巴比特訊,10 月28 日,智子引擎發布多模態大模型“元乘象Chatimg3.0”,支援多圖理解、物體定位、OCR 等功能。據介紹,與Chatimg2.0 相比,Chatimg3.0 主要進行了兩方面的升級,包括第一階段的預訓練(描述、檢測、OCR 等多任務訓練)以及第二階段的指令微調(高品質的人工精篩指令集)。
巴比特訊