據站長之家8 月23 日報導,人工智能創業公司Hugging Face 最近推出了一款名為IDEFIX 的開源多模態AI 模型。 IDEFIX 可以處理圖像和文本輸入,並生成連貫的文本輸出。 IDEFIX 基於視覺語言模型Flamingo 構建,Flamingo 是去年由DeepMind 開發的一款領先的多模態AI 模型。 IDEFIX 使用了包括維基百科、公共多模態數據集和LAION 在內的各種開放數據集進行了訓練。此外,Hugging Face 還引入了一個新的多模態數據集OBELIX,其中包含1.41 億個從互聯網收集的圖像文本文檔。與專有模型相比,IDEFIX 在各種圖像文本理解評估中的表現非常優異。它有兩個版本,基本版本有90 億個參數,指導版本有800 億個參數。相比之下,OpenAI 的ChatGPT 目前還不支持處理圖像。此前報導,。