根據站長之家10 月8 日報道,來自威斯康辛大學麥迪遜分校、微軟研究院和哥倫比亞大學的研究人員近期開源了一款全新的端到端多模態大模型LLaVA-1.5,該模型在11在項基準測試中都實現了新的狀態最優(SOTA)成績,包括視覺問答、圖像caption 等任務,展現了強大的多模態理解能力。可與OpenAI 的GPT-4 V 形成正面競爭。
巴比特訊