根據站長之家10 月18 日報道,首個多模態開放世界偵測大模型MQ-Det 最近在NeurIPS 2023 上首次亮相,引起廣泛關注。此模型的核心創新在於融合了文字描述和視覺範例查詢,以顯著提升目標偵測的精確率,整體效能提高了7.8%。 MQ-Det 的設計包括門控感知模組和視覺為條件的掩碼語言預測訓練策略,使其相容於現有檢測大模型且具備多模態查詢能力。
巴比特訊