蘋果的秘密行動-推出開源多模式法學碩士Ferret


蘋果和康乃爾大學的研究人員去年10 月偷偷地向全世界介紹了Ferret,這一悄然的消息在科技走廊裡引起了比任何精心策劃的公告都更大的反響。這種開源、多模式大語言模型(LLM) 打破了Apple 的保密傳統,標誌著AI 領域的重大飛躍。利用圖像作為查詢,Ferret 在GitHub 上的悄然亮相引起了人工智慧愛好者和研究人員的極大興趣。

在安靜的創新走廊中,蘋果和康乃爾大學的研究人員在去年10 月出人意料地推​​出了名為Ferret 的開源多模態大語言模型(LLM)。 GitHub 上的這一未經宣布的發布並未引起人們的注意,但後來引起了人工智慧社群的關注。

Ferret的巧妙操作-近距離觀察

Ferret 的操作方法包括檢查影像中的特定區域,識別有價值的元素,並將它們封裝在邊界框中。這種新穎的方法允許使用者使用這些元素作為查詢,促使Ferret 以傳統方式回應。

例如,當使用者突出顯示動物的圖像並詢問雪貂其物種時,模型會進行相應的識別和回應。 Ferret 甚至可以利用影像中其他元素的背景來提供更詳細的回應,讓我們一睹其獨特的多模態功能。

蘋果人工智慧研究科學家甘哲分享的見解表明,開源Ferret 模型的特點是能夠在不同粒度級別的不同元素之間引用和建立聯繫,這標誌著蘋果公司的重大轉變。

該公司以其保密性而聞名,願意與開源社群分享其人工智慧進步被視為一個令人驚訝的舉動。這種新發現的開放性使蘋果成為多模式人工智慧領域的重要參與者,挑戰了業界的期望。

蘋果的戰略支點-駕馭人工智慧領域

Ferret的發布不僅標誌著蘋果進軍開源人工智慧領域,也體現了該公司應對人工智慧產業挑戰的戰略應對。正如科技部落客Ben Dickson 指出的那樣,由於運算資源的限制,蘋果面臨微軟和谷歌等競爭對手的激烈競爭。與ChatGPT 等模型不同,Apple 的基礎設施無法大規模服務大型語言模型(LLM)。

這一困境讓蘋果處於十字路口,有兩個可行的選擇。第一個涉及與超大規模雲端供應商建立策略合作夥伴關係,以增強其人工智慧能力。第二個,正如Ferret 的發布所表明的那樣,是採用開源方法,類似於Meta Platforms Inc. 所採用的策略。協作和社群共享之間的選擇反映了蘋果致力於在快速發展的人工智慧領域保持競爭力的承諾。

當Ferret 悄悄地繪製多模式人工智慧領域的未探索領域時,蘋果正站在一個超越單純技術創新的十字路口。這項開源奇蹟的發布對蘋果在人工智慧領域的未來提出了微妙的疑問。

Ferret 能否推動蘋果進入多模式人工智慧的前沿,挑戰產業規範並促進協作進步?或者它像徵著人工智慧領域更廣泛的轉變,產業巨頭在專有能力與公共創新之間取得了平衡?費雷特悄悄到來的迴響依然存在,引發了人們對蘋果在塑造人工智慧未來方面不斷演變的角色的猜測。答案在科技、協作和人工智慧敘事不斷變化的動態的交匯中揭曉。

資訊來源:由0x資訊編譯自CRYPTOPOLITAN。版權歸作者Aamir Sheikh所有,未經許可,不得轉載!

Total
0
Shares
Related Posts