OpenAI將推出多模態大模型,志在阻擊GoogleGemini


谷歌在大約半個月前公佈了自家的大模型Gemini,消耗的算力是GPT-4的五倍之多,官方稱之為「一種多模態和高效的機器學習工具」。 Gemini的開發始於今年四月,Google將內部的兩個AI實驗室Google大腦(Google Brain)和DeepMind合併後正式啟動。接下來幾個月內Gemini的神秘面紗一點點被揭開,目前已知的大約有:將具有和GPT-4相似的參數量級;Gemini在訓練中已經展示出了傳統大模型產品中從未所見的多模態能力;一旦經過微調和嚴格的安全性測試,Google同樣將提供不同尺寸和功能的Gemini版本,以確保部署在不同的產品、應用和設備上。

現在的最新消息有兩則:一、Google已經允許一小部分週邊公司使用Gemini軟體的早期版本,可能很快就將被納入消費者服務,並透過公司的雲端運算服務出售給企業。二、OpenAI正積極將自家的多模態功能整合到GPT-4中,可能與Gemini預計提供的功能類似,爭取趕在Gemini發布前推出,其代號為Gobi。 OpenAI的目標很明確,就是要擊敗Google並保持領先地位。

OpenAI在今年三月推出GPT-4時就曾提出過多模態功能的預覽。但當時僅為特殊群體,如專為盲人或弱視等群體提供服務的Be My Eyes公司提供服務,其他許多公司都未能獲得這些功能。半年多後,OpenAI又準備推出這項名為GPT-Vision的功能,這次要面向更廣大的族群了。至於為什麼要拖半年,外界推測主要是擔心新的視覺功能會被居心叵測者利用,例如透過自動解決驗證碼問題來冒充人類,或透過臉部辨識來追蹤他人。不過目前來看,OpenAI似乎正在致力於解決圍繞這項新技術的法律擔憂,或許很快就會有成果公佈。

谷歌也面臨同樣的問題。在之前Gemini發布會後,曾有人問谷歌正在採取哪些措施來防止其被濫用。谷歌的發言人指出早在七月就做出了一系列措施,以確保其所有相關產品能夠負責任地開發與運用。考慮到Google擁有與文字、圖像、影片和音訊相關的專有資料為數不少,包括來自搜尋引擎和YouTube等平台的資料等,Gemini多模態的發展方向可能就是為了發揮發揮Google多年的優勢。據外媒引用一位使用過早期版本的人說,與現有常見的大模型相比,Gemini似乎已經很好的糾正了“AI幻覺”,即一本正經的胡說八道的問題。

OpenAI的CEO奧爾特曼在先前的各種訪談中有意無意的表示,他們計劃對GPT-4進行各種增強,新的增強大模型是其中可能的方向之一,現在說GPT-5還為時尚早。但很快的,這種說法就被穆斯塔法·蘇萊曼揭老底,稱“OpenAI一直在秘密開發與訓練GPT-5,之所以經常被否認可能是因為其內部新起了個名字” 。蘇萊曼是DeepMind的共同創辦人之一,稱得上是奧爾特曼的同行和對手。老話說“同行才是最大的冤家”,此言得之。

雖然現在OpenAI表態要開發Gobi以確保自己在AIGC於大模型業內的領先地位,但也有消息表明Gobi似乎還沒有開始訓練,所以目前Gobi可能還處於技術驗證,或者概念論證階段。在先前接受採訪時,GoogleCEO皮查伊表達了他對Google目前在AI領域地位的信心,並認可技術進步的持久性,以及他們在平衡創新與責任方面深思熟慮的策略。

無論如何,時代的浪潮一旦起步自然不會說停就停。面對傳聞中Google要幹掉自己的大殺器,OpenAI當然不會無動於衷,OpenAI與其他企業的競賽就相當於AIGC與大模型時代的iOS與安卓之爭。估計現在有很多人都屏息以待Gemini的到來,不僅是期待它的強大功能,更因為它將揭示谷歌和OpenAI之間的差距到底有多大。先前李彥宏曾表態:「成交量大模型沒意思,不如去成交量應用的機會更大。」不論iOS與安卓誰在智能機和移動互聯網競賽中勝出,最終都是微信等APP收穫了數以億計的用戶,並逐漸滲透到越來越多的使用情境。

資訊來源:由0x資訊編譯自8BTC。版權所有,未經許可,不得轉載

Total
0
Shares
Related Posts