GPT4多模態預期落空,關於AIGC還有什麼值得暢想?


來源:《科創板日報》

編輯邱思雨

圖片來源:由無界版圖AI工俱生成

自ChatGPT走紅以來,市場不乏追捧、跟風、質疑等等各類聲音。 ChatGPT背後的語言模型——GPT的技術進展,也成為了市場關注的焦點。各方對GPT4的猜測不斷。在A股市場上,各類預期概念炒作也層出不窮。

目前來看,純文本交易所已逐漸無法滿足公眾對於人工智能的期待,多模態(包含文本、圖像、視頻處理)是最受關注的技術變革方向。

而多模態大模型究竟何時到來? GPT4到底有什麼更新?就此,《科創板日報》整理了目前已知的GPT4爆料、多模態大模型相關資料等。

GPT4多模態預期落空Kosmos-1橫空出世

國盛證券、天風證券等機構曾認為,GPT4可能是一個多模態模型,可用於圖像等領域,有望極大刺激視頻處理的需求。自多模態傳聞興起後,ChatGPT相關概念股也紛紛衝高。其中,當虹科技(688039.SH)在4個交易日(2月27日-3月2日)內累計漲幅超過50%。

但據Forbes、CAMBIO等外媒報導,OpenAI創始人Sam Altman否認了多模態的可能性,GPT4仍然是純文本模式。基於此,Cambrian AI的分析師Alberto Romero猜測,在跳到下一代多模態人工智能之前,OpenAI試圖通過對模型和數據集大小等因素進行調整來達到語言模型的極限。

而承載了公眾對於多模態人工智能的期望的,是另一個語言模型——Kosmos-1。據ZDNET等外媒報導,微軟近日推出的多模態大型語言模型Kosmos-1,可以處理文本、音頻、圖像和視頻等內容。

圖片來源於微軟

微軟表示,用於訓練Kosmos-1資料同樣源自網絡。為了讓Kosmos-1能進一步理解圖像內容,研究人員事先將圖像以文字內容加上大量標記,讓Kosmos-1能夠進一步理解圖像內容,藉此實現多模態運作。

相關研究人員在學術論文中寫道:“作為智能的基本組成部分,多模態感知是實現人工智能的必要條件。”加入圖像內容理解能力之後,Kosmos-1不僅能夠識別文字以外的圖像內容,甚至能進一步判斷視頻內容。

有關GPT4的一切

多模態、參數量暴漲、革命性突破、與人類無異……公眾對GPT4加諸了許多想像,並翹首以盼它的到來。在A股市場上,ChatGPT各類概念炒作也層出不窮。

與多模態一樣,參數量暴漲一事同樣被創始人Sam Altman否定。 Altman稱,GPT4並沒有數千、數万億個參數要訓練,其參數量並不會比GPT3高出太多,因為研發的重心在如何提升數據利用效率上。此前有市場傳聞稱,GPT4參數量或有指數級暴漲,達到100萬億個。

據Forbes最新報導,有專家指出,同為大語言模型的Megatron 3所用的參數比GPT3多很多,但前者的測試表現並沒有超過後者,AI領域內,數據越多並不意味著越好。與此同時,提升算法效率有助於降低GPT4的運行成本。

不過值得一提的是,GPT4的編碼能力或許更強大。據外媒ZDNET今年1月報導,OpenAI正積極招聘程序員,要求應聘者能用日常語言來描述代碼的功能。基於此,業內普遍預測,GPT4的編碼能力或將有新的突破,目前,微軟和OpenAI共同開發的AI編程工具Github Copilot已經在使用微調後的GPT3,來將自然語言轉換成代碼。

發佈時間上,OpenAI並未宣布GPT4的發佈時間,但New York Times等一眾外媒都認為,GPT4或將於2023年的某個時間點推出。 Forbes推測,GPT4或將逐步公開。以GPT-3為例,一開始GPT-3主要開放給部分合作夥伴、付費用戶和學術機構,在2022年底才開放給公眾。 GPT-4大概率將遵循同樣的開放節奏。

目前,ChatGPT已經挑戰產業對於AI的認知。天風證券認為,GPT4未來可能會是生成式AI時代的“報曉鳥”。未來,生成式AI可能成為人類思維的“大副”。全要素生產率在PC時代飛速增長,在互聯網普及後(2005-2022)增長緩慢,生成式AI時代全要素生產率可能重新加速上漲。

與此同時,多模態大模型讓深度學習對個體的多層次理解成為可能,讓“AI生成設計”到“AI生成產品”成為可能,而該市場或將比“AI生成內容”大很多倍。

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts