微軟、谷歌爭奪AI時代話語權。
文|湃客、劉雨婷
來源:界面新聞
海內外互聯網大廠與創業者,正陷入一場有關ChatGPT的競賽中。
3月15日凌晨,OpenAI推出GPT-4多模態預訓練大模型,除語言文本外,還支持圖像識別輸入,以文本形式輸出。
在發布會上,官方人員演示GPT-4可以識別手繪網頁草圖,並僅用十秒鐘左右,就根據草圖寫出網站代碼。
在OpenAI發布會前幾個小時,谷歌剛剛宣布推出一系列生成式AI功能,用於其各種辦公軟件中,包括谷歌Gmail、Docs(文檔)、Sheets(表格)和Slides(幻燈片)。
在外界看來,這是谷歌意圖搶在微軟3月16日預期官宣GPT接入Office之前,展現自己的成果。
作為直接競爭對手,谷歌已走在“對抗”微軟與OpenAI的最前列。但隨著OpenAI空降官宣GPT-4,谷歌又陷入下一場追逐戰中。
ChatGPT是AIGC領域的顛覆性產品,在上線後吸引了全球關注。將ChatGPT嵌入微軟Bing搜索引擎後,Bing日活首次突破1億,直接影響到谷歌的用戶基礎。
面對微軟的步步緊逼,蘋果、Meta和亞馬遜等公司也正計劃重新評估其人工智能的開發策略。
3月16日,百度將率先發布“中國版ChatGPT”文心一言。國內創業公司和互聯網大廠,都迅速跟進,不願成為新技術掉隊者。在王興、王慧文再度攜手、開啟AI領域創業的同時,快手前AI核心人物李岩也投身“多模態大模型”創業。
隨著OpenAI發布GPT-4,多模態大模型已成為最新的技術變革方向,人工智能正邁入“iPhone 時刻”。正如iPhone帶來的智能手機變革,GPT模型的出現又將影響未來AI領域的發展方向。
如今,微軟與穀歌競爭的不只是當前的市場,還有未來AI時代的定義標準與話語權。
GPT-4:多模態變革
面對ChatGPT的步步緊逼,海外大廠都在追趕和阻擊微軟,以動搖其目前在人工智能領域的領先地位。
在“對抗”微軟與Open AI方面,谷歌已經走在前列。知情人士透露,谷歌高級管理層已經宣布“紅色指令”,其中要求在幾個月時間裡將“生成式人工智能”技術集成到谷歌的所有重要產品中。
去年12月,谷歌母公司Alphabet就曾發布“紅色警告”,已處於半退休狀態的創始人拉里·佩奇和謝爾蓋·布林重新回到公司,商討制定了人工智能後續戰略,並決定將聊天機器人納入搜索引擎,以應對ChatGPT的威脅。
但從微軟和OpenAI近期舉動來看,單純的文本交互已無法滿足其在生成式AI方向的野望,包含文本、圖像、視頻處理等在內的多模態大模型已成為其最新的技術變革發力點。
在GPT4.0發布前,今年3月初,微軟發布了多模態AI大模型Kosmos-1。微軟AI技術專家Holger Kenn表示,多模態AI不僅能夠將文本轉變成圖像,還可以轉變成音樂和視頻,尤其在編程領域,AI模型能夠更輕鬆的生成樣板代碼。
在微軟發布Kosmos-1後,3月7日,谷歌和柏林工業大學的團隊推出了PaLM-E視覺語言模型,參數量高達5620億,約為GPT-3參數量的三倍。
據悉,PaLM-E大模型是在語言類模型PaLM(5400億參數)和視覺類模型ViT(220億參數)的基礎上開發的。其不僅可以理解圖像,還能理解、生成語言,以及將兩者結合,處理複雜的機器人指令。
谷歌與微軟的較量不僅體現在生成式AI的場景應用層面,也聚焦於大模型底層實力。但隨著GPT4.0的發布,多模態大模型的能力得到進一步展現,谷歌的聲量又再度落於下風。
今天凌晨,OpenAI發布最新GPT4.0多模態大模型,引爆全網討論。與前一代相比,最新的GPT4.0可以識別圖片輸入;文字輸入上限提升至2.5萬字;回答深度和專業性、推理和風格變化能力也顯著提高。
OpenAI稱,GPT-4在各種專業學術基准上有著人類水平表現。在最新測試中,GPT-4通過了模擬律師考試,得分約為前10%,而GPT-3.5得分約為倒數10%。 GRE、SAT數學考試成績也有大幅提升,擊敗了80%以上的人類答題水平。
GPT-4也擁有更高級的推理能力。用戶在GPT上傳了一張梗圖,問這張圖為什麼會引人發笑:
GPT4.0一一給出回答:
在官方的示例中,GPT-4.0可以10秒鐘編寫網站代碼,可以編寫劇本、計算物理題、速讀專業論文、分析數據圖表,甚至可以解讀搞笑圖片與漫畫。
在業內人士看來,生成式AI的產生本質上是一種生產力革命,其不僅是工具,而是直接成為生產要素的重要部分。以文本、音頻、圖像和視頻為處理對象的多模態大模型和生成式AI,勢必會對未來的內容創作、數據處理等相關行業帶來巨大衝擊。
AI對傳統工作方式的革命和顛覆或許即將到來,未來最核心的競爭力和技能可能不再是編程,計算,甚至分析能力,而是和大模型的對話能力。
現在人工智能正處於一個決定性的時刻,就像90年代的互聯網以及iPhone帶來的手機變革,人工智能正朝著大規模採用的方向發展,ChatGPT類的大模型正推動數據革命。
美國銀行戰略分析師預測,人工智能正邁入“iPhone 時刻”,預估到2030年會為全球經濟帶來15.7萬億美元的增長。
在過去,蘋果曾經兩次定義硬件工具的交互方式:PC時代的Apple Lisa電腦,是首次採用圖形用戶界面(GUI)和鼠標的個人電腦;到智能手機時代,iPhone定義了觸控交互。
如今,ChatGPT已經改變了人與文字、知識的交互方式,而下一步,ChatGPT類的大模型又將影響未來AI的發展方向和人類的工作方式。
ChatGPT開放端口是創業機會嗎?
作為OpenAI背後的投資者,微軟的相關產品已經取得了初步成果。
微軟在GPT-4發布後第一時間表示,新的Bing已經基於GPT-4技術運行,這是為搜索產品量身定制的模型產品。
在集成ChatGPT的Bing搜索引擎推出一個月後,微軟宣布Bing每日活躍用戶首次突破1億,每天大約有1/3的必應用戶與BingChat進行交互。此外,Bing在移動設備上的使用率也有所增長,BingChat應用使得每日活躍用戶增加了6倍。
此外,微軟宣布,將於3月16日召開“工作的AI未來”發布會,預計將展示其類似ChatGPT的人工智能,如何在Teams、Word和Outlook等Office生產力套件中發揮作用。
從Bing瀏覽器到Office辦公套件,微軟正籌劃將AI賦能更多C端、甚至B端用戶。據悉,微軟計劃將ChatGPT背後的技術整合到其Power Platform平台上,允許用戶在幾乎不需要編碼的情況下,就能開發自己的應用程序。
“我們不想把它打造成定制產品,它一開始是一個定制產品,但我們總是想辦法把它打造成通用型產品,這樣任何想訓練大型語言模型的人都可以利用同樣的改進,”微軟負責雲計算和人工智能的執行副總裁斯科特・格思裡曾對外表示,“這真的能夠幫助我們成為使用更廣泛的人工智能雲。”
對旗下平台進行AI賦能是互聯網大廠的優勢,微軟、谷歌、BAT等互聯網大廠具備充足的資金和技術支持,同時具備龐大的C端流量入口。對於他們來說,開發自有大模型一方面可以探索更多的場景和商業模式,另一方面也是為了保證自身對於用戶的競爭力和行業話語權。
但對於資金和技術實力欠缺的企業或創業者來說,利用大廠開源模型,優先採用接口模式,結合自身產品,將重心放在更具體的需求場景上,或許才是最優的選擇。
ChatGPT之父、OpenAI創始人山姆·阿爾特曼在3月10日的摩根士丹利大會上透露,OpenAI將重點開發一個平台,向開發者開放API接口,並創建類似ChatGPT的應用程序,第三方開發者被允許通過API將ChatGPT集成到他們的應用程序和服務中。
OpenAI將推出一系列工具,讓用戶可以更好地控制這套生成式人工智能係統,並針對通用用戶用例和具體用戶用例進行改進。
最新GPT-4發布後,OpenAI把ChatGPT直接升級為GPT-4最新版本。同時,OpenAI開放了GPT-4的API。
ChatGPT Plus付費訂閱用戶可以獲得具有使用上限的GPT-4訪問權限(每4小時100條消息),可以向GPT-4模型發出純文本請求,圖像輸入處於研究預覽階段,仍不完全公開。
用戶可以申請使用GPT-4的API,OpenAI會邀請部分開發者體驗,並逐漸擴大邀請範圍。該API的定價為每輸入1000個字符(約合750個單詞),價格為0.03美元;GPT-4每生成1000個字符,價格為0.06美元。
與前一代模型相比,新推出的GPT-4 API價格提高不少。 3月2日,OpenAI剛剛放出ChatGPT API,比之前的GPT-3.5模型便宜10倍,每生成1000字符,價格為0.002美元,即2.7美元就可輸出100萬個字符。
自去年12月以來,ChatGPT對於處理查詢的方式進行了優化,使成本降低90%,最終帶來了面向用戶的大幅降價,GPT-4或許也能在將來重複這一過程,這將大大降低開發人員利用ChatGPT賦能自身產品的難度。
當調用ChatGPT模型的能力不再是門檻,對於場景賽道的理解、商業模式的構建能力就成為企業的核心競爭優勢。
北極光創投合夥人張朋在一場直播中向創業者提出建議,產品和服務不能僅依靠調用大模型的能力,還要實現差異化,比如工具層+應用層結合在客戶的場景落地,讓客戶買的是場景的價值。
張朋認為,從變現角度,最好從應用層下手,“以Pass為例的中間層的很難盈利,大多客戶難以從通用模型框架自我研究出解決方案,還需要提供細化到應用的服務,B端客戶需要的不是工具,是解決方案。”
千萬美元入場券
美團聯合創始人王慧文對於AI的態度很明確,“關於人工智能,到現在為止,我只有一個判斷,必須參與。”
今年2月,王慧文在朋友圈發布“組隊帖”,要帶資5000萬美元進入AI賽道,設立光年之外科技有限公司,資金佔股25%,其餘75%的股份用於邀請頂級研發人員,打造中國Open AI。
據王慧文透露,光年之外估值達2億美元,下輪融資已有頂級VC認購2.3億美元。 3月8日,美團創始人王興在朋友圈回應王慧文的宣言,宣布將以個人身份參與王慧文的創業公司“光年之外”的A輪投資,並出任董事。
在“雙王”三度攜手、進場AI賽道的同時,眾多互聯網大佬紛紛開始招兵買馬,爭相搶奪人才:原京東集團高級副總裁、集團技術委員會主席周伯文同樣在朋友圈發布招募研發、產品及算法人員,原搜狗CEO王小川對媒體回應正快速籌備AI大模型,快手前AI核心人物李岩也投身“大模型”賽道創業,成立AI公司元石科技,進行多模態大模型的研發。
百度、騰訊、阿里、字節跳動等互聯網大廠也在“爭分奪秒”開發自有大模型,百度宣布將於3月16日推出類似產品“文心一言”,騰訊針對類ChatGPT產品已成立“混元助手”項目組,阿里巴巴則表示其聊天機器人正處於研發內測階段。
在OpenAI發布GPT4.0後,即將發布文心一言的百度壓力再度增加。 ChatGPT的背後離不開大模型、大數據、大算力,大廠想要追趕Open AI,也需要面臨多方面的挑戰。
在算力要求方面,市場調查機構TrendForce集邦諮詢公佈的最新報告指出,如果以英偉達A100顯卡的處理能力計算,運行ChatGPT將需要使用到3萬塊英偉達GPU,目前英偉達A100顯卡的售價在1萬-1.5萬美元之間,3萬塊售價超過3億美金。
除算力要求高外,需要大量的數據集得到ChatGPT訓練成本非常高昂。其使用Transformer神經網絡架構,訓練數據來自包括維基百科,以及真實對話在內的龐大語料庫,有著多達1750億個模型參數。
根據中信研報測算,ChatGPT生成一條信息的成本在1.3美分左右,是目前傳統搜索引擎的3-4倍,成本問題中短期內或只能等待硬件成本的繼續下降。
儘管目前技術上還在追趕Open AI,但在這條新興賽道上,BAT並不想缺席。如今,現在生成式AI的商業模式還有待探索,但人的想像力是無窮的。 ChatGPT可以寫詩,可以優化搜索,可以回复郵件,可以整理數據,也可以編寫代碼……
ChatGPT只是更偉大事物的開始,英偉達CEO黃仁勳表示,“你知道你今天做不到,但是當然,它總有一天會做到的”。
無論現在的微軟、谷歌、百度等旗下的聊天機器人表現如何,這也只是新時代AI技術迭代的最開始,未來的AI產業勢必會更精彩。
展開全文打開碳鏈價值APP 查看更多精彩資訊