GPT-4震撼空降，谷歌「緊追」微軟有點難

微軟、谷歌爭奪AI時代話語權。

文｜湃客、劉雨婷

來源：界面新聞

海內外互聯網大廠與創業者，正陷入一場有關ChatGPT的競賽中。

3月15日凌晨，OpenAI推出GPT-4多模態預訓練大模型，除語言文本外，還支持圖像識別輸入，以文本形式輸出。

在發布會上，官方人員演示GPT-4可以識別手繪網頁草圖，並僅用十秒鐘左右，就根據草圖寫出網站代碼。

在OpenAI發布會前幾個小時，谷歌剛剛宣布推出一系列生成式AI功能，用於其各種辦公軟件中，包括谷歌Gmail、Docs（文檔）、Sheets（表格）和Slides（幻燈片）。

在外界看來，這是谷歌意圖搶在微軟3月16日預期官宣GPT接入Office之前，展現自己的成果。

作為直接競爭對手，谷歌已走在“對抗”微軟與OpenAI的最前列。但隨著OpenAI空降官宣GPT-4，谷歌又陷入下一場追逐戰中。

ChatGPT是AIGC領域的顛覆性產品，在上線後吸引了全球關注。將ChatGPT嵌入微軟Bing搜索引擎後，Bing日活首次突破1億，直接影響到谷歌的用戶基礎。

面對微軟的步步緊逼，蘋果、Meta和亞馬遜等公司也正計劃重新評估其人工智能的開發策略。

3月16日，百度將率先發布“中國版ChatGPT”文心一言。國內創業公司和互聯網大廠，都迅速跟進，不願成為新技術掉隊者。在王興、王慧文再度攜手、開啟AI領域創業的同時，快手前AI核心人物李岩也投身“多模態大模型”創業。

隨著OpenAI發布GPT-4，多模態大模型已成為最新的技術變革方向，人工智能正邁入“iPhone 時刻”。正如iPhone帶來的智能手機變革，GPT模型的出現又將影響未來AI領域的發展方向。

如今，微軟與穀歌競爭的不只是當前的市場，還有未來AI時代的定義標準與話語權。

GPT-4：多模態變革

面對ChatGPT的步步緊逼，海外大廠都在追趕和阻擊微軟，以動搖其目前在人工智能領域的領先地位。

在“對抗”微軟與Open AI方面，谷歌已經走在前列。知情人士透露，谷歌高級管理層已經宣布“紅色指令”，其中要求在幾個月時間裡將“生成式人工智能”技術集成到谷歌的所有重要產品中。

去年12月，谷歌母公司Alphabet就曾發布“紅色警告”，已處於半退休狀態的創始人拉里·佩奇和謝爾蓋·布林重新回到公司，商討制定了人工智能後續戰略，並決定將聊天機器人納入搜索引擎，以應對ChatGPT的威脅。

但從微軟和OpenAI近期舉動來看，單純的文本交互已無法滿足其在生成式AI方向的野望，包含文本、圖像、視頻處理等在內的多模態大模型已成為其最新的技術變革發力點。

在GPT4.0發布前，今年3月初，微軟發布了多模態AI大模型Kosmos-1。微軟AI技術專家Holger Kenn表示，多模態AI不僅能夠將文本轉變成圖像，還可以轉變成音樂和視頻，尤其在編程領域，AI模型能夠更輕鬆的生成樣板代碼。

在微軟發布Kosmos-1後，3月7日，谷歌和柏林工業大學的團隊推出了PaLM-E視覺語言模型，參數量高達5620億，約為GPT-3參數量的三倍。

據悉，PaLM-E大模型是在語言類模型PaLM（5400億參數）和視覺類模型ViT（220億參數）的基礎上開發的。其不僅可以理解圖像，還能理解、生成語言，以及將兩者結合，處理複雜的機器人指令。

谷歌與微軟的較量不僅體現在生成式AI的場景應用層面，也聚焦於大模型底層實力。但隨著GPT4.0的發布，多模態大模型的能力得到進一步展現，谷歌的聲量又再度落於下風。

今天凌晨，OpenAI發布最新GPT4.0多模態大模型，引爆全網討論。與前一代相比，最新的GPT4.0可以識別圖片輸入；文字輸入上限提升至2.5萬字；回答深度和專業性、推理和風格變化能力也顯著提高。

OpenAI稱，GPT-4在各種專業學術基准上有著人類水平表現。在最新測試中，GPT-4通過了模擬律師考試，得分約為前10%，而GPT-3.5得分約為倒數10%。 GRE、SAT數學考試成績也有大幅提升，擊敗了80%以上的人類答題水平。

GPT-4也擁有更高級的推理能力。用戶在GPT上傳了一張梗圖，問這張圖為什麼會引人發笑：

GPT4.0一一給出回答：

在官方的示例中，GPT-4.0可以10秒鐘編寫網站代碼，可以編寫劇本、計算物理題、速讀專業論文、分析數據圖表，甚至可以解讀搞笑圖片與漫畫。

在業內人士看來，生成式AI的產生本質上是一種生產力革命，其不僅是工具，而是直接成為生產要素的重要部分。以文本、音頻、圖像和視頻為處理對象的多模態大模型和生成式AI，勢必會對未來的內容創作、數據處理等相關行業帶來巨大衝擊。

AI對傳統工作方式的革命和顛覆或許即將到來，未來最核心的競爭力和技能可能不再是編程，計算，甚至分析能力，而是和大模型的對話能力。

現在人工智能正處於一個決定性的時刻，就像90年代的互聯網以及iPhone帶來的手機變革，人工智能正朝著大規模採用的方向發展，ChatGPT類的大模型正推動數據革命。

美國銀行戰略分析師預測，人工智能正邁入“iPhone 時刻”，預估到2030年會為全球經濟帶來15.7萬億美元的增長。

在過去，蘋果曾經兩次定義硬件工具的交互方式：PC時代的Apple Lisa電腦，是首次採用圖形用戶界面(GUI)和鼠標的個人電腦；到智能手機時代，iPhone定義了觸控交互。

如今，ChatGPT已經改變了人與文字、知識的交互方式，而下一步，ChatGPT類的大模型又將影響未來AI的發展方向和人類的工作方式。

ChatGPT開放端口是創業機會嗎？

作為OpenAI背後的投資者，微軟的相關產品已經取得了初步成果。

微軟在GPT-4發布後第一時間表示，新的Bing已經基於GPT-4技術運行，這是為搜索產品量身定制的模型產品。

在集成ChatGPT的Bing搜索引擎推出一個月後，微軟宣布Bing每日活躍用戶首次突破1億，每天大約有1/3的必應用戶與BingChat進行交互。此外，Bing在移動設備上的使用率也有所增長，BingChat應用使得每日活躍用戶增加了6倍。

此外，微軟宣布，將於3月16日召開“工作的AI未來”發布會，預計將展示其類似ChatGPT的人工智能，如何在Teams、Word和Outlook等Office生產力套件中發揮作用。

從Bing瀏覽器到Office辦公套件，微軟正籌劃將AI賦能更多C端、甚至B端用戶。據悉，微軟計劃將ChatGPT背後的技術整合到其Power Platform平台上，允許用戶在幾乎不需要編碼的情況下，就能開發自己的應用程序。

“我們不想把它打造成定制產品，它一開始是一個定制產品，但我們總是想辦法把它打造成通用型產品，這樣任何想訓練大型語言模型的人都可以利用同樣的改進，”微軟負責雲計算和人工智能的執行副總裁斯科特・格思裡曾對外表示，“這真的能夠幫助我們成為使用更廣泛的人工智能雲。”

對旗下平台進行AI賦能是互聯網大廠的優勢，微軟、谷歌、BAT等互聯網大廠具備充足的資金和技術支持，同時具備龐大的C端流量入口。對於他們來說，開發自有大模型一方面可以探索更多的場景和商業模式，另一方面也是為了保證自身對於用戶的競爭力和行業話語權。

但對於資金和技術實力欠缺的企業或創業者來說，利用大廠開源模型，優先採用接口模式，結合自身產品，將重心放在更具體的需求場景上，或許才是最優的選擇。

ChatGPT之父、OpenAI創始人山姆·阿爾特曼在3月10日的摩根士丹利大會上透露，OpenAI將重點開發一個平台，向開發者開放API接口，並創建類似ChatGPT的應用程序，第三方開發者被允許通過API將ChatGPT集成到他們的應用程序和服務中。

OpenAI將推出一系列工具，讓用戶可以更好地控制這套生成式人工智能係統，並針對通用用戶用例和具體用戶用例進行改進。

最新GPT-4發布後，OpenAI把ChatGPT直接升級為GPT-4最新版本。同時，OpenAI開放了GPT-4的API。

ChatGPT Plus付費訂閱用戶可以獲得具有使用上限的GPT-4訪問權限（每4小時100條消息），可以向GPT-4模型發出純文本請求，圖像輸入處於研究預覽階段，仍不完全公開。

用戶可以申請使用GPT-4的API，OpenAI會邀請部分開發者體驗，並逐漸擴大邀請範圍。該API的定價為每輸入1000個字符(約合750個單詞)，價格為0.03美元；GPT-4每生成1000個字符，價格為0.06美元。

與前一代模型相比，新推出的GPT-4 API價格提高不少。 3月2日，OpenAI剛剛放出ChatGPT API，比之前的GPT-3.5模型便宜10倍，每生成1000字符，價格為0.002美元，即2.7美元就可輸出100萬個字符。

自去年12月以來，ChatGPT對於處理查詢的方式進行了優化，使成本降低90%，最終帶來了面向用戶的大幅降價，GPT-4或許也能在將來重複這一過程，這將大大降低開發人員利用ChatGPT賦能自身產品的難度。

當調用ChatGPT模型的能力不再是門檻，對於場景賽道的理解、商業模式的構建能力就成為企業的核心競爭優勢。

北極光創投合夥人張朋在一場直播中向創業者提出建議，產品和服務不能僅依靠調用大模型的能力，還要實現差異化，比如工具層+應用層結合在客戶的場景落地，讓客戶買的是場景的價值。

張朋認為，從變現角度，最好從應用層下手，“以Pass為例的中間層的很難盈利，大多客戶難以從通用模型框架自我研究出解決方案，還需要提供細化到應用的服務，B端客戶需要的不是工具，是解決方案。”

千萬美元入場券

美團聯合創始人王慧文對於AI的態度很明確，“關於人工智能，到現在為止，我只有一個判斷，必須參與。”

今年2月，王慧文在朋友圈發布“組隊帖”，要帶資5000萬美元進入AI賽道，設立光年之外科技有限公司，資金佔股25%，其餘75%的股份用於邀請頂級研發人員，打造中國Open AI。

據王慧文透露，光年之外估值達2億美元，下輪融資已有頂級VC認購2.3億美元。 3月8日，美團創始人王興在朋友圈回應王慧文的宣言，宣布將以個人身份參與王慧文的創業公司“光年之外”的A輪投資，並出任董事。

在“雙王”三度攜手、進場AI賽道的同時，眾多互聯網大佬紛紛開始招兵買馬，爭相搶奪人才：原京東集團高級副總裁、集團技術委員會主席周伯文同樣在朋友圈發布招募研發、產品及算法人員，原搜狗CEO王小川對媒體回應正快速籌備AI大模型，快手前AI核心人物李岩也投身“大模型”賽道創業，成立AI公司元石科技，進行多模態大模型的研發。

百度、騰訊、阿里、字節跳動等互聯網大廠也在“爭分奪秒”開發自有大模型，百度宣布將於3月16日推出類似產品“文心一言”，騰訊針對類ChatGPT產品已成立“混元助手”項目組，阿里巴巴則表示其聊天機器人正處於研發內測階段。

在OpenAI發布GPT4.0後，即將發布文心一言的百度壓力再度增加。 ChatGPT的背後離不開大模型、大數據、大算力，大廠想要追趕Open AI，也需要面臨多方面的挑戰。

在算力要求方面，市場調查機構TrendForce集邦諮詢公佈的最新報告指出，如果以英偉達A100顯卡的處理能力計算，運行ChatGPT將需要使用到3萬塊英偉達GPU，目前英偉達A100顯卡的售價在1萬-1.5萬美元之間，3萬塊售價超過3億美金。

除算力要求高外，需要大量的數據集得到ChatGPT訓練成本非常高昂。其使用Transformer神經網絡架構，訓練數據來自包括維基百科，以及真實對話在內的龐大語料庫，有著多達1750億個模型參數。

根據中信研報測算，ChatGPT生成一條信息的成本在1.3美分左右，是目前傳統搜索引擎的3-4倍，成本問題中短期內或只能等待硬件成本的繼續下降。

儘管目前技術上還在追趕Open AI，但在這條新興賽道上，BAT並不想缺席。如今，現在生成式AI的商業模式還有待探索，但人的想像力是無窮的。 ChatGPT可以寫詩，可以優化搜索，可以回复郵件，可以整理數據，也可以編寫代碼……

ChatGPT只是更偉大事物的開始，英偉達CEO黃仁勳表示，“你知道你今天做不到，但是當然，它總有一天會做到的”。

無論現在的微軟、谷歌、百度等旗下的聊天機器人表現如何，這也只是新時代AI技術迭代的最開始，未來的AI產業勢必會更精彩。

展開全文打開碳鏈價值APP 查看更多精彩資訊

GPT-4震撼空降，谷歌「緊追」微軟有點難

加密貨幣令牌在2025年7月解鎖5月觸發市場波動

Conflux即將進行的3.0升級和Yuan Stablecoin發布的背後是什麼？

茉莉花抽15％以勝過市場，目標$0.034

Bittensor生態公司xTAO將在加拿大上市，獲DCG等2280萬美元投資

華爾街質押的轉變：銀行如何以穩定幣吸引機構投資者，重塑全球金融格局。

隨著加密貨幣市場飆升，投資者需求增加，Bitgo在美國的IPO申請有所增加

3.6億美元用於Ethena財政部與Stablecoinx X Tlgy聯盟合作

Arbitrum領先於19億美元的流入，超過Avalanche，並在Defi流動性競賽中

GPT-4震撼空降，谷歌「緊追」微軟有點難

Related Posts