Copy to China難以復現,中國的大模型機會在何處?

大模型技術帶來的生態機會究竟在何處?

作者|武靜靜

來源:甲子光年

幾天前,GPT-4救回了一隻寵物狗。

事情是這樣的。有一天,網友庫珀發現自家小狗表現異常,有貧血的症狀,就去診所檢查。醫生診斷小狗患有蜱傳疾病,回家後,庫珀按醫囑照顧小狗。

沒想到過了幾天,小狗的身體再次出現問題,牙齦發白,貧血症比之前更嚴重。庫珀再次去了診所,醫生卻說,他也不知道怎麼回事,建議看小狗後續情況。庫珀無法接受這種說法,慌亂中只能找其他診所尋求建議。

同時,他想到了GPT-4曾提到擅長醫療診斷,決定試試——庫珀詳細描述了小狗的情況並給GPT-4提供了小狗多次的血液檢測結果,要求GPT-4給出診斷意見。

庫珀提問的部分信息

在說了“我不是獸醫……”的免責聲明之後,GPT-4給出了導緻小狗貧血的多種潛在可能,並提供了一個潛在問題列表。結合此前的檢測結果,庫珀排除了其他可能,留下了一個最符合目前情況診斷結果——IMHA(免疫性溶血性貧血)。

GPT-4針對庫珀給出的其中一個問題的回复

庫珀把這個診斷結果告訴了給小狗看病的第二家診所,醫生同意並進行了血液檢測。最終,小狗確診患有IMHA,並進行了對症治療。

小狗成功獲救,庫珀激動地在推特上分享了這則好消息。 “當然,這並不能說明GPT-4就是一個好醫生,但毫無疑問,它應該成為專業人士用來幫助他們挽救更多生命的工具”,庫珀說。

庫珀不是第一個受益於新技術的人,從ChatGPT到GPT-4,AI湧現出驚人的理解和生成能力以及強大的知識和技能儲備,正在讓更多普通人享受到新技術帶來的便捷——借助新一代的AI,人們不僅可以讓聊天機器人“寫專屬童話故事療愈自己”“寫處理指定任務的代碼”“充當自己的英語老師”,還可以讓它們直接幫忙訂機票以及檢索個人知識庫信息。此前,人們要么靠自己,要么依賴某一領域的專業人士來處理這些任務。

AGI(通用人工智能)時代來了。上週,微軟發布報告釋放了這一信號。報告提到,GPT-4已明顯超越ChatGPT,可以被視為AGI的早期(但仍不完整)版本,其不僅掌握了語言,還可以在無需任何特殊提示的情況下,解決跨越數學、編程、視覺、醫學、法律、心理學等領域的困難任務,並且能力非常接近人類水平。

就連技術樂觀主義者都驚訝於AGI會來得如此之快,不由感嘆:“知道AGI肯定會到來,以為是幾年後,或者十幾年後,萬萬沒想到是現在。”

熱潮跨越海洋傳遞到了中國。在OpenAI和微軟接二連三的產品“轟炸”下,國內市場直接炸鍋,投資人熬夜扒論文,創業者趕赴國外取經,大廠緊急開發對標產品,普通人忙著學攻略,此前忙著“聚焦”“下沉”“保持沉默”的AI行業再次熱鬧起來。

“人工智能的iPhone時刻”“AI2.0 時代到來”“顛覆性的創業機會”“下一代的操作系統”——人們給這個時刻賦予了各種代表時代變革意義的宏大名稱。 GPT-4背後的大模型技術以及相關應用成為了投資人和創業者眼中不可錯失的新風口。

大模型技術帶來的生態機會究竟在何處?我們又該如何抓住這波新技術浪潮?此次,「甲子光年」採訪了業內數位投資人和創業者,試圖還原不同人眼中對於大模型生態機會的理解和下注的方向,尋路中國AI行業未來的可能走向。

1.比移動互聯網還要顛覆性的平台性機會?

“這絕對是比移動互聯網還要顛覆性的機會”,一位投資人說。

這個觀點放在去年11月ChatGPT發布之後,會被很多人認為有些言過其實。但眼下,更多人覺得自己的想像力跟不上OpenAI以日為單位的進化速度。

去年發布ChatGPT後,OpenAI自己都沒意識到會在幾個月後引發如此大的行業震動。它原本只是一個花了兩週時間趕鴨子上架的“測試品”,主要為後續推出GPT-4收集反饋,做鋪墊。

這在部分人看來完全稱不上是革命性的創新。圖靈獎得主Yann LeCun甚至在公開場合說:“ChatGPT不算技術創新,只是組合得很好罷了”。事實上,ChatGPT背後的核心技術確實很多都出自他人之手,比如Transformer是谷歌在2017年提出,自監督學習算法也早就被提倡,強化學習是由DeepMind率先推崇。這也是在一開始很多人將ChatGPT只看作一個產品而非變革性平台的原因。

但一些人從ChatGPT中窺見了AGI的曙光。在使用過程中,人們發現ChatGPT不僅可以聊天、寫文章還可以做會議總結、行研分析、寫程序,大語言模型第一次展現出如此強大的通用性。

愛丁堡大學博士生符堯在文章中直言:“在國際學術界看來,ChatGPT / GPT-3.5 是一種劃時代的產物,它與之前常見的語言模型(Bert/ Bart/ T5) 的區別,幾乎是導彈與弓箭的區別,一定要引起最高程度的重視。”

UCL計算機系教授、上海數字大腦研究院院長汪軍告訴「甲子光年」:“ChatGPT驚豔的自然語言生成能力對於機器與人之間交互的影響是變革性的,它讓機器人能夠充分地理解人的語言表達,從而建立了最便捷的人機連接通路,為此後機器做泛化任務創造了基礎前提。”

“和超級聰明的人工智能交個朋友,一個月只用20美元。”一位網友調侃。

如今,這種通用性正在激發新的商業圖景。過去幾週,OpenAI先後發布了GPT-4、ChatGPT 插件,並開放了API接口,讓很多開發者和企業能夠直接調用OpenAI背後的大模型能力。各式各樣的工具和產品因此而生,ChatPDF、ChatExcel、新的筆記軟件……在矽谷幾乎每天都有幾十個基於OpenAI的新產品上線。

一位矽谷工程師還用GPT-4、Whisper和Monocle AR眼鏡搭建製作了RizzGPT,幫人擺脫尷尬的約會和麵試氛圍。 rizzGPT提供的是一種“實時魅力即服務(CaaS)”,它可以傾聽人的談話,並準確告訴這個人接下來應該說什麼話。

最盛行的一種觀點是:ChatGPT 是AI 時代的操作系統。 “如果說ChatGPT 的登場是’iPhone 盛會’,ChatGPT 插件帶來的就是’iOS App Store’盛會”,身在美國的克斯在推特上感嘆,“OpenAI可能會使用專有的模型運行他們的App Store,來交叉編譯各個插件(應用程序),就算開源的平台也無法與他們競爭,就像Android手機無法獲得iOS系統的全部體驗一樣。”

OpenAI創始人Altman更願意將大模型定義為新技術平台,借助平台,人人都是開發者。他說道:“新技術會解鎖人們構建應用程序的方式,這是移動互聯網之後未曾出現過的新機會,所有行業都會受益於此。”在他看來,基於新的技術平台,每個人都可以在自己的口袋裡擁有一個量身定制的助手,幫助學習、工作和提供醫療建議,而人們只需要說一句話就可以開啟這個專屬機器助手。

微軟云成為這場開發者盛宴最直接的受益者。今年3月,Azure向B端上線了Azure OpenAI服務,並更新了ChatGPT編碼功能,讓用戶通過Azure,直接調用OpenAI大模型的能力。這意味著,每新增一個使用ChatGPT、GPT4的開發者和企業,微軟雲就多了一個用戶。

雲計算之外,微軟的野心還瞄準了搜索引擎、SaaS產品等方向。此前,微軟已經將ChatGPT整合到必應搜索中,與穀歌直接競爭。另外,微軟雲也在加碼與OpenAI一系列產品的融合。辦公軟件市場新局開啟,GPT-4發布之後,微軟隔日就將宣布把GPT-4接入Office套件,推出了全新的AI功能Copilot(副駕駛),幫人直接寫項目書、做表格可視化、給PPT寫摘要、寫郵件、做會議總結、商務聊天。

“一百年後,我們將會回顧這一刻,並說:那是真正的數字時代的開始。”微軟副總裁Jared Spataro說。在這個新的起點,微軟已經佔領“lead time”。

2. 重複造輪子?

美國市場大模型生態創業景像如火如荼,大洋彼岸,中國科技行業也聞風而動。

“尋找或成為中國的OpenAI”成為了最首要的問題。

第一家迅速跟進產品動作的大廠是百度。 3月16日,百度發布對標ChatGPT的產品文心一言,並面向企業客戶開放文心一言API接口調用服務。 3月27日,百度推出了面向企業開發者的文心千帆大模型平台,其推理雲調用單價比ChatGPT便宜0.0003美元。 “文心一言和ChatGPT可能最多差兩個月。”李彥宏在接受36氪採訪時說道。

李彥宏直言:“中國的OpenAI不是創業公司的機會,沒有必要再重新發明一遍輪子。”

顯然,很多人不同意他的觀點。目前,美團聯合創始人王慧文、創新工場CEO李開復、前搜狗CEO王小川、前京東AI掌門人周伯文、出門問問創始人李志飛都官宣要創業做大模型。 “AI 2.0已經到來,會誕生比移動互聯網大十倍的平台機會。”李開復稱,3月19日,他發布朋友圈稱,要親自籌組Projevt AI 2.0——一個致力打造AI 2.0全新平台和AI-first生產力應用的全球化公司。

更多此前就錨定大模型方向的創業公司也浮出水面。致力於做決策智能的上海數字大腦研究院、做多模態AI大模型的MiniMax、專注於大模型研究和應用的西湖心辰、認知智能公司瀾舟科技均是在這波熱潮之前就成立的公司。

AI大模型正成為創投領域的香餑餑。最新消息是王慧文創立的新項目光年之外已經與AI架構創業公司一流科技Oneflow達成併購意向。

熱鬧的B面是現實的隱憂。

“做大模型創業的公司要融到大錢不容易了。”雲啟資本合夥人陳昱告訴「甲子光年」,他談到,2021年底在天使輪投資MiniMax的時候,這還是個冷門領域,國內少有人做,但當時由於和MiniMax創始團隊很早就認識,雲啟選擇相信這群人的技術信仰以及想做AGI的野心。

在陳昱看來,目前國內市場炒得過熱,不少人在跟風,有一些項目就是在魚目混珠。

對於真正想深耕大模型技術的公司而言,這也是一場注定艱難的戰鬥,資金、算力、數據、人才,以及更多未知的工程化方法,處處是難題,“沒有算力,沒有數據,不可能在幾個月內就搞出高質量大模型。”陳昱說。

錢是大模型創業最基礎的入門條件。 2022年,OpenAI花掉了5.44億美元,收入只有3600萬美元。 “1年融不到一兩億美金就無法入門。”線性資本資深總監白則人說。

算力也是關鍵要素,浙商證券的一份研報指出,支撐ChatGPT算力基礎設施至少需要上萬顆英偉達GPU A100(AlphaGO只需要8塊GPU),採購一片英偉達頂級GPU成本為8萬元,GPU服務器成本通常超過40萬元,一次模型訓練成本超過1200萬美元。這些都是顯性投入。 “算力是難題,但可以通過模型加速或者設計專用於Transformer芯片的方式解決,國內已經有公司在探索。”白則人在這一問題上態度樂觀。

白則人認為,在數據和場景上,大模型創業公司如何直面來自大廠的競爭壓力也是個關鍵問題。目前,百度、騰訊、阿里、字節、華為都已經公佈了自身的大模型技術。 “大廠都有自己的數據和場景,對大模型基礎層的創業公司而言,工程化落地能力之外,還需要積累足夠高質量的數據和可應用的場景才能和大廠比拼。”

比算力和數據更稀缺的是人才。雲啟資本合夥人陳昱告訴「甲子光年」:“大模型平台具有強技術屬性,需要頂級的工程師來把控方向,目前國內這方面的人才比較稀缺,拿到錢也不一定能在短時間內找到合適的人。”

從王慧文發布英雄榜一個多月以來都沒找到首席科學家的情形來看,找人確實是個大難題。

“這注定是屬於少數人的遊戲,最終大模型基礎平台層會剩下三四家創業公司。”陳昱說。

3. 先做基礎模型還是先做上層應用?

大廠和創業公司爭相競跑大模型平台性機會的同時,中國的大模型生態逐步走出了一幅與美國市場迥異的圖景。

最顯著的差異就是大模型公司做技術和應用的優先級不同。

一直以來,OpenAI把主要精力都放在了致力於讓大模型技術實現通用性上,用這種通用能力來解決垂直領域的問題,所以在美國市場,我們看到的大模型生態機會形成基礎層-中間層-應用層的分工。其中, OpenAI的定位就是成為新的基礎設施,做大模型平台,平台之上,中間層和應用層的公司來負責將技術抵達垂直場景。

比如,Notion、Salesforce等公司選擇直接調用ChatGPT的能力服務用戶。此前,SaaS企業Jasper就是基於GPT-3開源的API,幫助企業和個人用戶寫營銷文案和AI繪畫。 2022年10月,Jasper估值達到15億美元。

百度也在倡導這種“分層式”大模型生態機會,李彥宏在文心一言發布會分享稱:

  • 第一類是新型雲計算公司,雲計算主流商業模式將會從IaaS變為MaaS。
  • 第二類是進行行業模型精調的公司,介於通用大模型和企業之間的中間,這類企業可以基於對行業的洞察,調用通用大模型能力,為行業客戶提供解決方案。
  • 第三類是應用層的企業,基於通用大語言模型開發應用服務,這可能才是真正的機會。

有更多中國創業公司認為中國特色的大模型之路與美國市場不同。他們探索出一種“兩條腿走路”的方式,即一邊做大模型基礎平台開發,一邊直接瞄準垂直的行業場景落地。

創新工場孵化的瀾舟科技就是這樣一家公司。瀾舟科技成立於2021年6月,主要產品是基於“孟子大模型”核心技術打造的一系列能力平台和垂直場景應用,公司新推出的孟子MChat可控大模型擁有機器翻譯平台、金融NLP、AIGC智能創作等多個企業級解決方案。

“中國公司擁抱大模型的同時,要審時度勢,要注重落地,尤其是to B落地。”瀾舟科技創始人周明說。

前京東AI的掌門人周伯文在2021年創立的銜遠科技也選了這條路:垂直整合從自有基礎大模型到應用、用戶全場景閉環,其產品ProductGPT與ChatGPT很像,是一款多輪對話類AI產品,在3C、消費品、美妝等領域,ProductGPT比ChatGPT給出的回復更加專業。這條路更接近垂直類大模型。

“中國與美國的情況完全不同,中國OpenAI需要探索一條新的道路。”周伯文說。

這種“兩條腿走路”的發展也並非易事。 “創業公司資源是有限的,就像雲廠商很難把SaaS做到底一樣,對於初創公司而言,優先開發大模型技術,還是直接切入細分行業做場景是個單選題而不是多選題。”雲啟資本合夥人陳昱告訴「甲子光年」。

但中國的科技公司確實需要在早期就考慮到現實的商業落地問題,這是一個兩難的局面。

一些人還在失落,中國AI行業怎麼就落後了呢?一些人更關心接下來的答案,中國大模型公司能趕得上OpenAI嗎?

有人樂觀。線性資本資深總監白則人認為,雖然具體工程化的彎路和難題需要時間去攻克,但國內兩三年內做出類似ChatGPT 80%能力的產品概率很大,即使很難超越OpenAI已經建立起來的1億用戶和數據規模優勢,但只要國內創業團隊能做出初步可用的產品,接下來就會出現海量的開發者機會。

也有人覺得後發者未必沒有機會,“大模型確實存在工程化的難題,但護城河不像芯片,還沒有那麼深厚,隨著參數規模的增大,可能會遇到規模化的瓶頸,等模型能力慢下來之後,後來者就有機會。”

更多人在呼籲回歸技術本質,“國內市場需要接受專注技術工具的公司,才有可能真正的做到通用人工智能,但這需要漫長的時間以及堅定的技術信仰。”UCL計算機系教授、上海數字大腦研究院院長教授汪軍告訴「甲子光年」。

“這條路上,時間不是問題,信心和決心更重要。”汪軍說。

4. 應用層機會:國內更看重to B端

不論這場大模型平台的最終競賽結果如何,都不會影響應用層公司們的前仆後繼。李彥宏對大模型應用層公司的百花齊放非常看好,他說:“真正的機會在應用層,將會有更多的殺手級應用、現象級產品出現。”

目前國內很多投資人已經把重心從大模型基礎層平台轉移到更廣闊的應用層機會上,“中國會有自己的大模型,但線性更關注未來真正智能的場景應用。”線性資本資深總監白則人說。

這是一場所有公司都可以參與的遊戲。 UCL計算機系教授、上海數字大腦研究院院長教授汪軍告訴「甲子光年」:“Model As A Service 的模式下,基於大模型技術開發的各種應用可以服務於各行各業,比如將大模型能力和數據庫、機器人、智能汽車指令同步後,就可以用自然語言的方式讓聊天機器人直接操作這些軟硬件。”

在雲啟資本合夥人陳昱看來,應用層的機會中,80%的應用機會和2018年、2019年的一致,“只是由於大模型的通用能力,這些應用的技術路徑發生了變化;有20%的應用是大模型平台機會下新誕生的,比如用自然語言能力自動生成代碼等,對於開發者而言是革命性的。”

對於很多to B公司而言,大模型平台能力帶來的是一次全新的效率革命,也會實現此前無法達成的定制化服務。比如對智能合同賽道的法律人工智能公司冪律智能而言,公司的技術路徑和產品就會在這次大模型平台機會中迎來全新的變化。

冪律智能創始人塗存超告訴「甲子光年」,此前,公司做合同審查的路徑是梳理知識-數據標註-訓練模型,此後公司可以藉助聊天機器人進行信息抽取,“相當於取締了數據標註訓練模型的過程,此前這個過程成本高且耗時。”他也坦言,在一些特別專業的知識方面,還存在一些通用大語言模型無法很好解決的問題,需要沿用之前的技術路徑。

塗存超談道,大語言模型的通用能力也讓公司能夠做以前投入產出非常低的產品和項目,“在合同審查的業務中,以前由於成本很高,無法低成本高效的響應客戶個性化的合同審查需求,比如在合同台賬檢索的場景中,面對’公司Q1超過50萬的合同有哪些,和某公司的合同付款條款怎麼約定的’這些問題,以前需要檢索、篩選,現在直接問機器人就可以。”

塗存超透露,公司的商業化路徑也因此發生了變化,“目前主要客戶是中大型企業,現在也在開始探索通過ChatGPT的能力給小微企業提供合同相關法律服務服務。”據悉,目前,冪律智能聯合清華大學人工智能研究院、智譜AI、面壁智能、OpenBMB,即將發布基於中文千億大模型的法律ChatGPT。

像冪律智能一樣,很多to B公司都會在大模型技術平台的加持下走出新的商業化局面。線性資本資深總監白則人認為,當前已經從特定場景下的能用(AI +)進化到泛化場景的好用(AGI x),AIGC 會帶來範式級別的創新,可能會給未來十年帶來新的萬億美金的機會。

變量之下,也會有AGI時代全新的應用誕生。白則人提到,AGI native應用是全新的方向,“比如通過自然語言的方式直接分析處理數據,做企業決策服務等。此外,國內有不同於國外的軟件生態,比如很多軟件沒有部署在雲端,存在數據可觸達性的問題,會探索出新的方式和應用。”

在他看來,這次的AGI浪潮會加速國內企業擁抱數字化的工具,企業服務賽道會迎來新的機會。

AGI+B端應用前景被廣泛看好的同時,AGI+C端應用也正在成為熱門。國內公司已經開始嘗試,比如創業公司聆心智能就在打造場景化、人格化的ChatGPT,公司打造的“超擬人大模型”核心技術是可控、可配置、擬人化,通過簡單設置即可構造一個類人智能體。 “AGI時代的AI,每個智能體除了’能做助手’,都應該有個性、人設、情感、風格,能和人建立深度的情感和社交鏈接,這才是人和AI共生的核心”,聆心智能創始人黃民烈告訴「甲子光年」。

雖然AGI+C端的機會看上去更大,但在國內也面臨著更多現實挑戰。

這與國內C端用戶對數字產品的付費意願直接相關。一位科技領域投資人告訴「甲子光年」:“To C公司的天花板比to B公司高,但中美市場的付費意願截然不同,Midjourney一年可以實現1000萬用戶和1億美元營收,在中國就不一定。所以國內to B的機會反而更普遍。”

另一種對於未來應用層機會的擔憂是,隨著規模化能力的加強,大模型AGI會不會直接吞噬很多應用層的機會?

從目前GPT-4展現的能力來看,通用能力比ChatGPT更強,未來GPT-5的能力如果再上一個台階,很多應用層的產品有可能會被直接替代。

“有點像應用開發速度和大模型迭代速度的比拼”,一位從業者在播客《科技早知道》中說道。

有人覺得速度不會那麼快。因為to B產品和服務考驗的是垂直行業的認知能力、銷售能力、服務能力,隨著時間的積累,經驗優勢就是壁壘;而to C產品如果已經建立起品牌效應和用戶認同,也很難被直接替代。也有人覺得機器進化的速度已經超乎想像,未來一切皆有可能。

新的想法和觀點還在持續產生,大模型生態機會的共識也在形成的路上,對於從業者而言,或許比下判斷更重要的是傾聽更多不同的聲音。

展開全文打開碳鏈價值APP 查看更多精彩資訊

Total
0
Shares
Related Posts