文章來源:虎嗅
作者:小溪
圖片來源:由無界AI生成
百模大戰愈演愈烈,但許多從業者對大模型的疑問卻越來越多。
在基礎大模型領域,騰訊、阿里、百度等多個網路巨頭湧入,且阿里、百度、科大訊飛等大廠在最近一個月相繼發布了最新版本的大模型產品,技術能力也有了較大提升;新創公司在迭代新版本的同時,還在「瘋狂」融資,智譜AI於近日宣布今年已累計獲得25億元融資,成立近半年的百川智能已獲3.5億美元融資,這些創業公司的投資方中,也不乏騰訊、阿里、美團等網路巨頭。
中國真的需要這麼多基礎大模型嗎?各家基礎大模型公司都在瘋狂「成交量」技術參數,但市場到底需要什麼樣的大模型?在熱鬧且混亂的戰局下,這些問題被越來越多的人提出來。
回答這個問題,得先搞清楚基礎大模型在中國市場如何賺錢。雖然絕大部分人對大模型的感知是聊天機器人,也有不少用戶在搜尋資訊、整理文件時開始使用這些產品,但相關企業難以從這些C端產品中賺錢,甚至用戶規模越大企業虧損越多。當下,基礎大模型商業化最務實的方向還是在B端,服務零售、金融、製造業等領域企業降本提效,才能獲得穩定的商業效益。
企業對基礎大模型的需求無非3種:直接調取大模型API,取得相關大模型能力;基於大模型,貼合實際業務進行二次開發;基於大模型開發AI應用。這些需求考驗基礎大模型平台的技術能力,更考驗其企業服務能力。
從服務能力來看,大模型新創公司和網路巨頭公司都要從零起步,沒有人擁有先天優勢。能更快洞察客戶需求,並提供穩定可靠的平台才能脫穎而出。
大模型不是「吹」出來的
以ChatGPT走紅為分界點,國內大模型的發展經歷了冰火兩重天。
在ChatGPT走紅之前,國內只有少量的公司在從事基礎大模型研發工作,因為大模型的技術以及服務能力還未被市場廣泛接受,這些公司主要專注於技術研發和服務能力增持。當ChatGPT走紅之後,大量投資者和從業者湧入,大模型成了新風口。
市場火熱就容易催生投機者,他們不是深入鑽研技術,而是講故事、炒作概念,不管技術和服務能力如何,先把故事講得天花亂墜,並以此獲得資本市場和客戶的認可。一位大模型從業者層打趣地對虎嗅表示,國內很多大模型公司都稱自己和GPT-4的差距只有幾個月,這是因為他們都在已經開源GPT-2基礎之上做了一些訓練就出來講故事。
實際上,大模型的技術能力的進化並不是隨便訓練幾個月就能實現的,因為這是一個複雜的系統,規模大非常重要,規模不達到一定程度無法產生更智能的進化。而提升大模型的訓練規模,需要花費大量時間反覆調試。調試過大模型訓練參數的技術人員都理解這種困難:沒有人告訴你該怎麼做,只能自己摸索,這個過程中會出現各種意想不到的狀況,都需要花時間解決。
在國內,真正在技術能力上有底氣的基礎大模型,都是在ChatGPT走紅之前就開始訓練了,那時候大模型還沒有被大家熟知,很多人看不懂也不看好大模型,而堅持投入大模型的公司都對新技術非常篤定。
例如,智源研究院在2020年發起首個超大規模預訓練模型研究計畫“悟道”,其2.0版本一度成為全球最大的萬億級模型。今年升級之後,「悟道」 涵蓋語言、視覺、多模態等基礎大模型,並已進入全面開源的階段。
智譜AI同樣在2020年就研發起了GLM預訓練架構,也訓練出了一個百億規模參數的模型GLM-10B。 10月27日,智譜AI發布了自研第三代對話大模型ChatGLM3,其效能、推理能力、上下文容量等都相較於上一代有較大提升。與ChatGLM2相比,ChatGLM3在44個中英文公開資料集測試中,均排在國內同尺寸模型首位。其中,MMLU提升36%、CEval提升33%、GSM8K提升179% 、BBH提升126%。
另外,在功能上,智譜AI 發布的多個國產自研大模型(ChatGLM、CodeGeeX、WebGLM、CogVLM等) 也是目前國內對標OpenAI 系列大模型最完善的,且在生成式AI助手「智譜清言「上都是適用的。
這些最早一批做大模型的公司和炒概念、追風口的公司有本質差異。在大模型技術還沒爆紅、市場還沒那麼成交量的時候,他們就投身其中,是因為把基礎大模型技術價值和生意邏輯都想明白了。這種差異在大模型走紅之後也非常明顯,很多公司為了流量和話題度去涉足C端產品,而像智譜AI等最早一批涉足大模型的公司更聚焦在企業服務領域,所有的研發能力和服務能力也都圍繞著這個思路去佈局,踏實做增持,朝著為客戶創造價值的方向去發展。
大模型的複雜性決定了在技術和服務能力上增持時間較長的企業具備更強的優勢。當市場上越來越多人意識到大模型大模型的複雜性,以及大模型進化所需的時間,那些靠講故事炒概念的大模型公司,生存空間將會越來越小,而認真增持技術和服務能力的公司才能經得起第一波競爭的考驗。
沒有繁榮生態的大模型,沒有未來
在大模型商業化的過程中,誰能在具備社會剛需的應用場景落地,誰就能最先形成自我造血的良性循環。
通用大模型具有更廣泛的應用範圍,但在解決垂直領域特定問題時並不夠專業。垂直大模型解特定領域問題的能力更強,但服務範圍非常受限,這導致許多垂直大模型很難實現成本和商業收益的平衡,發展空間有限。
大模型應用的最終落點是要為生活和生產所用,能解決工作、生活中的實際問題,提升工作效率和生產力。綜合目前通用大模型和垂直大模型的優劣勢,當下大模型商業化過程中一個更為合適的思路是,通用大模型作為基座,把技術和服務能力開源給零售、金融、製造等領域,通用大模型和相關領域企業一起合作,共建應用場景。
受限於數據、算力、場景等限制,真正能跑通開源的大模型並不會太多。同時,作為基礎技術底座,大模型的角色和PC、手機作業系統非常相似,將呈現「大樹底下,寸草不生」的競爭格局,即一兩個技術底座佔據行業統治地位,所有的應用開發者都要基於這兩個技術底座開發。如果基座大模型無法形成繁榮的生態,就沒有永續發展的能力。
從PC、手機作業系統的發展歷史來看,先發優勢非常重要。當Windows統治PC市場,iOS和Android在手機領域二分天下之後,其他作業系統很難再有翻盤的空間。
大模型領域也呈現相同的趨勢。大模型將開啟一個繁榮的AI應用生態,個人及企業的數據、能力或應用,都能快速變成AI插件,增強大模型的能力,也將讓大模型更實用易用。
目前,百度、科大訊飛等巨頭公司已經致力於生態建設,百度智能雲千帆大模型平台2.0月活企業數近萬家,覆蓋了金融、教育、製造、能源、政務、交通等多個行業的400多個場景,科大訊飛的星火大模型平台開發者規模已超70萬個。
一些在大模型領域增持較長時間的新創公司,也最早吃到了螃蟹。智譜AI目前客戶數量超過1000家,共建生態的合作夥伴超100家,涵蓋傳媒、SaaS、教育、辦公室等多個場景。例如,WPS智慧文檔生成簡報內容、撰寫新聞稿等能力背後,就有智譜AI的技術能力作為支撐。
在各個大模型平台的生態競爭中,最考驗平台的是其帶給合作夥伴的價值以及和合作夥伴共同成長的能力。就以辦公場景來說,簡報內容生成、文章內容撰寫、風格改寫對大模型平台的精度、推理等能力要求非常高,只有達到一定技術水平的大模型才有能力支撐這些應用,同時大模型平台還需要根據用戶在實際應用中的回饋糾錯迭代。
無論是巨頭公司還是新創公司,即使資金和資源實力再強,都要從零開始一步一步來增加一個腳印的迭代。所以,大模型平台在建構生態過程中,時間優勢顯得非常重要。這也是為什麼有先發優勢的新創公司和資金資源能力較強的網路大廠能夠旗鼓相當的原因。
百模大戰,誰比較適合中國市場?
雖然百模大戰的戰局熱鬧且混亂,但背後的競爭方向已非常清晰,技術和服務能力以及大模型平台構建生態的能力直接決定競爭的走向。
這些能力的建構需要時間增持,很難一蹴而就,但光有時間的增持也是不夠的。先發優勢,除了早行動帶來的時間差之外,還有精準洞察到市場需求的能力,即沿著一條正確的戰略堅定而快速地行動,戰略搖擺以及走彎路很容易把早行動增持的時間優勢全部損耗掉。
當越來越多大模型平台都把重心轉移到生態建設之後,平台的策略定力和執行力在生態的競爭將變得越來越重要,誰能更有效率地完成各個領域和場景從0到1的增持,誰的優勢就更加明顯。而當少數幾家平台完成向超級平台的質變之後,競爭格局也就基本確定下來。
在大而複雜的國內市場,B端服務企業很容易出現策略搖擺以及走彎路的情況。一方面,國內市場企業所處的區域、經營規模不同,對大模型給企業智能化價值的認知有較大差異,願意投入的資源和付出的成本也各不相同,較難找到一個標準化的解決方案;另一方面,不同領域企業對大模型能力的需求不同,甚至同一領域的不同企業對大模型的需求也不盡相同,在不同需求的撕扯下,大模型公司很容易從基礎技術底座變成專案外包公司,而很難成為真正的超級平台。
在這樣的環境下,相較於OpenAI的商業化方案,國內大模型平台的商業化落地需要更重視細節。在一些平台的商業化思路上,我們看到了這樣的趨勢。
例如,除了常見的開放平台API服務以外,智譜AI除了還提供了雲端私有化和本地私有化兩種方案。雲端私有化可協助企業基於私有資料打造專屬大模型,擁有更強的安全性,而本地私有化是中國市場獨有的方案,除了提供更強大的模型,還提供完整的模型矩陣,以滿足各種場景和需求。
針對本文生成、智慧客服、數據標註等不同的客戶需求以及大中小型企業的需求規模,智譜AI都提供了不同的解決方案,客戶可根據自己的需求自由組合。這種更細節更靈活的服務模式,也是基於長期對中國市場的精準洞察而來的。
面對外部環境的不確定性,智譜AI還啟動了國產晶片適配計劃,和國內硬體廠商、晶片廠商合作,面對不同類型的用戶不同類型的晶片提供不同等級的認證和測試,讓大模型服務更安全可靠。目前,ChatGLM系列已支援10餘種國產硬體生態,包括昇騰、神威超算、海光DCU、海飛科、沐曦曦雲、算能科技、天數智芯、寒武紀、摩爾線程、百度崑崙芯、靈薰科技、長城超雲,同步發布的可手機部署的端測模型ChatGLM3-1.5B和3B支援小米、vivo、三星等多種手機以及車載平台。
在百模大戰的戰局越激烈,這些看似不起眼的細節就越重要,因為這些細節決定了外部合作夥伴的認可程度,也關係著大模型在不同場景下的落地速度。單純發布一個大模型的門檻,沒有市場想像那麼高,但能夠擁有高品質數據場景,才能持續迭代,形成競爭壁壘,而高品質數據場景的關鍵就在於外部合作夥伴——讓更多合作夥伴願意選擇的平台,更容易跑通這個商業循環。
在這場競爭中,許多從業人員認為贏家一定是資源和資金能力較強的巨頭公司,其實不然。新創公司和巨頭公司都需要身體力行,深耕細節,沒有任何捷徑。至於資金,並不是決定戰局的根本,因為有核心競爭力的創業公司也並不會缺錢——即使智譜AI目前已獲得大模型創業公司最高額的融資,還有更多新的投資者想入局。
如果換一個角度思考,其實對於誰是更適合中國企業的基座大模型,資本市場已經用腳投票了。
資訊來源:由0x資訊編譯自8BTC。版權所有,未經許可,不得轉載