建議阿里、百度、華為們,不要急著搶行業大模型的“飯碗”


原創:一蓑煙雨

來源: 資料猿

大數據產業創新服務媒體

——聚焦數據· 改變商業

近幾個月,國內大模型領域一個很明顯的發展態勢,就是大家札堆產業大模型。不僅各垂直領域的企業發表多個產業大模型,而且百度、阿里巴巴、華為、騰訊、京東等頭部巨頭,也把產業大模型當作一個關鍵的發力點。

具體來看,根據大模型在其策略上的比重,這些廠商又可分為兩類:

百度、阿里巴巴、騰訊、科大訊飛這幾家,通用大模型與產業大模型並重。

一方面,他們比較注重通用大模型,並將通用大模型開放給C端使用者使用。百度文心一言、科大訊飛的訊飛星火甚至做了手機端APP,來推廣通用大模型的應用。

另一方面,他們也非常注重產業大模型。一般透過行業解決方案的形式,對外輸出。甚至,在9月19日,百度直接推出了一個醫療產業大模型──靈醫大模型,直接服務醫院、病患、醫藥器材企業。

另外一類,則以華為、京東為代表,他們從一開始就主打產業大模型,直接面向產業應用。

華為盤古大模型一開始打出的口號就是“不作詩,只做事”,其並不熱心C端應用,幾乎把所有戰略重心都放在行業上。

京東的言犀大模型也類似,秉持京東雲「更懂產業的雲」這個理念,京東在大模型領域也將重心放在產業應用上。此外,京東健康也發表了京醫千詢大模型,作為進軍產業領域的排頭兵。

可以發現,無論是「兩線並重」的百度、阿里巴巴、騰訊、科大訊飛,還是幾乎「單線作戰」的華為、京東,都將產業大模型作為一個兵家必爭之地。

筆者認為,這是有問題的。這些科技巨頭,應該把重心放在通用大模型上,行業應用應該交給各個行業領域的合作夥伴去做,自己只做大模型的“基礎設施”,不碰上層應用。

為什麼這樣說,接下來我們來詳細分析其中的優缺點關係。

巨頭應該著眼於通用大模型的研發

通用大模型就像整個大模型產業的地基,地基是否牢固,將決定了這座大廈能夠建造多高。那麼,現在的地基牢固呢?

很遺憾,雖然目前大模型初步實現了智能“湧現”,在自然語言理解、內容生成、邏輯推理方面都有長足的進步,但是還不夠好。尤其是想讓大模型在各產業領域進行商業落地,目前的模型能力是不夠的。

這裡說的能力不夠強,不是特別指某一個大模型。

即使是GPT-4,要想在商業領域落地,能力都還存在著顯著的不足。我們來看幾個例子。

搜尋引擎是大模型一個重要的應用場景,微軟的必應因為連接到ChatGPT,改變了原來關鍵字的搜尋方式,打了一個漂亮的翻身仗。那麼,有ChatGPT助攻的必應的真實表現如何呢?

我們試用了一下,說實話讓人很失望。

以下是一個例子,讓必應查找一下今天(9月26日)關於大模型的新聞,結果給出的四條新聞,點進去之後,第1、3條內容其實來自於一篇新聞文章,而且這則新聞是2月21日發布的;第2、4條內容也來自同一篇新聞,這個新聞是7月27日發布的。

也就是說,給來的新聞是錯的,我們要找今天的新聞,結果卻回到幾個月前的內容。而且,我們是要找大模型領域發生的重要事件,給出來的四個答案中,有兩個報告、一篇新聞分析文章、一個論壇活動。嚴格的說,報告、分析文章不算是重要的新聞事件,從這個角度來說,必應給出的結果也完全不符合要求。

筆者接著往下問,讓它用表格梳理一下給的新聞內容。結果在其給出的表格中,新聞時間都變成了9月26日,而且具體到時間點,這明顯就是在胡說八道嘛。

筆者曾經對必應這類新的搜尋引擎懷有很高的期待,也嘗試過很多次。但整體的感覺就是──基本上不能用。這就是ChatGPT在搜尋領域應用的實際表現,某種程度上,這已經代表了大模型所能達到了最高水準。

百度也推出了類似的功能,除了通常的網頁搜尋外,還可以透過對話形式來進行查詢,我們迫不及待的試了一下。

相對於必應,百度對於新聞事件的理解要好一些,必應給出了幾個報告,百度給出的結果是大模型發布,這些事件的新聞價值明顯更高。

但是,百度給出的這些結果卻是可靠呢?同樣的,我們讓其以表格形式進行統計,並給出新聞時間和連結。可以發現,時間都是5月11日的,這明顯是有問題的,我們要的是9月26日的新聞,而不是5月11日的新聞。

而且,表格裡給的新聞連結也有問題,開啟對應的網頁直接是「404」。當然,微軟的必應也有這個問題,其給予的新聞連結要不是打不開、就是不存在。

回到ChatGPT上來,其一個重要的限制就是不能連網,而且其資料沒能即時更新,GPT-3的訓練資料集是截止到2021年9月,GPT-4的訓練資料集是截止到2022年1月。

而且,ChatGPT在複雜的資料計算處理方面,常常會出錯。其宣稱的文本上傳、理解能力,也不理想。

讓我們來試試GPT-4的文檔理解能力。我們上傳了龍芯中科的2023年半年報,試圖讓其來做一個簡單的SWOT分析。上傳文檔之後,ChatGPT就開始寫程式碼,來解析文檔,好像很厲害的樣子。

結果如何呢?

最終,ChatGPT沒解析出來這個PDF文檔,我們又試了好幾次,結果都是解析不出來。

試想一下,依托這些大模型,想要在複雜的產業場景落地,效果必然不會很理想,而他們已經是現在市場上最好的通用大模型了。

誠然,大模型的確出現了一些“智能湧現”,能力得到質的提升,但目前處於“小荷才露尖尖角”的初級階段。既然發現大模型這條道路是一個有希望的方向,那麼現在最應該做的是快馬加鞭,好好培養這個有潛力的“孩子”,而不是過早的就讓其來養家糊口。

以歷史經驗來看,每次人工智慧狂熱之後都會經歷一段漫長的沉寂,主要原因就是前期人們的期望值被拉得太高了,一旦發現達不到期望就會很失望。

同樣的,如果現在就匆匆將大模型在各個行業領域強行落地,很快就會迎來一個問題爆發期,人們會從巨大的期待迅速轉變成瘋狂吐槽,這樣的大起大落是不利於行業健康發展的。

所以,阿里巴巴、華為、百度、騰訊這樣的科技巨頭,目前最核心的任務,就是把通用大模型這個「孩子」培養好。只要能力真正提上來了,那規模化落地其實是很快的,不急著在這一時半會。

大模型領域有一條著名的智慧湧現的曲線,也就是模型的表現跟參數規模並不是線性相關的,不是200億參數的模型就比100億參數的模型好兩倍。

在這個智慧湧現曲線上,有一個閾值,目前看這個閾值就是1000億參數左右。在這個閾值之前,模型表現出的智力水準並不隨著參數規模的擴大而顯著變化,200億參數的模型跟20億參數的模型表現差不多。但是,當參數規模邁過千億的門檻之後,模型的表現得到指數級提升。

雖然,模型規模不能代表一切,但從近十年的人工智慧發展經驗來看,「數量暴力」往往是一個關鍵的方向,更大的模型、更深的神經網路、更多的數據,會帶來更好的表現。

從目前的智慧湧現曲線來看,千億級參數規模之後,又會進入一個智慧瓶頸期,可能5000億參數的模型,跟1000億參數模型在「智力」上沒有顯著的差異。但是,如果我們要追求下一個“湧現閾值”,目前來看最好的方法就是繼續擴大參數規模。也許,等參數規模擴大到幾十億之後,又會迎來下一個湧現閾值,大模型的能力將再上一個台階。

大模型智慧湧現預測資料猿製圖

當然,擴大模型規模,成本也會顯著提高,所以這只能是巨頭們的遊戲。而且,單純擴大模型規模,還會帶來過擬合的問題。因此,模型規模的擴大也需要配合模型架構的最佳化調整,這才是真正考驗技術能力的地方。

退一步說,現在的大模型都是基於Transformer架構,而這個架構是5年前谷歌的幾個研究人員的論文提出來的。那麼Transformer架構真的是最好的麼,是否有更好的模型架構呢?這些問題,都是需要華為、百度、阿里巴巴、騰訊等科技巨頭來回答的。

除了參數規模、模型架構外,大模型還需要解決「幻覺」問題、可解釋性問題、多模態問題。這些問題現在都沒能得到很好的解決,這是整個產業所面臨的共同難題。而要解決這些問題,關鍵還是在於一般大模型上的底層技術突破,而不在於產業大模型。

當然,誰能真正解決這些關鍵問題,那麼市場必定會給予對應的獎勵。

不要既做裁判又做運動員

之所以建議科技巨頭先不要碰產業大模型,除了通用大模型的問題還沒解決外,另一個很重要的原因,就是避免與夥伴發生利益衝突。

對科技巨頭而言,玩的是生態的遊戲,分享的是基礎建設的效益。

在大模型領域,其價值傳導路線應該是通用大模型-產業大模型-產業客戶。在產業大模型階段,華為、百度、阿里等一般大模型廠商既可以自研產業大模型,也可以讓第三方合作夥伴在自己通用大模型基礎上進行研發。

大模型產業應用價值傳導機制資料猿製圖

通用大模型考驗的是技術能力,而產業大模型的技術門檻並不是很高,其核心要素是數據和產業經驗,而這兩點是科技巨頭們的短板。要匯集金融、醫療、製造、零售等各行業的優質資料集,理解各行各業的業務場景,絕對不是某一家企業能夠做到的,必須依託生態的力量,用整個生態體系成千上萬的合作夥伴去做。

當然,百度、華為、騰訊這樣的一般大模型廠商,也可以兩條價值傳導路線都佔。例如,在醫療領域,百度既可以用自有的靈醫大模型去直接服務醫院、病患、醫藥器材企業,同時也可以推動垂直醫療大模型合作夥伴體系建設。

但是,這種情況就會面臨「與民爭利」的問題,這犯了商業的大忌。

試想一下,某個醫療大模型企業A,建立在B企業的通用大模型基礎上,把自己的核心醫療資料向B開放,訓練醫療大模型。在幾個月之後,A發現B企業也推出了醫療大模型,而且功能跟自己的差不多。在產業客戶打單時,發現B企業也在競標,自己的合作夥伴突然變成了競爭對手。如果是這種情況,A企業還願意與B企業合作麼?

在一個生態體系中,合作夥伴對於生態主的信任是黃金一般寶貴的東西。只有上層應用夥伴堅信生態主不會跟他發生利益衝突,不會搶他生意,他才會放心把自己的事業放在生態主建構的平台上。

這有點類似雲端運算領域IaaS廠商與SaaS廠商的關係。中國許多SaaS企業之所以對阿里雲、騰訊雲、百度雲、華為雲等雲端廠商不放心,最關鍵的就是怕利益衝突。目前,IaaS雲端廠商的業務邊界不夠清晰,不僅提供IaaS、PaaS產品,還進入了許多SaaS領域,這是其SaaS合作夥伴最忌諱的。

在中國網路的早期階段,投資人對新創公司有一個著名的靈魂拷問──騰訊做一個同樣的產品,你怎麼辦?

同樣的道理,通用大模型廠商想建構一個應用生態,那醫療、金融、政務、製造業等領域的產業大模型廠商也會問──你將來做一個跟我一樣的東西,那我該怎麼辦?

那怎樣的大模型生態體系才更合理呢?可以藉鏡雲端運算生態體系,通用大模型相當於IaaS,產業大模型相當於SaaS。

百度、華為、阿里巴巴、騰訊、京東、字節跳動、科大訊飛等幾家頭部通用大模型廠商,專心做好通用大模型(IaaS+PaaS),盡量不碰行業大模型(SaaS),劃分好業務邊界。

需要指出的是,即使不做產業大模型,底層通用大模型廠商仍可分享到大模型的產業應用紅利。就像SaaS應用程式會消耗IaaS資源,為IaaS付費一樣,上層的產業大模型會調用下層通用大模型的能力,可以基於呼叫的次數和使用量,來建構合理的商業模式。

例如,百度不做醫療大模型,但文心一言基礎上有10個醫療大模型夥伴,每個合作夥伴服務1000家醫院。假定每家醫院每年付費100萬元,這100萬中百度分享20%。那每個醫療大模型企業每年可收入10億元,百度的收入為10億*20%*10=20億元。這樣一來,百度只需要服務10個合作夥伴即可,而不是去服務1萬家醫院。

以此類推,如果能夠建構一個繁榮的產業大模型生態體系,大模型的產業應用也可以為底層通用大模型廠商帶來上百億的收入規模。

對於百度、華為、騰訊、阿里巴巴這種通用大模型廠商而言,根本不用擔心錯過產業大模型應用的紅利。就像雲端運算領域,有哪個SaaS廠商的收入能夠媲美做IaaS的阿里雲、騰訊雲、華為雲?

只要專心把通用大模型的地基打好,那以後就可以躺著賣“地皮”,而不用苦哈哈的搬磚建房子。我們回想一下房地產領域,最賺錢的是萬科、恆大這種房地產開放商麼?顯然是賣地更賺錢,也更輕鬆。

對於垂直產業大模型廠商而言,他們最理想的狀態,是藉鑒SaaS跨雲部署策略,實現產業大模型的跨通用模型部署,並可將業務從一個通用模型平台平滑地遷移到另一個平台,這樣就避免了被單一平台綁定。當然,目前產業大模型才處於非常初級的階段,談跨通用模型部署還為時過早。

產業大模型的跨模型部署模式資料猿製圖

綜上,建議百度、華為、阿里巴巴、騰訊這類科技巨頭,把注意力放在通用大模型的研發方面,而不是放在產業大模型的應用上。

一方面,通用大模型現在還不夠好,模型的智慧水準不夠高、幻覺問題、可解釋性差、多模態融合能力差、模型訓練推理成本高等問題還很突出,科技巨頭應該去解決這些更底層、更具挑戰性的難題。只有這些問題解決,大模型產業應用的根基才穩固。

在大模型產業應用層面,完全可以交給上層的垂直領域企業去完成。可以預見,每個領域都將會有數百家產業大模型企業競爭,最後優勝劣汰留下來幾十家,這些生存下來的企業就是合格的合作夥伴。底層通用大模型廠商應該與合作夥伴一起建構一個生態體系,來共同服務產業客戶。

資訊來源:由0x資訊編譯自8BTC。版權所有,未經許可,不得轉載

Total
0
Shares
Related Posts