國產大模型即將跨越“算力關”


原創:趙晉傑

來源:字母榜

圖片來源:由無界AI工俱生成

國內科技大廠,在大模型競爭上再一次取得共識:既要做淘金者,也要賣鏟子。

進入4 月份,阿里雲一邊發布通用大模型“通義千問”,一邊致力於幫助其他企業打造專屬大模型。一位接近阿里雲的人士表示,阿里雲“甚至可以只賣鏟子”。

尚未公開內測自有大模型產品的騰訊和字節跳動,也搶先盯上了賣鏟子的生意。

騰訊雲發布了面向大模型訓練的新一代HCC(High-Performance Computing Cluster)高性能計算集群,通過搭載英偉達最新H800 GPU,將整體性能提升了3 倍。

字節更是明確表態,火山引擎不做大模型,而是要為大模型客戶提供算力平台,幫助其做好大模型開發。

在阿里、騰訊、字節相繼決定賣鏟子之前,百度其實是這一策略的更早提出者。但百度不同的是,前述大廠們都是在賣算力,百度更多是聚焦在服務。

在百度看來,支撐大模型訓練和運轉的算力固然重要,但不是評判大模型優劣的唯一標準。好的大模型需要由算力、框架、模型、應用構築的四層架構相互配合提供支撐,需要將模型開發、訓練、調優、運營等複雜過程封裝起來,為客戶提供低門檻、高效率的企業服務。

有百度內部人士告訴字母榜,在率先發布國內首個大語言模型文心一言後,3 月底的一場閉門溝通會上,百度就推出了“既淘金又賣鏟子”的百度智能雲大模型平台,並在近期正式將其命名為“文心千帆大模型服務平台”。

據字母榜了解,正在內測的“文心千帆大模型平台”,是全球首個一站式的企業級大模型生產平台,不但提供包括文心一言在內的大模型及第三方大模型服務,還提供大模型開發和應用的整套工具鏈,允許企業基於任何開源或閉源的大模型,開發自己的專屬大模型。

在賣鏟子上達成新共識後,頭部雲廠商之間的大模型之戰,開始深入AIGC+Application 的軟件應用開發。

這也是時下投資機構最為青睞的方向之一。線性資本創始合夥人兼CEO 王淮就表示,這是自己特別看重並且願意花力氣去挖礦的領域。今年上半年,線性資本至少看了兩三百個基於大模型開發的各類應用。

已經走向全面開放或內測階段的大模型產品提供商,由此掀起新一輪的應用生態建設競賽。

OpenAI 發布了ChatGPT Plugins 插件功能,開始將大模型能力直連第三方應用;微軟推出了AI 版Office“全家桶”——Microsoft 365 Copilot,並將其測試企業數量從最初的20 家,在近期擴展到600 多家。

截至5 月上旬,百度文心一言的內測企業數量超過300 家,並在400 多個企業內部場景取得了測試成效。

然而,目前企業應用大模型仍面臨諸多難點,如模型成交量大,訓練難度高;算力規模大,性能要求高;數據規模大,數據質量參差不齊。

隨著越來越多應用與大模型相結合,其也將倒逼雲廠商對自己的大模型服務體系進行升維,走向一條追求更好效果、更低成本的道路。

通過全棧自研體系的端到端整體優勢,百度智能雲在實現大模型訓練成本降低的同時,做到大模型產品服務體驗的不掉隊,破除外界評判大模型優劣時唯算力論的極端觀點。

百度集團副總裁侯震宇告訴字母榜,在接下來幾個月,百度大模型服務通過迭代優化,還將實現大規模的成本下跌,不僅算力不會成為阻礙,“價格應該也不會成為大家所使用或者是擁抱大模型的瓶頸。”

A

“同樣60000 字的文本回復量,一個人工客服,一天的成本在100 元– 200 元,換用大模型智能助理,成本只有1 塊錢。”將大模型產品引入客服體系進行內測後,一家旅遊行業業務負責人直觀感受到了大模型帶來的降本增效成果。相關產品未來會在完成安全評估後上線。

一些昔日垂類明星企業,股價甚至被大模型直接沖垮。美國學生習慣用以搜索課堂作業答案的在線教育公司Chegg,成為全球首家公開承認“收入受ChatGPT 影響”的公司,公司股價年內跌幅接近60%。

網絡流量數據網站SimilarWeb 給出的一份報告顯示,今年3 月份GPT-4、微軟New Bing 等產品陸續上線後,Chegg 網站轉化訪問量同比暴跌89%。

對於企業來說,接入大模型產品已經從一道選擇題,變成了必答題。

考慮到各行各業都有自己的Know-How,在遠望資本程浩看來,這正是頭部雲廠商紛紛發力賣鏟子生意,幫助企業打造行業專屬大模型的動因之一。

但並不是每一家企業都需要從0 到1,自主研發一個百億、千億的大模型產品。去年春節開始決定將辦公文檔引入大模型產品後,金山辦公就明確好了甲方心態——自己不做大模型,而是藉助外部已有大模型方案,定制自己的專屬大模型。

在當前大模型尚缺乏評判好壞的統一客觀標準之下,如何在“百模大戰”中挑選出適合自己的大模型產品,正在成為企業面臨的一道新難題。

金山辦公助理總裁田然表示,公司的策略是要跟中國最好的大模型服務提供方站在一起,這勢必要求大模型技術提供商做到“人無我有,人有我優”。

效果好不好,無疑會成為企業評判大模型產品好壞的首要標準。這一方面要看大模型產品是否已經有了大規模應用,如百度文心一言,已經在內部的百度搜索、百度新聞、百度地圖,小度智能屏、如流等等方面實現大規模落地,並籍此成為國內唯一將大模型在實際應用中大規模落地的公司。

另一方面還要看大模型是否足夠靈活便捷。基於文心千帆大模型平台,百度智能雲提供公有云和私有云雙重部署方案,並分別配套有大模型推理、微調、託管,軟件授權、軟硬一體和租賃等多元化服務。

金山辦公由此看中了文心千帆在安全合規、模型深度、迭代速度、推理性能等多個方面的行業比較優勢。目前,雙方在意圖理解、PPT 大綱生成、範文書寫、生成待辦列表、文生圖等多模態生成場景上的聯合探索開發,已經取得了進展。

金山辦公CEO 章慶元在接受采訪中提到,成本是打消公司自研大模型念頭的重要考慮因素。基於此,運行成本成為企業評判大模型產品好壞的另一決定因素。

運行大模型有多少燒錢?從OpenAI 身上就能略窺一二。近期,OpenAI 被爆出去年虧損額翻倍,達到5.4 億美元左右,主要都被用以支撐ChatGPT 的運轉以及從谷歌挖人。

OpenAI CEO Sam Altman 更是表示,OpenAI 可能需要在未來幾年嘗試籌集多達1000 億美元的資金,用來開發足夠先進的通用AI,同時維持公司的正常運轉。

在追趕OpenAI 的道路上,後進者是否也要做好巨額虧損的準備?百度集團副總裁侯震宇向字母榜解釋道,“這或許說明微軟的雲服務賣得太奢侈了。”

百度集團副總裁侯震宇

一個明顯的佐證是,2023 年一季度,微軟雲計算毛利率達到72%,而國內云計算廠商大多還處於虧損階段。

為了降低用云成本,微軟、谷歌等美國頭部雲廠商開始加速自研服務器芯片和雲端AI 芯片。

“如果你能製造出針對AI 進行優化的矽,那前方等待你的將是巨大的勝利。”研究公司Forrester 分析師格倫・奧唐納形容道。

百度同樣也在推進旗下芯片自研計劃,其崑崙芯三代將對標更高性能的顯卡,有望在2024 年量產。

值得注意的是,除了芯片層的成本優化外,百度還是全球唯一一家在芯片層、框架層、模型層和應用層具備全棧協同優勢的雲廠商。

借助端到端的整體優化能力,在文心一言開啟內測近兩個月以來,百度已經對其進行了4 次技術版本升級,並將大模型推理成本降至原來的十分之一。

在接下來幾個月,百度大模型服務通過端到端的迭代升級,還可以實現大規模的成本下跌,“價格應該不會成為大家所使用或者是擁抱大模型的瓶頸。”侯震宇表示。

通過百度過去近兩個月在大模型落地應用上的實踐經驗,侯震宇總結出了企業選擇大模型的三個標準評判:大模型本身的能力、大模型企業服務的能力、全棧技術增持程度。

B

持續不斷的AI 創新和研發投入,無疑將成為支撐大模型效果和成本持續優化的源動力。

但一則令AI 創業者略感恐慌的消息卻在近期被證實。一度引領全球AI 發展方向的谷歌,為了不再為他人作嫁衣,正式決定“以後將不得不推遲與外界分享自己的工作成果”。谷歌人工智能主管傑夫・迪恩對此表示,背靠微軟的創業公司OpenAI,正是在大量閱讀谷歌提交的AI 論文基礎上,才做到了與穀歌保持同步。

令OpenAI 火遍全球的ChatGPT,其中的T——Transformer,就是谷歌2017 年在一篇AI 論文中率先提出的概念。

在侯震宇看來,谷歌關閉基礎性AI 研究的分享舉動,更多影響到的是那些在AI 領域沒有自我積澱和獨特優勢的公司。

當所有公司都無法再依靠谷歌來為自己辨明AI 方向後,此舉反過來卻可能為國內科技大廠創造出一個新的競爭優勢。

近期,李彥宏在談及當下的大模型混戰中,就提到“算力不能保證我們能夠在通用人工智能技術上領先,算力是可以買來的,創新的能力是買不來的,是需要自建的。”

作為一款對標ChatGPT 的產品,百度文心一言,背後包括有監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強等六大關鍵技術。

“前三項是這類大語言模型都會採用的技術……後三項則是百度已有技術優勢的再創新,也是文心一言未來越來越強大的基礎。”百度CTO 王海峰解釋道,如通過知識增強,文心一言可以在調用更少參數的基礎上,達到效率更高、效果更好的目標。

這一創新優勢同樣適合於企業借助文心千帆大模型平台,通過數據微調,打造自己的專屬大模型產品。

在5 月9 日的一場閉門交易所會上,百度首次對外演示瞭如何微調行業專屬大模型的全過程。在文心一言基礎上,百度內部測試了一款專屬大模型“文心問數”,希望來展示數據的可視化能力。這也是國內第一個公開演示如何微調大模型。

在被要求其生成華北地區乃至全國2019 年3 月銷售額時,“文心問數”順利生成了餅狀圖等可視化圖標。

但在將難度升級,要求其生成“華北地區2019 年3-5 月的銷售額,用折線圖來表示”時,“文心問數”直接表示自己處理不了。

借助文心千帆大模型平台,這家公司只需新建一個包括約100 條標註數據的微調數據集,發起模型微調,不到半個小時,就能完成對專屬大模型的能力升級。

升級後的“文心問數”,不僅能夠順利完成特定指令和要求,並且對於同類需求還有一定的泛化能力。

C

大模型給傳統應用帶來的大幅體驗升級,讓越來越多人開始認同一種觀點,即所有應用都值得用大模型重做一遍。

如同Windows 帶動了PC 普及,Android 催生了移動互聯網的生態,AIGC 時代“將誕生比移動互聯網大十倍的平台機會,將把既有的軟件、使用界面和應用重寫一次。”李開復預測道。

眼下,百度等國產大模型廠商,正處於一場爭奪AIGC 時代“Android”的激烈競爭中。誰能搶先拿下更多的企業客戶,誰就有望憑藉“滾雪球效應”脫穎而出。

這是一場面向AIGC 時代應用生態開發標準的搶位戰,比的是誰能跑得更快,誰能拿到更多的反饋數據,誰能建立更多的應用落地優勢。

儘管各家大模型產品在技術上大同小異,但大語言模型也是有“方言”的,相關產業專家表示,不同的大語言模型因為訓練的數據分佈不同,構造高質量數據不同,決定著用戶提問的方式、調教和使用的方式也不盡相同。

就像開發者在不同手機操作系統上開發一款遊戲,儘管最終遊戲效果、賽制差不多,但分屬不同操作系統的遊戲好友,是沒辦法進行排位等操作的。一旦企業用了某個大語言模型,再切換到別的大模型,遷移成本會很高。

“這也造成了誰能夠跑得更快一些,獲取更多的應用,拿到更多的反饋,誰就能持續地保持一定程度的領先。”上述專家表示。

大模型不僅將成為新的應用生態的Game Changer,當越來越多客戶基於大模型重塑業務後,大模型還有望成為雲服務行業的Game Changer,徹底改變雲計算的遊戲規則。

在李彥宏看來,過去,雲計算主要賣算力,看速度、看存儲。今天,客戶購買雲服務,則要看框架好不好、模型好不好。 MaaS(模型即服務),將成為評判雲服務的行業新標準。

更重要的是,在移動互聯網時代已經劃分好市場地位的雲廠商,面對AIGC 時代的新機遇,有望重塑行業格局。

美國第四大雲計算廠商甲骨文,在過去一個月內,因為頭部雲廠商算力緊缺,甲骨文模型服務更便宜,已經吸引不少人工智能初創企業轉而成為甲骨文的新客戶。

隨著越來越多企業將更多業務融入大模型,當AI 能力逐步放大變成企業上雲的主要需求後,如百度這類押注AI 的雲廠商,無疑將走上一條快速道。

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts