大模型的大廠之戰:八仙過海,各顯神通


原文來源:獨角獸挖礦機

圖片來源:由無界AI‌ 生成

如果哪個大廠還沒做大模型,應該都不好意思跟別人打招呼了。

年初ChatGPT橫空出世,引爆了國內大模型的熱情,各路資金蜂擁而入。其中以百度、阿里、華為、京東等為代表的互聯網大廠更是重金押注、無一缺席。

“我最初以為AI是互聯網10年不遇的機會,但現在,我覺得這是幾百年不遇的,類似發明電的工業革命一樣的機遇。”向來低調的馬化騰也給了AI極高的評價。 《中國人工智能大模型地圖研究報告》顯示,我國10億參數規模以上的大模型已發布79個,“百模大戰”一觸即發。

世人皆知大模型香,但也知世上不需要這麼多大模型。

在這場未來科技高地的攀岩中,最終能登頂,笑到最後的必然是寥寥無幾,而大廠憑藉著先天的資本、算力、大數據等優勢,無疑是百模大戰中的“種子隊”。

本文盤點百度、華為、阿里、騰訊、京東、美團、字節、科大訊飛八家大廠的大模型特點,未來翹楚,應該有他們的一席之地。

01 百度文心一言:最硬核

國內大廠裡,百度是最先交大模型作業的。

3月16日,百度發布了生成式AI產品文心一言,發布首日就有超60萬人申請測試。

百度能成為第一個吃螃蟹的大廠,有賴於近些年在人工智能領域的深耕和增持。

早在2019年,百度就推出了知識增強的語義理解框架文心大模型,並廣泛應用於閱讀理解、情感分析等領域。人工智能已成為這家以搜索起家的科技企業的新標籤。在大模型之前,百度在人工智能領域就在自動駕駛、智能雲等多個領域進行了前瞻佈局,擁有先發優勢。

百度創始人李彥宏更是親自下場,成為大模型的堅強擁躉:“科技創新驅動了大的增長。沿著這個思路,如果讓我來判斷第四次科技革命的標誌,我認為是深度學習算法。”

當然,第一個關注度最高,被吐槽也不少,比如,文心一言剛上線,作為新生,在面對車水馬龍、夫妻肺片這些內涵詞時,理解能力還停留在字面意思,像車水馬龍出現了“汽車+龍”的元素疊加圖片。

不過在用戶的反饋下,文心一言很快就學習到正確的理解和繪製方式,能繪製出車馬成群結隊、繁華熱鬧的“車水馬龍”街景。

在IDC最新發布的《AI大模型技術能力評估報告,2023》中,百度文心大模型拿下12項指標的7個滿分,綜合評分第一,尤其是算法模型、通用能力等基礎技術領跑全行業,算法模型獲得唯一一個滿分。

如果說,大模型對其他大廠來說多是副業,對All in人工智能的百度來說,是一號工程,這也讓它擁有了最硬核的實力。

02 華為盤古:最被寄予厚望

作為在國際市場上最能扛的科技企業,華為在5g的強大讓美國不得不窮盡各種手段來打壓,在AI這個國際角逐的新戰場,華為理所當然也被寄予厚望。

7月7日,在華為開發者大會2023上,華為雲正式發布盤古大模型3.0。盤古大模型3.0是一個完全面向行業提供服務,以行業需求為基礎設計的大模型體系,包括5+N+X三層架構。

華為盤古大模型早在2020年就啟動研發,華為雲CEO張平安表示希望用盤古大模型幫助各行各業,例如在金融、政務、礦山、氣象等行業,在產品研發、生產供應鏈、市場營銷以及數字運作領域,讓盤古大模型為他們賦能。

從華為的策略來看,雖然國內外C端的大模型聲量大,但華為還是做自己擅長的B端市場,並且已經進入實操階段。 7月18日,華為聯合山東能源集團舉行發布會,宣布華為盤古大模型在礦山領域實現首次商用。

從通信網絡設備到5G手機、智能駕駛,華為都展現了其強大的科技底蘊和技術實力,在AI領域,華為自然也承擔著更高的期望。

03 京東靈犀:最懂產業

7月13日,在2023京東全球科技瀏覽器大會暨京東雲峰會上,京東正式推出靈犀大模型。

與其他通用大模型相比,京東靈犀可謂是“從產業中來,到服務產業中去”,融合了70%通用數據與30%數智供應鏈原生數據,具有“更高產業屬性、更強泛化能力、更多安全保障”的優勢,深入零售、物流、金融、健康、政務等知識密集型、任務型產業場景,解決真實產業問題。

對於大模型價值的思考,京東也提出了自己的獨到見解:大模型的價值=算法×算力×數據×產業厚度的平方。

京東CEO許冉認為,前三個指標固然重要,但技術在產業場景落地應用,創造實際價值才是關鍵。當產業效率和產業的邊界拓展得到質的提升以後,大模型才有了更重要的實際價值和意義,這將不亞於又一次工業革命。

從京東的發展史來看,產業早已融入京東的基因和血脈中,從產業場景切入做大模型,做的也是京東非常擅長的領域,訓練出的大模型天然具備“產業基因”。

04 阿里通義千問:最強算力

4月11日,阿里雲宣布推出大語言模型“通義千問”,並表示包括天貓、釘釘、高德地圖、淘寶、優酷、盒馬等阿里巴巴所有產品,未來都將接入“通義千問”大模型全面改造。

阿里云總裁張勇談到阿里雲戰略的核心,表示未來要做好兩件事情——讓算力更普惠、讓AI更普及。其中的算力是阿里做大模型的核心競爭力。

大模型背後的海量數據,需要有強大的算力作為支持。某種程度上,大模型之爭說到底也是雲服務之爭、是算力之爭。

在數字基礎設施,阿里雲擁有國內最強的智能算力儲備,阿里雲的智算集群可支持最大十萬卡GPU規模,承載多個萬億參數大模型同時在線訓練,為大規模AI集群提供無擁塞通訊的自研RDMA網絡架構和低成本高可靠的高性能存儲CPFS。

在國際權威機構Gartner榜單中,阿里雲是亞洲第一、全球第三的雲計算服務商。在2021年底Gartner對雲廠商整體能力評估中,阿里雲IaaS基礎設施能力拿下全球第一,在計算、存儲、網絡、安全四項核心評比中均斬獲最高分。

05 騰訊混元助手:最擅社交

作為初代互聯網BAT三巨頭之一,騰訊在大模型領域上表現得比較內斂。

去年4 月,騰訊首次對外披露了混元AI 大模型的研發進展,這是一個包含CV(計算機視覺)、NLP(自然語言處理)、多模態內容理解、文案生成、文生視頻等方向的超大規模AI 智能模型。

今年2 月底,在ChatGPT熱潮下,騰訊也被曝出成立了混元助手項目組,這個項目組將聯合騰訊內部多方團隊構建大參數語言模型。

千呼萬喚始出來,6月19日,在行業大模型及智能應用技術峰會上,騰訊第一次公佈了騰訊雲行業大模型的研發進展,圍繞B端需求,騰訊反復強調大模型是為“具體場景設計的具體應用”。

沒有哪家大廠比騰訊更懂社交,憑藉著龐大的用戶基數和強大的技術實力,騰訊在大語言模型AI的佈局,尤其是類ChatGPT聊天機器人,有著別人無法比擬的優勢。

對於騰訊的聊天機器人是集成到QQ、微信,還是通過騰訊雲向B端用戶服務,騰訊雲與智慧產業事業群CEO湯道生表示:“都會有。”

06 美團光年之外:最命運多舛

光年之外由美團聯合創始人王慧文在今年2月創立,彼時王慧文已經處於“退休”狀態,大模型讓他重燃了創業激情。肩負起打造“中國OpenAI”的使命。

在短短兩個月時間裡,光年之外吸引了眾多人工智能領域頂級專家和創業者的加入,完成了以產品和技術人才為主的團隊搭建。

王慧文自帶的創業成功者光環,還有王興以個人身份投資的加持,光年之外從成立第一天起,就站在了聚光燈下,成為大模型賽道裡的初創企業的明星。然而,出師未捷身先傷,雄心勃勃的王慧文出現個人健康原因,不得不離崗就醫。

群龍無首之時,王興出手了。 6月29日,美團的一紙公告宣布完成光年之外境內外主體100%股權的收購,收購價約為20.65億人民幣。

從這筆收購來看,既幫助了兄弟,又增強了美團的大模型實力。

王興與王慧文是清華上下舖的室友,從攜手創辦校內網到美團,兩人從同窗到創業夥伴,成就了彼此。另外,美團自身也有做大模型的需求,通過這次收購,美團獲得領先的AGI技術及人才,可以加強其於快速增長的人工智能行業中的競爭力。

雖然有些命運多舛,但最後的歸宿還是很不錯。

07 科大訊飛訊飛星火:最有學問

4月24日,科大訊飛星火認知大模型官網正式上線。

作為AI語音龍頭,訊飛星火認知大模型圍繞“知識問答、代碼編程、數理推算、創意聯想、語言翻譯”等場景佈局。

上線一個月後,訊飛星火認知大模型各項能力持續提升,且在綜合能力上實現三大升級:開放式知識問答取得突破,多輪對話、邏輯和數學能力再升級。擁有如此強大的學習能力,也讓訊飛星火的“學問”越來越大。

在應用落地上,科大訊飛重點是推動星火認知在教育、醫療、工業、辦公等領域落地。比如,在教育領域,科大訊飛已經在學習機上嚐到甜頭,在星火大模型與教育垂直場景的深度融合下,有望廣泛應用於教師備授課、作文批閱、學生語言學習、心理健康監測等常見場景。

憑藉著AI語音和知識問答上的優勢,訊飛星火在定位上,可能是與ChatGPT最接近的大模型。

08 字節火山方舟:最低調

當其他大廠一把手掛帥親自站台,對大模型不吝讚美之詞時,已與BAT平起平坐的字節卻相對低調得多。

直到6月28日,字節跳動公佈了大模型業務最新進展,在火山引擎主辦、英偉達合作舉辦的“V-Tech體驗創新科技峰會”上,火山引擎發布大模型服務平台“火山方舟”,面向企業提供模型精調、評測、推理等全方位的平台服務。

集成多個大模型,供客戶直接對比,火山方舟避開烽火連天的大模型大戰,選擇做大模型服務平台,以賣水者身份殺入大模型賽道。

選擇這條路,字節也有自己的考量,與其他大廠佈局多年對比,字節雖然在算力、算法等AI基礎設置上不遜色,但還是慢了一拍,字節語言大模型團隊今年初才成立。

在沒有先發優勢的情況下,又不想缺席大模型盛宴,選擇為大模型客戶提供算力AI基礎設施,幫助做好大模型開發,這樣的另闢蹊徑也不失為理智的選擇。

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts