百模大戰,不拼單項拼平台


原文來源:數智前線

作者:徐鑫

圖片來源:由無界AI生成

產業智慧轉型走進深水區,企業對AI能力的需求點正在改變。

越來越多大型企業的視野已不侷限在單一智慧應用上。在電力、金融等產業,大型企業正圍繞著AI能力的生產、運用及管理全流程,對廠商的AI學習平台及平台性生產力工具提出需求,進而解決人才稀缺、資料稀缺、管理困難、資源複用率低等一系列痛點。

大模型熱潮到來後,平台的比拼重點轉移到了大模型開發和應用之上,廠商們積極將先前的AI平台解決方案和大模型結合。在平台大比拼中,有些企業的優勢已經凸顯出來。國際分析機構Forrester近日發布報告顯示,中國人工智慧/機器學習平台競爭中,百度智能雲表現亮眼,參與評選的AI平台在數據、推理、應用等6個大類,15個細項獲得了最高分,位居領導者象限。

AI平台,正幫助企業快速建構符合業務需求的人工智慧模型及應用,有效監控優化模型效果。

一百個場景要建一百個模型的境況已經成為歷史。

01 深度用AI,老砲們的困擾

產業正進入深度用AI應用階段,AI已不再遙不可及。不過也有越來越多企業發現,隨著應用程式深入,這些企業智慧化領域裡的資深用戶正遭遇新的困擾。

以能源產業為例,大型電力企業已經將AI模型用於電路巡檢等多個情境。通常情況下,這類企業的相關需求,多由不同部門或分公司獨立採購。隨著AI應用變多,模型數量也在增持。管理大量模型,並讓大量的零散模型能穩定、有效率地運行,正成為一項挑戰。

許多大型企業都有類似問題。一位資深人士告訴數智前線,他親眼看過企業裡A部門放5個人做A演算法,B部門搞B小分隊也放幾個人做演算法,這導致很難從公司層級進行統一的監控優化更新維護,同時企業內整體的AI資源復用率很低。

金融業應用AI也走在前列,一些企業或機構早已將AI技術應用於信用卡發放資格審批和詐欺識別等多個環節,實現AI風控和精準行銷。但金融業對安全和合規的強調也在延伸到AI的應用過程。例如,銀行內的技術團隊非常重視合規因素,新建一個模型時,建設的委託和批准角色是誰,資料讀取的批准由誰經手,資料撰寫、模型生產、訓練、落地和上線也都有層層流程保障。這類需求明顯不是傳統的智慧應用建置。

一位雲廠商資深產業解決方案人士告訴數智前線,一些大型央國企明確提出希望建構企業的智慧中樞,培育自身的AI能力,這樣企業裡的數位化部門就能針對新場景,自己研發演算法做全新應用。

業界也觀察到這一趨勢。百度智慧雲端AI平台高級架構師靳偉告訴數智前線,這反映出,AI應用邁向深水區,企業的智慧轉型的系統性日益凸顯。企業不但要有願景目標規劃,也需要有很強的推動協調與監督機制,並且要有完整的工具,確保順利推動實施。 AI平台就是企業智慧轉型的生產力工具。

產業上下已經意識到這項平台產品的重要性。日前,國際分析機構Forrester發表《The Forrester WaveTM:中國市場人工智慧/機器學習平台廠商評測,Q42023》報告指出,中國的企業決策者正進一步優先考慮採用AI技術,推動生產力提升和商業創新。過程中,企業需要人工智慧平台產品,以便在各自的業務環境中支援複雜用例。

新的趨勢對機器學習平台廠商的能力也提出了要求。 Forrester認為,領先的平台既要能提供跨資料管理、模型培訓和人工智慧應用程式建構的綜合工具;也要貼合產業場景,幫助一些缺乏AI人才和資料科學家的企業基於自身業務需求來獲得AI能力;另外,還能透過工具、技術和實踐幫助企業可以規模化開發部署模型。

Forrester針對中國14家主流機器學習平台廠商從產品能力、策略佈局、市場表現3大維度,進行了25項細分標準的評估。數據顯示,目前百度智能雲獲評報告的領導者陣營,在數據、訓練、預測推理、應用等9項細分分數均獲得第一名。

靳偉介紹,百度在AI平台的產品能力領先經歷了長期的增持和打磨。 AI平台的初衷是希望打造一款生產力軟體,讓不同類型的企業用戶能夠多快好省地建立AI應用,同時做到平台上演算法多、工具多、運行快、效果好,幫助客戶節省伺服器和人力。

目前能源、金融業的一些大型企業已經在深度使用。基於AI平台,企業不僅可以快速建構符合業務需求的人工智慧模型及應用,還能有效監控優化模型效果。此外,管理和協調數據、算力、人員、流程等資源時也更便捷、有效率。

例如,電力產業,百度智慧雲端AI平台正幫助大型集團解決業務痛點。一方面,模型和數據能在不同子公司分享,避免重複造輪子。同時一些已有的安全生產相關模型使用此產品,可由國網直接統一分發到省網或市網,能高效利用AI資源,品質一致。另外,AI平台還能協助企業創新,例如研發出的電力調度新演算法,用上了百度的強化學習框架,可實現不用大量專家的人工經驗調參數,AI自動完成調度參數校準。

金融業裡,百度智慧雲端的AI平台解決方案也幫助許多金融機構建構了大型的模型風險管理模組,保障AI應用到金融場景裡流程合規和可信任安全。

02 大模型時代,如何量體裁衣

今年以來,大模型和生成式AI浪潮推動了產業界進一步深度應用AI,機器學習平台也迎來新的發展機會。

資深人士介紹,大語言模型到來後,機器學習平台的變化體現在三個層面。最典型的一個變化在操作介面上,NLP之前複雜的操作介面變得簡單了,企業應用語言類AI的門檻在降低。同時,模型的自動化能力提升,資料處理、模型選擇、自動報告產生等任務都可以自動化完成。另外,AI原生的創新應用空間也隨之開啟。

在這一背景下,許多企業已經把大模型當作了一道必答題,各平台廠商也摩拳擦掌,加足馬力,推出各類產品和平台來加速大模型技術的應用落地。以百度為例,今年3月推出了百度智慧雲端千帆大模型平台,將大模型開發與應用的關鍵能力與AI平台深度整合,打造大模型服務的「超級工廠」。

為方便企業輕鬆使用和開發大模型應用,目前百度千帆上既提供包括百度自研的文心大模型和第三方大模型,還提供了各種AI開發工具和整套開發環境,助力各行業的生成式AI產業落地。

具體而言,百度將產業界對大模型的需求總結為五種類型,無論是只有算力需求的客戶,還是希望直接調用大模型API或基於現有大模型做二次開發的企業,以及想要基於大模型去開發AI原生應用或直接使用已開發好應用的公司,百度千帆平台都能提供有針對性的服務。

對於只有算力需求的企業,百度千帆平台可提供極具高效率和性價比的異質算力服務。靳偉透露,要做到這一點,百度智慧雲端AI平台的技術團隊花幾年時間做了大量Dirty Work。例如相容於國內外主流AI晶片,需要從框架層、核心演算法及網路、晶片型號、作業系統四個層級做適配。 「PyTorch寫的和TensorFlow寫的不一樣,作業系統用Windows、Linux或單晶片,要做的工作也有差別。四層組合做了四萬種適配,才能保證各種模型順利運轉。」靳偉說。

想直接調用大模型API的用戶關心模型能力的豐富性,目前千帆大模型平台既接入了文心大模型4.0,還納管了44個第三方的國內外主流大模型,數量上是國內平台裡最多。

有些企業希望對現有大模型進行二次開發,這需要豐富的工具鏈和大量的資料集支援。千帆平台目前有覆蓋大模型再訓練、微調、評估和部署等全生命週期的完善工具鍊和大量高品質資料集,能針對場景快速優化模型效果,進一步提升企業的大模型使用者體驗。

大模型為資料標註環節帶來新變化,許多標註任務可透過模型完成。目前千帆平台支援業務資料回流和高度自動化的資料標註。例如目標偵測場景裡,千帆直接提供預訓練能力,透過點選紐標註少部分,剩下的讓模型學習人類標註風格自動標註,可為企業節省70%~90%的人力。

也有許多企業想基於大模型來開發AI原生應用程式。本月中旬,百度智慧雲端發布“千帆AI原生應用開發工作台”,其中包含大模型應用開發的常見應用元件、應用框架兩層服務,正是針對開發AI原生應用需求。

以應用元件為例,千帆平台包含了多種類型的能力,如問答、思維鍊等大語言模型元件和文生圖、語音辨識等多模態元件以及向量資料庫、物件儲存等傳統​​雲端服務能力等。

而應用框架能將組件有機串聯起來,完成特定場景的完整任務。千帆平台已經提供市面上常用的檢索增強生成(RAG)、智能體(Agent)等框架服務,先鋒企業如三一重工已經應用這些框架,快速開發自己的知識問答應用。

Prompt工程是大模型出現之後誕生的新領域。這與大模型的特性有關,稍微改變指令,它的輸出或行為會發生巨大變化。目前,各家廠商都在強調Prompt工程工具。百度千帆平台也提供了涵蓋對話、程式設計、電商、醫療、遊戲、翻譯、演講等十餘個場景,共226個模版。根據介紹,這是國內主流平台裡數量最多的Prompt模板庫。開發者和企業還能使用平台提供的各類自動化及大量工具,高效完成prompt環節。

靳偉認為,過去幾個月百度智能雲千帆大模型平台夯實了基礎,為百模大戰,助力企業規模化應用AI做好了準備。

03 AI平台,下一站拼什麼?

AI不只是大企業專屬。目前機器學習平台廠商們都重視對大型企業、中小型客戶和開發者市場的全面覆蓋,百度智能雲的AI平台解決方案也有針對性地服務不同群體。

靳偉告訴數智前線,百度AI平台解決方案是多個產品的總稱,包含了全功能AI開發平台BML、零門檻AI開發平台EasyDL及百度智能雲千帆大模型平台等產品。針對不同領域或不同顧客偏好,AI平台都有對應的產品適配。例如,資料處理能力被打包成EasyData產品,零程式碼建模能力也被抽出來做了EasyDL產品,能幫助使用者實現用高性能預訓練模型完成零程式碼建模,而大模型的能力則由百度智能雲端千帆平台承載。

在公有雲上,客戶類型以偏中小的企業居多,AI平台的模組被重新打散組合,以全功能AI開發平台BML和EasyDL產品為主要代表來適應需求。針對大型客戶的私有化部署需求,各類產品又會被打包成超大產品完成交付。

此次Forrester報告顯示,百度智慧雲端AI平台的產品能力在資料處理、模型訓練、預測推理、應用、架構等五大領域都表現優異。

靳偉介紹了不同領域裡的獨特能力優勢。以資料領域的特徵工程為例,靳偉介紹,百度AI平台整合了非常優異的特徵庫管理能力,能力上達到了專業級水準。可以提供特徵的增刪改查,特徵生產、共享、版本管理、資料驗證等功能,支援批示流式不同形式的資料用於預測服務,也能確保模型訓練時用的特徵和最終預測時候的特徵一致。 「如果訓練的時候特徵分佈上,例如男人佔50%,女人50%,而預測的時候男人佔60%、女人40%,那你不可能指望這個模型特別準”,靳偉說,這對模型的準確性非常關鍵。

又例如模型訓練領域,百度AI平台可支援包含圖像、視訊、文字、語音以及結構化資料等多種資料類型的建模和訓練。在建模方式上,為願意寫程式碼的人提供了NoteBook工具支持,不喜歡寫程式碼的人能拖拉拽甚至點一下集成一站式按紐就能建模。針對大量的場景例如圖像分類,單標籤多標籤,物體檢測等CV場景,都由飛槳演算法團隊基於Paddle算子進行了深度優化,性能和效果表現會更優異。

產品性能上的獨特優勢點,離不開長期的技術投入和對新技術趨勢的關注。百度AI平台研發團隊介紹,他們非常關注新的技術趨勢,例如三年前業界就在探討模型可解釋性問題,不知道模型怎麼做決策的,就會影響模型在安全合規要求比較高的場景裡面使用。一般而言,深度學習模型參數量上比傳統的機器學習模型大很多,黑盒子問題會更嚴重。

經過長期的準備,百度AI平台團隊最終攻克了常規機器學習領域下的模型可解釋性演算法,整合了五個常見的機器學習的原理白盒化,同時也攻克了部分深度學習可解釋性問題。 「弄清楚模型在什麼場合下做出決策,是數據引發還是演算法引發,都可以歸因,這些成果推動了AI平台相關產品在金融決策等特殊行業場景裡的應用。」靳偉介紹。

當下業界把大模型的發展典範分成五層,大模型本身、prompt工程、Chain工具鏈與行動鏈、Agency與Multiagency。百度智慧雲千帆平台先前主要的工作重心在第一、二層走得非常紮實,後面三層包括工具鏈、Agent和Multiagency能力也處於重點建設階段。靳偉介紹,千帆大模型平台將持續完善升級,讓大模型自主發揮主觀能動性,具備解決複雜問題的能力。同時,未來不排除有出海計畫。

整體而言,企業智慧化建置下,企業應用AI深度升級,AI平台領域的競爭也日趨激烈。要在這一領域持續保持領先,迎接合規性和技術複雜度變化等帶來的長期挑戰,廠商們也需要技術投入。靳偉認為,廠商需要堅持技術創新、在客戶滿意度、安全性、合規性上提升來適應這個不斷變化的市場。

資訊來源:由0x資訊編譯自8BTC。版權所有,未經許可,不得轉載

Total
0
Shares
Related Posts