原文來源:IT時報
作者:郝俊慧
圖片來源:由無界AI 生成
這是一次要靠加快語速、提高分貝才能“搶”到提問的採訪。
7月7日下午,2023世界人工智能大會·騰訊論壇舉行前,一個狹小嘈雜的會議室裡,騰訊雲副總裁、騰訊雲智能負責人、優圖實驗室負責人吳運聲接受了媒體群訪。近20天前,騰訊對外正式公佈MaaS全景圖,以行業大模型切入火熱的“大模型賽道”,記者們迫切地想知道,同為頭部互聯網企業,騰訊為何避開通用大模型,選擇了一條看起來更“現實”的道路。
“企業需要的,是在實際場景中真正解決某個問題,而不是在100個場景中解決70%-80%的問題。”吳運聲表示,站在公司策略角度,騰訊更專注於解決落地實際的問題,而通用大模型不能徹底解決用戶的所有問題。
擁有中國最多個人用戶的騰訊,在新一輪人工智能浪潮來臨時,將產業互聯網AI化放在了改變的第一步。
騰訊雲MaaS再升級
6月19日,騰訊雲首次公佈騰訊雲行業大模型研發進展,依托騰訊雲TI平台打造行業大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務,並已為傳媒、文旅、政務、金融等10餘個行業提供了超過50個大模型行業解決方案。
本次世界人工智能大會上,騰訊雲再次公佈了多項升級。
其中,最新升級的騰訊云自研星脈高性能計算網絡,能提升40%的GPU利用率,節省30%~60%的模型訓練成本,為AI大模型帶來10倍通信性能提升。基於騰訊雲新一代算力集群HCC,可支持10萬卡的超大計算規模。騰訊雲AI原生向量數據庫,最高支持10億級向量檢索規模,延遲控制在毫秒級,相比傳統單機插件式數據庫檢索規模提升10倍,同時具備百萬級每秒查詢(QPS)的峰值能力。
在應用創新方面,騰訊雲行業大模型能力應用到金融風控、交互翻譯、數智人客服等場景中,極大提升了智能應用效率。
行業大模型加持的金融風控解決方案,相比之前有了10倍效率提升,通過騰訊增持超過20年的黑灰產對抗經驗和上千個真實業務場景,整體反欺詐效果比傳統模式有20%左右的提升。在數智人領域,今年騰訊雲推出了小樣本數字人工廠,僅需少量數據、24小時內即可複刻2D數字分身,讓企業應用數智人服務成本大大降低。
“事實上,過去半年多的時間裡,我們一直在思考和探索,大模型和各行業結合背後最本質的邏輯是什麼?其實只有兩點:一是技術的根本出發點是解決實際問題,二是如果不能深入行業探索,便不能真正解決行業面臨的問題。”真實場景對大模型帶來的“考驗”,讓吳運聲感慨頗多。
智能客服被公認是LLM(大規模語言模型)最適用的行業。此次大會,騰訊為一家線上旅遊OTA公司打造了一個行業大模型,精調後的客戶專屬模型,無需配置對話流程,即可實現端到端解決業務問題。提升任務完成率,降低對話構建成本。但事實上,讓大模型真正理解客戶的問題,並非想像中那麼簡單。
“在溝通過程中,客戶的思維是跳躍的、變化的。比如他剛提出要定10號的酒店,但在機器還沒回答之前,突然又說,再幫我看看11號的酒店和航班,當AI還在對第二個需求進行反饋時,他又可能說,給我看看雙床房。”吳運聲指出,大模型要實現多意圖識別,目前還是有相當難度,通用大模型並不能簡單解決,而是需要結合場景,特別是與客戶的系統交互要重構一些非常複雜的模型。
“群模共舞”時代到來
經過初期的喧囂之後,AI大模型如何落地商業化,企業客戶如何享受這輪AI紅利,解決“AI焦慮”,成為這屆世界人工智能大會上熱議的話題。
紅杉資本中國合夥人鄭慶生從PC互聯網中期開始進入投資領域,在他看來,每個時代的勝出者,都源自那個時代的技術原生,比如PC互聯網時代,人們看重電子商務,結果社交軟件成了最大贏家;移動互聯網時代開始,人們看中社交軟件、長視頻,但短視頻佔據了最多的時長,“現在我們並不知道,哪些AI本身產生的原發性場景,將改變我們的基礎行為。”
儘管AI原生的“殺手鐧”何時出現,還不得而知,但“入局”一定是第一步。此次WAIC中心化亮相的30多個大模型中,除了百度文心一言、阿里通義、訊飛星火、商湯日日新等第一輪通用大模型之外,後來者基本都聚焦於行業大模型。
“對客戶而言,參數少、投入低,見效快的企業專屬大模型,更容易被接受,買單意願也比較明確。”一位創業公司展商告訴《IT時報》記者,一些已經在用大模型改造客服系統的銀行客戶,通常會選擇軟硬一體的私域部署方式,用自己已有的知識圖譜和數據訓練和實現推理,既確保了數據安全,投入算力成本也不會太高,“如果只需要對一個場景進行推理輸出,算力闆卡甚至在個位數便可以搞定。”
“產業場景已經成為最佳練兵場,”騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生,在本次WAIC全體會議-產業發展論壇上曾表示,選擇具有一站式行業大模型服務能力的雲廠商合作,基於行業大模型,構建自己的專屬模型,或許是企業探索大模型應用實踐的可行路徑。
這意味著,未來將是一個“萬模共存”的時代,每個企業都將擁有自己的大模型,而騰訊決定做新時代的賦能者。
上個月騰訊雲公佈的MaaS服務全景圖中提出,基於騰訊雲TI平台打造行業大模型精選商店,騰訊雲可提供金融、文旅、政務、醫療、傳媒、教育等10大行業,50多個解決方案。同時騰訊雲推出行業大模型精調解決方案,幫助模型開發者與算法工程師,一站式解決模型調用、數據與標籤管理、模型精調、評估測試與部署等任務,減輕創建大模型的壓力。
在這些模型和工具平台基礎上,企業只用加入自己的場景數據,就可以快速生成自己的“專屬模型”。
“現在還是大模型發展的早期階段,我個人更希望百花齊放,大家在不同的領域嘗試不同的可能性。”吳運聲認為,人工智能的發展是一項龐大的數據工程,既要有共性的知識,也需要有專業的精深的權威知識組織,需要各方合力,才能真正使技術服務行業。
AI for Science捕獲Cosmos“閃爍”
當然,除了在產業數字化轉型發揮效應,騰訊雲行業大模型也加速推動大模型等AI技術在科學計算領域的應用。
2021年開始,騰訊、國家天文台、復旦大學計算機科學技術學院聯合啟動“探星計劃”,用雲+AI幫助中國天眼FAST處理每天接收到的龐大數據量,通過視覺AI分析找到快速射電暴、脈衝星線索,截至目前已發現30顆脈衝星。
今年WAIC上,騰訊宣布探星計劃再度取得進展,首次通過AI技術發現2顆快速射電暴。
快速射電暴是一種神秘的天文現象,每1毫秒,就會放射出太陽一整年釋放的能量,“閃爍”Cosmos。但它“閃爍”頻次極低、時間極短,海量數據中極易忽視、捕捉極難,直到2007年,人類才發現第一顆,比脈衝星的發現晚了40年。
與脈衝星探索相比,要在海量數據中發現更低頻出現的快速射電暴,要求AI模型具備更高的精度、以及更快的計算速度。為了提高計算速度,騰訊針對快速射電暴探索,特別設計了一套全新的,端到端的AI算法。在同等算力下,這套全新的天文數據處理範式,推動信號處理效率相對常規處理流程提速1800倍。
此前,AI識圖前,需要先對信號圖完成繁雜的天體物理預處理,比如傅立葉變換、消色散……這些工作專業而復雜。現在騰訊優圖開創了一種天文數據處理的“端到端AI算法”,可以跳過預處理步驟,直接進入AI識別,效率大提升。
FAST每天產生數百TB 數據,每週產生幾千萬張信號圖。面對海量數據,通過“多示例學習方法+注意力機制”,騰訊雲可以快速定位和識別數據中有用信息,並提供強大的底層算力支撐。
如今,騰訊雲和FAST正在繼續探測250萬光年外M31仙女座的射電信號,預計不久的將來,將有更多“Cosmos閃爍”被捕獲。
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載