無人不談大模型,是今年上半年科技界的真實寫照。
無人不談大模型,是今年上半年科技界的真實寫照。
從市場熱鬧程度來看,大模型已經成為各家科技廠商爭先湧入的賽道,無論是互聯網巨頭,還是科技公司,甚至是研究機構,均已加入這場大模型混戰,大模型儼然成了“兵家必爭之地”。
就在國內大模型市場正如火如荼時,一舉帶動大模型熱度的ChatGPT卻出現訪問量下降的情況。據第三方監測機構SimilarWeb的最新數據顯示,今年5月,ChatGPT開始出現增長放緩的勢頭,當月增長率僅為2.8%,而2023年前四個月分別為131.6%、62.5%、55.8%、12.6%。這是自2022年11月30日發布以來,ChatGPT首次出現流量負增長。
這一現像或許反映出重要的行業動向,各方正在從初期對大模型的技術熱情,轉變為對商業化落地冷靜思考。而大模型的落地,也正是所有大模型企業都需要認真思考的話題。
“京東認為,大模型的價值=算法×算力×數據×產業厚度的平方。”京東集團CEO許冉表示。京東不止追求技術的先進性,也格外關注產業厚度——看重技術能在多少產業場景切實應用,能為社會創造各種價值。
7月13日,京東推出言犀大模型。據京東介紹,這是參數達到千億級的新一代模型,未來將深入應用於零售、金融、物流、健康、工業等產業場景。
當產業效率和產業的邊界拓展得到質的提升後,大模型才有了更重要的實際價值和意義。在大模型的眾聲喧囂中,我們更應該回歸理性,認真思考大模型的真正價值。行業需要什麼樣的大模型?大模型應該如何實現落地商用,為產業降本增效?
逐鹿大模型:從通用邁向產業的共識
一夜之間,國內大模型紛紛“湧現”。
據科技部下屬的中國科學技術信息研究所發布的《中國人工智能大模型地圖研究報告》顯示,截至5月28日,國內規模在10億級參數以上的基礎大模型,至少已發布79個。我國研發的大模型數量已經排名全球第二。
但在研發數量暴漲背後,如何實現大模型的商業價值,更值得探索。
目前來看,現在問世的更多是通用大模型,這類大模型具備強大的自然語言理解、語言生成和語音識別等能力,在聊天、娛樂等通識屬性較強的場景上表現頗佳,但這些場景目前還難以實現大規模商業化。
而在細分的產業場景上,通用大模型回答準確度較低,這是因為產業本身數據樣本量較少、數據分佈不均、應用場景多變,導致大模型無法進行自我優化和改進,輸出精度自然不高。
從商業化落地來看,企業或許並不需要一個“全能”的通用大模型,而是更需要針對細分領域場景、解決實際問題的產業大模型。
中國工程院院士鄔賀銓曾指出,“Chat類的大模型引發新一輪熱潮,但對話、寫詩、作畫絕不是大模型的全部。我們需要去深入思考大模型的應用方向,要將大模型切實投入到城市發展、金融科技、生物醫藥、工業製造、科學研究等領域,也需要專業的企業和組織加速其在實體產業落地,為產業剛需帶來實實在在的價值,真正意義大規模服務社會。”
如今,大模型市場正在形成一種共識,那就是無法落地商用的大模型只是“娛樂工具”,只有深入產業、解決實際問題的大模型,才具備價值。深入思考大模型的價值,京東提出的一個公式,更符合大模型市場的動向,即:大模型的價值=算法×算力×數據×產業厚度的平方。
從大模型價值公式可以看到,產業大模型和通用大模型不是對立的關係,產業大模型是基於通用大模型的基礎,訓練而來,區別在於:產業大模型更關注產業厚度,生成的內容更符合產業垂類場景的需求,更有針對性。
在大模型的演進路線上,京東的前瞻性其實並不奇怪。自成立以來,京東就紮根於產業,自然對大模型在產業中的價值更加關注。
“京東看待大模型和其他技術創新,除了追求技術的先進性,還格外關注產業厚度——看重技術能在多少產業場景中切實應用,為社會真正創造價值。”京東CEO許冉表示。
事實上,現階段大模型的發展,正在從“通用”邁向“產業”。
民生證券最新發布的研究報告提到,在經歷二月至三月的大模型集中發布期、四月至五月的產品研發期和政策方向逐步明確後,六月起大模型的產品和應用,有望迎來集中發布。新一輪發布潮是基於大模型的應用產品,開始大規模升級上線,為走進千家萬戶做準備。
近期,國內科技企業最新發布的大模型,大多都面向垂類產業落地。在海外,各企業也陸續發布了不同規模的行業大模型,目的就是將其應用於產業領域。
從海內外各大廠商的實際動向不難看出,產業大模型將更能夠幫助產業夥伴,來完成數字化轉型和降本增效,為產業和社會創造更大價值。
產業大模型,難在打牢產業地基
產業大模型的建設難度,遠比通用大模型高得多。
如果說通用大模型考驗的是企業的算力、算法積累,那產業大模型更考驗企業對業務場景的觸達與理解,以及對產業數據的積澱與運用。
一個行業共識是,在產業大模型的訓練中,最難獲取的是產業數據。產業數據往往掌握在企業手中,出於數據安全等考慮,很少有企業願意將私有數據公開。但這些產業數據往往直接或間接影響著產業大模型的技術迭代速度、模型精準度和業務專業度。
“產業數據還分為靜態數據和動態數據。靜態數據相對穩定,不會發生即時變化,獲取路徑也較為清晰。動態數據則是不同產業場景中,每時每刻產生的數據,這部分數據是’活的’場景數據。不容易獲取,但卻是產業大模型的必備要素之一。”京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬強調。
不過,產業大模型的訓練也不能只用產業數據,仍需要使用大量通用數據,來提供常識性知識。其原因在於:首先,產業數據的泛化性不足,每次換個場景都需要重新訓練大模型,成本較高;其次,在應用時,如果用戶提出的問題與該領域無關,產業大模型就會陷入卡殼狀態。
何曉冬把訓練產業大模型比作培養一個人,“如果一個人高中畢業後直接出去打工,似乎也行,但專業性會差一點。要是能讀完四年本科再出去工作,就既有通識能力又有足夠的專業知識,這是產業大模型應該具備的能力”。
為此,京東言犀大模型的數據,由70%的通用數據與30%供應鏈場景生長的原生數據構成。
值得一提的是,這些產業數據均來自京東自身。京東本身就是以供應鍊為基礎的企業,自身紮根於寬廣的產業,不僅在零售、物流、金融、健康、工業等產業擁有實踐數據,還擁有城市、政務、金融、製造、工業、航空、交通、園區、能源等產業的脫敏數據,每年產生的優質數據達到百億條。
產業大模型,除了需要源源不斷供給的高質量產業數據,還需要了解行業Know-How,即對產業擁有特有的知識,對理解力要求也更高。舉例來說,零售行業更關注營銷、推薦的效果,金融行業更關注風控、可靠和安全的效果。
對於這種需求,京東長期耕耘的數智供應鏈就起到了關鍵作用,成為京東發力大模型應用的著力點。大模型也能夠基於供應鏈數智化,深入到實體產業。
據悉,京東的數智供應鏈,已經覆蓋超千萬的京東自營商品SKU,服務超800萬家活躍企業客戶,包括90%以上的在華世界500強企業,和全國近70%的專精特新中小企業。同時,京東的數智供應鏈還在全國,與超過2000個產業帶深度合作。
這種鏈路更長、場景更複雜、數據更豐富的數智供應鏈,是大模型的絕佳“訓練場”。在京東雲看來,只有將供應鏈做透,讓大模型“跑”在供應鏈上,才能將大模型的價值做實。
除了在產業側的積澱,京東在基礎算法、算力等方面的實力也不容小覷。
2021年,京東探索研究院就在重慶落地了全國首個基於DGX SuperPOD架構的超大規模計算集群——天琴α,推理提速6.2倍,推理成本節省90%。這為京東提供了最基礎的大模型訓練保障。
同年,京東推出了十億級模型K-PLUG,K-PLUG生成的商品文案已覆蓋京東超3000個品類,累計生成30億字,人工審核通過率超過95%。到了2022年,京東大模型升級為百億級模型Vega,能夠廣泛應用於情感分析、語義匹配、語法糾錯、智能問答、常識推理等多種下游自然語言處理任務。
得益於此前的積累,京東今年再度進行技術突破,推出了千億級參數的新一代京東言犀大模型,圍繞內容生成、人機對話、用戶意圖理解、信息抽取、情感分類幾大類任務,實現了基座模型+垂直領域模型精調,並且應用深入零售、物流、金融、健康、政務等垂直場景。
目前,以京東大模型為代表的產業大模型,正在通過自身積澱的行業化、場景化的數據和知識,對大模型進行訓練,並結合自身所積累的行業Know-How,對大模型進行修正,以提升大模型在特定行業及應用場景的表現,並提高可控性。這相當於對AI完成了“通識教育”。
京東大模型正在逐步深入各個產業,提升供應鏈的智能化水平。反過來,供應鏈的數智化升級也在推動產業變革,進而為大模型提供更豐富的數據土壤,形成正向循環。
“從產業端切入大模型,如同從北坡攀爬技術珠峰:道路雖然更加艱難,卻有更波瀾壯闊的風景。京東堅持做’難而正確的事’,堅持做實事、有價值的事和長期的事。在技術領域、在大模型上,這都是我們不變的承諾。”許冉表示。
“難而正確的事”需要長時間的積澱。但在產業大模型的建設上,京東顯然已經打好了地基。
生於產業的京東,用大模型創造產業價值
“在大模型時代,任何事情都值得用大模型重新做一遍。”
在大模型浪潮下,業界迅速達成了上述共識。不過,當其他大廠正在通過各種策略尋找商業模式時,京東落地產業的方向始終未變過。
“產業屬性是京東技術的鮮明特徵。京東研發每一項技術,都技術源於產業需求,歷練於產業場景,創造產業價值。”許冉表示。
當前,京東言犀大模型正在按照“三步走”戰略邁進:目前,京東雲已經基於內部實踐構建了通用大模型;到今年年底這段時間,京東將經由高複雜場景大規模錘煉,迭代出紮實的產業服務;預計在2024年初,會將大模型能力向外部嚴肅商業場景開放。
從具體實踐來看,京東大模型已經走到了第二步,京東正將大模型的能力用於最熟悉的零售、金融、物流、健康等場景,已經深入各個環節。
舉例來說,京東正在通過大模型提升智能客服的能力。客服領域不同於日常閒聊對話,是一個嚴肅的任務型對話場景,需要解決真實世界中買方與賣方的各類複雜問題。
“用戶和ChatGPT對話,即使回答錯了也沒關係,不會影響任何決策。但如果在嚴肅的商業場景中,智能客服回答錯誤,後果則不堪設想。因此,回答的精度很重要。”京東集團技術委員會主席、京東雲事業部總裁曹鵬表示。
針對智能客服場景,京東既搭建了具備基礎語義理解和問答邏輯的大模型,同時打磨了面向具體場景的小模型。如果客戶的問題涉及常見的退換貨等,智能客服就會調用更通用的大模型。而一旦問題涉及具體商品的保修政策、價保規則,智能客服則會調用針對性更強的小模型,來給出答案。不同的模型能夠承擔不同的職責。
現在,智能客服正在京東內部,助力2萬多名自有客服員工的降本增效,不斷優化客戶服務體驗。京東還對外開放了智能客服能力,幫助更多政府機構和企業進行數智化轉型升級。
在大模型對外服務方面,京東依舊保持著自己的“慢”節奏,並沒有急於將大模型“兜售”給企業。其原因在於,人工智能是一場非常嚴肅的技術變革:如果用得好,能夠幫助產業改天換地,但使用不當也可能造成嚴重的後果。在這種情況下,京東秉承長期主義的心態,不失為絕佳的選擇。
“京東不會把沒有實現’色香味俱全’的菜餚端上餐桌。大模型在內部關鍵場景完成了歷練和實踐後,才會開放給合作夥伴,來幫助整個行業降本增效。”許冉表示。
在京東的規劃中,言犀大模型將成為最底層的技術支撐。基於它的能力,領域都會產生一系列產品,同領域產品再聚合為平台,最終對行業輸出價值。
舉例來說,在內容生成領域,京東就打造了京東雲AIGC內容營銷平台。基於京東全品類的豐富商品數據積累,大模型可以更好理解商品特徵,幫助商家自動生成商品圖片、賣點等營銷素材,提升商家的運營工作效率和營銷內容質量。
換言之,商家只需要上傳一張產品圖片,就能夠迅速得到電商運營需要的商品主圖、營銷海報圖和商詳圖等多類型套圖,滿足快速開店、上品和營銷的需求。這些能力,能夠為商家在製圖方面節省90%成本,將製作週期從7天縮短到半天。
利用更多大模型能力,商家甚至都不用自己賣貨,只需使用京東雲多模態數字人,即可24小時不間斷、低成本地帶貨。
在這些應用以外,京東還展示了金融領域AI營銷運營平台。使用者通過簡單的對話,就能一站式生成營銷活動,覆蓋運營策略制定、營銷任務調度編排、搭建活動頁面、批量生成營銷文案和素材、數字化投放等方面。據京東相關數據顯示,過去這套流程需要產品、研發、算法、設計、分析師5類職能人員,如今減少到1人;過去流程需要2000次人機交互,也減少到少於50次。在大模型能力的加持下,營銷方案的生產效率有了顯著提升。
可以說,京東的產業大模型,正在成為各行各業產業應用的底座。目前其已經深入零售、物流、健康、工業、製造、金融、營銷等多個行業,奔赴產業、奔赴實際應用。
大模型狂奔半年後,廠商們已經意識到“規模大”或是“參數高”並不能解決實際問題。當泡沫期結束,大模型落地終究還是要回歸產業、回歸真實場景、解決實際問題,才是技術的最終歸宿,也是大模型良性發展的開端。那些具備了紮實產業數據和場景實踐的企業開始走向台前。
顯然,京東言犀大模型,已經向產業價值的彼端啟航。
展開全文打開碳鏈價值APP 查看更多精彩資訊