從熱潮到理性，大模型迎來產業「拐點」

無人不談大模型，是今年上半年科技界的真實寫照。

從市場熱鬧程度來看，大模型已經成為各家科技廠商爭先湧入的賽道，無論是互聯網巨頭，還是科技公司，甚至是研究機構，均已加入這場大模型混戰，大模型儼然成了“兵家必爭之地”。

就在國內大模型市場正如火如荼時，一舉帶動大模型熱度的ChatGPT卻出現訪問量下降的情況。據第三方監測機構SimilarWeb的最新數據顯示，今年5月，ChatGPT開始出現增長放緩的勢頭，當月增長率僅為2.8%，而2023年前四個月分別為131.6%、62.5%、55.8%、12.6%。這是自2022年11月30日發布以來，ChatGPT首次出現流量負增長。

這一現像或許反映出重要的行業動向，各方正在從初期對大模型的技術熱情，轉變為對商業化落地冷靜思考。而大模型的落地，也正是所有大模型企業都需要認真思考的話題。

“京東認為，大模型的價值=算法×算力×數據×產業厚度的平方。”京東集團CEO許冉表示。京東不止追求技術的先進性，也格外關注產業厚度——看重技術能在多少產業場景切實應用，能為社會創造各種價值。

7月13日，京東推出言犀大模型。據京東介紹，這是參數達到千億級的新一代模型，未來將深入應用於零售、金融、物流、健康、工業等產業場景。

當產業效率和產業的邊界拓展得到質的提升後，大模型才有了更重要的實際價值和意義。在大模型的眾聲喧囂中，我們更應該回歸理性，認真思考大模型的真正價值。行業需要什麼樣的大模型？大模型應該如何實現落地商用，為產業降本增效？

逐鹿大模型：從通用邁向產業的共識

一夜之間，國內大模型紛紛“湧現”。

據科技部下屬的中國科學技術信息研究所發布的《中國人工智能大模型地圖研究報告》顯示，截至5月28日，國內規模在10億級參數以上的基礎大模型，至少已發布79個。我國研發的大模型數量已經排名全球第二。

但在研發數量暴漲背後，如何實現大模型的商業價值，更值得探索。

目前來看，現在問世的更多是通用大模型，這類大模型具備強大的自然語言理解、語言生成和語音識別等能力，在聊天、娛樂等通識屬性較強的場景上表現頗佳，但這些場景目前還難以實現大規模商業化。

而在細分的產業場景上，通用大模型回答準確度較低，這是因為產業本身數據樣本量較少、數據分佈不均、應用場景多變，導致大模型無法進行自我優化和改進，輸出精度自然不高。

從商業化落地來看，企業或許並不需要一個“全能”的通用大模型，而是更需要針對細分領域場景、解決實際問題的產業大模型。

中國工程院院士鄔賀銓曾指出，“Chat類的大模型引發新一輪熱潮，但對話、寫詩、作畫絕不是大模型的全部。我們需要去深入思考大模型的應用方向，要將大模型切實投入到城市發展、金融科技、生物醫藥、工業製造、科學研究等領域，也需要專業的企業和組織加速其在實體產業落地，為產業剛需帶來實實在在的價值，真正意義大規模服務社會。”

如今，大模型市場正在形成一種共識，那就是無法落地商用的大模型只是“娛樂工具”，只有深入產業、解決實際問題的大模型，才具備價值。深入思考大模型的價值，京東提出的一個公式，更符合大模型市場的動向，即：大模型的價值=算法×算力×數據×產業厚度的平方。

從大模型價值公式可以看到，產業大模型和通用大模型不是對立的關係，產業大模型是基於通用大模型的基礎，訓練而來，區別在於：產業大模型更關注產業厚度，生成的內容更符合產業垂類場景的需求，更有針對性。

在大模型的演進路線上，京東的前瞻性其實並不奇怪。自成立以來，京東就紮根於產業，自然對大模型在產業中的價值更加關注。

“京東看待大模型和其他技術創新，除了追求技術的先進性，還格外關注產業厚度——看重技術能在多少產業場景中切實應用，為社會真正創造價值。”京東CEO許冉表示。

事實上，現階段大模型的發展，正在從“通用”邁向“產業”。

民生證券最新發布的研究報告提到，在經歷二月至三月的大模型集中發布期、四月至五月的產品研發期和政策方向逐步明確後，六月起大模型的產品和應用，有望迎來集中發布。新一輪發布潮是基於大模型的應用產品，開始大規模升級上線，為走進千家萬戶做準備。

近期，國內科技企業最新發布的大模型，大多都面向垂類產業落地。在海外，各企業也陸續發布了不同規模的行業大模型，目的就是將其應用於產業領域。

從海內外各大廠商的實際動向不難看出，產業大模型將更能夠幫助產業夥伴，來完成數字化轉型和降本增效，為產業和社會創造更大價值。

產業大模型，難在打牢產業地基

產業大模型的建設難度，遠比通用大模型高得多。

如果說通用大模型考驗的是企業的算力、算法積累，那產業大模型更考驗企業對業務場景的觸達與理解，以及對產業數據的積澱與運用。

一個行業共識是，在產業大模型的訓練中，最難獲取的是產業數據。產業數據往往掌握在企業手中，出於數據安全等考慮，很少有企業願意將私有數據公開。但這些產業數據往往直接或間接影響著產業大模型的技術迭代速度、模型精準度和業務專業度。

“產業數據還分為靜態數據和動態數據。靜態數據相對穩定，不會發生即時變化，獲取路徑也較為清晰。動態數據則是不同產業場景中，每時每刻產生的數據，這部分數據是’活的’場景數據。不容易獲取，但卻是產業大模型的必備要素之一。”京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬強調。

不過，產業大模型的訓練也不能只用產業數據，仍需要使用大量通用數據，來提供常識性知識。其原因在於：首先，產業數據的泛化性不足，每次換個場景都需要重新訓練大模型，成本較高；其次，在應用時，如果用戶提出的問題與該領域無關，產業大模型就會陷入卡殼狀態。

何曉冬把訓練產業大模型比作培養一個人，“如果一個人高中畢業後直接出去打工，似乎也行，但專業性會差一點。要是能讀完四年本科再出去工作，就既有通識能力又有足夠的專業知識，這是產業大模型應該具備的能力”。

為此，京東言犀大模型的數據，由70%的通用數據與30%供應鏈場景生長的原生數據構成。

值得一提的是，這些產業數據均來自京東自身。京東本身就是以供應鍊為基礎的企業，自身紮根於寬廣的產業，不僅在零售、物流、金融、健康、工業等產業擁有實踐數據，還擁有城市、政務、金融、製造、工業、航空、交通、園區、能源等產業的脫敏數據，每年產生的優質數據達到百億條。

產業大模型，除了需要源源不斷供給的高質量產業數據，還需要了解行業Know-How，即對產業擁有特有的知識，對理解力要求也更高。舉例來說，零售行業更關注營銷、推薦的效果，金融行業更關注風控、可靠和安全的效果。

對於這種需求，京東長期耕耘的數智供應鏈就起到了關鍵作用，成為京東發力大模型應用的著力點。大模型也能夠基於供應鏈數智化，深入到實體產業。

據悉，京東的數智供應鏈，已經覆蓋超千萬的京東自營商品SKU，服務超800萬家活躍企業客戶，包括90%以上的在華世界500強企業，和全國近70%的專精特新中小企業。同時，京東的數智供應鏈還在全國，與超過2000個產業帶深度合作。

這種鏈路更長、場景更複雜、數據更豐富的數智供應鏈，是大模型的絕佳“訓練場”。在京東雲看來，只有將供應鏈做透，讓大模型“跑”在供應鏈上，才能將大模型的價值做實。

除了在產業側的積澱，京東在基礎算法、算力等方面的實力也不容小覷。

2021年，京東探索研究院就在重慶落地了全國首個基於DGX SuperPOD架構的超大規模計算集群——天琴α，推理提速6.2倍，推理成本節省90%。這為京東提供了最基礎的大模型訓練保障。

同年，京東推出了十億級模型K-PLUG，K-PLUG生成的商品文案已覆蓋京東超3000個品類，累計生成30億字，人工審核通過率超過95%。到了2022年，京東大模型升級為百億級模型Vega，能夠廣泛應用於情感分析、語義匹配、語法糾錯、智能問答、常識推理等多種下游自然語言處理任務。

得益於此前的積累，京東今年再度進行技術突破，推出了千億級參數的新一代京東言犀大模型，圍繞內容生成、人機對話、用戶意圖理解、信息抽取、情感分類幾大類任務，實現了基座模型+垂直領域模型精調，並且應用深入零售、物流、金融、健康、政務等垂直場景。

目前，以京東大模型為代表的產業大模型，正在通過自身積澱的行業化、場景化的數據和知識，對大模型進行訓練，並結合自身所積累的行業Know-How，對大模型進行修正，以提升大模型在特定行業及應用場景的表現，並提高可控性。這相當於對AI完成了“通識教育”。

京東大模型正在逐步深入各個產業，提升供應鏈的智能化水平。反過來，供應鏈的數智化升級也在推動產業變革，進而為大模型提供更豐富的數據土壤，形成正向循環。

“從產業端切入大模型，如同從北坡攀爬技術珠峰：道路雖然更加艱難，卻有更波瀾壯闊的風景。京東堅持做’難而正確的事’，堅持做實事、有價值的事和長期的事。在技術領域、在大模型上，這都是我們不變的承諾。”許冉表示。

“難而正確的事”需要長時間的積澱。但在產業大模型的建設上，京東顯然已經打好了地基。

生於產業的京東，用大模型創造產業價值

“在大模型時代，任何事情都值得用大模型重新做一遍。”

在大模型浪潮下，業界迅速達成了上述共識。不過，當其他大廠正在通過各種策略尋找商業模式時，京東落地產業的方向始終未變過。

“產業屬性是京東技術的鮮明特徵。京東研發每一項技術，都技術源於產業需求，歷練於產業場景，創造產業價值。”許冉表示。

當前，京東言犀大模型正在按照“三步走”戰略邁進：目前，京東雲已經基於內部實踐構建了通用大模型；到今年年底這段時間，京東將經由高複雜場景大規模錘煉，迭代出紮實的產業服務；預計在2024年初，會將大模型能力向外部嚴肅商業場景開放。

從具體實踐來看，京東大模型已經走到了第二步，京東正將大模型的能力用於最熟悉的零售、金融、物流、健康等場景，已經深入各個環節。

舉例來說，京東正在通過大模型提升智能客服的能力。客服領域不同於日常閒聊對話，是一個嚴肅的任務型對話場景，需要解決真實世界中買方與賣方的各類複雜問題。

“用戶和ChatGPT對話，即使回答錯了也沒關係，不會影響任何決策。但如果在嚴肅的商業場景中，智能客服回答錯誤，後果則不堪設想。因此，回答的精度很重要。”京東集團技術委員會主席、京東雲事業部總裁曹鵬表示。

針對智能客服場景，京東既搭建了具備基礎語義理解和問答邏輯的大模型，同時打磨了面向具體場景的小模型。如果客戶的問題涉及常見的退換貨等，智能客服就會調用更通用的大模型。而一旦問題涉及具體商品的保修政策、價保規則，智能客服則會調用針對性更強的小模型，來給出答案。不同的模型能夠承擔不同的職責。

現在，智能客服正在京東內部，助力2萬多名自有客服員工的降本增效，不斷優化客戶服務體驗。京東還對外開放了智能客服能力，幫助更多政府機構和企業進行數智化轉型升級。

在大模型對外服務方面，京東依舊保持著自己的“慢”節奏，並沒有急於將大模型“兜售”給企業。其原因在於，人工智能是一場非常嚴肅的技術變革：如果用得好，能夠幫助產業改天換地，但使用不當也可能造成嚴重的後果。在這種情況下，京東秉承長期主義的心態，不失為絕佳的選擇。

“京東不會把沒有實現’色香味俱全’的菜餚端上餐桌。大模型在內部關鍵場景完成了歷練和實踐後，才會開放給合作夥伴，來幫助整個行業降本增效。”許冉表示。

在京東的規劃中，言犀大模型將成為最底層的技術支撐。基於它的能力，領域都會產生一系列產品，同領域產品再聚合為平台，最終對行業輸出價值。

舉例來說，在內容生成領域，京東就打造了京東雲AIGC內容營銷平台。基於京東全品類的豐富商品數據積累，大模型可以更好理解商品特徵，幫助商家自動生成商品圖片、賣點等營銷素材，提升商家的運營工作效率和營銷內容質量。

換言之，商家只需要上傳一張產品圖片，就能夠迅速得到電商運營需要的商品主圖、營銷海報圖和商詳圖等多類型套圖，滿足快速開店、上品和營銷的需求。這些能力，能夠為商家在製圖方面節省90%成本，將製作週期從7天縮短到半天。

利用更多大模型能力，商家甚至都不用自己賣貨，只需使用京東雲多模態數字人，即可24小時不間斷、低成本地帶貨。

在這些應用以外，京東還展示了金融領域AI營銷運營平台。使用者通過簡單的對話，就能一站式生成營銷活動，覆蓋運營策略制定、營銷任務調度編排、搭建活動頁面、批量生成營銷文案和素材、數字化投放等方面。據京東相關數據顯示，過去這套流程需要產品、研發、算法、設計、分析師5類職能人員，如今減少到1人；過去流程需要2000次人機交互,也減少到少於50次。在大模型能力的加持下，營銷方案的生產效率有了顯著提升。

可以說，京東的產業大模型，正在成為各行各業產業應用的底座。目前其已經深入零售、物流、健康、工業、製造、金融、營銷等多個行業，奔赴產業、奔赴實際應用。

大模型狂奔半年後，廠商們已經意識到“規模大”或是“參數高”並不能解決實際問題。當泡沫期結束，大模型落地終究還是要回歸產業、回歸真實場景、解決實際問題，才是技術的最終歸宿，也是大模型良性發展的開端。那些具備了紮實產業數據和場景實踐的企業開始走向台前。

顯然，京東言犀大模型，已經向產業價值的彼端啟航。

展開全文打開碳鏈價值APP 查看更多精彩資訊

從熱潮到理性，大模型迎來產業「拐點」

特朗普已分四批向24個貿易夥伴發出關稅函

專家表示，若本週XRP驟升4美元，大家不必感到意外

Blockfi與DOJ達成3500萬美元加密貨幣資產轉移糾紛和解

“美聯儲傳聲筒”：美聯儲獨立性再受挑戰，預計本月不會降息

Santiment宣布Altsyzone正式啟動

人工智能在Facebook未來發展的持續作用

Coinbase和困惑AI團結了實時加密貨幣價格訪問

比特幣和以太坊ETFS本週$3.6B流入

從熱潮到理性，大模型迎來產業「拐點」

Related Posts