通用大模型商業化尚早,生成式AI才剛起跑


來源:鈦媒體

作者:秦聰慧

圖片來源:由無界AI生成

從狂熱追捧到回歸冷靜,人們對大模型看法正在悄然發生轉變。一方面,由於合規、監管等原因,通用大模型商業化尚需時日;另一方面,產業側才從金融、醫療等試點領域著手投入,效果上也並不能立竿見影。

於是,當瘋轉的螺旋逐漸變慢,不同的聲音逐漸描繪出一個真實的“大模型”圖景。

這其中,究竟是上“通用大模型”,還是上“行業大模型”,各家也都在經過一番考量後做出了選擇;而伴隨大模型之爭,“生成式AI”進入聚光燈下。不得不說,ChatGPT無異於是人工智能行業發展進入新階段的一針強心劑,它將AI重新推向了時代中心。

通用大模型與行業大模型之爭

ChatGPT讓業界認識到了通用大模型的巨大能量,這才有了後面“百模大戰”的商界奇觀,無數投資人、創業者為此夜不能寐,GPU資源也一時變得“洛陽紙貴”。

這其中,不乏一些行業頭部的技術公司被逼上“梁山”。一位大模型業內人士就曾對鈦媒體App透露其公司所處現狀:“沒有大模型都不好意思出來講,現在做吧,趕了個晚集,說沒有又不好交代。”所以他們只能一邊對外界放出正在做通用大模型的消息,一邊內部加緊研發進度。

但通用大模型畢竟是一件費時費力的苦差事,OpenAI將GPT1.0迭代到4.0用了6年,百度文心一言、智源悟道等業界反饋較好的通用大模型也都是從幾年前就開始著手訓練。因此如果在AI技術和數據等方面沒有基礎增持,想要在短期內實現通用大模型的商業化是非常困難的一件事。

再加上通用大模型天然需要公開數據做訓練,把自身數據投入通用大模型也意味著默認將數據共享。所以,一些對數據隱私要求高的行業,也不太可能在毫無準備的情況下接入通用大模型。

在這一境況下,行業大模型成為業界在通用大模型之外,“退而求其次”且能較快享有大模型紅利的方案。 360集團創始人周鴻禕也曾直言:“人工智能大模型未來機會在企業級增量市場,大模型是’垂直化’是發展方向。”某大廠技術高管也對鈦媒體App表示。 “從我們在大模型的規劃上來看,持續迭代通用大模型,並以此繼續分層,進行行業垂直大模型訓練。”

不久前,在2023 世界人工智能大會上,騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生也表示,企業的大模型應用需要綜合考慮行業專業性、數據安全、持續迭代和綜合成本等因素。基於行業大模型,構建自己的專屬模型,也許是企業更優的選項。原因是,行業大模型所需參數比通用大模型少,訓練和推理的成本更低,模型優化也更容易。

不過,鈦媒體App也從以為行業人士處獲悉,在一些情況下,通用大模型也不是垂直大模型的必要條件,也就說一家訓練行業大模型的平台不必須以通用大模型為底座。 “如果定義的通用大模型是千億參數那種,那麼通用大模型不是行業大模型的必要條件。”在一次交易所中,一位行業大模型高管向鈦媒體App表示。不過,他也表示,通用大模型雖然不是行業大模型的必要條件,但是訓練通用大模型的各類底層技術,如Transformer等,卻也是訓練行業大模型必不可少的要素。

不動輒“千億”參數,“撇清”與通用大模型的關係,垂直大模型的門檻也進一步降低,這給生成式AI的進一步發展提供了更多可能性。

大模型之外,生成式AI也值得關注

每當談及大模型,生成式AI(Generative Al)就會如影隨形。簡單來理解兩者的關係——大模型可以理解為實現生成式AI的引擎,即生成式 AI 的能力由機器學習模型或者大模型提供,而生成式AI比大模型更上層,生成式AI可以根據所需場景可以決定調用哪種大模型,ChatGPT是生成式AI的典型應用之一。

早在2020年,生成式AI就入選了Gartner新興技術成熟度曲線,2022年,生成式AI被列入主要戰略技術趨勢之一,該技術已從創新觸發階段進入膨脹期望的峰值。 Gartner認為生成式AI將成為一種通用技術,其影響類似於蒸汽機、電力和互聯網。隨著生成式AI逐漸落地,圍繞這一概念的炒作將會逐漸消退,對人和企業在日常工作和生活中影響將會增加。

圖片來源@Gartner

全球雲計算巨頭亞馬遜雲科技也是將筆墨更多地放在了生成式AI身上,亞馬遜雲科技首席執行官Adam Selipsky曾接受彭博社、CNBC等媒體專訪時表示:“生成式AI在聊天機器人和搜索上的應用優勢已經有目共睹,但這只是眾多可能性的冰山一角。未來,生成式AI將為各行各業帶來變革。”他把生成式AI看做一次“突破性”變革,且有可能是自互聯網誕生以來最大的變革。

“想像一下,在計算機以穿孔卡片為交互界面的年代,只有少數科學家才有能力使用計算機;當圖形界面和鼠標成為人機交互界面,人人都可以使用計算機。”Adam Selipsky表示。

那麼,生成式AI帶來的變革會體現在哪些方面呢?

可以看到,在汽車領域,已經有企業使用生成式AI合成數據用於自動駕駛訓練,加快訓練進程;在製造領域,生成式AI可以幫助分析大量物聯網遙測數據,進行預測性維護,減少生產線的停機時間。依託生成式AI,Autodesk與飛機製造商合作,成功完成了艙壁的部分設計,並推出了重量減輕45%的新設計。如果將這種航壁推廣應用到全球機隊,將可以節省相當於93000輛汽車油耗的燃油。

不過需要強調的是,Autodesk所依託的生成式AI背後並非是某某大模型,而是以機器學習模型構建的AI驅動的設計工具。

所以,對與生成式AI的實現來說,大模型只是一種選擇,未來也不會是以一個大模型為主導。鈦媒體App關注到,大多數企業在考慮接入大模型時,並不僅僅直接入一家大模型,而是選擇接入多家。那麼這多家大模型中,未來可能也不排除垂直大模型和通用大模型的通力合作。

以國內兩款軟件用友和WPS為例,用友日前發布企業服務大模型YonGPT,據鈦媒體App了解,YonGPT規劃接入的通用大模型底座包含智譜ChatGLM、文心一言以及智源悟道天鷹等;WPS此前推出了WPS AI,據最新消息,WPS AI在中國內地依託的通用大模型底座為MiniMax,其剛剛推出的海外版本則是由OpenAI和PaLM2提供大模型支持。

在生成式AI的世界中,不依賴一種大模型,而決定生成式AI是否成功的也並不只有大模型。

不可否認的是,生成式AI的落地也多方面促成的結果,且圍繞生成式AI落地而出現的“次生”挑戰正在暴露出來。

生成式AI下“次生”挑戰

“對著手機說’如果貓跑到沙發上,提醒我’,那麼在貓跑到沙發上的時候,手機就會收到告警信息。”視頻解決方案服務商山東中維世紀科技股份有限公司高級副總裁王正彬在一次演講中提到了智能家居的智能視頻檢測應用場景。

但就是這樣一個看似簡單的場景,除了背後的多模態大模型,邊緣端的網絡、計算也非常重要。 “像ChatGPT這樣的生成式AI應用中,如果網絡丟包率達到1%的時候,大模型訓練平台的性能就會掉到它峰值性能的5%,也就是說95%都丟掉了。網絡能力對整個大模型平台的性能是非常重要的因素。”英特爾中國區網絡與邊緣事業部首席技術官、英特爾高級首席AI 工程師張宇說道。

有預測認為,隨著AI需求的爆發,人工智能的在邊緣端的部署,將會比在數據庫當中高3倍,這也意味著邊緣端AI的落地是下一步人工智能發展的一大挑戰。

“人工智能部署到工廠產線等邊緣端的時間成本和人力成本還是偏高,且邊緣人工智能的部署超過一半都是失敗的。”英特爾公司高級副總裁兼網絡與邊緣事業部總經理Sachin Katti 日前談到大模型時代下的邊緣計算問題時表示。原因一方面是設備陳舊,邊緣計算資源不足;另一方面,如何利用他們自身獨特的數據來部署AI 也非常關鍵。很多邊緣AI 的部署會因為這些挑戰止步不前。

同時,生成式AI的更好表現最終也需要依靠數據來支撐,目前業界一方面希望能保證生成式AI中的數據安全,一方面也希望能夠實現數據源能夠豐富可用。

這些問題的解決,也已經在逐步推進中。 “今天的大模型體系、AI體係是強依賴數據的,是數據驅動的智能體系。這個體係對數據所需要的廣泛性和無偏差性要求非常高。假設數據偏差性非常大,很難有效支撐人工智能體係發展。”螞蟻集團副總裁兼首席技術安全官韋韜曾表示,於是可以看到,目前已經有反向驗證AI數據安全的工具出現。

在開拓數據源上,不久前,深圳數交所聯合近50家單位成立“開放算料聯盟”,共同發起機構包括了騰訊雲、華大基因、雲天勵飛、奧比中光、優必選、中國聯通廣東分公司、華傲數據等企業,深圳市人工智能學會等協會,國家超級計算深圳中心等智庫及研究機構。該算料聯盟成立的一個主要目的,就是圍繞高質量中文訓練數據和多模態訓練數據,協調數據要素、數據治理、訓練數據、數據標註、合成數據等相關標準制定,協助數據交易所增加大模型相關的新品類和新專區。

生成式AI在發展過程中所遭遇的挑戰並不能一文言盡,ChatGPT引發的全球AI風暴也並不以ChatGPT而結束。在新人工智能世界被打開後,處於初級階段的大模型與生成式AI也暴露了諸多問題並拋出了一系列挑戰,但同時這給各行各業提供了探索和創新的機會。

行業競逐生成式AI,這對人工智能甚至是人類的發展來說絕非是一件壞事。

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts