在AIGC技術應用佈局上,通用性和垂直性並重。
作者:白惠天,騰訊研究院研究員;
王強,騰訊研究院資深專家、前沿科技研究中心主任
縱覽生成式人工智能(Generative AI或AIGC,兩種表述均可,國內更多用AIGC)進化史,從AI誕生之始,人們就試圖讓機器生成內容,與其對話,並誕生了最早的圖靈測試標準。多年來,生成式AI的發展一直不溫不火。直到去年Midjourney、Stable Diffusion等文生圖應用點燃了大眾的熱情,再到11月ChatGPT的橫空出世,更是引發了現象級熱潮,讓生成式AI走入了億萬用戶的視野。
本文結合國際企業實踐經驗,從大模型生態構建方式、行業應用的切入路徑這兩個視角切入,描繪生成式AI的行業應用版圖,分享我們初步的觀察與思考。
大模型的生態
模型即服務(MaaS)的新生態加速形成
結合目前行業“基礎設施層-模型層(MaaS)-應用層”三層結構,我們預計未來可能形成一個模型即服務(MaaS)的新生態。自下而上,三層結構的構成如下:
基礎設施層:GPU芯片、AI芯片、超級計算機等算法基礎設施,以及機器學習框架、雲操作系統等軟件。
模型層(MaaS):通用AI大模型,以及基於大模型在垂直領域訓練生成的行業模型(中間層),即在預訓練AI大模型基礎上,可以快速微調或使用嵌入等方式、開發出場景化、定制化、個性化的中小模型,實現在不同行業、垂直領域、功能場景的工業流水線式部署,同時兼具按需使用、高效經濟的優勢。
應用層:AIGC技術面向終端用戶帶來的新的功能、產品、服務和應用等;正如之前的“互聯網+”一樣,“AIGC+”或者說“AI+”將來有望和各行各業深度結合,持續帶來新的應用形式。未來,一方面,現有的APP都可以用大模型重做一遍,另一方面,還會出現更多新的AI原生類APP,從而誕生更多新的獨角獸甚至巨頭企業。
大模型走向通用性和垂直性並重的縱深佈局
在AIGC技術應用佈局上,通用性和垂直性並重。
所謂“通用性”指的是橫向能力,適用於各個行業,具體而言包括語義多輪對話、知識庫構建、智能搜索、企業級RPA、多模態內容生成、代碼生成等方面:
1、語義多輪對話:AIGC技術在語義多輪對話中發揮著巨大的優勢,尤其是在高客單價銷售和私域交流場景下。例如,直播話術中,AIGC能夠迅速學習並掌握最佳實踐,如各類Chatbot和IQ for sales。
2、知識庫構建:AIGC技術從簡單的資料概括整理髮展到幫助用戶閱讀理解、生成個性化資料庫,以及基於高效資訊歸納的新搜索功能。這使得AIGC既可應用於企業級人工智能,也可成為個人助理(如Mem)。
3、智能搜索:AIGC在智能搜索領域的應用也取得了顯著成果,如New Bing、Perplexity等。凡積累了知識庫的系統,都可以藉助AIGC實現語義搜索功能。
4、企業級RPA(Robotic Process Automation):結合LLM(Large Language Models)技術和RPA,AIGC在企業級應用中發揮著重要作用。典型應用包括微軟的Copilot以及CRM領域的Salesforce等,它們緊密結合行業場景,為用戶賦能。
5、多模態內容生成:在智能寫作助手、廣告主視覺創作、智能NPC等領域,AIGC技術帶來了創新應用,除了文字,還可以生成圖片、視頻,甚至3D數字內容。
6、代碼生成:代碼作為一種更標準化的文本,AIGC在代碼生成方面具有巨大潛力,如GitHub Copilo已經有很不錯的表現,在這個領域,正在有更多的代碼生成工具出出現,有望大幅提升碼農的生產力,也為普通的非技術工作者提供了更為便捷的工具,大幅降低了編程門檻。
所謂“垂直性”指的是縱向能力,通過對不同行業Know-how的學習,AIGC技術可以進化為行業專家,從而大幅加速各行業的數字化轉型。
結合國外企業的投融資信息,我們列舉了醫療、金融、零售和製造幾個行業的典型例子:
- 醫療(Zebra Medical Vision ,Aidoc 等使用AGI進行醫學圖像分析)
- 金融(Bloomberg發布Terminal AI大模型提供金融智能化服務)
- 零售(Stitch Fix 等公司使用生成式人工智能來實現個性化購物體驗、庫存管理和需求預測)
- 製造(通用電氣等公司利用生成式人工智能優化生產流程、預測性維護和供應鏈管理)
國外科技企業紛紛“卷”出了新高度
在Open AI的直接帶動(微軟)或刺激(谷歌等)下,大模型已經成為巨頭軍備競賽新的殺手鐧。不僅加速大煉“大模型”,還在原有的產品中快速加入大模型的能力,以期在新的範式轉換和技術浪潮中占得先機。
先是5月初,谷歌I/O大會推出PaLM2大模型,其對話產品Bard未來也能像ChatGPT一樣,接入網絡,實時搜索網頁。同時推出Duet AI,給谷歌的辦公套件Workspace全新升級。
近日,微軟開發者大會則推出了Windows Copilot,打造每個人的AI助手。 Windows Copilot將直接集成到Windows 11中,在所有應用和程序中都可使用,就像我們在Edge、Office程序和GitHub中看到的Copilot側邊欄一樣。
除了傳統科技巨頭,創業企業同樣表現出極高的市場活力和技術實力,各模態應用快速落地,爆款產品不斷推出。隨著技術不斷演進,尤其是Diffusion、Transformer和Clip等模型的提出,AIGC的商業化在多個領域開始落地,其中代碼生成、文本生成、圖像生成、音視頻/遊戲等領域已有不少爆款級產品。
- 代碼領域,Github推出的Copilot用戶量破百萬
- 文本領域,微軟已經在Bing和Dynamic365等應用已接入ChatGPT/GPT-4接口
- 圖像領域,Stable diffusion等文生圖應用已突破千萬級用戶量
- 音視頻/遊戲領域,起步較晚,對模型和算力要求更高,出現了不少Start-up。
更多頭部企業創新產品和解決方案可參見下表:
大模型生態合作的5種典型方式
目前,大模型可能的生態合作和商業模式正在漸次展開,我們梳理了主要的5種。其中API調用和插件是大多數公司接入大模型能力的主要方式。
1、API調用:大多數公司使用大模型的主要方式
在當前的技術環境下,API調用被廣泛應用於知識庫和客戶服務領域。公司通過利用ChatGPT開放的Fine Tuning API,將自有的Knowledge Base(包括產品文檔、常見問答、客服歷史對話等)上傳到ChatGPT,從而建立私有模型。值得注意的是,儘管如此,創業公司仍無法擁有該模型的所有權。
通過這種方式,ChatGPT的用戶可以擁有專屬的Chat Bot,它不僅具備常規對話功能,還可以利用企業自有、甚至非公開的訓練數據來提供高度針對性的服務。
以OpenAI的GPT-3/3.5/4為技術基礎,一些創新公司如QUANTUM ENGINE(類似Character.ai和Inworld,由創始人Jesse Lyu於2023年創建)旨在基於ChatGPT改善玩家體驗並提升生產環節效率。這些公司通過引入開放式對話,重新探索NPC的價值,以提升沈浸感與交互方式。同時,實現了開放式遊戲視覺引擎聯動的三個步驟:生成對話、行為與藍圖的自動化。一個典型的示例是“當馬斯克想把特斯拉賣給比爾蓋茨”的Demo,該Demo展示瞭如何自由選擇角色並自動生成對話。
價格方面,儘管不同類型、不同公司的定價方式各有千秋,但整體上大模型日益向生態擴展方向發展。典型如OpenAI開放了GPT-4(純文本)、ChatGPT API和WhisperAPI(應用程序接口),允許開發者將ChatGPT集成至他們的應用程序和服務中。 2023年3月1日,OpenAI基於GPT 3.5 Turbo模型開放了ChatGPT API;API收費模式為0.002美元/1000tokens。相較於前一代開放接口GPT 3.5,性能更強的同時,價格下降90%,進一步加速了ChatGPT相關應用生態的發展。
2、插件模式:Plugin讓大模型有望成為新的OS
除API調用外,2023年3月24日,OpenAI公佈了重磅消息:ChatGPT支持接入第三方插件,並一口氣上架了11個插件。通過這些插件,用戶可以用ChatGPT購買商品,預定酒店、機票,搜索專業數據等,這大大解放了ChatGPT的生產力,為其發展帶來了更多的可能性。這種插件模式為Plugin可能的應用方式和影響提供了豐富的發展前景。
總之,不管是作為操作系統還是應用商店,AI的轉折點已經到來。
3、進一步的探討:機遇還是陷阱?護城河在哪裡?
綜合上述API調用方式的分析,我們不禁產生一個靈魂之問:模型是OpenAI的,核心技術不在自己手裡,AIGC應用層企業的護城河在哪裡?
PitchBook調查數據顯示,僅在2022年,生成式AI(即AIGC)賽道就發生了78筆投資,總融資金額超過13.7億美元,幾乎相當於過去5年的融資總和。同期,出現了OpenAI、Stability AI、Jasper等估值超過10億美元的獨角獸。預計2023年,生成式AI賽道的融資次數、額度將會更多。
然而,“GPT狂飆,AI投資突進,整個創投市場都熱得發燙。稀缺的公司分分鐘獨角獸,做大模型的人才出500萬年薪也難招,但與此同時,有的創業公司還沒來得及在市場上露出鋒芒,就已經被一日千里的OpenAI拍倒在PPT階段,難以翻身”——AIGC應用層融資過熱,是否“虛假繁榮”?
換言之,ChatGPT“更強、更快、更便宜”了,現有應用還有市場嗎?關於這個問題的回答我們將以Grammarly、Jasper.ai 的使用體驗及Quantum-engine創始人的現身說法為例嘗試做出回答。
(1)ChatGPT對Grammarly說:我幹掉你,與你無關?
Grammarly為全球每天的3000萬用戶(包括50000個專業機構)提供語法校對服務。然而,在ChatGPT出現後,這一市場格局可能面臨挑戰,據悉reddit、twitter 等地充滿了正在認真考慮退訂Grammarly 。
(2)Jasper“真香”,為什麼?
Jasper支持各平台廣告/博客圖文內容生成,截至2022年12月底,Jasper付費用戶達到7萬,估值已達15億美元,旗下有多款產品接入GPT-3進行商業性文字創作。
雖然底層模型是OpenAI的(親測調整設問方式後可在ChatGPT中得到高度一致的營銷文案結果輸出,核心功能可替代),且Jasper定價更高,但截至目前Jasper的估值和用戶量並未受到影響,這引發了關於其發展和市場競爭力的思考。
(3)創始人視角:應用層壁壘在於前端用戶體驗
QUANTUM ENGINE 創始人表示ChatGPT在遊戲行業的應用呈現出巨大潛力,包括遊戲角色對話生成、劇情編寫、遊戲元素創意等方面,為遊戲開發者提供強大的支持。作為對話生成應用,低延時性對用戶體驗至關重要,類似於在弱網條件下云視頻會議產品Zoom適當犧牲視頻質量以優先保障音頻流暢以保證用戶通話體驗,AIGC應用也需要關注此類需求,為用戶精準提供更舒適的前端用戶體驗。
由此觀之,行業應用層的獨特優勢決定了未來百花齊放的生態,深耕行業特性、優化前端體驗才能應對大模型飛速迭代帶來的潛在危機。
行業應用的6類切入路徑
按用戶側類型劃分,生成式人工智能(AIGC)在C端和B端市場呈現出兩類路徑,其中C端已經達到可用、甚至好用的臨界點,B端將從高價值先導領域向MaaS生態擴展。
C端市場已經達到可用的臨界點
C端應用包括效率工具的下一代產品、遊戲未來的新形態和製作新方式,以及為數字人、元宇宙、機器人等交叉領域帶來新空間。此外,AIGC還帶來了內容創作領域的大爆發。
B端市場,從高價值先導領域向MaaS生態擴展。
1、生成式AI從效率角度切入,提升寫作和生產力。
例如,會議、招聘、各類辦公助手(文檔助手、編程助手)等應用場景。
2、生成式AI在高價值領域如營銷、金融育等領域率先切入
以營銷為例,AIGC技術可以大幅降低創意成本、大量生成廣告素材和文案。 Jasper作為市場上最為火爆的廣告、營銷圖文生成產品,在截至2022年12月底時,付費用戶達到7萬,2022年年收入7500萬美元,估值已達15億美元。
在金融領域中,AIGC應用探索方向集中在智能客服、智能投顧、商戶入網、欺詐檢測、智能營銷等領域。然而,在算法風險、隱私保護、信息安全等方面仍然面臨較大的挑戰。
3、知識密集型領域蘊含著生成式AI應用的巨大潛力
在醫療領域,GPT-4作為一種醫學AI聊天機器人,在醫學領域的潛在應用方式主要包括醫療記錄、醫學知識和醫療諮詢,可以幫助醫護人員提升工作效率和患者問診體驗。但它也存在局限性,並可能帶來系列潛在風險。
在教育領域的應用已較為成熟。以Duolingo為例,他們利用GPT-4推出了新產品“Duolingo MAX”學習平台,提供了“解釋答案”和“角色扮演”兩項全新的AI功能。
在這些領域中,AIGC技術不斷拓展應用場景,為各行各業帶來了前所未有的效率提升和創新機遇。但我們也應當關注到其中的挑戰與風險,確保技術在發揮潛能的同時,也能保障用戶的利益和安全。
除了千行百業的多模態應用,在B端市場,如下圖所示的模型層中AIGC技術業在逐漸圍繞頭部幾家大模型形成的MaaS生態發展。
進一步的探討
暢想未來,生成式人工智能將進一步與生產、生活深度融合。而大模型帶來的變革才剛剛開始。也特別歡迎大家聯繫我們,一起探討大模型在行業應用主戰場落地的機會和挑戰。
企業級RPA+大模型的AutoGPT方式可能顛覆現有的軟件模式
產業層面,企業級RPA(Robotic Process Automation)結合大模型的方式將在更多行業實現落地(譬如金融、零售、政府、製造、物流、地產、教育等),並財務,HR,客服等應用場景展現極為出色的能力,從而實現更高效的工作流程和業務處理。譬如說AutoGPT已昭示Prompt 工程的下一個前沿,即便是非科班出身的小白,借助AutoGPT不到3 分鐘就能成功建立一個網站,完成一份詳實的市場調研也可以在彈指間輕鬆實現。
組織變革和個人自僱等興起,將帶來應用軟件的全新革命
當一個人就能成為一支團隊,這將有可能誕生具有To C體驗的B端現象級產品。在產業變革的加速驅動下,未來在組織層面業將發生深刻變革,個人和小團隊模式可能成為重要形態,引發To B和To C軟件的邊界進一步模糊……
當然這還只是我們的初步的思考,生成式AI技術影響下的未來勢必繼續顛覆我們的認知、持續突破想像的邊界,帶來生產力的新革命。無論如何,未來已呼嘯而至。
展開全文打開碳鏈價值APP 查看更多精彩資訊