可控性是AIGC的成色“鑑定表”?
作者:王詠剛
- 王詠剛:SeedV實驗室創始人兼CEO,創新工場AI工程院執行院長
- 童超:SeedV實驗室聯合創始人兼首席產品
生成式AI的應用場景在哪裡
Stable Diffusion、ChatGPT等生成式AI技術(Generative AI)在2023年上半年吸引了IT創投圈的最多注意力。當我們稍稍從波瀾壯闊的新技術浪潮中回過神來,開始認真思考到底什麼樣的應用場景才是生成式AI的最佳落地方向時,很多人還是會發現,科技與市場之間的關係錯綜複雜,很難梳理出生成式AI落地的最佳路徑:
- 某投資人:這幾個月來,一線風投機構全體動員,忙得昏天黑地,結果發現除了四五家頭部大模型創業項目被大家追捧外,其他AIGC項目都看不清,不敢投,不知道未來AI應用會向哪裡發展。
- 某分析師:幾家頭部大模型項目投入大,風險也高;所有B端、政府端應用受限於私有部署和私有數據的製約,週期長,難落地;C端應用大部分都太淺太薄,文本和圖像生成項目同質化嚴重;有一兩篇好論文就出來創業的現像很普遍,但團隊自己也想不清具體應用落地方向……
這裡面最大的思維癥結是:
- 大多數人還是在潛意識裡把生成式AI看成是一組生成對話、文章、圖片的工具。按這樣的刻板印象:這東西只能幫文案工作者、設計師提高提高效率,哪裡稱得上顛覆式的變革?
- 雖然有許多跡象表明,生成式AI顯露出通用人工智能(AGI)的曙光,但受限於短期價值判斷的人總會說:曙光又怎樣?眼見為實。今天的AI不還是在聊天兒、寫文章、畫畫兒嗎?
顯然,僅停留在單一視角或單一時間節點來分析生成式AI的應用前景是不可取的。有沒有串聯起生成式AI的發展脈絡,簡明易用的思考模型呢?
圍繞可控性建立思考模型
我們認為,生成式AI是可以與桌面計算、移動計算相提並論甚至更具顛覆效應的信息產業革命。顛覆式變革從來都不是一蹴而就,而要隨著生成式AI的不斷發展、不斷進步逐漸實現。如果想看清、看透生成式AI即將帶來哪些新產品、新平台、新市場、新機會,我們覺得,有一條簡明易懂,也易於指導產品選型、項目選型的思維路徑:
生成式AI的可控性越強,對市場和產業的顛覆性就越大!
這條路徑可以簡單用一張圖來表示:
隨著生成式AI對生成內容的可控性不斷提高,生成式AI適用的應用場景也會不斷擴展和深化。量變引起質變。一旦突破領域閾值,生成式AI就可以徹底改造現有的產品生態,為產品賦予真正的智能元素。
演進過程中,生成式AI的可控性大致會經歷六個階段。以最基本的文本生成為例:
階段1:不可控
20多年前,基於N-grams算法的統計語言模型也可以生成連續的文本內容。只不過,生成的結果基本不可控。如此早期形態的“生成式AI”幾乎沒有轉化到產品的可能性,更談不上顛覆已有市場了。
階段2:概略方向可控
從基於LSTM或RNN的文本生成,到早期GPT(如GPT-2)的文本生成,生成式AI逐漸擁有了描摹一段類似人類語言文字的能力。這一階段的描摹能力,基本可以達到文句通順,內容大致符合人類給出的提示,但因為細節、結構或邏輯不可控,還是很難轉化成真正有用的產品。
階段3:結構或局部邏輯可控
從GPT-3到ChatGPT(GPT-3.5),生成式AI第一次擁有了對生成內容的結構和局部邏輯的控制力。文字創作和多輪會話是這個時期的兩種典型應用生態。前者可以支持自動文章摘要,法律文書生成,營銷文案生成等實用場景,後者則可以滿足會話式搜索,語言學習,智能客服,虛擬人,智能遊戲角色的部分需要。
階段4:初步的思維鏈可控
從GPT-3.5到GPT-4,生成式AI的邏輯推理能力顯著提高。生成式AI第一次擁有了強大的分析能力(如從新聞報導中提取數據,總結趨勢),控制能力(如將人類語言轉化成複雜系統控制指令)和初步的邏輯推理能力(如解答簡單的數學、邏輯題)。可生成的文本內容也擴展到數據、表格、代碼、指令序列、工作流或工具鍊等結構化、半結構化文本。這直接引發了今天一大批以Copilot(直譯為“副駕駛”)為特徵的新工具、新系統。
階段5:複雜邏輯推理可控
當然,今天的GPT-4生成文本時,可以控制的邏輯思維鏈還處在初級階段。如果一切順利,人類有望在不太遠的將來研發出可精確控制複雜邏輯推理的下一代生成式AI。這樣的AI具備記憶、學習、規劃、決策等高級邏輯推理能力。這些能力足以在效率工具、內容平台、商業流程自動化、機器人、操作系統、智能設備等場景裡,徹底顛覆過去數十年的人機交互形態,重新定義人類與計算機的關係。
階段6:規則或原理可控
更前瞻一些看,人類思維的最高階表現是:一、基於歸納思維發現原理、制定規則;二、基於演繹思維將原理或規則應用到具體場景中。生成式AI的理想進化形態是接近人類思維方式,生成與人類思維水平相當的規則或原理,並加以應用。一旦達到規則或原理可控的“自由王國”,生成式AI必將擁有強大的自我迭代、自我改進的能力,可以像人類一樣設計系統規則、世界規則,甚至與人類科學家一道開展科學研究。
可控性與典型應用方向
生成式AI可控性的提升帶來適用領域的大幅擴展。我們用下圖概括生成式AI在不同發展階段,可控性與最佳應用方向之間的關係:
以可控性為脈絡,生成式AI在每個發展階段,支持的應用方向不斷擴展、深化,從滿足簡單、局部需求,逐步發展到滿足領域、平台需求,並最終積累到產品和商業模式的顛覆性變革。思維鏈、邏輯推理是否可控,在多大程度上可以精準控制,是這個量變到質變過程裡最關鍵的因素。
可控性與具體應用案例
以生成式AI的可控性為脈絡,我們將今天和近未來的生成式AI最適合的應用方向分成四個大類,並用下圖將每個大類中的典型應用案例與生成式AI的不同發展階段關聯起來:
內容創建工具/內容平台
內容創建工具是生成式AI落地最直接也最快捷的場景。隨著生成式AI可控性的提升,內容創建任務會從簡單的文本、圖片創建,過渡到復雜的視頻、3D、動畫、遊戲、影視、虛擬世界等的自動創建。借助AI,每個普通人都將擁有原本只屬於專業團隊、專業工具的能力。普通人的創作欲一旦得到大幅釋放,有關新內容形式的分享、觀賞、購買、社交等更高層級的需求就必將帶動新一代內容平台的誕生、發展和壯大。
商業自動化/企業服務
限於數據安全、私有部署、內容準確性及合規性等原因,商業流程對生成式AI的可控性要求非常高。今天的生成式AI最適合落地的商業領域可能包括市場營銷中的內容創建和電商的用戶界面。此外,生成式AI也可以通過自動生成SQL等中間代碼,自動採集分析數據,自動生成報表,自動連接業務流程等,大幅提高商業效率。未來,隨著生成式AI可控性的提高,商業流程中的規劃、決策、優化等關鍵過程,一定會吸納更多的前沿AI技術。
個人助理/專業助理
個人生活和辦公場景中,生成式AI將逐漸以各類不同形態的“助理”身份,在數年內建立起人與AI相互協作的新生態。生成式AI的可控性有多強,從根本上決定了我們生活或工作中的AI助理有多聰明,可以幫我們解決哪些問題。一旦生成式AI在一部分工作中具備與人類文秘、司機、譯員、律師等角色相當的水平,AI助理就會成為替代計算機、手機的新一代大眾電子產品。
基礎架構/開發工具/操作系統/搜索引擎
生成式AI的編程能力,數據處理能力,系統設計能力,知識處理能力等,將為開發工具、數據庫、搜索引擎、操作系統提供全新的設計理念和跨時代的新功能。未來是否能真正誕生AI為核心的操作系統,AI為核心的智能計算平台,完全取決於生成式AI的複雜邏輯推理能力到底能達到怎樣的高度。
多模態AI的應用能力演進
與簡單的文本生成、圖片生成相比,包含聲音、視頻、3D場景、動畫、複雜故事線的多模態系統與人類的常識感受和本源需求更加契合,明顯擁有更寬廣和深遠的應用前景。有關多模態AI的技術現狀和前景展望,可以參見本文作者的另一篇文章:
後GPT時代,多模態是最大的機會在多模態領域,我們認為,今天和未來的生成式AI會大致按照下圖所示的脈絡演進積累,不斷催生有革命意義的新應用、新平台甚至顛覆性的新商業模式:
使用許可
以上所有應用路線圖的圖片和文字內容,均由SeedV實驗室以CC BY 4.0協議發布。大家在註明原始出處(SeedV實驗室)的基礎上,可自由使用、修改、再發布。
以上應用路線圖的圖片也同時開源在以下位置,歡迎訪問(可直接點擊文末【閱讀原文】訪問):
github.com/SeedV/generative-ai-roadmap
展開全文打開碳鏈價值APP 查看更多精彩資訊