朱嘉明:智能數字新時代,關於AIGC的13個關鍵問題

AIGC的絕對優勢是其邏輯能力。

來源:瞭望智庫

原標題:《顛覆性挑戰!你想像不到的一個新領域強勢崛起》

最近,一款叫“ChatGPT”的聊天機器人闖入人們的視野,很多跟它聊過天的人感歎其表現相當“靠譜”。不同於市面上其他聊天機器人經常答非所問、言語混亂的表現,ChatGPT的對話交流非常接近真實的人類。

更厲害的是,它的內容創作能力驚人:寫郵件、做文案、創作詩歌分分鐘完成,還能寫代碼、查程序Bug、改論文、參加司法考試……怪不得有人評價它“只有你想不到,沒有ChatGPT辦不成的”。

ChatGPT的一夜爆紅,讓許久沒有聲響的人工智能又一次在各界引起轟動。

比爾·蓋茨曾這樣描述互聯網的發展,他說“人們大大高估了5 年後的互聯網,又大大低估了10年後的互聯網。”如今在談及與之相媲美的技術時,他指出“人工智能是最重要的”,“ChatGPT 讓我們窺見了未來”。

在ChatGPT顛覆人們想像的背後,是一個新領域的強勢崛起——AIGC(AI Generated Content,人工智能生成內容)。

一方面,AIGC催生出全新產業體系和商業化特徵,並引領人類加速逼近“科技奇點”;另一方面,人類獨有的創造性工作面臨顛覆性挑戰,相當多的職業可能面臨衰落和消亡。說到底,以ChatGPT為標誌的AIGC將改變社會的演進模式,而這一切已經開始。

未來何以窺見?下文探討的13個問題,揭示了其中關鍵。

文| 朱嘉明經濟學家、橫琴新區數鏈數字金融研究院學術與技術委員會主席編輯丨王乙雯瞭望智庫本文為瞭望智庫書摘,係作者為《AIGC:智能創作時代》(中譯出版社2023年2月出版)所撰寫的“代序言”,原標題為《AIGC和智能數字化新時代——媲美新石器時代的文明範式轉型》,不代表瞭望智庫觀點。

2022年,在集群式和聚變式的科技革命中,人工智能生成內容(AIGC,AI Generated Content)後來居上,以超出人們預期的速度成為科技革命歷史的重大事件,迅速催生了全新的科技革命系統、格局和生態,進而深刻改變了思想、經濟、政治和社會的演進模式。

第一,AIGC的意義是實現人工智能“內容”生成。人們主觀的感覺、認知、思想、創造和表達,以及人文科學、藝術和自然科學都要以具有實質性的內容作為基礎和前提。所以,沒有內容就沒有人類文明。進入互聯網時代後,產生了所謂專業生產內容(PGC),也出現了以此作為職業獲得報酬的職業生產內容(OGC)。與此同時,“用戶生成內容”(UGC)的概念和技術也逐漸發展,由此形成了用戶內容生態。

內容生產賦予了Web 2.0的成熟和Web 3.0時代的來臨。相較於PGC和OGC、UGC,AIGC通過人工智能技術實現內容生成,並在生成中註入了“創作”,意味著自然智能所“獨有”和“壟斷”的寫作、繪畫、音樂、教育等創造性工作的歷史走向終結。內容生成的四個階段(見下圖):

圖0-1 內容生成的四個階段。

第二,AIGC的核心技術價值是實現了“自然語言”與人工智能的融合。自然語言是一個包括詞法、詞性、句法、語義的體系,也是不斷演進的動態體系。代表AIGC最新進展的是由OpenAI公司開發的ChatGPT(Generative Pre-Training)。它完成了機器學習算法發展中,自然語言處理領域的歷史性跨越,即通過大規模預訓練模型,形成人工智能技術理解自然語言和文本生成能力,能完成腳本編寫、文案撰寫、翻譯等任務。

這是人類文明史上翻天覆地的革命,開啟了任何階層、任何職業都可以以任何自然語言和人工智能交流,並且生產出從美術作品到學術論文的多樣化內容產品。在這樣的過程中,AIGC“異化”為一種理解、超越和生成各種自然語言文本的超級“系統”。

第三,AIGC的絕對優勢是其邏輯能力。是否存在可以逐漸發展的邏輯推理能力是人工智能與生俱來的挑戰。 AIGC之所以迅速發展,是因為AIGC基於代碼、雲計算、技術操控數據、模式識別,以及通過機器對文本內容進行描述、分辨、分類和解釋,實現了基於語言模型提示學習的推理,甚至是知識增強的推理,構建了堅實的“底層邏輯”。不僅如此,AIGC具備基於準確和規模化數據,形成包括學習、抉擇、嘗試、修正、推理,甚至根據環境反饋調整併修正自己行為的能力;它可以突破線性思維框架並實現非線性推理,也可以通過歸納、演繹、分析,實現對複雜邏輯關係的描述。可以毫不誇張地說,AIGC已經並繼續改變著21世紀邏輯學的面貌。

第四,AIGC實現了機器學習的集大成。 21世紀的機器學習演化到了深度學習(Deep learning)階段。深度學習可以更有效地利用數據特徵,形成深度學習算法,解決更為複雜的場景挑戰。 2014 年生成對抗網絡(GAN)的出現,加速了深度學習在AIGC領域的應用。 AIGC實現了機器學習的集大成(見下圖):

圖0-2 機器學習常用算法。資料來源:程序員zhenguo(2023),“梳理機器學習常用算法(含深度學習)”圖0-2 機器學習常用算法。資料來源:程序員zhenguo(2023),“梳理機器學習常用算法(含深度學習)”

第五,AIGC開創了“模型”主導內容生成的時代。人類將跑步進入傳統人類內容創作和人工智能內容生成並行的時代,進而進入後者逐漸走向主導位置的時代。這意味著傳統人類內容創作互動模式轉換為AIGC模型互動模式。 2022年是重要的歷史拐點(見下圖):

圖0-3 人類生成內容向AIGC轉換趨勢。圖0-3 人類生成內容向AIGC轉換趨勢。

在自然語言處理(NLP)系統中,“Transformer”是一種融入註意力機制和神經網絡模型領域的主流模型和關鍵技術。 Transformer具有將所處理的任何文字和句子“向量”或者“矢量”化,最大限度反映精準意義的能力。

總之,沒有Transformer,就沒有NLP的突破;沒有大模型化的AIGC,ChatGPT升級就沒有可能。多種重要高效Transformer的集合(見下圖):

圖0-4 多種重要高效transformer的集合模型。資料來源:Tay et al (2022), “Efficient Transformers: A Survey”, doi: 10.48550/arXiv.2009.06732圖0-4 多種重要高效transformer的集合模型。資料來源:Tay et al (2022), “Efficient Transformers: A Survey”, doi: 10.48550/arXiv.2009.06732

第六,AIGC開放性創造力的重要來源是擴散模型。擴散(diffusion)模型的概念最早在2015年的論文《利用非均衡熱力學的深度非監督學習》(Deep Unsupervised Learning Using Nonequilibrium Thermodynamics)中被提出。 2020年,論文《去噪擴散概率模型》(Denoising Diffusion Probabilistic Models)中提出DDPM模型用於圖像生成。從技術的角度來看,擴散模型是一個潛在變量(Latent Variable)模型,通過馬爾可夫鏈(Markov chain)映射到潛在空間。

【注:馬爾可夫鏈的命名來自俄國數學家安德雷·馬爾可夫(Andrey Andreyevich Markov,1856—1922),定義為概率論和數理統計中具有馬爾可夫性質,且存在於離散的指數集和狀態空間內的隨機過程。馬爾可夫鏈可能具有不可約性、常返性、週期性和遍歷性。 】

一般來說,AIGC因為吸納和依賴擴散模型,而擁有開放性創造力。

2021年8月,斯坦福大學聯合眾多學者撰寫論文將將基於Transformer架構的等模型稱為“基礎模型”(Foundation model),在翻譯時也常譯作大模型。 Transformer推動了AI整個範式的轉變(見下圖):

圖0-5 基礎模型“transformer”。資料來源:Bommasani et al (2022), "On the Opportunities and Risks of Foundation Models", doi: 10.48550/arXiv.2108.07258圖0-5 基礎模型“transformer”。資料來源:Bommasani et al (2022), “On the Opportunities and Risks of Foundation Models”, doi: 10.48550/arXiv.2108.07258

第七, AIGC的進化是參數以幾何級數擴展為基礎。 AIGC的訓練過程,就是調整變量和優化參數的過程。所以,參數的規模是重要前提。 ChatGPT聊天機器人的問世,標誌著AIGC形成以Transformer為架構的大型語言模型(Large Language Mode,LLM)機器學習系統,通過自主地從數據中學習,在對大量的文本數據集進行訓練後,可以輸出複雜的、類人的的作品。

AIGC形成的學習能力決定於參數的規模。 GPT-2大約有15億個參數,而GPT-3最大的模型有1750億個參數,上升了兩個數量級。而且,它不僅參數規模更大,訓練所需的數據也更多。根據媒體報導但還未被證實的消息,GPT-4 的參數可能將達到100萬億規模(見下圖):

圖0-6 GPT-4的參數規模。圖0-6 GPT-4的參數規模。

根據學界經驗,深度神經網絡的學習能力和模型的參數規模呈正相關。人類的大腦皮層有140多億個神經細胞,每個神經細胞又有3萬多個突觸。所以,大腦皮層的突觸總數超過100萬億個。所謂的神經細胞就是通過這些突觸相互建立聯繫。假設GPT-4實現100萬億參數規模,堪比人的大腦,意味著它達到與人類大腦神經觸點規模的同等水平。

第八,AIGC的算力需求呈現顯著增長。數據、算法、算力是人工智能的穩定三要素。根據OpenAI分析,自2012年以來,6年間AI算力需求增長約30萬倍(見下圖):

圖0-7 從AlexNet到AlphaGo Zero:30萬倍的運算量增長。資料來源:OpenAI (2018),“AI and Compute”, https://openai.com/blog/ai-and-compute/圖0-7 從AlexNet到AlphaGo Zero:30萬倍的運算量增長。資料來源:OpenAI (2018),“AI and Compute”, https://openai.com/blog/ai-and-compute/

在可以預見的未來,在摩爾定律(Moore’s Law)以走向失效的情況下,AI模型所需算力被預測每100天翻一倍,也就是“5年後AI所需算力超100萬倍”。造成這樣需求的根本原因是AI的算力不再是傳統算力,而是“智能算力”,是以多維度的“向量”集合最為算力基本單位的。

第九,AIGC和硬技術相輔相成。從廣義上講,AIGC的硬技術是AI芯片,而且是經過特殊設計和定制的AI芯片。 AI芯片需要實現CPU、GPU、FPGA和DSP共存。隨著AIGC的發展, 使得計算技術的發展不再僅僅依靠通用芯片在製程工藝上的創新,而是結合多種創新方式,形成智能計算和計算智能技術。例如,根據應用需求重新審視芯片、硬件和軟件的協同創新,即思考和探索新的計算架構,滿足日益巨大、複雜、多元的各種計算場景。期間,量子計算會得到突破性發展。

第十,AIGC將為區塊鏈、NFT、Web3.0和元宇宙帶來深層改變。 AIGC不可枯竭的創造資源和能力,將從根本上改變目前的NFT概念生態。 Web3.0結合區塊鏈、智能合約、加密貨幣等技術,實現去中心化理念,而AIGC是滿足這個目標的最佳工具和模式。

沒有懸念,在Web3.0環境下,AIGC內容將出現指數級增長。元宇宙的本質是社會系統、信息系統、物理環境形態通過數字所構成了一個動態耦合的大系統,需要大量的數字內容來支撐,人工設計和開髮根本無法滿足需求,AIGC可以最終完善元宇宙生態的底層基礎設施。

隨著AIGC技術的逐漸成熟,傳統人類形態不可能進入元宇宙這樣的虛擬世界。未來的元宇宙主體將是虛擬人,即經過AIGC技術,特別融合ChatGPT技術,以代碼形式呈現的模型化的虛擬人。

簡言之,區塊鏈、NFT、Web3.0,將賦予AIGC進化的契機。 AIGC的進化,將加速廣義數字孿生形態與物理形態的平行世界形成。

第十一,AIGC催生出全新產業體系和商業化特徵。 AIGC利用人工智能學習各類數據自動生成內容,不僅能幫助提高內容生成的效率,還能提高內容的多樣性。文字生成、圖片繪製、視頻剪輯、遊戲內容生成皆可由AI替代,並正在加速實現,使得AIGC進而滲透和改造傳統產業結構。 “在產業生態方面,AIGC領域正在加速形成三層產業生態並持續創新發展,正走向模型即服務(MaaS)的未來”(見下圖):

圖0-8 AIGC產業結構。資料來源:騰訊《AIGC發展趨勢報告》,2023年1月31日發布圖0-8 AIGC產業結構。資料來源:騰訊《AIGC發展趨勢報告》,2023年1月31日發布

伴隨AIGC生成算法的優化與改進,AIGC對於普通人來說也不再是一門遙不可及的尖端技術。 AIGC在文字、圖像、音頻、遊戲和代碼生成中商業模型漸顯。 2B(to B的簡稱)將是AIGC的主要商業模式,因為它有助於B端提高效率和降低成本,以填補數字鴻溝。

但可以預見,由於AIGC“原住民”的成長,2C(to C的簡稱)的商業模式將接踵而來。根據有關機構預測,2030年的AIGC市場規模將超過萬億人民幣,其產業規模規模生態(見下圖):

圖0-9 AIGC產業規模生態分佈。資料來源:陳李,張良衛(2023),“ChatGPT:又一個“人形機器人”,東吳證券https://www.nxny.com/report/view_5185573.html圖0-9 AIGC產業規模生態分佈。資料來源:陳李,張良衛(2023),“ChatGPT:又一個“人形機器人”,東吳證券https://www.nxny.com/report/view_5185573.html

現在,AIGC,特別是在語言模型領域的全方位競爭已經開始。所以,發生了微軟對OpenAI的大規模投資,因為有這樣一種說法:“微軟下個十年的想像力,藏在ChatGPT裡。”近日,谷歌表宣布推出基於“對話應用語言模型”(LaMDA)的Bard,實現其搜索引擎將包括人工智能驅動功能。

ChatGPT刺激谷歌開始“創新者困境”突圍。未來很可能出現Bard和ChatGPT的對決或共存,也就是LaMDA和GPT-3.5的對決和共存,構成AIGC競爭和自然壟斷的新生態。

在這樣的新興產業構造和商業模式下,就業市場將會發生根本性改變:其一,專業職場重組,相當多的職業可能衰落和消亡;其二,原本支持IT和AI產業的碼農隊伍面臨嚴重萎縮。因為AIGC極大刺激全球外包模式並取代碼農。

第十二,AIGC的法律影響和監管。雖然AIGC這樣的新技術提供了很多希望,但是將給法律、社會和監管帶來挑戰。在中國,繼2022年1月國家互聯網信息辦公室、工業和信息化部、公安部、國家市場監督管理總局聯合發布《互聯網信息服務算法推薦管理規定》後,2022年11月,國家互聯網信息辦公室再次會同工業和信息化部、公安部聯合發布《互聯網信息服務深度合成管理規定》。該規定的第五章第二十三條,對“深度合成技術”內涵做了規定:“利用深度學習、虛擬現實等生成合成類算法製作文本、圖像、音頻、視頻、虛擬場景等網絡信息的技術。”但可以預見,因為AIGC的技術日趨複雜和高速發展,國家很難避免監管缺乏專業性和滯後性。

第十三,AIGC正在引領人類加速逼近“科技奇點”。現在,人工智能已經接管世界;世界正在經歷一波人工智能驅動的全球思想、文化、經濟、社會和政治的轉型浪潮。 AIGC呈現指數級的發展增速,開始重塑各個行業乃至全球的“數字化轉型”。說到底,這就是以AIGC為代表,以ChatGPT為標誌的轉型。這一切,在2023年會有長足的發展,特別是在資本和財富效益領域。

【注:AI產業在2022年接近3874.5億美元,預計到2029年將超過13943億美元,可謂市場機會巨大。 2023年,全球企業在人工智能方面的支出將突破5000億美元。 】

如果說,2022年8月的AI繪畫作品《太空歌劇院》(Théatre D’opéra Spatial)推動AIGC進入大眾視野,那麼,ChatGPT的底層模型GPT-3.5是一個劃時代的產物。它與之前常見的語言模型(BERT/ BART/ T5)的區別幾乎是導彈與弓箭的區別。現在,呼之欲出的GPT-4,很可能通過圖靈測試。

【注:根據韓國IT媒體報導,自2022年11月中旬開始,業界已經傳出了GPT-4全面通過了圖靈測試的說法。 】

如果是這樣,不僅意味著GPT-4系統可以改造人類的思想和創作能力,形成人工智能超越專業化族群和大眾化趨勢,而且意味著這個系統開始具備人類思維能力,並有可能在某些方面和越來越多的方面替代人類。

【注:根據Metaverse Post 消息,ChatGPT通過了美國賓大沃頓商學院MBA的考試。如果消息屬實,近乎完成圖靈試驗。 】

特別值得關注的是被稱為“人工智能激進變革先鋒”的BLOOM(大型開放科學獲取多語言模型)的誕生。從2021年3月11日到2022年7月6日,60個國家和250多個機構的1000多名研究人員,在法國巴黎南部的超級計算機上整整訓練了117天,創造了BLOOM。這無疑是一場意義深遠的歷史變革的前奏。

斯坦福大學心理學和計算機科學助理教授丹尼爾·亞明斯(Daniel Yamins)說過:“人工智能網絡並沒有直接模仿大腦,但最終看起來卻像大腦一樣,這在某種意義上表明,人工智能和自然之間似乎發生了某種趨同演化。”

2005年,雷·庫茨維爾(Ray Kurzweil,1948—)的巨著《奇點臨近:當計算機智能超越人類》(The Singularity is Near: When Humans Transcend Biology)出版。該書通過推算奇異點指數方程,得出了這樣一個結論: “在2045年左右,世界會出現一個奇異點。

這件事必然是人類在某項重要科技上,突然有了爆炸性的突破,而這項科技將完全顛覆現有的人類社會。它不是像手機這種小的奇異點,而是可以和人類誕生對等的超大奇異點,甚至大到可以改變整個地球所有生命的運作模式。 ”

現在處於狂飆發展狀態的AIGC,一方面已經開始呈指數形式膨脹,另一方面其“溢出效應”正在改變人類本身。在這個過程中,所有原本看來離散和隨機的科技創新和科技革命成果,都開始了向AIGC技術的收斂,人工智能正在形成自我發育和完善的內在機制,加速人類社會超越數字化時代,進入智能數字化時代,逼近可能發生在2045年的“科技奇點”。

參考文獻:

1.Sohl-Dickstein et al (2015), “Deep Unsupervised Learning using Nonequilibrium Thermodynamics”, doi: https://doi.org/10.48550/arXiv.1503.03585.

2.Ho et al (2020), “Denoising Diffusion Probabilistic Models”, doi:10.48550/arXiv.2006.11239.

3.Anne Trafton (2021), “Artificial intelligence sheds light on how the brain processes language”, https://news.mit.edu/2021/artificial-intelligence-brain-language-1025.

4.新智元《5年後AI所需算力超100萬倍》,2023.1.31. 發表於北京

展開全文打開碳鏈價值APP 查看更多精彩資訊

Total
0
Shares
Related Posts