中國互聯網協會發布:2023年全球生成式AI產業研究報告

為政府部門、行業從業者、教育工作者以及社會公眾更好了解全球生成式AI發展情況提供參考。

來自:中國互聯網協會

2023年5月19日,在第七屆世界智能大會“世界智能科技創新合作峰會”期間,由中國互聯網協會、中國軟件行業協會指導,天津市人工智能學會、至頂科技、至頂智庫聯合編寫的《2023年全球生成式AI產業圖譜》和《2023年全球生成式AI產業研究報告》重磅發布,為政府部門、行業從業者、教育工作者以及社會公眾更好了解全球生成式AI發展情況提供參考。

生成式AI作為當前人工智能的前沿領域,成為全球最熱的科技話題。 2022年OpenAI發布ChatGPT,生成式AI在模型應用層面實現重要突破,僅兩個月突破1億月度活躍用戶數,成為史上用戶增長速度最快的消費級應用。全球多家科技企業加大在生成式AI領域的研發投入力度,不斷在技術、產品及應用等方面推出重要成果,持續推動人工智能的創新與商業化落地進程,也將帶動產業鏈相關企業快速發展。

在此背景下,在中國互聯網協會、中國軟件行業協會指導下,天津市人工智能學會、至頂科技、至頂智庫聯合發布《2023年全球生成式AI產業研究報告》,該報告從全球視角出發,對生成式AI的產業概況、基礎設施、算法模型、場景應用、機遇挑戰等方面進行梳理,全面展現生成式AI的產業發展情況,為政府部門、行業從業者、教育工作者以及社會公眾更好了解生成式AI提供參考。

01生成式AI產業概況篇

1.1 生成式AI概念及內容生成階段

生成式人工智能(Generative AI)是在專業生成內容(PGC)、用戶生成內容(UGC)之後,利用人工智能技術自動生成內容的新型生產方式。

生成式AI基於海量訓練數據和大規模預訓練模型,自動生成創建文本、音頻、圖像、視頻以及跨模態信息。自2022年OpenAI發布ChatGPT以來,全球爆發生成式AI熱潮,諸多科技類企業紛紛推出生成式AI模型、產品和相關底層基礎設施及服務。

1.2 生成式AI產業發展驅動力

近年全球數據規模持續增長,IDC預計到2025年全球數據規模將達到175ZB,為人工智能模型訓練提供海量數據資源;高性能AI芯片的推出為大規模預訓練模型提供重要算力支撐;伴隨技術的不斷發展,Transformer、BERT、LaMDA、ChatGPT等模型實現快速迭代優化。在數據、算力和模型的共同推動下,全球生成式AI產業得以迅速發展,相關場景應用也不斷豐富。

02生成式AI基礎設施篇

2.1 AI高性能芯片為生成式AI訓練提供算力支撐

人工智能的發展從深度學習時代進入到大模型時代,大規模預訓練模型的參數量呈現指數級上升,需要高性能算力的支撐。

目前,大規模預訓練模型訓練算力是以往的10到100倍,當前主流生成式AI模型的訓練廣泛使用到英偉達Tensor Core GPU芯片,如微軟斥資數億美元購買數万顆英偉達A100芯片以幫助Open AI打造ChatGPT。

2.2 AI計算集群為生成式AI訓練提供大規模算力資源

AI計算集群能夠提供大規模算力、持續提高算力資源利用率、提升數據存儲和處理能力,加速AI大模型訓練和推理效率。

當前較為典型的AI計算集群如英偉達DGX SuperPOD、百度智能雲高性能計算集群EHC、騰訊新一代高性能計算集群HCC等,相關算力基礎設施持續為生成式AI訓練場景提供強大算力資源,進一步降低模型訓練門檻和成本,推動生成式AI模型的落地進程。

2.3 AI雲服務為生成式AI模型開發提供平台支撐

人工智能預訓練模型的開發對於雲服務有較大需求,AI雲服務可以提供人工智能開發模塊,通過多元化的服務模式,降低開發者的開發成本和產品開發週期,為模型開發提供AI賦能。

典型案例如亞馬遜SageMaker,其可提供圖片/圖像分析、語音處理、自然語言理解等相關服務,使用者無需了解參數和算法即可實現功能的應用。

百度飛槳EasyDL零門檻AI開發平台提供圖像分類、物體檢測、文本分類、聲音分類和視頻分類等功能,實現一站式自動化訓練,降低AI定制開發門檻。

03生成式AI算法模型篇

3.1 全球生成式AI模型發展歷程

3.2 語言類生成主流模型:OpenAI GPT-1至GPT-4

2018年以來,OpenAI先後發布GPT-1、GPT-2、GPT-3、ChatGPT、GPT-4等一系列生成式預訓練模型。 GPT-1模型基於Transformer架構,僅保留架構中解碼器部分;

GPT-2模型取消GPT-1中的有監督微調階段;

GPT-3模型捨棄GPT-2的zero-shot,採用few-shot對於特定任務給予少量樣例;ChatGPT通過採用RLHF(人類反饋強化學習)技術,增強對模型輸出結果的調節能力;

2023年發布的GPT-4模型擁有更為強大的多模態能力,其支持圖文多模態輸入並生成應答文字,可實現對視覺元素的分類、分析和隱含語義提取,表現出優秀的應答能力。

3.3 語言類生成主流模型:Google Transformer到PaLM-E

2017年,Google發布具有標誌性意義的Transformer模型,該模型的解碼模塊成為GPT模型的核心要素,通過引入註意力機制,可實現更大規模的並行計算,明顯減少模型的訓練時間,使得大規模AI模型得以應用。 BERT模型、LaMDA模型在信息提取能力以及安全性等方面不斷提升。

最新推出的PaLM-E模型具有很強的泛化和遷移能力,在完成視覺語言和通用語言任務的同時,可處理多模態數據(語言、視覺、觸覺等),實現指導機器人完成相應任務的功能。

3.4 圖像類生成主流模型:Diffusion Model

Diffusion Model相關研究可追溯到2015年,去噪擴散概率模型(Denoising Diffusion Probabilistic Model, DDPM)在2020年被提出,展示擴散模型的強大能力,帶動擴散模型的發展。模型主要包括兩個過程:前向過程和反向過程,其中前向過程又稱為擴散過程,擴散模型通過給圖像增加高斯噪聲破壞訓練數據來學習,找出逆轉噪聲過程的方法,利用學習的去噪聲方法實現從隨機輸入中合成新的圖像。

Diffusion模型的優勢在於生成的圖像質量更高,不需要通過對抗性訓練,在所需數據更少條件下,該模型圖像生成效果有明顯提升。

PART.04生成式AI場景應用篇4.1 全球生成式AI典型應用概覽

4.2 生成式AI場景應用—文本生成

文本生成應用主要在四個領域:內容續寫、文本風格遷移、摘要/標題生成及整段文本生成,與其相關的個性化文本生成及實時文本交互前景廣闊。

總體來看,基於NLP技術的文本生成是生成式AI中發展較早的應用,全球知名科技企業先後推出文本生成類應用工具,如Microsoft、Xmind等相關產品在文案寫作、數據分析、演示文稿、思維導圖等方面均有相關應用案例。

4.3 生成式AI場景應用—圖像生成

圖像生成的技術場景劃分為圖像屬性編輯、圖像局部生成及更改、端到端的圖像生成。其中,前兩者落地場景為圖像編輯工具,端到端的圖像生成則對應創意圖像生成及功能性圖像生成兩大落地場景。

目前,圖像編輯工具的使用已較為廣泛,相關產品較為豐富;創意圖像生成大多以NFT等形式呈現,功能性圖像大多以營銷類海報/界面、LOGO、模特圖、用戶頭像為主。

4.4 生成式AI場景應用—音頻生成

音頻生成在日常生活中已較為常見,其應用領域可進一步區分為語音合成和音樂創作,語音合成包括文本生成特定語音(TTS)和語音克隆領域。

TTS領域的技術成熟度較高,但在情感表現上仍有欠缺;語音克隆對電影、動畫等行業意義重大值得關注;音樂創作可進一步細分為作詞、作曲、編曲、錄製、混音等多個方向,創作過程主要依托Transformer模型。

4.5 生成式AI場景應用—視頻生成

視頻生成有望成為未來跨模態生成領域的中高潛力場景。視頻生成主要對應三個領域:視頻屬性編輯、視頻自動剪輯、視頻部分生成。

視頻屬性編輯已廣泛應用於視頻創作領域,大幅提升視頻剪輯效率;視頻自動剪輯主要在技術嘗試階段;視頻部分生成的原理本質與圖像生成類似,強調將視頻切割成幀,再對每一幀的圖像進行處理,現階段的技術在於提升修改精準度與修改實時性兩方面。

4.6 生成式AI場景應用—數字人

數字人指存在於非物理世界(如圖片、視頻、直播、VR)中,並具有多重人類特徵的綜合。數字人代表著從文本/音頻等低密度模態向圖像/視頻/實時交互等信息密度更高模態的轉化,未來視頻乃至元宇宙領域都將是數字人的重要應用場景。

在生成式AI領域,數字人生成可劃分為數字人視頻生成和數字人實時互動,數字人視頻生成是目前應用最廣泛的領域之一,而數字人實時互動多應用於可視化的智能客服,更強調實時交互功能。

05生成式AI機遇挑戰篇

5.1 生成式AI時代,行政類工作被替代性高,“問客”有望成為新職業

生成式AI對就業的影響挑戰與機遇並存。一方面,生成式AI將促進崗位智能化升級,部分工作崗位將被替代。據高盛分析,生成式AI的智能自動化能力極大提升工作效率並降低運營成本,美國和歐洲的傳統職位都將受到不同程度的AI自動化影響,生成式AI可以替代四分之一的工作崗位。

另一方面,生成式AI也會創造新職業:“問客”(Prompt Engineer)讓人們能夠利用自然語言作為提示詞,通過與AI進行交互,得到信息或創造作品。除此之外,圍繞人工智能的相關領域也將產生大量新的工作崗位。

5.2 生成式AI作品版權主要在軟件所有者和使用者之間分配

生成式AI本質是機器學習的應用,其在模型學習階段不可避免地會使用大量的數據集執行訓練,但對訓練後生成物的版權歸屬問題尚存爭議。

由於法律主體才能享有權利,所以生成式AI作品的版權只能由對作品的生成具有貢獻的人享有,相關人員包括軟件開發者、所有者和使用者(主體身份可能重合),一般認為生成式AI軟件開發者已從軟件版權中得到補償,生成式AI作品版權主要在軟件所有者和使用者之間分配。

展開全文打開碳鏈價值APP 查看更多精彩資訊

Total
0
Shares
Related Posts