AIGC絕非曇花一現,其底層技術和產業生態已經形成了新的格局。
2022年,從引爆AI作畫領域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT為代表的接近人類水平的對話機器人,AIGC不斷刷爆網絡,其強大的內容生成能力給人們帶來了巨大的震撼。學術界和產業界也都形成共識:AIGC絕非曇花一現,其底層技術和產業生態已經形成了新的格局。
就內容生產而言,AIGC作為新的生產力引擎,讓我們從過去的PGC、UGC,已經不可避免地進入AIGC時代。 AIGC代表著AI技術從感知、理解世界到生成、創造世界的躍遷,正推動人工智能迎來下一個時代。
經過了2022年的預熱,2023年AIGC領域將迎來更大發展。 AIGC生成內容的類型不斷豐富、質量不斷提升,也將有更多的企業積極擁抱AIGC。在這個背景下,騰訊研究院正式發布《AIGC發展趨勢報告2023:迎接人工智能的下一個時代》。報告從技術發展和產業生態、應用趨勢、治理挑戰等維度,對AIGC的發展趨勢進行了深入思考。
本文為報告核心內容摘要(下載:https://pan.baidu.com/s/1bWEmS9OzLuh45s2bpC4AKw?pwd=lehe,提取碼:lehe):
AIGC技術和產業生態迎來發展快車道
AIGC的大爆發不僅有賴於AI技術的突破創新,還離不開產業生態快速發展的支撐。在技術創新方面,生成算法、預訓練模型、多模態技術等AI技術匯聚發展,為AIGC的爆發提供了肥沃的技術土壤。
圖:AIGC技術累積融合
第一,基礎的生成算法模型不斷突破創新。比如為人熟知的GAN、Transformer、擴散模型等,這些模型的性能、穩定性、生成內容質量等不斷提升。得益於生成算法的進步,AIGC現在已經能夠生成文字、代碼、圖像、語音、視頻、3D物體等各種類型的內容和數據。
第二,預訓練模型,也即基礎模型、大模型,引發了AIGC技術能力的質變。雖然過去各類生成模型層出不窮,但是使用門檻高、訓練成本高、內容生成簡單和質量偏低,遠遠不能滿足真實內容消費場景中的靈活多變、高精度、高質量等需求。而預訓練模型能夠適用於多任務、多場景、多功能需求,能夠解決以上諸多痛點。預訓練模型技術也顯著提升了AIGC模型的通用化能力和工業化水平,同一個AIGC模型可以高質量地完成多種多樣的內容輸出任務,讓AIGC模型成為自動化內容生產的“工廠”和“流水線”。正因如此,谷歌、微軟、OpenAI等企業紛紛搶占先機,推動人工智能進入預訓練模型時代。
第三,多模態技術推動了AIGC的內容多樣性,進一步增強了AIGC模型的通用化能力。多模態技術使得語言文字、圖像、音視頻等多種類型數據可以互相轉化和生成。比如CLIP模型,它能夠將文字和圖像進行關聯,如將文字“狗”和狗的圖像進行關聯,並且關聯的特徵非常豐富。這為後續文生圖、文生視頻類的AIGC應用的爆發奠定了基礎。
未來,算法的進步將帶來更多激動人心的應用,語言模型會得到進一步發展,可以自我持續學習的多模態AI將日益成為主流,這些因素會進一步推動AIGC領域的蓬勃發展。
在產業生態方面,AIGC領域正在加速形成三層產業生態並持續創新發展,正走向模型即服務(MaaS)的未來。
目前,AIGC產業生態體系的雛形已現,呈現為上中下三層架構。
第一層是基礎層,以預訓練模型為基礎搭建的AIGC技術基礎設施層。在國外,以OpenAI、Stability.ai為代表,通過受控API、開源等方式輸出模型能力。
第二層是中間層,是在預訓練模型基礎上,通過專門的調試和訓練,快速抽取形成垂直化、場景化、定制化的小模型和應用工具層,可以實現工業流水線式部署,同時兼具按需使用、高效經濟的優勢。比如,知名的二次元畫風生成模型Novel-AI,以及各種風格的角色生成器等,就是基於Stable Diffusion開源進行的二次開發。隨著AIGC模型加速成為新的技術平台,模型即服務(Model-as-a-Service,MaaS)開始成為現實,預計將對商業領域產生巨大影響。
第三層是應用層,依托底層模型和中間層的垂直模型,各廠商進一步開放面向C端和B端用戶的各種各樣的AIGC產品和服務,滿足海量用戶的內容創建和消費需求。例如群聊機器人、文本生成軟件、頭像生成軟件等AIGC消費工具。
目前,從提供預訓練的AI大模型的基礎設施層公司到專注打造垂直領域內AIGC工具的中間層公司、再到直接面對消費者和終端用戶提供產品和服務的應用層公司,美國圍繞AIGC生長出繁榮的生態,技術創新引發的應用創新浪潮迭起;中國也有望憑藉領先的AIGC技術賦能千行百業。
AIGC在消費互聯網、產業互聯網和社會價值領域持續產生變革性影響
AIGC領域目前呈現AIGC的內容類型不斷豐富、內容質量不斷提升、技術的通用性和工業化水平越來越強等趨勢,這使得AIGC在消費互聯網領域日趨主流化,湧現了寫作助手、AI繪畫、對話機器人、數字人等爆款級應用,支撐著傳媒、電商、娛樂、影視等領域的內容需求。目前AIGC也正在向產業互聯網、社會價值領域擴張應用。
圖:AIGC應用現狀概覽(引用自紅杉資本)
在消費互聯網領域,AIGC牽引數字內容領域的全新變革。目前AIGC的爆發點主要是在內容消費領域,已經呈現百花齊放之勢。 AIGC生成的內容種類越來越豐富,而且內容質量也在顯著提升,產業生態日益豐富。這其中有三個值得關注的趨勢:
第一,AIGC有望成為新型的內容生產基礎設施,塑造數字內容生產與交互新範式,持續推進數字文化產業創新。過去AI在內容消費領域的作用主要體現在推薦算法成為了新型的傳播基礎設施。推薦算法對數字內容傳播,短視頻為主的數字內容新業態發展,起到了顛覆式的變革作用。而現在,隨著AIGC生成的內容種類越來越豐富,內容的質量不斷提升,AIGC將作為新型的內容生產基礎設施對既有的內容生成模式產生變革影響。
第二,AIGC的商業化應用將快速成熟,市場規模會迅速壯大。當前AIGC已經率先在傳媒、電商、影視、娛樂等數字化程度高、內容需求豐富的行業取得重大發展,市場潛力逐漸顯現。比如,在廣告領域,騰訊混元AI大模型能夠支持廣告智能製作,即利用AIGC將廣告文案自動生成為廣告視頻,大大降低了廣告視頻製作成本。巨大的應用前景將帶來市場規模的快速增長,根據6pen預測,未來五年10%-30%的圖片內容由AI參與生成,有望創造超過600億以上市場規模。也有國外商業諮詢機構預測,2030年AIGC市場規模將達到1100億美元。
第三,AIGC還將作為生產力工具,不斷推動聊天機器人、數字人、元宇宙等領域發展。 AIGC技術讓聊天機器人接近人類水平日益成為現實,當前以ChatGPT為代表的聊天機器人已經在刺激搜索引擎產業的神經,未來人們獲取信息是否會更多通過聊天機器人而非搜索引擎?這已經使谷歌等公司面臨的巨大壓力。 AIGC也在大大提升數字人的製作效能,並且使其更神似人。比如騰訊AI LAB的虛擬歌手AI艾靈,能夠基於AIGC實現作詞和歌曲演唱。在元宇宙領域,AIGC在構建沉浸式空間環境、提供個性化內容體驗、打造智能用戶交互等方面發揮重要作用。比如,扎克伯格在元宇宙的島嶼上,可以通過發出語音命令生成創造海灘、變換天氣,添加不同的場景等。只有借助AGIC,元宇宙才可能以低成本、高效率的方式滿足海量用戶的不同內容需求。
在產業互聯網領域,基於AIGC技術的合成數據(synthetic data)迎來重大發展,合成數據將牽引人工智能的未來。 MIT科技評論將AI合成數據列為2022年10大突破性技術之一;Gartner也預測稱,到2030年合成數據將徹底取代真實數據,成為訓練AI的主要數據來源。
圖:合成數據發展預測(來源:Gartner)
合成數據的用途是成為真實世界數據的廉價替代品,用來訓練、測試、驗證AI模型。 AIGC技術的持續創新,讓合成數據迎來新的發展契機,開始迸發出更大的產業發展和商業應用活力。這主要體現在以下四個方面:
第一,合成數據為AI模型訓練開發提供強大助推器,推動實現AI 2.0。過去用真實世界數據訓練AI模型,存在數據採集和標註的成本高昂,數據質量較難保障、數據多樣化不足、隱私保護挑戰等多方面問題。而合成數據可以很好的解決這些問題。使用合成數據不僅能更高效地訓練AI模型,而且可以讓AI在合成數據構建的虛擬仿真世界中自我學習、進化,極大擴展AI的應用可能性。從某種意義上也可以說合成數據讓AI模型訓練從1.0階段發展到2.0階段。
第二,合成數據助力破解AI“深水區”的數據難題,持續拓展產業互聯網應用空間。目前,合成數據正迅速向交通、金融、醫療、零售、工業等諸多產業領域拓展應用,幫助破解產業互聯網應用中的數據難題。比如,騰訊自動駕駛團隊研發的仿真係統TAD SIM可以自動生成各種交通場景數據,助力自動駕駛系統測試、開發。在醫療領域,美國國立衛生研究院和合成數據服務商合作,基於其COVID-19病人病歷數據庫,合成了不具有可識別性的替代數據,可供世界範圍內的研究人員自由分享和使用。
圖:騰訊自動駕駛數字孿生仿真平台
第三,正是由於合成數據對人工智能未來發展的巨大價值,合成數據正加速成為一個新產業賽道,科技大廠和創新企業紛紛搶先佈局。目前,全球合成數據創業企業也已經達到100家,英偉達、亞馬遜、微軟等頭部科技企業也在加速佈局,湧現了合成數據即服務(SDaaS,synthetic data as a service)這一全新商業模式。
第四,合成數據加速構建AI賦能、數實融合的大型虛擬世界。合成數據指向的終極應用形態是藉助遊戲引擎、3D圖形、AIGC技術構建的數實融合的大型虛擬世界。基於合成數據構建的大型虛擬世界,為測試、開發新的人工智能應用,提供了一個安全、可靠、高效以及最重要的是——低成本的、可重複利用的環境,將成為AI數實融合的關鍵載體,包括為AI開發提供數據和場景、試驗田等。比如騰訊開悟的AI開放研究環境,已經吸引了國內外眾多決策智能領域的研究團隊使用。
在社會價值領域,AIGC也在助力可持續社會價值的實現。比如,在醫療健康方面,AI語音生成幫助病人“開口說話”。語音合成軟件製造商Lyrebird為漸凍症患者設計的語音合成系統實現“聲音克隆”,幫助患者重新獲得“自己的聲音”。 AI數字人也能幫助老年癡呆症患者與他們可能記得的年輕面孔或者逝去的親人互動。此外,AIGC也可以用於文物修復,助力文物保護傳承。騰訊公司利用360度沉浸式展示技術、智能音視頻技術、人工智能等技術手段,對敦煌古壁畫進行數字化分析與修復。在國外,DeepMind合作開發的深度神經網絡模型Ithaca可以修復殘缺的歷史碑文。
圖:騰訊利用AIGC技術手段,助力敦煌古壁畫修復
總之,隨著AIGC模型的通用化水平和工業化能力的持續提升,AIGC的根本影響在於,將極大降低內容生產和交互的門檻和成本,有望帶來一場自動化內容生產與交互變革,引起社會的成本結構的重大改變,進而在各行各業引發巨震。未來,“AIGC+”將持續大放異彩,深度賦能各行各業高質量發展。
以可信AIGC 積極應對科技治理問題與挑戰,擁抱人工智能的下一個時代
發展總是與挑戰並生,AIGC的發展也面臨許多科技治理問題的挑戰。目前,主要是知識產權、安全、倫理和環境四個方面的挑戰。
首先,AIGC引發的新型版權侵權風險,已經成為整個行業發展所面臨的緊迫問題。因版權爭議,國外藝術作品平台ArtStation上的畫師們掀起了抵制AIGC生成圖像的活動。其次,安全問題始終存在於科技發展應用之中。在AIGC中,主要表現為信息內容安全、AIGC濫用引發詐騙等新型違法犯罪行為,以及AIGC的內生安全等。較為著名的案例是,詐騙團隊利用AIGC換臉偽造埃隆·馬斯克的視頻,半年詐騙價值超過2億人民幣的數字貨幣。再次,算法歧視等倫理問題依然存在。比如,DALL·E 2具有顯著的種族和性別刻板印象。最後是環境影響,AIGC模型訓練消耗大量算力,碳排放量驚人。此前就有研究表明,單一機器學習模型訓練所產生的碳排放,相當於普通汽車壽命期內碳排放量的5倍。
圖:騰訊優圖實驗室推出FaceIn人臉防偽產品,
能夠自動檢測精準識別視頻、圖像中是否應用人臉偽造技術
為了應對以上挑戰,面向人工智能的下一個時代,人們需要更加負責任地、以人為本地發展應用AIGC技術,打造可信AIGC生態。面對AIGC技術應用可能帶來的風險挑戰,社會各界需要協同參與、共同應對,通過法律、倫理、技術等方面的多元措施支持構建可信AI生態。在立法方面,網信辦等三部門出台的《互聯網信息服務深度合成管理規定》針對深度合成技術服務提出的要求和管理措施,諸如禁止性要求、標識要求、安全評估等,亦適用於AIGC。接下來,需要著重從以下方面持續推進AIGC的政策和治理。
其一,政府部門需要結合AIGC技術的發展應用情況,制定並明晰AIGC的知識產權與數據權益保護規則。目前,AIGC的知識產權與數據權益保護規則的不明確,在某種程度上導致甚至加劇了AI領域的亂象。
其二,研發應用AIGC技術的主體需要積極探索自律管理措施,例如,秉持不作惡、科技向善等目的,制定適宜的政策(消極要求和積極要求),採取控制和安全措施保障AIGC的安全可控應用,採取內容識別、內容溯源等技術確保AIGC的可靠來源。
其三,打造安全可信的AIGC應用,需要深入推進AI倫理治理。例如,行業組織可以製定可信AIGC的倫理指南,更好地支持AIGC健康可持續發展;AIGC領域的創新主體需要考慮通過倫理委員會等方式,推進落實AI風險管理、倫理審查評估等,在AIGC應用中實現“倫理嵌入設計”(ethics by design)。
其四,社會各界需要攜手應對AIGC領域的能源消耗問題,推行綠色AI的發展理念,致力於打造綠色可持續、環境友好型的AI模型,實現智能化與低碳化融合發展。
未來已來,讓我們擁抱AIGC,擁抱人工智能的下一個時代,打造更美好的未來。
展開全文打開碳鏈價值APP 查看更多精彩資訊