2022年,從引爆AI作畫領域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT為代表的接近人類水平的對話機器人,AIGC不斷刷爆網絡,其強大的內容生成能力給人們帶來了巨大的震撼。
當AIGC成為社會各界關注的熱點時,人們不禁發問,AI會成為新的造物者嗎? AIGC為什麼突然爆發,是否標誌著AI正迎來下一個時代,又會如何走向?兼具大模型和多模態模型的AIGC模型是否會成為新的技術平台? AIGC技術和應用將給經濟社會帶來哪些影響,不同主體應如何看待與應對?
2023年1月9日,騰訊研究院舉辦《AIGC:AI新浪潮之下的趨勢與展望》專題論壇,具體討論了“AIGC”這一前沿科技趨勢的技術現狀和產業實踐,發展機遇與未來挑戰等問題。我們將會議實錄刊發在這裡,供各領域思想者參考。
研討嘉賓:
姚 新南方科技大學計算機科學與工程系講席教授、系主任
段偉文中國社會科學院哲學所科技哲學研究室主任
王蘊韜中國信息通信研究院雲計算與大數據研究所副總工程師
吳保元 香港中文大學(深圳)數據科學學院副教授
殷 俊 騰訊遊戲CROS研發效能部數字內容技術中心總監
史樹明 騰訊AI Lab自然語言處理中心總監、文湧產品負責人
主持人:
楊 健騰訊集團副總裁、騰訊研究院總顧問
AIGC的蓄力與爆發
楊健(主持人):如何看待AIGC在2022年下半年這一時間節點突然爆發? AIGC是否代表著AI技術的下一個時代?
姚新:AIGC的爆發實際上是一個綜合性的成功。 AI雖然在內容生成方面有很長的歷史,但過去因為數據、算力和算法技術等限制,一直沒有發展到現在這個程度。現在大家對AIGC產生濃厚興趣的一個重要因素是它超出了人們的預想,所以大家就覺得這東西特別有意思。但是仍需思考AIGC在技術上究竟有什麼樣的突破。
第一,在技術上,達到超出人們預想的效果相對比較容易。比如在圖像、對話,甚至在音樂方面,它可以生成具有某個作曲家風格,但又是不完全一樣的曲子。但是很多人認為AIGC可能是一個通向AGI的有效路徑,其實是值得慎重思考的。因為現在AIGC生成內容是靠著大量的數據和算力堆出來的。而人在生成內容的時候,有時候是通過一個抽象的過程,比如我看了很多圖像,腦子裡面是有個抽象過程,然後從抽象過程再回到圖像的空間,最後來創造生成一個圖像。我還不是太清楚現在AIGC有沒有這種抽象的層次在裡面。你看了100萬幅貓和狗的圖像,機器是不會自己生成一個概念,如4條腿、有毛等。
第二,未來AIGC進一步發展,涉及到科學技術領域,或者真正關係到國計民生的應用領域,可能會有額外的挑戰。因為AIGC生成內容難以保證保證它生成的內容滿足一定約束條件。打一個比喻,我們現在可以把很多分子送到AI系統裡面,它或許給你生成新的分子。從生成分子到生成藥物是可以想像的,但是真正到最後落地,它的距離會在什麼地方?真正要達到所謂的AGI的距離在什麼地方?這是需要我們思考和探索的。
殷俊:首先,我跟姚老師的觀點非常一致,無論從廣義的基於人工智能做內容生成這件事情,還是比較狹義的做深層次大模型,其實都是厚積薄發,已經有了比較長的研究歷史。 AIGC到今天爆發是多方面的,一方面的確積累了非常大量的數據集,而且是公開高質量數據集;一方面是一些理論上的突破,比如以擴散(Diffusion)模型為代表;還有就是新的計算硬件,從2020年開始以GBT3為代表,模型堆得足夠大,效果也足夠好,以前可能並沒有這麼強的計算設備來支持這種規模的模型訓練,即使到現在這個模型訓練成本還是非常高的。幾方面因素疊加,導致大家覺得以前可能比如說生成圖片或者是生成文本是一個不太現實的一個東西,現在好像離我們很近了,我覺得今年AIGC爆發是這麼一個狀態。
目前AIGC的發展跟最早期的深度神經網絡相比,並沒有從範式上產生一個根本性的變化。我們不能從ChatGPT對話生成效果好、表現的很智能,就得出它真的是產生了通用智能的結論,因為它並不能真正知道它自己在說什麼,只是給人們一種它已經理解其所生成內容的感覺而已,這跟人類智能還是有一定距離。
我認為AI的下一個時代,需要往幾個重要的方向發展。一方面是它可以自主學習,它本身的一些推理邏輯要跟我們人一樣要可解釋或者可理解,真的能夠做到跨領域等。另一方面就是從產業落地的角度來看,比如用人工智能的方法去輔助做遊戲裡面的內容生成,但是現在無論是AIGC生成圖片、文本生成3D模型、去生成遊戲裡面的角色動畫,或者是我們用ChatGPT來做遊戲劇本或NPC對話等,其實離現在遊戲的專業規範性還是有一定的距離的。
楊健(主持人):謝謝兩位老師的觀點,總的來講就是現在AIGC爆發可能還是在量變到質變的邊緣,很難說它真正的完成了質變。它還在過去的範式基礎之上,只是因為其他的技術條件進步了。但是AIGC到底是不是符合人類智能或者說是將來通用人工智能的真正的內在規律,現在還無法確定,可能還要根據後續的發展才能更好地判斷。
楊健(主持人):AIGC的技術現狀和產業實踐如何,有哪些代表性的應用和方向?
王蘊韜:首先從目前AIGC產業界的實踐來看,AIGC的技術分類按照處理的模態來看,大概可以分成是文本類、音頻類、圖像視頻類和虛擬空間類等:(1)文本類,主要包括文章生成、文本風格轉換、問答對話等生成或者編輯文本內容的AIGC技術,典型應用包括寫稿機器人、聊天機器人等;(2)音頻類,包括了文本轉音頻、語音轉換,語音屬性編輯等生成或者編輯語音內容的,以及音樂合成、場景聲編輯等生成或者編輯的非語音內容的,典型應用就是智能配音主播、虛擬歌手演唱、自動配樂、歌曲生成等;(3)圖像視頻,包括了人臉生成、人臉替換、人物屬性編輯、人臉操控、姿態操控等生成或者編輯圖像、視頻內容,圖像生成、圖像增強、圖像修復等技術都是相關聯的,典型應用包括美顏換臉、捏臉、復刻或者是修改圖像風格,AI繪畫等;(4)虛擬空間類。主要包括了三維重建、數字仿真等生成或者是編輯數字人物、虛擬場景相關的,典型應用包括元宇宙、數字孿生、遊戲引擎、3D建模、VR等。
從AIGC應用來看,目前在提供更加豐富多元、動態、可交互的內容有很大優勢,在傳媒、電商、影視、娛樂等數字文化程度比較高、內容需求豐富的行業,已經取得了一些比較重大的創新發展。比較具有代表性的包括AIGC+傳媒,主要是在人機協同生產來推動媒體融合,這其中寫稿機器人生成一篇深度報告的時間,已經由最初的30秒縮短到了兩秒以內;還有AIGC+電商,比較核心的是生成商品3D模型,把它用於商品展示和虛擬試用,提升線上購物體驗。還有虛擬數字人打造虛擬主播,賦能直播帶貨;另外一塊就是AIGC+影視,主要是來拓展影視創作空間,提升作品質量。目前已經有產品在為劇本創作提供新的思路,比如小說選劇本的智能寫作服務,其中包括《你好,李煥英》、《流浪地球》等。還有AIGC賦能影視剪輯、後期製作的升級服務,包括《厲害了我的國》、《馬路天使》等多部影視劇都用到了基於AI的圖像處理服務;AIGC+娛樂,主要是趣味性圖像、音視頻生成等。那麼同時目前的話也是有這種開發這種C端應用的這種數字化身來佈局相關元宇宙的相關的應用案例,這塊可能大家還是見得比較多的。此外,AIGC在醫療、工業領域也有一些實踐,但可能還僅僅是用在虛擬交互方面,對於深入行業、覆蓋行業業務邏輯方面,還在探索中。
史樹明:從整體技術進展來看,AIGC確實進展非常大。 5年前,AIGC領域也只有文本生成語音(TTS)被認為是可用的。 3年前,如果說AI根據文本來生成圖片,生成的圖片質量過關、相關度也比較高,人們是難以想像的。但是現在這些都已經變成現實了。此外,以前文本生成大多是基於模板,這種模式的通用性就非常差,只適用於非常狹窄的領域。現在隨著大模型的出現,以及語言模型本身也在進步,所以AIGC讓人印象深刻。不管是Stable Diffusion,還是ChatGPT,讓人很驚嘆於它們強大的文本理解和內容生成能力。
當然中國在AIGC發展中確實是還需要再努力。絕大多數工作都是美國的少數研究機構完成的,它們引領了整個AI技術的發展。所以我們也要努力,也要爭取在AI發展史上能夠有更多的貢獻。
商業化應用方面,目前主要能看到的一個顯著方向是輔助人來,如AI輔助創作,AIGC充當輔助的角色。 AIGC如果自己獨立生成很多圖片不一定有意義。但當人有需要的時候,AIGC可以根據一些Prompt,也就是輸入一些提示詞及其組合,經過不停的測試、交互之後,最終能夠產生精美的圖片,並應用在具體的工作或者生活中。 AIGC確實能夠輔助大多數很不擅長畫圖的人去創作。文本生成也是一樣,比如在AIGC的輔助之下,我們進行文本續寫、文本改寫的效率會更高,它也能夠啟發我們的思路。因此客觀上AIGC提升了我們這種勞動生產效率,工作效率。從商業化應用來看,最直接的就是AI輔助創作,其他方面還需要進一步挖掘。當然,有人問ChatGPT是不是能夠取代搜索引擎,但是現在看來可能性還不大,它只是可能完成搜索引擎中的一部分功能,但還不能取代。
總結一下,第一,技術進展非常快,超出預期;第二,商業化有很多的想像空間,但是目前我們似乎還沒有挖掘到最關鍵的東西。
楊健(主持人):雖然AIGC還在探索階段,但是我覺得已經很讓人心馳神往了。以前學設計、美術的都是要從素描開始學起,現在這些技法隨著AI技術輔助好像變得越來越沒有用武之地了,所以可能更需要人在創意方面的一些突破,這也是涉及到技術裡面的術和道的關係問題。
AIGC價值引領
楊健(主持人):我們回歸到價值層面上來看,AIGC為什麼會這麼重要?它到底有什麼樣的價值和意義?它能夠在哪些領域引髮變革,除了物質層面,從精神層面價值層面能夠帶來一些什麼樣的更多的衝擊和變化?
段偉文:我主要從4個方面來談:
第一,AIGC帶來一種全新的內容創作,但是其實它還應該是一種全新的認知方式。現在讓AIGC生成內容時,個人的Idea變得更重要了。
第二,AIGC是一種全新的學習和研究工具,因為它賦予了每個個體更高層次的創作能力。比方說最近有爭議的是,很多本科生的論文已經可以用AIGC寫出來了,大家認為這個是作弊。其實我們仔細去看現在大多數的本科生論文,它確實也就是這抄一段那兒抄一段,只不過他會抄的比較好,他歸納的比較合理。但實際上如果運用AIGC這樣一個技術,它就能夠讓你比較輕鬆的完成文獻蒐集和處理的工作,提升學習效率。在研究工作中,AIGC的應用或許能夠常規化的,成為人機認知的協同過程中的有利工具。
第三,會涉及到元宇宙,也就是可能世界的創造。 AI繪畫實際上是把各種可能性都結合在一塊,類似於克里普克的可能世界理論。那麼在以往的時候,個人大腦調用這些可能的數據資源的能力是非常有限的。而有了AIGC以後,它就可以完全是按照你的想像來進行組合,成為一種可能世界的製造機器。所以這樣來看,元宇宙的視野就更開闊了,而是我們完全可以把人類所有的精神財富、思想創造,還有文化遺產等,經過組合方式,再加上人的靈感選擇去進行創造。
第四,AIGC有一些有意思的應用,一個是可以用來防止孤獨症。現在有很多人社交恐懼,所以他可以搞一個自己的數字人,然後自己跟自己聊天。還有一個藝術家用她小時候的日記去訓練AI,最後實現了與小時候的自己對話,她就能夠了解她在青少年時期擔心憂慮什麼,達到心理治療的作用。因此,我覺得AIGC還有在精神的自我認知、自我療愈發揮作用,甚至最後AIGC它會成為我們的好伴侶、好陪伴,能夠讓我們通過AI來自助來獲得新生,來產生更大的精神力量。
殷俊:我認為AIGC對於整個包括元宇宙的虛擬內容生產來說,它可以把內容生產的門檻給降得很低。比如AI生成的太空歌劇院主題的畫作拿了第一名。人們擁有AIGC之後看到一個新的可能性,是不是以後就變成了大眾創作,只需要有一個好的Idea就可以去創作了。比如用ChatGPT把一整套劇本按照我的思路演繹出來。回到元宇宙這個話題,以往生產工具跟生產方式可能不能滿足元宇宙的海量內容的生產需求。但是現在AIGC讓大家覺得它可能是下一代生產工具。
楊健(主持人):剛才段老師、殷老師更多的是從人類怎樣去來提升自己、突破自己,利用新技術來實現這個目標的過程。但是不免的可能也會有另外的一面,它有可能對我們既有的生存方式、生活方式、以及生產方式有比較大的衝擊,我們怎麼樣來消化這些可能的變化和衝突呢?
王蘊韜:我們接觸產業界比較多一些,我第一次看到AIGC的時候,腦海中想到的第一個詞是“超算”。 AIGC很有可能會對我們目前已有的計算體系,包括計算系統,會提出新的挑戰。其實我們真正在用一套計算系統,去把異構的AI系統做一個很好地並行部署時,會發現有很多的計算裝置、數據儲備、軟硬件協同的不足之處。對於這些不足之處,可能都是需要我們去迎接的這麼一個挑戰。
另外從應用來看,AIGC對傳統行業的最大挑戰,是內容科技的挑戰。其實就是整個內容的創造已經從平台的中心化創造,越來越走向分散式的用戶創造,那麼AI技術在這個過程中也是越來越起到了一種顛覆性的作用。無論是內容生成,還是內容傳播、內容審核? AI的顛覆性作用是越來越強。
這裡其實一個最核心的就是元宇宙,它一定是充滿了各種內容的試驗場。元宇宙與傳統遊戲不同的是,元宇宙似乎沒有一個大家需要實現或完成的目標,這就意味著元宇宙來說這個遊戲一定要不停的持續下去。那麼如何才能在元宇宙場景下打造一個無限持續的遊戲規則呢? AIGC就會有一個非常重要的作用,輔助人類在未來元宇宙的內容體系設計時,實現無限的滾動下去。
建立可信AIGC
楊健(主持人):AIGC現在有哪些潛在挑戰?這些挑戰分為兩個層面,一個是技術和產業層面的難點有哪些,另一個是它可能會帶來哪些法律和倫理和社會方面的問題,我們應該怎麼樣去應對?
吳保元:首先,最近ChatGPT很火熱,但是人們也發現它會帶來很多的負面問題。最典型的就是它產生虛假信息、錯誤信息,它會產生一堆看似正確但又是錯的內容。但是如果對這些挑戰過於關注,就會對技術的發展多多少少產生限制。比如學術界在研究Deepfake的時候,做生成攻擊的需要做倫理影響和技術潛在風險的聲明,而做防禦檢測則不需要,導致大家更傾向於做防禦檢測方面的研究。但是攻擊技術往往會啟發防禦技術。其次,在數字經濟中,AIGC可以作為數據產生的工具,可以保護隱私、大幅度降低數據採集的成本、創造新的數據。總結來看,AIGC帶來的社會問題以及它本身面臨挑戰,還有它需要更多的應用場景去驅動其正面發展。
段偉文:AIGC的法律、倫理和社會問題在很多討論裡面已經有了,比如在藝術創作裡,已經有藝術家提出來版權問題。過去在搜索引擎、平台經濟時期,我們實際上是在把世界變成數據,即世界數據化,相應的隱私、倫理法律問題也在不斷深化和治理中。那麼,進入到AIGC技術階段後,就是在世界數據化的基礎上進行生成,也就是二階的世界數據化時代。那麼,它的法律和倫理問題,應該是跟以前存在不一樣的地方,因此我們需要有一些新的社會契約和共識,也就是哪些行為我們是可以接受的,哪些行為是不可以接受的。
AIGC生成內容如果從知識生產的一般意義上來講,它生成的內容是在世界數據化之上,生產的新內容。這就好比歐幾里得發明了歐式幾何,歐式幾何是原來世界上沒有的,世界上原來只有測量,它是在測量基礎上發展而來。那麼現在AIGC也是這樣的,它是一種新的認知或知識生產的新形態。所以在這種新形態下,我覺得在法律倫理治理方面,要給予AIGC一個創新的保護空間。為什麼要講創新的保護空間,它不僅僅是保護你的經濟利益,而是只有技術為社會所接受,而且技術從一開始就重視倫理法律問題,才能夠行穩致遠。所以監管者、管理者和法律倫理的學者,以及產業界應該是協同的,一起來構建一個可預期的治理模式,通過法律和倫理上的探索,能夠讓AIGC有更好的發展。舉個例子,現在經常說數據毒性,它其實就是現實生活中的毒性。這有兩面,第一面是通過AIGC能夠暴露出來數據毒性,社會中的一些偏見歧視等,反過來可以淨化我們的社會生活。但是這種淨化不可能是絕對的淨化,因為絕對淨化其實又違背了我們現代人生活的一些最基本的初衷。因為關於什麼東西是乾淨的或不干淨的,沒有一個絕對的標準。最後還是有一個大家要共同接受的過程。所以在這種情況下,我們要認識到事物的複雜性,只有認識到這樣一個複雜性,才能夠開拓前進。在開拓過程中,我們就能夠知道哪些東西是可以接受的,哪些東西是現在還不能接受的。
在我看來,法律、倫理和社會問題要納入到AIGC帶來新的認知範式背景下,新的認知方式對整個社會的法律倫理等方面的動態衝擊,以及我們如何動態的應對。
楊健(主持人):很多時候技術問題確實是一個度的把握問題。 AIGC作為新技術,要在法律倫理上給予一定的約束,但是又不能抑制它的發展。那麼,未來怎麼樣能夠安全、可信、負責任地發展應用AIGC就變得非常的重要,我們在這些方面應該具備什麼條件才能夠把它做好?
姚新:我覺得從內容生成來說,安全、可信和負責任發展的確稍微落後了一點。第一個問題是,現在大部分數據來源於互聯網,互聯網中有不小比例的數據是錯誤或者是不准確的,但這些數據用於訓練AI大模型,然後用AI大模型生成新的數據,最後這些生成的數據也會被新一代的AI大模型用來訓練。所以可以想像,就像做計算的時候誤差會疊加,有一些錯誤在大模型中會被固化,一旦固化了以後就比較難解決。
第二個問題是,AIGC如果真正有一些工業應用,或者應用跟人相關的比較密切,安全性和可信性問題應該在哪一個階段考慮?不可能是在AI生成以後,再去找辦法來判斷它是否安全、可行。肯定是在整個模型的建立和訓練過程中都要考慮。
第三個問題是,比如有一些學生寫畢業論文也是這裡抄一下,那邊抄一點,沒准他最後寫的還不如ChatGPT,那麼為啥不讓他用這個工具?這裡有一個比較深層次的問題。教育應該教學生什麼?應該怎麼教學生?這是挺重要的問題。因為依賴某一個AI大模型去生成知識,會不會損失產生知識的多樣性,假如失去了產生知識的多樣性,會對我這個社會有什麼影響?這都是AIGC發展之初應該考慮的,否則就有可能走推薦系統老路,好像咱們的世界視野被一個個推薦系統封閉了,將來會不會被一個大模型給封閉住。
楊健(主持人):謝謝姚老師。姚老師提的三個問題都是非常重要的。首先是數據源頭污染的問題,這個問題進入到整個內容基因裡是非常可怕的;第二是對技術的干預到底是在什麼樣的階段,要以一個什麼樣的度來把握;第三是AI大模型會不會從人類助手變成人類的一個桎梏,成為約束人類的牢籠。
吳保元:我從自身研究的可信AI領域來探討一下。可信AI的定義已經很明確了,魯棒性、公平性、隱私和可解釋性等。然而這些僅限於此前判別式、決策式AI,AIGC的相關研究還比較少。第一,如同姚老師所言,AIGC的安全問題更可能是在源頭上製造的,危害可能更大。所以針對AIGC的可信問題,除了以前的老問題,還應該關注新的挑戰,比如版權問題、責任追溯問題等。因此,需要先把它的問題定義清楚,後面技術解決方案可以進一步探討。
第二,AIGC有個特點是它的危害性好像不那麼直接,即AIGC的衍生問題,作為技術人員而言,他可能想不到那麼清楚,所以AIGC治理需要更多的交叉學科更早的參與進來,共同把問題定義清楚,從源頭上去管控它,這樣有助於AIGC健康發展。
AIGC 未來可期
楊健(主持人):對AIGC和人工智能領域的未來發展有何期待和展望?它對人類社會的未來影響可能會是怎樣的?
殷俊:整個AIGC,以及未來人工智能技術,一定會給我們現有的生產工具跟生產力帶來一個根本性變革。這些變革一定會引起生產關係的變化,這可能會對人類未來以及社會產生比較大的影響。
王蘊韜:AIGC可能對於未來數字原生世界而言是一個重大的機遇,同時也是一個全新挑戰。相對於物理世界的數字化轉型來說,未來數字原生世界很有可能就是元宇宙世界,人類可以憑空創造出很多新應用、新業態、新商業模式,而AIGC是不可缺少的一環。
那麼它也存在著很多挑戰,包括對傳統經濟理論的挑戰,也就是AIGC可能改變未來人類生產生活的成本結構,未來智慧能力的成本會下降很多,也就是對智慧使用的邊際收益會增長很多,因此人類會面臨一個更加複雜、更加多元的新世界。
姚新:第一,應該擁抱AIGC技術,這是毫無疑問的。第二,在擁抱AIGC的過程中一定要明確它潛在的挑戰,當然也不是一定要解決這些挑戰才可以推廣AIGC應用。
史樹明:第一,我相信AIGC和整個人工智能技術還會持續高速發展;第二,我很期待這種發展會有利於提升整個人類的生活品質,讓我們的生活更加舒適便捷。
段偉文:AIGC主要是帶來了一種內容生產自動化,那麼這種自動化實際上會徹底改變人和機器的認知協同過程。它真正的挑戰是,AIGC作為一個內容生產或者知識生產的引擎,我們有沒有在內容本身上做好準備,包括法律和倫理規則等。
吳保元:AIGC對於人工智能而言,應該是又一波熱潮。這裡也有一個潛在影響,就是目前人工智能教學和教材需要大幅度的更新修改。以往我們的教學重點是在判別式網絡,但現在可能需要增加生成式AI方面的內容。
楊健(主持人):感謝各位嘉賓的精彩分享!可以說我們正是在經歷著這麼一場AIGC引領的生成大浪潮,它不只是科技行業的進展,也是整個社會都要面對的一個趨勢,我們要用更加開放的心態去認知它,用樂觀而且謹慎的態度去接受它,可能這樣才能夠看清,並且受益於這個浪潮。