深度學習三巨頭之一Yann LeCun：大語言模型帶不來AGI

如何讓AI 能夠像人類一樣能真正規劃？

作者：凌梓郡、Li Yuan

當今世界，Yann LeCun 、Geoffrey Hinton 以及Yoshua Bengio 三位科學家並稱為深度學習三巨頭。值得注意的是，三巨頭之中，LeCun 對於AI 發展所持的態度是最為樂觀的。此前在馬斯克提出「人工智能給人類文明帶來了潛在風險」時，LeCun 曾公開反駁，認為人工智能遠未發展到給人類構成威脅的程度。關於AI 接下來該如何發展，在今天上午於北京舉行的2023 智源人工智能大會上，他發表了名為《走向能夠學習、推理和規劃的大模型》的演講，表達了系統的思考。

法國當地時間凌晨四點，LeCun 從法國的家中連線智源大會的北京現場。儘管OpenAI 的GPT 路線風頭正盛，許多人認為大語言模型將通往AGI，LeCun 卻直言不諱：需要放棄生成模型、強化學習方法這樣的主流路線。他認為，基於自監督的語言模型無法獲得關於真實世界的知識。儘管語言生成的內容質量一直提升，但是這些模型在本質上是不可控的。對於語言模型的局限性理解，也基於他此前的一個基本觀點：人類有許多知識是目前無法被語言系統所觸達的。

因此，想讓AI 獲得如人一般對真實世界學習、應對和規劃的能力，他展示了自己在一年前所發表的論文中提出的架構「自主智能」(autonomous intelligence）。這是由一個配置模塊控制整個系統，基於輸入信息，進行預測、推理、決策的架構。其中的「世界模塊」具有估計缺失信息、預測未來外界狀態的能力。

極客公園團隊在智源大會現場觀看了這場演講，以下為核心觀點精彩摘要以及經過編輯的演講內容。

LeCun 核心觀點精彩摘要：

AI 的能力距離人類與動物的能力，還有差距——差距主要體現在邏輯推理和規劃，大模型目前只能「本能反應」。

什麼是自監督學習？自監督學習是捕捉輸入中的依賴關係。訓練系統會捕捉我們看到的部分和我們尚未看到的部分之間的依賴關係。

目前的大模型如果訓練在一萬億個token 或兩萬億個token 的數據上，它們的性能是驚人的。我們很容易被它的流暢性所迷惑。但最終，它們會犯很愚蠢的錯誤。它們會犯事實錯誤、邏輯錯誤、不一致性，它們的推理能力有限，會產生有害內容。由此大模型需要被重新訓練。

如何讓AI 能夠像人類一樣能真正規劃？可以參考人類和動物是如何快速學習的——通過觀察和體驗世界。

Lecun 認為，未來AI 的發展面臨三大挑戰，並由此提出「世界模型（World Model）」。

以下為演講全文的部分摘要：

很抱歉我不能親自到場，已經很久沒有去中國了。

今天我將談一下我眼中的人工智能的未來。我會分享一下AI 在未來十年左右的方向，以及目前的一些初步結果，但還沒有完整的系統。

本質上來說，人類和動物的能力和今天我們看到的AI的能力之間，是有差距的。簡單來說，機器學習和人類動物相比並不特別好。 AI 缺失的不僅僅是學習的能力，還有推理和規劃的能力。

過去幾十年來，我們一直在使用監督學習，這需要太多的標註。強化學習效果不錯，但需要大量的實驗。最近幾年，我們更多使用機器自我監督，但結果是，這些系統在某種程度上是專業化和脆弱的。它們會犯愚蠢的錯誤，它們不會推理和規劃，它們只是快速地反應。

那麼，我們如何讓機器像動物和人類一樣理解世界的運作方式，並預測其行動的後果？是否可以通過無限步驟的推理執行鏈，或者將復雜任務分解為子任務序列來規劃複雜任務？

這是我今天想講的話題。

但在此之前，我想先談一下什麼是自我監督學習？自我監督學習是捕捉輸入中的依賴關係。在最常見的範例中，我們遮蓋輸入的一部分後將其反饋送到機器學習系統中，然後揭曉其餘的輸入——訓練系統會捕捉看到的部分和尚未看到的部分之間的依賴關係。有時是通過預測缺失的部分來完成的，有時不完全預測。

這種方法在自然語言處理的領域取得了驚人的成功（如翻譯、文本分類）。最近大模型的所有成功都是這個想法的一個版本。

同樣成功的是生成式人工智能係統，用於生成圖像、視頻或文本。在文本領域這些系統是自回歸的。自監督學習的訓練方式下，系統預測的不是隨機缺失的單詞，而是僅預測最後一個單詞。系統不斷地預測下一個標記，然後將標記移入輸入中，再預測下一個標記，再將其移入輸入中，不斷重複該過程。這就是自回歸LLM。

這就是我們在過去幾年中看到的流行模型所做的事情：其中一些來自Meta 的同事，包括開源的BlenderBot、Galactica、LLaMA、Stanford 的Alpaca（Lama 基於LLaMA 的微調版）、Google 的LaMDA 、Bard、DeepMind 的Chinchilla，當然還有OpenAI 的ChatGPT 和GPT-4。如果你將這些模型訓練在一萬億個Token 或兩萬億個Token 的數據上，它們的性能是驚人的。但最終，它們會犯很愚蠢的錯誤。它們會犯事實錯誤、邏輯錯誤、不一致性，它們的推理能力有限，會產生有害內容。

因為它們沒有關於基礎現實的知識，它們純粹是在文本上進行訓練的。這些系統在作為寫作輔助工具、幫助程序員編寫代碼方面非常出色。但是它們可能會產出虛構的故事或者製造幻覺。

我同事給我開了一個玩笑。他們說，你知道Yann Lecun（楊立昆）去年發行了一張說唱專輯嗎？我們聽了一下（AI 根據這個想法生成的假專輯），當然這是不真實的，但如果您要求它這樣做，它會這樣做。目前的研究重點是，如何讓這些模型系統能夠調用搜索引擎、計算器、數據庫查詢等這類工具。這被稱為擴展語言模型。

我和我的同事合作撰寫過一篇關於擴展語言模型的論文。我們很容易被它們的流暢性所迷惑，認為它們很聰明，但它們實際上並不那麼聰明。它們非常擅長檢索記憶，但它們沒有任何關於世界運作方式的理解。這種自回歸的生成，存在一種主要缺陷。

如果我們想像所有可能答案的集合，即標記序列的樹（tree），在這個巨大的樹中，有一個小的子樹對應於給定提示的正確答案。因此，如果我們想像任何產生標記的平均概率e 都會將我們帶出正確答案集合的集合，而且產生的錯誤是獨立的，那麼它們可能會看到n 的答案的相似度是（1-e）的n 次方。這意味著會存在一個指數級的發散過程將我們帶出正確答案的樹。這就是自回歸的預測過程造成的。除了使e 盡可能小之外，沒有其他修復方法。

因此，我們必須重新設計系統，使其不會這樣做。這些模型必須重新訓練。

那麼如何讓AI 能夠像人類一樣能真正規劃？我們先來看人類和動物是如何能夠快速學習的。

我們看到嬰兒在生命的前幾個月內掌握了大量關於世界運作方式的基礎概念：如物體永恆性、世界是三維的、有機和無機物體之間的區別、穩定性的概念、自然類別的學習以及重力等非常基本的概念。嬰兒在9 個月左右就能會這些。

根據我同事製作的圖表，如果您向5 個月大的嬰兒展示下面左下角的場景，其中一個小汽車在平台上，你將小汽車從平台上推下來，它似乎漂浮在空中，5 個月大嬰兒不會感到驚訝。但是10 個月大的嬰兒會非常驚訝，因為在此期間，嬰兒已經知道了物體不應該停留在空中，它們應該在重力下下落。這些基本概念是通過觀察世界和體驗世界來習得的。我認為我們應該用機器複製這種通過觀察世界或體驗世界學習世界運作方式的能力。

我們有流利的系統，可以通過法律考試或醫學考試，但我們沒有可以清理餐桌並填滿洗碗機的家庭機器人，對吧？這是任何孩子都可以在幾分鐘內學會的事情。但我們仍然沒有機器可以接近這樣做。

我們顯然在當前擁有的AI 系統中缺少了非常重要的東西。我們遠遠沒有達到人類水平的智能，那麼我們該如何做到這一點？實際上，我已經確定了未來幾年AI 面臨的三個主要挑戰。

首先是學習世界的表徵和預測模型，當然可以採用自我監督的方式進行學習。

其次是學習推理。這對應著心理學家丹尼爾·卡尼曼的系統1 和系統2 的概念。系統1 是與潛意識計算相對應的人類行為或行動，是那些無需思考即可完成的事情；而係統2 則是你有意識地、有目的地運用你的全部思維力去完成的任務。目前，人工智能基本上只能實現系統1 中的功能，而且並不完全；

最後一個挑戰則是如何通過將復雜任務分解成簡單任務，以分層的方式運行來規劃複雜的行動序列。

所以大約一年前，我發布了一篇論文，是關於我認為未來10 年人工智能研究應該走向的願景，你可以去看一下，內容基本上是你們在這個演講中聽到的提議。在我提出的這個系統中，核心是世界模型（World Model）。世界模型可以為系統所用，它可以想像一個場景，基於這樣的場景作為依據，預測行動的結果。因此，整個系統的目的是找出一系列根據其自己的世界模型預測的行動，能夠最小化一系列成本的行動序列。

（編者註：有關Lecun 關於世界模型的論述，感興趣的讀者可以自行搜索Lecun 的這篇論文《A Path Towards Autonomous Machine Intelligence》。）

問答環節Q & A：

提問人：朱軍｜清華大學教授，智源首席科學家

Q：生成式模型通常將輸出定義為多個選擇的概率。當我們應用這些生成模型時，我們通常也希望它們擁有創造力，產生多樣化的結果。這是否意味著這些模型實際上無法避免事實錯誤或邏輯的不一致性呢？即使您擁有平衡的數據，因為在許多情況下，數據會產生衝突的影響，對嗎？您之前提到了輸出的不確定性，您對此有何看法？

A：我認為，通過保留自回歸生成來解決自回歸預測模型生成模型的問題是不可行的。這些系統本質上是不可控的。所以，它們將必須被我提出的那種架構所取代，在推理過程中，你需要讓系統優化某種成本和某些準則。這是使它們可控、可操縱和可規劃的唯一方法。這樣的系統將能夠計劃其回答。

就像我們像現在這樣講話，我們都會計劃講話的過程，怎樣從一個觀點到另一個觀點，怎麼解釋事物，這些都在你的腦海裡。當我們設計演講時，不是一字一句地即興發揮。也許在低層次上，我們在即興發揮，但在高層次上，我們一定是在規劃。所以規劃的必要性是非常明顯的。人類和許多動物都具備規劃能力，我認為這是智能的一項重要特徵。所以我的預測是，在相對短的幾年內，理智的人肯定不會再使用自回歸元素。這些系統將很快被放棄，因為它們是無法修復的。

Q：您之後將參與一個辯論，探討人工智能會不會成為人類生存的威脅。

參會者還有Yoshua Bengio，Max Tegmark 和Melanie Mitchell。您能講講您屆時將闡述什麼觀點嗎？

A：在這場辯論中，Max Tegmark 和Yoshua Bengio 將站在「是」的一邊，認為強大的AI 系統可能對人類構成存在風險。而我和Melanie Mitchell 將站在「否」的一邊。我們的論點不是說沒有風險，而是這些風險雖然存在，但通過謹慎的工程設計可以輕易地加以減輕或抑制。

我對此的論點是，今天問人們是否能夠使超智能係統對人類安全，這個問題無法回答，因為我們還沒有超智能係統。所以，直到你能基本設計出超智能係統，你才能討論如何讓它變得安全。這就好比你在1930 年問一位航空工程師，你能使渦噴發動機安全可靠嗎？工程師會說，什麼是渦噴發動機？因為渦噴發動機在1930 年還沒有被發明出來，對吧？所以，我們處於一種有點尷尬的境地。現在，宣稱我們無法使這些系統安全還為時過早，因為我們還沒有發明出它們。一旦我們發明了它們，或許就是按照我所提出的設計藍圖，再討論如何使它們安全也許是值得的。

展開全文打開碳鏈價值APP 查看更多精彩資訊

深度學習三巨頭之一Yann LeCun：大語言模型帶不來AGI

問答環節Q & A：

策略通過新購買6,220 BTC增強了比特幣的投注

根據XRP軍團的觀點，您需要的XRP才能享受舒適的退休生活

穩定幣突破邊界：解析12國監管政策競賽動態

Bollinger樂隊暗示XRP大幅上漲1,300％的額外提示

隨著ETH和Pengu的上漲，BlockDag預售飆升至3.46億美元

選擇FitForex克隆腳本進行加密交易所開發的理由解析。

美股Profusa簽署1億美元股權信貸協議，啟動比特幣資財庫戰略

專家股份近期目標達到126%的前景分析與展望

深度學習三巨頭之一Yann LeCun：大語言模型帶不來AGI

問答環節Q & A：

Related Posts