OpenAI聯合創始人：自動駕駛和VR都是“歧途” AI智能體才是未來

作者：葛佳明

葛佳明

在黃仁勳和馬斯克接連看到了AI智能體的發展潛力後，OpenAI聯合創始人，特斯拉前人工智能總監Andrej Karpathy也在最近高呼，AI智能體代表著一個瘋狂的未來。

Andrej Karpathy直言，自己在特斯拉的工作時“被自動駕駛分了心”，鑽研自動駕駛和VR都不是發展AI智能體的正確道路。此刻正是回歸神經科學，從中尋求靈感的時刻。

另一方面，Andrej Karpathy認為每個人在構建AI智能體的方面都比OpenAI這樣的公司更有優勢，大家目前處於平等競爭的狀態，因此他很期待看到這方面的成果：

AI智能體代表著一個瘋狂的未來，雖然可能還有點遠，但是今天到場的大家構建的AI智能體已經處於AI智能體能力的最前沿。
現在所有正在做大語言模型的機構，比如OpenAI等，我覺得都沒有處於這個領域的最前，最前沿的是在座的各位。

谷歌旗下AI團隊DeepMind的最新論文介紹了一種能夠進行自我改進的AI智能體——RoboCat，本質上是由AI賦能的軟件程序，相當於機器人的“大腦”。由其加持的機器人與傳統機器人不同之處在於，RoboCat更具“通用性”，並可實現自我改進、自我提升。

具身智能比人形機器人更有價值

具身智能相當於AI的大腦，而這個大腦的載體可以是任何形式。可以是一個機械臂，一隻機器狗，更或者是一輛小汽車。

而反觀人形機器人，當下為何被看做是一個不太智能鋼鐵巨人，核心還是因為缺少AI大腦+不太靈活的軀體。

簡單來說，類似GPT-4這樣的大模型，對物理世界並不能真的產生影響，而具身智能則多了一個身體，通過傳感器收集環境信息，利用機械執行器進行物理操作，或者通過機器人等具體實體與人類和環境進行實時互動。

馬斯克曾說，雖然未來有一天人人可能會擁有一個人形機器人，但是目前展現的Optimus人形機器人產品也就只能執行重複性的簡單勞動。

具身智能的目標是使機器能夠更好地理解和適應複雜的環境，更高效地解決問題，並具備更靈活的行為能力。通過融合感知、決策和執行的過程，具身智能使機器能夠更接近人類智能的表現，從而在機器人技術、自動駕駛、智能製造等領域發揮重要作用。

Karpathy直言，在7年前，研究AI智能體的時機還不成熟，因技術所限做出來的效果不好，於是他和OpenAI就改變了方向，開始研究大語言模型。

而現在有了全新的技術手段來研究AI智能體，情況和2016年完全不同了：

最簡單的例子就是，現在沒有人再像2016年那樣用強化學習的方法來研究AI智能體了。現在的研究方法和方向在當年是不可想像的。

AI下一個浪潮？

大語言模型的出現，給構建具身智能體帶來了全新的可能性。因為基於LLM的智能體可以利用預訓練模型中蘊含的世界知識，生成一致的行動計劃或可執行策略，這就非常適合應用於遊戲和機器人之類的任務。

DeepMind的RoboCat只是AI賦能機器人的主要案例之一。

今年以來，已經有數家公司將語言模型運用到了機器人上：2023年年初，谷歌推出視覺語言模型PaLM-E，並運用到工業機器人上；4月，阿里巴巴將千問大模型接入工業機器人；5月，特斯拉人形機器人Optimus展示了精準的控制、感知能力，同月，英偉達發布全新自主移動機器人平台。

得益於此，人工智能加持的機器人化身俱身智能吸引了全球的廣泛關注。

馬斯克在特斯拉2023年股東大會上便表示，人形機器人將是今後特斯拉主要的長期價值來源：

“如果人形機器人和人的比例是2比1左右，那麼人們對機器人的需求量可能是100億乃至200億個，遠超電動車的數量”。

英偉達創始人黃仁勳在ITF World 2023半導體大會上也表示，AI下一個浪潮將是“具身智能”。華爾街見聞此前指出，國盛證券分析師認為，具身智能有著物理反饋、物理輸出的特性，可以成為成為通信、計算和存儲的新載體：

未來具身智能將會越來越強調邊緣通信能力與邊緣算力的匹配和耦合。

AI的軀體其實並非是最重要的，核心應該是發展AI大腦，打通人機交互方式，讓AI能夠主動感知物理世界，擬人化的思維路徑才能做到人類期待的行為反饋。機器視覺和多模態大模型正是開啟這個世界的兩把鑰匙。

資訊來源：由0x資訊編譯自8BTC。版權歸作者所有，未經許可，不得轉載