GPT-4竟然有身體，167cm清華、北師大重磅研究：ChatGPT能像人一樣感知行動

來源：新智元

ChatGPT眼裡的世界，和人類感知的世界是一樣的嗎？

ChatGPT的語言能力確實很驚艷，但大語言模型在沒有人類身體、且缺乏實踐經驗的情況下，是否能像人類一樣感知到真實世界呢？

最近，來自清華大學、北京師範大學的研究人員就對ChatGPT感知世界的能力進行了測試。

研究發現，基於物體可供性（affordance），即物體能夠提供給生物體的所有可能動作，人類受試者可以將世界中不同大小物體分成兩類，而劃分這兩類的標準恰好是以其身體尺寸為界的。

有趣的是，ChatGPT，一個缺乏實際身體的大型語言模型，也能在物體-動作聯繫上表現出類似的可供性邊界，並且與人類的身體大小相吻合。

也就是說，ChatGPT可以通過語言學習到關於世界中物體的表徵

論文鏈接：https://www.biorxiv.org/content/10.1101/2023.03.20.533336v3

總而言之，這項研究促進了對身體尺寸在塑造物體表徵方面的作用的理解，強調了具身認知在理解智能如何湧現上的作用與方向。

讀萬成交量書，不如行萬里路

我們的身體不僅僅是我們思維的容器，它同樣也是思維本身——借助身體，我們得以與世界中的物體進行互動，從而去感知整個世界。

想像一下，對於一個手掌大小的圓柱體容器來說，我們可以拿來裝水喝，這個容器被稱為「杯子」；但當這個容器逐漸變大，到身體大小，我們就可以坐在裡面泡澡，相應的，這個容器就變成了「浴缸」。

在這個例子中，物體的形狀一樣，但是因為它們相對於我們身體的大小不同，我們對它們的認知與交互方式也不同。

進一步，這種交互方式可以被改變——假如我們變成了《格列佛遊記》中的巨人，原本的「浴缸」可能對於巨人的我們來講，則又變成了一個「杯子」。

這種按照自我參照意向下運行的感覺與運動功能係統，被稱之為「身體圖式」。我們通過身體圖式來實現認知的具身性。

古希臘哲學家普羅泰戈拉曾說：「人是萬物的尺度。」也就是說，我們的身體就是一把度量萬事萬物的尺子。

古羅馬哲學家進一步解釋到：「自然將我們置於Cosmos的中心，使我們能用目光掠過Cosmos。她不僅把人創造成直立姿態，而且為了使人適合靜觀她自身，又把人的頭顱置於身體頂部，安放在一個容易彎轉的脖子上，以使其能夠追尋眾星的升落，隨著整個旋轉的天空而改變面部方向。」也就是說，我們的身體之所以長成如此，是因為Cosmos就是如此。

身體圖式在正常社交中也有著重要的作用，這就是人機交互、用戶體驗的核心。比如唐納德·A·諾曼在《The Design of Everyday Things（譯為：設計心理學）》中所述的可供性（affordance）的用途。

通過考慮用戶的身體圖式和行為期望，設計師可以創造出更符合用戶認知和互動習慣的產品和環境。

這種關注身體圖式和可供性的設計方法能夠提高產品的易用性，使用戶能夠自然而然地與之互動，並實現更好的用戶體驗。

而這也是蘋果公司的立身之本之一。

ChatGPT：我身高167.6

閃現通用人工智能火花的以ChatGPT為代表的大語言模型，顯然是具有與人類似的智慧，但是承載這些智慧的，是沒有形體的一段段代碼。

傳統的認知科學觀點認為，身體圖式是建立在我們所具有的對自己的身體長期的知覺體驗之上的，只能來源於外部的「真實交互」，即「行萬里路」。也就是說，ChatGPT不會有身體的圖式。

但是，當我們去問只「讀萬成交量書」語言模型，ChatGPT（GPT-4），它是否有身體時，它回答說：「It could be the size of an average adult human, around 5 feet 6 inches (167.6 cm) tall. This would allow me to interact with the world and people in a familiar way.」