AI的世界正以驚人的速度躍進,創造著一個全新的智慧時代。
2024春節人工智慧話題瘋狂發酵。美國OpenAI公司正式發布其首個文字-影片生成模型Sora,能夠根據文字指令創造出既逼真又充滿想像力的場景,微軟憑藉OpenAI翻身市值超過3.1萬億美元,超越蘋果成為全球市值最高公司。
隨後,美國科技巨頭Google(Google)宣布推出全球效能最強大、輕量級的開源模型系列Gemma,效能遠超主流開源模式Llama 和Mistral,直接登頂Hugging Face開源大機型排行榜。
在人工智慧BCI方面,馬斯克宣稱首個植入Neuralink大腦晶片的人類已經完全康復,患者僅用意念就可以控制滑鼠,開創的腦機介面新時代。
英偉達發布了2023年四季財務報告顯示,英偉達去年四季營收221億美元,超各項數據均顯著超出市場預期。技術創新催化下,全球人工智慧概念股近期大漲,多股獲機構紮堆關注。高盛預測2025年全球人工智慧投資將成長至1,584億美元,這只是冰山一角,根據最新的人工智慧統計數據,截至 2023 年,全球人工智慧市場規模估計為4,541.2 億美元。以每年 19% 的成長率,到2032 年人工智慧市場價值可能超過2.5 兆美元。
我們可以確定,這個社會最終是要走向人工智慧,那麼人工智慧下一步將會走向哪裡?
人工智慧和加速運算正在共同改變科技產業。下一波人工智慧浪潮將是一種被稱為具身AI的新型人工智慧,即能夠理解、推理並與物理世界互動的智慧系統。英偉達創辦人CEO黃仁勳指出了方向。
在探索智能與現實的交融上,WorldBrain堅持長期研究,建立技術儲備,並取得突破新發展。 WorldBrain是目前唯一將具身智慧概念融入Crypto的卓越創新專案。透過模仿人腦建模的大型智慧神經網路系統,WorldBrain將智慧引入特定的物體和機器中,賦予它們感知、理解和互動的能力。它的獨特之處在於將智慧從虛擬世界引向現實,探索智慧與現實的交融之道。
具身智能的由來
具身智能的想法萌芽於人工智慧誕生之初。
具身智能(Embodied Intelligence)這個概念,最早由人工智慧之父圖靈(Alan Mathison Turing)於1948年提出,embodied即人體的,intelligence即智能,結合在一起即具身的、離不開人體的智能。同時,圖靈也提出了另一個與其相對的概念Disembodied Intelligence,即體外智慧、離開人體的智慧。
1950年,圖靈在其開創新論文《Computing Machinery and Intelligence》中,提出人工智慧可能的兩條發展路徑:一條路是聚焦抽象計算(例如下棋)所需的智能,另一條路則是為機器配備最好的感測器,賦予它們與人類溝通的能力,並像嬰兒一樣學習的能力。這兩條道路逐漸演變成了非具身智能和具身智能。
什麼是具身智能?
具身智能(Embodied Artificial Intelligence,Embodied Intelligence,Embodied AI,簡稱:EAI),又稱“具身AI”“具身人工智能”,指一種基於物理身體進行感知和行動的智能係統,其通過智能體(可以是生物或機械)與環境的互動獲取資訊、理解問題、做出決策並實現行動,從而產生智慧行為和適應性。
具身智能可以簡要地理解為透過創建軟硬體結合的智能體,強調有物理身體的智能體透過與物理環境互動而獲得智慧的人工智慧研究範式。我們拆分來看:一是“具身”,二是“智能”。具身的基本意義是指認知對身體的依賴性,即身體對於認知有影響。認知不能脫離身體單獨存在。此外,「具身」相對的概念是「離身」(Disembodiment),指的是認知與身體解耦。人工智慧學科領域對智慧的理解多偏人的抽象、邏輯能力及適應性能力。
探索AI新維度 WorldBrain的具身智能新視角
具身智能是相對於傳統的抽象化的人工智慧,是一種能夠感知並互動自身環境並具有自我感知能力的智慧形態。具身智能可以以多種形式存在,如機器人、自動駕駛等。它們不僅能理解環境中的信息,還能以更高層次從複雜的環境中獲取並處理信息。
WorldBrain是基於WorldModel世界模型創造出一個前所未有的分散式智慧神經網路系統,透過模擬人腦的運作機制和思考過程,以便更好地理解人工智慧和認知科學之間的連結。它是未來實現「強人工智慧」的重要組成部分,透過採用複雜的運算模型,包括神經元網路的建模、資訊處理、學習和決策等,有助於深入研究人類認知的基本原理,為AI系統提供更有效的靈感。
WorldBrain為人類帶來了更智慧、更有效率的資訊處理方式,為未來的數位社會建構起一個全新的智慧生態系統。
首先,具身智能可以理解並回應自己的環境。這是透過先進的感知技術,例如視覺感測器、語音辨識系統或觸覺感測器,使得具身智慧能夠獲取環境中的資訊。 WorldBrain借鑒大腦地圖和參考系的機制,透過感知輸入(例如視覺和位置感測器數據透過使用人腦中的地圖和參考係作為學習世界模型的基礎,獲得更準確的空間感知和環境理解能力。這將使得WorldBrain 能夠更好地與物理世界進行交互,並實現更高級的認知和智慧功能。
其次,具身智能能透過機器學習自我改善並學習新的技能。這透過大數據和深度學習技術,使得具身智慧不僅僅是一個靜態的系統,而是一個不斷改善和學習的動態系統。 WorldBrain 可以以無監督的方式快速訓練,以學習環境的壓縮空間和時間表示。透過使用從世界模型中提取的特徵作為代理的輸入,可以訓練一個非常緊湊和簡單的策略來解決所需的任務。
最後,具身智慧能夠和使用者進行自然交互,理解並處理複雜的任務。人機互動上升到新的高度。不同於當前火熱的大語言模型多模態多為文字、圖片、音頻、視頻等之間的交互,具身智能重要表現是多模態+跨模態感知交互,尤其是視覺、語言和肢體行為的跨模態感知;這不僅需要人工智慧,還需要人機互動、自然語言處理等多種技術。 WorldBrain 可以透過知覺和行為模擬來模仿人類的認知能力和行為表現,透過運動和身體表徵模擬來模仿人類的運動能力和身體表達,使得 WorldBrain 能夠像人類一樣進行複雜的操作和互動現。
具身智能是產生超級人工智慧的一條可能路徑。
具身智慧是人工智慧的新前沿,是感知、理解、學習和適應等更高層次智慧進化的關鍵一步。
《智源人工智慧前沿報告》(2021-2022年度)指出:未來三年,基於虛擬世界、即時時空環境訓練的具身模型會取得較大的發展,如自動駕駛、機器人、遊戲中數位人等······未來五到十年,超大規模預訓練模型(資訊模型)和具身模型將會結合,成為’數位超人’,在知識能力以及跟環境的互動程度上,將比以往的人類都要強,具身模型和機器人也將結合,在物理世界出現能力比人類還要強的無人系統,即’具身超人’。樂觀估計,在未來三十年,數位超人和具身超人可能會結合,最終誕生超級人工智慧。
Sora一鏡到底及多鏡頭畫面功能強大,逼真且充滿想像力。然而Sora不懂玻璃破碎和液體溢出的順序,不明白螞蟻有6條腿的常識,也不能推理時間和因果關係。妄圖用擬合的方法來認識世界,純粹擬合路線成不了AGI,AGI最終需要自我監督地去觸摸和學習世界。
人工智慧的終極夢想是實現超級人工智慧。
具身智能是產生超級人工智慧的一條可能路徑。具身智能是能夠提升目前的「弱人工智慧」認知能力的重要方式。人工智慧可以透過與環境互動的管道,從真實的實體或虛擬的數位空間中學習和進步。
WorldBrain將繼續沿著革圖靈所開拓的具身智慧(Embodied Intelligence)的道路前進,追求在人工智慧技術與現實世界之間建立更緊密、更自然的連結。儘管目前還處於初級階段,但其打破人工智慧與現實世界之間的障礙探索已經展現出無限的潛力。