來源:中國電子報
近日,伴隨微軟ChatGPT、谷歌Bard、百度“文心一言”等AI大模型之爭愈演愈烈,生成式AI在全球範圍內掀起軒然大波。與此同時,人形機器人賽道也悄悄升溫了。 ChatGPT背後的造物主OpenAI領投人形機器人公司,引發投資熱。浙商證券中性預估,2030年全球人形機器人市場規模有望達855億元,未來十年市場規模料將增長超120倍。多位業內專家指出,依託大型語言模型的訓練,機器對人類意圖的理解有了跨越式的質變提升,人形機器人即將迎來新一輪“進化”。
AI大模型為人形機器人注入“靈魂”
1928年,在美國紐約市的一家高級俱樂部,一個由牆板製成的粗糙類人形體(頭部、鉸接的手臂和腿)開啟了人類對於人形機器人的無限想像。這個類人形體被稱為“Herbert Televox”,由美國西屋公司打造,身體的核心部分是Televox控制單元。 1928年的廣告是這樣描述Televox的:“這是未來會成為僕人的一款新設備。”
經過近百年的發展,從粗糙的外形到越來越接近人類的外表,從沒有行動能力到可以行走、攀爬、跳躍,人形機器人的進化之路越走越快。然而,由於算法複雜度和數據規模的限制,目前,市面上多數人形機器人還只能在少量垂直應用方向上實現接近或超越人類的智能表現,無法在更加開放、複雜的領域實現從“弱人工智能”向“強人工智能”的關鍵一躍。
民生證券研報指出,以ChatGPT為代表的AI大模型將為人形機器人注入“靈魂”,有望大幅推動產業的商業化落地。 “人機交互最好的載體就是人形機器人。人形機器人的發展離不開語音、視覺、運動控制等多方面的研究,通過引入ChatGPT在人形機器人中的應用,人形機器人與人類的交互體驗將會指數上漲。以ChatGPT為代表的語言大模型是人形機器人的第一個殺手級應用,代表通用AI賦能通用服務機器人的開始。”優必選科技副總裁、人形機器人事業部負責人付春江對《中國電子報》記者說道。
在他看來,大模型關鍵技術可拓展到人形機器人的視覺、決策、推理、動作等方面,使人形機器人能部署到更複雜的開放環境中,使人形機器人的感知和動作形成閉環,讓其能夠在日常生活中發揮更大作用。比如,可以彌補語言模型和真實世界的鴻溝,讓它更會“說話”;可以提升模型推理能力,利用環境反饋形成閉環,讓它可以探索更多應用環境。
Forrester分析師盧冠男在接受《中國電子報》記者採訪時指出,長期而言,大模型不僅能夠更好地訓練機器人學習算法和處理更複雜和更大規模的數據集,而且有助於機器人更好地理解人類語言、行為和環境,通過與包括智能仿生材料在內的其他軟硬件技術發展的融合,加速人形機器人在任務完成、自主學習、適應能力、仿生體驗等領域的進化。但在短期內,ChatGPT並不會為人形機器人帶來實質影響。
盧冠男坦言:“ChatGPT會改善的AWA(自動化辦公助手)的能力。但AWA並不依賴人形機器人的形態呈現,更多是以RPA(機器人流程自動化)、NLP(自然語言處理)、DPA(數字流程自動化)和AIOps(智能運維)等產品形態體現。”
新一輪進化方向已顯現
人形機器人的新一輪進化方向是怎樣的?在“強人工智能”時代,人形機器人又該如何學習和進步,不斷刷新能力與體驗上限? Forrester VP研究總監戴鯤在接受《中國電子報》記者採訪時分析說:“下一代人形機器人的進化方向將聚焦於三個方面:更高的智能水平,實現自主決策和動態交互;更強的感知能力,獲取環境與人類行為信息,更好地完成任務;更靈活的操控能力,實現多種姿態和運動模式,與人類和其他機器人進行協作。”
正在展示中的達闥人形機器人
達闥創始人、CEO黃曉慶對《中國電子報》記者表示,基於“雲(雲端大腦)、網(安全網絡)和端(機器人終端)”架構的雲端機器人將會成為5G時代的“殺手級”的應用,如果可以量產出會做飯、會清潔、會對話、會照顧老人小孩的家庭保姆級機器人,這將會是數万億的市場。
機器人的“雲”大腦通過在雲、邊、端分佈式算法、算力和大數據形成機器人智能;通過5G等無線安全高速“網”絡連接雲端大腦和機器人本體;機器人本體在“端”側完成各種任務。雲端大腦通過人工增強、多模態融合AI和數字孿生等先進技術,實現機器人智能地自我學習、不斷進化與成長。
黃曉慶指出,ChatGPT的出現,恰恰證明機器人需要一個雲端大腦。因為ChatGPT是不可能裝在一個小小的計算機裡的,它必須裝在一個雲裡面,變成個雲服務。 ChatGPT本身是單模態的,所以它無法支持機器人。而基於多模態的人工智能大模型要能夠支持多模態,文字、語言、視覺、運動都要支持,這就是達闥在做的RobotGPT。
“人形機器人是一個多任務、通用型機器人平台,未來它在工業生產、社會服務等領域將有非常多的應用場景。”付春江說道。他認為,具身智能是人形機器人下一階段的重點進化方向,ChatGPT可以認為是人類創造出一個超級語言大腦,人形機器人是超級大腦載體,ChatGPT通過人形機器人與物理世界發生聯繫,交易所和互動,根據物理世界中真實的反饋,利用比如強化學習來學習在世界遊走,抓取行為,推理和決策的能力,學會在現實世界裡生存。
多模態大語言模型(LLM)可以ChatGPT發展成GPT-X(GPT-4,GPT-5…),給予GPT-X 視覺、聽覺、觸覺、味覺和嗅覺,具身智能給予GPT-X身體。 GPT-X使人形機器人和人類及周圍環境交互自然,依託於GPT-X 強大的自主學習能力,人形機器人走進千家萬戶和服務各行各業就會成為現實。
距離規模化量產還有多遠?
人形機器人是全球科技創新領域最重要的一個方向,也是機器人的最高級形態。戴鯤分析稱,與普通機器人相比,人形機器人一方面可以通過面部表情、語音和身體語言等多種方式來與人類進行交易所,更加自然和準確地理解人類情感,更好地適應人類需求,特別是在人口老齡化加速,對精神陪伴和物理陪護需求日益增加的社會背景下具有日益增加的迫切性。
另一方面,一般情況下人形機器人具備常規的普通機器人所沒有的靈活性和柔韌性,如手腕關節的運動和抓取力度等,從而更好地完成特殊場景的操作任務。技術層面的穩定性與可靠性及用戶需求層面的仿生體驗真實性與安全性都是人形機器人需要解決的關鍵問題。
隨著科技的發展及社會生產對效率要求的提高,人形機器人產業發展迎來窗口期。弗若斯特沙利文預測,到2026年,全球人形機器人市場規模將達到80億美元;高盛預計,到2035年,在藍海市場情景下,人形機器人市場能夠達到1540億美元的規模,接近截至2021年全球電動汽車市場及全球智能手機市場的1/3。
特斯拉人形機器人
放眼國際市場,波士頓動力Atlas機器人憑藉優異的運動性能引領技術發展;特斯拉推出的人形機器人“擎天柱”驚艷四座,特斯拉CEO埃隆·馬斯克稱擎天柱未來產量可達數百萬台,預計價格不到2萬美元;亞馬遜、三星等也紛紛注資賽道。
再看國內,小米自研的首款全尺寸人形機器人CyberOne(鐵大)已經做好了面向海外市場的準備;優必選自主研發的大型人形機器人Walker X和熊市貓機器人優悠等已經出現在世博會、兩會等重要場合,正在衝刺人形機器人第一股;達闥推出的人形機器人Gingerxr-1,已經發展到2.0的版本,柔性關節從1.0版本的34個增加至41個,續航時間超過24小時,還能切換不同角色,通過視覺和語音感知人類情緒。
儘管賽道競爭火熱,付春江坦言,人形機器人要從“可用”走向“實用”,並達到理想的商業化狀態,在軟件或AI方面,需要解決人形機器人多維感知和決策能力,解決通用智能問題,來滿足半結構化環境的適應能力和完成任務能力。在硬件方面,要解決高功率密度,實現低能耗,關鍵元器件性能提升,整機量產導入和成本控制。
比如,制約人形機器人運動性能的關鍵模塊——伺服驅動器佔據了一半以上的整機成本。儘管近年來,在多方努力下,人形機器人的核心零部件成本一直在穩步下跌,像優必選已經率先將雙足真人尺寸人形機器人的成本降至10萬美元以下,但要讓人形機器人真正走進千家萬戶仍然任重道遠。
再比如,製作柔性關節需要用的減速器長期被國外機器人“四大家族”壟斷。人形機器人所用的減速器成交量更小、重量更輕,而且材質也不相同。達闥自主研發生產的智能柔性關節(SCA),在同樣性能下,成交量只有傳統伺服器系統的1/10。
與此同時,人形機器人對軟件方面的關鍵技術依賴度極高。 AI 算法及軟件平台能力決定了最終人形機器人的核心服務能力。過去傳統機器人架構下,人形機器人產業化部署面臨智能化水平低、價格高、難量產、隱私安全和數據保護無法保障等難題。
不過,黃曉慶指出,這些難題都將隨著“雲—網—端”架構的推廣而得以解決。一個可為智能機器人共享的雲端大腦,將支持海量的機器人共同進行訓練和學習,不斷進化,最終實現機器人通用智能服務。
ChatGPT、多模態融合AI的RobotGPT等先進技術,將從“質”上促進機器人從“功能”進階到“智能”,讓機器人智能地自我學習、不斷進化與成長。如同手機“功能機”向“智能機”的升級,伴隨新一輪進化,人形機器人將走入千家萬戶,真正改變我們的生活。
賽迪顧問報告顯示,儘管目前各家人形機器人仍處於原型機研發的早期階段,但它所帶來的潛在技術變革和對某些生產生活場景的改變值得高度關注。目前較有潛力的人形機器人發展方向主要面向製造業、航天探索、生活服務業、高校科研等,預計2025年,人形機器人將有望實現製造業場景應用的突破,小批量應用於電子、汽車等生產製造環境。
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載