人工智慧新創公司推出對話式機器人Tapping OpenAI Tech

在Figure執行長布雷特·阿德科克(Brett Adcock)確認從微軟、OpenAI、Nvidia、英特爾、傑夫·貝佐斯和Ark Invest獲得6.75億美元融資幾天后，這家人工智慧機器人公司推出了一款表現出常識的人類機器人。

這家人工智慧機器人開發商推出了一款人形機器人，融入了OpenAI 技術，可以進行即時對話並同時執行任務，從而引起了轟動。

Figure 在Twitter 上發布的一篇文章中透露，注入OpenAI 技術可以讓Figure 01 與人類進行完整的對話。類人機器人具有理解人類互動並立即做出反應的示範能力。

Figure 在對話機器人中利用OpenAI 技術

The Figure 貼文讚揚了其最近與Sam Altman 領導的OpenAI 結成的聯盟，以利用後者的語言智慧和高級視覺效果來打造機器人。這種整合使其產品能夠採取快速、低階和靈巧的操作。

剪輯展示了圖01 與Seniro AI 工程師Corey Lynch 的互動。創作者讓機器人在一個看似臨時廚房的地方執行多項任務，機器人成功地完成了任務。

圖01 當林奇要求給一些東西時，很快就辨識出蘋果是食物。隨後，Figure 01 會將垃圾收集到適當的籃子中，同時回答問題，作為其多工處理能力的證據。

Lynch 在X 貼文中詳細解釋了Figure 01 的功能。機器人可以描述視覺體驗並安排未來的行動。這位AI專家透露，它反映的是記憶與語言推理的融合。

Lynch 證實，開發團隊除了將從機載麥克風捕獲的語音中提取的文字轉錄到微軟支援的OpenAI 訓練的大型多模態模型之外，還向攝影機提供影像。多模態人工智慧涉及能夠理解和產生各種資料類型（包括圖像和文字）的人工智慧。

圖01 人形機器人舉行對話

Lynch 證實，圖01 所展示的行為是以正常速度學習和執行的，因此排除了遠端控制的可能性。人工智慧工程師解釋說，該模型正在處理對話歷史記錄，以產生機器人透過文字轉語音程式與人類對話的語言回應。

林奇補充說，該模型用於決定是否在機器人上運行學習到的閉環行為，以便機器人能夠完成給定的命令。此外，該模型還有助於將神經網路權重加載到相應的GPU 上，以使其執行策略。

Lynch 對Figure 01 的設計表示讚賞，它能夠簡潔地描述周圍環境，並在執行決策時運用常識。它推斷諸如將盤子放在架子上和解析模糊語句等動作。

Figure 01 的發佈在X 社群中引起了熱烈的反響，大多數人都對它的能力表示讚賞。許多人將其添加到實現奇點的里程碑中。

Lynch 告知AI 開發人員和研究人員，Figure 01 利用神經網路和視覺運動變壓器策略來影響行為。此外，它將像素直接映射到動作。此網路負責接收10hz 的機載影像並產生200hz 的24-DOF 動作。

《Figure 01》的首次亮相是否達成了功利目標？

圖01 的首次亮相恰逢全球領導人和政策制定者審議解決人工智慧在主流領域的擴散問題。然而，正在進行的大量討論都中心化在大型語言模型上，例如ChatGPT、Anthropic 的Claude AI 和Google 的Gemini。

特斯拉公司執行長馬斯克敦促整合功利主義目標，美國柏克萊大學教授肯·戈德堡承認這是優先事項。

這位工業工程學者認為，加速對Figure等公司投資的動機是希望這些公司能夠相容，特別是與太空探索計畫相容。

Figure AI 將見證Hanson Robotic 在將人工智慧與其產品融合的過程中展開的競爭。自2016 年首次亮相以來，該公司一直致力於增強Desdemona 人工智慧機器人。

林奇承認，由於人工智慧促進了創新，使與人形機器人進行整個對話成為現實，因此發生了加速變化。如今，高階人工智慧工程師是人形機器人的幕後黑手，能夠規劃和執行完全學習的行為。

資訊來源：0x資訊編譯自HERALDSHEETS。版權歸作者Michael Scott所有，未經許可，不得轉載