原文標題:《Meta describes how AI will unlock the metaverse》
原文作者:theofficial_ksa,Venturebeat
原文編譯:比得潘,律動BlockBeats
最近結束的「Inside the lab」活動:「用AI 構建Metaverse」,是Meta 尋求用AI 解鎖元宇宙的關鍵一步,此前Meta 就曾宣布正在開發一台破紀錄的超級計算機來為元宇宙提供動力。專家們表示,除了AI,元宇宙中還涉及到VR、AR、區塊鍊和5G 等重要技術,而扎克伯格則熱衷於構建幾個巨大的AI 系統來驅動新生的虛擬世界。
對此,扎克伯格表示,「我們特別關注可以使全新事物成為虛擬世界的基礎技術,因此在Meta 我們研究了許多不同的技術,從VR 到設計我們自己的數據中心。今天,我們將專注於也許是我們這個時代最重要的基礎技術——AI。」
此外,「我們將在元宇宙中獲得的各種體驗已遠遠超出了今天的可能,元宇宙被描述為「互聯網的沉浸式版本」,因此它需要在整個領域取得進步,包括從新的硬件設備到用於構建和探索世界的軟件,而AI 則是解鎖許多這些進步的關鍵」,扎克伯格補充道。
AI 正轉向另一種自我監督學習的新方式
扎克伯格在「Inside the lab」活動中作出介紹性說明之後,Meta AI 負責人Jrme Pesenti 和Meta AI Research 聯合董事總經理Joelle Pineau 在題為「用AI 解鎖Metaverse」的會議上深入探討了Meta 如何用AI 構建元宇宙和開放科學。 Pesenti 指出,AI 是元宇宙的關鍵之一,而Meta AI 的使命是通過AI 研究改進Meta 產品,讓世界更緊密地聯繫在一起。
目前,Meta AI 在體現機器人技術、創造力和自我監督學習等關鍵領域取得了重大進展。傳統上,機器直接從人類的監督中學習,是通過面向系統提供大量人工生成的示例來教它們執行單個任務實現的。然而,這種方法的挑戰在於它過於依賴任務,而機器何時能真正理解超出狹隘任務的部分時,是否需要大量引入不必要的偏見,對此人工並不清楚。
不過,Meta AI 正在轉向另一種自我監督的方式,在這種方式中,AI 可以在沒有任何人工監督的情況下學習數據。
例如,在處理語言時,AI 系統可以從輸入文本中刪除單詞,並嘗試通過推斷周圍單詞的模式來獲取它們。隨著AI 系統變得更好,它也提高了對語言含義和結構的理解,這是這種自我監督模型的最大優勢之一:它獨立於任務,因此可以利用單個模型進行最少的微調來執行多個下游任務,如該模型可以幫助執行諸如識別仇恨言論之類的事情等。
此外,Pesenti 表示,隨著Meta AI 的研究突破,自監督學習不再局限於語言。在過去的六個月裡,Meta AI 和其他行業的研究人員在理解語音圖像方面也取得了驚人的成果。
Meta AI 研究人員已經設法獲得了非常適用於圖像的自我監督技術,他們將圖像分成小塊,並要求AI 重建圖像。目前,Meta AI 研究人員已經證明,這種新的自我監督技術與最少量的註釋數據相結合,與使用更多人工監督的傳統方法相比更具有競爭力。
並且,Meta AI 還開始創建可以同時理解多種模式的統一模型:他們可以在聆聽的同時閱讀嘴唇以獲得更好的語音識別,或者通過分析所有組件(文本、圖像或視頻)來識別違反政策的社交媒體帖子。但Meta AI 依然不會止步於此,隨著元宇宙的出現,Meta AI 將面臨著更多獨特的挑戰和機會來實現這一目標。
元宇宙帶來的幾個新挑戰
在Joelle Pineau 看來,她同樣相信元宇宙會帶來各種新的挑戰。過去十年,AI 的大部分快速進步都深深植根於互聯網,如我們看到語音、語言和視覺等數據模式。
然而,AR 和VR 呈現出不同且更大的體驗和可供性。例如,從手到臉再到全身的運動成為提供和接收信息的主要載體,這開闢了一些令人著迷的新機遇,也需要我們的AI 模型取得更多新的進展。
儘管Pesenti 分享了構建統一模型的目標,但Pineau 表示這還不夠,在構建世界模型方面取得進展至關重要。同時,建立一個「世界模型」是AI 研究人員多年來一直都在談論的一個概念。
「這個想法是建立一系列豐富的數據上,不僅可以用來進行預測,還可以用來推動未來並比較行動或乾預的替代選擇。隨著我們開始構建能夠在現實,以及AR 和VR 中流暢運行的AI 代理,我們的世界模型將需要混合使用預先記錄的靜態數據(如監督模型)進行訓練,同時還需要一系列交互經驗」,Pineau 補充道。
因此,目前仍存在許多不確定性,Meta AI 也還不知道它在未來幾年將要開發出的新方法或算法。不過,Meta AI 已經知道一些研究方向即將發生重大變化,這樣的方向之一則是機器人技術。此外,Pineau 還指出,重點是實現所謂的「無界機器人」,這是一種突破實驗室或工廠等高度受限環境的機器人,它們能夠在家中和辦公室流暢地操作,並與人類和物體交互地盡可能自然。
而當我們構建從豐富交互中學習的機器人時,一個重要的步驟則是我們需要機器人本身來提高其通過觸摸感知世界的能力,Pineau 對此做出了一個強調。
目前,Meta AI 一直在試驗新的觸摸傳感器,與卡內基梅隆大學和麻省理工學院的研究人員合作,並創建傳感器,使用AI 技術來推斷接觸位置,同時通過傳感器內的攝像頭記錄的圖像變化來測量接觸力。而與目前可用的商業觸覺傳感器相比,Meta AI 與麻省理工學院合作開發的數字傳感器製造成本也要更低。
不過,Meta AI 想要解決的挑戰之一還是要創建可以通過物理機器人和虛擬世界在現實世界中運行的模型,以允許數字化身以更加逼真的方式來挑选和操縱元宇宙中的人物,來確保彼此之間的一致性。 Meta AI 認識到模擬與現實世界之間的巨大差距,並加大投資來彌合從現實到VR 的差距,在那裡它可以訓練和測試機器人導航和操縱的新算法,以及與空間和物體的真實感測和交互。
雖然Pineau 同意建立真正可靠的虛擬世界模型還有很多工作要做,但她仍然指出,一個有趣的問題是虛擬世界模型是否必須始終保持精確。為了回答這個問題,Meta AI 正在開發一個項目,除了試圖感知和重建現實世界之外,它還可以融入我們內心深處並發揮創造力。這只是一個開始,隨著我們探索AI 模型可以增強人類創造力的新方法,將可以看到更多。
開源計劃
對於是否開源,Pineau 給出了肯定的回應,Meta AI 將開源他們的研究計劃,讓世界各地的團隊都可以使用。在Meta AI 的大部分研究工作中,其構建並發布了一個開源庫,如本例中的PyTorch 庫,它包括多種功能,例如檢測觸摸滑動、估算、機器人和對象本身,都可以包含在內作為具有導航和其他機器人功能的更廣泛系統的一部分。
此外,Meta AI 還正在開源TorchRec,這是為其許多產品提供支持的推薦庫。 TorchRec 展示了Meta AI 對AI 透明度和開放科學的承諾,它在PyTorch 庫中可用,並提供常見的稀疏性和並行性原語,使研究人員能夠構建與當今Facebook 新聞源和Instagram reels 使用相同的最先進的個性化。
隨著Meta 踏上為具身互動元宇宙構建AI 的新旅程,Pineau 指出,其還將提高如何做到這一點的標準,以及它在其設計和技術中將提升哪些價值。對此,Pesenti 與Pineau 達成了一致,並表示Meta 將通過堅定不移地致力於創建遵循公平、包容、透明的最佳實踐、責任與模型的AI 系統和技術來提高標準,並在保護用戶隱私的同時給予用戶更多控制權。
但根據Pesenti 的說法,這些最佳實踐並不容易定義,因為這些問題通常涉及復雜的社會問題。 「這就是為什麼必須對我們的工作保持透明,並向更廣泛的負責任的AI 社區分享,以獲得他們的反饋並運用他們的專業知識」,Pesenti 解釋道。
可以看出,在邁向所謂「負責任的AI」的過程中,Meta 似乎希望通過整合其開源社區的反饋來解決其多年來面臨的一些隱私問題。同時,Meta 能否成功用AI 解鎖元宇宙,還有待進一步的觀察。
資訊來源:由0x資訊採集自互聯網。版權歸作者“區塊律動BlockBeats”所有,未經許可,不得轉載