英偉達於2024年12月3日推出了新的合成資料生成工作流程,旨在增強機器人和自主系統的人工智慧模型訓練。此流程使用生成式AI,解決了獲取多樣化資料集的挑戰,加速資料產生。透過數位孿生和電腦模擬,開發人員可以快速產生大型資料集,並建立適用於不同場景的通用模型。工作流程包括情境建立、領域隨機化、資料產生和資料增強等步驟,採用Edify和Omniverse Replicator等核心技術,協助提升AI模型的訓練效率和準確性。
路易莎·克勞福德2024 年12 月3 日18:32
Nvidia 推出了一種使用生成式AI 產生合成資料的新工作流程,增強了機器人和自主系統的AI 模型的訓練。
在人工智慧模型訓練方面取得了重大進展,英偉達推出了支援生成人工智慧的合成資料管道,旨在加強感知人工智慧模型的開發。英偉達表示,這種創新方法解決了獲取多樣化和廣泛數據集的挑戰,這對於訓練為機器人和自動駕駛汽車等自主機器提供動力的人工智慧模型至關重要。
綜合數據的作用
透過數位孿生和電腦模擬產生的合成數據提供了現實世界數據的替代方案。它使開發人員能夠透過更改佈局、資產放置和照明條件等參數來快速產生大型且多樣化的資料集。這種方法不僅加快了資料生成過程,還有助於創建能夠處理不同場景的通用模型。
生成式人工智慧:遊戲規則的改變者
生成式人工智慧透過自動化傳統手動且耗時的任務來簡化合成資料生成流程。先進的傳播模型,例如Edify 和SDXML,有助於根據文字或圖像描述快速創建高品質的視覺內容。這些模型透過以程式方式調整配色方案和照明等影像參數,顯著減少了手動工作,從而加速了多樣化資料集的創建。
此外,生成式AI 可以實現高效的影像增強,而無需修改整個3D 場景。開發人員可以使用簡單的文字提示快速引入真實的細節,從而提高工作效率和資料集多樣性。
實施參考工作流程
Nvidia 的合成資料生成參考工作流程是為在機器人和智慧空間中研究電腦視覺模型的開發人員量身定制的。它涉及幾個關鍵步驟:
場景創建:建立一個全面的3D 環境,可以透過不同的物件和背景動態增強。 域隨機化:利用USD Code NIM 等工具執行域隨機化,自動變更場景參數。 資料生成:使用各種格式和編寫器導出已註釋的圖像,以滿足特定的模型要求。 資料增強:採用生成式人工智慧模型來增強影像多樣性和真實感。 技術骨幹
此工作流程由多項核心技術支撐,包括:
Edify 360 NIM:一項用於產生在Nvidia 平台上訓練的360 HDRI 影像的服務。 美元代碼:用於產生美元Python 程式碼並回答OpenUSD 查詢的語言模型。 Omniverse Replicator:用於開發自訂合成資料生成管道的框架。 工作流程的好處
透過採用此工作流程,開發人員可以加速AI 模型訓練,解決隱私問題,提高模型準確性,並在製造、汽車和機器人等各個行業擴展資料生成流程。這一發展標誌著克服數據限制和增強感知人工智慧模型能力的重要一步。
圖片來源:Shutterstock
資訊來源:由0x資訊編譯自BLOCKCHAINNEWS。版權所有,未經許可,不得轉載