OpenAI 推出Sora：人工智慧文字轉視頻產生器

隨著Sora 的推出，OpenAI 剛剛在人工智慧(AI) 和影片創作領域取得了突破。生成式AI 模型能夠透過簡單的文字提示產生長達一分鐘的視頻，類似於ChatGPT 的工作原理。

索拉的主要特點

據OpenAI 稱，Sora 可以製作具有多個角色的高度詳細且複雜的場景。每個角色都可以在動態背景和複雜的攝影機運動中表現出充滿活力的情緒和動作。所有這些都是透過對自然語言軟體的深入認知而成為可能的。

為了展示文字轉影片模型的潛力，OpenAI 在X 上發布了一段完全由Sora 製作的影片。這段真人影片顯示，一對夫婦在冬天的背景下走在東京一些商店前的人行道上。

OpenAI 在Sora 的官方網頁上表示：“我們正在教授人工智能理解和模擬運動中的物理世界，目的是訓練模型幫助人們解決需要現實世界交互的問題。” “Sora 可以生成長達一分鐘的視頻，同時保持視覺品質並遵守用戶的提示。”

「Sora 能夠產生具有多個角色、特定類型的運動以及主題和背景的準確細節的複雜場景，」它補充道。 “該模型不僅了解用戶在提示中提出的要求，還了解這些東西在物理世界中的存在方式。”

不過，執行長薩姆·奧爾特曼(Sam Altman) 領導的公司尚未確定《Sora》的發布日期。

OpenAI在Sora遇到的挑戰

OpenAI 承認目前版本的Sora 存在一些弱點，需要在公開發布之前解決。其中包括模擬複雜場景的物理問題，因為它在理解因果的特定邏輯方面有其限制。它提供的一個例子是一個視頻，描繪了一個人咬餅乾，但下一個場景可能會導致餅乾根本沒有咬痕。

它也可能對空間指令感到困惑，這可能會導致一些簡單的方向細節（例如左右）的混淆。同樣，它仍然容易出現錯誤訊息、偏見和有害內容。

此外，該技術公司目前正致力於在Sora 中編碼C2PA 元數據，並將其包裝為OpenAI 產品。這樣，偵測分類器就可以知道某個影片是否是由Sora 產生的，同時防止平台上誤導性內容的歸屬。

廣受歡迎的ChatGPT 的製造商確保它目前正在吸引世界各地的政策制定者、教育工作者和藝術家，以從他們那裡獲得盡可能多的關於他們所關心的問題的意見，並確定新技術的可能用例。

OpenAI 警告說：「儘管進行了廣泛的研究和測試，我們仍無法預測人們將使用我們的技術的所有有益方式，也無法預測人們將濫用我們的技術的所有方式。」「這就是為什麼我們相信，隨著時間的推移，從現實世界的使用中學習是創建和發布越來越安全的人工智慧系統的關鍵組成部分。”

其製造商認為Sora 是生成式人工智慧模型理解如何模擬現實世界場景的重要基礎。

資訊來源：由0x資訊編譯自BLOCKZEIT。版權歸作者Giancarlo Perlas所有，未經許可，不得轉載