谷歌將開發人工智慧模型來為影片生成聲音


Google_logo-分鐘

谷歌DeepMind 正在開發基於人工智慧的技術來創建視訊配樂。

谷歌的人工智慧研究部門和其他部門已經創建了視訊模型,但他們無法為其產生聲音效果。 為此,DeepMind 使用V2A(視訊轉音訊)技術。

「視訊生成模型正在以令人難以置信的速度發展,但許多當前系統不會產生音訊。電影製作的下一個重要步驟之一是為這些無聲視訊引入配樂,」DeepMind 在一份聲明中表示。

DeepMind 的V2A 技術使用提示與影片結合來創建音樂、音效和對話。 例如:「水下脈動的水母、海洋生物、海洋。」V2A 的底層擴散AI 模型是在音訊、對話記錄和視訊剪輯上進行訓練的。

以下線索用於為影片創建聲音:電影攝影、驚悚片、恐怖片、音樂、緊張、氣氛、混凝土上的腳步聲。

DeepMind 指出,該技術尚未完善,聲音還不能稱為高品質或令人信服。 在V2A全面推出之前,需要進行改進和測試。

讓我們記住,二月OpenAI 推出了一種新的生成式AI 模型Sora,它允許您將文字轉換為影片。

6月,哈佛大學和DeepMind的科學家創造了一隻以人工智慧為大腦的虛擬老鼠。

先前,Google子公司推出了用於創建遊戲的Genie生成式AI模型。

資訊來源:由0x資訊編譯自FORKLOG。版權歸作者Алекс Кондратюк所有,未經許可,不得轉載

Total
0
Shares
Related Posts