根據品嚐10 月9 日報道,香港中文大學聯手卡內基美隆大學、微軟亞洲研究院和浙江大學的研究者共同發布音訊生成模型UniAudio。論文顯示,UniAudio 可以在給定輸入條件下產生不同了類型的語音、聲音、音樂等音訊檔案。在所有生成任務的基礎上,UniAudio 的訓練規模擴大到165K 小時的音訊和10 億參數,目的是獲得足夠的先驗知識,不僅包括音訊的內在屬性,還包括音訊與其他模態之間的相互關係。
巴比特訊