Meta 推出AI 音訊模型Audiobox：支援語音及文字同時輸入、可產生多層次聲音

根據IT 之家12 月4 日報道，Meta 日前推出了一款AI 聲音生成模型Audiobox，能夠同時接收語音及文字輸入，用戶可同時使用語音及文字描述，讓這款模型生成所需的音頻。據悉，這款模型基於Meta 今年6 月推出的Voicebox AI 模型，Audiobox 能產生各種環境音、自然對話語音，並整合了音訊產生和編輯能力，以便於用戶自由生成自己所需的音訊。 Meta 介紹稱，生成高品質音訊需要有大量音訊庫及深厚的領域知識，但大眾難以獲得這些資源，而該公司推出這個模型旨在降低聲音生成門檻，讓任何人都更容易製作視頻、遊戲等應用場景的音效。 Meta 測試生成帶有雷暴聲的下雨音頻，並輸入一系列提示句進行演示，例如“流水聲伴隨鳥鳴”、“以高音調快節奏說話的年輕女性”等；同時測試了同時輸入人聲及文字提示，以產生帶有情緒（「哀痛而緩慢」）並擁有背景音（身處教堂）的語音。

Meta 推出AI 音訊模型Audiobox：支援語音及文字同時輸入、可產生多層次聲音

加密AI興衰啟示錄：泡沫褪去，留下哪些火種？

Speciale Invest在INR 600億上支持DeepTech創業公司，專注於III類投資

FTX用戶加強訴訟，稱律師事務所Fenwick & West是其欺詐案的“關鍵”推手

跨鏈橋安全隱患剖析：28億美元損失揭示Web3基礎設施的致命弱點

特朗普一家為全球自由令牌推出15億美元的寶藏公司

XRP今日價格預測（8月12日）

策略性購買BTC火箭推動比特幣清算失衡至17,300%

比特幣的利潤率從122,000美元的高價降低； CPI報告Loom

Meta 推出AI 音訊模型Audiobox：支援語音及文字同時輸入、可產生多層次聲音

Related Posts