ElevenLabs 發表語音設計API 及X to Voice項目,推動語音技術創新


ElevenLabs 於2024 年11 月1 日推出了語音設計API 和X to Voice項目,使用戶能夠根據提示或Twitter 個人資料產生獨特的聲音。 API 提供兩個主要功能:產生三個獨特語音預覽和保存語音以便自訂。 X to Voice專案透過分析用戶的社群媒體資料,創造個人化的語音和頭像。此外,該專案作為開源範例供開發人員探索,推動創新和應用開發。這標誌著語音合成技術的重要進步,為各產業帶來廣闊的應用前景。

勞倫斯‧詹格2024 年11 月1 日16:20

ElevenLabs 推出了Voice Design API 和X to Voice,使用戶能夠根據提示或Twitter 配置檔案創建獨特的聲音,從而擴展了語音合成的可能性。

ElevenLabs 推出語音設計API 與X to Voice項目

據ElevenLabs 稱,ElevenLabs 推出了其語音設計API,該工具允許用戶根據提示產生獨特的語音。這項創新功能可以創造具有特定特徵的聲音,例如年齡、口音和語氣,甚至可以創造類似食人魔、女巫和海盜的奇幻聲音。

API 特性和功能

語音設計API 提供兩個主要端點。第一個端點根據文字提示產生三個獨特的語音預覽,為使用者提供多種選擇。第二個端點允許使用者將這些語音預覽儲存到他們的庫中,從而提供對語音自訂的靈活性和控制。

X 到語音項目

為了展示語音設計API 的潛力,ElevenLabs 開發了X to Voice專案。此示範專案根據使用者的X(以前稱為Twitter)個人資料創建獨特的聲音和頭像。透過分析用戶的個人資料,該工具產生個人化的語音,展示了API 將社交媒體數據整合到語音合成中的能力。

開源貢獻

ElevenLabs 也提供了X to Voice專案作為開源範例。開發人員可以存取GitHub 上的項目,從而探索和擴展演示中演示的功能。此舉旨在促進創新並鼓勵利用語音設計API 開發新應用程式。

語音設計API 的發布標誌著語音合成技術向前邁出了重要一步,為開發人員和用戶等提供了創建高度個人化和多樣化語音輸出的工具。隨著整合社交媒體資料的附加功能,在各個行業的應用可能性是巨大且有前途的。

圖片來源:Shutterstock

資訊來源:由0x資訊編譯自BLOCKCHAINNEWS。版權所有,未經許可,不得轉載

Total
0
Shares
Related Posts