ElevenLabs 發表語音設計API 及X to Voice項目，推動語音技術創新

ElevenLabs 於2024 年11 月1 日推出了語音設計API 和X to Voice項目，使用戶能夠根據提示或Twitter 個人資料產生獨特的聲音。 API 提供兩個主要功能：產生三個獨特語音預覽和保存語音以便自訂。 X to Voice專案透過分析用戶的社群媒體資料，創造個人化的語音和頭像。此外，該專案作為開源範例供開發人員探索，推動創新和應用開發。這標誌著語音合成技術的重要進步，為各產業帶來廣闊的應用前景。

勞倫斯‧詹格2024 年11 月1 日16:20

ElevenLabs 推出了Voice Design API 和X to Voice，使用戶能夠根據提示或Twitter 配置檔案創建獨特的聲音，從而擴展了語音合成的可能性。

ElevenLabs 推出語音設計API 與X to Voice項目

據ElevenLabs 稱，ElevenLabs 推出了其語音設計API，該工具允許用戶根據提示產生獨特的語音。這項創新功能可以創造具有特定特徵的聲音，例如年齡、口音和語氣，甚至可以創造類似食人魔、女巫和海盜的奇幻聲音。

API 特性和功能

語音設計API 提供兩個主要端點。第一個端點根據文字提示產生三個獨特的語音預覽，為使用者提供多種選擇。第二個端點允許使用者將這些語音預覽儲存到他們的庫中，從而提供對語音自訂的靈活性和控制。

X 到語音項目

為了展示語音設計API 的潛力，ElevenLabs 開發了X to Voice專案。此示範專案根據使用者的X（以前稱為Twitter）個人資料創建獨特的聲音和頭像。透過分析用戶的個人資料，該工具產生個人化的語音，展示了API 將社交媒體數據整合到語音合成中的能力。

開源貢獻

ElevenLabs 也提供了X to Voice專案作為開源範例。開發人員可以存取GitHub 上的項目，從而探索和擴展演示中演示的功能。此舉旨在促進創新並鼓勵利用語音設計API 開發新應用程式。

語音設計API 的發布標誌著語音合成技術向前邁出了重要一步，為開發人員和用戶等提供了創建高度個人化和多樣化語音輸出的工具。隨著整合社交媒體資料的附加功能，在各個行業的應用可能性是巨大且有前途的。

圖片來源：Shutterstock

ElevenLabs 發表語音設計API 及X to Voice項目，推動語音技術創新

比特幣價格接近130,000美元，分析師認為RTX、HBAR和XLM在BTC翻倍前可提供50倍收益

以太坊Microstrategy的結構性風險分析：基於最優淨資產價值

預計2050年XRP價格，XRPL每年銷毀98.5萬XRP

知名資管公司Point72與ExodusPoint披露持有Alt5 Sigma股份

當ETH找到新的支持級別時值得購買的山寨幣冷軟件和Shiba INU成為安全避風港

比特幣預測：哈佛經濟學家羅戈夫對驚人現象的深思

比特幣有兩名礦工攻擊51％攻擊的風險

Dogecoin（Doge）會打1美元嗎？三個鮮為人知的山寨幣首先要到達那裡

ElevenLabs 發表語音設計API 及X to Voice項目，推動語音技術創新

Related Posts