OpenAI發布語音Agent

今天凌晨1點,OpenAI進行了技術直播發布了三款全新語音模型,專用於開發語音AI Agent。兩個是語音轉文本模型GPT-40 Transcribe和GPT-4 Mini Transcribe;一個是文本轉語音模型GPT-40 Mini TTS。值得一提的是,開發者可以控制GPT-40 Mini TTS模型的語音情緒和風格。 OpenAI為語音轉文本API增添了強大的streaming模式,允許開發者將連續的音頻流實時輸入模型,模型也能實時返回連續的文本和響應,這種實時交互的特性對於需要即時反饋的應用場景,例如,實時語音對話系統、語音會議轉寫等,幫助非常大。 (AIGC開放社區)

Total
0
Shares
Related Posts