谷歌發布Translatotron 3 模型,可繞過文字轉換步驟

根據IT 之家消息,Google正式介紹推出了名為Translatotron 3 的新AI 模型,無需任何平行語音資料下,可以實現語音對語音的同聲傳譯翻譯。 Google於2019 年推出了Translatotron S2 ST 系統,於2021 年7 月推出第2 個版本,在2023 年5 月27 日發布的一篇論文中,宣布正在部署新方法,訓練Translatotron 3。研究人員稱,Translatotron 2 已經提供了卓越的翻譯品質、語音穩健性(Robust)和語音自然度,而Translatotron 3 實現「第一個完全無監督直接語音到語音翻譯的端對端模型」。傳統上的S2 ST 透過自動語音辨識+ 機器翻譯+ 文字到語音合成的級聯方法來解決,但Translatotron 3 依賴一種新穎的端對端架構,直接將來源語言語音對應到目標語言,而不依賴中間文字表示。 Translatotron 3 模型還可用於創建幫助有語言障礙的人的工具,或開發更具吸引力和有效性的個人化語言學習工具。

Total
0
Shares
Related Posts