根據站長之家12 月22 日報道,Meta 最新發布了一系列AI 翻譯大模型,實現即時語音轉換延遲不超過2 秒,支援多種語言翻譯,並具備模仿語氣、語速、情感等特徵的能力。這一系列模式名為Seamless Communication,包括SeamlessExpressive、SeamlessStreaming、SeamlessM4 T v2 和Seamless,其中前三個已經在GitHub 上開源。為確保翻譯準確性和避免濫用,Meta 採用了毒性緩解技術,在訓練前過濾「有毒內容」並在翻譯生成過程中自動檢測和調整生成的有毒單詞,同時為音訊添加了水印以追蹤來源。為了防止濫用風險,Meta 還為音訊添加了浮水印,透過在音訊中嵌入不可察覺的訊號,可以準確追蹤音訊的來源,並對抗各種攻擊手段。