根據品玩9 月25 日報道,Arxiv 頁面顯示,約翰霍普金斯大學的研究者近日聯手微軟,推出了一款全新的大語言模型ALMA,專注於翻譯工作。 ALMA 的全名是Advanced Language Model-based trAnslator,基於LLaMA-2 研發。該模型引入了一種新的微調方法,透過在單語資料上的初始微調,然後在一小部分高品質平行資料上的後續微調,消除了傳統翻譯模型通常依賴的大量平行資料的需求。實驗結果顯示,ALMA 在翻譯工作的表現優於傳統模型。
巴比特訊