AI 新創公司Silo AI 面向歐洲推出開源語言模型“Poro”,涵蓋歐盟24 種語言

根據VentureBeat 報導,總部位於芬蘭赫爾辛基的人工智慧新創公司Silo AI 本週發布了新開源大型語言模式“Poro”,旨在提升歐洲語言的多語言人工智慧能力。 Poro 是計畫中的首個開源模型,旨在最終涵蓋歐盟所有24 種官方語言。這些模型由Silo AI 的SiloGen 生成人工智慧部門和圖爾庫大學的TurkuNLP 研究小組共同開發。 Poro 34B 模型擁有342 億參數,以芬蘭語中「馴鹿(reindeer)」一詞命名。它是在21 兆個token 多語言資料集的一個分區上進行訓練的,這些資料集涵蓋英語、芬蘭語以及Python 和Java 等程式語言。 Silo AI 執行長Peter Sarlin 表示,Poro 的設計目的是解決為歐洲低資源語言(如芬蘭語)訓練表現卓越的核心挑戰。透過利用跨語言訓練方法,模型能夠利用來自高資源語言(如英語)的資料。

Total
0
Shares
Related Posts