聯發科推出全球首個繁體中文AI 大語言模型BLOOM-zh

據IT 之家消息,聯發科4 月28 日官宣,旗下AI 研究小組日前發布了全球首個繁體中文AI 大型語言模型(LLM)。這一多語言模型名為BLOOM-zh,號稱在大多數繁體中文基準測試中優於其前身,同時保持其英語能力。聯發科表示,BLOOM-zh 起源於BigScience 於2022 年推出的開源BLOOM 模型,團隊對BLOOM 進行了額外的繁體中文和英文74 億個token 的擴展預訓練,涵蓋了新聞、書籍、百科全書、教材、口語等多個領域。為了展示BLOOM-zh 的特性,現有的和新創建的基準場景都用於評估性能。此外,聯發科的AI 研究小組在ICLR 國際表徵學習大會上發表了一篇論文,詳細介紹了其使用Fisher-Legendre(FishLeg)優化的新算法,可以比以前更快、更可靠地訓練AI 模型。該研究是與英國劍橋大學的神經動力學和控制組合作進行的。聯發科AI 研究小組將在5 月1 日的ICLR 會議上展示這項成果。

Total
0
Shares
Related Posts