阿里達摩院推大語言模型PolyLM:通曉18 種語言擁有1.7B 和13B 兩種參數版本

據站長之家消息,阿里巴巴達摩院發布的一個名為POLYLM 的多語言大型語言模型引起了人們的興趣。與其他多語言模型不同的是,PolyLM 能夠在理解、推理和生成自然語言指令方面表現出顯著的能力,該模型擁有1.7B 和13B 兩種參數版本可選。人們提出了一個名為MULTIALPACA 的數據集,它補充了現有的教學數據集,使大語言模型能夠更好地遵循多語言教學,特別是非英語母語人士的教學。

巴比特訊

Total
0
Shares
Related Posts