深度求索發布開源程式碼大模型DeepSeek Coder

11 月2 日,幻方量化宣布「深度求索(DeepSeek)」在成立半年後發布第一代大模型DeepSeek Coder,1B,7B,33B 全系列模型開源且免費商用。公告顯示,DeepSeek Coder 模型有指令Python 快速寫出程式、修改UI(使用者介面)、測試bug(程式錯誤)以及資料分析,學寫SQL(資料庫語言)等技能。根據介紹,與先前最好的開源大模型CodeLlama 相比,DeepSeek Coder 在程式碼產生任務上(使用標準資料集HumanEval、MBPP 和DS-1000 進行評測)分別領先 9.3%、10.8% 和 5.9%。其中DeepSeek Coder 的70 億參數版本在程式碼能力上達到了CodeLlama 的340 億參數水準。經過指令調校後的DeepSeek Coder 模型更是全面超越了GPT3.5-Turbo。

Total
0
Shares
Related Posts