中科院國家天文台開源天文大模型StarWhisper

根據站長之家10 月23 日報道,中科院國家天文台的開源星語StarWhisper 天體大模型在甲骨文AI 研究院與LanguageX AI Lab 聯合發布的CG-Eval 上獲得了總排名第二的成績。該模型在數學推理和天文能力方面接近或超過了GPT3.5 Turbo。星語StarWhisper 是一個基於天文大模型StarGLM 開發的開源項目,旨在提升大模型在天文通用知識和多模態任務上的能力,為未來可部署於望遠鏡陣列的科學具身智能——司天大腦打下基礎。星語StarWhisper 系列模型包括6B,7B,13B,14B,20B 等規模,透過資料集清洗、監督微調、DPO 等方法,緩解了大模型在天文領域的幻覺現象,提升了數學推理、代碼能力等方面的表現。

Total
0
Shares
Related Posts