根據上證報中國證券網訊報道,在10 月21 日舉行的第四屆1024 資管科技開發者大會(ITDC 2023)資產管理垂直領域大模型開發與應用論壇上,上海人工智慧實驗室書生大模型生態與產業合作負責人許韶華分享了大語言模型技術總覽,分別為資料準備、預訓練、指令微調、部署& 推理、模型評測。許韶華表示,大規模建構高品質語料資料是大模型研發中非常具有挑戰的環節,其中精細化資料處理是關鍵,而掌握領域資料是建立產業大模型的關鍵。算力方面,語言大模型的預訓練計算量龐大,需要在大規模計算集群上進行,並且依賴高效的訓練系統以充分發揮集群算力。在技術層面,實現大模型的高效且穩定的訓練也是非常具有挑戰性的。許韶華認為:“評測主要目的不是為了排名,而是指路,對於我們認識模型能力,安排後續研發非常重要。”