據IT 之家7 月25 日報導,北京知未智能科技有限公司日前在上海發布了知未智能KDF 大模型,以及基於該模型研發的一系列產品,包括“KDF 智訊”、“KDF 絕未”、“KDF 中書”等金融行業工具。據悉,知未智能KDF 大模型的訓練數據以中文為主,並包含大量的金融數據,以提升模型在商業和金融領域的問題處理能力。此外,訓練數據中還融合了部分英文與代碼數據,以適應模型的通用能力。在訓練過程中,知未智能KDF 大模型將單個漢字視為獨立的Token 進行處理。模型參數量達1400 億,訓練Token 數達到4000 億。知未智能科技CEO 段清華表示,現有通用大模型在具體行業應用性和中文能力方面的局限是知未智能選擇從零訓練知未智能KDF 大模型的主要原因,Chatglm 在具體行業應用能力上相對薄弱,MOSS 採用英文模型為基底而對中文支持不足,LLaMA 訓練數據大多為英文數據而中文能力相對較弱了,因此研發團隊選擇從零開始訓練知未智能KDF 大模型,以便更好地提升其中文能力以及行業適用性。