來源:量子位QbitAI
原文標題:中醫大模型來了臨床診療和養生調理一步到位,發布現場訓練過程大公開,超1100萬條知識圖譜數據
國內醫療大模型,現在又迎來了位新玩家。
還是以中醫為核心的大模型——
岐黃問道·大模型,大經中醫出品。
作為國內智慧中醫的代表企業,以往它的個中進展或許並不被廣泛熟知。
但它核心產品中醫臨床智能輔助診療系統,實現了從基層村級衛生室到三甲中醫院的應用覆蓋,增持了400多家等級醫院、8000多家基層醫療機構的用戶。
這也就意味著,一旦大模型規模化落地,就可快速實現到基層的應用。
結果在發布會現場,它直接甩出三個子模型,還進行了現場演示。
基於已確診疾病的臨床診療大模型;
僅僅基於症狀、體徵的臨床診療大模型;
中醫養生調理大模型。
以中醫養生調理大模型為例,只需輸入症狀、體徵信息。比如輸入怕冷及相關症狀。
大模型就能輸出一系列多維度的養生方案來。包括中藥、經絡穴位、食療、茶飲等一步到位。
△輸入怕冷及相關症狀,給出系列養生方案
年輕人養生的第一個大模型,來了?
本以為這樣就結束了,但沒想到的是演示之後,大經中醫竟然還直接公開了正在進行的訓練過程?
這個玩家究竟什麼來頭?中醫GPT首秀實力究竟如何?
中醫GPT實力如何?
那就來看看,這個岐黃問道·大模型的首秀能力如何?
主要分佈兩大場景:中醫輔助診療、中醫健康養生服務。
首先是知病場景——基於已確診疾病的臨床診療大模型的現場演示,即輸入患者“疾病-症狀-體徵”信息,讓大模型輸出辨證結果、治則治法和中藥方劑。
一上來,它就會自稱「小經醫生」,詢問需要諮詢的疾病。現場輸入慢性胃炎後,它會進一步要求你提供相關的病情。
患者3年前出現胃痛,隱隱地痛,有時候會有胃熱的感覺。前年9月份去當地人民醫院做了胃鏡檢查,當時診斷為淺表性胃炎。患者平時吃的比較少,胃口一般,口乾,大便乾,睡眠一般,舌紅,脈細數。
最終可以看到,它成功地推斷出了證型「脾胃陰虛型」,並給出了治法、處方以及用藥和用法。
目前該模型已經通過“大經數智中醫”微信公眾號,向醫療機構開放內測申請。
而即便是那種沒有明確診斷的疾病,只輸入症狀和體徵信息。大模型也能輸出完整的結果來,即第二個子模型知症。比如輸入“盜汗”以及相關病情。
而在健康養生場景下,只需輸入最近困擾你的亞健康問題,就能快速獲取一整套涵蓋艾灸、按摩、膏方、茶飲、膳食、湯羹等內容的養生建議。
這樣的能力,離不開行業數據的支撐和訓練。據大經中醫技術總監王祺表示,在大模型的訓練中,主要用了這些數據集——
1100萬條中醫知識圖譜數據;1500本中醫古籍和文獻數據;10萬份真實中醫專家醫案數據;10萬條脈象、舌象、經絡、穴位數據;200萬條真實的中醫臨床診療數據。
而為了這些高質量數據,大經中醫過去投入了數千萬研發費用。
具體訓練方式也在這場發布會上,得到了公開呈現。
主要採用四層遞進的訓練方式:預訓練→監督微調→獎勵模型→強化學習。目前,前兩個階段已經完成,後兩個階段正在持續迭代中。
目前該訓練系統正在由中醫和AI兩方面的專家協作完成。中醫專家評估的ID,已經達到了1704605,足以見其數據規模。
敢一下子放出三個子模型,並在現場直接公開訓練過程,大經中醫底氣從何而來?
岐黃問道大模型如何煉成?
大模型最直觀的範式變革,就是新型人機交互關係的誕生。
不管是通用場景下的搜索引擎,還是垂直場景下的交互模式——
從UI、OS、EMR(電子病歷)等轉變為自然語言。已預見到的是,「流量入口」、「知識獲取路徑」等都在這場變革中得到重新定義。
既然落地價值顯性,那具體到大模型在垂直場景應用,大經中醫CEO李文友認為取決於這三個要素:
數據:高質量行業數據的獲取;
專家:業內高水平專家對預訓練模型的調整、反饋;
場景:具體場景的業務深耕,對具體場景的業務理解,以此實現大模型與行業的有效結合。
歸結起來,就是行業Know-how,多年領域深耕積攢下來的行業壁壘。
△大經中醫創始人、CEO 李文友
於大經中醫而言,這種“壁壘”可以具體展現在三個方面:
數據。
相較於其他醫療分支,中醫知識更為龐雜和個性化,而且歷來有“道不傳非人,法不傳六耳”的傳統,這就導致高質量數據非常私密,公開數據質量又比較低,因而更需要垂直領域深耕。
據介紹,基於大量真實名老中醫的診療經驗和中醫文獻中的診療知識,大經中醫構建了中醫診療知識圖譜,涵蓋內外婦兒等全學科、經方時方、孟河嶺南等全流派。據稱是目前業內最高質量的行業數據。
與此同時,還建立了包含25000+個詞條的中醫症狀、體徵術語規範化詞典。據介紹,這也是行業中唯一大規模、覆蓋全病種的術語規範化詞典。這樣一來,能夠減少因為措辭差異導致答案不一致的影響。
目前,大經中醫已經增持了400多家等級醫院、8000多家基層醫療機構用戶,形成了大量專業的中醫診療數據。
人才。
據了解,大經中醫擁有全行業規模最大的中醫-AI跨界研發團隊,也擁有行業最大的名老中醫團隊,他們通過協議方式合作展開中醫AI研究,可在此次大模型研發中,協助開展RLHF工作提高性能。
此外,大經中醫還與上海交大計算機科學與工程係等機構專家合作,集成多方技術優勢,共同開展中醫大模型的研究。
應用。
場景應用越豐富,客戶數據越龐雜,越有助於訓練出更理解行業場景和業務的垂直大模型,並且在後續迭代中也能快速形成飛輪效應,更新速度越來越快。
大經中醫現有的AI應用場景實現了B端和C端的覆蓋——
包括廣東省中醫院、上海中醫藥大學附屬龍華醫院在內的等級醫療機構;南京市江寧區、淄博市高青縣等區域中醫醫聯體,亦或是在上海長寧區“為老服務中心”這種大健康機構應用,以及下沉到山東、吉林等地村衛生室這種基層醫療機構的應用。
而在C端,則以學習強國里的中醫智能健康助手為例,只需要選擇一些不舒服的表現,就能推薦中醫調理方案。目前用戶已接近300萬人。
基於這三點核心優勢,“岐黃問道·大模型”的技術路徑也就明晰起來。發布會現場,李文友透露大模型是這樣煉成的。
首先,從名老中醫臨床診療數據+中醫文獻數據到中醫診療知識圖譜。
用知識圖譜將這些數據結構化、規範化,從而表達和存儲名老中醫診療經驗和文獻診療知識。
隨後,從中醫診療知識圖譜到中醫領域預訓練模型。
利用千萬級的中醫知識圖譜數據和臨床診療數據,微調通用預訓練模型。
最後,從中醫領域預訓練模型到岐黃問道大模型。
由中醫專家共同參與,利用獎勵模型-強化學習機制,最終形成岐黃問道大模型。
為什麼需要大模型?
大模型發展到現在,不管從個中進展還是業內聚焦探討,已經從對技術本身的展望,逐漸具像到行業落地中去。
像華為盤古大模型在氣象上的應用登上Nature頂刊,它可以在1.4秒就能完成24小時全球氣象預報,比傳統方法快1萬倍。
在教育、遊戲、廣告營銷以及礦山、藥物研發等領域,大模型都有相應的落地應用。
這兩天,北京交通大學還聯合發布了國內自主研發首款綜合交通大模型TransGPT・致遠,並開源。
李文友認為,在垂直領域乃至具體場景的應用,正是大模型最大生命力所在。
關於「中醫大語言模型」打造,大經中醫也透露了這兩個方面的原因。
從行業中看,中醫大語言模型有助於中醫藥「數智化」發展。
首先,中醫臨床診療數據、中醫文獻數據大多都是文本數據的形式。擅長自然語言識別處理的大語言模型則有助於中醫傳承發展。
其次,中醫臨床診療既具有完善的理論體系,又具有較強的經驗屬性,因此學中醫素來有“讀經典、跟名師”之說。
這些經驗深藏於中醫文獻、典籍中,以及大量歷代醫家的醫案、醫話、醫論中,但理解、記憶、應用這些經驗是一項艱難的任務,中醫大語言模型的出現,將大大改變中醫學習和人才培養的模式。
最後,從中醫的終極思維出發,中醫不僅僅是醫學,也是中國人的生活方式,這也就決定中醫不僅存在於醫院,也存在於家庭,以及各種與健康有關的空間。
而在更廣泛場景中,自然語言的交互方式更符合普通人的溝通習慣。這樣來看,中醫大語言模型,能更加推動中醫AI更廣泛落地。
而除了行業維度,對於大經中醫本身而言,還有更深層次的價值。
早在7年前,大經中醫就提出:數智化是中醫藥發展的必由之路,並以此為實踐。
核心產品中醫臨床智能輔助診療系統(CDSS)建立起從三甲中醫院到社區衛生服務中心和鄉鎮衛生院,再到診所、門診部、衛生室的各級醫療機構的應用生態。
今年開始,進一步集成了中醫臨床智能輔助診療系統(中醫智腦)、中醫智能脈診儀(中醫智指)、中醫智能舌面診儀(中醫智目)的大經數智中醫一體化診療系統已經逐步走進更多健康服務場景。
△融合了大經中醫一系列軟硬件產品的“數智中醫一體化診療系統”
用他們的話來講,大經數智中醫一體化診療系統已經從“嚴肅醫療”的生態圈,擴展到“中醫大健康”的生態圈。
而現在,隨著岐黃中醫GPT的發布,大經“中醫大健康”的生態圈將進一步做大,加速更多健康場景的拓展。
發布會上,李文友演講最後還呼籲更多生態夥伴加入。
大模型加速企業生態圈建設,也將進一步加速行業領域發展,朝著更廣泛場景落地——
日常生活中,中醫也將隨處可見。
從企業出發,到行業,最後再普惠到每個人當中,這也是大模型落地更多細分領域的變革範式。
大模型還可以在哪些領域碰撞出火花?不妨在這裡期待一下。
— 完—
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載