dark

區塊鏈

年輕人養生的第一個大模型，來了？

2023-08-01

來源：量子位QbitAI

原文標題：中醫大模型來了臨床診療和養生調理一步到位，發布現場訓練過程大公開，超1100萬條知識圖譜數據

國內醫療大模型，現在又迎來了位新玩家。

還是以中醫為核心的大模型——

岐黃問道·大模型，大經中醫出品。

作為國內智慧中醫的代表企業，以往它的個中進展或許並不被廣泛熟知。

但它核心產品中醫臨床智能輔助診療系統，實現了從基層村級衛生室到三甲中醫院的應用覆蓋，增持了400多家等級醫院、8000多家基層醫療機構的用戶。

這也就意味著，一旦大模型規模化落地，就可快速實現到基層的應用。

結果在發布會現場，它直接甩出三個子模型，還進行了現場演示。

基於已確診疾病的臨床診療大模型；

僅僅基於症狀、體徵的臨床診療大模型；

中醫養生調理大模型。

以中醫養生調理大模型為例，只需輸入症狀、體徵信息。比如輸入怕冷及相關症狀。

大模型就能輸出一系列多維度的養生方案來。包括中藥、經絡穴位、食療、茶飲等一步到位。

△輸入怕冷及相關症狀，給出系列養生方案

年輕人養生的第一個大模型，來了？

本以為這樣就結束了，但沒想到的是演示之後，大經中醫竟然還直接公開了正在進行的訓練過程？

這個玩家究竟什麼來頭？中醫GPT首秀實力究竟如何？

中醫GPT實力如何？

那就來看看，這個岐黃問道·大模型的首秀能力如何？

主要分佈兩大場景：中醫輔助診療、中醫健康養生服務。

首先是知病場景——基於已確診疾病的臨床診療大模型的現場演示，即輸入患者“疾病-症狀-體徵”信息，讓大模型輸出辨證結果、治則治法和中藥方劑。

一上來，它就會自稱「小經醫生」，詢問需要諮詢的疾病。現場輸入慢性胃炎後，它會進一步要求你提供相關的病情。

患者3年前出現胃痛，隱隱地痛，有時候會有胃熱的感覺。前年9月份去當地人民醫院做了胃鏡檢查，當時診斷為淺表性胃炎。患者平時吃的比較少，胃口一般，口乾，大便乾，睡眠一般，舌紅，脈細數。

最終可以看到，它成功地推斷出了證型「脾胃陰虛型」，並給出了治法、處方以及用藥和用法。

目前該模型已經通過“大經數智中醫”微信公眾號，向醫療機構開放內測申請。

而即便是那種沒有明確診斷的疾病，只輸入症狀和體徵信息。大模型也能輸出完整的結果來，即第二個子模型知症。比如輸入“盜汗”以及相關病情。

而在健康養生場景下，只需輸入最近困擾你的亞健康問題，就能快速獲取一整套涵蓋艾灸、按摩、膏方、茶飲、膳食、湯羹等內容的養生建議。

這樣的能力，離不開行業數據的支撐和訓練。據大經中醫技術總監王祺表示，在大模型的訓練中，主要用了這些數據集——

1100萬條中醫知識圖譜數據；1500本中醫古籍和文獻數據；10萬份真實中醫專家醫案數據；10萬條脈象、舌象、經絡、穴位數據；200萬條真實的中醫臨床診療數據。

而為了這些高質量數據，大經中醫過去投入了數千萬研發費用。

具體訓練方式也在這場發布會上，得到了公開呈現。

主要採用四層遞進的訓練方式：預訓練→監督微調→獎勵模型→強化學習。目前，前兩個階段已經完成，後兩個階段正在持續迭代中。

目前該訓練系統正在由中醫和AI兩方面的專家協作完成。中醫專家評估的ID，已經達到了1704605，足以見其數據規模。

敢一下子放出三個子模型，並在現場直接公開訓練過程，大經中醫底氣從何而來？

岐黃問道大模型如何煉成？

大模型最直觀的範式變革，就是新型人機交互關係的誕生。

不管是通用場景下的搜索引擎，還是垂直場景下的交互模式——

從UI、OS、EMR（電子病歷）等轉變為自然語言。已預見到的是，「流量入口」、「知識獲取路徑」等都在這場變革中得到重新定義。

既然落地價值顯性，那具體到大模型在垂直場景應用，大經中醫CEO李文友認為取決於這三個要素：

數據：高質量行業數據的獲取；

專家：業內高水平專家對預訓練模型的調整、反饋；

場景：具體場景的業務深耕，對具體場景的業務理解，以此實現大模型與行業的有效結合。

歸結起來，就是行業Know-how，多年領域深耕積攢下來的行業壁壘。

△大經中醫創始人、CEO 李文友

於大經中醫而言，這種“壁壘”可以具體展現在三個方面：

數據。

相較於其他醫療分支，中醫知識更為龐雜和個性化，而且歷來有“道不傳非人，法不傳六耳”的傳統，這就導致高質量數據非常私密，公開數據質量又比較低，因而更需要垂直領域深耕。

據介紹，基於大量真實名老中醫的診療經驗和中醫文獻中的診療知識，大經中醫構建了中醫診療知識圖譜，涵蓋內外婦兒等全學科、經方時方、孟河嶺南等全流派。據稱是目前業內最高質量的行業數據。

與此同時，還建立了包含25000+個詞條的中醫症狀、體徵術語規範化詞典。據介紹，這也是行業中唯一大規模、覆蓋全病種的術語規範化詞典。這樣一來，能夠減少因為措辭差異導致答案不一致的影響。

目前，大經中醫已經增持了400多家等級醫院、8000多家基層醫療機構用戶，形成了大量專業的中醫診療數據。

人才。

據了解，大經中醫擁有全行業規模最大的中醫-AI跨界研發團隊，也擁有行業最大的名老中醫團隊，他們通過協議方式合作展開中醫AI研究，可在此次大模型研發中，協助開展RLHF工作提高性能。

此外，大經中醫還與上海交大計算機科學與工程係等機構專家合作，集成多方技術優勢，共同開展中醫大模型的研究。

應用。

場景應用越豐富，客戶數據越龐雜，越有助於訓練出更理解行業場景和業務的垂直大模型，並且在後續迭代中也能快速形成飛輪效應，更新速度越來越快。

大經中醫現有的AI應用場景實現了B端和C端的覆蓋——

包括廣東省中醫院、上海中醫藥大學附屬龍華醫院在內的等級醫療機構；南京市江寧區、淄博市高青縣等區域中醫醫聯體，亦或是在上海長寧區“為老服務中心”這種大健康機構應用，以及下沉到山東、吉林等地村衛生室這種基層醫療機構的應用。

而在C端，則以學習強國里的中醫智能健康助手為例，只需要選擇一些不舒服的表現，就能推薦中醫調理方案。目前用戶已接近300萬人。

基於這三點核心優勢，“岐黃問道·大模型”的技術路徑也就明晰起來。發布會現場，李文友透露大模型是這樣煉成的。

首先，從名老中醫臨床診療數據+中醫文獻數據到中醫診療知識圖譜。

用知識圖譜將這些數據結構化、規範化，從而表達和存儲名老中醫診療經驗和文獻診療知識。

隨後，從中醫診療知識圖譜到中醫領域預訓練模型。

利用千萬級的中醫知識圖譜數據和臨床診療數據，微調通用預訓練模型。

最後，從中醫領域預訓練模型到岐黃問道大模型。

由中醫專家共同參與，利用獎勵模型-強化學習機制，最終形成岐黃問道大模型。

為什麼需要大模型？

大模型發展到現在，不管從個中進展還是業內聚焦探討，已經從對技術本身的展望，逐漸具像到行業落地中去。

像華為盤古大模型在氣象上的應用登上Nature頂刊，它可以在1.4秒就能完成24小時全球氣象預報，比傳統方法快1萬倍。

在教育、遊戲、廣告營銷以及礦山、藥物研發等領域，大模型都有相應的落地應用。

這兩天，北京交通大學還聯合發布了國內自主研發首款綜合交通大模型TransGPT・致遠，並開源。

李文友認為，在垂直領域乃至具體場景的應用，正是大模型最大生命力所在。

關於「中醫大語言模型」打造，大經中醫也透露了這兩個方面的原因。

從行業中看，中醫大語言模型有助於中醫藥「數智化」發展。

首先，中醫臨床診療數據、中醫文獻數據大多都是文本數據的形式。擅長自然語言識別處理的大語言模型則有助於中醫傳承發展。

其次，中醫臨床診療既具有完善的理論體系，又具有較強的經驗屬性，因此學中醫素來有“讀經典、跟名師”之說。

這些經驗深藏於中醫文獻、典籍中，以及大量歷代醫家的醫案、醫話、醫論中，但理解、記憶、應用這些經驗是一項艱難的任務，中醫大語言模型的出現，將大大改變中醫學習和人才培養的模式。

最後，從中醫的終極思維出發，中醫不僅僅是醫學，也是中國人的生活方式，這也就決定中醫不僅存在於醫院，也存在於家庭，以及各種與健康有關的空間。

而在更廣泛場景中，自然語言的交互方式更符合普通人的溝通習慣。這樣來看，中醫大語言模型，能更加推動中醫AI更廣泛落地。

而除了行業維度，對於大經中醫本身而言，還有更深層次的價值。

早在7年前，大經中醫就提出：數智化是中醫藥發展的必由之路，並以此為實踐。

核心產品中醫臨床智能輔助診療系統（CDSS）建立起從三甲中醫院到社區衛生服務中心和鄉鎮衛生院，再到診所、門診部、衛生室的各級醫療機構的應用生態。

今年開始，進一步集成了中醫臨床智能輔助診療系統（中醫智腦）、中醫智能脈診儀（中醫智指）、中醫智能舌面診儀（中醫智目）的大經數智中醫一體化診療系統已經逐步走進更多健康服務場景。

△融合了大經中醫一系列軟硬件產品的“數智中醫一體化診療系統”

用他們的話來講，大經數智中醫一體化診療系統已經從“嚴肅醫療”的生態圈，擴展到“中醫大健康”的生態圈。

而現在，隨著岐黃中醫GPT的發布，大經“中醫大健康”的生態圈將進一步做大，加速更多健康場景的拓展。

發布會上，李文友演講最後還呼籲更多生態夥伴加入。

大模型加速企業生態圈建設，也將進一步加速行業領域發展，朝著更廣泛場景落地——

日常生活中，中醫也將隨處可見。

從企業出發，到行業，最後再普惠到每個人當中，這也是大模型落地更多細分領域的變革範式。

大模型還可以在哪些領域碰撞出火花？不妨在這裡期待一下。

— 完—

資訊來源：由0x資訊編譯自8BTC。版權歸作者所有，未經許可，不得轉載