根據站長之家1 月5 日報道,發表在《美國醫學會兒科雜誌》上的一項研究表明,GPT-4 在兒科醫學病例的診斷方面的準確率僅為17%,較去年一般醫學病例的39% 更低。在該項由紐約科恩兒童醫學中心進行的研究中,ChatGPT-4 被用於分析自2013 年至2023 年間JAMA Pediatrics 和NEJM 發表的100 個兒科病例。研究人員將相關病例的文字貼到ChatGPT 的提示中,然後由兩位合格的醫學研究員對AI 產生的答案進行評分。 ChatGPT 在100 個病例中僅有17 個正確的診斷,72 個錯誤的診斷,以及11 個未完全捕捉診斷的情況。其中,57% 的錯誤診斷集中在同一器官系統。這一低成功率顯示出人類兒科醫生在短時間內不太可能失業的現實,研究強調了臨床經驗在醫學領域的不可替代性。研究人員指出ChatGPT 的高錯誤率主要源於其對疾病關係的辨識不足,並提出透過選擇性地在準確可信的醫學文獻上進行培訓,以及提供更即時的醫學數據,有望提高模型的準確性。