久久97久久-久久97人人-久久97人人超人人超碰超国产-久久99-久久999国产免费-久久999精品

阮彤:ChatGPT等大語言模型對醫(yī)療信息系統(tǒng)的影響與提升——大語言模型在醫(yī)療行業(yè)應(yīng)用系列(一)

發(fā)布時(shí)間:2023-04-07
瀏覽次數(shù):

  類ChatGPT的語言模型對于包括醫(yī)療在內(nèi)的各行各業(yè)系統(tǒng)的沖擊是本質(zhì)性的,由于語言模型會(huì)推動(dòng)人機(jī)交互方式的變化、代碼與文檔的自動(dòng)生成、數(shù)據(jù)的自動(dòng)分析處理,因此,本質(zhì)上,會(huì)影響所有信息系統(tǒng)。但是,比較重要的變遷可能在三大類系統(tǒng)上,自然語言信息記錄與檢索類系統(tǒng)、臨床知識(shí)庫與臨床科研系統(tǒng)三大類知識(shí)/數(shù)據(jù)密集型系統(tǒng)上。下表列出了這些系統(tǒng)類型對應(yīng)的典型系統(tǒng),原有系統(tǒng)的難點(diǎn),以及大模型的能力帶來的可能的提升,以及應(yīng)用大模型同時(shí)可能出現(xiàn)的待解決的技術(shù)問題。

表1 大語言模型會(huì)改變的系統(tǒng)

微信圖片_20230407173123.jpg

  1自然語言信息記錄與檢索類系統(tǒng)

  原本就與自然語言有關(guān)的,帶有模糊性和個(gè)性化的系統(tǒng),會(huì)有更大的變化與受益。比如說,電子病歷系統(tǒng)、區(qū)域衛(wèi)生共享平臺(tái)、專病庫系統(tǒng)等,由于數(shù)據(jù)格式很難達(dá)到共識(shí),給系統(tǒng)的構(gòu)建與變遷帶來困難。很長時(shí)間以來,業(yè)界希望通過信息化標(biāo)準(zhǔn)、互聯(lián)互通協(xié)議、專病數(shù)據(jù)模型等來規(guī)范系統(tǒng)的數(shù)據(jù)格式,但因?yàn)閿?shù)據(jù)格式問題非常瑣碎,因此,推廣過程困難重重。這個(gè)問題的本質(zhì)在于,凡是用自然語言描述的東西,都有豐富的語義,而任何一種規(guī)范,都會(huì)損失語義,從而限制未來各種可能的表達(dá)。

  大語言模型的特點(diǎn)在于強(qiáng)大的自然語言理解與生成能力。該能力衍生出了不同格式文檔的理解與生成,數(shù)據(jù)格式的語義轉(zhuǎn)換,數(shù)據(jù)的自動(dòng)化的清洗等等。更重要的是,這些能力的激發(fā),并不需要標(biāo)注大量語料,Zero-Shot、Few-Shot InContext learning以及一些簡單的自然語言提示(prompt),就可以達(dá)到比較好的效果。微軟的office將可以通過簡要描述,生成用戶需要的文檔,而文本抽取任務(wù)、文獻(xiàn)檢索在Zero-Shot以及簡單的示例情況下就可以有比較好的效果。下表顯示了面向中文文本的醫(yī)療的CBLUE評測在chatGPT上的基本效果。

表2 CBLUE在chatGPT上的測試效果

微信圖片_20230407173126.jpg

  上述的文本生成功能,將對電子病歷系統(tǒng)/專科電子病歷系統(tǒng)/急診病歷/護(hù)理系統(tǒng)等系統(tǒng),產(chǎn)生較大的影響。電子病歷系統(tǒng)的核心功能是可定制的EMR模板,以及基于模板的引導(dǎo)式數(shù)據(jù)錄入。難點(diǎn)并不在于定制模板,而是模板定義規(guī)范很難確立,對模板的擴(kuò)充限制,會(huì)影響模板的靈活性,但如果不限制,又會(huì)影響模板的利用。而有了大模型,可以放入大量的經(jīng)典例子進(jìn)行指令微調(diào),然后通過使用簡單的提示(prompt),表達(dá)模板的含義,生成相應(yīng)的病歷數(shù)據(jù)。而電子病歷的質(zhì)控,也完全可以通過prompt定義質(zhì)量要求,再自動(dòng)生成,或是修改過程,或是輸入完成后,進(jìn)行質(zhì)量控制。其他功能,如導(dǎo)入檢驗(yàn)檢查數(shù)據(jù),或是文檔的修改,都可以通過自然語言交互接口完成。

  大模型對于文檔的轉(zhuǎn)化、清洗以及檢索和分析功能,將對醫(yī)院的CDR/RDR/專病庫系統(tǒng)產(chǎn)生影響。智能檢索與數(shù)據(jù)轉(zhuǎn)換是傳統(tǒng)的CDR/RDR系統(tǒng)的兩大難點(diǎn)。基于關(guān)鍵詞的檢索,由于同義詞、上下位詞、否定、遠(yuǎn)程依賴等醫(yī)療詞匯、語法以及語義層面的特點(diǎn)的存在,遠(yuǎn)遠(yuǎn)不能達(dá)到CDR系統(tǒng)電子病歷篩選數(shù)據(jù)的要求。由于檢索和利用的困難,萌生了大量的數(shù)據(jù)轉(zhuǎn)換需求,RDR和專病庫系統(tǒng),所謂的文本結(jié)構(gòu)化,數(shù)據(jù)歸一化,本質(zhì)上就是利用數(shù)據(jù)格式統(tǒng)一,簡化分析利用的困難。而大模型的Zero-Shot的數(shù)據(jù)轉(zhuǎn)換能力,不僅會(huì)給各種快速的數(shù)據(jù)轉(zhuǎn)換帶來方便,也會(huì)讓業(yè)界不再執(zhí)迷于數(shù)據(jù)格式,而是側(cè)重于確認(rèn)數(shù)據(jù)包含的語義。

  大模型對于區(qū)域衛(wèi)生平臺(tái)的好處更為顯見。長期以來,區(qū)域衛(wèi)生平臺(tái)通常會(huì)有統(tǒng)一的數(shù)據(jù)采集規(guī)范,對醫(yī)院上傳的數(shù)據(jù)字段具有復(fù)雜而又詳盡的格式要求。為了制定這個(gè)規(guī)范,通常需要多家醫(yī)院協(xié)商,在不同信息能力的醫(yī)院之間平衡。而為了執(zhí)行這個(gè)規(guī)范,又在采集過程增加了很多質(zhì)量檢測。即使如此,由于電子病歷包含的數(shù)據(jù)字段豐富,數(shù)據(jù)冗余且值域難以規(guī)范化,文案之間的語義關(guān)系含混,并有大量的自然語言和影像文件,因此,區(qū)域平臺(tái)的數(shù)據(jù)利用一直是很大的難點(diǎn)。而和CDR以及RDR平臺(tái)類似,有了大語言模型,對于數(shù)據(jù)規(guī)范變得不那么嚴(yán)格,醫(yī)院端數(shù)據(jù)的格式轉(zhuǎn)化,數(shù)據(jù)的質(zhì)控,會(huì)更為語義化,數(shù)據(jù)的檢索和利用,特別是多模態(tài)數(shù)據(jù)檢索和利用,會(huì)更有想象空間。

  2知識(shí)庫與臨床決策支持類系統(tǒng)

  傳統(tǒng)的知識(shí)庫構(gòu)建通常采用人工手段,從醫(yī)書、臨床指南,醫(yī)學(xué)文獻(xiàn)中抽取知識(shí)。這種抽取過程不但費(fèi)時(shí)費(fèi)力,而且更新困難。更糟糕的是,知識(shí)圖譜等結(jié)構(gòu)化的方式雖然精確,但語義表達(dá)能力遠(yuǎn)遠(yuǎn)弱于自然語言,包括多元關(guān)系、條件關(guān)系,因果關(guān)聯(lián)等等各種知識(shí)模式的定義,需要很高的專業(yè)認(rèn)知能力和業(yè)務(wù)建模能力,而模式的理解和正確性驗(yàn)證也同樣有雙重門檻。另外,加工后的知識(shí)庫,由于應(yīng)用場景不一,和場景結(jié)合時(shí),又需要二次加工,也讓知識(shí)庫成為某種“雞肋”型應(yīng)用。

  臨床決策支持系統(tǒng),就是知識(shí)庫系統(tǒng)的這樣一個(gè)“雞肋”應(yīng)用。從理論上說,我們以診斷和治療兩個(gè)關(guān)鍵決策為例,說明其中的難點(diǎn)。

  診斷難點(diǎn)在于對疾病進(jìn)行猜測,以及基于猜測的進(jìn)一步的檢驗(yàn)檢查,評估診斷的好壞,不僅在于猜測的精準(zhǔn)度,檢驗(yàn)檢查的合理性,也在于迭代交互式的過程方便性。而達(dá)到上面的目標(biāo),除了需要對病人病情數(shù)據(jù)的更為完整的觀測和了解,對各種疾病出現(xiàn)可能性的概率判斷,也需要比傳統(tǒng)知識(shí)庫查詢更好的交互手段,需要更為場景化的決策支持系統(tǒng)的設(shè)計(jì)與評估方式。因此,基于傳統(tǒng)知識(shí)庫的臨床診斷,基本上只能作為文獻(xiàn)查詢輔助用途。

  而治療的問題,在于個(gè)人病因,病情發(fā)展以及個(gè)體各種個(gè)性化特征,包括多疾病共存與并發(fā)疾病等等,知識(shí)庫系統(tǒng)很難將共性和個(gè)性治療方法的描述,以及各種異常情況的判斷,用結(jié)構(gòu)化方法描述。而在臨床決策系統(tǒng)中,也很難將特定病情和知識(shí)庫的條目簡單關(guān)系起來。

  大語言模型對文本數(shù)據(jù)的解析能力,極大方便了知識(shí)庫系統(tǒng)的構(gòu)建。而自然語言檢索和問答,提升了知識(shí)庫的應(yīng)用的便利性。大語言模型體現(xiàn)的推理能力,提供了智能醫(yī)學(xué)診斷和治療方案推薦的可能性。具體而言,可以通過chatGPT的開源框架langchain的一系列工具,以及chatGPT的各種Zero-Shot抽取能力,將原始書本數(shù)據(jù)抽取成更為合適的形式。而對于臨床決策類的知識(shí)庫應(yīng)用,在提升知識(shí)庫對嵌套、條件、分支和異常、概率等各種表達(dá)能力基礎(chǔ)上,綜合更多的真實(shí)世界數(shù)據(jù)。可以將病人病情通過大模型進(jìn)行解析,在知識(shí)庫上進(jìn)行推理。也可以將知識(shí)自動(dòng)生成數(shù)據(jù),與真實(shí)數(shù)據(jù)一起,放入大模型進(jìn)行訓(xùn)練。當(dāng)然,大模型的可解釋性、不穩(wěn)定性以及缺乏嚴(yán)密的邏輯推理等問題,也會(huì)給臨床決策支持帶來障礙,可以通過分解決策的步驟,通過外接知識(shí)庫,對推理的每一步進(jìn)行嚴(yán)格溯源與控制得到緩解。

  3臨床科研系統(tǒng)

  從大類來說,臨床科研和AI for Science話題有關(guān)。其中,生物信息的基因、蛋白、突變、病毒等數(shù)據(jù),可以看作是一大類模態(tài),訓(xùn)練的大模型可能帶來的生信領(lǐng)域的重大變革。本文討論的是臨床醫(yī)生日常的科研:包括選擇題目、構(gòu)造CRF表單、病人招募、臨床數(shù)據(jù)采集、科研數(shù)據(jù)分析以及科研論文撰寫等為流程的科研過程,一般分為前瞻性研究和回顧性研究。

  對于回顧性研究,由于整個(gè)過程由于完全是基于數(shù)據(jù),LLM將從選題到撰寫論文,帶來流程性的時(shí)效性的重大變革。首先,原來的選題和構(gòu)造CRF表單的過程,需要調(diào)研文獻(xiàn)、或是在RDR上分析臨床數(shù)據(jù),找到可能的方向,這個(gè)過程可能在早期需要人類的思考和假設(shè),但一旦思考過程可以記錄在案,形成類模板的思考鏈,就可以通過對于文獻(xiàn)的自動(dòng)分析和數(shù)據(jù)分析,獲得可能的研究方向與字段。對于臨床數(shù)據(jù)采集,如前文所說,利用大模型的數(shù)據(jù)轉(zhuǎn)換能力,可以快速把數(shù)據(jù)轉(zhuǎn)換成CRF表單需要的格式。對于論文撰寫,由于此類論文本身在模式上有大量的雷同,而差別主要是病種不同,數(shù)據(jù)不同以及數(shù)據(jù)結(jié)果分析不同。目前的基于數(shù)據(jù)到文本生成技術(shù),再綜合一些常見的模板,文章初稿生成,可以達(dá)到一定的效果。理論上,回顧性研究,通過面向特定訓(xùn)練目前的LLM模型,可能可以達(dá)到端到端的效果。如果是前瞻性研究,有動(dòng)態(tài)收集數(shù)據(jù)的過程,可以看作是在特殊訓(xùn)練的LLM模型上增加了一個(gè)外在的插件。

  除了前面所說的系統(tǒng)外,影像和病理檢查系統(tǒng),本身就在被人工智能提升,多模態(tài)模型的出現(xiàn),為直接寫出影像檢查文本,提供了可能性。 也有些系統(tǒng)影響比較小,如HIS、LIS、HRP等涉及財(cái)務(wù)、藥品、檢驗(yàn)等交易與結(jié)算類醫(yī)療業(yè)務(wù)系統(tǒng)。但如我們所說,由于大模型本身在交互方式、數(shù)據(jù)統(tǒng)計(jì)以及文檔與代碼生成的能力,這些系統(tǒng)未來也一定會(huì)發(fā)生變革。

  當(dāng)然,目前大模型還存在很多問題,包括穩(wěn)定性、可解性等等。對于醫(yī)療行業(yè)來說,最直接的是技術(shù)的可獲得性問題,因?yàn)獒t(yī)療數(shù)據(jù)不可能外接到ChatGPT或其他外部運(yùn)營的大模型上,這就意味著必須要有自己可控的、較為廉價(jià)的類似模型。因此,在后面的幾次文章中,我將詳細(xì)闡述如何獲得這些能力,以及每個(gè)不同系統(tǒng)使用大模型的不同的方法。

  作者簡介

  阮彤,CHIMA委員,華東理工大學(xué)信息科學(xué)與工程學(xué)院計(jì)算機(jī)系,博導(dǎo),教授。現(xiàn)任華東理工大學(xué)計(jì)算機(jī)技術(shù)研究所所長,自然語言處理與大數(shù)據(jù)挖掘?qū)嶒?yàn)室主任。長期從事自然語言處理、知識(shí)圖譜、醫(yī)學(xué)人工智能等方面的研究。

主站蜘蛛池模板: 丁香激情六月天 | 国产91精彩在线观看 | av永久天堂一区二区三区 | 高清对白精彩国产国语 | 99re久久在热线播放最新地址 | 91欧美一区二区三区综合在线 | www视频在线观看免费 | 91免费午夜视频在线播放 | 97国产精华最好 | 国产91亚洲国模持一区 | 午夜寂寞无码免费专区 | 91久久国产综合久久91大便 | 91传媒制片厂制作网 | 99精品人妻无码专区在线视频 | h无码中字动漫在线观看 | 91制片厂果冻传媒天美 | 91久久青青草原免费 | 69精产国品 | 91亚洲人成网污www | av三区国产伟业 | 日韩av无码国产精品不卡 | 91制片厂果冻传媒公司麻豆 | 91婷婷精品国产综合久久 | 99久久综合精品国产 | 丰满饥渴老女人hd | 日韩av无码一区二区三区 | av无码中出一区 | 丰满美女一级毛片不卡在线播 | 97se亚洲国产综合自在线观看 | 91尤物在线观看免费 | 午夜高清在线无码 | 91精品国产茄子在线观看 | 999精品视频 | 国产91精彩在线观看 | 午夜男女爽爽刺激视频在线观看 | 日韩av成人片在线 | 99久久精品成 | 午夜精品久久久久久久影视 | 91福利国产在 | a片在线观看 | 岛国岛国免费v片在线观看 岛国二区三区 |