黃基:全院一庫內存數據庫與AI驅動的NLP技術應用
創辦于1937年的福州大學附屬省立醫院(以下簡稱“福建省立醫院”)是一所集醫療、教學、科研、預防和保健為一體的三級甲等綜合醫院,開啟了“一院兩區”新發展格局。在醫院發展過程中,信息化發揮了非常重要的支撐作用,由此積累了大量數據。“醫院通過數據匯聚與統一治理,提升醫療服務質量。”福建省立醫院信息管理中心高級工程師、福建省醫療大數據工程重點實驗室副主任黃基介紹。
在黃基看來,醫院數據應用主要面臨以下挑戰:找數據難,數據分散在眾多業務庫中,各庫表結構不一,目標數據難以定位;管不著、管不好數據,數據分散即為管理人員的管理時間和精力的分散,難以同時在理解幾十上百個業務庫數據的情況下還能及時進行有效的數據管理;用數據難、復用數據更難,業務庫在支撐業務系統正常運行的情況下再支撐數據服務要求,算力不足,面向不同角色/不同次數的數據需求,往往需要0-1的開發;看不見、看不懂數據,專業表數據需專業人士解讀,全面的數據可視化展示工具,很多決策者的“金點子”就此夭折。“簡言之,醫院數據應用主要存在多庫、異構的結構性制約。”他總結。
為了打破數據存、管、用的制約,福建省立醫院改變了過去全院多庫的狀態,構建了全院一庫,實現了全院級全量數據匯聚、調取和使用,且具備高算力。
開展醫療數據標準化治理
福建省立醫院數據庫實現全院一庫后,將數據匯聚到一起,主要開展了以下應用:數據集成,融合多源異構數據,稽查數據質量;數據治理,對文本進行結構化處理,并對數據進行標準化處理;數據應用,實現數據的檢索、導出,滿足科研、醫療質控等多樣化應用。
“我們對數據開展標準化過程中,與標準的數據集進行映射。同時用NLP的技術實現了非結構化數據的結構化。”黃基介紹,醫院引入了質控平臺,每個過程基于數據的及時性、一致性、完整性等,形成了統一的報表,向各個職能部門推送,保證了數據的穩定性。
在全院一庫的基礎上,福建省立醫院建設了全院科研大數據平臺,為院內用戶提供數據支持,在平臺上可進行統一的科研探索和復核檢索,科研數據年服務200多次。同時,醫院的數據實現了申請、接收、審批、解讀、分析、分配、腳本、運行、存檔、推送的完整閉環管理服務。
AI賦能數據分析和安全
為了更好地推動大數據為科研服務,福建省立醫院將AI應用于數據分析中。“因為Meta LLaMA 3已具備文本分析的能力,因此可以借助它為科研提供服務。”黃基強調,基于這個考慮,醫院推動了AI模型的本地化,通過云計算和開源服務等成熟的平臺,實現數據的高度集成,可進行低門檻數據清洗、高效的統計分析,在確保數據安全的同時,更好地提供自助科研服務。
大數據匯聚到一起后,數據安全的重要性更為凸顯。“我們將Meta LLaMA 3應用到數據分析中,雖然提高了分析的效率,仍存在安全隱患。為降低數據泄露風險,醫院采取本地化AI部署,并構建高級沙箱模型,以強化數據安全。”黃基談到,醫院也將一些國內的大模型適配到數據分析中,通過大語言模型賦能臨床和科研,加速醫務人員文本輸入的過程。
黃基認為,目前臨床業務普遍存在以下挑戰:臨床、科研交叉,病歷工作量大;表單數據收集難,而且缺少結構化;數據質量要求高,多人核對;回顧性數據代碼量巨大,獲取數據技術門檻高。
為應對這些挑戰,福建省立醫院推出了結構化病歷,擁有結構化模板設置界面、結構化病歷使用界面以及結構化病歷后臺存儲,由此擁有了明確的數據結構,便于快速查找關鍵信息,提高標準化和可比性。
“在借助信息技術助力臨床和科研的過程中,沒有單一的技術是完美的。醫院信息化建設的核心在于以需求驅動技術選型,結合成熟與前沿技術,打造最適合臨床和科研的數字化生態。同時,還要將成熟技術和前沿技術糅合到一起,取長補短,以有效避免技術缺陷,使信息技術發揮最大的效用。”黃基總結道。