醫院根本沒有大數據?!五大臨床科研探索路徑帶你解密!
在“數據爆炸”的時代背景下,世界逐漸被數據所“淹沒”,隨之而來的“大數據”更是滲透到人類生產、生活的各個領域,推動著新一波的技術革命,在這一波時代大潮中,每一個醫療工作者迫切關心的是醫療行業如何運用“大數據”這一革命性的技術。2017年3月8日由中國數字醫療網(HC3i)、中關村互聯網產業聯盟移動醫療專委會主辦的“西部醫院信息化大會”上來自北京大學腫瘤醫院(以下簡稱“北大腫瘤醫院”)的信息中心工程師王立軍,從醫療的角度分享了大數據在醫院中的實際應用。
北大腫瘤醫院作為一家集醫、教、研于一體,預防、治療、康復相結合的三級甲等腫瘤??漆t院,具有較高的醫療技術水平和較強的醫療服務能力。在2010年被批準為教育部“惡性腫瘤發病機制及轉化研究”重點實驗室,醫院現有29個臨床科室,14個醫技科室,27個病區790張病床,年住院人數4萬余人次,年門診量45萬余人次。如何讓數據發揮更大的作用,為腫瘤患者更好的服務,成為信息中心不斷思考的問題,在一系列的嘗試過程中,王立軍對于“大數據思維”,也有了獨到的見解。
大數據思維更重要
眾所周知,大數據具有量大、多樣、快速、高值的特點。“從大數據的特點來看,醫院當前沒有完全意義上的大數據;大數據技術是傳統IT的突破性提高,但說不上革命性創新”,北大腫瘤醫院信息中心工程師王立軍這樣說道。
既然醫院現階段根本沒有真正意義的大數據,為什么大家都在談醫療大數據?其實對于醫療大數據來說,不能單純只靠量大來衡量,真正的價值在于運用醫療大數據的技術實現歷史醫療資源的再利用,并借助大數據的思維和方法進行研究,完成過去傳統思維、方法、技術無法完成的任務,解決過去無法解決的問題,使得數據加以利用,形成從量變到質變的過程,同時通過多維度的分析研究,實現對醫療數據的高效檢索、后結構化、分析計算。
科研數據應用--當今醫院的痛點
與普通的綜合醫院相比,??漆t院在各方面都有其自身的特點,北大腫瘤醫院的臨床數據同樣存在一些特殊性:
第一,復診率高,治療周期記錄完整(跟隨病人多年診療次的過程);
第二,隨訪數據完善(以治療次為時間軸,同時搜集門診數據與住院數據)
對于腫瘤醫院來說,病人出院后,醫院需要對病人的復發情況進行實時監測,因此如果把每個過程、每個階段聯系起來,傳統的技術則無法實現,此時就需要醫院利用大數據來實現。
經過醫院信息化20余年的發展,臨床所需的單一患者數據已基本能滿足,但是臨床數據應用由于數據質量、數據標準、數據挖掘等問題,還處于試驗階段,無法規?;瘧糜谂R床。近年來隨著醫院科研任務及要求的增加,對科研數據獲取的準確性及效率要求越來越高,傳統的手工或半手工獲取科研數據的方式已不能滿足要求,因此解決醫院的科研數據問題,成為醫院IT人員的重要任務。
五大臨床科研探索路徑實踐
面對當前科研存在的二次錄入數據效率低,增加臨床大夫負擔、書寫效率低及使用率低、臨床醫學科研項目數據分散、數據不延續等問題,北大腫瘤醫院通過以下五個臨床科研探索路徑進行嘗試實踐:
第一,篩選入組患者,二次錄入。
傳統的“到信息部或統計室通過數據查詢工具篩選符合條件的入組患者列表,查詢病案或電子病歷記錄,將符合條件的數據錄入數據庫,最后對數據庫進行分析”。這種方法的缺點是數據收集效率低下、準確性差。面對這個問題,醫院思考通過結構化病歷搜集數據,并因此做了第二階段的嘗試。
第二,結構化電子病歷。
病歷模板結構化采集數據是業內共識,然而易增加臨床大夫負擔,且后期利用仍需要臨床大夫進行二次整理,書寫效率低導致使用率低,無法滿足臨床科研采集的需要,那么能否后臺靠算法自動轉換成結構化病歷呢?
第三,臨床科研一體化病歷書寫與采集體系。
這一階段則是基于上述結構化電子病歷前結構化的難題產生的,因此在做該采集系統時,要求數據盡量在發生期進行采集,同時以醫師為視角,提升臨床書寫效率,以電子病歷為平臺,建立臨床科研一體化病歷書寫與采集體系。在實現科研數據收集的同時,不增加日常工作量。目前北大腫瘤醫院已經完成5000例的病人數據收集。
第四,基于CDR的科研數據采集體系。
上一路徑雖然實現了基于前瞻性研究的科研數據搜集,但是回顧性研究數據如何解決?基于CDR的科研數據采集體系成為了解決方法,該體系集合臨床各種數據,CRF表單對應模式,填報人(醫生或護士)進行確認填寫表單(機器對應自動填寫),同時基于傳統SQL的人工分析思路,做后結構化病理報告等關鍵數據,但是病歷的問題并沒有最終解決,對于如何喚醒“沉睡的歷史病歷”,醫院又進行了基于大數據的機器學習。
第五,基于大數據技術的后結構化數據采集。
通過后結構化,保持醫生書寫習慣和思考邏輯的基礎上,實現對既往病歷的結構化處理,滿足科研數據采集需求。
通過以上五個階段的臨床科研路徑探索不難發現:挖掘數據價值,不僅限于解析清洗出臨床數據,而是在于數據價值臨床、科研、產業的轉化,因此如何挖掘真正有價值的數據,這就對數據的高準確性提出了要求。
最后,王立軍還說道:“醫院目前在做健康篩查,也就是將常人的信息跟患腫瘤人的信息進行走勢觀測,從而實現對腫瘤的預測,未來有可能實現滴血驗腫瘤。”對于醫療大數據的發展前景,他表示十分看好,同時也期待大數據在基因組學分析等方面的更高一級應用的出現。