人工智能技術(shù)如何助力病案智能化編碼與DRG支付方式變革
人工智能技術(shù)應(yīng)用于智能編碼其算法的基礎(chǔ)都是自然語言處理(NLP)技術(shù),該技術(shù)是通過計算機科學(xué)、信息工程和人工智能等手段讓計算機實現(xiàn)對非結(jié)構(gòu)化文本的理解、分析和處理工作。
電子病歷中患者的主訴、既往史、癥狀、診療過程及臨床診斷等信息大多以非結(jié)構(gòu)化的自然語言形式儲存,如何能讓計算機利用這些無章但極有價值的信息來輔助病案首頁編碼是提升醫(yī)院管理效率和管理質(zhì)量的一個重要部分。具體而言,文本處理所包含的步驟包括:
1、分詞
分詞是將文本序列切分成一個個單獨的詞,例如將“糖尿病周圍血管病變”分解為“糖尿病”“周圍血管”“病變”,這需要龐大的醫(yī)學(xué)知識庫在背后支撐,否則將會影響分詞效果及以后的文本處理步驟。
2、詞嵌入
簡單來說,詞嵌入是一種詞的類型表示,具有相似意義的詞具有相似的表示,是將詞匯映射到實數(shù)向量的方法總稱。通過這種方式產(chǎn)生的詞向量不僅維度低,而且包含了語義信息。例如“癌”和“惡性腫瘤”這兩個詞所對應(yīng)的向量在空間中距離很近,但“癌”和“汽車”這兩個不搭邊的詞所對應(yīng)的向量就距離很遠。這樣,通過運算可以使計算機像人一樣“理解”詞匯的意思。
3、命名實體識別
在經(jīng)過分詞和詞嵌入之后,計算機就可以開始識別文本中具有特定意義的實體了,在醫(yī)療中這些實體包括病人基本信息相關(guān)實體(姓名、年齡等)、藥品名、疾病名和手術(shù)名等。一些常見的實體可能包含在知識庫當中,識別起來就很簡單。但是對于那些不常見的實體的識別,則需要一些算法來實現(xiàn)。
通過以上三個步驟,計算機已經(jīng)可以較好的理解文本的語義,以輔助編碼為例,計算機可以通過“基于規(guī)則”和“人工智能”這兩個手段來達成。
4、基于規(guī)則
“基于規(guī)則”依靠的是大量醫(yī)學(xué)知識的沉淀,通過編碼邏輯和編碼規(guī)則,將處理好的文本與編碼的標準描述對齊匹配,達到編碼的目的。邏輯和規(guī)則的搭建需要依靠電子病歷中不同部分的內(nèi)容信息,其中包括:病人基本信息(性別、年齡)、臨床診斷、手術(shù)操作、影像信息和病理信息等。“基于規(guī)則”智能編碼系統(tǒng)的搭建需要花費大量的時間和專家資源,且維護的成本高。但是一旦搭建完成,其編碼的效果好、編碼路徑的可解釋性強。
5、人工智能
“人工智能”途徑則可以在最短時間內(nèi)搭建出一個較為可靠的編碼模型。它的主要核心是將編碼問題轉(zhuǎn)化為經(jīng)典的文本分類問題來解決,只是在智能編碼這個背景下,輸入的是電子病歷文本,輸出的是該病例編碼。計算機通過大量準確歷史數(shù)據(jù)的訓(xùn)練,學(xué)習(xí)從文本中找特征,并將這些特征和編碼標簽聯(lián)系在一起,從而完成學(xué)習(xí)的流程。
在數(shù)據(jù)多且質(zhì)量好的情況下,人工智能算法可以達到很好的效果,但是數(shù)據(jù)少、數(shù)據(jù)錯誤多都會讓計算機“學(xué)錯”,導(dǎo)致效果不佳。另外,相較于“基于規(guī)則”的智能編碼,人工智能模型的可解釋性不強,這也是人工智能在醫(yī)療很多應(yīng)用上受限的一大原因。
因此,最理想的病案首頁輔助編碼是以醫(yī)學(xué)知識為基石、通過人工智能的算法賦能來搭建的。這樣的系統(tǒng)既能保留很強的醫(yī)學(xué)解釋性,又能具有人工智能算法的高效和可擴展性。
三、人工智能應(yīng)用于智能輔助編碼的關(guān)鍵技術(shù)
應(yīng)用先進的自然語言處理技術(shù)、機器學(xué)習(xí)技術(shù)等基于人工智能算法開發(fā)的各類模型,將其應(yīng)用在以診斷(編碼)為主的病案首頁數(shù)據(jù)之上。具體技術(shù)架構(gòu)如圖3所示,其包含以下特征。
圖3 病案首頁質(zhì)控框架
1、整合知識庫的自然語言處理文本分析
原始出院診斷信息為病案首頁中的重要信息來源,而且大多數(shù)情況下以自然語言形態(tài)出現(xiàn)(即醫(yī)生手動輸入的文字型診斷內(nèi)容)。同時,國家規(guī)范的ICD編碼(包含ICD-10以及ICD-9-CM版本),其中的標準診斷書寫方式也是基于自然語言。
一般情況下醫(yī)生需要通過自己輸入的關(guān)鍵詞或完整診斷內(nèi)容從系統(tǒng)自動化匹配的ICD編碼中選擇合適的對應(yīng)編碼。然而很多時候醫(yī)生的書寫方式與ICD中的形態(tài)完全不同,因而一些情況下通過關(guān)鍵字的搜索無法找到對應(yīng)的ICD編碼。
然而這一問題可以通過知識庫積累與自然語言處理算法進行優(yōu)化。自然語言處理算法可以將醫(yī)生書寫的出院診斷文字進行語義學(xué)分析。將其中的核心詞,及對應(yīng)程度、病因、病理、部位、臨床表現(xiàn)等的修飾詞進行拆分與結(jié)構(gòu)化。因而,不同部分的信息點可以以不同的方式進行分析。
例如,標為“開放性右肱骨骨折”的主要診斷,自然語言分析可將其拆分為“開放性” “右” “肱骨””骨折”,分別指代診斷的類別、方位、位置及內(nèi)容。因而可以對不同部分進行詳盡的分析,從ICD編碼中找出對應(yīng)的大類。
進而,醫(yī)學(xué)知識庫可以將各類表述同一診斷的不同表述方式進行整理歸一,同時也可以將各類醫(yī)學(xué)名詞之間的關(guān)聯(lián)性進行細化。例如上例中,可以通過知識庫分析得知“右肱骨”屬于“肱骨”、“肱骨”位于上臂,因此將會從ICD編碼中排除所有不符合的編碼,對候選結(jié)果進行優(yōu)化。
2、機器學(xué)習(xí)、深度學(xué)習(xí)模型構(gòu)建
由于編碼過程除了涉及醫(yī)學(xué)相關(guān)知識外,還要求編碼人員有一定的邏輯判斷能力。例如可以從多個出院診斷中選擇合適的診斷作為主要診斷,或面對多個診斷信息時可以恰當?shù)貙⑵渲锌梢院喜⒌脑\斷進行編碼合并。在此前提下,機器學(xué)習(xí)、深度學(xué)習(xí)算法可以對該環(huán)節(jié)進行一定程度的輔助。
計算語言相似度的方法有很多,依據(jù)前期探索的經(jīng)驗,單一方法在自動編碼輔助上的效果都偏差。因而需要探索多種方法整合后生成的模型是否可以具備更高的可用性。同時,應(yīng)用神經(jīng)網(wǎng)絡(luò)將各類單一算法中有限的變量整合后進行關(guān)聯(lián),將可以在原有算法基礎(chǔ)上形成新的、可支持一定邏輯的深度學(xué)習(xí)模型。一些候選的研究算法羅列在表1中。
表1 研究算法
3、自學(xué)習(xí)算法、強誤差容忍度
為實現(xiàn)主診斷的選擇與合并編碼,模型應(yīng)具備極強的自學(xué)習(xí)能力與抗噪聲能力,F(xiàn)有院內(nèi)編碼數(shù)據(jù)(甚至包括監(jiān)管部門得到的歷年上傳的數(shù)據(jù))的一個特點就是其中依舊有不少難以發(fā)現(xiàn)的錯誤與偏差。
因而,在訓(xùn)練相關(guān)的模型時,在無法得到完整的并且無誤的訓(xùn)練數(shù)據(jù)的時候如何保證模型具備一定的誤差容忍度就成了極具挑戰(zhàn)性的命題。
四、電子病案智能化編碼在DRGs支付方式改革中推廣應(yīng)用的對策建議
伴隨著DRGs支付方式改革的逐步推進,病案首頁質(zhì)量將越來越重要,編碼的準確性問題需要引起高度重視。市場上的很多信息化廠商也紛紛開始關(guān)注病案首頁質(zhì)控以及智能化輔助編碼的技術(shù)實現(xiàn)問題。
隨著人工智能技術(shù)的逐步推進,基于人工智能技術(shù)從電子病歷數(shù)據(jù)來進行智能輔助編碼將具有更廣闊的前景。
根據(jù)筆者的調(diào)研目前市場上也已經(jīng)有一些廠商已經(jīng)在一定程度上進行了很好的探索和市場化應(yīng)用推廣,為提升病案首頁的數(shù)據(jù)質(zhì)量以及編碼的準確性做出了一定的貢獻。
但是,如果要從國家層面助力醫(yī)保深入開展DRGs支付方式改革的全國推廣,還需要進行一定程度的頂層設(shè)計,具體建議如下:
1、自上而下的進行臨床數(shù)據(jù)的統(tǒng)一規(guī)范管理
1、推行統(tǒng)一規(guī)范的病案首頁填寫版本
盡管國家已經(jīng)發(fā)布了統(tǒng)一版本的病案首頁填寫要求,但是從各地的實際來看還有很多城市存在病案首頁填寫版本不一致的現(xiàn)象,建議應(yīng)該首先由衛(wèi)健委或醫(yī)保局統(tǒng)一牽頭推進病案首頁上報的標準版本,并確保該版本所需的數(shù)據(jù)能夠滿足DRGs分組所需要的全部數(shù)據(jù)需求。
2、推行統(tǒng)一的DRGs分組器,并發(fā)布與之相適應(yīng)的編碼體系,形成定期維護更新機制
目前,國內(nèi)主流的分組器版本有CN-DRGs、C-DRG、上海版DRGs等,為適應(yīng)不同的DRGs分組器,各不同學(xué)派又研發(fā)了自己的編碼體系,由于不同版本的編碼體系有較大的差異,在信息化建設(shè)、數(shù)據(jù)共享和交換等方面不能滿足信息化建設(shè)和醫(yī)改提出的要求,加強疾病分類編碼的統(tǒng)一管理、推行統(tǒng)一標準,是當前的大勢所趨。
因此,建議國家能夠從頂層設(shè)計的思路考慮,充分吸納借鑒各個學(xué)派的優(yōu)勢,融會貫通,確定國家統(tǒng)一的法定DRGs分組器版本、以及與之相適應(yīng)的編碼標準、編碼規(guī)則,并形成定期維護更新機制。確保分組科學(xué),疾病之間的可比性以及為DRGs支付提供技術(shù)支撐。
3、構(gòu)建全國統(tǒng)一的病案首頁/電子病歷臨床數(shù)據(jù)庫,并成立專門的部門進行自上而下統(tǒng)一的數(shù)據(jù)質(zhì)量監(jiān)管
根據(jù)國際經(jīng)驗,各國DRGs支付成功的必要條件是準確的臨床和成本數(shù)據(jù)。因此,各國在實施DRGs支付體系構(gòu)建時都會成立專門的部門負責(zé)對數(shù)據(jù)的搜集、處理、以及監(jiān)管和審核等工作。
以德國為例,德國專門責(zé)成InEK(Institut für das Entgeltsystem im Krankenhaus,DRGs研究院)進行DRGs的改革與開發(fā)工作。InEK的主要職責(zé)之一就是對醫(yī)療機構(gòu)的數(shù)據(jù)進行收集與分析工作,并下設(shè)數(shù)據(jù)中心對醫(yī)療機構(gòu)等提交的數(shù)據(jù)進行整理與匯總。
臨床數(shù)據(jù)主要用于診斷分類系統(tǒng)和程序分類系統(tǒng),由InEK的數(shù)據(jù)中心收集匯總后提交給DIMDI(Deutsches Institut für medizinische Dokumentation und Information,聯(lián)邦醫(yī)療數(shù)據(jù)文獻及信息研究院)進行診斷和程序編碼(基于InEK數(shù)據(jù)中心對臨床數(shù)據(jù)的處理與匯總審核是確保DIMDI 的正確編碼與分組的重要保障)。
在編碼層面,德國DRGs相關(guān)的編碼工作,多數(shù)醫(yī)院是由醫(yī)師或?qū)I(yè)編碼人員來做。每一家醫(yī)院皆設(shè)有醫(yī)療控制中心負責(zé)編碼的正確性與優(yōu)化,醫(yī)療控制中心同時也負責(zé)在專業(yè)審查過程與MDK連絡(luò)。
德國DRGs支付制度改革的一個很重要的經(jīng)驗就是數(shù)據(jù)基礎(chǔ)建設(shè)。DRGs的開發(fā)依靠信息、能力、政策工具等多項基礎(chǔ)條件,而可得、及時、準確的成本、臨床、病案等數(shù)據(jù)基礎(chǔ)是改革是否成功的決定因素之一。
好的數(shù)據(jù)基礎(chǔ)需要花時間來構(gòu)建。一些國家希望在一個月之內(nèi)就建成DRGs體系,但實際上構(gòu)建DRGs系統(tǒng)是非常復(fù)雜的一項工程。在美國,建立DRGs系統(tǒng)花了15年的時間,先是在部分州作為試點,逐步擴大并完善。準確的數(shù)據(jù)是合理定價的基礎(chǔ),以馬里蘭州為例,在數(shù)據(jù)逐步完善的情況下,至少花了4-5年之后才確定費率。
另外,DRGs系統(tǒng)本身的持續(xù)進化和更新本身還需要大量數(shù)據(jù)的積累,以更好的實現(xiàn)對于病種分類的不斷改進,對于嚴重程度的評價與監(jiān)督,以及對于存在變異性很大的數(shù)據(jù)的規(guī)律性的總結(jié)與驗證等。
2、加強數(shù)據(jù)標準化和跨部門數(shù)據(jù)共享機制的建設(shè)
DRGs支付體系涉及衛(wèi)生、人社、發(fā)改、醫(yī)院和商保等多部門的協(xié)同聯(lián)動,數(shù)據(jù)標準化和跨部門的數(shù)據(jù)共享是推進該支付體系改革順利實施和高效運行的重要保障,需要從國家層面加強對數(shù)據(jù)標準化的要求,并加強推進跨部門數(shù)據(jù)共享機制的建設(shè),保障數(shù)據(jù)互聯(lián)互通,更好的推進DRGs支付改革的順利實施。
另外,還應(yīng)積極通過促進跨部門的數(shù)據(jù)融合,比如身份信息可以通過公安或運營商的數(shù)據(jù)進行補全及真實身份認證,來提升對醫(yī)保支付基金的合力支付和使用的有效監(jiān)管,避免醫(yī)保欺詐行為的發(fā)生。
3、充分運用最新技術(shù)手段
如人工智能、物聯(lián)網(wǎng)、5G等豐富數(shù)據(jù)源和數(shù)據(jù)實時采集功能,不斷通過數(shù)據(jù)交叉驗證等方式提升對編碼和DRGs分組準確性的判斷。
隨著人工智能技術(shù)的快速發(fā)展,可以考慮借助人工智能的技術(shù)通過“智能編碼”的應(yīng)用,從電子病歷中通過語義分析的技術(shù)直接提取出關(guān)鍵主題信息,再利用深度學(xué)習(xí)的技術(shù)將主題信息進行分析對應(yīng)到出院診斷,醫(yī)生對診斷分析結(jié)果進行復(fù)核,并對應(yīng)到編碼,從而提升編碼員編碼的準確性,并反向監(jiān)管編碼與病案首頁數(shù)據(jù)質(zhì)量。
但是,醫(yī)保局在進行DRGs支付時,主要應(yīng)用的分組數(shù)據(jù)來源于病案首頁,盡管有部分廠商現(xiàn)在嘗試利用人工智能技術(shù),將數(shù)據(jù)采集從病案首頁擴展到電子病歷,無論是病案首頁,還是電子病歷,都是在病人出院后的結(jié)果數(shù)據(jù),無法對病人在住院過程中的實時數(shù)據(jù)進行實時采集和過程管控。
建議可以充分利用物聯(lián)網(wǎng)手段采集與病案內(nèi)容相關(guān)的護理數(shù)據(jù)、醫(yī)療器械數(shù)據(jù)、環(huán)境數(shù)據(jù)、患者數(shù)據(jù),采用大數(shù)據(jù)技術(shù)對病案內(nèi)容進行交叉驗證,從而大大提高病案數(shù)據(jù)的完整性、真實性、及時性和可信度,同時也便于醫(yī)院和醫(yī)生對病人住院的治療過程進行更精準的臨床過程管理,和使用藥品、耗材等的成本管控。
對于醫(yī)保部門來說,還有利于運用這些過程數(shù)據(jù)與編碼數(shù)據(jù)進行交叉驗證,有利于結(jié)合過程數(shù)據(jù)對編碼的準確性進行進一步的輔助確認。
4、構(gòu)建完善的DRGs費用、編碼及數(shù)據(jù)質(zhì)量審查及監(jiān)管機制
編碼決定了DRGs 的分組及費用支付的標準。因此國家醫(yī)保局應(yīng)該成立專門的組織來專職負責(zé)構(gòu)建完善的DRGs費用、編碼及數(shù)據(jù)質(zhì)量審查及監(jiān)管機制。
未來實行DRGs支付制度改革,病案首頁的數(shù)據(jù)質(zhì)量將直接關(guān)系到醫(yī)院的經(jīng)營收益,從國外經(jīng)驗來看,實行DRGs支付后,一些醫(yī)療可能會存在高編碼傾向,也要求監(jiān)管部門通過規(guī)范臨床數(shù)據(jù),加強對病案首頁的審核監(jiān)管來避免高編碼行為。這些都要求對病案首頁的數(shù)據(jù)質(zhì)量給予高度重視。
5、建立有針對性的高編碼風(fēng)險監(jiān)管的獎懲機制
根據(jù)國際經(jīng)驗,實行DRG付費后高編碼的現(xiàn)象會根據(jù)不同的制度設(shè)計呈現(xiàn)不同的特點,根據(jù)對國外的文獻梳理發(fā)現(xiàn),高編碼風(fēng)險的可能性和影響因素,因不同市場、控制和病例組合系統(tǒng)而存在不同的特點。具體如下圖所示:
圖4 DRGs系統(tǒng)高編碼風(fēng)險的影響因素
因此,建議醫(yī)保局結(jié)合DRGs支付方式改革的目標、系統(tǒng)的特點,在制度層面綜合考慮設(shè)計有針對性的高編碼風(fēng)險監(jiān)管的獎懲措施,盡量降低高編碼的風(fēng)險。
6、加強對專業(yè)人才的培養(yǎng)與培訓(xùn),特別是對二級醫(yī)院編碼的應(yīng)用培訓(xùn)
DRG涉及到編碼、病案、分組、權(quán)重與費率測算、質(zhì)量監(jiān)管等系列專業(yè)性極強的關(guān)鍵技術(shù)環(huán)節(jié),從目前我國的人才現(xiàn)狀來看,還需要持續(xù)加強對不同領(lǐng)域?qū)I(yè)人才的強化培訓(xùn)與持續(xù)培養(yǎng)機制的建設(shè),為DRG支付體系改革的持續(xù)發(fā)展提供專業(yè)的人才保障。
特別是基層醫(yī)院、二級醫(yī)院、民營醫(yī)院等,由于醫(yī)院信息化水平低下,缺乏專業(yè)的病案與編碼人才,臨床醫(yī)生對臨床數(shù)據(jù)尤其是編碼的準確性重視不夠等,長期以來數(shù)據(jù)質(zhì)量低下,亟需提升與改善。需要通過專業(yè)化的培訓(xùn)以及借助智能編碼等信息化手段,快速提升編碼準確性,確保 DRGs分組的準確性以及支付方式改革的順利開展。
7、智能編碼應(yīng)用試點先行,逐步推廣
當前,病案首頁數(shù)據(jù)質(zhì)量問題是一個普遍存在的問題,智能編碼廠商的信息化軟件系統(tǒng)的應(yīng)用也是處于研發(fā)和試點階段,建議國家醫(yī)保局可以充分整合各廠商的產(chǎn)品優(yōu)勢,尋找基礎(chǔ)條件好的省市及重點醫(yī)院開展試點,先行先試,在總結(jié)試點經(jīng)驗的基礎(chǔ)上進行逐步推廣。
8、頒布專門的法律法規(guī)保障DRG支付體系的權(quán)威性和順利推進執(zhí)行
DRG支付體系改革是改變醫(yī)療衛(wèi)生生態(tài)體系利益分配格局的一次衛(wèi)生經(jīng)濟改革,涉及產(chǎn)業(yè)鏈條里的各方利益博弈,從國外經(jīng)驗來看,為了更好的保障各方利益,很多頂層設(shè)計的規(guī)則、制度、標準需要以法律的形式進行明確,以更好的體現(xiàn)DRG 支付改革的權(quán)威性,確保改革能夠順利推進執(zhí)行。
因此,中國需要結(jié)合DRG頂層設(shè)計方案確定的系列規(guī)則、制度、標準及利益主體的談判機制、組織形式及組織保障、數(shù)據(jù)如DRGs分組及編碼的標準、質(zhì)量監(jiān)管等通過立法的方式予以明確。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
技術(shù)文庫
最新活動更多
- 1 2025高端醫(yī)療器械國產(chǎn)替代提速,這些賽道值得關(guān)注!
- 2 多數(shù)人錯估了關(guān)稅將對中國醫(yī)藥產(chǎn)業(yè)的影響
- 3 一季度醫(yī)療儀器及器械進出口報告:前十大出口市場在哪?
- 4 認購火爆,映恩生物打響18A IPO重啟信號槍
- 5 中國創(chuàng)新藥出海:機遇、挑戰(zhàn)與未來展望
- 6 核藥賽道解碼:高壁壘、國產(chǎn)替代與千億市場卡位
- 7 創(chuàng)新藥是避風(fēng)港,更是發(fā)射臺!
- 8 第一醫(yī)藥扣非凈利潤僅687.40萬元:上海“隱形土豪”要再沉淀沉淀
- 9 隱匿的醫(yī)療大佬,10年干出千億級公司
- 10 3月生物醫(yī)藥產(chǎn)業(yè)100個項目獲投,廣東最吸金