田 琪 陳雅妮 韓喆僖 呂旭東
(浙江大學(xué)生物醫(yī)學(xué)工程與儀器科學(xué)學(xué)院 杭州 310007)
臨床數(shù)據(jù)是記錄臨床信息的載體。數(shù)據(jù)能夠準(zhǔn)確、完整地反映所記錄的臨床事實(shí),是保證數(shù)據(jù)有效利用的重要前提[1]。臨床數(shù)據(jù)的質(zhì)量問(wèn)題會(huì)嚴(yán)重影響臨床工作正常開(kāi)展,對(duì)患者生命安全和社會(huì)經(jīng)濟(jì)發(fā)展造成負(fù)擔(dān)[2]。美國(guó)國(guó)家衛(wèi)生信息協(xié)調(diào)辦公室(Office of the National Coordinator for Health Information Technology,ONCHIT)報(bào)告中指出可預(yù)防醫(yī)療錯(cuò)誤在美國(guó)每年導(dǎo)致超過(guò)4萬(wàn)人死亡,患者數(shù)據(jù)不匹配、診斷數(shù)據(jù)缺失等數(shù)據(jù)質(zhì)量問(wèn)題是造成醫(yī)療錯(cuò)誤的重要原因之一?;颊邤?shù)據(jù)不匹配也是35%醫(yī)療保險(xiǎn)拒賠理由,大約每年造成醫(yī)院120萬(wàn)美元的損失[3-4]。臨床數(shù)據(jù)質(zhì)量評(píng)估是通過(guò)科學(xué)手段發(fā)現(xiàn)臨床數(shù)據(jù)中質(zhì)量問(wèn)題的過(guò)程,是了解和改善臨床數(shù)據(jù)質(zhì)量的重要環(huán)節(jié)[5]。研究者基于質(zhì)量評(píng)估結(jié)果判定數(shù)據(jù)是否可用,或針對(duì)暴露的數(shù)據(jù)質(zhì)量問(wèn)題采取相應(yīng)改善措施,提高數(shù)據(jù)質(zhì)量[6]。錯(cuò)誤或無(wú)效的評(píng)估結(jié)果可能導(dǎo)致數(shù)據(jù)應(yīng)用事故,威脅生命財(cái)產(chǎn)安全。數(shù)據(jù)質(zhì)量評(píng)估流程標(biāo)準(zhǔn)化有利于保證評(píng)估結(jié)果準(zhǔn)確性與有效性,然而實(shí)現(xiàn)標(biāo)準(zhǔn)化質(zhì)量評(píng)估面臨巨大挑戰(zhàn)。一方面,雖然多數(shù)學(xué)者對(duì)“臨床數(shù)據(jù)質(zhì)量是一個(gè)包含完整性、合理性等多維度的復(fù)雜概念”這一觀(guān)點(diǎn)已經(jīng)達(dá)成共識(shí)[7],但是每種維度代表哪些臨床數(shù)據(jù)問(wèn)題仍未達(dá)成一致。例如評(píng)估人A認(rèn)為的完整性代表數(shù)據(jù)項(xiàng)和數(shù)據(jù)值不能缺失,而評(píng)估人B理解的完整性則可能是數(shù)據(jù)總量不能缺失。由于評(píng)估人對(duì)于質(zhì)量維度的理解不一致,兩人對(duì)數(shù)據(jù)質(zhì)量的衡量也就不一致,導(dǎo)致各自評(píng)估結(jié)果互相毫無(wú)意義。另外不同研究者對(duì)質(zhì)量維度的認(rèn)知不一致會(huì)造成評(píng)估人沒(méi)有全面理解維度包含的數(shù)據(jù)質(zhì)量問(wèn)題,導(dǎo)致評(píng)估結(jié)果無(wú)法全面反映數(shù)據(jù)質(zhì)量問(wèn)題。另一方面,對(duì)于每種評(píng)估問(wèn)題應(yīng)當(dāng)采取哪種評(píng)估手段取決于評(píng)估人的經(jīng)驗(yàn)和技術(shù)實(shí)施水平。大多數(shù)研究都根據(jù)評(píng)估人經(jīng)驗(yàn)選擇評(píng)估方法,方法適宜程度和實(shí)施效果因人而異[7],難以保證質(zhì)量評(píng)估的標(biāo)準(zhǔn)化。因此為促進(jìn)臨床數(shù)據(jù)質(zhì)量評(píng)估的標(biāo)準(zhǔn)化,首先需要對(duì)臨床數(shù)據(jù)質(zhì)量有準(zhǔn)確、完善的認(rèn)知,其次減少評(píng)估流程對(duì)人工的依賴(lài),提升質(zhì)量評(píng)估的自動(dòng)化程度[8]。
Weiskopf 等人在2011年通過(guò)文獻(xiàn)綜述,依據(jù)各維度在文獻(xiàn)中的出現(xiàn)頻次,得到5種高度關(guān)注的質(zhì)量維度:完整性、合理性、準(zhǔn)確性、一致性、時(shí)間性[7]。Kahn等人在2016年通過(guò)文獻(xiàn)綜述與專(zhuān)家討論方式,提出包含完整性、合理性、一致性3種維度的質(zhì)量評(píng)估框架。該研究中Kahn對(duì)每種維度都定義了若干評(píng)估指標(biāo)。評(píng)估指標(biāo)是對(duì)質(zhì)量維度相關(guān)質(zhì)量問(wèn)題的詳細(xì)描述[9]。Johnson等人也基于文獻(xiàn)構(gòu)建一套臨床數(shù)據(jù)質(zhì)量的本體。該本體中包含完整性、一致性、時(shí)間性、合理性4個(gè)質(zhì)量維度,每個(gè)維度同樣定義了若干指標(biāo)[8]。Johnson描述質(zhì)量評(píng)估中質(zhì)量維度、實(shí)施手段等概念之間的關(guān)系及相關(guān)屬性,初步描述評(píng)估指標(biāo)自動(dòng)化執(zhí)行的思路[8]。目前研究中存在一些不足:第一,當(dāng)前研究者在構(gòu)建指標(biāo)時(shí)考慮并不全面。例如Kahn并未將與需求相關(guān)的質(zhì)量特性納入指標(biāo)體系[9],Johnson則沒(méi)有考慮數(shù)據(jù)重復(fù)問(wèn)題[8];第二,目前指標(biāo)并未實(shí)現(xiàn)對(duì)一類(lèi)數(shù)據(jù)質(zhì)量問(wèn)題的唯一定義,研究者仍會(huì)對(duì)相同指標(biāo)有不同理解。第三,現(xiàn)有研究主要基于文獻(xiàn)知識(shí)來(lái)構(gòu)建指標(biāo)。雖然文獻(xiàn)是相關(guān)知識(shí)的可靠來(lái)源,但是指標(biāo)構(gòu)建缺少臨床實(shí)際數(shù)據(jù)作為基礎(chǔ),降低指標(biāo)可信度。第四,Johnson在本體中雖然描述了指標(biāo)和評(píng)估方法之間的關(guān)系,但是缺少每項(xiàng)指標(biāo)與具體實(shí)施方法之間的關(guān)聯(lián)。針對(duì)以上問(wèn)題,本研究通過(guò)結(jié)合文獻(xiàn)知識(shí)與實(shí)際臨床數(shù)據(jù)問(wèn)題,構(gòu)建相對(duì)全面的對(duì)質(zhì)量評(píng)估問(wèn)題進(jìn)行唯一描述的數(shù)據(jù)質(zhì)量評(píng)估指標(biāo),促進(jìn)領(lǐng)域?qū)εR床數(shù)據(jù)質(zhì)量理解的一致性。此外本研究依據(jù)的指標(biāo)來(lái)源對(duì)每項(xiàng)指標(biāo)所適用的評(píng)估方法進(jìn)行描述,構(gòu)建評(píng)估指標(biāo)與具體評(píng)估方法之間的關(guān)系,為評(píng)估指標(biāo)的自動(dòng)化評(píng)估研究提供支持。
3.1.1 文獻(xiàn)檢索與整理 通過(guò)對(duì)國(guó)內(nèi)外文獻(xiàn)數(shù)據(jù)庫(kù)進(jìn)行檢索來(lái)收集相關(guān)文獻(xiàn)。對(duì)于英文文獻(xiàn),選擇PubMed作為檢索數(shù)據(jù)庫(kù)以提高臨床相關(guān)文獻(xiàn)的檢索相關(guān)性。以關(guān)鍵字"data quality","quality of data"對(duì)標(biāo)題和摘要進(jìn)行檢索,時(shí)間限定為1998-2019年,共得到802篇文獻(xiàn),通過(guò)兩輪篩選剔除不相關(guān)文獻(xiàn)。首先,基于文獻(xiàn)標(biāo)題和摘要,剔除研究對(duì)象不是電子病歷或醫(yī)院信息系統(tǒng)相關(guān)數(shù)據(jù)或臨床研究所收集數(shù)據(jù)的文獻(xiàn)。對(duì)無(wú)法確定的文獻(xiàn)進(jìn)行全文閱讀。本輪篩選排除267篇非相關(guān)文獻(xiàn)。剩余535篇文獻(xiàn),基于標(biāo)題和摘要保留同時(shí)滿(mǎn)足以下兩個(gè)條件的文獻(xiàn):研究?jī)?nèi)容含有數(shù)據(jù)質(zhì)量維度或質(zhì)量評(píng)估框架;作者對(duì)質(zhì)量維度、特性提出個(gè)人觀(guān)點(diǎn)。第2輪篩選最終排除509篇文獻(xiàn)。對(duì)剩余的20篇文獻(xiàn)[6-25]基于引文進(jìn)行關(guān)聯(lián)查詢(xún),對(duì)得到的文獻(xiàn)采用同樣流程進(jìn)行篩選,最終再納入3篇相關(guān)文獻(xiàn)[26-28],累計(jì)得到23篇相關(guān)英文文獻(xiàn)。對(duì)于中文文獻(xiàn),選擇萬(wàn)方、維普和中國(guó)知網(wǎng)3個(gè)文獻(xiàn)庫(kù)。檢索條件為主題中關(guān)鍵字為“數(shù)據(jù)質(zhì)量”且摘要中包含“臨床數(shù)據(jù)”,時(shí)間限定為1998-2019年。去除重復(fù)后共得到103篇相關(guān)文獻(xiàn)。閱讀文獻(xiàn)標(biāo)題、摘要,篩選其中與臨床數(shù)據(jù)質(zhì)量維度或特性相關(guān)的文章。對(duì)無(wú)法確定的文章進(jìn)行全文閱讀。經(jīng)過(guò)篩選,得到4篇相關(guān)中文文獻(xiàn)[29-32]。對(duì)其進(jìn)行關(guān)聯(lián)查詢(xún)和篩選,發(fā)現(xiàn)兩篇相關(guān)中文文獻(xiàn)[33,34]以及1篇相關(guān)英文文獻(xiàn)[35]。綜上最終得到24篇英文文獻(xiàn)、6篇中文文獻(xiàn)。
3.1.2 基于文獻(xiàn)的語(yǔ)料集整理 為收集文獻(xiàn)中碎片化數(shù)據(jù)質(zhì)量知識(shí),對(duì)納入的30篇文獻(xiàn)進(jìn)行全文閱讀,摘錄其中質(zhì)量維度的相關(guān)描述。摘錄遵循以下3條準(zhǔn)則以確保內(nèi)容相關(guān):文獻(xiàn)中關(guān)于數(shù)據(jù)質(zhì)量維度的定義;對(duì)維度的解釋說(shuō)明;所列舉的實(shí)際數(shù)據(jù)質(zhì)量問(wèn)題示例。最終得到包含247個(gè)段落或句子的語(yǔ)料集。
3.1.3 問(wèn)題數(shù)據(jù)報(bào)告收集 在實(shí)際臨床數(shù)據(jù)應(yīng)用中,數(shù)據(jù)使用者會(huì)記錄數(shù)據(jù)中的問(wèn)題,形成數(shù)據(jù)問(wèn)題報(bào)告,以便提高數(shù)據(jù)質(zhì)量。數(shù)據(jù)問(wèn)題報(bào)告中包含豐富的數(shù)據(jù)質(zhì)量知識(shí),為構(gòu)建指標(biāo)提供可用資源。本研究選擇區(qū)域衛(wèi)生信息平臺(tái)構(gòu)建和臨床科研表單數(shù)據(jù)采集兩類(lèi)臨床數(shù)據(jù)應(yīng)用場(chǎng)景,收集該場(chǎng)景數(shù)據(jù)問(wèn)題報(bào)告。構(gòu)建區(qū)域化衛(wèi)生信息平臺(tái)是我國(guó)基礎(chǔ)衛(wèi)生建設(shè)的重要任務(wù),國(guó)內(nèi)各省市均開(kāi)展相關(guān)建設(shè)[36];注冊(cè)研究是針對(duì)性地收集特定診斷或病情數(shù)據(jù)并開(kāi)展相關(guān)研究工作的一種常見(jiàn)臨床研究手段[37]。針對(duì)以上兩類(lèi)常見(jiàn)的應(yīng)用場(chǎng)景,分別選擇兩個(gè)典型案例進(jìn)行數(shù)據(jù)問(wèn)題收集。案例1:哈爾濱市2020年4-9月間,13家醫(yī)療機(jī)構(gòu)產(chǎn)生25份數(shù)據(jù)問(wèn)題報(bào)告,總計(jì)1 810條數(shù)據(jù)問(wèn)題。每份報(bào)告涉及1家醫(yī)療機(jī)構(gòu),報(bào)告中的每條數(shù)據(jù)問(wèn)題代表該醫(yī)療機(jī)構(gòu)1張數(shù)據(jù)庫(kù)表中所發(fā)現(xiàn)的一類(lèi)數(shù)據(jù)質(zhì)量問(wèn)題。案例2:山西省某三甲醫(yī)院2020年5-8月間,面向區(qū)域衛(wèi)生健康信息平臺(tái)構(gòu)建的19份數(shù)據(jù)問(wèn)題報(bào)告,總計(jì)1 372條數(shù)據(jù)問(wèn)題。每份報(bào)告涉及該醫(yī)院一類(lèi)臨床業(yè)務(wù)數(shù)據(jù)庫(kù)表的數(shù)據(jù)質(zhì)量問(wèn)題,其中每條問(wèn)題代表1張數(shù)據(jù)庫(kù)表中的一類(lèi)數(shù)據(jù)質(zhì)量問(wèn)題。案例3:國(guó)內(nèi)某冠心病患者注冊(cè)數(shù)據(jù)集。該研究數(shù)據(jù)由16家醫(yī)療機(jī)構(gòu)共同參與收集,從2016年至今累積收集超過(guò)33 000例冠心病患者臨床、隨訪(fǎng)數(shù)據(jù)。本研究收集該研究2019年6月-2020年1月期間6份數(shù)據(jù)問(wèn)題報(bào)告,總計(jì)207條數(shù)據(jù)質(zhì)量問(wèn)題。案例4:國(guó)內(nèi)某老年糖尿病患者注冊(cè)研究數(shù)據(jù)集。該研究數(shù)據(jù)由全國(guó)141家醫(yī)療機(jī)構(gòu)共同參與收集,2015-2017年間累積收集2 806例老年糖尿病患者(年齡>65歲)診療和隨訪(fǎng)數(shù)據(jù)。收集該研究2016年7月-2017年1月期間的8份數(shù)據(jù)問(wèn)題報(bào)告,總計(jì)323條數(shù)據(jù)質(zhì)量問(wèn)題。案例1代表在區(qū)域衛(wèi)生信息平臺(tái)構(gòu)建中多家不同醫(yī)療機(jī)構(gòu)所發(fā)現(xiàn)的數(shù)據(jù)質(zhì)量問(wèn)題;案例2則代表同一家機(jī)構(gòu)在長(zhǎng)期多次數(shù)據(jù)遞交中所發(fā)現(xiàn)的數(shù)據(jù)質(zhì)量問(wèn)題。兩個(gè)案例結(jié)合能有效代表該場(chǎng)景中遇到的數(shù)據(jù)質(zhì)量問(wèn)題,具有典型性。案例3和案例4則是多中心、跨地區(qū)、大規(guī)模的患者注冊(cè)研究,具有典型性。
為使指標(biāo)清晰、唯一描述數(shù)據(jù)質(zhì)量問(wèn)題,對(duì)指標(biāo)進(jìn)行結(jié)構(gòu)化描述十分必要。Johnson曾在研究中提出一套臨床數(shù)據(jù)質(zhì)量本體,對(duì)質(zhì)量評(píng)估相關(guān)概念進(jìn)行定義[6]。我國(guó)衛(wèi)健委發(fā)布的電子病歷數(shù)據(jù)評(píng)估相關(guān)標(biāo)準(zhǔn)中也對(duì)指標(biāo)進(jìn)行一定描述[38-39]。Johnson本體和我國(guó)相關(guān)標(biāo)準(zhǔn)中出現(xiàn)的11個(gè)與質(zhì)量評(píng)估相關(guān)的概念,見(jiàn)表1。本研究選擇其中9個(gè)概念作為指標(biāo)屬性。其中問(wèn)題描述和評(píng)估對(duì)象兩個(gè)屬性是區(qū)分指標(biāo)的兩個(gè)重要屬性,分別代表指標(biāo)所描述的臨床問(wèn)題類(lèi)型以及指標(biāo)所適用的數(shù)據(jù)對(duì)象類(lèi)別。沒(méi)有選擇數(shù)據(jù)集、評(píng)估結(jié)果兩個(gè)概念作為指標(biāo)屬性,因?yàn)楸狙芯酷槍?duì)臨床數(shù)據(jù)提出評(píng)估指標(biāo),不面向其他領(lǐng)域數(shù)據(jù)集;評(píng)估結(jié)果也不是描述評(píng)估過(guò)程的屬性。
表1 指標(biāo)屬性以及對(duì)應(yīng)文獻(xiàn)依據(jù)
續(xù)表1
3.3.1 確定熱點(diǎn)維度 臨床數(shù)據(jù)質(zhì)量維度是用來(lái)描述臨床數(shù)據(jù)質(zhì)量特性的專(zhuān)用概念。統(tǒng)計(jì)文獻(xiàn)中不同維度出現(xiàn)的次數(shù)得到當(dāng)前關(guān)注高的質(zhì)量維度[8]。統(tǒng)計(jì)所得文獻(xiàn)中各維度的出現(xiàn)頻次。由于目前缺乏統(tǒng)一術(shù)語(yǔ)標(biāo)準(zhǔn),相同維度可能會(huì)使用同義詞來(lái)表示,例如consistency和conformance, accuracy 和correctness等;不同含義的術(shù)語(yǔ)在不同研究中也可能代表相同維度。因此根據(jù)維度定義統(tǒng)計(jì)相同維度出現(xiàn)的次數(shù)并記錄相關(guān)同義詞,最后得到當(dāng)前關(guān)注最高的5種維度,構(gòu)建相關(guān)指標(biāo)。
3.3.2 基于語(yǔ)料分析歸納指標(biāo) 指標(biāo)歸納流程,見(jiàn)圖1。(1)語(yǔ)料分解。從文獻(xiàn)中收集的語(yǔ)料可能存在一條語(yǔ)料描述多種質(zhì)量問(wèn)題的情況。為實(shí)現(xiàn)指標(biāo)對(duì)質(zhì)量問(wèn)題的唯一表達(dá),對(duì)語(yǔ)料進(jìn)行分析與拆解。例如從文獻(xiàn)[22]中收集到的語(yǔ)料“數(shù)據(jù)一致是指相同數(shù)據(jù)在不同應(yīng)用、系統(tǒng)中的描述應(yīng)該一致,例如患者的醫(yī)療檔案編號(hào)。此外相關(guān)聯(lián)的數(shù)據(jù)也應(yīng)當(dāng)不沖突”。該語(yǔ)料描述了兩種情況,因此將其拆分為“數(shù)據(jù)一致是指相同數(shù)據(jù)在不同應(yīng)用、系統(tǒng)中的描述應(yīng)該一致,例如患者的醫(yī)療檔案編號(hào)”,“相關(guān)聯(lián)的數(shù)據(jù)也應(yīng)當(dāng)不沖突”兩條描述。(2)語(yǔ)料分類(lèi)。依據(jù)內(nèi)容對(duì)語(yǔ)料進(jìn)行分類(lèi)。第1類(lèi)語(yǔ)料是文獻(xiàn)作者對(duì)相同類(lèi)型臨床數(shù)據(jù)質(zhì)量問(wèn)題的歸納總結(jié),例如 “數(shù)據(jù)包含任務(wù)所需的所有數(shù)據(jù)項(xiàng)目”;第2類(lèi)語(yǔ)料通常是文獻(xiàn)作者用來(lái)舉例說(shuō)明的示例,需經(jīng)過(guò)歸納總結(jié)才能表示為相應(yīng)的評(píng)估指標(biāo),例如“數(shù)據(jù)應(yīng)包含患者的血壓、心率值”。(3)指標(biāo)合并。對(duì)于第1類(lèi)語(yǔ)料,通過(guò)分析語(yǔ)料語(yǔ)義對(duì)相似觀(guān)點(diǎn)進(jìn)行合并,從而形成對(duì)應(yīng)的評(píng)估指標(biāo)。語(yǔ)料語(yǔ)義分析主要從其描述的數(shù)據(jù)對(duì)象(數(shù)據(jù)值、數(shù)據(jù)記錄等)、數(shù)據(jù)問(wèn)題(數(shù)據(jù)缺數(shù)、重復(fù)等)或數(shù)據(jù)約束(不為空、不重復(fù)等)描述、對(duì)應(yīng)的質(zhì)量維度(完整性、合理性)3個(gè)方面進(jìn)行考慮。(4)指標(biāo)映射。將第2類(lèi)語(yǔ)料與步驟3中已得到的指標(biāo)進(jìn)行映射,剔除能映射到指標(biāo)的語(yǔ)料,避免指標(biāo)重復(fù)。(5)歸納總結(jié)。對(duì)于步驟4中尚未對(duì)應(yīng)指標(biāo)的語(yǔ)料,基于其含義歸納總結(jié)相應(yīng)的臨床數(shù)據(jù)質(zhì)量評(píng)估指標(biāo)。與步驟3中類(lèi)似,將語(yǔ)料描述抽象為3個(gè)部分:數(shù)據(jù)對(duì)象、數(shù)據(jù)問(wèn)題或數(shù)據(jù)約束以及對(duì)應(yīng)的維度。最終將所有語(yǔ)料轉(zhuǎn)化為相應(yīng)的評(píng)估指標(biāo)。
圖1 指標(biāo)歸納流程
3.3.3 基于數(shù)據(jù)問(wèn)題報(bào)告歸納指標(biāo) 本研究所收集的問(wèn)題數(shù)據(jù)報(bào)告主要包含數(shù)據(jù)庫(kù)表名、問(wèn)題描述、不符合要求數(shù)3部分內(nèi)容。其中問(wèn)題描述部分是對(duì)質(zhì)量問(wèn)題發(fā)生的位置、對(duì)象以及對(duì)質(zhì)量問(wèn)題的描述。問(wèn)題數(shù)據(jù)分析總結(jié)流程,見(jiàn)圖2。首先,對(duì)于數(shù)據(jù)問(wèn)題報(bào)告中的每條記錄,分析問(wèn)題描述部分,獲取兩部分關(guān)鍵信息:?jiǎn)栴}發(fā)生的數(shù)據(jù)對(duì)象和該質(zhì)量問(wèn)題的描述。其中根據(jù)其數(shù)據(jù)對(duì)象的描述,將其抽象為數(shù)據(jù)元、數(shù)據(jù)值或數(shù)據(jù)記錄等。其次,根據(jù)所抽象的評(píng)估對(duì)象以及問(wèn)題描述,將其與已成立的指標(biāo)進(jìn)行映射匹配。若評(píng)估的數(shù)據(jù)對(duì)象和質(zhì)量問(wèn)題描述都能匹配至對(duì)應(yīng)指標(biāo)則說(shuō)明該條問(wèn)題記錄已存在對(duì)應(yīng)指標(biāo);若沒(méi)有對(duì)應(yīng)的指標(biāo)與問(wèn)題關(guān)聯(lián),則針對(duì)該問(wèn)題新建指標(biāo)。
圖2 數(shù)據(jù)問(wèn)題歸納為指標(biāo)的流程
3.3.4 指標(biāo)信息補(bǔ)充 對(duì)于最終得到的指標(biāo),按照其指標(biāo)屬性定義,依據(jù)指標(biāo)所來(lái)源的文獻(xiàn)描述或案例場(chǎng)景的實(shí)際情況,對(duì)其補(bǔ)充評(píng)估方法、適用場(chǎng)景等相關(guān)信息。
Kahn在2016年提出一套質(zhì)量評(píng)估框架,在其研究中將個(gè)人提出的框架與前人研究框架進(jìn)行比較,證明個(gè)人提出的評(píng)估框架具有一定全面性[9]。我國(guó)衛(wèi)健委發(fā)布的《電子病歷系統(tǒng)應(yīng)用水平分級(jí)評(píng)價(jià)標(biāo)準(zhǔn)》[38](下文簡(jiǎn)稱(chēng)國(guó)標(biāo))是針對(duì)電子病歷應(yīng)用評(píng)級(jí)的質(zhì)量要求標(biāo)準(zhǔn),按照維度對(duì)不同類(lèi)別臨床數(shù)據(jù)提出相應(yīng)的質(zhì)量評(píng)估需求。病房病歷是國(guó)標(biāo)中的一個(gè)類(lèi)別,其中包括患者住院病歷所涉及的相關(guān)數(shù)據(jù),這些數(shù)據(jù)因?yàn)楹胸S富臨床信息,有很高的二次利用價(jià)值,其數(shù)據(jù)質(zhì)量問(wèn)題被廣泛關(guān)注[40]。本研究設(shè)計(jì)以下對(duì)比試驗(yàn)來(lái)驗(yàn)證研究所提出指標(biāo)的全面性和描述唯一性。選擇國(guó)標(biāo)中病房病歷類(lèi)別相關(guān)的質(zhì)量評(píng)估需求作為金標(biāo)準(zhǔn),將本研究提出的評(píng)估指標(biāo)和Kahn框架中所提出的評(píng)估指標(biāo)與國(guó)標(biāo)的質(zhì)量需求進(jìn)行對(duì)應(yīng),比較兩種指標(biāo)的完善程度和對(duì)應(yīng)需求的難易程度。
基于對(duì)30篇文獻(xiàn)的分析,出現(xiàn)次數(shù)最高的前5種質(zhì)量維度和定義,見(jiàn)表2,分別為完整性(28/30)、準(zhǔn)確性(24/30)、時(shí)間性(21/30)、一致性(18/30)和合理性(18/30)。
表2 質(zhì)量維度、相關(guān)術(shù)語(yǔ)和定義
4.2.1 指標(biāo)及其定義 基于30篇相關(guān)文獻(xiàn)以及3 712條臨床實(shí)際問(wèn)題,本研究從5種質(zhì)量維度歸納出43項(xiàng)評(píng)估指標(biāo)。各指標(biāo)代碼、名稱(chēng)和指標(biāo)來(lái)源,見(jiàn)表3-7。43項(xiàng)指標(biāo)在文獻(xiàn)中均有提及,29項(xiàng)指標(biāo)源自數(shù)據(jù)問(wèn)題報(bào)告。
表3 數(shù)據(jù)完整性相關(guān)指標(biāo)
表4 數(shù)據(jù)合理性相關(guān)指標(biāo)
表5 數(shù)據(jù)一致性相關(guān)指標(biāo)
表6 數(shù)據(jù)時(shí)間性相關(guān)指標(biāo)
表7 數(shù)據(jù)準(zhǔn)確性相關(guān)指標(biāo)
4.2.2 結(jié)果驗(yàn)證 本研究選擇國(guó)標(biāo)中住院病歷相關(guān)質(zhì)量需求作為金標(biāo)準(zhǔn),比較Kahn指標(biāo)、本研究所提出的評(píng)估指標(biāo)與國(guó)標(biāo)需求的對(duì)應(yīng)唯一性。結(jié)果表明國(guó)標(biāo)中關(guān)于住院病歷的質(zhì)量需求能夠與本研究所提出的指標(biāo)實(shí)現(xiàn)一對(duì)一對(duì)應(yīng);而在與Kahn的對(duì)應(yīng)過(guò)程中,需求(1-4),(6-7)沒(méi)有找到對(duì)應(yīng)指標(biāo);需求(5)、(12-13)能夠明確對(duì)應(yīng)到Kahn框架中的某個(gè)指標(biāo);需求(8-11)能模糊對(duì)應(yīng)到Kahn指標(biāo)。本研究所提出的質(zhì)量評(píng)估指標(biāo)能夠更全面、更準(zhǔn)確地對(duì)應(yīng)到實(shí)際評(píng)估需求。
4.2.3 結(jié)果討論 標(biāo)準(zhǔn)化的臨床數(shù)據(jù)質(zhì)量評(píng)估對(duì)于提高臨床數(shù)據(jù)質(zhì)量意義重大。構(gòu)建全面、描述唯一的質(zhì)量評(píng)估指標(biāo)是實(shí)現(xiàn)標(biāo)準(zhǔn)化評(píng)估的重要前提。本研究結(jié)合文獻(xiàn)知識(shí)與實(shí)際數(shù)據(jù)問(wèn)題,提出一套臨床數(shù)據(jù)質(zhì)量評(píng)估指標(biāo),詳細(xì)描述指標(biāo)所適用的評(píng)估方法,為實(shí)現(xiàn)標(biāo)準(zhǔn)化、自動(dòng)化的臨床數(shù)據(jù)質(zhì)量評(píng)估奠定基礎(chǔ)。本研究選擇兩種不同類(lèi)型臨床場(chǎng)景數(shù)據(jù)問(wèn)題報(bào)告,收集的問(wèn)題條目數(shù)量上有較大差異,原因有以下兩點(diǎn):一是在本研究所選擇的注冊(cè)研究采集場(chǎng)景中研究人員將不同機(jī)構(gòu)數(shù)據(jù)合并后再進(jìn)行評(píng)估,因此同一份報(bào)告中不同機(jī)構(gòu)的相同數(shù)據(jù)問(wèn)題被合并在一起;二是注冊(cè)研究場(chǎng)景中各機(jī)構(gòu)會(huì)根據(jù)報(bào)告迅速地采取相關(guān)措施,因此后續(xù)報(bào)告中數(shù)據(jù)問(wèn)題會(huì)逐漸減少。然而在本研究的分析過(guò)程中,同一類(lèi)型數(shù)據(jù)問(wèn)題只要出現(xiàn)一次就會(huì)關(guān)聯(lián)相關(guān)指標(biāo),同類(lèi)型問(wèn)題出現(xiàn)的次數(shù)不會(huì)影響最終指標(biāo)結(jié)果。因此在本研究中兩種場(chǎng)景數(shù)據(jù)問(wèn)題在數(shù)目上的差異沒(méi)有影響最終建立指標(biāo)的結(jié)果。高效、自動(dòng)的數(shù)據(jù)質(zhì)量評(píng)估技術(shù)是研究者一直致力的目標(biāo)。本研究描述評(píng)估指標(biāo)所適用的評(píng)估方法,構(gòu)建評(píng)估需求與評(píng)估方法的聯(lián)系,為研究自動(dòng)化評(píng)估技術(shù)提供一定支持。統(tǒng)計(jì)指標(biāo)適用的評(píng)估方法,有29項(xiàng)指標(biāo)(67%)可以通過(guò)邏輯規(guī)則方法進(jìn)行評(píng)估,其余14項(xiàng)(33%)則適用于統(tǒng)計(jì)分析、自然語(yǔ)言處理算法等手段進(jìn)行評(píng)估。這29項(xiàng)指標(biāo)涉及5個(gè)質(zhì)量維度,其中包括數(shù)據(jù)值完整、數(shù)值合理等被大多數(shù)研究或標(biāo)準(zhǔn)所要求的評(píng)估指標(biāo),因此也說(shuō)明基于邏輯規(guī)則的評(píng)估方法是一種相對(duì)普適的評(píng)估手段。然而邏輯規(guī)則的定義與具體的知識(shí)相關(guān),目前邏輯規(guī)則的創(chuàng)建主要依賴(lài)人工完成?;诒狙芯?,研究者能夠了解適于采用邏輯規(guī)則方式進(jìn)行評(píng)估的指標(biāo),這些指標(biāo)代表了相關(guān)臨床數(shù)據(jù)質(zhì)量問(wèn)題類(lèi)型。因此如果能夠找到與這些指標(biāo)相關(guān)的評(píng)估知識(shí)源,則可以在這些知識(shí)源的基礎(chǔ)上探索自動(dòng)化評(píng)估的可能性。目前邏輯規(guī)則評(píng)估所涉及的知識(shí)包括臨床知識(shí)、通用常識(shí)以及數(shù)據(jù)知識(shí)等。臨床指南、臨床信息模型中都對(duì)這些知識(shí)有一定的描述。通過(guò)自然語(yǔ)言處理等技術(shù)提取其中的相關(guān)知識(shí)自動(dòng)化的生成評(píng)估規(guī)則是具有可行性的自動(dòng)化評(píng)估手段之一。后續(xù)本研究基于指標(biāo)探索以臨床信息模型為基礎(chǔ)的自動(dòng)化邏輯規(guī)則生成技術(shù)。
本研究通過(guò)對(duì)質(zhì)量評(píng)估相關(guān)文獻(xiàn)和實(shí)際數(shù)據(jù)問(wèn)題中相關(guān)知識(shí)進(jìn)行收集、分解、合并與歸納,基于當(dāng)前關(guān)注度較高的質(zhì)量維度,即完整性、合理性、準(zhǔn)確性、一致性、時(shí)間性,構(gòu)建包含43項(xiàng)對(duì)數(shù)據(jù)問(wèn)題進(jìn)行唯一表述的評(píng)估指標(biāo),描述各項(xiàng)指標(biāo)所適用的評(píng)估方式。通過(guò)與傳統(tǒng)指標(biāo)以及國(guó)家標(biāo)準(zhǔn)的比較,本文所提出的質(zhì)量評(píng)估指標(biāo)更全面地涵蓋國(guó)標(biāo)中的評(píng)估需求,更清晰、準(zhǔn)確地映射到現(xiàn)有國(guó)家質(zhì)量評(píng)估標(biāo)準(zhǔn)。對(duì)于臨床數(shù)據(jù)質(zhì)量評(píng)估的標(biāo)準(zhǔn)化有促進(jìn)意義。本研究也存在一些不足:首先,即使結(jié)合文獻(xiàn)與實(shí)際問(wèn)題報(bào)告總結(jié)歸納指標(biāo),仍然難以保證指標(biāo)全面性。收集文獻(xiàn)時(shí)盡量更多地納入相關(guān)文獻(xiàn),在案例選擇上充分考慮典型性,從而最大可能地代表當(dāng)前實(shí)際應(yīng)用中質(zhì)量評(píng)估的需求。其次,本研究提出的指標(biāo)需組織專(zhuān)家進(jìn)行評(píng)估和驗(yàn)證,在后續(xù)工作中將組織經(jīng)驗(yàn)豐富的專(zhuān)家對(duì)指標(biāo)進(jìn)行討論和完善[12]。