王本有,黃和平
(1.皖西學(xué)院 電子與信息工程學(xué)院,安徽 六安 237012;2.六安市人民醫(yī)院信息管理科,安徽 六安 237001)
我國人口眾多,擁有世界上五分之一的人口,因此所面臨的醫(yī)療問題非常嚴峻.我國政府對此高度重視,并不斷地推出新政策來促進我國醫(yī)療服務(wù)水平的提高和醫(yī)療資源的平衡[1],取得了長足的進步,但醫(yī)療資源和醫(yī)療壓力在城鄉(xiāng)和不同區(qū)域間的差距依舊沒有消除[2].本文對醫(yī)療垃圾數(shù)據(jù)進行統(tǒng)計分析,在時間上和空間上探討中國某地區(qū)不同醫(yī)院間的醫(yī)療壓力不平衡的現(xiàn)狀[3].
數(shù)據(jù)挖掘[4],即 DM(Data Mining),是從數(shù)據(jù)庫中發(fā)現(xiàn)知識,通過算法從海量數(shù)據(jù)中發(fā)現(xiàn)隱藏的、未知的,并有潛在價值的信息的非平凡過程.這包括數(shù)據(jù)集成、分類、聚類、預(yù)測變化、檢測異常等.文獻[5]提出了一種基于系統(tǒng)動力學(xué)技術(shù)的醫(yī)院廢棄物管理仿真模型,用來統(tǒng)計不同類型醫(yī)院的垃圾產(chǎn)生量,預(yù)測未來產(chǎn)生的廢物和治療費用,相關(guān)因數(shù)包括:床位數(shù)、服務(wù)水平、人口數(shù)量、出生率、死亡率等.文獻[6]發(fā)現(xiàn)衛(wèi)生機構(gòu)數(shù)量在不斷增加,一次性醫(yī)療產(chǎn)品的使用量也在不斷增加,導(dǎo)致了衛(wèi)生保健廢物產(chǎn)生率的增加.研究發(fā)現(xiàn)醫(yī)療廢物的產(chǎn)生率與住院病人數(shù)有很強的線性相關(guān)性,與醫(yī)院的門診病人有較弱的相關(guān)性.文獻 [7]運用人工神經(jīng)網(wǎng)絡(luò)(ANNs)和多元線性回歸(MLR)兩個預(yù)測模型,預(yù)測醫(yī)療廢物生成的速率.文獻[8]闡述臺灣醫(yī)院醫(yī)療廢物產(chǎn)生的相關(guān)因素,預(yù)測平均每天每床產(chǎn)生垃圾重量在2.6到4.1公斤.床位數(shù)量是重要的預(yù)測因素,發(fā)現(xiàn)在醫(yī)療中心,產(chǎn)生的污染廢物的平均數(shù)量是最高的.
參考以上文獻,本文旨在分析醫(yī)療壓力的不平衡性,增加了醫(yī)院職工數(shù)作為特征字段,將醫(yī)療垃圾分成3類分析,保留了醫(yī)院類型、床位數(shù)等字段,運用時間序列對垃圾產(chǎn)生量進行分析和預(yù)測,實證了不同類型醫(yī)院的貢獻度差異,發(fā)現(xiàn)了醫(yī)療保險報銷比例和病床數(shù)量是垃圾產(chǎn)生率的重要因素;發(fā)現(xiàn)了垃圾呈上升趨勢,但中心醫(yī)院的貢獻度增加很少,表明了分層醫(yī)療改革取得了較好效果.
本數(shù)據(jù)是中國某地區(qū)2010年10月至2016年8月的醫(yī)療垃圾處理記錄,總共有近64萬條.
1.1.1 醫(yī)療垃圾采集
該地區(qū)的醫(yī)療垃圾有授權(quán)定點處理單位,負責(zé)處理地區(qū)內(nèi)68家醫(yī)療機構(gòu)產(chǎn)生的垃圾.垃圾有專人進行分類包裝,用專用的包裝箱,包裝箱上粘貼有條形碼,該條形碼共有共5位信息,其中3位用作醫(yī)院代號,1位代表所在行政區(qū),最后1位是垃圾分類.垃圾在處理前必須進行登記,通過專用的計算機進行掃描、記錄稱量,并自動錄入登記日期,數(shù)據(jù)格式如表1所示.然后交給專業(yè)技術(shù)人員通過專用設(shè)備進行處理.
表1 垃圾數(shù)據(jù)表字段及功能
1.1.2 醫(yī)療垃圾分類
醫(yī)療垃圾是指由醫(yī)院產(chǎn)生,是接觸過病人血液、肉體等的污染性垃圾.醫(yī)療垃圾的危害性是普通生活垃圾的成百上千倍[9].如果對醫(yī)療垃圾處理的不合適,將對環(huán)境造成嚴重污染,也會引發(fā)傳染病.本文將醫(yī)療廢物分成感染性,BCID為0;損傷性,BCID為1;病理性,BCID為2.
感染性廢物是指被血液和其他體液污染的廢物;損傷性廢物是指醫(yī)用針頭、縫合針、玻璃試管等;病理性廢物是指人體組織、器官或體液,被污染的動物尸體等.
1.1.3 醫(yī)療垃圾清理與集成
醫(yī)療垃圾有授權(quán)定點處理單位,通過計算機掃描條形碼,垃圾重量自動錄入數(shù)據(jù)庫,記錄有序.數(shù)據(jù)清理主要集中在:第一,數(shù)據(jù)重復(fù),備份后的數(shù)據(jù)在錄入平臺沒有清理,部分數(shù)據(jù)重復(fù),根據(jù)時間清理了重復(fù)記錄;第二,個別醫(yī)院沒有持續(xù)的5年數(shù)據(jù),如企業(yè)改制,企業(yè)內(nèi)部的醫(yī)院撤銷了,私立醫(yī)院倒閉了,去除了信息不完整的醫(yī)院有3家.
數(shù)據(jù)集成:第一,數(shù)據(jù)合并.行政區(qū)域的重新劃分,有4家醫(yī)院合并成2家,按日期將數(shù)據(jù)合并,歸屬到現(xiàn)在的醫(yī)院;第二,在垃圾數(shù)據(jù)匯總后,進行聚類和貢獻度等分析,數(shù)據(jù)庫中加入了醫(yī)院職工數(shù)和床位數(shù),集成了新的數(shù)據(jù)庫.
本文中涉及的醫(yī)療機構(gòu)數(shù)據(jù)由該地區(qū)衛(wèi)生局提供,城市有17,046位專業(yè)技術(shù)人員,其中醫(yī)療服務(wù)和醫(yī)療管理部門有3,789位,如從事于血站,計劃生育,婦幼保健等,農(nóng)村僅有2,233位.根據(jù)醫(yī)療機構(gòu)床位數(shù)據(jù),該地區(qū)城市醫(yī)院擁有床位數(shù)為14,661張,其中醫(yī)療服務(wù)和醫(yī)療管理部門有床位895張,農(nóng)村醫(yī)療有床位數(shù)為3,035張.中國醫(yī)療資源高度集中于城市,農(nóng)村醫(yī)療服務(wù)供給相對不足[10][11].
1.2.1 醫(yī)療機構(gòu)基本情況
本次數(shù)據(jù)中所包含的醫(yī)療機構(gòu)有68家,包括公立醫(yī)院、衛(wèi)生院、婦幼保健院、血站、疾病控制中心、私立醫(yī)院等.其中有2家是三級甲等醫(yī)院,12家二級甲等醫(yī)院,6家二級乙等醫(yī)院,25家一級醫(yī)院,服務(wù)機構(gòu)18家,數(shù)據(jù)處理剔除了5家信息不完整的醫(yī)院.醫(yī)院分布在市區(qū)、縣城和鄉(xiāng)鎮(zhèn).
1.2.2 醫(yī)院編碼
BCID為醫(yī)院所在區(qū)域編碼,在垃圾數(shù)據(jù)表中定義為1位,取值1-9,代表行政區(qū)劃分,市區(qū)為1,市瞎8個縣區(qū),分別為2-9.
BHID為醫(yī)院代碼,用三位阿拉伯?dāng)?shù)據(jù)表示,市中心醫(yī)院為001.
通過對垃圾數(shù)據(jù)的統(tǒng)計,展示了3類垃圾的分布情況,該地區(qū)的垃圾日產(chǎn)量,市中心醫(yī)院每類垃圾占總量的比例.
圖1 感染性垃圾時間重量曲線
圖2 損傷性垃圾的時間重量曲線
圖3 病理性垃圾的時間重量曲線
醫(yī)療垃圾由定點單位專門負責(zé)處理,政府監(jiān)督,分類、包裝、運輸?shù)拳h(huán)節(jié)規(guī)范有序.通過條形碼采集垃圾信息,計算機同步錄入垃圾重量,避免了手工操作的失誤.但在2016年5、6兩個月,企業(yè)設(shè)備維護,數(shù)據(jù)缺失.企業(yè)提供了手工記錄,記錄凌亂,信息不完整,如圖1-3為3類垃圾按日重量分布圖.
把采集的數(shù)據(jù)繪制出圖形,能直觀反映數(shù)據(jù)的變化,可以看出來感染性垃圾和損傷性垃圾整體呈慢慢增長的趨勢,感染性垃圾增長幅度更大一些.感染性垃圾平均每天產(chǎn)生的垃圾重量大于2500kg,損傷性垃圾平均每天產(chǎn)生的垃圾重量大于500kg,病理性垃圾平均每天產(chǎn)生的垃圾重量大于15kg.
為了解市中心醫(yī)院的醫(yī)療垃圾產(chǎn)量與該地區(qū)63家醫(yī)療機構(gòu)垃圾產(chǎn)量的關(guān)系,分類對垃圾量進行了統(tǒng)計,垃圾重量采用年均值,如表2所示.
表2 所有醫(yī)院垃圾總重量的均值和市中心醫(yī)院垃圾總重量的均值及其比例
從表2可以看出,市中心醫(yī)院產(chǎn)生的垃圾量遠超過63家醫(yī)療機構(gòu)產(chǎn)生的垃圾重量的平均數(shù).其中感染性垃圾占比平均為15.46%,損傷性垃圾占比平均為23.88%,病理性垃圾占比平均為34.36%,最高達到38.38%,也就是說,該地區(qū)超過三分之一的病理性垃圾是由這一家醫(yī)院產(chǎn)生,而且,它所占的比例沒有下降的趨勢.市中心醫(yī)院產(chǎn)生的醫(yī)療垃圾的總重量占該地區(qū)的醫(yī)療垃圾總重量的比例雖然很高,但5年里比重總趨勢在不斷減小.
圖4可看出5年垃圾產(chǎn)量變化趨勢,用縱軸為年平均重量,橫軸為年份.藍色曲線為63家醫(yī)療機構(gòu)總的醫(yī)療垃圾重量的年均值,紅色曲線為市中心醫(yī)院的醫(yī)療垃圾重量的年均值.
圖4 醫(yī)療垃圾總量的年平均重量曲線
從表2和圖5都顯示該地區(qū)醫(yī)療垃圾總量的年均值在隨年份不斷地增加,雖然市中心醫(yī)院的醫(yī)療垃圾總量的年均值也在增加,但斜率明顯小于所有醫(yī)院醫(yī)療垃圾總量的年均值增長斜率.可以說,醫(yī)療需求在不斷地增加,但市中心醫(yī)院的醫(yī)療壓力增長趨于平穩(wěn).隨著醫(yī)療改革的深入,部分醫(yī)院逐漸被市民接受,在醫(yī)療服務(wù)中承擔(dān)的任務(wù)逐步加大.
通過對垃圾數(shù)據(jù)的相關(guān)性、聚類、貢獻度和城鄉(xiāng)區(qū)別等方面的分析,掌握垃圾數(shù)據(jù)變化規(guī)律,為管理部門預(yù)算、決策和監(jiān)管提供數(shù)據(jù)支撐.
圖5 三類垃圾重量占總重量的比例
從圖5可以看出感染性垃圾最多,占總量的79.96%,損傷性垃圾占總量的19.51%,而病理性垃圾只占0.53%.
相關(guān)性是指變量之間的一種非確定性關(guān)系.用相關(guān)系數(shù)表示變量之間的線性相關(guān)程度.相關(guān)系數(shù)(Correlation coefficient)是由著名統(tǒng)計學(xué)家卡爾·皮爾遜(Pearson)設(shè)計的統(tǒng)計指標(biāo)[10].因為相關(guān)表和相關(guān)圖無法確切地表示兩個變量之間相關(guān)的程度,在二元變量的相關(guān)性分析過程中,皮爾遜相關(guān)系數(shù)是最常用的,其計算公式如下:
相關(guān)系數(shù)的值介于–1與+1之間,即–1≤r≤+1.一般可按三級劃分:|r|<0.4為低度線性相關(guān);0.4≤|r|<0.7 為顯著性相關(guān);0.7≤|r|<1 為高度線性相關(guān).
對三類垃圾做了相關(guān)性的計算,得到如表3中的數(shù)據(jù).我們發(fā)現(xiàn)感染性垃圾和損傷性垃圾高度線性相關(guān),而病理性垃圾與感染性和損傷性垃圾顯著性相關(guān).
表3 三類垃圾相互關(guān)聯(lián)系數(shù)
聚類分析(Cluster Analysis)是對樣品或指標(biāo)進行分類的一種多元統(tǒng)計分析方法.劃分的原則是使得每個組內(nèi)的樣本之間距離最小而每個組之間的距離最大.本文運用K-means算法對醫(yī)療垃圾數(shù)據(jù)進行聚類分析[10].本文聚類的特征數(shù)據(jù)為醫(yī)院級別,職工數(shù),床位數(shù),感染性垃圾重量,損傷性垃圾重量,病理性垃圾重量.聚類只對45家醫(yī)院,不包括18家醫(yī)療服務(wù)機構(gòu).根據(jù)實驗效果,本文K值取4.即從數(shù)據(jù)對象中任意選擇4個對象作為初始聚類中心,循環(huán)執(zhí)行下面兩個步驟直到聚類不變?yōu)橹?
(1)計算每個對象與中心對象的距離,將相應(yīng)對象劃分到離他最近的中心.
(2)重新計算每個聚類的均值(中心對象),直到聚類中心不再變化.這種劃分使得表達式2最?。?/p>
聚類結(jié)果如圖6所示,結(jié)果證實了該地區(qū)居民最相信的2家醫(yī)院為一類,級別3A,其產(chǎn)生的垃圾量最多,也是醫(yī)療壓力最大的醫(yī)院;其次,該地區(qū)3家2A級醫(yī)院為一類,其報銷比例較高,產(chǎn)生的垃圾量和醫(yī)療壓力較大;第三類,是2A級縣人民醫(yī)院,為引導(dǎo)普通病人就診,緩解前2類醫(yī)院的就診壓力,增大了醫(yī)療保險報銷比例,其垃圾量和醫(yī)療壓力基本平衡;最后一類為鄉(xiāng)鎮(zhèn)和民營醫(yī)院,醫(yī)療垃圾產(chǎn)量很少.聚類所得出的結(jié)果驗證了醫(yī)療資源和醫(yī)療壓力的不平衡現(xiàn)象.
圖6 聚類中心圖
貢獻度分析又稱帕累托分析,帕累托規(guī)則是20/80定律[17],即80%以上的產(chǎn)出來自20%的生產(chǎn)單位.貢獻度分析只包括45家醫(yī)院,排除了18家醫(yī)療服務(wù)機構(gòu).
圖7 醫(yī)療垃圾重量、職工數(shù)、床位數(shù)的貢獻度曲線
圖7帕累托定律分析結(jié)果,可以看出前9家醫(yī)院占總垃圾比例的81.40%,占總職工比例的65.27%,占總床位比例的65.35%.這9家醫(yī)院集中在城區(qū),9家醫(yī)院產(chǎn)出的垃圾量遠高于職工和床位比例.在地方醫(yī)療服務(wù)中,表現(xiàn)及其不均衡性.導(dǎo)致城區(qū)9家醫(yī)院承受很大的壓力,醫(yī)生負擔(dān)很重.
為證明城鄉(xiāng)醫(yī)院之間垃圾的產(chǎn)出、醫(yī)院的職工數(shù)、床位數(shù),在各自的比例中是否基本保持一致,把醫(yī)院分為城區(qū)(市區(qū)和縣城)和鄉(xiāng)鎮(zhèn),用以上三個特征進行對比分析.
3.5.1 城區(qū)
圖8 城區(qū)垃圾量,職工數(shù),床位數(shù)比例圖
從圖8可以看出在該市市區(qū)前三家醫(yī)院垃圾量所占比例明顯高于職工數(shù)和床位數(shù)所占比例,其他幾家醫(yī)院垃圾量所占比例大致等于職工數(shù)和床位數(shù)所占比例,23家醫(yī)院中只有4家醫(yī)院垃圾量所占比例遠低于職工數(shù)和床位數(shù)所占比例,它們所面臨的醫(yī)療壓力較小,它們所擁有的資源相對多.
3.5.2 鄉(xiāng)鎮(zhèn)
從圖9可以看出,22家醫(yī)院中只有4家垃圾量比例高出職工人數(shù)和床位數(shù)比例,其他的衛(wèi)生院比例相反.換句話說,鄉(xiāng)鎮(zhèn)醫(yī)院閑置,它們的醫(yī)療壓力很小,醫(yī)療資源被浪費了,同時鄉(xiāng)鎮(zhèn)醫(yī)務(wù)人員水平也得不到提高[11].
圖9 鄉(xiāng)鎮(zhèn)垃圾量,職工數(shù),床位數(shù)比例圖
中國醫(yī)院之間醫(yī)療水平、服務(wù)質(zhì)量差距太大,使得我國民眾都喜歡涌入大城市,去級別高的醫(yī)院看病.為緩解城市大醫(yī)院的壓力,中國的醫(yī)療改革在不斷完善分級診療體系,加大扶持定點醫(yī)院的人、財、物優(yōu)質(zhì)資源建設(shè),加大優(yōu)質(zhì)醫(yī)療人力資源在城鄉(xiāng)間流動,加大在定點醫(yī)院消費的報銷比例,引導(dǎo)居民消費偏好,提高城鄉(xiāng)居民對醫(yī)療服務(wù)的受益度,緩解“看病難,看病貴”問題.
本文通過醫(yī)療垃圾數(shù)據(jù)的實證分析,了解到居民對不同類別醫(yī)院的信任度不同,就醫(yī)偏好也就不同,導(dǎo)致地方的中心醫(yī)院醫(yī)療負擔(dān)最繁重,城區(qū)醫(yī)院承擔(dān)區(qū)域內(nèi)大部分醫(yī)療任務(wù),鄉(xiāng)鎮(zhèn)醫(yī)院比較清閑,也造成了一定的資源浪費[12].通過5年內(nèi)采集的醫(yī)療垃圾數(shù)據(jù),結(jié)合醫(yī)院職工數(shù)和床位數(shù),通過聚類和貢獻度分析,城鄉(xiāng)醫(yī)療壓力分析,垃圾量預(yù)測,有一定的實際意義,但由于數(shù)據(jù)不夠豐富、細致,后續(xù)研究將采集更加豐富的醫(yī)療數(shù)據(jù),深入研究.