劉志臻,楊紅清,蔡 晶,黃子杰
(1.福建中醫(yī)藥大學(xué) 中西醫(yī)結(jié)合學(xué)院,福建 福州 350122;2.福州市馬尾區(qū) 羅星街道社區(qū)衛(wèi)生服務(wù)中心,福建 福州 350015)
醫(yī)學(xué)衛(wèi)生數(shù)據(jù)結(jié)構(gòu)復(fù)雜、維度多元,普通讀者對(duì)分析結(jié)果存在理解難度大的問(wèn)題。若能將具有空間信息的醫(yī)學(xué)數(shù)據(jù)分析結(jié)果形象化地表現(xiàn)在地圖上,展現(xiàn)其中的信息規(guī)律和趨勢(shì),無(wú)疑會(huì)降低閱讀難度,提高理解程度。Power Map和GeoDa軟件是地圖可視化常用的實(shí)現(xiàn)工具軟件。Power Map是嵌套在Excel里的基于Bing地圖的三維可視化工具組件,使用便捷;通過(guò)Power Map,可在三維地球儀或自定義地圖繪制帶有地理位置信息的數(shù)據(jù),如果包含時(shí)間數(shù)列信息,還可創(chuàng)建可視化視頻介紹并進(jìn)行分享。GeoDa是實(shí)現(xiàn)柵格數(shù)據(jù)探求性空間數(shù)據(jù)分析的軟件工具集合體,用以描述空間數(shù)據(jù)分析,比如空間自相關(guān)性統(tǒng)計(jì)和異常值指示等。與Power Map相比,GeoDa雖然無(wú)法實(shí)現(xiàn)不同圖層的疊加,但在進(jìn)行縱向數(shù)據(jù)比較的時(shí)候,可以自定義統(tǒng)一的尺度及豐富的顏色展示區(qū)域圖。
為此,筆者基于2013—2015年全國(guó)各省份醫(yī)療服務(wù)情況統(tǒng)計(jì)數(shù)據(jù)集,應(yīng)用Power Map和GeoDa兩種工具軟件,對(duì)比傳統(tǒng)統(tǒng)計(jì)圖和地圖可視化例示的方式進(jìn)行了比較和分析,通過(guò)探討醫(yī)學(xué)衛(wèi)生數(shù)據(jù)分析的實(shí)施途徑,總結(jié)醫(yī)學(xué)衛(wèi)生數(shù)據(jù)分析應(yīng)用案例,提升信息化水平,以輔助衛(wèi)生管理決策。
本案例的醫(yī)院診療人次數(shù)(萬(wàn)人次)數(shù)據(jù)源自國(guó)家衛(wèi)生和計(jì)劃生育委員會(huì)《2015年1—11月全國(guó)醫(yī)療服務(wù)情況》[1],GDP(億元)和人口數(shù)(萬(wàn)人)數(shù)據(jù)來(lái)自國(guó)家統(tǒng)計(jì)局[2]。通過(guò)Excel 2016錄入完畢后,計(jì)算人均GDP和2周每千人就診人數(shù)指標(biāo)。2周每千人就診人數(shù)是反映衛(wèi)生服務(wù)需求的指標(biāo),在一定程度上與當(dāng)?shù)氐慕?jīng)濟(jì)狀況相關(guān)[3]。
數(shù)據(jù)錄入完成后,先應(yīng)用四分位數(shù)計(jì)算人均GDP的割點(diǎn),按P25、P50、P75的順序從小到大將其對(duì)應(yīng)的地區(qū)分為四組。通過(guò)秩和檢驗(yàn)發(fā)現(xiàn)不同的地區(qū)之間“2周每千人就診人數(shù)”差異有統(tǒng)計(jì)學(xué)意義(P<0.001)。同時(shí),計(jì)算“人均GDP”與“2周每千人就診人數(shù)”之間的相關(guān)系數(shù)(r=0.75,P<0.001)。
散點(diǎn)圖很好地反映了2015年我國(guó)各省人均GDP與2周每千人就診人數(shù)之間存在的正相關(guān)關(guān)系,但沒(méi)有對(duì)應(yīng)各個(gè)省份的地理信息和空間信息,很難想象并理解2015年的醫(yī)療衛(wèi)生現(xiàn)狀(圖1a);柱狀折線組合圖與散點(diǎn)圖相比,增加了對(duì)應(yīng)各個(gè)省份的地理信息,但仍然缺少地理的空間信息(圖1b)。
a:散點(diǎn)圖;b:柱狀折線組合圖
具有地域特征的醫(yī)學(xué)數(shù)據(jù)分析結(jié)果若能將其可視化地表現(xiàn)在地圖上,展現(xiàn)其中信息規(guī)律和趨勢(shì),無(wú)疑能幫助讀者直觀和形象地看到復(fù)雜數(shù)據(jù)背后的內(nèi)在空間規(guī)律。為此,筆者應(yīng)用Power Map及GeoDa軟件,探討人均GDP、2周每千人就診人數(shù)指標(biāo)與對(duì)應(yīng)省份地理信息的可視化制圖的實(shí)現(xiàn)途徑。
1.Excel 2016地圖繪制菜單。插入→三維地圖→打開(kāi)三維地圖。右側(cè)是可視化地圖的參數(shù)設(shè)置:包含圖標(biāo)類型、位置、高度、類別、時(shí)間、篩選器、圖層選項(xiàng)等。
第一步:設(shè)置地理字段。下拉菜單可見(jiàn)經(jīng)度、緯度、X坐標(biāo)、Y坐標(biāo)、省、市、國(guó)家等。本例數(shù)據(jù)Power Map已經(jīng)自動(dòng)識(shí)別為“省/市/自治區(qū)”這個(gè)類別(圖2)。
圖2 Power Map主界面截屏圖
第二步:選擇可視化圖形。Power Map提供的可視化圖形有五類:堆積柱形圖、簇狀柱形圖、氣泡圖、熱度圖和區(qū)域圖(圖3a)。其中,柱形圖以柱形的高低來(lái)體現(xiàn)數(shù)值大小,氣泡圖以圓形的大小來(lái)體現(xiàn)數(shù)值的大小,通常比較適合較為分散的地理位置點(diǎn)或區(qū)域,例如不同城市間的數(shù)據(jù)對(duì)比;熱度圖是通過(guò)色階的冷暖來(lái)體現(xiàn)數(shù)值的大小,特別適合密度、頻率、溫度這類數(shù)值,例如城市交通狀況、氣溫或降水分布情況的對(duì)比等;區(qū)域圖則是以區(qū)域整體(需要使用省份、國(guó)家或地區(qū)之類的地理信息)的色階冷暖來(lái)體現(xiàn)數(shù)值大小。筆者選擇區(qū)域圖表現(xiàn)人均GDP(圖3b)和2周每千人就診人數(shù)(圖3c)。
第三步:圖層疊加。通過(guò)對(duì)比圖3b和圖3c的區(qū)域可以相對(duì)容易地看到人均GDP與2周每千人就診人數(shù)空間信息的灰階分布趨勢(shì)大致相同,但需要二張圖組合看,不夠直觀。因此,將2周每千人就診人數(shù)呈現(xiàn)方式改為熱力圖,與人均GDP區(qū)域圖疊加(圖3d)。
a:可視化圖形種類截屏圖;b:人均GDP區(qū)域地圖;c:2周每千人就診人數(shù)區(qū)域地圖;d:疊加效果圖. (臺(tái)灣、南海諸島暫無(wú)相關(guān)數(shù)據(jù),未在地圖中體現(xiàn),下圖同)
圖32015年中國(guó)各省人均GDP及2周每千人就診人數(shù)的區(qū)域地圖
通過(guò)圖層疊加,讀者不僅感受到“人均GDP”與“2周每千人就診人數(shù)”二者存在正相關(guān),而且直觀和形象地看到兩組數(shù)據(jù)的地理和空間信息的相關(guān)規(guī)律,如北京、天津、江蘇、上海、浙江、廣東等經(jīng)濟(jì)發(fā)達(dá)省份對(duì)應(yīng)的就診人數(shù)也高。
第四步:縱向比較。收集2013—2015年全國(guó)各省份醫(yī)療服務(wù)情況,用Power Map生成3年“2周每千人就診人數(shù)”的區(qū)域地圖(圖4a),試圖發(fā)現(xiàn)隨著經(jīng)濟(jì)的發(fā)展,2周每千人就診人數(shù)逐年提升的趨勢(shì),但由于顏色區(qū)分度較低,可視化結(jié)果極不理想。
Power Map實(shí)現(xiàn)衛(wèi)生管理空間信息的可視化優(yōu)點(diǎn)之一是圖層疊加,但如果要比較不同年份之間的衛(wèi)生管理空間信息,由于Power Map是自動(dòng)生成的過(guò)渡色,且各圖之間默認(rèn)共用一致的標(biāo)準(zhǔn)化過(guò)渡色,無(wú)法自定義設(shè)置尺度標(biāo)準(zhǔn)進(jìn)行調(diào)整,因此,在縱向比較時(shí)直觀程度大打折扣。為此,應(yīng)選擇GeoDa軟件實(shí)現(xiàn)。
2.GeoDa的地圖可視化。下載全國(guó)各省份矢量地圖(shp格式)。具體步驟:導(dǎo)入地圖→匹配數(shù)據(jù)→map→change current map type→create new custom→"Breaks"中選擇"user defined"→Edit Custom Break設(shè)定割點(diǎn)→依次生成歷年“2周每千人就診人數(shù)”的區(qū)域地圖(圖4b)。
與圖4a相比,圖4b可以更為明顯看出絕大部分省份的2周每千人就診人數(shù)在逐年提升,顏色呈加深趨勢(shì),更為形象地說(shuō)明衛(wèi)生服務(wù)需求的提高。但是,GeoDa比Power Map相比,矢量地圖獲得困難,并且可視化圖形選擇性局限,無(wú)法實(shí)現(xiàn)圖層疊加等,在一定程度上也限制了它的應(yīng)用。
衛(wèi)生管理探討空間屬性事物之間的相互關(guān)系,透過(guò)空間信息的表面現(xiàn)象,發(fā)現(xiàn)其內(nèi)在規(guī)律,并對(duì)成因進(jìn)行分析,同時(shí)提出干預(yù)決策[4]。這一過(guò)程需要利用多種科學(xué)方法和技術(shù),其中地圖可視化就是空間統(tǒng)計(jì)的一種重要方法。洛杉磯時(shí)報(bào)的數(shù)據(jù)可視化主管Groot曾提到,“地圖是信息密度最大的數(shù)據(jù)通信方式”[5]。顯而易見(jiàn),如果本例數(shù)據(jù)還是按照傳統(tǒng)統(tǒng)計(jì)圖的展示形式,不免枯燥、乏味,難以形象傳達(dá)醫(yī)療衛(wèi)生現(xiàn)狀在全國(guó)范圍的內(nèi)在地域特征和規(guī)律。相比較傳統(tǒng)統(tǒng)計(jì)圖,地圖可視化更能考慮衛(wèi)生與健康的地理空間和背景信息,研究結(jié)果更加真實(shí)、科學(xué)。
a:2013-2015年(PowerMap版);b:2013-2015年(GeoDa版).
2周每千人就診人數(shù)是反映衛(wèi)生服務(wù)需求的指標(biāo),筆者通過(guò)該指標(biāo)分析衛(wèi)生服務(wù)的聚集性。聚集性分析用于研究潛在影響因素的時(shí)空聚集性,從整體上檢驗(yàn)醫(yī)療衛(wèi)生服務(wù)的空間分布是隨機(jī)還是聚集。如果是聚集分布,則進(jìn)一步回答聚集在什么地方?聚集程度高低及周邊地區(qū)關(guān)系如何?聚集在多大的空間尺度才有意義?通過(guò)地圖可視化展示不難看出,我國(guó)2013—2015年衛(wèi)生服務(wù)水平呈現(xiàn)聚集空間分布,同時(shí)疊加對(duì)比各省的人均GDP水平發(fā)現(xiàn),與衛(wèi)生服務(wù)地域相關(guān)的聚集因素可能是當(dāng)?shù)氐慕?jīng)濟(jì)水平,如北京、天津、江蘇、上海、浙江、廣東等經(jīng)濟(jì)發(fā)達(dá)省份對(duì)應(yīng)的就診人數(shù)也高,并且呈現(xiàn)逐年提高趨勢(shì)。
綜上所述,在地圖可視化的實(shí)現(xiàn)工具軟件方面,Power Map、GeoDa以方便、實(shí)用、易操作等特點(diǎn)廣泛應(yīng)用于各個(gè)領(lǐng)域。對(duì)實(shí)現(xiàn)小規(guī)模、簡(jiǎn)單的數(shù)據(jù)集,地圖可視化功能已能滿足用戶的需求。但是,在更多的需求下,用戶應(yīng)該根據(jù)數(shù)據(jù)的特點(diǎn)和任務(wù)目標(biāo)選擇合適的工具[6]。地圖可視化作為處理空間信息數(shù)據(jù)的一種非常重要方法,對(duì)衛(wèi)生管理數(shù)據(jù)的科學(xué)挖掘和有效利用將對(duì)相關(guān)業(yè)務(wù)的監(jiān)管、決策的制定及可持續(xù)發(fā)展均有著重要意義。
[1]中華人民共和國(guó)國(guó)家衛(wèi)生和計(jì)劃生育委員會(huì).2015年1-11月全國(guó)醫(yī)療服務(wù)情況[EB/OL].(2016-04-11)[2017-03-22].http://www.nhfpc.gov.cn/zwgkzt/nianbao/list.shtml.
[2]中華人民共和國(guó)國(guó)家統(tǒng)計(jì)局.2015年國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展統(tǒng)計(jì)公報(bào)[EB/OL].(2016-02-29)[2017-03-22].http://data.stats.gov.cn/.
[3]付 琰.社區(qū)衛(wèi)生服務(wù)中心慢性病管理中舉辦主體的影響分析[J].臨床醫(yī)藥文獻(xiàn)電子雜志,2017,4(35):6910-6911.
[4]范俊杰,王 怡,張 震,等.基于空間統(tǒng)計(jì)的公共衛(wèi)生研究現(xiàn)狀與展望[J].中國(guó)預(yù)防醫(yī)學(xué)雜志,2015,16(7):562-565.
[5]Yau N.鮮活的數(shù)據(jù):數(shù)據(jù)可視化指南[M].北京:人民郵電出版社,2012:21.
[6]任利敬,趙正旭,徐 騫.三維地圖式可視化大數(shù)據(jù)[J].測(cè)繪與空間地理信息,2017(2):63-65.