李高明 周 亮 陳虹汝 易大莉 張彥琦 伍亞舟 易 東 劉 嶺
第三軍醫(yī)大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)教研室(400038)
基于氣象因素的手足口病系統(tǒng)狀態(tài)聚類方法研究*
李高明 周 亮 陳虹汝 易大莉 張彥琦 伍亞舟 易 東 劉 嶺△
第三軍醫(yī)大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)教研室(400038)
目的利用系統(tǒng)狀態(tài)評估(state representation methodology,SRM)方法,描述手足口病的流行情況,探索一種新的疾病狀態(tài)聚類新方法。方法收集2010-2014年全國各省市手足口病月發(fā)病率資料及相應(yīng)的氣象資料,將發(fā)病率和氣象因素視為一個(gè)系統(tǒng),構(gòu)建SRM模型并求解各省市的狀態(tài)分布值,然后使用層次聚類方法對不同省市區(qū)域系統(tǒng)進(jìn)行聚類分析。結(jié)果實(shí)現(xiàn)了對手足口病的狀態(tài)評估,以手足口病發(fā)病率及相應(yīng)的氣象資料建立SRM模型所得到的聚類分析結(jié)果,比直接使用發(fā)病率數(shù)據(jù)得到的結(jié)果更為合理。結(jié)論本文從系統(tǒng)的角度提出了一種疾病描述的新方法,將SRM用于手足口病數(shù)據(jù),可以為其分析提供一個(gè)新的思路。
手足口病 氣象因素 狀態(tài)評估方法 層次聚類
手足口病(hand-food-mouth diease)是由多種腸道病毒引起,并以發(fā)熱和手、足、口腔等部位的皮疹或者皰疹為主要特征的常見傳染病[1]。該病具有傳染性強(qiáng),傳播途徑復(fù)雜,地區(qū)分布又非常廣泛,且四季均可發(fā)病的特點(diǎn),已成為危害人類健康的主要傳染病之一[2-3]。據(jù)2015年全國法定傳染病疫情概況顯示,上報(bào)至監(jiān)測系統(tǒng)的手足口病發(fā)病例數(shù)接近200萬人,其發(fā)病率和死亡率均居丙類傳染病的首位[4]。目前對手足口病的防控仍缺乏相應(yīng)的疫苗或特異性藥物。因此,基于手足口病發(fā)病率和氣象影響因素,劃分手足口病的不同流行區(qū)域,對疾病的分片管理和控制具有非常重要的意義。
由于手足口病發(fā)病和相關(guān)因素的關(guān)系具有復(fù)雜性、多樣性和系統(tǒng)性,因此,從系統(tǒng)生物學(xué)的角度來描述手足口病與其所處的環(huán)境狀態(tài)、氣象狀態(tài)之間的時(shí)空關(guān)系具有科學(xué)性和可行性[5-6]。本研究將引入一種新的疾病狀態(tài)分析方法-系統(tǒng)狀態(tài)評估(state representation methodology,SRM)[7-8],并結(jié)合聚類分析方法,建立一種新的手足口病的聚類模型。
1.資料來源
全國31個(gè)省市2010-2014年手足口病月發(fā)病率通過公共衛(wèi)生科學(xué)數(shù)據(jù)中心[9]下載獲得;全國31個(gè)省市2010-2014年氣象數(shù)據(jù)資料通過中國氣象數(shù)據(jù)網(wǎng)[10]下載獲得,其中包括平均氣溫、平均濕度、降水量、日照時(shí)間。
2.SRM模型
系統(tǒng)科學(xué)角度認(rèn)為,系統(tǒng)的數(shù)據(jù)集是該系統(tǒng)的一個(gè)映像,并可用結(jié)構(gòu)參數(shù)來對系統(tǒng)進(jìn)行描述。因此,可將系統(tǒng)的映像看作是系統(tǒng)的響應(yīng),或者是對應(yīng)于結(jié)構(gòu)上的描述。從理論角度來說,系統(tǒng)的結(jié)構(gòu)與系統(tǒng)的響應(yīng)是一對對偶關(guān)系,也就是“系統(tǒng)的響應(yīng)取決于系統(tǒng)的結(jié)構(gòu),并可根據(jù)系統(tǒng)響應(yīng)推導(dǎo)出系統(tǒng)結(jié)構(gòu),這種量化的對偶關(guān)系被稱為系統(tǒng)的狀態(tài)”。
于是對系統(tǒng)的定量評價(jià)是描述系統(tǒng)對這些激發(fā)因素的響應(yīng)。所以系統(tǒng)的狀態(tài)是系統(tǒng)對刺激環(huán)境的一個(gè)響應(yīng)函數(shù)。并可表示為:
ζ=f(λ,x)
(1)
其中ζ是狀態(tài)變量,λ是系統(tǒng)結(jié)構(gòu)參數(shù),x是系統(tǒng)特征向量。
3. 計(jì)算方法
(1)模型輸入數(shù)據(jù)
將不同地區(qū)手足口病的月發(fā)病率及同期的氣象資料數(shù)據(jù)作為模型的輸入數(shù)據(jù),數(shù)據(jù)結(jié)構(gòu)可以用式(2)表示:
(2)
其中,矩陣中L=1,2,…,31表示不同的省市,M表示月份數(shù),N表示發(fā)病率和氣象資料變量數(shù)。
(2)數(shù)據(jù)標(biāo)準(zhǔn)化處理
數(shù)據(jù)的標(biāo)準(zhǔn)化處理是將數(shù)量級差異較大的數(shù)據(jù)轉(zhuǎn)換到同一個(gè)量綱范圍。在獲取的數(shù)據(jù)中,由于不同變量之間存在著很大的差異,需將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,公式如下:
(3)
本文標(biāo)準(zhǔn)化的變量有:發(fā)病率、氣溫、濕度、降水量和日照時(shí)間。
(3)狀態(tài)函數(shù)的非線性逼近
(4)求解支撐向量λ
使用核函數(shù)構(gòu)建G矩陣:
(4)
將G矩陣帶入方程(4)中,使用最小二乘法則求得λ值。
(5)計(jì)算狀態(tài)值ζ
通過高斯核函數(shù)實(shí)現(xiàn)對狀態(tài)函數(shù)的非線性逼近,我們可以得到核函數(shù)形式下的狀態(tài)函數(shù):
(5)
并在相同的尺度下,計(jì)算出每個(gè)省市系統(tǒng)的狀態(tài)值。
(6)區(qū)域分類
通過SRM模型,每個(gè)省市可以獲得一個(gè)M維的狀態(tài)向量,以這個(gè)M維的狀態(tài)向量為綜合指標(biāo),使用系統(tǒng)聚類方法對不同省市區(qū)域系統(tǒng)進(jìn)行聚類分析。
本文SRM模型建立使用MATLAB(7.11.0)編程完成,聚類分析通過R(3.3.2)實(shí)現(xiàn)。
1.SRM狀態(tài)值計(jì)算
對每個(gè)省市使用構(gòu)建的SRM模型計(jì)算狀態(tài)值,其中σ=2為SRM模型的觀察尺度,觀察尺度越大各省市狀態(tài)分布值差異越小,而尺度越小差異越大。以北京市為例SRM模型的輸入數(shù)據(jù)和求解得到的狀態(tài)值如表1所示,最終我們可以計(jì)算得到31個(gè)省市的SRM狀態(tài)值。
表1 北京市2010-2014手足口病月發(fā)病率、氣象數(shù)據(jù)和SRM狀態(tài)值
2.區(qū)域聚類分析
(1)基于發(fā)病率的聚類結(jié)果
為探討SRM模型對分類結(jié)果的影響,我們分別使用2010-2014年全國31個(gè)省市每月手足口病發(fā)病資料與各省市狀態(tài)變量值進(jìn)行層次聚類,結(jié)果見圖1。
(2)聚類結(jié)果的比較
基于發(fā)病率的聚類分析中,西藏、青海、黑龍江、甘肅和新疆為一個(gè)類別。而基于系統(tǒng)狀態(tài)的聚類中,以溫帶季風(fēng)氣候?yàn)橹鞯暮邶埥?、吉林和遼寧為一個(gè)類別;以溫帶大陸性氣候?yàn)橹鞯膬?nèi)蒙古、寧夏和甘肅,高山高原氣候的青海和溫帶季風(fēng)氣候山西為一個(gè)類別;而溫帶大陸性氣候的新疆和高山高原氣候的西藏單獨(dú)為一類。在以亞熱帶季風(fēng)氣候?yàn)橹鞯乃拇ā⒅貞c、陜西、河南、湖北、安徽、江蘇、浙江、上海、江西、福建、廣東、廣西、云南、貴州和湖南的各省市,經(jīng)發(fā)病率的聚類四川、重慶、河南和江西為一個(gè)類別;云南、安徽、江蘇和湖北為一個(gè)類別;貴州和陜西為一個(gè)類別;福建和湖南為一個(gè)類別;上海和浙江為一個(gè)類別;廣西和廣東單獨(dú)為一個(gè)類別。而使用系統(tǒng)狀態(tài)進(jìn)行聚類,重慶和四川為一個(gè)類別;河南和陜西為一個(gè)類別;湖南和貴州為一個(gè)類別;江蘇、上海、浙江、安徽和湖北為一個(gè)類別;剩余的廣東、江西、福建、廣西和云南為一個(gè)類別。對比結(jié)果可以看出,經(jīng)SRM模型求解狀態(tài)分布值得到的聚類結(jié)果具有區(qū)域性。
圖1 基于2010-2014年全國31個(gè)省市手足口病層次聚類圖
圖2 兩種分布地圖的比較
本聚類結(jié)果綜合了氣象信息,研究中使用2010-2014年全國31個(gè)省市手足口病發(fā)病資料以及該地區(qū)相應(yīng)的平均氣溫、平均濕度、降水量和日照時(shí)間氣象資料來建立SRM模型,從另一個(gè)角度去認(rèn)識(shí)手足口病與其所處的環(huán)境狀態(tài)、氣象狀態(tài)之間的時(shí)空關(guān)系。該模型可以根據(jù)現(xiàn)有的氣象資料來描繪手足口病的發(fā)生狀態(tài),并可結(jié)合聚類方法對不同地區(qū)進(jìn)行劃分,且聚類地區(qū)的連通性更好,為手足口病的分片管理和采取有針對性的公共衛(wèi)生防御措施提供了依據(jù),盡管如此,手足口病狀態(tài)的發(fā)生與發(fā)展受多種因素的影響,如社會(huì)因素中的經(jīng)濟(jì)發(fā)展?fàn)顩r、收入水平和人口流動(dòng)性,以及人們的健康教育程度、職業(yè)和生活習(xí)慣等。研究還需納入更多的客觀因素才能使手足口病的狀態(tài)更具有可靠性。
系統(tǒng)狀態(tài)評估這種新的疾病狀態(tài)分析方法,闡述了從整體的角度對系統(tǒng)的狀態(tài)進(jìn)行描述的一般過程。我們認(rèn)為系統(tǒng)的狀態(tài)是系統(tǒng)對刺激環(huán)境的一個(gè)響應(yīng)函數(shù)。根據(jù)系統(tǒng)學(xué)理論知識(shí),系統(tǒng)的結(jié)構(gòu)與響應(yīng)是一對對偶關(guān)系,其實(shí)質(zhì)上是一種非參數(shù)描述。并使用核函數(shù)將原始數(shù)據(jù)投影到高維空間里面去,實(shí)現(xiàn)狀態(tài)函數(shù)的非線性逼近。
近年來,通過數(shù)學(xué)模型來研究手足口病的發(fā)病過程得到了廣泛的應(yīng)用[11-12]。本文以手足口病發(fā)病及相應(yīng)的氣象資料構(gòu)建模型并進(jìn)行研究分析,從系統(tǒng)的角度描述疾病的過程,實(shí)現(xiàn)整體的認(rèn)識(shí)和把握。從分析的結(jié)果可以看出SRM模型能夠?qū)Σ煌到y(tǒng)進(jìn)行描繪,并具有很好的適應(yīng)性,可以為其他疾病的時(shí)空流行情況提供新的研究思路。
[1] 衛(wèi)生部.手足口病預(yù)防控制指南(2008年版).社區(qū)醫(yī)學(xué)雜志,2008,6(10):69-71.
[2] 孫軍玲,張靜.手足口病流行病學(xué)研究進(jìn)展.中華流行病學(xué)雜志,2009,30(9):973-976.
[3] Wang Q,Wang ZJ.Epidemiology of hand foot and mouth disease in China,2008..Disease Surveillance,2010,27(5):438-441.
[4] 中華人民共和國國家衛(wèi)生和計(jì)劃生育委員會(huì).http://www.nhfpc.gov.cn/jkj/.
[5] Wang C,Cao K,Zhang Y,et al.Different effects of meteorological factors on hand,foot and mouth disease in various climates:a spatial panel data model analysis.BMC Infectious Diseases,2016,16(1):1-10.
[6] Pei F L,Labadin J,Bin ARS,et al.Quantifying the relationship between the climate and Hand-Foot-Mouth Disease(HFMD)incidences:International Conference on Modeling,Simulation and Applied Optimization,2011.
[7] Miyamoto A,Yabe A.State Representation Methodology(SRM)for Bridge Condition Assessment in SHM.土木工程與建筑:英文版,2012,5(4):433-443.
[8] 肖琴.系統(tǒng)狀態(tài)描述方法及其在艾滋病防治效果綜合評價(jià)中的應(yīng)用.重慶理工大學(xué),2013.
[9] 公共衛(wèi)生科學(xué)數(shù)據(jù)中心.http://www.phsciencedata.cn/.
[10]中國氣象數(shù)據(jù)網(wǎng).http://data.cma.cn/site/index.html.
[11]韋懿蕓.向量自回歸模型在手足口病發(fā)病與氣象因素的動(dòng)態(tài)分析中的應(yīng)用.中國衛(wèi)生統(tǒng)計(jì),2013,30(6):794-797.
[12]郭靜,金水高.基于復(fù)雜網(wǎng)絡(luò)的手足口病傳播模型研究.中國衛(wèi)生統(tǒng)計(jì),2009,26(1):14-17.
ClusteringAnalysisofSRMModelofHFMDBasedonMeteorologicalFactors
Li Gaoming,Zhou Liang,Chen Hongru,et al
(DepartmentofHealthStatistics,ThirdMilitaryMedicalUniversity(400038),Chongqing)
ObjectiveTo describe the development process of Hand,foot and mouth disease(HFMD)and to explore a new methodology for assessing diseases from a systematic perspective by using state representation methodology(SRM).MethodsThe monthly morbidity data of HFMD and corresponding meteorological data in the provinces and cities across China during 2010-2014 were collected;an SRM model was built to calculate the state distribution values of each province and city;then cluster analysis was carried out on the regional systems of different provinces and cities by means of hierarchical clustering.ResultsThe state of HFMD was assessed.The results from cluster analysis on the SRM model built based on morbidity data of HFMD and corresponding meteorological data showed more reasonable than the results obtained by using the morbidity data directly.ConclusionThis paper puts forward a new method for describing diseases from a systematic perspective and applies SRM to HFMD data,which provides a new thought for the analysis.
Hand,foot and mouth disease(HFMD);Meteorological factor;State representation methodology;Hierarchical clustering
國家社會(huì)科學(xué)基金(14BTJ019);國家自然基金(81473068)
△通信作者:劉嶺,E-mail:liuling_505@sina.com
劉 壯)