黃澤穎
新世紀(jì)以來(lái),我國(guó)不僅面臨傳統(tǒng)傳染病的持續(xù)威脅,而且SARS、H7N9亞型禽流感、MERS、新冠肺炎等新型傳染病的連續(xù)出現(xiàn),使我們不斷反思傳染病預(yù)測(cè)的精準(zhǔn)性。同一傳染病在不同地區(qū)表現(xiàn)不同特征,若不劃分區(qū)域展開(kāi)研究,可能削弱預(yù)測(cè)能力[1]。H7N9亞型禽流感嚴(yán)重危害居民的生命健康,引發(fā)全球的廣泛關(guān)注[2]。廣東省是人感染H7N9亞型禽流感的高發(fā)省份,2013年8月份至 2018年2月份,共發(fā)生病例數(shù)264起(占全國(guó)18.84%)[3]。不同的是,廣東省的H7N9亞型禽流感與本地H9N2禽流感重配組合,傳染能力更強(qiáng),具有典型區(qū)域性[4-5]。雖然H7N9亞型禽流感在廣東省得到有效控制,但尚未凈化和消滅,其潛在的威脅不可忽視,故有必要加強(qiáng)精確預(yù)測(cè),提高防控決策的科學(xué)性。
大數(shù)據(jù)的“數(shù)據(jù)密集型科學(xué)”研究范式極大提高了科學(xué)發(fā)現(xiàn)概率[6],也為傳染病預(yù)測(cè)提供了一種新的技術(shù)和手段[7]。隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,來(lái)自雅虎、谷歌、百度等知名互聯(lián)網(wǎng)公司的搜索引擎網(wǎng)絡(luò)大數(shù)據(jù)越來(lái)越多地應(yīng)用到傳染病發(fā)展趨勢(shì)的預(yù)測(cè),例如,Polgreen PM等[8]分析雅虎搜索引擎上的流感搜索次數(shù)與實(shí)際流感發(fā)生之間的關(guān)系,預(yù)測(cè)美國(guó)的流感發(fā)展趨勢(shì)。 Ginsberg J等[9]通過(guò)監(jiān)測(cè)谷歌搜索引擎上與疾病相關(guān)信息的搜索行為預(yù)測(cè)美國(guó)季節(jié)性流感動(dòng)態(tài)。Yuan Q等[10]使用百度指數(shù)預(yù)測(cè)我國(guó)流感走勢(shì)。王晶晶等[11]基于百度指數(shù)預(yù)測(cè)以廣東省為中心的全國(guó)登革熱疫情。Li Z等[12]結(jié)合百度指數(shù)、氣象和人口因素開(kāi)發(fā)了廣州市登革熱預(yù)測(cè)模型。Bu Y等[13]利用百度指數(shù)預(yù)測(cè)我國(guó)流感情況。Zhao Y等[14]結(jié)合百度指數(shù)構(gòu)建時(shí)間序列元特征的預(yù)測(cè)模型,對(duì)全國(guó)及典型地區(qū)的手足口病發(fā)病率進(jìn)行即時(shí)預(yù)報(bào)。白寧等[15]基于百度指數(shù)分波段預(yù)測(cè)福建省的H7N9亞型禽流感疫情。梳理文獻(xiàn)可知,包括百度指數(shù)在內(nèi)的搜索引擎網(wǎng)絡(luò)大數(shù)據(jù)與傳染病的流行病學(xué)有緊密的聯(lián)系,有充分的證據(jù)預(yù)測(cè)疫情的發(fā)生或流行。然而,就如何進(jìn)一步提高搜索引擎網(wǎng)絡(luò)大數(shù)據(jù)預(yù)測(cè)的精準(zhǔn)度方面,大多數(shù)研究一方面忽視了公眾搜索行為隨疫情發(fā)展變化的特征,不分疫情波段進(jìn)行預(yù)測(cè)研究,另一方面忽視了疫情期間公眾通過(guò)搜索引擎查詢身體不適的原因和治療方法,未將公眾對(duì)傳染病臨床癥狀相關(guān)關(guān)鍵詞的搜索頻率考慮在內(nèi)。
《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》指出,截至2020年3月份,我國(guó)網(wǎng)民規(guī)模達(dá)9.04億,其中,搜索引擎是搜索信息的主要渠道,用戶占總網(wǎng)民的83.0%[16]。百度是全球最大的中文搜索引擎,其推出的百度指數(shù),以網(wǎng)民在百度的搜索量為數(shù)據(jù)基礎(chǔ),以關(guān)鍵詞為統(tǒng)計(jì)對(duì)象,科學(xué)分析并計(jì)算出各個(gè)關(guān)鍵詞在百度網(wǎng)頁(yè)搜索中搜索頻次的加權(quán)和,客觀地反映網(wǎng)民的主動(dòng)搜索需求和網(wǎng)民對(duì)網(wǎng)絡(luò)信息的關(guān)注程度。因此,本文以提高廣東省H7N9亞型禽流感疫情的預(yù)測(cè)準(zhǔn)確度為研究重點(diǎn),利用回顧性流行病學(xué)調(diào)查方法,基于“H7N9”關(guān)鍵詞百度指數(shù),首先根據(jù)疫情整體趨勢(shì)劃分波段預(yù)測(cè)疫情,然后從中選擇預(yù)測(cè)效果較佳的波段,結(jié)合臨床癥狀關(guān)鍵詞的百度指數(shù)開(kāi)展預(yù)測(cè)研究,希冀通過(guò)這些方法與理論能更好地支撐H7N9亞型禽流感疫情防控,也為流行病學(xué)分析提供參考價(jià)值。
1.1數(shù)據(jù)來(lái)源 本文使用的數(shù)據(jù)主要是廣東省H7N9亞型禽流感病例數(shù)和相關(guān)關(guān)鍵詞的百度指數(shù):一是根據(jù)廣東省衛(wèi)健委的疫情信息[3],整理2013年1月份到2018年12月份的廣東省H7N9亞型禽流感月度與周度新增病例數(shù);二是在百度指數(shù)平臺(tái)(http://index.baidu.com),以“PC端+移動(dòng)端”指數(shù)(基于我國(guó)居民越來(lái)越多使用電腦和智能手機(jī)進(jìn)行信息搜索的趨勢(shì))作為搜索指數(shù)來(lái)源,地區(qū)范圍設(shè)定在廣東省,一方面,為提高查全率,以“H7N9”為關(guān)鍵詞采集2013年1月份到2018年12月份廣東省每月與每周的“H7N9”百度指數(shù),另一方面,根據(jù)H7N9禽流感的定義,結(jié)合H7N9亞型禽流感高頻被引國(guó)內(nèi)外文獻(xiàn)[17-19],基于百度指數(shù)平臺(tái)對(duì)關(guān)鍵詞的收錄權(quán)限,選取了“發(fā)熱”“咳嗽”“咳痰”“肌肉酸痛”“呼吸困難”“乏力”“頭痛”“咽痛”“胸悶”“氣喘”“胸痛”“流涕”12個(gè)與H7N9亞型禽流感臨床癥狀密切相關(guān)且特異性的關(guān)鍵詞。鑒于每年普通流感的流行高峰與H7N9禽流感的流行高峰在時(shí)間上有很大重合性,且人感染H7N9禽流感的臨床表現(xiàn)也跟一般的普通流感比較相似,但顯著的區(qū)別在于潛伏期,即流感的潛伏期相對(duì)較短,通常1~3 d。而H7N9潛伏期平均是7 d,短的是2~3 d,長(zhǎng)的是10~14 d。因此,在利用臨床癥狀關(guān)鍵詞的百度指數(shù)預(yù)測(cè)環(huán)節(jié)中,將預(yù)測(cè)時(shí)間間隔擬定為周,搜集臨床癥狀關(guān)鍵詞在2013年1月份到2018年12月份廣東省每周的百度指數(shù)。
1.2研究方法 本文運(yùn)用R統(tǒng)計(jì)軟件,基于廣東省H7N9亞型禽流感病例數(shù)和百度指數(shù),采用支持向量機(jī)回歸和多元線性回歸對(duì)疫情趨勢(shì)進(jìn)行預(yù)測(cè)。
1.2.1支持向量機(jī)回歸預(yù)測(cè) 支持向量機(jī)回歸(support vector machine regression, SVMR)是以支持向量機(jī)作為數(shù)據(jù)挖掘方法處理時(shí)間序列分析問(wèn)題,其擬合優(yōu)度并非通過(guò)常規(guī)的二次損失函數(shù)(均方差)測(cè)量,而是通過(guò)非靈敏損失函數(shù)(ILF)測(cè)度[20]。本文以每個(gè)疫情波段中H7N9亞型禽流感每月新增病例數(shù)為因變量,以相應(yīng)的H7N9月度百度指數(shù)為自變量,采用徑向基(RBF)核函數(shù),利用交叉驗(yàn)證方法尋找最佳的懲罰因子和RBF核函數(shù)的方差,然后分波段建立支持向量機(jī)回歸模型,對(duì)每個(gè)波段的疫情前半段進(jìn)行模型訓(xùn)練和對(duì)后半段進(jìn)行模型預(yù)測(cè),考察是否可以預(yù)測(cè)到實(shí)際病例數(shù)的變化趨勢(shì)與峰值出現(xiàn)的時(shí)間,最后以均方誤差小和決定系數(shù)大作為預(yù)測(cè)效果良好的評(píng)判標(biāo)準(zhǔn),選取預(yù)測(cè)效果較好的疫情波段。
1.2.2多元線性回歸預(yù)測(cè) 基于支持向量回歸預(yù)測(cè)效果較好的疫情波段,以這段疫情波段的每周新增病例數(shù)為因變量,以12個(gè)H7N9亞型禽流感臨床癥狀關(guān)鍵詞的百度指數(shù)為自變量建立多元線性回歸模型。第1步,采用皮爾森相關(guān)系數(shù)(PCC)和斯皮爾曼相關(guān)系數(shù)(SCC)判斷12個(gè)關(guān)鍵詞與實(shí)際每周H7N9亞型禽流感病例數(shù)的關(guān)系。第2步, 評(píng)估模型的預(yù)測(cè)效果:采用留一法交叉驗(yàn)證法LOOCV(leave-ont-out cross validation),選取上述支持向量回歸預(yù)測(cè)效果較好的疫情波段,假設(shè)有n個(gè)周的數(shù)據(jù),將每周的數(shù)據(jù)作為測(cè)試集,其余n-1個(gè)周的數(shù)據(jù)作為訓(xùn)練集,重復(fù)方法使每個(gè)周度數(shù)據(jù)都被作為一次測(cè)試集,然后使用逐步回歸法去除回歸效果不夠顯著的自變量,建立最優(yōu)的預(yù)測(cè)模型,以預(yù)測(cè)值與實(shí)際值的皮爾森相關(guān)系數(shù)(PCC)評(píng)估預(yù)測(cè)模型實(shí)際應(yīng)用中的準(zhǔn)確度。第3步,開(kāi)展疫情預(yù)測(cè):采用反向測(cè)試(retrospective test)方法,假設(shè)數(shù)據(jù)集共M條周度數(shù)據(jù),用后N條周度數(shù)據(jù)作測(cè)試集,以測(cè)試其中的第n條周度數(shù)據(jù)為例,將前(M-N+n-1)條周度數(shù)據(jù)作為訓(xùn)練集構(gòu)建模型,為排除普通流感流行(潛伏期1~3 d)的混雜影響,文章鑒于人感染H7N9禽流感的臨床表現(xiàn)一般存在7 d潛伏期,參考一些專家的方法[21],將預(yù)測(cè)周的前一周H7N9實(shí)際新增病例數(shù)據(jù)作為自變量加入到模型中,預(yù)測(cè)第n條的周度數(shù)值,重復(fù)方法N次,也就是說(shuō),利用上述支持向量回歸預(yù)測(cè)效果較好的疫情波段作為訓(xùn)練集,預(yù)測(cè)下一個(gè)疫情波段的病例數(shù),并以下一個(gè)疫情波段的實(shí)際病例數(shù)作為驗(yàn)證集進(jìn)行比較,最后利用預(yù)測(cè)值和實(shí)際值之間的皮爾森相關(guān)系數(shù)(PCC)檢驗(yàn)反向測(cè)試的效果以及采用預(yù)測(cè)值與實(shí)際值的平均絕對(duì)誤差(MAE)判斷模型的預(yù)測(cè)準(zhǔn)確度。
2.1廣東省H7N9亞型禽流感疫情波段劃分與分析 由圖1可知,廣東省2013年8月份至2018年2月份的月度H7N9亞型禽流感確診病例數(shù)與百度指數(shù)的變化趨勢(shì)具有很高的相似性,總體上,月新增病例數(shù)越多其百度指數(shù)越高,而且呈現(xiàn)4個(gè)波段,波段周期長(zhǎng)短相符,大體可劃分為:第1波段(2013年7月份至2014年7月份)、第2波段(2014年10月份至2015年4月份)、第3波段(2015年10月份至2016年6月份)、第4波段(2016年11月份至2017年5月份);此外,與病例數(shù)變化趨勢(shì)相比,4波疫情中的居民搜索關(guān)鍵詞“H7N9”的行為呈提前現(xiàn)象(提前時(shí)間1個(gè)月),如廣東省首個(gè)病例發(fā)生于2013年8月份,比居民首次搜索關(guān)鍵詞“H7N9”的行為僅晚了1個(gè)月;在2013-2018年期間,廣東省發(fā)生病例數(shù)最多(44起)的月份是2014年2月份,而百度指數(shù)最高(11 719)的月份是2014年1月份。
由圖2可知,在每波疫情中,H7N9亞型禽流感總病例數(shù)與關(guān)鍵詞“H7N9”總的百度指數(shù)有一定的相關(guān)關(guān)系。除了第2波疫情外,第1波、第3波、第4波疫情中的百度指數(shù)與病例總數(shù)近似同步。
圖2 每波疫情總病例數(shù)與關(guān)鍵詞“H7N9”百度指數(shù)的關(guān)系圖Fig.2 Relationship between the total number of cases in each wave and the keyword "H7N9" in the Baidu index
2.2分波段支持向量機(jī)回歸預(yù)測(cè) 在H7N9亞型禽流感疫情的不同波段,居民對(duì)于關(guān)鍵詞“H7N9”的搜索行為不同,故根據(jù)疫情波段選擇訓(xùn)練集與預(yù)測(cè)集開(kāi)展支持向量機(jī)回歸預(yù)測(cè),見(jiàn)圖3~7。
由圖3可知,廣東省的每波疫情中,2月份是H7N9亞型禽流感的高發(fā)月份,以此為界,選擇疫情中10月份到次年1月份的病例發(fā)生數(shù)作為訓(xùn)練集,2月份到9月份作為預(yù)測(cè)集。
圖3 2013年8月份至2018年12月份各波疫情每月H7N9亞型禽流感病例數(shù)Fig.3 Number of H7N9 subtype avian influenza cases in each wave from August 2013 to December 2018
第1~3波疫情中(見(jiàn)圖1),百度指數(shù)峰值出現(xiàn)的時(shí)間比病例數(shù)峰值提前1個(gè)月,故利用第t-1個(gè)月的關(guān)鍵詞“H7N9”百度指數(shù)預(yù)測(cè)第t個(gè)月的H7N9禽流感病例數(shù);在第4波疫情中,百度指數(shù)峰值出現(xiàn)時(shí)間比病例數(shù)峰值滯后1個(gè)月,因此利用第t+1個(gè)月關(guān)鍵詞“H7N9”的百度指數(shù)預(yù)測(cè)第t個(gè)月H7N9亞型禽流感病例數(shù)。
圖1 2013-2018年各月H7N9亞型禽流感病例數(shù)與關(guān)鍵詞“H7N9”百度指數(shù)的變化趨勢(shì)Fig.1 Change trend in the number of H7N9 subtype avian influenza cases in each month and the keyword "H7N9" in the Baidu index from 2013 to 2018
由圖4可知,廣東省第1波疫情中預(yù)測(cè)集是2014年2月份至2014年7月份,除了2014年4月份和7月份外,2014年2月份、3月份、5月份和6月份的預(yù)測(cè)值均低于同期的真實(shí)值。
圖4 第1波疫情中預(yù)測(cè)集的真實(shí)值和預(yù)測(cè)結(jié)果的對(duì)比Fig.4 Comparison of the true values of the predicted sets and the predicted results in the first wave epidemic
由圖5可知,廣東省第2波疫情中預(yù)測(cè)集是從2015年2月份到2015年4月份,其中2015年2月份的預(yù)測(cè)值低于同期的真實(shí)值,而3月份的預(yù)測(cè)值高于同期的真實(shí)值。
圖5 第2波疫情中預(yù)測(cè)集的真實(shí)值和預(yù)測(cè)結(jié)果的對(duì)比Fig.5 Comparison of the true values of the predicted sets and the predicted results in the second wave epidemic
由圖6可知,第3波疫情中預(yù)測(cè)集是從2016年2月份到2016年6月份,其中5月份的預(yù)測(cè)值與真實(shí)值一致,但2016年2月份、3月份的預(yù)測(cè)值低于同期的真實(shí)值,而4月份、6月份的預(yù)測(cè)值高于同期的真實(shí)值。
圖6 第3波疫情中預(yù)測(cè)集的真實(shí)值和預(yù)測(cè)結(jié)果的對(duì)比Fig.6 Comparison of the true values of the predicted sets and the predicted results in the third wave epidemic
由圖7可知,廣東省第4波疫情中的預(yù)測(cè)集是從2017年2月份到2017年5月份,這些月份的預(yù)測(cè)值均高于同期的真實(shí)值。
圖7 第4波疫情中預(yù)測(cè)集的真實(shí)值和預(yù)測(cè)結(jié)果的對(duì)比Fig.7 Comparison of the true values of the predicted sets and the predicted results in the fourth wave epidemic
通過(guò)計(jì)算圖4到圖7每波疫情的均方誤差和決定系數(shù)發(fā)現(xiàn),第1波、第2波、第3波、第4波疫情預(yù)測(cè)集的均方誤差分別為21.68、8.63、11.21、30.97,決定系數(shù)分別為0.78、0.91、0.90、0.76,第2、3波疫情的預(yù)測(cè)值能較好地描述真實(shí)病例數(shù)的變化趨勢(shì)。
2.3多元線性回歸預(yù)測(cè) 由表1可知,12個(gè)關(guān)鍵詞的百度指數(shù)與實(shí)際每周H7N9亞型禽流感病例數(shù)的皮爾森相關(guān)系數(shù)和斯皮爾曼相關(guān)系數(shù)有明顯的正相關(guān),與實(shí)際疫情有較強(qiáng)相關(guān)性的關(guān)鍵詞是 “肌肉酸痛”(PCC=0.381,SCC=0.472)、“頭痛”(PCC=0.326,SCC=0.281)、“發(fā)熱”(PCC=0.261,SCC=0.377)。由此可知,12個(gè)關(guān)鍵詞的百度指數(shù)可用來(lái)預(yù)測(cè)H7N9亞型禽流感疫情的動(dòng)態(tài)變化。
表1 各關(guān)鍵詞的百度指數(shù)與實(shí)際病例數(shù)的相關(guān)性系數(shù)Tab.1 Correlation coefficients between each keyword in the Baidu index and the actual number of cases
以廣東省2014年10月份到2016年6月份每周新增H7N9亞型禽流感病例數(shù)作為因變量,以上述12個(gè)關(guān)鍵詞的百度指數(shù)作為自變量建立多元線性回歸模型,依次選取2014年10月份到2016年6月份中的一個(gè)周的數(shù)據(jù)為測(cè)試集,其余的數(shù)據(jù)為訓(xùn)練集,通過(guò)逐步回歸方法,結(jié)合AIC信息準(zhǔn)則數(shù)值最小化作為選擇模型擬合數(shù)據(jù)較優(yōu)的標(biāo)準(zhǔn),最終形成自變量為“肌肉酸痛”、“發(fā)熱”、“頭痛”、“流涕”、“乏力”的預(yù)測(cè)模型。通過(guò)留一法交叉驗(yàn)證(LOOCV)評(píng)估發(fā)現(xiàn),預(yù)測(cè)值與實(shí)際值之間的PCC為0.805(P<0.01),這說(shuō)明,模型在測(cè)試數(shù)據(jù)上的效果較好。
采用反向測(cè)試方法,以76周(2014年10月份到2016年6月份,共19個(gè)月,累計(jì)76周)的數(shù)據(jù)作為訓(xùn)練集,預(yù)測(cè)第4波段(2016年11月份到2017年5月份,共7個(gè)月,累計(jì)28周)的疫情走勢(shì),以28個(gè)預(yù)測(cè)周的前1周H7N9病例新增數(shù)據(jù)(即2016年10月25-31日)作為自變量加入到模型中,消除普通流感的混雜影響,并以第4波段的實(shí)際病例數(shù)作為驗(yàn)證集。為了便于比較,將多元線性回歸模型得出的周度預(yù)測(cè)值轉(zhuǎn)換為預(yù)測(cè)值,研究結(jié)果見(jiàn)表2,第4波段疫情的預(yù)測(cè)值與實(shí)際值比較接近,兩者之前的PCC為0.885(P<0.01),相關(guān)性強(qiáng),預(yù)測(cè)值與實(shí)際值的平均絕對(duì)誤差(MAE)為2.83,預(yù)測(cè)的準(zhǔn)確度較高,很好地捕捉到真實(shí)病例數(shù)峰值出現(xiàn)的時(shí)間。在2017年2月份到2017年5月份這段時(shí)間內(nèi),支持向量機(jī)回歸的預(yù)測(cè)值與實(shí)際值之間的PCC值為0.791(P<0.01),MAE=10,而多元線性回歸的預(yù)測(cè)值與實(shí)際值之間的PCC值為0.987(P<0.01),相關(guān)性更明顯,MAE=2.25,相比之下,多元線性回歸的預(yù)測(cè)效果更優(yōu)。
表2 第4波段疫情的病例數(shù)預(yù)測(cè)值與實(shí)際值Tab.2 Predicted values and the actual number of cases in the fourth wave of the epidemic
為了更好地預(yù)測(cè)廣東省H7N9亞型禽流感疫情的動(dòng)態(tài)變化,本文基于2013-2018年廣東省的“H7N9”與12個(gè)H7N9亞型禽流感臨床癥狀等關(guān)鍵詞的百度指數(shù),結(jié)合2013年到2018年的廣東省H7N9亞型禽流感月度新增病例數(shù),劃分了4個(gè)疫情波段,首先,通過(guò)支持向量機(jī)回歸預(yù)測(cè)篩選第2、3波段的疫情時(shí)間(2014年10月份到2016年6月份),然后,在這個(gè)疫情的周度時(shí)間范圍內(nèi),12個(gè)H7N9亞型禽流感臨床癥狀的關(guān)鍵詞與實(shí)際病例數(shù)有明顯的正相關(guān),結(jié)合臨床癥狀關(guān)鍵詞建立多元線性回歸模型對(duì)第4波段疫情預(yù)測(cè)發(fā)現(xiàn),預(yù)測(cè)值能更好地?cái)M合實(shí)際疫情動(dòng)態(tài)趨勢(shì),比支持向量機(jī)回歸的預(yù)測(cè)精度更高。
“有事問(wèn)百度”已成為我國(guó)居民利用其檢索服務(wù)功能關(guān)注新型傳染病以及查詢和獲取健康信息的重要渠道,隨著網(wǎng)民的逐年增加和5G時(shí)代的到來(lái),搜索引擎的使用率會(huì)愈加頻繁,基于百度指數(shù)預(yù)測(cè)傳染病的發(fā)生率具有良好的應(yīng)用前景。本文以廣東省H7N9亞型禽流感疫情為例,創(chuàng)新性地從分疫情波段和臨床癥狀關(guān)鍵詞兩個(gè)方面試圖改進(jìn)現(xiàn)有研究的預(yù)測(cè)性能,得到的結(jié)論具有流行病學(xué)意義,進(jìn)一步肯定了搜索引擎網(wǎng)絡(luò)大數(shù)據(jù)預(yù)測(cè)傳染病的可行性。
然而,本文預(yù)測(cè)的結(jié)果與實(shí)際疫情發(fā)生尚不完全吻合,預(yù)測(cè)模型及參數(shù)方面仍存在不盡人意的地方。盡管百度公司對(duì)百度指數(shù)進(jìn)行不懈的完善,使之更接近實(shí)際,但傳染病預(yù)測(cè)模型的建立,還有不少影響精準(zhǔn)度的噪音:一是指數(shù)本身受制于搜索者的知識(shí)層面、所在地區(qū)的限制,對(duì)于預(yù)測(cè)結(jié)果存在一定的干擾,例如,非廣東省地區(qū)發(fā)生了疑似疫情,可能導(dǎo)致廣東省對(duì)H7N9亞型禽流感搜索量的上升;二是疫情態(tài)勢(shì)已發(fā)生變化,當(dāng)前我國(guó)人感染H7N9禽流感呈散發(fā)態(tài)勢(shì),大規(guī)模與集中暴發(fā)的可能性較低,如果以集中暴發(fā)期的新增案例預(yù)測(cè),則與實(shí)際相差甚遠(yuǎn)。因此,利用好搜索引擎網(wǎng)絡(luò)大數(shù)據(jù)開(kāi)展精準(zhǔn)預(yù)測(cè)除了要進(jìn)一步了解公眾的搜索習(xí)慣,揣測(cè)搜索動(dòng)機(jī),還應(yīng)根據(jù)氣候、環(huán)境、社會(huì)、經(jīng)濟(jì)、防控政策等新變化對(duì)構(gòu)建的模型進(jìn)行年度調(diào)整。
利益沖突:無(wú)