許小可,文 成,張光耀,孫皓宸,劉 波,王賢文*
(1. 大連民族大學(xué)信息與通信工程學(xué)院 遼寧 大連 116600;2. 大連理工大學(xué)科學(xué)學(xué)與科技管理研究所暨WISE實(shí)驗(yàn)室 遼寧 大連 116024;3. 電子科技大學(xué)基礎(chǔ)與前沿研究院 成都 610054)
隨著新型冠狀病毒肺炎(COVID-19)疫情的爆發(fā)與蔓延[1-2],截至北京時(shí)間2020年2月3日18時(shí),中國(guó)累計(jì)報(bào)告了感染新型冠狀(新冠)病毒確診病例17 335例[3-5]。此次疫情爆發(fā)在春運(yùn)期間,人員的密集流動(dòng)給病毒的傳播提供了條件[6]。為了阻止病毒隨人口流動(dòng)迅速傳播,武漢于2020年1月23日10時(shí)全面關(guān)閉離漢通道。2020年1月26日晚,在新型冠狀病毒感染的肺炎疫情防控工作的新聞發(fā)布會(huì)上,武漢市長(zhǎng)周先旺表示在23日武漢“封城”前有500萬(wàn)人離開(kāi)武漢,分析這部分人員的數(shù)量和目的地,對(duì)新冠疫情的傳播和防治具有至關(guān)重要的意義。
當(dāng)下已有相關(guān)媒體和學(xué)者使用人口遷徙數(shù)據(jù)對(duì)離漢人口的流動(dòng)做了初步的分析,如第一財(cái)經(jīng)使用百度慧眼數(shù)據(jù)對(duì)人口流向和比例進(jìn)行了描述[7],文獻(xiàn)[8]采用2013?2015 年百度遷徙數(shù)據(jù)分析了國(guó)內(nèi)人口流向,并使用來(lái)自國(guó)際航空運(yùn)輸協(xié)會(huì)(IATA)的2018 年國(guó)際航空旅行數(shù)據(jù)分析了國(guó)際/港澳臺(tái)流向,對(duì)從武漢出發(fā)的人口流向和模式進(jìn)行了初步匯報(bào)。雖然這些分析在向社會(huì)傳達(dá)信息和政府疾病防控上都有著一定社會(huì)意義,但研究仍然停留于定性和簡(jiǎn)單量化分析,從更為科學(xué)合理的角度對(duì)武漢外流人口的地理分布進(jìn)行準(zhǔn)確地量化分析,對(duì)于公眾輿論的正確引導(dǎo)和對(duì)疾病進(jìn)行更好的防控有著非常重要的意義。
本文使用騰訊和百度公司基于地理信息服務(wù)系統(tǒng)收集的大規(guī)模人口流動(dòng)數(shù)據(jù),對(duì)比往年武漢的春運(yùn)狀況,對(duì)武漢外流人口的目的地分布及對(duì)疾病傳播的影響進(jìn)行分析。主要關(guān)注和研究以下兩個(gè)問(wèn)題:1) 節(jié)前500 萬(wàn)人口離開(kāi)武漢,是否是這個(gè)時(shí)間離開(kāi)武漢的正常人流量,這些人口是屬于遇到疫情離開(kāi)武漢,還是正常的春節(jié)前返鄉(xiāng)?2) 武漢流向各城市的人口地理分布是什么情況?離漢人流對(duì)全國(guó)疫情產(chǎn)生了什么影響?回答這些問(wèn)題以期為預(yù)測(cè)和阻止疫病傳播提供參考。
每年春運(yùn)期間,全國(guó)各大城市都有大量的人口進(jìn)出,因?yàn)樯婕暗斤w機(jī)、火車(chē)、汽車(chē)等多種交通方式,基于常規(guī)方法難以統(tǒng)計(jì)出行人數(shù)和目的地信息。隨著提供位置服務(wù)的各種產(chǎn)品的出現(xiàn),基于個(gè)體記錄的“大數(shù)據(jù)”為地理學(xué)研究提供了豐富的群體行為數(shù)據(jù)。不同于統(tǒng)計(jì)年鑒數(shù)據(jù),基于地理位置服務(wù)的數(shù)據(jù)具有時(shí)效性與連續(xù)性,可以包括非戶(hù)籍遷移數(shù)據(jù)與旅游流動(dòng)數(shù)據(jù)等。這種新數(shù)據(jù)使一些難以量化的問(wèn)題得到有效分析和更好研究,而且可以揭示傳統(tǒng)研究中難以發(fā)現(xiàn)的因素[9]。在基于地理位置服務(wù)獲取人口流動(dòng)大數(shù)據(jù)的背景下,可以準(zhǔn)確地對(duì)大規(guī)模人口遷徙的目的地、具體流量和對(duì)疫情的影響進(jìn)行深度剖析。
我國(guó)的主要大型互聯(lián)網(wǎng)公司,如騰訊、百度等都提供基于地理位置的服務(wù),這些服務(wù)可以讓用戶(hù)自報(bào)告其所在的地理位置。互聯(lián)網(wǎng)公司可以利用這些數(shù)據(jù)開(kāi)發(fā)相關(guān)的地理位置產(chǎn)品和服務(wù),如騰訊位置服務(wù)(https://heat.qq.com/index.php)和百度遷徙數(shù)據(jù)服務(wù)(http://qianxi.baidu.com/)。騰訊位置服務(wù)應(yīng)用于微信、QQ、京東、滴滴等多項(xiàng)產(chǎn)品,基本覆蓋全部智能手機(jī)用戶(hù)[10],包含汽車(chē)、火車(chē)(包括高鐵)、飛機(jī)3 種交通方式,提供與360 個(gè)城市相連的最緊密城市的遷徙數(shù)據(jù),涉及我國(guó)34 個(gè)省級(jí)行政區(qū)域的371 個(gè)主要城市(以地級(jí)市為主)。百度遷徙數(shù)據(jù)通過(guò)對(duì)比用戶(hù)位置的變化,將8 小時(shí)內(nèi)所有位置發(fā)生變化的智能終端用戶(hù)數(shù)量進(jìn)行計(jì)算分析,也可以全覆蓋鐵路、公路、航空等各類(lèi)交通工具[11]。
騰訊位置服務(wù)目前終止了遷移數(shù)據(jù)的提供,因此本文只獲取了2016 年?2019 年的歷史數(shù)據(jù)。目前公開(kāi)可獲得的百度遷移數(shù)據(jù)是從2020 年1 月開(kāi)始提供服務(wù),沒(méi)有2020 年以前的具體歷史數(shù)據(jù),但是提供2019 年與2020 年同時(shí)期對(duì)應(yīng)的城市人流指數(shù)數(shù)據(jù)?;谝陨蠈?duì)騰訊和百度數(shù)據(jù)的分析,必須綜合利用兩個(gè)數(shù)據(jù)來(lái)源,才能有效分析出2020年武漢流出人口和正常年度的異同。同時(shí),每年春節(jié)的陽(yáng)歷時(shí)間都不一樣,春節(jié)和元旦之間的時(shí)間差異對(duì)春節(jié)前的人流動(dòng)態(tài)和數(shù)量有一定影響??紤]到2017 年春節(jié)為1 月27 日,2020 年春節(jié)是1 月25日,這兩年的春節(jié)日期是近年來(lái)最為接近的,本文選取了騰訊2017 年和百度2019、2020 年提供的遷徙數(shù)據(jù)作為數(shù)據(jù)來(lái)源,探討2017 年和2020 年的春節(jié)期間的離漢人口數(shù)量、目的地分布等多方面的差異。
2017 年 春 運(yùn) 時(shí) 間 為2017 年1 月13 日?2 月21 日,本文將這個(gè)時(shí)間段分為春節(jié)前和春節(jié)后進(jìn)行統(tǒng)計(jì)分析。
基于獲取的數(shù)據(jù),在1 月11 日(臘月十四)至1 月26 日(臘月二十九)之間,武漢流入的人口遠(yuǎn)遠(yuǎn)低于流出人口,人口的凈流出(這些天流出的總?cè)丝?流入的總?cè)丝?的數(shù)字合計(jì)為373 萬(wàn)左右,此時(shí)人口流出最多的3 天是臘月二十七~二十九。考慮到2017 年到2020 年,人口數(shù)量和交通流量均有增長(zhǎng),且并不是所有的流出人口都會(huì)使用騰訊的相關(guān)產(chǎn)品,因此本文認(rèn)為根據(jù)2017 年的373 萬(wàn)部分流出人流量來(lái)預(yù)測(cè)2020 年的外流人員數(shù)量,與武漢市市長(zhǎng)在新聞發(fā)布會(huì)上提出的武漢市有500 萬(wàn)左右的流出人口數(shù)量大致相符。
正常年份下春節(jié)前武漢的人口流出較多,人口流入較少;而春節(jié)后的情況剛好相反,人口流入較多,流出較少。在2017 年1 月27 日(臘月三十)至2 月21 日(正月二十五)之間,從圖1 可以看到武漢的流出人口數(shù)量比較平穩(wěn),數(shù)量也相對(duì)較少。在整個(gè)春運(yùn)期間,春節(jié)后流出人口會(huì)出現(xiàn)3 次高峰,分別是正月初六、正月十六這兩個(gè)外地務(wù)工人員回城的高峰,此外還有一個(gè)春運(yùn)即將結(jié)束前出現(xiàn)的大中專(zhuān)院校學(xué)生返校高峰。
圖1 2017 年春節(jié)前后武漢的人口流入和流出數(shù)據(jù)
在分析完正常年份2017 年武漢的人流數(shù)量和動(dòng)態(tài)特征以后,本文將2017、2019 和2020 三年從臘月十一到春節(jié)前武漢的進(jìn)出人口動(dòng)態(tài)特征進(jìn)行了比較,如圖2 所示。首先看總體趨勢(shì),2020 年的流入和流出人口,從大的趨勢(shì)上看和2017、2019年的情況基本上是相同的。具體上看,從臘月二十開(kāi)始到二十六,2020 年武漢的流入和流出人口相對(duì)于往年都略有減少,很顯然這段時(shí)間肯定不存在網(wǎng)上炒作的武漢人口“逃離”現(xiàn)象。
圖2 2017、2019 和2020 年武漢春運(yùn)人口流量的動(dòng)態(tài)分析
本文也發(fā)現(xiàn),臘月二十八~三十期間流入人流量更是出現(xiàn)明顯下滑;而臘月二十七~二十九三天間流出人口明顯增多,尤其是臘月二十九凌晨武漢市宣布關(guān)閉離漢通道到10 點(diǎn)正式關(guān)閉的這10 個(gè)小時(shí),涌現(xiàn)出的人流是異于常年的,相比往年有一定的增幅。那么這兩個(gè)時(shí)間段上的輸入人口減少和輸出人口增加和往年相比是否具有顯著性差異呢?考慮到樣本量比較少,本文采用配對(duì)樣本t 檢驗(yàn)來(lái)分析2020 年武漢流入和流出人流的顯著性,具體數(shù)值見(jiàn)表1 所示。從臘月二十八~三十期間的流入人口的數(shù)量來(lái)看,2020年和正常年份具有顯著性差別,和2017 年相比少流入23.33 萬(wàn)人,比2019 年少流入26.12 萬(wàn)人。從臘月二十七~二十九期間的流出人口的數(shù)量來(lái)看,2020 年和2017 年比較具有顯著性差別,多流出人口12.14 萬(wàn)人;與2019 年相比不具有顯著性差異,多流出人口6.10 萬(wàn)人。
表1 2020 年和2017、2019 年進(jìn)出武漢人口的差異
上述結(jié)果說(shuō)明在關(guān)閉離漢通道那幾天,武漢出現(xiàn)了人口大量離開(kāi)的現(xiàn)象,但是人口數(shù)量相對(duì)于往年和整個(gè)500 萬(wàn)的人口數(shù)量并不大。此外,也無(wú)法確定導(dǎo)致這一現(xiàn)象的原因是疾病爆發(fā)還是武漢要關(guān)閉出城通道這一消息。如果是正常的返鄉(xiāng)人流,他們從官方和其他渠道得知要關(guān)閉離漢通道的消息后,很明顯是要選擇盡快出城回家過(guò)年。他們當(dāng)中應(yīng)該有在武漢求學(xué)的大學(xué)生回家、有辛苦工作一年的外地務(wù)工人員返鄉(xiāng),這些人的流出目的地每年幾乎都是相同的。而如果是受疫情影響的外出人流,他們的流出目的地就會(huì)和返鄉(xiāng)人流有一定區(qū)別?;谏鲜隹紤],本文在下一節(jié)中比較2020 年和正常年份武漢春節(jié)外流人口的地理分布。
基于2017 年和2020 年春節(jié)前離漢人口的主要流向城市排序和比例如表2 所示??梢?jiàn),排名前4 的城市排序都是相同的,排名在前20 的城市中前18 名也都是重合的。在2020 年人口流出前20 個(gè)城市中,僅有排在最后的兩個(gè)城市北京和上海沒(méi)有出現(xiàn)在2017 年的名單中;而在2017 年人口流出前20 城市中,僅有排在最后的兩個(gè)城市駐馬店和南陽(yáng)沒(méi)有出現(xiàn)在2020 年的名單中。上述結(jié)果說(shuō)明了2017 和2020 年武漢流出人口目的地的重合度很高。
表2 2017 和2020 年離漢人口的前20 目的地城市比較
為了進(jìn)一步揭示武漢正常年份和疫情年份人口流出目的地城市的相關(guān)性,本文選取了武漢2020 年流出人口的前50 目的地城市數(shù)據(jù),然后計(jì)算這些城市和2017 年流出人口目的地人口分布之間的相關(guān)性,具體如圖3 所示。圖中所示兩者之間的相關(guān)性很強(qiáng),這說(shuō)明從武漢流出人口的目的地城市,在2020 年疫情年份和正常非疫情年份的地理分布基本也是一致的。綜合以上分析,從2020 年疫情發(fā)生前期,武漢流入人口數(shù)還有流出人口的分布這兩個(gè)角度,本文認(rèn)為絕大部分人和往年一樣是正常地回家過(guò)年,而非網(wǎng)上所言的“逃離”武漢。
圖3 2017 年和2020 年武漢春運(yùn)人口流量目的地分布的相關(guān)性
大家直覺(jué)認(rèn)為:一個(gè)城市或地區(qū)如果從武漢來(lái)的人流量越大,這個(gè)地區(qū)的肺炎病例就有可能越多(包括原發(fā)已感染病例和多代傳染病例)。
為了驗(yàn)證這一點(diǎn),本文計(jì)算了武漢流出人口目的地前50 城市的人流量和截至2020 年1 月24 日武漢“封城”后這些城市的肺炎病例數(shù)關(guān)系,如圖4 所示。由該圖可以看出,截至24 日,重慶和北京是病例最多的城市,但是重慶和北京并非武漢流出人口排名前2 位的目的地,而且從該圖的整體上看,武漢流出的人口比例和病例數(shù)之間并不存在較強(qiáng)相關(guān)性。
圖4 武漢流出人口目的地前50 城市和新冠肺炎病例數(shù)關(guān)系(截至2020 年1 月24 日,不考慮潛伏期)
本文分析兩者不相關(guān)這一結(jié)果主要是由新型冠狀病毒的潛伏期效應(yīng)導(dǎo)致的。新冠肺炎患者具有較長(zhǎng)的潛伏期,潛伏期中患者僅有較為微弱的癥狀,如發(fā)熱、乏力和咳嗽等,甚至感覺(jué)不出有何異樣。根據(jù)2020 年1 月30 日國(guó)際醫(yī)學(xué)權(quán)威期刊《新英格蘭醫(yī)學(xué)雜志》(NEJM)中發(fā)表的論文“新型冠狀病毒感染肺炎在中國(guó)武漢的初期傳播動(dòng)力”揭示的新冠肺炎的潛伏期的平均時(shí)間為5.2 天,潛伏期分布情況的第95 百分位數(shù)為12.5 天[12]。分析到這一點(diǎn),本文計(jì)算截至2020 年1 月27 日,考慮潛伏期情況下,前50 目的地城市的人流量和這些城市的肺炎病例數(shù)關(guān)系,如圖5 所示。
從圖中可以發(fā)現(xiàn)二者存在很明顯的線(xiàn)性相關(guān)關(guān)系。如果考慮到3~7 天的潛伏期這一重要因素,從武漢離開(kāi)的人流對(duì)全國(guó)肺炎疫情的影響確實(shí)是非常大的,值得關(guān)注。表3 列出了截至2020 年1 月27 日累計(jì)病例數(shù)排名在前20 的城市排序,并計(jì)算了24 日~27 日的新增病例數(shù)占總病例數(shù)的比率,可以發(fā)現(xiàn)該值在67.5%~98.9%之間,這么高的數(shù)值再一次說(shuō)明疫情分析和防治的過(guò)程中不可忽視潛伏期的影響。
圖5 武漢流出人口目的地前50 城市和新冠肺炎病例數(shù)關(guān)系(截至2020 年1 月27 日,考慮潛伏期)
表3 截至1 月27 日累計(jì)病例數(shù)排名在前20 的城市
為了分析武漢流出人口對(duì)于目的地城市新冠肺炎疫情的長(zhǎng)期影響,圖6 繪制了城市接收武漢流出人口的數(shù)量和該城市新冠肺炎病例數(shù)關(guān)系的相關(guān)性系數(shù)隨時(shí)間變化曲線(xiàn)。由該圖可以發(fā)現(xiàn),隨著時(shí)間的增長(zhǎng),城市接收的武漢流出人口數(shù)和該城的病例數(shù)相關(guān)性逐漸增加,在2020 年1 月31 日左右達(dá)到0.92 這一較為穩(wěn)定值,進(jìn)一步證實(shí)了潛伏期的重要作用。
圖6 城市接收武漢流出人口的數(shù)量和該城市新冠肺炎病例數(shù)關(guān)系的相關(guān)性系數(shù)隨時(shí)間變化曲線(xiàn)
本研究基于騰訊和百度公司的人口遷移數(shù)據(jù),分析了春運(yùn)期間離漢人員的去向,并探討了人員流動(dòng)和疫情擴(kuò)散之間的關(guān)系。與其他對(duì)數(shù)據(jù)的簡(jiǎn)單統(tǒng)計(jì)描述相比,本文發(fā)現(xiàn)官方公布的節(jié)前500 萬(wàn)人口離開(kāi)武漢,大部分都不是社交媒體上熱議的“逃離”武漢,絕大部分還是像往年一樣正常地返鄉(xiāng)過(guò)年。
同時(shí)也發(fā)現(xiàn):臘月二十以后武漢的流入人口就相對(duì)于往年較少,臘月二十六?二十八日期間更是出現(xiàn)明顯下滑;而臘月二十七?二十九日三天間流出人口明顯增多,尤其是臘月二十九凌晨武漢市宣布關(guān)閉離漢通道到10 點(diǎn)正式關(guān)閉的這10 個(gè)小時(shí),涌出的較大人流是異于往常的。盡管這些現(xiàn)象說(shuō)明在短時(shí)間內(nèi)武漢出現(xiàn)了部分人口緊急離開(kāi)的現(xiàn)象,但是這些人口的數(shù)量并不大,甚至和2019 年沒(méi)有顯著性差異。此外,無(wú)法確定導(dǎo)致這一現(xiàn)象的原因是疾病爆發(fā)還是武漢要“封城”這一消息。本文比較2020 年和正常年份武漢春節(jié)外流人口的地理分布,發(fā)現(xiàn)兩者之間沒(méi)有特別明顯的差別。
從武漢外流人口對(duì)疫情傳播的影響來(lái)看,必須高度重視新冠肺炎潛伏期這一重要因素。由于此次疫病患者在潛伏期中癥狀輕微但是有很強(qiáng)的傳播性,與2003 年SARS 相比更加難以防范,也是此次疫情防控的難點(diǎn)。因此離開(kāi)武漢的人們進(jìn)行14 天的自我隔離,對(duì)于疫情的控制還是非常必要的。而離漢人群需要的是幫助而不是抵制,政府部門(mén)應(yīng)當(dāng)有相應(yīng)的保障措施,體現(xiàn)出人性關(guān)懷。
基于位置大數(shù)據(jù)可以對(duì)疫情期間的人口流動(dòng)狀況進(jìn)行可視化呈現(xiàn)和統(tǒng)計(jì)分析,能更加有效了解疫區(qū)的人口流向,完善疫情地理信息數(shù)據(jù)庫(kù)并在此基礎(chǔ)上展開(kāi)分析和建模工作,可有效分析疫情的時(shí)空演變和擴(kuò)散特征,支持疾病應(yīng)急中心的選址和設(shè)計(jì)。在此基礎(chǔ)上通過(guò)引入疾病傳播模型,可分析城市傳染病傳播的防控因素,對(duì)以后更好地預(yù)測(cè)和阻止疾病傳播具有重要的參考意義。
本文研究工作的數(shù)據(jù)分析還得到張童、冉義軍的幫助,在此表示感謝。