□ 文 /湯一平 浙江工業(yè)大學
3月2日,習近平總書記在北京考察新冠肺炎防控科研攻關工作時強調,要統(tǒng)籌病毒溯源及其傳播途徑研究,利用病毒蛋白和不同受體的結合特征,評估可疑動物作為中間宿主的可能性,利用人工智能、大數(shù)據(jù)等新技術開展流行病學和溯源調查,搞清楚病源從哪里來、向哪里去,提高精準度和篩查效率。
對于傳染病的防控,有三個重要的基本環(huán)節(jié),那就是控制傳染源,切斷傳播途徑,保護易感人群。
在抗擊新冠肺炎的戰(zhàn)場上,有這樣一群人。他們不是警察,干的工作卻有點像破案,這就是流行病學調查員。做流行病學調查有點像警察破案,要在千頭萬緒中抽絲剝繭,去尋找傳染源的蛛絲馬跡,同時排查可能傳播的范圍,這需要有縝密的思維,還要有扎實的專業(yè)知識和豐富的經(jīng)驗。
流行病學調查速度是一個與病毒傳播速度進行時間賽跑的過程,只有跑贏了才能有效阻斷病毒的有效傳播。信息技術是否能幫助疾控“福爾摩斯”減少工作量與工作強度,提升破案的工作效率呢?
計算機病毒與生物病毒都具有寄生性、傳染性、潛伏性、破壞性,兩者一個是生命形式,一個是非生命形式。
早期的生物流行病學的研究就是利用數(shù)學建模的方式來建立傳染病模型,分析病毒的傳播規(guī)律。上個世紀九十年代初期,J.O.Kephart和S.R.White考慮到網(wǎng)絡病毒和生物流行病毒的相似性,利用其與生物流行病相同的建模方式來分析計算機病毒,建立類似的計算機病毒模型,為以后計算機病毒模型的研究奠定了基礎。歷經(jīng)二十余年,網(wǎng)絡病毒模型的研究已經(jīng)日漸走向成熟,模型的研究方法也逐漸完善。迄今為止網(wǎng)絡病毒的研究方向大致分為三類:第一類是概率方法即利用馬氏鏈來描述病毒的狀態(tài)轉移過程;第二類是利用統(tǒng)計的知識,通過數(shù)值模擬分析病毒的傳播規(guī)律;第三類是通過建立數(shù)學模型探究網(wǎng)絡病毒的傳播規(guī)律。
在計算機病毒領域中的研究成果是否也能為生物病毒防控提供一些新的手段?
傳染病的防控是有其科學規(guī)律的,要把握三大原則:隔離傳染源、切斷傳播途徑、保護易感人群。通過“早、快、嚴、小”來實現(xiàn),采取措施早、快速采取措施、嚴格執(zhí)行措施、把疫情控制到最小范圍。
在COVID-19疫情防控中,新加坡能做到以極小的代價有效地阻止了疫情的蔓延。我國在武漢大規(guī)模擴散傳播的情況下,也做到了有效地在全國范圍內遏制了疫情的蔓延趨勢。但是,我國也由于疫情使得全國停擺,對整個社會經(jīng)濟人民生活造成了重大的影響。痛定思痛,我們應該從這件事情中吸取教訓。
2月17日,中國疾控系統(tǒng)研究人員在《中華預防醫(yī)學雜志》發(fā)表《我國新型冠狀病毒肺炎疫情早期圍堵策略概述》,對中國的圍堵策略做了闡述和評價。
該文認為,整體來看,圍堵策略措施的實施降低了除武漢外中國其他地區(qū)出現(xiàn)社區(qū)持續(xù)傳播的風險,延緩了流行高峰到來的時間,緩解了醫(yī)療資源的壓力,為應對可能出現(xiàn)的嚴重流行爭取了寶貴時間,但也對武漢等疫情較重地區(qū)的人民生活和社會生產(chǎn)造成了一定的影響,經(jīng)濟和社會成本巨大。
圍堵策 略(containment)于2005年由WHO提出,作為流感大流行防控的指導性策略。這種策略主要是在新發(fā)傳染病疫情早期,在限定的地理范圍內,采用醫(yī)學和非醫(yī)學(區(qū)域封鎖、停學和停工等)干預策略和措施,以迅速阻斷疫情傳播。
策略的核心措施包括封鎖疫區(qū),加強病例隔離和密切接觸者管理、減少人員流動(交通管控和限制出行等),增加人際距離(停止大型活動、學校延遲開學、工廠推遲復工)和促進公眾個人預防等。
從圖1可以看出,疫情在1月23日至2月2日達到頂峰,湖北省的積極封鎖控制工作中,至少有5000萬人處于“居家封鎖”狀態(tài),為其他省份抵抗疫情的工作爭取了寶貴的時間,并最終預防了(其他省份)成千上萬病例的出現(xiàn)。用空間上的損失換取了寶貴的時間。
圖1 WHO對湖北抗擊COVID-19的以時間軸展開的歸納圖
所以,有必要補充制定關于特殊情況且原因不明的風險決策機制,即在不明原因、風險尚難預估的條件下,迅速評估最壞的情況和結果,并作出有針對性的決策,例如,可以對一定的區(qū)域,立即采取封鎖、隔離、排查等嚴厲措施。總之,寧可十防九空,也不可留下遺憾、貽誤戰(zhàn)機。即使在事后看,當初一些反應有些過激,影響面不大,但為了穩(wěn)妥、安全起見,也是必要的、可以理解的。
以下是防控三大原則指導下的具體舉措:
①控制傳染源:
對來自疫情重點地區(qū)的人禁止出行;
及時關閉產(chǎn)生病毒源的場地,并對其消毒處理;
盡可能迅速全部找出密切接觸者,并盡快進行檢測和隔離;
對居家隔離者進行隨訪和追蹤等多種措施。若違反隔離措施將予以處分。
②切斷傳播途徑:
敦促公民保持冷靜和警惕,提供良好的公共衛(wèi)生建議,戴口罩、注意手衛(wèi)生;
在官網(wǎng)上即時更新每個案例傳播鏈條的詳細分析,完善輸入性病例監(jiān)測;
鼓勵所有有感冒癥狀的患者前去就診;
取消部分大型聚眾公眾互動;③保護易感人群:減少公眾活動,控制人員流動;良好的公眾溝通解釋和信息披露;
對患者、患者的密切接觸者、疑似患者盡快診斷出來,把密切接觸者都找出來,進行管理和治療,這是防止新發(fā)病人的根本辦法。
通過手機定位技術以及軌跡跟蹤是可以獲取病毒攜帶者和密切接觸者的時空信息的,病毒攜帶者的個人及手機信息是可以通過各地疾控中心獲得的,病毒攜帶者的行為以及所產(chǎn)生的病毒場是可以通過大數(shù)據(jù)等計算分析手段追溯得到的,密切接觸者是可以通過用其進入病毒場的頻度、時間長度和接近程度進行推理計算得到的。
現(xiàn)實疫情防控中,有兩類密切接觸者最為難防,一類是為了某些原因故意隱瞞的,另一類是就連自己也不知道是密切接觸者。有兩類感染者也更為難防,一種是潛伏期就具備了傳染力的感染者,另一種是無癥狀感染者。
互聯(lián)網(wǎng)時代我們缺的不是信息,缺的是快速、準確的從海量的信息中篩選出真實,有益部分的能力。抗疫情最需要有一個動態(tài)實時精準反映疫情的地圖,及時獲取病毒攜帶者時空分布信息并映射成相應的病毒場時空分布信息,然后精準地篩選和提取出可能被感染或者感染他人的語義場景并實時更新,讓信息上報、流動、發(fā)布和采取隔離措施的速度跑贏病毒傳播速度。
那么將病毒攜帶者與病毒場進行映射,能帶來什么效果呢?
能實現(xiàn)對個人隱私的保護,公開的信息中不會出現(xiàn)感染者和密切接觸者的任何個人信息,這樣容易實現(xiàn)對已感染患病的人群、擔憂被感染的人群以及大量健康的人群實施人道主義關懷,有助于提高全民對傳染病的群防群控自覺性。
能精準定位防控對象、分類精準實施防控措施、體現(xiàn)對疫情無情對人溫情、兼顧疫情防控和生活生產(chǎn)。
病毒場的大小以及分布范圍是可以進行計算的,病毒攜帶者在某個相對比較密閉的空間滯留的時間越長,其產(chǎn)生的病毒場就越大;在某個空間內病毒攜帶者越多那么病毒場就越大;同樣道理,易感人群滯留在病毒場時間越長、滯留的病毒場病毒密度越高,那么被感染的概率就越大;通過這種方法將病毒傳播感染的問題轉化成概率計算問題。
實現(xiàn)對事不對人,有利于避免對疾病標簽下的污名化,傳染病疫情對整個人類都是災難,疫情爆發(fā)地的所有居民首先都是受害者。
在法律方面,有助于解決疫情信息發(fā)布和預警之間責任不清問題;疫情發(fā)布,是對巳經(jīng)明確的疫情進行公開,需要由國務院衛(wèi)生行政部門負責向社會公布傳染病疫情信息;預警是對還沒有發(fā)生或者可能發(fā)生的疫情進行前置式的警示,發(fā)布預警主體是縣級以上地方各級人民政府。如果以病毒場的信息發(fā)布,就像一個路段或者小區(qū)發(fā)生煤氣泄漏一樣,早些告知居民主動避開這些區(qū)域,即能阻止病毒的蔓延,同時也能減少民眾的恐慌心理。畢竟傳染病與其他自然災害有所不同,如地震預警預報是一個很大的區(qū)域,而傳染病的預警可以限制在一個比較小的范圍內。
從信息工作者角度來說,要解決幾個核心問題:一是兩步可視化方法,即對病毒攜帶者可視化和對其向周圍散發(fā)的病毒分布可視化;二是在充分保護個人隱私的前提下對病毒攜帶人群的時空軌跡數(shù)據(jù)和感染發(fā)病數(shù)據(jù)的收集、清洗與加工;三是計算病毒攜帶者為位置中心的病毒分布密度;四是將病毒攜帶人群的時間、空間和病毒分布密度數(shù)據(jù)映射到時態(tài)GIS上;五是排查出所有可疑重點的傳染病病毒場,并根據(jù)空間位置語義信息標識出高風險的傳染病病毒場。
大數(shù)據(jù)的核心意義在于對事物未來發(fā)展趨勢的預測。依據(jù)大數(shù)據(jù)處理時間要求,可以將大數(shù)據(jù)處理模式分成三種:離線批處理式數(shù)據(jù)處理,查詢式數(shù)據(jù)處理和實時式數(shù)據(jù)處理。而對于COVID-19這樣的防控,是在與病毒的傳播速度進行賽跑,就必須采用實時式數(shù)據(jù)處理方式。
大數(shù)據(jù)在公共衛(wèi)生領域中的應用,更是得到了人們的關注,突出體現(xiàn)在以傳染病監(jiān)測數(shù)據(jù)為基礎,利用不同數(shù)據(jù)處理技術,建立敏感特異的傳染病監(jiān)測預警體系。
基于網(wǎng)絡數(shù)據(jù)的監(jiān)測預警系統(tǒng),具有明顯的優(yōu)勢:
一是避開了傳統(tǒng)監(jiān)測系統(tǒng)的層峰式結構,具有實施快速的特點。
二是傳統(tǒng)監(jiān)測系統(tǒng)只能收集疾病治療階段的數(shù)據(jù),而基于網(wǎng)絡數(shù)據(jù)的監(jiān)測系統(tǒng)可以在癥狀出現(xiàn)時起,或者疾病發(fā)生早期進行預警。
三是基于網(wǎng)格的監(jiān)測系統(tǒng),適合于大量人群的數(shù)據(jù)分析,即使在一些中低收入國家,網(wǎng)絡使用率僅為30.7%,網(wǎng)絡來源的數(shù)據(jù)分析依舊優(yōu)于傳統(tǒng)監(jiān)測系統(tǒng)。
醫(yī)療大數(shù)據(jù)主要來自檢驗結果,影像數(shù)據(jù),費用數(shù)據(jù),基因數(shù)據(jù)等,數(shù)據(jù)量龐大,每天都在更新。大數(shù)據(jù)在醫(yī)療衛(wèi)生領域應用廣泛,包括疾病診斷,治療效果評估,流行病預測和藥物不良反應分析的醫(yī)療大數(shù)據(jù),對傳染病的監(jiān)測預警,主要是通過癥狀監(jiān)測模式來實現(xiàn)。癥狀監(jiān)測是指持續(xù)、系統(tǒng)的收集分析臨床明確診斷前與疾病爆發(fā)相關的資料,及時發(fā)現(xiàn)疾病在時間空間上的異常聚集,以及對疾病爆發(fā)進行早期探查,預警和快速反應的監(jiān)測方法。癥狀監(jiān)測通常不依賴于特定的疾病診斷,而是對人群中特定臨床綜合征進行監(jiān)測。癥狀監(jiān)測,作為傳統(tǒng)監(jiān)測的有益補充,提高了新發(fā)傳染病和暴發(fā)疫情發(fā)現(xiàn)的敏感性,提高了疾病防控的能力和水平,但是當前的癥狀檢測也存在著一些不足之處,比如推廣成本高,信息化建設落后,病原檢測滯后,數(shù)據(jù)不能共享等。
傳染病暴發(fā)流行,是病原體通過傳播途徑,在易感人群中引發(fā)的。這種監(jiān)測,對于明確疾病的傳播過程,追溯傳染來源等能夠起到關鍵作用。病原監(jiān)測涉及到病原體分離鑒定分子診斷,血清學監(jiān)測,以及其他體內體外試驗。國際上發(fā)達國家尤其重視細菌性傳染病監(jiān)測中的病人分析與預警工作,通過整合病原檢測技術,網(wǎng)絡實驗室現(xiàn)場調查和數(shù)據(jù)分析,達到提前預警。
不同數(shù)據(jù)來源的傳染病監(jiān)測預警系統(tǒng)有各自的優(yōu)勢和不足,如何取長補短,融合不同預警系統(tǒng)的優(yōu)點,改進監(jiān)測手段,成為下一步研究的重點。具體工作主要集中在以下幾個方面:
第一,在探討新的監(jiān)測手段,即將監(jiān)測系統(tǒng)應用于新的疾病種類的同時,應注意如何將這些監(jiān)測手段與現(xiàn)有監(jiān)測系統(tǒng)融合。新的監(jiān)測系統(tǒng),不是對現(xiàn)有監(jiān)測系統(tǒng)的取代,而是在現(xiàn)有監(jiān)測系統(tǒng)上的延伸。
第二,網(wǎng)絡數(shù)據(jù)的監(jiān)測系統(tǒng),僅僅應用在發(fā)達國家,但是隨著旅游和貿易的全球化,國家與國家之間的聯(lián)系愈加頻繁,檢測、監(jiān)測和防控傳染病,成為一個全球的問題,在探討如何解決網(wǎng)絡大數(shù)據(jù)不足支出的同時,也應著手建立基于網(wǎng)絡數(shù)據(jù)來源的全球化監(jiān)測系統(tǒng)。
第三,建立對監(jiān)測系統(tǒng)的評價體系,要從邏輯學經(jīng)濟學流行病學的角度,去評價監(jiān)測系統(tǒng),以保證監(jiān)測系統(tǒng)的使用及推廣。
這次,首先由杭州推出的健康碼就是運用了大數(shù)據(jù)、云計算來實現(xiàn)的,它在抗擊COVID-19中起到了非常重要的作用。
綜上所述,基于大數(shù)據(jù)的傳染病監(jiān)測預警工作的研究方法和理論,已經(jīng)取得了長足的進步,并逐步走向成熟,盡管大數(shù)據(jù)存在一些等待解決的挑戰(zhàn),比如數(shù)據(jù)噪聲、數(shù)據(jù)共享以及個人隱私安全等,但是我們相信,隨著數(shù)據(jù)處理技術日新月異的發(fā)展以及國家層面大數(shù)據(jù)相關政策的落實,大數(shù)據(jù)必將帶來巨大變革,也必將在傳染病監(jiān)測預警領域發(fā)揮至關重要的作用。
多位醫(yī)學專家回顧此次疫情暴發(fā)早期的工作得失,不約而同地提到2003年SARS疫情以后,中央和地方花費巨資建立的“傳染病網(wǎng)絡直報系統(tǒng)”并未充分發(fā)揮作用。那么它為什么沒能充分發(fā)揮作用呢?
傳染病網(wǎng)絡直報系統(tǒng)的信息報告反饋流程如圖2所示。建設該系統(tǒng)的目的是在醫(yī)院接診傳染病病人或疑似傳染病病人后,能快速上報、審核,衛(wèi)生部門與疾控系統(tǒng)也能快速分析、研判疫情。按照設計規(guī)劃,這套龐大的信息系統(tǒng)是一個理論上橫向覆蓋全國,縱向貫穿“到鄉(xiāng)鎮(zhèn)衛(wèi)生院的電腦里都可以看到這個網(wǎng)絡系統(tǒng)”。
從流程框圖來看,這個網(wǎng)絡系統(tǒng)屬于一般的信息系統(tǒng),估計沒有運用大數(shù)據(jù)和人工智能等技術。
圖2 傳染病網(wǎng)絡直報系統(tǒng)的信息報告反饋流程圖
復旦大學附屬華山醫(yī)院感染科主任張文宏教授說:“中國疾控直報系統(tǒng)并不是花架子,這個系統(tǒng)對于已知的病原體(如MERS,2009大流行株H1N1流感病毒)或者傳播不快、有限傳人的病原體(如H7N9禽流感),比世界上大多數(shù)國家都厲害?!?/p>
但這個系統(tǒng)的一個問題是“經(jīng)受不起大量垃圾信息的摧毀”。
以信息專業(yè)的語言來說就是涉及到模式識別和知識發(fā)現(xiàn)的問題。
通過申報系統(tǒng)上報上來的是數(shù)據(jù),這些數(shù)據(jù)本身可能會雜亂,如果不經(jīng)過梳理、清洗和加工,對用戶來說不能夠稱為信息,可能成為所謂的“垃圾信息”。目前申報系統(tǒng)對上報的數(shù)據(jù)處理能力比較弱。
因此,筆者認為,應對直報系統(tǒng)進行升級改造,比如引入鐘南山團隊的人工智能預測模型,在方案設計時引入數(shù)據(jù)科學家和人工智能團隊成員;加強直報系統(tǒng)升級,使信息更為通暢、處理更為智能、反饋更為及時、使用更為便捷、權利和責任更為清晰。
COVID-19爆發(fā)后,筆者團隊做了以下三個方面的研究工作:基于時空軌跡數(shù)據(jù)的流行傳染病病毒場可視化處理方法、基于流行傳染病病毒場追溯傳染源的方法和基于流行傳染病病毒場的防控方法,并完成了總體設計工作。
為了克服已有的傳染病防控方法對已經(jīng)患病或者疑似患病者識別排查難、對個人隱私保護缺失、對付病毒的隱匿性手段欠缺、難以計算與病毒攜帶者相遇后被感染的概率、對疫情的精準施策和精準防控缺少有力的技術支撐等不足,設計目標是提供一種通過病毒攜帶人群的時空軌跡數(shù)據(jù)和感染發(fā)病數(shù)據(jù)加工成病毒攜帶者為位置中心的病毒分布密度圖,并加入空間位置語義信息映射到時態(tài)GIS上,將流行傳染病病毒場可視化處理的方法。
通過構建一個基于時態(tài)GIS的流行傳染病病毒場云平臺,面對全國各地每天產(chǎn)生的海量疫情數(shù)據(jù)的加工處理,采用云計算的方式來實現(xiàn);各地基層疾病防控中心工作人員通過基于時態(tài)GIS的流行傳染病病毒場云平臺輸入病毒攜帶者感染發(fā)病數(shù)據(jù);然后通過病毒攜帶人群的時空軌跡數(shù)據(jù)和感染發(fā)病數(shù)據(jù)的收集、清洗與加工單元,病毒攜帶者位置語義信息獲取單元,病毒攜帶者為位置中心的病毒分布密度計算單元,病毒攜帶人群的時間、空間和病毒分布密度數(shù)據(jù)映射單元進行云計算,最后自動生成基于時態(tài)GIS的可視化的流行傳染病病毒場。
為了克服已有的傳染病防控方法對追溯病毒源和查清感染途徑耗費大量人力、用時長、結果不準確、調查時間長、需要耗費傳染學病專家很多精力與時間、靜態(tài)的調查結果難以從時間和空間維度、從全局和局部、動態(tài)地追溯感染途徑等不足,設計目的是提供一種通過病毒攜帶人群的時空軌跡數(shù)據(jù)和感染發(fā)病數(shù)據(jù)加工成病毒攜帶者為位置中心的病毒分布密度圖,然后基于時態(tài)GIS的病毒分布密度圖追溯病毒攜帶者在何時何地被病毒感染的,最后得到所有被感染的病毒攜帶者與產(chǎn)生該病毒場的病毒攜帶者傳染傳播鏈的方法。
為了克服已有的傳染病防控方法防控對象不清晰、防控方法一刀切、人文關懷欠缺、耗費人力物力財力大、難以平衡疫情防控和生活生產(chǎn)等不足,設計目標是能提供一種精準定位防控對象、分類精準實施防控措施、體現(xiàn)對疫情無情對人溫情、兼顧疫情防控和生活生產(chǎn)的疫情防控方法。■