中共重慶市萬州區(qū)委黨校 王海濤
重大公共衛(wèi)生事件,是指那些突然發(fā)生的,已經(jīng)或可能對公眾身體健康造成嚴重損害的公共衛(wèi)生事件。主要包括重大傳染類疾病、不明原因的群體性疾病、重大食源性疾病以及食物中毒事件等。其中,危害最大、控制處理最為困難的就是重大傳染類疾病。從早期的天花病毒、黑死病、霍亂、鼠疫、結(jié)核病到近期2003年的SARS(嚴重急性呼吸綜合征)疫情,2009年暴發(fā)的H1N1禽流感,2014年西非爆發(fā)的埃博拉疫情,以及2020年全球爆發(fā)的新型冠狀病毒疫情等,這類事件具有傳播速度快、感染性強、危害性大、控制處理困難等特征,處置不當極易由小范圍的個體感染事件發(fā)展為社會性的群體感染事件甚至演變?yōu)槿蛐缘闹卮蠊残l(wèi)生事件,這對傳統(tǒng)的疾病防控和社會治理帶來了極大的挑戰(zhàn)。
傳統(tǒng)小數(shù)據(jù)時代,對于突發(fā)公共衛(wèi)生事件的處理決策,一般采用“抽樣數(shù)據(jù)+經(jīng)驗判斷”的模式,決策者易受樣本數(shù)據(jù)、經(jīng)歷背景等多方面因素影響,分析結(jié)構(gòu)可信賴度差,時效性低,易延誤事件準確及時處理。以數(shù)據(jù)挖掘、人工智能、深度機器學習等新興技術(shù)為主的大數(shù)據(jù)技術(shù),能夠有效解決重大公共衛(wèi)生事件處理中信息匱乏與快速決策的矛盾困境,在輔助決策、追蹤密切接觸者、優(yōu)化重點資源配置和維護網(wǎng)絡思想意識安全等方面發(fā)揮重要作用。
大數(shù)據(jù)技術(shù)作為新興的數(shù)據(jù)處理技術(shù),能夠充分利用網(wǎng)絡資源,實時并行處理不斷累積的大數(shù)據(jù)集時,在面對數(shù)據(jù)類型多樣、數(shù)據(jù)總量龐大的復雜數(shù)據(jù)集,相對于傳統(tǒng)的本地處理系統(tǒng)與單點數(shù)據(jù)處理技術(shù)有顯著的優(yōu)勢。小數(shù)據(jù)時代,傳統(tǒng)數(shù)據(jù)處理模式能夠處理的數(shù)據(jù)規(guī)模與數(shù)據(jù)類型都十分有限,同時受限于處理能力與數(shù)據(jù)樣本規(guī)模,數(shù)據(jù)分析的時效性與準確性都難以得到保障。隨著具備更強大處理能力的超級計算機與云計算平臺架構(gòu)技術(shù)興起之后,能夠快速收集重大公共衛(wèi)生安全事件中產(chǎn)生的眾多零散數(shù)據(jù),為及時、準確、高效地處理大數(shù)據(jù)集提供技術(shù)保障。面對復雜大數(shù)據(jù)集高效性、準確性的要求,大數(shù)據(jù)技術(shù)具有傳統(tǒng)數(shù)據(jù)處理技術(shù)不可替代的優(yōu)勢,其高度匹配性主要體現(xiàn)在以下三個方面。
大數(shù)據(jù)時代,所有的信息都需要并能夠被數(shù)據(jù)化處理。在重大公共衛(wèi)生事件處理中,我們能夠利用的大數(shù)據(jù)集主要分為兩類:一類是集成型數(shù)據(jù),主要包括公眾社交數(shù)據(jù)、醫(yī)療衛(wèi)生數(shù)據(jù)、搜索引擎數(shù)據(jù)等;另一類是分析型數(shù)據(jù),主要包括特殊的大數(shù)據(jù)系統(tǒng)或平臺,通過數(shù)據(jù)挖掘、模擬仿真等技術(shù),得出的空間地理軌跡信息、輿情熱點等分析數(shù)據(jù)。這兩類數(shù)據(jù)是我們要重點關注的類型。從數(shù)據(jù)類型上分,這些數(shù)據(jù)又可以分為結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。從各個醫(yī)療機構(gòu)系統(tǒng)數(shù)據(jù)庫中抓取的數(shù)據(jù),具有固定的屬性結(jié)構(gòu),屬于結(jié)構(gòu)化數(shù)據(jù)。在網(wǎng)絡上隨機抓取的圖片、音頻、視頻等信息,不能用統(tǒng)一的數(shù)據(jù)模型定義,則屬于非結(jié)構(gòu)化數(shù)據(jù)。除此之外,還有一些應用系統(tǒng)產(chǎn)生的日志文件、email等,則屬于半結(jié)構(gòu)化數(shù)據(jù)。
通過分析,可以發(fā)現(xiàn),在這個突發(fā)事件處理過程中,我們面對的數(shù)據(jù)類型復雜多樣,同時隨著時間的不斷累積,數(shù)據(jù)規(guī)模也在不斷擴大。傳統(tǒng)的數(shù)據(jù)處理技術(shù)只能在本地進行類型固定的數(shù)據(jù)處理,而且隨著數(shù)據(jù)集的擴充,處理速度會越來越慢甚至無法處理。大數(shù)據(jù)技術(shù)中的并行處理技術(shù),能夠充分調(diào)動互聯(lián)網(wǎng)中閑置的異地異構(gòu)數(shù)據(jù)處理平臺,并發(fā)處理不同結(jié)構(gòu)類型、體量不斷積聚的大數(shù)據(jù)集合。
移動互聯(lián)網(wǎng)、人工智能等新興技術(shù)的不斷發(fā)展,物流、交通等基礎設施也實現(xiàn)了跨越式的發(fā)展。公眾的出行、交流與生活更加便利,信息傳播更加快捷。在這樣的背景下,一旦有重大突發(fā)公共衛(wèi)生事件(尤其是傳染類公共衛(wèi)生事件)發(fā)生,對公眾身體健康、社會穩(wěn)定和經(jīng)濟發(fā)展都會帶來極大影響。傳統(tǒng)數(shù)據(jù)處理技術(shù),只能對收集到的歷史數(shù)據(jù)做單一結(jié)構(gòu)的處理,對于信息量較大的數(shù)據(jù)集,也需要進行數(shù)據(jù)拆分或者數(shù)據(jù)抽樣處理,耗費時間長,遠遠達不到這類事件快速反應的要求。同時,隨著時間的推移,數(shù)據(jù)庫系統(tǒng)累積的數(shù)據(jù)會越來越大,而對于數(shù)據(jù)處理速度的需求卻在不斷提高,這對傳統(tǒng)的單點處理技術(shù)提出了巨大挑戰(zhàn),需要一種新的處理模式加以改進。面對不斷“長胖”、分布零散、結(jié)構(gòu)各異的數(shù)據(jù)集,大數(shù)據(jù)中的云平臺架構(gòu),能夠調(diào)度網(wǎng)絡上的閑置計算資源,改變傳統(tǒng)處理技術(shù)的流水線作業(yè)模式,同時調(diào)度使用多個網(wǎng)絡系統(tǒng)并發(fā)處理不斷累積的大數(shù)據(jù)集,規(guī)避抽樣方法的缺陷和樣本的偏差,既節(jié)約硬件資源,又能顯著提高分析效率。這很好的契合了重大公共衛(wèi)生事件處理過程中快速反應的要求。
在應對重大公共衛(wèi)生事件的過程中,我們不僅僅要求反應快速高效,同時結(jié)果的客觀準確也是不可或缺的要素。在大數(shù)據(jù)時代,數(shù)據(jù)分析結(jié)果是政府決策的重要參考。數(shù)據(jù)分析結(jié)果的準確性直接與政府決策的科學性、有效性密切相關。一旦數(shù)據(jù)分析結(jié)果出現(xiàn)偏差,政府決策的效果差異就會放大,事件處理的效果就會產(chǎn)生較大偏差,甚至產(chǎn)生負面影響,造成不可挽回的影響或損失。
傳統(tǒng)數(shù)據(jù)分析方法受限于處理能力、分析樣本、噪音數(shù)據(jù)等因素,分析結(jié)果的準確性與實時性都有一定偏差。大數(shù)據(jù)技術(shù)處理的樣本包含不同系統(tǒng)平臺匯集的歷史數(shù)據(jù)、以及正在產(chǎn)生的現(xiàn)實同步數(shù)據(jù),數(shù)據(jù)樣本龐大、覆蓋面廣、時效性強,分析的數(shù)據(jù)是完整的、全面的、實時的,能夠有效規(guī)避傳統(tǒng)數(shù)據(jù)處理技術(shù)中備選數(shù)據(jù)集較小,抽樣方法缺陷等因素導致的分析結(jié)果偏差甚至錯誤的情形。除此之外,大數(shù)據(jù)本身的客觀真實性也為最終結(jié)果提供了有力支撐。集合中每個數(shù)據(jù)元都是現(xiàn)實事件的客觀反映。公眾軌跡數(shù)據(jù)是個體空間行為移動的客觀反映,具有真實性和可追溯性。搜索引擎統(tǒng)計數(shù)據(jù)是對當前一段時間網(wǎng)民網(wǎng)絡輿情熱點、網(wǎng)絡內(nèi)心訴求的真實反映。這些對公共衛(wèi)生事件的決策處理、網(wǎng)絡輿情引導以及公眾心理干預具有重要參考價值。
綜上,大數(shù)據(jù)技術(shù)中這些特點能夠很好地契合重大公共衛(wèi)生事件中數(shù)據(jù)信息處理中面對的一系列“棘手”芒刺,以數(shù)據(jù)挖掘、人工智能等技術(shù)為基礎的數(shù)據(jù)處理模式能夠應對事件中面對的技術(shù)挑戰(zhàn)。
認識世界,預測未來一直是人們苦苦追求的目標??萍剂α康募尤胧沟梦覀儗ξ磥硎录恼J知有了長足進步。例如:天氣預報,目前我們已經(jīng)能夠做到單位區(qū)域內(nèi)、具體時間的準確預測。當然也存在如地震這類自然災害事件到目前為止依然很難提前預報的情形。對于突發(fā)的重大公共衛(wèi)生事件而言,我們需要根據(jù)已經(jīng)發(fā)現(xiàn)的某個區(qū)域、部分群體的數(shù)據(jù)信息,結(jié)合歷史事件的發(fā)展規(guī)律,來判斷整個事件的發(fā)展趨勢,包括影響力、破壞力、傳染性等等。能否準確根據(jù)收集的信息對事件未來的發(fā)展態(tài)勢做客觀準確的分析判斷,是防止這類突發(fā)事件進一步惡化的關鍵。數(shù)據(jù)挖掘與機器學習的深度結(jié)合,有效解決了傳統(tǒng)事件預測中的難題。
現(xiàn)實社交網(wǎng)絡中,個人是網(wǎng)絡的中心。所有的數(shù)據(jù)都是圍繞個人展開,包括跨區(qū)域流動、行為軌跡等都是有跡可循的。這是大數(shù)據(jù)技術(shù)能夠在重大公共衛(wèi)生事件中得以應用的最大前提。利用“大數(shù)據(jù)+計算機仿真”的模式,能夠?qū)@類事件進行提前模擬預測。2009年,H1N1甲型流感暴發(fā)初期,美國的Google公司利用其獨特的技術(shù)和資源就對疫情的暴發(fā)作了提前預測。2019年底,加拿大的BlueDot公司利用收集到的健康數(shù)據(jù)在新冠疫情暴發(fā)初期對其客戶推送了疫情的預警信息。2020年,我國鐘南山院士團隊根據(jù)掌握的全國疫情大數(shù)據(jù)對我國的疫情形勢做出了準確的評估與預測,為后來的疫情防控提供了巨大幫助。
傳染類突發(fā)公共衛(wèi)生事件處理中,人流是最大的變量。解決好這個變量,是處理這類事件的關鍵。身處事件中的每個人都多了一個感染狀態(tài)屬性。根據(jù)這個屬性可以將所有的公眾分為四類:感染者、疑似感染者、密切接觸者和正常者。前三類是重點關注群體,對他們的處理與控制是所有傳染性突發(fā)公共衛(wèi)生事件處理的重點。傳統(tǒng)的疫情防控,只能根據(jù)本地醫(yī)療、防疫機構(gòu)上報的樣本數(shù)據(jù),進行流行病學分析,然后采用回溯的方式,去尋找可能潛在的患者,難以全面、準確、快速地找出空間移動軌跡中所有的密切接觸者,極易延誤疫情的處理控制。
傳統(tǒng)人工詢問排查方式,受被排查對象的瞞報或謊報、病毒本身的潛伏特性等外部因素影響較大,人力資源耗費巨大,進度緩慢,效果不佳,難以達到徹底排查的目的。借助大數(shù)據(jù)分析技術(shù),結(jié)合個人身份信息庫、交通大數(shù)據(jù)、醫(yī)療大數(shù)據(jù)、通信大數(shù)據(jù)等等,通過信息比對,能夠準確“繪制”出對象的出行軌跡,在已知的感染者周圍能夠“織成”一張清晰的公眾關系網(wǎng)絡,準確找出所有密切接觸者,并逐級找到二級、三級接觸者,分析他們與感染者的鏈接強弱度,及時有針對性采取醫(yī)療防護、區(qū)域隔離等防護措施,防止發(fā)生區(qū)域性的暴發(fā)性傳染事件?;谶@樣的思路,2020年中國電科開發(fā)了一款大數(shù)據(jù)程序,通過這款應用政府和相關部門能夠?qū)崟r掌握各個地方的疫情情況,同時對于每個群眾而言,通過這個程序,能夠清晰地看到,自己身邊的疫情情況,及時調(diào)整外出計劃,發(fā)揮群眾的主觀能動性,切實提高防疫措施的精準度與針對性,極大地節(jié)省了人力、物力資源。在新冠疫情暴發(fā)初期,浙江省利用空間流動大數(shù)據(jù),通過深度挖掘,提前評估了病毒蔓延的危害性,率先啟動一級應急響應,果斷采取了限制人口聚集、控制人口流動、加強流動人口登記、及時隔離確診與疑似病人等措施,有效地控制了疫情在當?shù)氐穆印?/p>
在重大公共衛(wèi)生事件處理中,涉及的重點物資主要包含醫(yī)療物資和生活物資。重點物資調(diào)度包括現(xiàn)有儲備統(tǒng)計反饋、市場需求預測、目前生產(chǎn)預期與規(guī)劃以及物資分配方案等涉及多個方面的問題。醫(yī)療物資是醫(yī)療衛(wèi)生機構(gòu)以及防疫部門正常有序開展工作的重要保障。生活物資是保障公眾基本生活、維護社會穩(wěn)定的重要保證。對于生活物資而言,根據(jù)大數(shù)據(jù)系統(tǒng)收集到的每個區(qū)域的公眾管控情形、交通管制狀況,綜合考慮各個區(qū)域內(nèi)市場需求與供應的情況,從全局調(diào)整應急生活物資的分配,從而確保群眾基本生活平穩(wěn)有序,尤其是處于隔離、管制狀況的群眾,基本的生活保障是安撫群眾情緒的基本保障;對于醫(yī)療物資而言,尤其是基本防護設備、一線醫(yī)療防護設備等關鍵物資,需要根據(jù)各地的疫情發(fā)展狀況進行分析,根據(jù)各個區(qū)域的不同預警級別,從全局來保障應急醫(yī)療物資的供應與調(diào)度。
通過分析人群跨區(qū)域流動和人群聚集重點區(qū)域,提前預警高暴發(fā)高風險地區(qū),及時向該區(qū)域調(diào)配醫(yī)療和生活物資,做到防控收益的最大化,避免出現(xiàn)社會恐慌、哄搶物資等現(xiàn)象,保障經(jīng)濟社會穩(wěn)定運行。利用大數(shù)據(jù)排查出疫情暴發(fā)的高風險地區(qū),能夠使防疫部門可以提前有針對性地布置防疫工作,加強重點區(qū)域的布控,提升防疫資源的使用效率。
外部環(huán)境的突然變化會引發(fā)公眾強烈的心理波動,可能導致極端的思想情緒和現(xiàn)實行為。移動互聯(lián)網(wǎng)、智能終端的普及使得公眾的關注焦點由傳統(tǒng)媒體轉(zhuǎn)移到微信、微博等社交平臺。多種網(wǎng)絡信息的夾雜容易與現(xiàn)實行動互相交織,網(wǎng)絡信息在傳播的過程中容易發(fā)生偏差、甚至產(chǎn)生逆轉(zhuǎn),在專業(yè)知識、風險認知以及情緒感染等多方面的影響下,容易產(chǎn)生放大效應。移動社交網(wǎng)絡的普及會放大這種個體不安情緒的傳播并加速向整個社會群體蔓延。若引導不當,極易導致社會恐慌,被不法分子利用,破壞社會穩(wěn)定。典型的事件有2003年SARS發(fā)生后,北京發(fā)生學生集體返家、民工返鄉(xiāng)事件。2011年由日本核泄漏事件引發(fā)的國內(nèi)部分地區(qū)搶鹽事件。
在重大突發(fā)公共衛(wèi)生事件處理中,網(wǎng)絡輿情大數(shù)據(jù)和搜索引擎大數(shù)據(jù)是我們重點關注的焦點。網(wǎng)絡輿情大數(shù)據(jù)主要來自于微博、微信等社交平臺,主要包含公眾主動發(fā)聲或者參與的網(wǎng)絡熱點事件信息,是公眾個人意見的客觀表達,是網(wǎng)民內(nèi)心活動與內(nèi)心訴求的真實寫照。通過大數(shù)據(jù)技術(shù)對網(wǎng)絡輿情信息進行抓取,可以實時跟蹤網(wǎng)絡輿情熱點問題,及時研判問題的網(wǎng)絡態(tài)勢和發(fā)展趨勢,能夠及時針對輿情熱點難點問題進行回應,從而正確引導或應對網(wǎng)絡輿情事件,對輔助把握民意,保證國家思想意識安全提供科技支撐。搜索引擎大數(shù)據(jù),主要來自于公眾利用搜索引擎在互聯(lián)網(wǎng)上獲取的數(shù)據(jù)信息,是公共內(nèi)心迫切想獲得某種數(shù)據(jù)信息的集合。通過對關鍵字、關鍵詞等搜索頻度的統(tǒng)計分析,深度挖掘公眾心理特征,捕捉公眾心理健康服務需求,有針對性地推送心理輔導資源,從而及時化解網(wǎng)絡危機,及時做好心理干預。
當然,在重大公共衛(wèi)生事件處理的過程中,大數(shù)據(jù)技術(shù)的應用還不僅僅于此,在事件中后期的病源尋找、疫苗研發(fā)、企業(yè)復工復產(chǎn)等諸多方面都發(fā)揮了重要作用。
目前,我們能夠看到大數(shù)據(jù)技術(shù)在重大公共衛(wèi)生事件中發(fā)揮了重要作用,并將它的影響拓展到更豐富的領域。然而,我們也要清醒地認識到,要充分發(fā)揮大數(shù)據(jù)技術(shù)的作用,我們在數(shù)據(jù)格式規(guī)范、數(shù)據(jù)開放共享、數(shù)據(jù)信息安全等方面仍存在不同程度的缺陷,亟須解決。
數(shù)據(jù)格式的統(tǒng)一規(guī)范是大數(shù)據(jù)技術(shù)能夠廣泛應用并向縱深發(fā)展的基本前提。目前,出于安全因素考慮,數(shù)據(jù)信息流動一般僅限于部門內(nèi)部或者行業(yè)系統(tǒng)內(nèi)部,部門之間或者不同系統(tǒng)之間只存在少量的數(shù)據(jù)交流。對于普通屬性或字段,缺乏全社會統(tǒng)一規(guī)范與標準,即使是最基本的屬性,部門數(shù)據(jù)庫都是依照部門或系統(tǒng)內(nèi)部制定的標準,所采集的數(shù)據(jù)在大小、格式上都可能存在巨大的差異。比如,生日屬性:就存在純數(shù)字、數(shù)字字符夾雜以及定義多少位字符的差異。數(shù)據(jù)格式的差異直接導致部門之間數(shù)據(jù)不能共享,不同部門、系統(tǒng)之間的信息交流絕大部分情形執(zhí)行的是查詢操作。如果要對本部門以外的平臺數(shù)據(jù)進行修改或者導入到本部門數(shù)據(jù)系統(tǒng)使用,需要耗費額外的人力物力財力去執(zhí)行噪音數(shù)據(jù)清洗、數(shù)據(jù)格式調(diào)整、冗余字段刪除等操作,會極大影響大數(shù)據(jù)的使用效率。同時,數(shù)據(jù)格式的不規(guī)范也造成了一定程度的資源浪費。因此在通用屬性與常用字段的標準上,各級政府要推動制定全社會統(tǒng)一的數(shù)據(jù)規(guī)范。
重大突發(fā)性公共衛(wèi)生事件,最重要的是對未來發(fā)展趨勢的預測與事件過程中的處理。整個事件的處理對預防和控制鏈的體系要求特別高,它體現(xiàn)的不只是某個環(huán)節(jié)的突出表現(xiàn),更需要的是整個體系的協(xié)同處理能力?!靶畔⒐聧u”的漏洞,導致區(qū)域之間信息的不對稱,數(shù)據(jù)的跨區(qū)域流動會有一定的滯后現(xiàn)象,最直接的影響便是各地協(xié)同防控難度加大。保障數(shù)據(jù)平臺之間的數(shù)據(jù)有序開放與共享,是大數(shù)據(jù)技術(shù)得以充分發(fā)揮的重要因素。任何大數(shù)據(jù)系統(tǒng)都是由“小數(shù)據(jù)”匯合而成。各數(shù)據(jù)平臺通過接口實現(xiàn)數(shù)據(jù)開放,完成數(shù)據(jù)共享,是大數(shù)據(jù)系統(tǒng)形成的基礎。然而,從歷次重大公共衛(wèi)生事件處理過程可以發(fā)現(xiàn),醫(yī)療系統(tǒng)之間、各地政府之間、交通部門之間等“信息孤島”問題依然突出,數(shù)據(jù)共享共通不夠,區(qū)域之間、部門之間依然存在書面?zhèn)鬟f疫情信息的情況。信息孤島極易帶來數(shù)據(jù)的重復采集和醫(yī)療資源的浪費,由此引發(fā)的數(shù)據(jù)不全、表達差異、指揮不當、決策偏差等問題時有出現(xiàn),大大延誤了事件的高效處理。因此,要充分發(fā)揮企業(yè)的技術(shù)優(yōu)勢,為公眾提供優(yōu)質(zhì)信息資源及技術(shù)服務。相關部門要制定措施積極推進健康大數(shù)據(jù)的共建共享,建立以政府為主導的大數(shù)據(jù)開放共享體系,促進政府數(shù)據(jù)與社會數(shù)據(jù)互聯(lián)互通,降低公眾獲取數(shù)據(jù)的門檻或成本,擴大數(shù)據(jù)規(guī)模,豐富數(shù)據(jù)種類,實現(xiàn)大數(shù)據(jù)的系統(tǒng)性開發(fā)與利用,充分利用大數(shù)據(jù)為我們的生產(chǎn)生活服務。
數(shù)據(jù)信息的安全是大數(shù)據(jù)技術(shù)應用的重要保障。在重大突發(fā)公共衛(wèi)生事件處理中,我們依托的大數(shù)據(jù)與個人信息息息相關。這些數(shù)據(jù)具有客觀真實性,是個人工作、生活、學習的客觀反映,與個人的隱私息息相關。在大數(shù)據(jù)的收集、清洗、存儲、分析和應用等階段,都存在數(shù)據(jù)信息泄露風險,甚至還有不法分子通過非法交易數(shù)據(jù)信息牟取暴利,嚴重侵害了公眾的個人隱私。數(shù)據(jù)信息的保護不僅涉及個人,還涉及醫(yī)院、疾控中心等部門以及第三方大數(shù)據(jù)企業(yè)平臺,每個成員的力量都不可或缺,這就增加了個人信息保護的難度。相關大數(shù)據(jù)一旦發(fā)生泄露,不僅會導致個人正常生活困擾、財產(chǎn)損失,還可能導致國家安全問題。因此,要采取相應措施保護好個人隱私數(shù)據(jù)的安全。完善相關法律,明確數(shù)據(jù)保護的權(quán)屬問題,包括個人基本信息、醫(yī)院科研院所的研究成果等,避免監(jiān)管和保護出現(xiàn)真空地帶;加強醫(yī)院、疾控等相關部門內(nèi)部的數(shù)據(jù)使用權(quán)限管理,避免內(nèi)部的數(shù)據(jù)信息泄露發(fā)生;加強第三方大數(shù)據(jù)管理與應用機構(gòu)的資質(zhì)審查和監(jiān)督管理,實現(xiàn)從數(shù)據(jù)的收集、存儲、分析和使用都處于監(jiān)管狀態(tài),同時充分發(fā)揮企業(yè)與高??蒲性核膶I(yè)技術(shù)優(yōu)勢,拓展企業(yè)參與渠道,實現(xiàn)多主體共同開發(fā)共同管理的良好局面。
重大公共衛(wèi)生事件的處理既是對國家治理能力的考驗,也是國家現(xiàn)代應急管理體系和現(xiàn)代化技術(shù)的實力體現(xiàn)。大數(shù)據(jù)帶來的新思路、新技術(shù),是“定性+定量”分析的現(xiàn)實應用,必將推動公共衛(wèi)生安全甚至其它突發(fā)事件的處理模式的變革與發(fā)展。
相關鏈接
大數(shù)據(jù)(big data),IT行業(yè)術(shù)語,是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數(shù)據(jù)時代》中大數(shù)據(jù)指不用隨機分析法(抽樣調(diào)查)這樣捷徑,而采用所有數(shù)據(jù)進行分析處理。大數(shù)據(jù)的5V特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。
對于“大數(shù)據(jù)”(Big data)研究機構(gòu)Gartner給出了這樣的定義?!按髷?shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應海量、高增長率和多樣化的信息資產(chǎn)。
麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低四大特征。
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理。換而言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實現(xiàn)盈利的關鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。從技術(shù)上看,大數(shù)據(jù)與云計算的關系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無法用單臺的計算機進行處理,必須采用分布式架構(gòu)。它的特色在于對海量數(shù)據(jù)進行分布式數(shù)據(jù)挖掘。但它必須依托云計算的分布式處理、分布式數(shù)據(jù)庫和云存儲、虛擬化技術(shù)。隨著云時代的來臨,大數(shù)據(jù)(Big data)也吸引了越來越多的關注。分析師團隊認為,大數(shù)據(jù)(Big data)通常用來形容一個公司創(chuàng)造的大量非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關系型數(shù)據(jù)庫用于分析時會花費過多時間和金錢。大數(shù)據(jù)分析常和云計算聯(lián)系到一起,因為實時的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。
大數(shù)據(jù)需要特殊的技術(shù),以有效地處理大量的容忍經(jīng)過時間內(nèi)的數(shù)據(jù)。適用于大數(shù)據(jù)的技術(shù),包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫、數(shù)據(jù)挖掘、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫、云計算平臺、互聯(lián)網(wǎng)和可擴展的存儲系統(tǒng)。