摘 ?要:隨著新型冠狀病毒肺炎的爆發(fā),如何建設(shè)新冠肺炎疫情醫(yī)療體系已然成為當(dāng)前炙手可熱的研究熱點(diǎn)。同時(shí)隨著大數(shù)據(jù)技術(shù)的不斷演變及進(jìn)步,亟需對(duì)當(dāng)前疫情醫(yī)療體系進(jìn)行建設(shè)及規(guī)范,改善和解決傳統(tǒng)醫(yī)療體系的缺陷。文章圍繞全球疫情數(shù)據(jù),利用大數(shù)據(jù)工具建立數(shù)據(jù)模型及參數(shù)指標(biāo)并進(jìn)行系統(tǒng)性分析,并探究如何建設(shè)新冠肺炎疫情醫(yī)療體系。
關(guān)鍵詞:大數(shù)據(jù);新冠肺炎疫情;數(shù)據(jù)分析;醫(yī)療體系建設(shè)
中圖分類號(hào):R197.3;TP392 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2020)12-0119-03
Abstract:With the outbreak of COVID-19,how to build the COVID-19 epidemic medical system has become a hot research hotspot. At the same time,combined with the continuous evolution and progress of big data technology,it is urgent to build and standardize the current epidemic medical system,so as to break the criticism and defects of the traditional medical system. Based on the global epidemic data,the author used big data tools to establish data model and parameter index and carry out systematic analysis,and explored how to build the COVID-19 epidemic medical system.
Keywords:big data;COVID-19;data analysis;construction of medical system
0 ?引 ?言
新冠肺炎疫情以突如其來的姿態(tài)席卷全球,其影響范圍之廣、傳染能力之強(qiáng),嚴(yán)重影響了全球數(shù)百個(gè)國(guó)家與地區(qū),時(shí)至今日仍有多個(gè)國(guó)家無法有效控制其蔓延趨勢(shì)[1]。
21世紀(jì)是大數(shù)據(jù)的時(shí)代,在擁抱大數(shù)據(jù)時(shí)代的同時(shí)應(yīng)將其充分應(yīng)用至現(xiàn)實(shí)中,以解決實(shí)際需求,在集全球之力對(duì)抗新冠肺炎疫情的同時(shí),可以利用大數(shù)據(jù)等技術(shù)從新冠肺炎疫情下的數(shù)據(jù)中挖掘出有用信息,并加快推進(jìn)對(duì)新冠肺炎疫情醫(yī)療體系的建設(shè)。
1 ?疫情數(shù)據(jù)分析
1.1 ?疫情數(shù)據(jù)爬取
筆者借助基于Scrapy的爬蟲框架,對(duì)全球新冠疫情數(shù)據(jù)進(jìn)行分析與探究,時(shí)間跨度為2020年1月22日—2020年5月22日,通過爬取美國(guó)霍普金斯大學(xué)在GitHub上共享的開源數(shù)據(jù),并以JSON文件格式進(jìn)行存儲(chǔ)導(dǎo)出及后續(xù)處理。
爬取過程重要代碼如下,得到的初始數(shù)據(jù)文件中包含日期、國(guó)家/地區(qū)、確診人數(shù)、死亡人數(shù)、治愈人數(shù)五個(gè)字段,并將其通過CSV文件導(dǎo)出:
for contry in datas['area']:
for province in contry['children']:
for city in province['children']:
with open(ExcelName, 'a', encoding='utf-8', newline='') as csvfile:
writer = csv.writer(csvfile)
writer.writerow([Datas ['name'], Province ['name'], str(Province ['total']['confirmed']), Province (city['total']['dead']), Province (city['total']['recovered']))
1.2 ?疫情數(shù)據(jù)清洗
根據(jù)基于Scrapy的爬蟲所獲取的CSV數(shù)據(jù)文件,對(duì)其數(shù)據(jù)特征進(jìn)行數(shù)據(jù)清洗。原數(shù)據(jù)中部分行和列根據(jù)地名排序且難以創(chuàng)造實(shí)際價(jià)值,因此利用DataFrame的數(shù)據(jù)格式篩選出有價(jià)值的行。
清洗過程重要代碼如下,通過刪除確診人數(shù)、死亡人數(shù)和治愈人數(shù)都為0的行并將其根據(jù)時(shí)間排序,同時(shí)刪除CSV文件的首行,以便后續(xù)更好地模擬真實(shí)數(shù)據(jù)傳輸:
val Sorted = spark.sql("select Datas,Province" +" confirmed,dead,recovered from view where confirmed!=0 or dead!=0 or confirmed!=0 " +"or confirmed!=null or recovered!=null or dead!=null order by Dates desc")
Sorted.coalesce(1)
.write.mode(SaveMode.Overwrite)
.option("header","False")
.option("sep",",")
.csv("csv")
1.3 ?變量設(shè)置及數(shù)據(jù)分析
Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),它可以處理消費(fèi)者在網(wǎng)站中的所有動(dòng)作流數(shù)據(jù)。對(duì)清洗過后的文件,采用Kafka作為實(shí)時(shí)處理工具,對(duì)確診人數(shù)、死亡人數(shù)、治愈人數(shù)等當(dāng)日數(shù)據(jù)與前一天定值比對(duì)得出確診率、死亡率、恢復(fù)率三大指標(biāo)進(jìn)行系統(tǒng)分析。同時(shí)選用Flask_SocketIO作為客戶端,通過MySQL數(shù)據(jù)庫逐行讀取數(shù)據(jù),同時(shí)Socket監(jiān)聽響應(yīng)函數(shù),對(duì)數(shù)據(jù)庫傳入的數(shù)據(jù)實(shí)時(shí)展現(xiàn)實(shí)現(xiàn)WebSocket。與此同時(shí)連接數(shù)據(jù)庫,將CSV文件存入MySQL數(shù)據(jù)庫中。
如圖1所示,id為自增主鍵,dates為日期(datatime數(shù)據(jù)),curerate為恢復(fù)率,state為狀態(tài)(僅設(shè)置0和1,當(dāng)數(shù)據(jù)被讀取后標(biāo)記為1)。
通過逐行讀取MySQL數(shù)據(jù)庫的內(nèi)容,同時(shí)更新數(shù)據(jù)庫state為1,Socket監(jiān)聽響應(yīng)函數(shù)并使用HTML網(wǎng)頁進(jìn)行展示,以下僅選取2020年1月22日—2020年5月22日全球疫情數(shù)據(jù)進(jìn)行分析,如圖2所示(圖2僅截取部分?jǐn)?shù)據(jù)),id為自增主鍵,country為國(guó)家/地區(qū),dates為日期(datatime數(shù)據(jù)),curerate為恢復(fù)率,Increase_rate為增長(zhǎng)率,Mortality為死亡率,state為狀態(tài)(僅設(shè)置0和1,當(dāng)數(shù)據(jù)被讀取后標(biāo)記為1)。
通過分析圖2中2020年1月23日數(shù)據(jù)中的確診率、死亡率、恢復(fù)率,可以看出全球疫情體系存在一些問題:
一是三大指標(biāo)中全球各個(gè)國(guó)家之間的確診率、死亡率、恢復(fù)率差異化較大,由于各個(gè)國(guó)家的重視程度與疫情治理能力不同,對(duì)抗疫情也伴隨著相當(dāng)大的困難,從而增加了世界疫情格局的不確定性。
二是尚未建立疫情醫(yī)療體系標(biāo)準(zhǔn),各個(gè)國(guó)家各自為政,盡管世衛(wèi)組織在全球抗擊疫情中發(fā)揮重要作用,但由于其職能所限,只能針對(duì)傳染病預(yù)防,對(duì)各國(guó)如何應(yīng)對(duì)疫情只能進(jìn)行呼吁和建議,不具備關(guān)鍵決策權(quán),這使得全球抗疫效率取決于各國(guó)的自愿配合程度。[2]因此迫切需要國(guó)際社會(huì)建立相關(guān)疫情醫(yī)療體系標(biāo)準(zhǔn)。
三是缺乏人類命運(yùn)共同體意識(shí),在全球化的今天,人類命運(yùn)共同體愈發(fā)成為世界人民立足之根本,只有各國(guó)一起合作,才能實(shí)現(xiàn)全球疫情醫(yī)療體系的穩(wěn)定有序發(fā)展,如果僅僅由少數(shù)國(guó)家對(duì)抗疫情,而大多數(shù)國(guó)家采取不作為的態(tài)度,這場(chǎng)疫情也難以得到繼續(xù)控制和防護(hù)。
2 ?疫情醫(yī)療體系建設(shè)的相關(guān)措施
2.1 ?加快不同省市區(qū)域內(nèi)疫情醫(yī)療體系建設(shè)
針對(duì)不同省市區(qū)域內(nèi)的疫情醫(yī)療體系,迫切需要建立相關(guān)制度與體系,對(duì)疫情區(qū)域強(qiáng)、中、弱地區(qū)進(jìn)行劃分及分類,對(duì)出現(xiàn)嚴(yán)重疫情的地區(qū)進(jìn)行及時(shí)管控并采取集中人員隔離的措施,對(duì)醫(yī)療體系的建設(shè)需嚴(yán)格遵循相關(guān)條例和法規(guī)制度,以此杜絕疫情下醫(yī)療資源的不對(duì)等及區(qū)域防范意識(shí)偏差。
2.2 ?集中醫(yī)療體系力量進(jìn)行綜合治理
對(duì)醫(yī)療體系的建設(shè)及規(guī)范,則重點(diǎn)在于集中醫(yī)療體系力量,最大的問題在于醫(yī)療體系往往只掌握在省會(huì)城市及部分發(fā)達(dá)地區(qū),當(dāng)疫情蔓延至偏遠(yuǎn)地區(qū),加上偏遠(yuǎn)地區(qū)的醫(yī)療治理能力及處理方式相對(duì)而言不夠成熟,往往會(huì)促使疫情擴(kuò)散及暴露醫(yī)療體系的種種問題。因此需集中醫(yī)療體系及醫(yī)療資源對(duì)偏遠(yuǎn)地區(qū)的防控提供支持,同時(shí)防止外來人口進(jìn)入偏遠(yuǎn)地區(qū)造成不必要的醫(yī)療資源流失,解決偏遠(yuǎn)地區(qū)醫(yī)療資源分配不均、醫(yī)療資源匱乏、重復(fù)使用等問題。
2.3 ?構(gòu)建大數(shù)據(jù)疫情醫(yī)療體系
現(xiàn)如今,我國(guó)的大數(shù)據(jù)醫(yī)療體系發(fā)展還處于初級(jí)階段,還在進(jìn)行醫(yī)療體制改革,并未對(duì)大數(shù)據(jù)時(shí)代下醫(yī)療體系,尤其是疫情醫(yī)療大數(shù)據(jù)進(jìn)行建設(shè)。從長(zhǎng)遠(yuǎn)來看,疫情大數(shù)據(jù)建設(shè)的實(shí)施,對(duì)推動(dòng)醫(yī)療人類命運(yùn)共同體,改善城鄉(xiāng)居民疫情醫(yī)療體系的差異化有著重大意義。
因此,筆者提出可以建設(shè)基于大數(shù)據(jù)下的大數(shù)據(jù)疫情醫(yī)療體系,采集醫(yī)院、臨床中心、防疫站、實(shí)驗(yàn)室的疫情大數(shù)據(jù)數(shù)據(jù),通過構(gòu)建疫情大數(shù)據(jù)平臺(tái)進(jìn)行數(shù)據(jù)清洗與分析,對(duì)數(shù)據(jù)進(jìn)行區(qū)域疫情評(píng)級(jí)、疫情數(shù)據(jù)共享、疫情資源調(diào)配等智慧應(yīng)用,如圖3所示。
醫(yī)療數(shù)據(jù)大多數(shù)掌握在大部分醫(yī)院手中,數(shù)據(jù)的封閉性阻礙了大數(shù)據(jù)疫情醫(yī)療體系的發(fā)展,逐步開放醫(yī)療大數(shù)據(jù)并及時(shí)整合醫(yī)療信息資源是未來大數(shù)據(jù)疫情醫(yī)療體系發(fā)展的大勢(shì)。疫情醫(yī)療取之于社會(huì)而用之于社會(huì),政府應(yīng)該積極推動(dòng)大數(shù)據(jù)疫情醫(yī)療體系的政策制定及制度化、科技化創(chuàng)新,更多地以政策推動(dòng)大數(shù)據(jù)疫情醫(yī)療體系的創(chuàng)新和發(fā)展。
3 ?結(jié) ?論
在大數(shù)據(jù)時(shí)代下,如何把握新冠肺炎疫情的數(shù)據(jù)特性,從錯(cuò)綜復(fù)雜的數(shù)據(jù)中提煉出規(guī)律,是我們迫切需要解決的問題。文章通過系統(tǒng)分析新冠肺炎疫情下數(shù)據(jù)分析的方法及思路,并針對(duì)疫情醫(yī)療數(shù)據(jù)提出了問題及相關(guān)應(yīng)對(duì)措施,對(duì)后疫情時(shí)代利用大數(shù)據(jù)工具如何建設(shè)新冠肺炎疫情醫(yī)療體系具有一定的現(xiàn)實(shí)意義。
參考文獻(xiàn):
[1] 張放,甘浩辰.疫情心理時(shí)空距離對(duì)公眾情緒的影響研究——基于新冠肺炎疫期微博文本面板數(shù)據(jù)的計(jì)算分析 [J].新聞界,2020(6):39-49.
[2] 史本葉,馬曉麗.后疫情時(shí)代的全球治理體系重構(gòu)與中國(guó)角色 [J].東北亞論壇,2020,29(4):60-71+127-128.
作者簡(jiǎn)介:?jiǎn)渭岩耍?000—),男,漢族,江西撫州人,本科在讀,研究方向:軟件工程。