王力梅
(天水師范學(xué)院 數(shù)學(xué)與統(tǒng)計學(xué)院,甘肅 天水 741001)
近年來,利用復(fù)雜網(wǎng)絡(luò)的多項指標(biāo)進行多屬性決策成為了識別關(guān)鍵節(jié)點的熱點.韓忠明教授團隊提出了面向結(jié)構(gòu)洞用復(fù)雜網(wǎng)絡(luò)的7種指標(biāo)識別關(guān)鍵節(jié)點的方法[1].文獻[2]將結(jié)構(gòu)洞融入多個指標(biāo)來研究軍事指揮控制網(wǎng)絡(luò).之后,學(xué)者將結(jié)構(gòu)洞指標(biāo)用于生物網(wǎng)絡(luò)領(lǐng)域的蛋白質(zhì)識別.雖然很多學(xué)者提出了不同的基于結(jié)構(gòu)洞的多屬性節(jié)點識別方法,但是大多數(shù)方法主要在理論研究方面,沒有應(yīng)用到實際網(wǎng)絡(luò).基于此,本文針對2020年的新冠疫情形勢下抗疫和防疫兩個階段,借助科研網(wǎng)絡(luò)數(shù)據(jù),提取關(guān)鍵詞構(gòu)建復(fù)雜網(wǎng)絡(luò).利用復(fù)雜網(wǎng)絡(luò)的中心性、核數(shù)和結(jié)構(gòu)洞等9種指標(biāo)對關(guān)鍵詞網(wǎng)絡(luò)進行分析,運用模糊綜合方法得到節(jié)點重要性排序,從而得到此階段新冠疫情的研究熱點,同時引入戰(zhàn)略坐標(biāo)方法分析聚類主題的演變.
以“COVID-19 和新冠肺炎”為檢索詞,共得到3 448篇相關(guān)文獻,具體檢索結(jié)果如表1所列.提取其中的關(guān)鍵詞構(gòu)建網(wǎng)絡(luò).本文將數(shù)據(jù)分為兩個階段,2020年1月至5月,在此時期全國中小學(xué)未全面復(fù)學(xué),視為抗疫階段,搜索得到的數(shù)據(jù)有1 716篇文章.2020年6月至10月底(數(shù)據(jù)搜索截至?xí)r間),在此時期全國學(xué)校已經(jīng)基本復(fù)學(xué),各個行業(yè)也已經(jīng)復(fù)工復(fù)產(chǎn),本階段的關(guān)鍵在于預(yù)防,將其視為防疫階段,搜索得到的數(shù)據(jù)有1 732篇文章.
基于網(wǎng)絡(luò)模型G={V,E},其中V表示網(wǎng)絡(luò)節(jié)點集,E表示網(wǎng)絡(luò)的邊集,構(gòu)建鄰接矩陣D.抗疫階段和防疫階段的網(wǎng)絡(luò)拓撲結(jié)構(gòu)如圖1和圖2所示,兩階段網(wǎng)絡(luò)特征數(shù)據(jù)如表2所列.
圖1 抗疫階段節(jié)點網(wǎng)絡(luò)拓撲結(jié)構(gòu)
圖2 防疫階段節(jié)點網(wǎng)絡(luò)拓撲結(jié)構(gòu)
表2 兩階段網(wǎng)絡(luò)特征對比
由表2可見,防疫階段的網(wǎng)絡(luò)平均路徑較小,平均聚類系數(shù)較大,網(wǎng)絡(luò)中心勢較大,由此可知防疫階段的小世界網(wǎng)絡(luò)特征較抗疫階段更加明顯.防疫階段網(wǎng)絡(luò)更為集中,聯(lián)系緊密,從而可知關(guān)于新冠肺炎的科研熱點研究也更為聚集.
復(fù)雜網(wǎng)絡(luò)描繪關(guān)鍵詞之間的連接關(guān)系(本文網(wǎng)絡(luò)為無向網(wǎng)絡(luò)),用關(guān)鍵詞出現(xiàn)的頻次來表示該節(jié)點在網(wǎng)絡(luò)中的度值.網(wǎng)絡(luò)中節(jié)點分布如果滿足冪律分布y=tx-r,其中t為常數(shù),r為指數(shù)變量,則認為該網(wǎng)絡(luò)為無標(biāo)度網(wǎng)絡(luò).抗疫階段和防疫階段的度分布結(jié)果如圖3和圖4所示.
圖4 防疫階段度分布
如圖3節(jié)點度的冪率擬合曲線所示,可以看出網(wǎng)絡(luò)的節(jié)點度分布基本上符合冪率分布,且可決系數(shù)R2(即冪函數(shù)擬合度)為0.8031,計算公式為:
(1)
從圖4可以看出,防疫階段的節(jié)點度分布滿足冪率分布且擬合度較高(R2為0.7443),明顯呈現(xiàn)無標(biāo)度網(wǎng)絡(luò)的特征,適用于復(fù)雜網(wǎng)絡(luò)的各種測度.
本文中節(jié)點的網(wǎng)絡(luò)中心性反映的是此關(guān)鍵詞在研究中的相對重要性.中心性分為兩大類,一類是基于網(wǎng)絡(luò)整體的表征,如接近度中心性和中介中心性;另一類是基于鄰節(jié)點的表征,如度中心性和特征向量中心性.
度中心性是基于鄰節(jié)點個數(shù)的一種排序,表達式為:
(2)
介數(shù)中心性是基于網(wǎng)絡(luò)的整體,計算網(wǎng)絡(luò)中所有的節(jié)點對之間的最短路徑數(shù)目,表達式為:
(3)
接近度中心性體現(xiàn)了本文中關(guān)鍵詞在整個網(wǎng)絡(luò)中居于中心的程度,表達式為:
(4)
特征向量中心性是比較網(wǎng)絡(luò)中節(jié)點連接到影響力節(jié)點概率的一種測度,表達式為:
Ax=λx,
(5)
其中,A為節(jié)點的鄰接矩陣,各個特征向量將對應(yīng)各自不同的特征值λ.
結(jié)構(gòu)洞表征的是處于網(wǎng)絡(luò)中“洞”,即網(wǎng)絡(luò)中連接那些沒有關(guān)聯(lián)節(jié)點的橋梁節(jié)點,連接越多的節(jié)點(即洞)在網(wǎng)絡(luò)中所能獲得的信息越多,影響力越大.本文采用Burt方法,該方法中結(jié)構(gòu)洞節(jié)點受到自身4個因素作用,主要包括有效規(guī)模、效率、限制度以及等級度,其中有效規(guī)模計算公式為:
(6)
其中,j表示與i相連的節(jié)點,q表示除了i,j的所有點.效率表征的是有效規(guī)模與實際規(guī)模的比值.
限制度表征的是節(jié)點運用網(wǎng)絡(luò)中結(jié)構(gòu)洞的能力,表達式為:
(7)
其中,piq表示節(jié)點i的所有連接關(guān)系中與q相關(guān)的比例.
等級度表征的是節(jié)點對網(wǎng)絡(luò)的控制力,控制力越大,則該關(guān)鍵詞在研究中越處于核心位置,計算公式為:
(8)
其中,C/N表示節(jié)點限制度的均值.
核數(shù)表征的是節(jié)點在網(wǎng)絡(luò)中的位置,核數(shù)小的節(jié)點位于網(wǎng)絡(luò)邊緣,反之則處于核心位置.
計算上述各項指標(biāo),部分抗疫階段測試結(jié)果如表3所列.
表3 抗疫階段網(wǎng)絡(luò)基本特征
(1)指標(biāo)精簡
(9)
(2)組合賦權(quán)
對剩余指標(biāo)歸一化處理后利用熵權(quán)法和CRITIC法對各指標(biāo)進行組合賦權(quán).兩種方法都是基于客觀數(shù)據(jù),但是側(cè)重點不同,組合賦權(quán)更有利于提高合理性[4].
組合賦權(quán):組合賦權(quán)采用加權(quán)平均法φj=αωj+βθj,其中α,β采用變異系數(shù)法確定.
(3)模糊綜合
把指標(biāo)的隸屬度函數(shù)值與其相應(yīng)的權(quán)重通過模糊合成算子綜合計算[5].由于指標(biāo)間量綱不同無法定量比較,隸屬度函數(shù)可以使異質(zhì)指標(biāo)同質(zhì)化.正指標(biāo)采用半梯形偏大型隸屬度函數(shù)A1(x),負指標(biāo)采用半梯形偏小型隸屬度函數(shù)A2(x).由此得到模糊矩陣A.具體計算公式為:
(10)
(11)
進而計算模糊集H=A⊙Φ,⊙為模糊合成算子M(;+);Φ為指標(biāo)相應(yīng)的權(quán)重.
計算可得指標(biāo)間特征向量中心性與核數(shù)的相關(guān)系數(shù)為0.93,中介中心性與有效規(guī)模的相關(guān)系數(shù)為0.96,故去掉指標(biāo)特征向量中心性和有效規(guī)模.
剩余指標(biāo)由熵權(quán)法所得權(quán)重依次分別為:0.1026,0.0544,0.4388,0.1464,0.1560,0.0489,0.0529;而采用CRITIC法所得的權(quán)重依次為:0.12,0.10,0.10,0.20,0.15,0.16,0.16.綜合可得Φj依次為:0.0183, 0.0482, 0.3416, 0.0590,0.3118,0.1151,-0.059.
經(jīng)模糊綜合后的前6排序為:疫情防控、診斷治療、國務(wù)院、護理和人民政府及應(yīng)急管理.而度中心排序的關(guān)鍵節(jié)點為:疫情防控、診斷治療、失業(yè)保險金、社會保險費、社會保險補貼和人民政府.
同理可得,防疫階段模糊綜合后的關(guān)鍵詞前6排序為:疫情防控、突發(fā)公共衛(wèi)生事件、中醫(yī)藥、心理狀況、臨床特征和影響分析.
(4)驗證識別關(guān)鍵節(jié)點
利用網(wǎng)絡(luò)的魯棒性驗證本文方法的有效性,采取攻擊特定節(jié)點來比較網(wǎng)絡(luò)連通比例,連通比例下降越大說明失去該節(jié)點網(wǎng)絡(luò)的性能越差,節(jié)點越為重要.采用度中心性的節(jié)點排序作為本文多屬性決策方法的對比,攻擊網(wǎng)絡(luò)兩種排序前2到6的節(jié)點對比情況如圖5和圖6所示.
圖5 抗疫階段兩種蓄意攻擊對比
圖6 防疫階段兩種蓄意攻擊對比
從圖5左邊部分可知,本文所提方法從第3次攻擊開始網(wǎng)絡(luò)的最大連通比例開始陡降,表明多屬性決策節(jié)點排序較度中心性排序更優(yōu).
從圖6可以看出本文排序與度排序攻擊節(jié)點相比,本文方法從第4次攻擊開始顯示更大破壞性,識別的節(jié)點更重要.
將抗疫階段的相似度矩陣導(dǎo)入SPSS軟件中,進行系統(tǒng)聚類,聚類的選擇標(biāo)準(zhǔn)為平方歐式距離.為了能夠統(tǒng)一處理數(shù)據(jù)則需要進行數(shù)據(jù)標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化過程采用Z分?jǐn)?shù)方法.再根據(jù)戰(zhàn)略坐標(biāo)理論計算各聚類的向心度與密度,具體聚類參數(shù)如表4所列.
表4 抗疫階段聚類參數(shù)
研究主題聚類內(nèi)部和聚類之間的聯(lián)系與變化狀況如圖7所示[7].橫坐標(biāo)表示向心度,縱坐標(biāo)為密度.聚類的向心度越大,表示該類團與其他聚類的聯(lián)系越強,表明該聚類在新冠肺炎領(lǐng)域的研究中屬于研究熱點,處于網(wǎng)絡(luò)的核心地位.聚類密度越大,表明該聚類內(nèi)部關(guān)聯(lián)更加緊密,在新冠肺炎領(lǐng)域的研究較為全面.
圖7 抗疫階段戰(zhàn)略坐標(biāo)
由圖7可知c的向心度最大,因此中醫(yī)藥診治是該時期至關(guān)重要的研究重點.a的密度最大,表明突發(fā)衛(wèi)生事件及應(yīng)急管理較其他聚類的內(nèi)部關(guān)聯(lián)最緊密,研究更為具體深入.a處于防疫時期戰(zhàn)略坐標(biāo)圖的第二象限,說明在此時期突發(fā)衛(wèi)生事件及應(yīng)急管理已有一定發(fā)展;聚類b和c處于第四象限,說明社會保障和中醫(yī)藥診治雖處于核心位置卻沒有得到很好的研究,應(yīng)加以重視.同樣的方法,得到防疫階段的系統(tǒng)聚類和戰(zhàn)略坐標(biāo),如圖8所示.
圖8 防疫階段戰(zhàn)略坐標(biāo)
由圖8可知F的密度最大,表明復(fù)工復(fù)產(chǎn)復(fù)學(xué)及影響分析在此時期的研究較多,成熟度較高,說明該研究主題在本階段得到較好的發(fā)展 .B和D的密度最小但向心度卻最大,體現(xiàn)了醫(yī)院防疫和科技防疫雖然是本階段研究最為核心的部分,但是卻沒有得到良好的發(fā)展,是我們今后的研究重點.關(guān)于新冠肺炎的現(xiàn)代科技防疫如利用大數(shù)據(jù)和人工智能抑制疫情的擴散,是防疫階段的重點.
A和E處于第四象限,向心度高但是密度低,說明突發(fā)衛(wèi)生事件及應(yīng)急管理與心理健康是本階段的研究熱點,但關(guān)于該主題的研究并不完善,在后續(xù)研究中要重點突破.聚類C處于第二象限,密度高但向心度低,表明中醫(yī)藥診治在前面的研究中有了一定成效,不再是防疫階段的研究核心.
a和A雖處于不同階段但研究主題大體一致,從抗疫階段的第一象限轉(zhuǎn)為防疫階段的第二象限,表明其在新冠肺炎研究領(lǐng)域的地位得到提升,成為現(xiàn)階段的研究核心.c和C的研究主題為中醫(yī)藥診治,從抗疫階段的第四象限轉(zhuǎn)為防疫階段的第二象限,表明其在研究領(lǐng)域的地位從核心轉(zhuǎn)為邊緣.
本文利用多指標(biāo)識別新冠疫情形勢下科研網(wǎng)絡(luò)的關(guān)鍵節(jié)點,針對復(fù)雜網(wǎng)絡(luò)的中心性、結(jié)構(gòu)洞以及核數(shù)這3種屬性,結(jié)合網(wǎng)絡(luò)中心性和拓撲結(jié)構(gòu)進行分析得到9個指標(biāo).進一步運用模糊綜合方法建立節(jié)點識別體系,得到不同階段的節(jié)點排序即新冠的科研重點排序.同時進行多指標(biāo)決策聚類分析,得到聚類主題戰(zhàn)略坐標(biāo)圖,數(shù)值結(jié)果驗證了所提方法的有效性.