張欣欣 許 力 徐振宇
(福建師范大學(xué)計(jì)算機(jī)與網(wǎng)絡(luò)空間安全學(xué)院 福州 350007)
(福建省網(wǎng)絡(luò)安全與密碼技術(shù)重點(diǎn)實(shí)驗(yàn)室 福州 350007)
在線社會(huì)網(wǎng)絡(luò),也就是通常所說(shuō)的社交網(wǎng)絡(luò),是一類基于Web的社會(huì)網(wǎng)絡(luò)系統(tǒng),例如臉書、推特和微博等。移動(dòng)社會(huì)網(wǎng)絡(luò)(Mobile Social Networks,MSNs)則是一個(gè)具有相似的某種特性的個(gè)人通過(guò)移動(dòng)設(shè)備互聯(lián)而成的網(wǎng)絡(luò)[1,2]。與社交網(wǎng)絡(luò)的虛擬性相比,移動(dòng)社會(huì)網(wǎng)絡(luò)更加強(qiáng)調(diào)的是人和移動(dòng)設(shè)備的存在,以及網(wǎng)絡(luò)行為的無(wú)中心和自組織,它是由人類攜帶移動(dòng)設(shè)備進(jìn)行數(shù)據(jù)傳輸和交互所構(gòu)成的網(wǎng)絡(luò)。移動(dòng)社會(huì)網(wǎng)絡(luò)使人們的觀點(diǎn)交流和信息的傳播變得極其便捷,病毒營(yíng)銷[3]、輿情控制[4]、推薦系統(tǒng)[5]、公安偵查[6]、社團(tuán)檢測(cè)[7]等各種應(yīng)用和問(wèn)題也應(yīng)運(yùn)而生。移動(dòng)社會(huì)網(wǎng)絡(luò)包含有通信網(wǎng)絡(luò)層、社會(huì)網(wǎng)絡(luò)層與數(shù)據(jù)層,每層都有各自的特點(diǎn),并且對(duì)信息傳播都有不同方面的影響。其中,由通信網(wǎng)絡(luò)和社會(huì)接觸網(wǎng)絡(luò)組成的雙層耦合網(wǎng)絡(luò)在結(jié)構(gòu)上存在相互依存關(guān)系的同時(shí),還在信息傳遞過(guò)程中起到相互促進(jìn)的作用。
社會(huì)網(wǎng)絡(luò)輿情是用戶對(duì)社會(huì)熱點(diǎn)問(wèn)題產(chǎn)生不同看法的網(wǎng)絡(luò)輿論,它是用戶通過(guò)互聯(lián)網(wǎng)對(duì)社會(huì)和生活中的熱點(diǎn)、焦點(diǎn)問(wèn)題所持有的具有影響力、傾向性的觀點(diǎn)和意見的集合[8]。若在短時(shí)間內(nèi)不能對(duì)惡意信息的傳播進(jìn)行有效控制,會(huì)造成嚴(yán)重的社會(huì)危害,威脅社會(huì)和諧與國(guó)家穩(wěn)定。例如,2019年出現(xiàn)的新冠肺炎疫情發(fā)展至今,已經(jīng)形成了全球性“大流行”(Pandemic),與之相伴的則是信息瘟疫(Infodemic)的到來(lái),大量謠言在社交媒體平臺(tái)上衍生并廣泛傳播[9]。在移動(dòng)社會(huì)網(wǎng)絡(luò)中,如何積極傳播真實(shí)可靠的信息和及時(shí)遏制謠言信息,如何根據(jù)移動(dòng)社會(huì)網(wǎng)絡(luò)中社會(huì)網(wǎng)絡(luò)層和物理通信層的關(guān)系,結(jié)合用戶社會(huì)屬性以及信息傳播規(guī)律,設(shè)計(jì)高效可控的信息傳播方案是一個(gè)值得研究的課題。
信息傳播控制是設(shè)計(jì)高效的傳播模型,以較小的代價(jià)在合適的時(shí)機(jī)選擇最佳的控制點(diǎn),對(duì)大部分甚至整個(gè)網(wǎng)絡(luò)的信息傳播進(jìn)行控制。最初,獨(dú)立級(jí)聯(lián)模型(Independent Cascade, IC)是由Kempe等人[10]在相互作用粒子系統(tǒng)的模型基礎(chǔ)上提出來(lái)的,它把節(jié)點(diǎn)v∈V分為活躍的和不活躍的兩個(gè)可能的狀態(tài),當(dāng)節(jié)點(diǎn)v接收網(wǎng)絡(luò)傳播的新信息、新思想、新產(chǎn)品時(shí),可以看到節(jié)點(diǎn)v的活躍狀態(tài),而非活動(dòng)狀態(tài)表示節(jié)點(diǎn)v沒(méi)有接收新信息、新思想、新產(chǎn)品。Peng等人[11]提出了基于大數(shù)據(jù)影響建模的社會(huì)網(wǎng)絡(luò)免疫方法,該方法為防止惡意軟件或惡意消息在社交網(wǎng)絡(luò)中的傳播提供了一種有效的解決方案。Doostmohammadian等人[12]用圖論控制的思想設(shè)計(jì)了移動(dòng)社會(huì)網(wǎng)絡(luò)中通過(guò)控制措施,合理分配治療資源給某一個(gè)目標(biāo)群體,實(shí)現(xiàn)移動(dòng)社會(huì)網(wǎng)絡(luò)的資源分配平衡。斯坦福大學(xué)Jure Leskovec[13]所在Chan Zuckerberg Biohub團(tuán)隊(duì)對(duì)移動(dòng)網(wǎng)絡(luò)模型進(jìn)行了深入研究,他們認(rèn)為在COVID-19爆發(fā)之后極大地改變了人類的流動(dòng)模式,需要建立流行病學(xué)模型來(lái)捕捉流動(dòng)性變化對(duì)病毒傳播的影響,于是該團(tuán)隊(duì)建立了疫情狀態(tài)下的移動(dòng)模型,能夠精準(zhǔn)地預(yù)測(cè)移動(dòng)網(wǎng)絡(luò)中的“超級(jí)傳播者”和在不同移動(dòng)性條件下感染的風(fēng)險(xiǎn)大小,這一成果為移動(dòng)社會(huì)網(wǎng)絡(luò)在流行病模型下的信息傳播提供了可借鑒的實(shí)例。針對(duì)移動(dòng)社會(huì)網(wǎng)絡(luò)信息在不同網(wǎng)絡(luò)層傳播的問(wèn)題,Wang等人[14]提出了一種新的基于兩層多重網(wǎng)絡(luò)的傳染病模型,探討了正預(yù)防信息和負(fù)預(yù)防信息對(duì)傳染病傳播的影響。
上述研究并未考慮社會(huì)網(wǎng)絡(luò)層用戶間的社會(huì)屬性和物理通信層多條信息之間的競(jìng)爭(zhēng)性等具體特征對(duì)信息傳播控制的影響,不能夠很好地適應(yīng)移動(dòng)社會(huì)網(wǎng)絡(luò)信息傳播控制的場(chǎng)景,并且上述研究均從個(gè)體角度出發(fā),對(duì)于移動(dòng)社會(huì)網(wǎng)絡(luò)中的群體性特點(diǎn)沒(méi)有很好的研究。針對(duì)以上問(wèn)題,本文主要的研究工作如下。
(1)本文在移動(dòng)社會(huì)網(wǎng)絡(luò)雙層結(jié)構(gòu)中社會(huì)網(wǎng)絡(luò)層,提出了多實(shí)體的競(jìng)爭(zhēng)性獨(dú)立級(jí)聯(lián)模型(Multientity Competitive Independent Cascade, MCIC),該模型首次將信息競(jìng)爭(zhēng)擴(kuò)散理論與社會(huì)網(wǎng)絡(luò)層用戶的社會(huì)屬性結(jié)合,實(shí)現(xiàn)信息的可控傳播。
(2)本文在移動(dòng)社會(huì)網(wǎng)絡(luò)雙層結(jié)構(gòu)中的物理通信層,從群體角度出發(fā)定義了控制信息流模體
(Control Information Flow Motif, CIFM),并選擇出具有可控傳播功能的關(guān)鍵網(wǎng)絡(luò)模體,設(shè)計(jì)其在通信層的高效可控傳播算法。
(3)通過(guò)理論推導(dǎo)證明了本方法具有收斂性,仿真實(shí)驗(yàn)表明本文方法不僅在信息傳播中最大感染時(shí)間和平均感染時(shí)間上更有優(yōu)勢(shì),而且在控制信息傳播方面的效果也是最好的。惡意信息感染時(shí)間有限和傳播惡意信息節(jié)點(diǎn)的數(shù)量呈下降趨勢(shì)都意味著惡意信息最終將會(huì)從網(wǎng)絡(luò)中消失,最終能夠?qū)崿F(xiàn)信息可控傳播。
哥倫比亞大學(xué)團(tuán)隊(duì)于2015年提出并分析了傳統(tǒng)和未來(lái)移動(dòng)社會(huì)網(wǎng)絡(luò)系統(tǒng)的總體架構(gòu)設(shè)計(jì),這些體系結(jié)構(gòu)主要采用物理層-用戶層-終端層交互方式介紹并分析了一種新的MSNs體系結(jié)構(gòu)[15]。移動(dòng)社會(huì)網(wǎng)絡(luò)包括通信網(wǎng)絡(luò)層、社會(huì)網(wǎng)絡(luò)層、數(shù)據(jù)層,每層都有各自的特點(diǎn),對(duì)信息傳播都有不同方面的影響。如圖1所示,本文主要研究的是社會(huì)網(wǎng)絡(luò)層與物理通信層之間的關(guān)系,社會(huì)網(wǎng)絡(luò)層主要由用戶的社會(huì)屬性、社會(huì)關(guān)系、社會(huì)行為等產(chǎn)生數(shù)據(jù)形成交互。物理通信層主要功能是為數(shù)據(jù)端設(shè)備提供傳送數(shù)據(jù)的通路,既要保證數(shù)據(jù)能從其上正確通過(guò),也要提供足夠帶寬減少信道上擁塞。所以將社會(huì)網(wǎng)絡(luò)層與物理通信層結(jié)合,考慮層與層之間的互相影響,利用通信模體的動(dòng)態(tài)演化設(shè)計(jì)高效可靠的信息傳播模型對(duì)信息可控傳播是具有挑戰(zhàn)和有實(shí)際應(yīng)用價(jià)值的。
圖1 移動(dòng)社會(huì)網(wǎng)絡(luò)中的社會(huì)網(wǎng)絡(luò)層與物理通信層關(guān)系圖
通常把移動(dòng)社會(huì)網(wǎng)絡(luò)建模成一個(gè)有向圖G=(V,E,W),其中,V代表節(jié)點(diǎn)集,E代表邊集,W表示邊權(quán)重。一個(gè)節(jié)點(diǎn)代表移動(dòng)社會(huì)網(wǎng)絡(luò)中的一個(gè)用戶,而從u到v的 一條邊代表用戶u和v之間的關(guān)系。這種關(guān)系是定向的,我們主要關(guān)注的是影響關(guān)系,也就是說(shuō),一個(gè)用戶u是否容易影響另一個(gè)用戶v,這種影響關(guān)系通常是定向的和非對(duì)稱的。獨(dú)立級(jí)聯(lián)模型首先是由Kempe等人[10]在相互作用粒子系統(tǒng)的模型基礎(chǔ)上提出來(lái)的,該模型的主要特點(diǎn)是沿圖中每條邊的擴(kuò)散事件是相互獨(dú)立的。并可能影響其非活躍鄰居變?yōu)榛钴S節(jié)點(diǎn)。在此基本模型中,單個(gè)影響過(guò)程從一組活躍節(jié)點(diǎn)開始,在每個(gè)時(shí)間戳中,只有新的活躍節(jié)點(diǎn)才有機(jī)會(huì)以概率方式影響其非活躍鄰居。具體傳播方式如圖2所示。
圖2 獨(dú)立級(jí)聯(lián)模型
第t=0:a節(jié)點(diǎn)被激活。
第t=1:a節(jié)點(diǎn)以0.5的概率嘗試激活b,以0.2的概率嘗試激活c。假設(shè)b節(jié)點(diǎn)在這一時(shí)間步內(nèi)成功被激活。
第t=2:b節(jié)點(diǎn)以0.3的概率嘗試激活c,并以0.5的概率嘗試激活d。假設(shè)c節(jié)點(diǎn)和d節(jié)點(diǎn)在這一時(shí)間步內(nèi)成功被激活。
第t=3:c節(jié)點(diǎn)以0.2的概率嘗試激活e,d節(jié)點(diǎn)以0.2的概率嘗試激活e。假設(shè)這一時(shí)間步內(nèi)的嘗試都失敗了,沒(méi)有新的節(jié)點(diǎn)被激活,傳播停止。
在信息情報(bào)領(lǐng)域,學(xué)者在競(jìng)爭(zhēng)擴(kuò)散理論框架下,利用貪婪算法等識(shí)別限制惡意信息的最優(yōu)策略,通過(guò)刺激“正確”信息的擴(kuò)散來(lái)限制“錯(cuò)誤”信息的傳播[16]。受到這個(gè)思想的啟發(fā),本文根據(jù)用戶的社會(huì)屬性和信息傳播的特點(diǎn),提出多實(shí)體的競(jìng)爭(zhēng)性獨(dú)立級(jí)聯(lián)模型(Multi-entity Competitive Independent Cascade, MCIC),在信息擴(kuò)散的過(guò)程中能夠捕獲惡意信息的同時(shí)傳播與惡意信息有競(jìng)爭(zhēng)關(guān)系的正確信息。MCIC模型中節(jié)點(diǎn)狀態(tài)分為以下4類:
(1)N0表示節(jié)點(diǎn)處于非活躍(inactive)狀態(tài),并且當(dāng)前沒(méi)有任何信息。
(2)Nam表示節(jié)點(diǎn)處于活躍(active)狀態(tài),并且當(dāng)前處于惡意信息(misinformation)。
(3)Nic表 示節(jié)點(diǎn)處于非活躍(inactive)狀態(tài),并且當(dāng)前處于正確信息(correct information)。
(4)Nc表示節(jié)點(diǎn)處于活躍(active)狀態(tài),并且信息正確(correct information)。
PIC網(wǎng)絡(luò)模型的初始狀態(tài)有3種分別為N0,Nam和Nic。Nam向網(wǎng)絡(luò)中鄰居節(jié)點(diǎn)傳遞惡意信息,N0節(jié)點(diǎn)收到惡意信息會(huì)轉(zhuǎn)變?yōu)镹am節(jié)點(diǎn)并向鄰居節(jié)點(diǎn)傳遞信息,此時(shí)傳遞惡意信息的概率是Pm。當(dāng)Nic節(jié)點(diǎn)感知到惡意信息時(shí)會(huì)被激活變?yōu)镹c節(jié)點(diǎn),并開始向鄰居節(jié)點(diǎn)傳播與惡意信息競(jìng)爭(zhēng)的正確信息,鄰居節(jié)點(diǎn)收到正確信息從N0狀 態(tài)轉(zhuǎn)換為Nc狀態(tài)。當(dāng)用戶獲得正確信息就不會(huì)再接收惡意信息,正確信息傳播概率是P。
節(jié)點(diǎn)4種狀態(tài)的定義展示出節(jié)點(diǎn)之間相互轉(zhuǎn)化的關(guān)系如圖3所示,根據(jù)本文設(shè)計(jì)的MCIC信息擴(kuò)散模型,處于N0狀態(tài)的節(jié)點(diǎn)是非活躍狀態(tài),它能夠被任何一個(gè)活躍的鄰居所影響。而處于Nam狀態(tài)的節(jié)點(diǎn)是活躍的,它可以向非活躍的鄰居傳遞惡意信息。處于Nic狀態(tài)的節(jié)點(diǎn)雖然是非活躍狀態(tài),但是它能夠明辨是非,從不相信惡意信息,當(dāng)它感知到惡意信息的時(shí)候,能夠被激活并開始與惡意信息對(duì)抗,向鄰居傳遞正確信息。所以Nic狀態(tài)下的節(jié)點(diǎn)對(duì)于整個(gè)網(wǎng)絡(luò)其他狀態(tài)下的節(jié)點(diǎn)有絕對(duì)的影響作用,在惡意信息出現(xiàn)的時(shí)候承擔(dān)著與之對(duì)抗,并傳遞信息使得網(wǎng)絡(luò)節(jié)點(diǎn)最終都變成接受正確信息的活躍節(jié)點(diǎn)Nc。 本文將Nc節(jié)點(diǎn)定義為控制信息節(jié)點(diǎn),它的功能是在出現(xiàn)任何惡意信息時(shí)被激活并傳遞正確信息,控制社會(huì)網(wǎng)絡(luò)的信息傳播。
圖3 節(jié)點(diǎn)狀態(tài)轉(zhuǎn)化圖
在移動(dòng)社會(huì)網(wǎng)絡(luò)中,人的行為不僅具有個(gè)體性,也具有群體性。模體(motif)最早是在生物學(xué)的蛋白質(zhì)網(wǎng)絡(luò)里表示最基本的功能模塊,引入到復(fù)雜網(wǎng)絡(luò)中便可以表示為網(wǎng)絡(luò)的基本子結(jié)構(gòu),稱為網(wǎng)絡(luò)模體(Network Motif, NM)。網(wǎng)絡(luò)模體的結(jié)構(gòu)和類型從微觀的角度反映了其所在網(wǎng)絡(luò)的特點(diǎn)。在社會(huì)網(wǎng)絡(luò)中,對(duì)于一個(gè)3個(gè)用戶形成的群體,若3個(gè)人相互之間的關(guān)系都比較緊密,他們的結(jié)構(gòu)穩(wěn)定性可能會(huì)更高,不易被惡意行為所破壞。本文用網(wǎng)絡(luò)模體作為社會(huì)網(wǎng)絡(luò)中最基本的構(gòu)成單元,從微觀角度刻畫移動(dòng)社會(huì)網(wǎng)絡(luò)中用戶相互作用的特殊模式,有利于描述人行為的群體性,從而來(lái)研究群體內(nèi)的互相作用對(duì)于整個(gè)社會(huì)網(wǎng)絡(luò)的影響。
在社會(huì)網(wǎng)絡(luò)中,當(dāng)出現(xiàn)惡意信息時(shí),通過(guò)選定的模體來(lái)輸入正確信息來(lái)遏制惡意信息的傳播,關(guān)鍵模體的功能是接受并傳遞正確的信息,并通過(guò)自身的影響力可能使惡意信息的節(jié)點(diǎn)改變其信念,最終使網(wǎng)絡(luò)避免接收惡意信息。因此,本文惡意信息遏制問(wèn)題旨在選擇一組正確的信息的模體作為信息控制模體,在社會(huì)網(wǎng)絡(luò)中及早地有效遏制惡意信息傳播。在惡意信息遏制問(wèn)題中,當(dāng)前相信惡意信息的節(jié)點(diǎn)可能會(huì)在來(lái)自權(quán)威來(lái)源的正確信息的節(jié)點(diǎn)的影響下改變其信念。
根據(jù)社會(huì)網(wǎng)絡(luò)模體的定義,本文定義控制信息流模體如下。
定義1 控制信息流模體(Control Information Flow Motif, CIFM)是指包含具備控制信息功能節(jié)點(diǎn)Nic的模體。記作
該模體由Nic產(chǎn)生指令,利用它對(duì)于社會(huì)網(wǎng)絡(luò)中其他狀態(tài)下的節(jié)點(diǎn)有絕對(duì)的影響作用,將與惡意信息競(jìng)爭(zhēng)的正確信息發(fā)送至鄰居節(jié)點(diǎn)。這類網(wǎng)絡(luò)模體承擔(dān)著遏制惡意信息和傳播正確信息的任務(wù)。
物理通信網(wǎng)絡(luò)作為真實(shí)社會(huì)人際關(guān)系的映射,具有用戶社會(huì)行為特征的數(shù)據(jù),用戶之間通過(guò)移動(dòng)設(shè)備建立交互關(guān)系。每個(gè)移動(dòng)設(shè)備都可以作為一個(gè)信號(hào)源節(jié)點(diǎn),它們可以向鄰接節(jié)點(diǎn)發(fā)送信息。物理通信層上個(gè)體之間可以傳遞帶有惡意的生物元素,對(duì)應(yīng)的是用戶接收和傳遞信息的物理狀態(tài),與傳染病模型中易感態(tài)-感染態(tài)(SI)類似,通信層中接收信息的節(jié)點(diǎn)稱為感染節(jié)點(diǎn),否則稱為易感節(jié)點(diǎn)。惡意信息和正確信息以競(jìng)爭(zhēng)的方式傳播過(guò)程中,社會(huì)網(wǎng)絡(luò)層中的用戶能將他們的信念從相信惡意信息轉(zhuǎn)向相信正確信息。兩個(gè)對(duì)通信網(wǎng)絡(luò)資源競(jìng)爭(zhēng)激烈的信息流模體,可能地理位置上相近,爭(zhēng)奪資源多,擴(kuò)散信息就多。由于各類信息流模體都是基于底層物理的信息基礎(chǔ)設(shè)施網(wǎng)進(jìn)行傳輸,受物理層信息傳輸能力的限制,信息流模體相互之間存在通信網(wǎng)絡(luò)資源競(jìng)爭(zhēng),造成彼此相互制約的關(guān)系。同時(shí),不同信息流模體之間還存在相互驅(qū)動(dòng)作用。
本文研究基于網(wǎng)絡(luò)模體的信息可控傳播方法,其中需要的關(guān)鍵網(wǎng)絡(luò)模體承載著控制和傳播信息的功能。由于結(jié)構(gòu)的穩(wěn)定性和實(shí)驗(yàn)的便捷性,本文的控制信息流模體CIFM選用3元模體M(v1,v2,v3)來(lái)研究。
定義2 度密度(Degree Density, DD)。對(duì)于給定的加權(quán)網(wǎng)絡(luò)G=(V,E,W) ,V=(v1,v2,...,vn),i=1,2,...,n,dvi表示節(jié)點(diǎn)vi的度數(shù),dmax表示圖G中最大的節(jié)點(diǎn)度,定義為
度密度衡量了網(wǎng)絡(luò)模體對(duì)網(wǎng)絡(luò)中剩余節(jié)點(diǎn)的重要性,網(wǎng)絡(luò)模體中的節(jié)點(diǎn)連接到外部越多,對(duì)其他節(jié)點(diǎn)的影響就越大,該網(wǎng)絡(luò)模體控制和傳播信息的作用就越重要。
定義3 平均加權(quán)度 (Average Weighted Degree, AWD)。在給定的加權(quán)網(wǎng)絡(luò)G=(V,E,W)中對(duì)于ui ∈V ?M,vj ∈M,其中,M ?G,j=1,2,3。W={w(e1),w(e2),...,w(en)},i=1,2,...,n。w(ei)表示邊ei的權(quán)值。A WD(u,M)表 示u在M內(nèi)的平均加權(quán)度,定義為
平均加權(quán)度描述了圖G中節(jié)點(diǎn)與模體M之間的耦合程度。平均加權(quán)度越大,節(jié)點(diǎn)與模體內(nèi)節(jié)點(diǎn)聯(lián)系越緊密,模體對(duì)圖中其余節(jié)點(diǎn)的影響就越大。
本文依據(jù)式(2)和式(3)確定社會(huì)網(wǎng)絡(luò)層關(guān)鍵網(wǎng)絡(luò)模體作為控制信息流模體,對(duì)于這一特定的功能,可根據(jù)式(4)計(jì)算其排名得分并擇優(yōu)選取
關(guān)鍵網(wǎng)絡(luò)模體具有感知惡意信息并傳播正確信息的能力,每個(gè)關(guān)鍵模體中含有控制信息節(jié)點(diǎn)Nic,它利用對(duì)于社會(huì)網(wǎng)絡(luò)中其他狀態(tài)下的節(jié)點(diǎn)有絕對(duì)的影響作用,產(chǎn)生指令并發(fā)送至其他相關(guān)的節(jié)點(diǎn)。本節(jié)主要內(nèi)容是在關(guān)鍵模體中選取能夠遏制惡意信息的控制節(jié)點(diǎn)Nic即種子節(jié)點(diǎn)。
基于2.2節(jié)中信息傳播模型,根據(jù)3.1節(jié)中對(duì)網(wǎng)絡(luò)模體S core(M)進(jìn)行關(guān)鍵程度排序,然后按照排名的先后順序選擇每個(gè)模體中度最大的節(jié)點(diǎn)作為種子節(jié)點(diǎn),如果確定一個(gè)種子節(jié)點(diǎn)后,將模體序列中含有該種子節(jié)點(diǎn)的模體刪除,這樣可以避免富人俱樂(lè)部(Rich Club)現(xiàn)象[17],循環(huán)上述步驟最終根據(jù)實(shí)際網(wǎng)絡(luò)大小選取前k個(gè)種子節(jié)點(diǎn)來(lái)作為控制信息傳播的初始節(jié)點(diǎn)。具體流程如算法1所示。
算法1 遏制惡意信息的種子節(jié)點(diǎn)選取算法
由于各類信息流模體都是基于底層物理的信息基礎(chǔ)設(shè)施網(wǎng)進(jìn)行傳輸,受物理層信息傳輸能力的限制,信息流模體之間存在通信網(wǎng)絡(luò)資源競(jìng)爭(zhēng),造成彼此相互制約的關(guān)系,同時(shí),不同信息流模體之間還存在相互驅(qū)動(dòng)作用,能夠通過(guò)協(xié)調(diào)配合,促進(jìn)信息傳輸系統(tǒng)發(fā)揮整體能力。于是,本文在SIR傳播模型的基礎(chǔ)上定義通信層競(jìng)爭(zhēng)信息傳播模型SMCR過(guò)程如圖4所示。
圖4 物理通信層競(jìng)爭(zhēng)信息傳播模型
隨著傳播過(guò)程的進(jìn)行,由于信息的競(jìng)爭(zhēng)傳播以及周圍好友狀態(tài)的變化惡意信息(M)與正確信息(C)會(huì)相互置換。另外,考慮到信息的時(shí)效性,傳播者會(huì)對(duì)信息失去傳播興趣或能力,退出傳播過(guò)程成為免疫者,免疫者將作為信息傳播的終極狀態(tài)。物理通信層的節(jié)點(diǎn)處于易感狀態(tài),會(huì)以不同的概率接受惡意信息和正確信息,由于正確信息與惡意信息存在競(jìng)爭(zhēng)關(guān)系的,具體信息可控傳播方案如算法2所示。
支持?jǐn)?shù)據(jù)傳播的通信網(wǎng)絡(luò)需要以節(jié)點(diǎn)間的傳輸和接觸過(guò)程為特征,移動(dòng)網(wǎng)絡(luò)中的傳輸可行性依賴于任意兩節(jié)點(diǎn)之間的鏈路,而接觸過(guò)程會(huì)隨用戶的移動(dòng)發(fā)生變化。在算法2中,社會(huì)網(wǎng)絡(luò)層中已經(jīng)選取控制信息節(jié)點(diǎn)Nic, 針對(duì)所有信息流Ii(i=1,2,...,n);對(duì)于任意信息流Ii; 當(dāng)時(shí)Nic感知到該信息為惡意信息,則標(biāo)記為Imi;通信網(wǎng)絡(luò)層對(duì)來(lái)自社會(huì)網(wǎng)絡(luò)層的用戶社會(huì)關(guān)系交互的數(shù)據(jù)進(jìn)行分析,在SMCR傳播模型上來(lái)傳播信息,當(dāng)移動(dòng)設(shè)備接到Imi的命令狀態(tài)變成Im,并采取免疫機(jī)制,否則信息被標(biāo)記為Ic設(shè)備將接收并傳遞這條正確的消息;直到所有惡意信息達(dá)到收斂可控范圍。
算法2 信息可控傳播算法
定理1 在MCIC傳播模型中, |Vm(ti)|表示ti(i=1,2,...,n)時(shí)刻惡意信息的數(shù)量,惡意信息的數(shù)量在種子節(jié)點(diǎn)被激活后隨時(shí)間的增大而減小,即當(dāng)t2≥t1時(shí) ,惡意信息數(shù)量|Vm(t2)|≤|Vm(t1)|。
證明 在一個(gè)網(wǎng)絡(luò)中,對(duì)于任意時(shí)刻t,Vm(t),Vc(t)分別表示該時(shí)刻的惡意信息數(shù)量和正確信息數(shù)量。
當(dāng)0≤t<γ時(shí),γ為延遲時(shí)間。由于在極短時(shí)間內(nèi),惡意節(jié)點(diǎn)主動(dòng)去影響未激活的鄰居節(jié)點(diǎn)并傳遞惡意信息,此時(shí)正確節(jié)點(diǎn)尚未被激活。Vn(t)代表未被激活的鄰居節(jié)點(diǎn)。于是
由于在集合{|Vm(t1)|?|Vm(t2)|}中,部分處于錯(cuò)誤信息狀態(tài)的節(jié)點(diǎn)受到控制流的影響改變態(tài)度,從集合{Vm(t2)}加 入到集合{Vc(t2)},所以有
由式(9),式(12)完成證明。 證畢
定理1理論上證明了,本文提出的MCIC傳播模型中,隨著時(shí)間的推移惡意信息的數(shù)量有所下降,且最終會(huì)達(dá)到一個(gè)收斂狀態(tài),這就控制了移動(dòng)社會(huì)網(wǎng)絡(luò)中惡意信息的傳播。
本文采用文獻(xiàn)[18]中定義的最大感染時(shí)間和平均感染時(shí)間來(lái)衡量本文所提方法的性能。
最大感染時(shí)間(The maximum infected time)
其中,t(v)表 示v∈V保留是惡意信息時(shí)所用的時(shí)間,如果最大感染時(shí)間M(G)是有限的,則意味著惡意信息最終將會(huì)從網(wǎng)絡(luò)中消失。
平均感染時(shí)間(The average infected time)
類似地,A(G)是指節(jié)點(diǎn)保留惡意信息的平均時(shí)間,如果平均感染時(shí)間A(G)是有限的,也意味著惡意信息最終將會(huì)從網(wǎng)絡(luò)中消失。本實(shí)驗(yàn)的數(shù)據(jù)集來(lái)自Facebook真實(shí)數(shù)據(jù)集(https://toreopsahl.com/datasets)分別是有899個(gè)節(jié)點(diǎn)和7089條連邊的Forum Network與含有1899個(gè)節(jié)點(diǎn)和13838條連邊的Social Network。圖5和圖6分別在兩個(gè)數(shù)據(jù)集上用M(G)和A(G)對(duì)本文方案的仿真實(shí)驗(yàn)。如圖5和圖6所示,橫坐標(biāo)p表示正確信息傳播的概率(為了使實(shí)驗(yàn)具有一般性,本文設(shè)置pm=0.5),隨機(jī)選取惡意節(jié)點(diǎn)進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,隨著惡意信息傳播概率增加,最大感染時(shí)間和平均感染時(shí)間都呈下降趨勢(shì)。
圖5 p對(duì)平均感染時(shí)間的影響
圖6 p對(duì)最大感染時(shí)間的影響
在2.2節(jié)定義的節(jié)點(diǎn)狀態(tài)的基礎(chǔ)上,本小節(jié)采用以下兩個(gè)傳播模型來(lái)進(jìn)行信息可控傳播實(shí)驗(yàn)。
(1)接觸激活模型。為了主動(dòng)地對(duì)抗惡意信息,惡意信息要擴(kuò)散到正確節(jié)點(diǎn)時(shí),該節(jié)點(diǎn)被信息激活,就會(huì)開始動(dòng)態(tài)地傳播正確的信息,此時(shí)會(huì)產(chǎn)生一個(gè)感知信息時(shí)間。
(2)延遲激活模型。給定一個(gè)社會(huì)網(wǎng)絡(luò)時(shí)間,
其中在時(shí)間t時(shí)刻有一些惡意信息的節(jié)點(diǎn),無(wú)論是否擴(kuò)散到正確節(jié)點(diǎn),具有正確信息的節(jié)點(diǎn)集都會(huì)在時(shí)間(t+γ)變 為激活狀態(tài),其中γ稱為延遲時(shí)間。
圖7和圖8分別是Forum數(shù)據(jù)集在接觸激活模型與延遲激活模型下正確信息與惡意信息數(shù)量的變化圖。圖中曲線顯示,兩種模型下的傳播正確信息節(jié)點(diǎn)數(shù)量呈大幅度上升后趨于平穩(wěn)狀態(tài),而傳播惡意信息節(jié)點(diǎn)的數(shù)量在正確信息對(duì)抗之下呈下降趨勢(shì)后逐漸平穩(wěn)。
圖7 Forum網(wǎng)絡(luò)中接觸激活模型下正確信息量與惡意信息量變化
圖8 Forum網(wǎng)絡(luò)中延遲激活模型下正確信息量與惡意信息量變化
圖9是Social網(wǎng)絡(luò)數(shù)據(jù)集在接觸激活模型下正確信息與惡意信息數(shù)量的變化圖。如圖所示,惡意信息在接觸激活模型傳播到t=3時(shí)刻時(shí)擴(kuò)散到了只傳播正確信息的節(jié)點(diǎn),此時(shí)傳播正確信息的節(jié)點(diǎn)被激活并傳播信息,傳播正確信息的節(jié)點(diǎn)數(shù)量開始迅猛增加,傳播惡意信息節(jié)點(diǎn)由于競(jìng)爭(zhēng)不過(guò)傳播正確信息節(jié)點(diǎn),數(shù)量呈迅速下降趨勢(shì),最終都趨于平穩(wěn)狀態(tài)。
圖9 Social網(wǎng)絡(luò)中接觸激活模型下正確信息量與惡意信息量變化
圖10是Social網(wǎng)絡(luò)數(shù)據(jù)集在延遲激活模型下正確信息與惡意信息數(shù)量的變化圖。如圖所示,惡意信息在延遲激活模型傳播到延遲時(shí)間λ=2,傳播正確信息的節(jié)點(diǎn)集合被激活,傳播正確信息節(jié)點(diǎn)數(shù)量開始迅猛增加,使得惡意信息量在t=3出現(xiàn)拐點(diǎn)并呈下降趨勢(shì)。
圖10 Social網(wǎng)絡(luò)中延遲激活模型下正確信息量與惡意信息量變化
Forum網(wǎng)絡(luò)和Social網(wǎng)絡(luò)兩個(gè)數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,本文方案在網(wǎng)絡(luò)規(guī)模較小的數(shù)據(jù)集中,采用接觸激活模型和延遲激活模型對(duì)惡意信息遏制都能發(fā)揮重要作用,在網(wǎng)絡(luò)規(guī)模較大的數(shù)據(jù)集中兩種傳播模型都能迅速啟動(dòng)對(duì)惡意信息遏制,而且延遲激活模型下的惡意信息傳播被控制的更為有效。
在本節(jié)兩個(gè)網(wǎng)絡(luò)數(shù)據(jù)集中,本文所提方法對(duì)惡意信息遏制的效果與其他兩個(gè)方案對(duì)惡意信息遏制效果對(duì)比圖,橫坐標(biāo)是時(shí)間t的變化,縱坐標(biāo)是惡意信息數(shù)量的變化。如圖11—圖12所示,可以清楚地看到,在Forum網(wǎng)絡(luò)中,信息在接觸激活模型和延遲激活模型下,本方案對(duì)惡意信息遏制的時(shí)間比Degree[19]和PageRank快,在t=3的時(shí)候本方案就將惡意信息控制到最高數(shù)量,最終本文方案能將惡意信息數(shù)量控制得比其他兩個(gè)方案的數(shù)量都低且達(dá)到收斂。圖13和圖14分別是在Social網(wǎng)絡(luò)中,信息在接觸激活模型和延遲激活模型下,本方案與Degree和PageRank方案的惡意信息量的變化對(duì)比圖。從兩幅圖中可以看到,隨著時(shí)間的推移,惡意信息的數(shù)量呈現(xiàn)先增后減的趨勢(shì),當(dāng)t=3時(shí),本方案將惡意信息控制到最高數(shù)量,比其余兩種方案都低,且比PageRank方案中惡意信息數(shù)量少了一半。這個(gè)實(shí)驗(yàn)說(shuō)明,本文方案能夠有效快速控制移動(dòng)社會(huì)網(wǎng)絡(luò)中的惡意信息數(shù)量,且能夠使該數(shù)量達(dá)到收斂,也就意味著最終惡意信息會(huì)消失。
圖11 Forum網(wǎng)絡(luò)中接觸激活模型下惡意信息量變化對(duì)比
圖12 Forum網(wǎng)絡(luò)中延遲激活模型下惡意信息量變化對(duì)比
圖13 Social網(wǎng)絡(luò)中接觸激活模型下惡意信息量變化對(duì)比
圖14 Social網(wǎng)絡(luò)中延遲激活模型下惡意信息量變化對(duì)比
本文提出了一種基于網(wǎng)絡(luò)模體的移動(dòng)社會(huì)網(wǎng)絡(luò)信息可控傳播方法。首先,本文提出多實(shí)體的競(jìng)爭(zhēng)性獨(dú)立級(jí)聯(lián)模型,該模型首次將信息競(jìng)爭(zhēng)擴(kuò)散理論與社會(huì)網(wǎng)絡(luò)層用戶的社會(huì)屬性結(jié)合,實(shí)現(xiàn)信息的可控傳播。其次,本文定義了控制信息流模體,設(shè)計(jì)關(guān)鍵網(wǎng)絡(luò)模體在通信層的高效可控傳播算法。仿真實(shí)驗(yàn)表明本文方法不僅在信息傳播中最大感染時(shí)間和平均感染時(shí)間上更有優(yōu)勢(shì),而且在控制信息傳播方面的效果也是最好的,最終能夠?qū)崿F(xiàn)信息可控傳播。未來(lái)可以進(jìn)一步探索移動(dòng)社會(huì)網(wǎng)絡(luò)中信息傳播的基本要素與傳染病傳播特征的關(guān)系,通過(guò)研究信息傳播路徑來(lái)實(shí)現(xiàn)對(duì)信息的可控傳播。