楊 浩,向 征
(1. 湖南信息學院計算機科學與工程學院,湖南 長沙 410151;2. 湖南大學物理系,湖南 長沙 410000)
自組織網(wǎng)絡是移動計算機網(wǎng)絡中的一種[1],突發(fā)性輿情就是在移動計算機網(wǎng)絡中通過電腦等工具,對即將要發(fā)生和已經(jīng)發(fā)生的事件進行主觀評論[2]。目前網(wǎng)絡上出現(xiàn)很多網(wǎng)民對不了解的事情發(fā)表個人觀點,導致言語上對事件當事人產(chǎn)生很多負面影響,破壞網(wǎng)絡大環(huán)境秩序性。因此,對輿論的實時監(jiān)測意義重大[3]。
針對此問題,目前相關領域專家也得到了較好的研究成果。例如:王會權等人[4]提出基于大數(shù)據(jù)思維的突發(fā)性輿情交互信息監(jiān)控方法。該方法在分析大數(shù)據(jù)與網(wǎng)絡輿情適用性的基礎上綜合了大數(shù)據(jù)思維,建立網(wǎng)絡輿情監(jiān)控模型,將網(wǎng)絡輿情的監(jiān)控工作分為數(shù)據(jù)采集、數(shù)據(jù)處理和數(shù)據(jù)分析三部分,并通過大數(shù)據(jù)技術對網(wǎng)絡輿情實施監(jiān)控并解決即將面臨的問題,進而實現(xiàn)突發(fā)性輿情交互信息監(jiān)控。但是該方法不具有實時性,無法提前獲取輿情可能發(fā)生的聚集區(qū)域,導致監(jiān)控過程難度較大,監(jiān)控時延較長,降低了輿情監(jiān)控效率。羅凌璐等人[5]提出智能過程層網(wǎng)絡突發(fā)性輿情交互信息監(jiān)控方法。該方法將過程層交換機作為過程層網(wǎng)絡運行狀態(tài)的數(shù)據(jù)采集和監(jiān)控單元,基于網(wǎng)絡分析儀通過動態(tài)學習過程層網(wǎng)絡拓撲、建立鏈路映射關系和流量統(tǒng)計列表,實時監(jiān)控網(wǎng)絡突發(fā)性輿論,以此實現(xiàn)突發(fā)性交互信息的監(jiān)控,該方法沒有利用交互空間掃描變量和概率分布模型運算出最有可能出現(xiàn)輿情的空間窗口及其概率再進行控制輿情,因此該方法只能根據(jù)網(wǎng)絡之間的關系實時監(jiān)控輿情發(fā)展,無法提前得知輿情最有可能出現(xiàn)的地理區(qū)域,導致輿情監(jiān)控率偏低。周昊飛等人[6]提出基于深度置信網(wǎng)絡的突發(fā)性輿情交互信息監(jiān)控方法。該方法利用灰度圖建立突發(fā)性輿論圖譜,精準表達出輿情走向,并建立用于識別輿情過程的深度置信網(wǎng)絡模型,在深度置信網(wǎng)絡模型的基礎上識別目前監(jiān)控窗口內的突發(fā)性輿論,實現(xiàn)突發(fā)性輿情交互信息的監(jiān)控。該方法在監(jiān)控突發(fā)性輿情過程中,忽略了對交互空間掃描統(tǒng)計量的分析,無法判斷監(jiān)控的輿情是否屬于隨機發(fā)生的,因此不能保證預測輿情聚集區(qū)域的真實性,降低了輿情預測率。
為解決上述傳統(tǒng)方法存在的問題,提出新的自組織網(wǎng)絡突發(fā)性輿情交互信息監(jiān)控方法。
監(jiān)測自組織網(wǎng)絡突發(fā)性輿情的過程就是利用掃描統(tǒng)計思想對自組織網(wǎng)絡進行數(shù)據(jù)掃描,獲取網(wǎng)絡用戶信息及網(wǎng)絡信息[7],最終確定出輿論聚集概率最大的窗口,實現(xiàn)突發(fā)性輿論監(jiān)測。
假設交互空間掃描范圍S內的網(wǎng)絡項信息和用戶信息分別為Me及Mr,假設交互空間掃描范圍S內特定用戶閾值?的用戶數(shù)量小于Mr用戶信息量Rif數(shù)量,從而實現(xiàn)在不同區(qū)域和環(huán)境下對不同影響力用戶的實時輿情監(jiān)測,并獲取到不同類別的輿情聚集窗口,則用戶信息Mr的表達式為
Mr=Count(Rif>?|S)=∑((ri2+ri1+ri3)>?)
(1)
假設交互空間掃描范圍S中特定閾值β的網(wǎng)絡項個數(shù)小于掃描變量Me網(wǎng)絡信息量Ejf數(shù)量,則網(wǎng)絡項信息Me的表達式為
Me=Count(Eif>β|S)=∑((ej2+ei1+ei3)>β)
(2)
式中,β為網(wǎng)絡信息閾值。
經(jīng)統(tǒng)計發(fā)現(xiàn),網(wǎng)絡中的數(shù)據(jù)具有隨機性且都為離散型數(shù)據(jù),所以可利用泊松分布模型進行計算,因此當S的大小可隨意定義且S≥0時,Me需要遵從參數(shù)λ3>0泊松分布,即得出Me(s)…Poisson(λ3),則概率分布模型表達式為
P{X(x+S)-X(x)=n}=e-λs(λS)0/n!
(3)
式中,X(x+S)-X(x)表示在[x,S+x]區(qū)間內的自組織網(wǎng)絡用戶個數(shù)或者網(wǎng)絡項個數(shù),其中n=0,1,2,…。
為更加精確監(jiān)測不同空間區(qū)域的突發(fā)性輿論,分別分析實際地理空間區(qū)域內的交互空間掃描窗口和基于空間關系獲取的對應交互空間掃描窗口。
建立網(wǎng)絡空間現(xiàn)象及輿論目標之間的關系模型,并將其稱之為空間關系[8],首先建立自組織網(wǎng)絡空間的鄰接關系矩陣,得出不同地理區(qū)域間的關系,其構建過程為:
(4)
式中,W代表n個基本單元的空間區(qū)域的臨近關系,Wij代表掃描基本單元的實際地理區(qū)域i及j的鄰接關系,若Wij等于1,且區(qū)域i與區(qū)域j為鄰近區(qū)域,若Wij等于0,則區(qū)域i與區(qū)域j不相鄰。
獲取到大量交互空間掃描窗口后,運算出每個窗口的掃描統(tǒng)計量,并求解出每個窗口的對數(shù)似然比,以此辨別出不同地理空間區(qū)域內突發(fā)性輿情的聚集性[9],其求解經(jīng)過為:
假設某個交互空間掃描窗口S中的輿情都屬于MIe類別的概率是p∈[0,1],在所有交互空間掃描窗口G中,除S外的其它輿情屬于MIe類別的概率是q∈[0,1],MIe類別指的是在某個交互空間掃描窗口S中的輿情符合閾值α的單個輿情。此時,若空假設為H0,S仍屬于G,但p=q,則假設為H1,S仍屬于G,但p>q。
則在空假設下關于泊松模型的μ(S)和μ(G)的表達式為
(5)
式中,Ks表示掃描窗口S中已發(fā)表的所有文章個數(shù),KG表示所有掃描窗口G中已發(fā)布的所有文章個數(shù),μ(S)表示掃描窗口S中預估出的MIe輿情個數(shù),μ(G)表示所有掃描窗口G中預估出的所有輿情個數(shù)。
(6)
當H0無效時,其似然比函數(shù)表達式為
(7)
(8)
根據(jù)LR表達式,求解出LR的對數(shù)似然比為
(9)
因此,可得出掃描窗口S的最大似然比為maxLLR=maxlg(L(S)/L0),對G中的每個掃描窗口進行上述運算即可得出每個窗口的似然比,并求解出所有似然比中最大的對數(shù)似然比,即求出最大概率發(fā)生突發(fā)性輿情的聚集空間區(qū)域[10]。
若LLR的順序越靠前,說明聚集區(qū)域的隨機性越小,否則反之。
令輿情聚集區(qū)域的顯著性水平α為0.01,則最終p值小于0.01就認為此輿情不是隨機性的,并根據(jù)LLR值排列符合α=0.01的交互空間掃描窗口,即可判別出最有可能成為突發(fā)性輿情聚集的空間窗口,進而監(jiān)測出最有可能發(fā)生突發(fā)性輿情爆發(fā)區(qū)域。
假設輿情擴散測度值為R0,R0值的大小直接體現(xiàn)出自組織網(wǎng)絡中突發(fā)性輿情的擴散程度,R0中含有兩個關鍵因素分別是參數(shù)a1和參數(shù)a2,令參數(shù)a1和參數(shù)a2是關于時間t的函數(shù),則函數(shù)分別為a1(t)和a2(t),其函數(shù)的意義分別是突發(fā)性輿情擴散到時間t時,采取措施控制輿情發(fā)展而生成的控制變量,以此遏制輿情發(fā)展,降低輿情擴散率,及突發(fā)性輿情擴散到時間t時采取措施控制輿情發(fā)展而生成的控制變量,以此感動網(wǎng)民進行情感召喚,提高輿情散播者的“喚醒率”[12]。若函數(shù)ai(t)屬于區(qū)間[0,1],則此時的函數(shù)ai(t)就是可測函數(shù),其中i=1,2。
則突發(fā)性輿情的最優(yōu)控制模型的表達式為
(10)
求解最優(yōu)控制輿情模型的最終目的是最大效率地降低輿情帶來的負面影響。將正能量的社會效應開發(fā)到最大化,因此將輿情擴散者Sh(t)、St(t)和疑惑者H(t)的數(shù)值設置為最小,將沒有參與散播輿情的人員I(t)數(shù)量設置為最大,并將運行成本控制在最低,則此時的函數(shù)ai(t)為可測函數(shù),因此得出輿情目標函數(shù)G(a1,a2)的表達式為
(11)
(12)
其中,Γ={(a1,a2)∈L1(t0,tf)|1≥ai≥0,i=1,2}表示控制約束集合,ai(i=1,2)表示可測變量。
將突發(fā)性輿情監(jiān)測聚集區(qū)域和最優(yōu)控制輿情模型相結合即可實現(xiàn)突發(fā)性輿情交互信息的監(jiān)控。
為驗證所提方法的整體有效性,需要對自組織網(wǎng)絡突發(fā)性輿情交互信息監(jiān)控方法、文獻[4]方法和文獻[5]方法進行輿情監(jiān)控效率、輿情監(jiān)控率測試,實驗環(huán)境如表1所示。
表1 實驗環(huán)境
分析圖1可知,經(jīng)過在不同地理區(qū)域和不同人數(shù)下的多次試驗發(fā)現(xiàn),所提方法的突發(fā)性輿情監(jiān)控用時一直低于5天,而文獻[4]方法和文獻[5]方法監(jiān)控輿情所用時間都高于6天,尤其是文獻[5]方法,其所用時間最高趨近于8天,因為所提方法在監(jiān)控突發(fā)性輿情前對輿情進行輿情聚集區(qū)域的實時監(jiān)測,因此可獲取到輿情聚集區(qū)域,使得監(jiān)控更加簡單容易,以此減少監(jiān)控時間,提高輿情監(jiān)控效率。
圖1 不同方法的監(jiān)控效率
選取2020年任意五天中的輿情進行監(jiān)控,經(jīng)實驗后得知,所提方法監(jiān)測并控制住的輿情傳播者和疑似傳播者達到實際傳播用戶的80%,其它兩種方法的監(jiān)控率均不足80%,因為所提方法利用交互空間掃描變量和概率分布模型求出最有可能出現(xiàn)輿情的空間窗口及其概率再進行控制輿情,從而提前得知輿情最有可能出現(xiàn)的地理區(qū)域,因此提高了所提方法的監(jiān)控率。
圖2 不同方法的監(jiān)控率
針對當前方法的不足,提出自組織網(wǎng)絡突發(fā)性輿情交互信息監(jiān)控方法。該方法首先對自組織網(wǎng)絡中的輿情進行監(jiān)測以此獲取輿情聚集區(qū)域,再通過求解輿情最優(yōu)控制模型和其目標函數(shù)控制輿情發(fā)展,以此實現(xiàn)突發(fā)性輿情交互信息的監(jiān)控。經(jīng)實驗表明,所提方法效率高、監(jiān)控率高。為今后的網(wǎng)絡環(huán)境提供了保障。