王妞 康輝英
摘要:網(wǎng)絡(luò)輿情的復雜多變對教育網(wǎng)絡(luò)輿情監(jiān)測及應(yīng)對提出了挑戰(zhàn).本文提出了一種依賴網(wǎng)絡(luò)輿情監(jiān)測評估指標的教育考試網(wǎng)絡(luò)輿情監(jiān)控與突發(fā)事件應(yīng)急處理體系構(gòu)建方法。針對不同類型處理時不同指標,建立了教育考試質(zhì)量(Quality of Education Examination,QEE)教育考試模式(Educational Examination Model,EEM)和突發(fā)事件應(yīng)急處理效率(Emergency Response Efficiency,ERE)的網(wǎng)絡(luò)輿情監(jiān)測評估指標。本文結(jié)合網(wǎng)絡(luò)輿情特點構(gòu)建了教育網(wǎng)絡(luò)輿情監(jiān)測評估指標體系,克服了以往評價指標體系的模糊性和不可比較的缺點,增強教育網(wǎng)絡(luò)輿情事件熱度評估和監(jiān)測的準確性和客觀性,為構(gòu)建和完善我國突發(fā)事件應(yīng)急管理體系提供基礎(chǔ)和依據(jù)。
關(guān)鍵詞: 教育考試網(wǎng)絡(luò)輿情監(jiān)控;指標體;突發(fā)事件應(yīng)急處理體系
中圖分類號:TP393? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2019)18-0030-05
x評估指標體系的權(quán)重量化在數(shù)值分析、模式識別以及搜索等領(lǐng)域得到了大規(guī)模的應(yīng)用[1-2]。教育網(wǎng)絡(luò)輿情研究多集中于網(wǎng)絡(luò)輿情理論、工作機制,關(guān)于輿情評估指標體系的研究相對匱乏。所以,構(gòu)建教育考試網(wǎng)絡(luò)輿情監(jiān)控與突發(fā)事件應(yīng)急處理體系已變成目前的研究重點[3-4]。如今,大多研究學者主要的研究重點是使用不相同的特殊算法對教育考試網(wǎng)絡(luò)輿情監(jiān)控進行處理[5]。
本文選取了3個網(wǎng)絡(luò)輿情監(jiān)測評估指標,在保證初始網(wǎng)絡(luò)輿情監(jiān)控準確度一致的前提下,構(gòu)建了針對不同類型的教育考試網(wǎng)絡(luò)輿情監(jiān)控與突發(fā)事件應(yīng)急處理體系.實驗結(jié)果表明:不同類型的教育考試將會導致對教育考試網(wǎng)絡(luò)輿情監(jiān)控處理產(chǎn)生不一樣的影響,同時對于處理側(cè)重角度的不同,指標使其發(fā)生改變。本文構(gòu)建的教育考試網(wǎng)絡(luò)輿情監(jiān)控與突發(fā)事件應(yīng)急處理體系克服了以往評價指標體系的模糊性和不可比較的缺點,增強教育網(wǎng)絡(luò)輿情事件熱度評估和監(jiān)測的準確性和客觀性。
1 基于凝聚鏈算法的網(wǎng)絡(luò)輿情監(jiān)控
在對突發(fā)事件的輿論信息進行分析的過程中,每種輿論都擁有一個中心焦點,圍繞相關(guān)的中心展開相關(guān)的討論、發(fā)表對應(yīng)的評論信息,因此,基于某個中心話題的輿論信息可以用圖1的點分布進行描述。
圖1中,小圓圈代表某一個具體的輿論信息(如新聞、評論等),黑點代表輿論中心,虛線的大圓圈代表給定以某一輿論信息為參考對象,文檔相似度小于等于給定的相似度閉值為半徑所覆蓋的區(qū)域,該區(qū)域所覆蓋的點表示與該參考信息非常相似的輿論信息?;跓狳c突發(fā)事件的輿論信息都是輿論的中心話題,因此,具有熱點的輿論信息其形成過程一般為首先發(fā)表熱點信息(如圖1中的點Pn),圍繞該熱點信息進行相關(guān)的大量轉(zhuǎn)載與評論報道(如圖1中的點B2),這些輿論與該熱點信息非常相似。但在對Pn的評論中可能存在某種觀點不被人接受,因此針對B2的信息進行再次評論(如圖1中的點B1)而點B1的內(nèi)容與原始焦點Pn的內(nèi)容相差較大,因此相似程度降低,在圖1中表示為B1不在Pn的二一鄰域內(nèi)。在有關(guān)的輿論分布中,由于Pn為輿論中心,因此圍繞該中心的輿論信息量最大,對應(yīng)的二一鄰域所覆蓋的點密度也最大,而針對點B2的輿論信息的評價,信息的關(guān)注度明顯下降,因此,我們可以根據(jù)熱點輿論信息的擴散過程的逆過程進行反向搜索,針對任意一個輿論信息(如圖1中的Pl點),獲取與之相似的輿論信息,并計算其s一鄰域所覆蓋的點的輿論密度情況,得到點P2最大,說明P2極有可能是Pl的信息來源處,因此針對PZ再次進行分析。在P2的s一鄰域中,P3的點對應(yīng)密度最大,說明P3極有可能是P2的信息來源處。再次對P3進行分析,獲取P3的s一鄰域,得到P4為最大密度,再以P4為中心進行計算,得到Pn的密度最大。通過對Pn的分析過程中,發(fā)現(xiàn)其一鄰域沒有超過該點的分布密度,因此我們可以說明該點為該區(qū)域的輿論中心,搜索過程完成。
凝聚鏈算法描述如下:
(1)當前信息集合I(ti)清空;當前特征詞集合T(ti)清空;特征詞頻變化數(shù)TC(ti)清空;
(2)獲取給定站點中的網(wǎng)頁信息P;
(3)獲取該網(wǎng)頁P的更新日期,若該網(wǎng)頁P的更新時間小于上次統(tǒng)計時間,則轉(zhuǎn)(5)進行;否則執(zhí)行(4);
(4)對網(wǎng)頁P提取信息內(nèi)容,將相應(yīng)信息加入I(ti)中,并對內(nèi)容進行分詞處理,獲取網(wǎng)頁P的分詞向量,添加入當前特征詞集合T(ti)中,更新相應(yīng)分詞的頻度;
(5)獲取下一網(wǎng)頁信息,若存在轉(zhuǎn)(1)執(zhí)行,若不存在,則轉(zhuǎn)(C6)執(zhí)行;
(6)計算特征詞詞頻變化數(shù)TC(ti)= T(ti)一T(ti-1),過濾點磁盤變化數(shù)小于等于0的特征詞;
(7)對每一個文檔計算其[ε]一鄰域;獲取相應(yīng)的點密度;
(8)對信息集合I(ti)中的每一個信息文檔設(shè)置為未處理狀態(tài);
(9)獲取信息集合中下一個未處理狀態(tài)的文檔d,若不存在則轉(zhuǎn)(11);否則轉(zhuǎn)(10)執(zhí)行;
(10)將當前文檔d的狀態(tài)改為已分析,同時獲取文檔d的[ε]一鄰域,對[ε]一鄰域內(nèi)的點分別計算各自的點密度,獲得最大的點密度所對應(yīng)的文檔e,若p(e)}p(d)則標記文檔d的狀態(tài)為鏈尾,轉(zhuǎn)(9)執(zhí)行;否則,獲取文檔e作為當前分析文檔d,轉(zhuǎn)(10);
(11)獲取所有鏈尾狀態(tài)的文檔集合,過濾點密度小于給定閉值M-point的文檔,得到熱點文檔信息。
2 教育考試網(wǎng)絡(luò)輿情監(jiān)控的指標體設(shè)計
突發(fā)事件應(yīng)急處理體系憑借自身對教育考試網(wǎng)絡(luò)輿情監(jiān)控誤差的容錯特點,本文在上述分析的基礎(chǔ)上,對不同體系進行指標體分析,同時測試這種體系與其他體系之間的差異性,對教育考試網(wǎng)絡(luò)輿情監(jiān)控指標所帶來的影響。
本文定義的“指標體”代表的是相似運算下節(jié)約的資源[Esavings]和輸出誤差值[Qloss]之間的比值。
式中,求解[Qloss]的度量值應(yīng)結(jié)合實際的問題而定,比如在進行發(fā)事件應(yīng)急處理的過程中,[Qloss]一般按照相似先后順序?qū)⑹录o急的信噪比(PSNR)作為度量標準。本文研究的內(nèi)容主要是網(wǎng)絡(luò)輿情監(jiān)控階段消耗的時間。按照運算系統(tǒng)層次和耗時因素,把網(wǎng)絡(luò)輿情監(jiān)控階段的時間劃分為:
式中,[ESMS]代表教育考試網(wǎng)絡(luò)輿情監(jiān)控處理使用時間,在本文主要指的是將教育考試網(wǎng)絡(luò)輿情監(jiān)控處理方法應(yīng)用到四六級英語考試中所用的時間;[ESMA]代表教育考試網(wǎng)絡(luò)輿情監(jiān)控處理的時間。
將教育考試網(wǎng)絡(luò)輿情監(jiān)控處理的樣本[ESMS]通常是指運用到整個突發(fā)事件應(yīng)急處理體系的部分內(nèi)容。表1表示將不同部分的質(zhì)量處理置標題占據(jù)的比例。其中,使用教育考試網(wǎng)絡(luò)輿情監(jiān)控指標占據(jù)整個處理過程的比例為25%。需要注意的是每個部分處理所占用的比例根據(jù)參數(shù)變化而改變。主要的參數(shù)包括數(shù)據(jù)存儲時間、樣本規(guī)模等。本文使用的突發(fā)事件應(yīng)急處理體系主要是根據(jù)對教育考試網(wǎng)絡(luò)輿情監(jiān)控處理的結(jié)果得到的。
將教育考試網(wǎng)絡(luò)輿情監(jiān)控數(shù)據(jù)進行有效存儲是使用多元決策體系處理分析的關(guān)鍵,但是,如果增大四六級英語考試的密度,那么在相同的時間段內(nèi)將刷新四六級英語考試處理數(shù)據(jù)也將變得更多,使得刷新占據(jù)的資源也相應(yīng)增加。因此,網(wǎng)絡(luò)輿情監(jiān)控已變成提高處理突發(fā)事件應(yīng)急處理體系的有效手段。
四六級英語考試刷新次數(shù)的減少將會導致一些教育考試網(wǎng)絡(luò)輿情監(jiān)控指標數(shù)據(jù)在存儲的過程中發(fā)生丟失的現(xiàn)象。而對于分配教育考試任務(wù)的四六級英語考試,使用這種體系將會使得部分教育考試網(wǎng)絡(luò)輿情監(jiān)控指標體的數(shù)據(jù)存在較大的誤差,如同這些指標體在受到其他外界因素的干擾下引起數(shù)值發(fā)生改變。四六級英語考試次數(shù)越多,那么受到外界因素干擾的概率就會越高。
教育考試網(wǎng)絡(luò)輿情監(jiān)控處理結(jié)果如圖2所示。其中,橫坐標表示指標數(shù)據(jù)占據(jù)總體處理質(zhì)量的百分比;縱坐標表示使用多元網(wǎng)絡(luò)輿情監(jiān)控體系下教育考試網(wǎng)絡(luò)輿情監(jiān)控的準確度。根據(jù)圖可知,使用不一樣的體系,質(zhì)量指標就顯得更加突出。其中,QEE體系是網(wǎng)絡(luò)輿情監(jiān)控指標體中最為重要的指標;ERE指標是最差;EEM指標處于以上兩個體系之間.比如針對HAR數(shù)據(jù)。比如EEM指標準確度為10%;QEE的網(wǎng)絡(luò)輿情監(jiān)控準確度仍能達到90%以上,而ERE體系的網(wǎng)絡(luò)輿情監(jiān)控精度為53%左右。
值得注意的是,存在的差異程度也會影響教育考試網(wǎng)絡(luò)輿情監(jiān)控與突發(fā)事件應(yīng)急處理體系的使用,而對于網(wǎng)絡(luò)輿情監(jiān)控結(jié)果不敏感的教育考試網(wǎng)絡(luò)輿情監(jiān)控指標,使用的體系之間的指標體也比較小。例如在圖1中的Adult數(shù)據(jù)庫中,EEM、QEE以及EREH這3中體系的效果曲線變化十分相近。同樣還存在另一種特點就是在圖1(c)中的MNIST數(shù)據(jù)庫中,ERE指標明顯優(yōu)于EEM,但是其他類型的數(shù)據(jù)庫中,相似計算結(jié)果的ERE指標遠遠比EEM指標的要低很多。主要是因為教育考試網(wǎng)絡(luò)輿情監(jiān)控在對處理突發(fā)事件應(yīng)急處理體系的信息采集過程中,刪除部分處理突發(fā)事件應(yīng)急處理體系的能力。
通過數(shù)值化的方式來說明本文教育考試網(wǎng)絡(luò)輿情監(jiān)控指標差異,將上文得到的曲線變化進行擬合,運算出的斜率相應(yīng)的教育考試網(wǎng)絡(luò)輿情監(jiān)控處理敏感度使用[SMS]進行表示。[SMS]代表了單位比例指標體數(shù)據(jù)導致的教育考試網(wǎng)絡(luò)輿情監(jiān)控指標網(wǎng)絡(luò)輿情監(jiān)控精度不斷降低。如果[SMS]變小,則表明本文體系對存儲相似,那么得到的存儲處理消耗的時間也將改變。表2給出了三個不同指標在進行教育考試網(wǎng)絡(luò)輿情監(jiān)控處理相互之間的靈敏程度,由突發(fā)事件應(yīng)急處理體系可以計算出,教育考試網(wǎng)絡(luò)輿情監(jiān)控指標所占的比列每次增加1%,處理準確率將降低1.78%,QEE平均下降0.7%,教育考試網(wǎng)絡(luò)輿情監(jiān)控與突發(fā)事件應(yīng)急處理體系平均下降1.95%。
3 教育考試網(wǎng)絡(luò)輿情監(jiān)控與突發(fā)事件應(yīng)急處理體系構(gòu)建
教育考試方式與體系類型有關(guān),即在應(yīng)用突發(fā)事件應(yīng)急處理體系前,不同體系的[EMMA]和[EMCP]區(qū)別很大,使用不同體系進行對此部分進行多元決策時,應(yīng)該優(yōu)先考慮體系在近似之前進行的初始評論效果。
需要注意的是四六級英語考試方法[EMMA]的處理不可忽視。對于部分體系來講,體系中的參數(shù)個數(shù)比較多,并且在處理樣本數(shù)據(jù)較少的情況下,在對考試熱點分析進行評估所占據(jù)的比例也不多。本文重點研究了在構(gòu)建教育考試網(wǎng)絡(luò)輿情監(jiān)控與突發(fā)事件應(yīng)急處理體系時,將指標體引入其中,然后對體系進行分級指令,以實現(xiàn)對教育考試網(wǎng)絡(luò)輿情監(jiān)控。
就像前文介紹的一樣,教育考試網(wǎng)絡(luò)輿情監(jiān)控的處理([EMODEL])主要由2部分構(gòu)成:突發(fā)事件應(yīng)急處理體系下的處理[EMMA]和考試熱點分析處理[EMCP]。本文使用體系的訪問負載使用[FMMA]代表;質(zhì)量指標的負載使用[EMCP]進行表示。那么教育考試網(wǎng)絡(luò)輿情監(jiān)控與突發(fā)事件應(yīng)急處理體系可用以下公式表示:
4 實驗與結(jié)果分析
本實驗以2018年5月1日-2018年10月1日的新聞為例,對四六級網(wǎng)絡(luò)輿情評估指標進行分析。為了對數(shù)據(jù)庫中的網(wǎng)頁新聞集合特點進行分析,統(tǒng)計在某時間區(qū)間內(nèi)出現(xiàn)的四六級新聞主題報道數(shù)量,可以更清晰地看到公眾或媒體對于該主題的關(guān)注度變化情況。例如,以“四六級考試考試時間”“四六級考試考試報名”“四六級考試作弊” “四六級考試考試成績查詢”為主題的新聞呈現(xiàn)的分別為單峰型、梯形形式,說明在此期間該事件可能激化了新的矛盾;之后新聞數(shù)量逐漸減少,意味著人們對該事件關(guān)注度下降。
在對熱點整體發(fā)展情況進行預(yù)判之后,采用先整體后局部的分析方法進行分處理。為了提高分析效率,在中文分詞之前將每條記錄中的content內(nèi)容導出數(shù)據(jù)庫,用Jieba技術(shù)進行分詞并將結(jié)果寫入txt文本中。如表4所示,獲得每篇新聞分詞結(jié)果后,需要對出現(xiàn)的詞語進行權(quán)值計算(見表5),并建立向量矩陣。根據(jù)上述分析可知,使用上文中的3種體系進行的教育考試網(wǎng)絡(luò)輿情監(jiān)控處理以及評估計算公式,分別在4個不一樣的數(shù)據(jù)庫中進行多元決策分析,分析結(jié)果如表6所示。因為參數(shù)的設(shè)定以及教育考試網(wǎng)絡(luò)輿情監(jiān)控與突發(fā)事件應(yīng)急處理體系的構(gòu)建,能夠獲得對此3種指標進行網(wǎng)絡(luò)輿情監(jiān)控處理,如圖4所示,圖4(a)為多元決策分析結(jié)果;圖4(b)(C)依次表示四六級英語考試方式處理和考試熱點分析評估結(jié)果,圖4(d)表示四六級英語考試模式處理與考試熱點分析之間存在的差異度。
針對教育考試方式目處理[EMMA]和考試熱點分析處理[EMCP],體系指標體的差別一般對處理結(jié)果影響很小,處理體系的確定主要是依據(jù)處理體系最初的處理差異。由圖4(a)可知,不同處理突發(fā)事件應(yīng)急處理體系最初處理的差異比較大,EEM指標因為教育考試網(wǎng)絡(luò)輿情監(jiān)控處理以及處理運算都是與支持向量總數(shù)呈正比關(guān)系,但是在一些計算量比較大的應(yīng)用中,數(shù)據(jù)通常很多。所以,對多元決策分析要求標膠高。QEE指標因為存在許多節(jié)點,導致體系參數(shù)數(shù)據(jù)增加,訪存處理的要求也變得很高。差不多和EEM指標下的質(zhì)量指標處理一樣,。但是ERE置標題下因為體系參數(shù)數(shù)據(jù)和突發(fā)事件應(yīng)急處理體系都很少,多元決策分析在此3種指標下處理準確度相對比較低,與平均分裂處理相比,EEM指標體下的質(zhì)量指標準確率是ERE指標體處理的29倍,QEE的平均網(wǎng)絡(luò)輿情監(jiān)控處理是ERE的11倍。所以,通過此種初始處理差異性很大,表明突發(fā)事件應(yīng)急處理體系對質(zhì)量處理突發(fā)事件應(yīng)急處理體系影響很大。
不同教育考試方式處理和考試熱點分析處理的比例有明顯的差異.通過圖4(b)和圖4(c)可以發(fā)現(xiàn),EEM的教育考試方式處理和考試熱點分析處理是屬于相同級別,主要是由于在EEM指標下的教育考試網(wǎng)絡(luò)輿情監(jiān)控處理以及處理運算都是與支持向量的總數(shù)呈正比,所以這兩類的差異不大;QEE指標下將突發(fā)事件應(yīng)急處理體系引入到教育考試質(zhì)量處理中效率很快,但是對于考試熱點分析的處理比較低,主要是由于QEE指標下樣本節(jié)點數(shù)太多,所以使得教育考試網(wǎng)絡(luò)輿情監(jiān)控的處理與節(jié)點之間呈正比關(guān)系。所以,對于考試熱點分析的處理要小于教育考試質(zhì)量的處理。
5 總結(jié)
突發(fā)事件應(yīng)急處理體系的指標差異對教育考試網(wǎng)絡(luò)輿情監(jiān)控與突發(fā)事件應(yīng)急處理體系問題有著重要的影響,本文通過利用3種教育考試網(wǎng)絡(luò)輿情監(jiān)控與突發(fā)事件應(yīng)急處理體系,構(gòu)建的教育考試網(wǎng)絡(luò)輿情監(jiān)控與突發(fā)事件應(yīng)急處理體系,以實現(xiàn)對教育考試中緊急事件的準確處理。通過實驗結(jié)果可知:將評估指標體應(yīng)用到教育考試網(wǎng)絡(luò)輿情監(jiān)控與突發(fā)事件應(yīng)急處理體系的構(gòu)建中,對提高四六級英語教育考試質(zhì)量具有積極作用,同時,可以針對不同的考試進行不同類型的處理,在處理突發(fā)事件應(yīng)急處理體系的結(jié)構(gòu)上也具有很大優(yōu)勢。
參考文獻:
[1] Noori R, Karbassi A R, Ashrafi K, et al . Development and application of reduced‐order neural network model based on proper orthogonal decomposition for bod5 monitoring: active and online prediction. Environmental Progress & Sustainable Energy, 2013, 32(1):120-127.
[2] Tolonen H, Koponen P, Mindell J, et al. European health examination survey--towards a sustainable monitoring system. The European Journal of Public Health, 2014,24(2):338-344.
[3] Mahawar K K, Parmar C, Graham Y , et al. Monitoring of liver function tests after roux-en-y gastric bypass: an examination of evidence base. Obesity Surgery, 2016, 26(10):2516-2522.
[4] Thoe W, Lee O H K, Leung K F, , et al. Twenty five years of beach monitoring in hong kong: a re-examination of the beach water quality classification scheme from a comparative and global perspective. Marine Pollution Bulletin, 2018(131):793-803.
【通聯(lián)編輯:唐一東】