王珍
摘要:分析了網(wǎng)絡(luò)輿情監(jiān)測的背景以及現(xiàn)狀,從網(wǎng)絡(luò)輿情監(jiān)測技術(shù)的基本概述、輿情監(jiān)測的基本實現(xiàn)、網(wǎng)絡(luò)監(jiān)控技術(shù)手段等方面回顧了近年來網(wǎng)絡(luò)輿情監(jiān)測技術(shù)的發(fā)展。系統(tǒng)的探索了網(wǎng)絡(luò)輿情監(jiān)測的技術(shù)類型,并對網(wǎng)絡(luò)輿情監(jiān)測技術(shù)提出了一些指導(dǎo)性意見。
關(guān)鍵詞:網(wǎng)絡(luò)輿情;輿情監(jiān)測;技術(shù)
中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2015)24-0024-02
近年來,Web技術(shù)和web終端發(fā)展迅猛,人們越來越多的利用互聯(lián)網(wǎng)表達(dá)自己的訴求,通過互聯(lián)網(wǎng)表達(dá)出來的態(tài)度、情緒、意見與要求集合起來形成的網(wǎng)絡(luò)輿情成為社情民意的體現(xiàn)。高校師生作為一個特定的群體,既有一般網(wǎng)民所關(guān)注的熱點(diǎn)、焦點(diǎn)和敏感問題,又有這個特定知識層面的群體所關(guān)注的特殊問題,比如各高校的百度貼吧、論壇以及各大媒體正面或負(fù)面的網(wǎng)絡(luò)輿情在一定程度上反映出校園文化的健康度。高校輿情是高校師生在社會政治態(tài)度的收集、整理、分析、報送、利用和反饋的信息運(yùn)動過程中,用以客觀反映輿情狀態(tài)及其運(yùn)動情況的消息、情報、指令等各種意見的總和[1]。這些輿情反映出廣大師生關(guān)注的熱點(diǎn)、焦點(diǎn)話題,對這些輿情特別是負(fù)面的輿情進(jìn)行研判和深入剖析有助于掌握師生的思想動態(tài),把握問題的實質(zhì),提早開展思想政治教育工作,及時化解、實現(xiàn)對高校網(wǎng)絡(luò)輿情的引導(dǎo)和控制,維護(hù)高校的和諧穩(wěn)定發(fā)展,是構(gòu)建社會主義和諧校園迫切需要解決的問題[2]。在這樣的背景下,如何加強(qiáng)高校網(wǎng)絡(luò)輿情監(jiān)測技術(shù)及處置研究,對網(wǎng)上言論進(jìn)行有效及時的監(jiān)測,快速定位不良信息的源頭顯得尤為重要。文章介紹了幾種監(jiān)測手段。
1網(wǎng)絡(luò)監(jiān)測技術(shù)的背景及現(xiàn)狀
1.1網(wǎng)絡(luò)輿情監(jiān)測技術(shù)基本概述
互聯(lián)網(wǎng)及新媒體技術(shù)已經(jīng)成為搜集民意、反饋政府部門、企事業(yè)單位工作成效的一個有效的渠道。但是由于缺乏對互聯(lián)網(wǎng)輿情信息等行為的必要監(jiān)控,在輿情危機(jī)事件發(fā)生后,很難及時有效的獲取高質(zhì)量、深層次的網(wǎng)絡(luò)輿情信息,造成輿情危機(jī)事件處置工作的被動。
在這種背景下,網(wǎng)絡(luò)輿情監(jiān)測及分析行業(yè)為了適應(yīng)信息時代輿情監(jiān)測和服務(wù)逐漸發(fā)展起來。它主要專注于通過海量信息采集、自然語言處理、挖掘數(shù)據(jù)、分析智能語義,機(jī)器學(xué)習(xí)等技術(shù),不間斷地監(jiān)控網(wǎng)站、論壇、貼吧、平面媒體、博客、微博、微信等新媒體,準(zhǔn)確、全面、及時地了解并掌握網(wǎng)絡(luò)動向和大量的信息,從浩瀚的數(shù)據(jù)海洋中發(fā)掘出事件的動向、掌握公眾態(tài)度情緒、歸納輿論觀點(diǎn)傾向、結(jié)合類似事件預(yù)測事件發(fā)展趨勢并提出應(yīng)對建議。
1.2輿情監(jiān)測的實現(xiàn)
整個輿情監(jiān)測的基礎(chǔ)是數(shù)據(jù)的采集加工,掌握數(shù)據(jù)抓取能力,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”是輿情監(jiān)測分析的基礎(chǔ)。對于采集監(jiān)測到的信息,輿情監(jiān)測技術(shù)可以自動加工分類,以負(fù)面輿情,與我相關(guān),我的關(guān)注,專題跟蹤等欄目分類呈現(xiàn),用戶可以直奔主題,最快找到自己需要的信息。
輿情監(jiān)測的目標(biāo)是對趨勢的研判。在信息爆炸時代人們要不斷增強(qiáng)關(guān)聯(lián)輿情信息的預(yù)測和分析,把監(jiān)測的重點(diǎn)從搜集有效數(shù)據(jù)向?qū)浨榈纳钊胙信醒由臁]浨楸O(jiān)測技術(shù)可以實現(xiàn)對監(jiān)測到的負(fù)面信息進(jìn)行專題重點(diǎn)跟蹤監(jiān)測,監(jiān)測人員可以對系統(tǒng)自動識別分類后的信息進(jìn)行分類和挑選,并可以輕松導(dǎo)出含有分析數(shù)據(jù)圖表的輿情日報周報,減輕輿情數(shù)據(jù)分析,統(tǒng)計作圖的繁雜度。
2 網(wǎng)絡(luò)監(jiān)控技術(shù)手段
2.1人工監(jiān)測法
人工監(jiān)測法是通過人工瀏覽查閱各大媒體網(wǎng)頁、論壇、貼吧等了解輿情的一種手段。這種手段需要投入人力資源查閱海量的信息。這種監(jiān)測方式的特點(diǎn)是所反饋的內(nèi)容全面,信息查閱精準(zhǔn)、輿情可靠性強(qiáng)。利用人工查閱網(wǎng)頁,可以較為細(xì)致、全面地反映網(wǎng)上輿情的真實狀態(tài),包括話語表達(dá)、情緒表達(dá)等。而這些信息內(nèi)容是機(jī)器系統(tǒng)無法取代的。人工監(jiān)測查閱網(wǎng)頁是通過逐個閱讀分析網(wǎng)頁信息,對所設(shè)定的目標(biāo)信息進(jìn)行抓取,對其呈現(xiàn)方式、參與人群、言辭激烈程度等同時納入信息的采集,因而可靠性較高。人工查閱網(wǎng)上輿情信息的內(nèi)容反映周詳。可以較為細(xì)致、完整地反映網(wǎng)上輿情的真實狀態(tài),包括人的情緒、話語表達(dá)、、共鳴強(qiáng)度、響應(yīng)人群等。機(jī)器系統(tǒng)是無法將這些內(nèi)容顯現(xiàn)的。對網(wǎng)頁的人工直接查閱是網(wǎng)絡(luò)輿情研判的最基本方法,它能有效識別目標(biāo)信息,為輿情分析提供第一手的數(shù)據(jù)。采用人工監(jiān)測方法對網(wǎng)頁信息的直接查閱還可以減少機(jī)器系統(tǒng)加工信息帶來的偏差。
2.2利用搜索引擎的監(jiān)控系統(tǒng)
根據(jù)目標(biāo)輿情信息的話語特征利用關(guān)鍵詞搜索,將核心詞語設(shè)為關(guān)鍵詞,運(yùn)用網(wǎng)絡(luò)搜索引擎,通過人工方式或系統(tǒng),進(jìn)行輿情信息搜集。這種監(jiān)測手段比人工瀏覽法的效率高。搜索引擎是依據(jù)一定的策略,運(yùn)用相關(guān)程序從互聯(lián)網(wǎng)上搜集信息,信息在經(jīng)過組織和處理后,可以向用戶提供檢索服務(wù)[3]。現(xiàn)代大規(guī)模高質(zhì)量搜索引擎采用三步式工作流程:搜索—預(yù)處理—服務(wù)。搜索是從給定的起始URL集合S開始,按照網(wǎng)頁中的鏈接,依據(jù)某種策略遍歷,從S中移除URL,下載相應(yīng)的網(wǎng)頁, 將URL從網(wǎng)頁中解析出,看是否被訪問過,將沒有訪問過的那些URL放置到集合S抓取直到S為空。預(yù)處理時提取關(guān)鍵字,是去除HTML頁面上與所需查找內(nèi)容無關(guān)的信息,然后從網(wǎng)頁源文件中提取出可以代表它的內(nèi)容的一些特征,也就是內(nèi)容部分所含的關(guān)鍵詞。對鏈接進(jìn)行分析,我們可利用HTML標(biāo)簽的隱含信息獲取有價值的內(nèi)容,同時HTML文檔內(nèi)指向其他文檔的鏈接信息給出了網(wǎng)頁間的關(guān)系,對判斷頁面內(nèi)容也有一定的作用。服務(wù)子系統(tǒng)的功能主要有三個模塊:包括查詢方式的匹配、對結(jié)果進(jìn)行排序、文檔的摘要等。大多數(shù)簡單地搜索引擎查詢方式是按照用戶輸入的詞或者短語,檢索含有相關(guān)內(nèi)容的網(wǎng)頁,并將結(jié)果加以排序。
2.3采用文本挖掘及信息處理技術(shù)的網(wǎng)絡(luò)監(jiān)測系統(tǒng)
對于網(wǎng)絡(luò)輿情信息的發(fā)現(xiàn)、熱點(diǎn)信息跟蹤處理等方面的關(guān)鍵技術(shù)的研究包含兩個方面內(nèi)容:一是基于自然語言處理技術(shù);二是從數(shù)據(jù)采集方面考慮輿情信息的發(fā)現(xiàn).輿情信息采集是指對Web網(wǎng)頁抓取和相關(guān)數(shù)據(jù)的存儲,系統(tǒng)將對該網(wǎng)絡(luò)資源運(yùn)用網(wǎng)絡(luò)爬行器(Crawler)、網(wǎng)絡(luò)蜘蛛等技術(shù)手段進(jìn)行信息獲取,將信息保存到數(shù)據(jù)庫中,為接下來的信息預(yù)處理準(zhǔn)備[4],同時,為了提高效率,系統(tǒng)可以制作多個信息采集器多線程的獲取網(wǎng)頁信息并存儲網(wǎng)頁的源碼。由于網(wǎng)頁中包含了大量的其他信息,比如導(dǎo)航鏈接、廣告鏈接等.與傳統(tǒng)的數(shù)據(jù)庫中結(jié)構(gòu)化的數(shù)據(jù)相比,Web文檔中的數(shù)據(jù)結(jié)構(gòu)復(fù)雜[5],計算機(jī)要直接對獲得的數(shù)據(jù)進(jìn)行處理有較大的難度。所以要對信息進(jìn)行預(yù)處理。這部分要做的工作就是對特征進(jìn)行提取,就是從噪音數(shù)據(jù)中把有用的信息提取出來同時需要減少數(shù)據(jù)的維數(shù),通過計算這些特征詞的文本頻數(shù)和文檔頻數(shù)來計算出權(quán)重,根據(jù)各個特征詞的權(quán)重,對這些一級特征詞進(jìn)排列成順序.確定一個閾值K 把文本的核心特征詞選為K個權(quán)重較大的特征詞。文本頻數(shù)是特征詞在文本中的頻數(shù),在訓(xùn)練庫中,至少出現(xiàn)一次的文檔數(shù)目即使文檔頻數(shù)。
在輿情分析過程中,利用聚類和文本分類等方法對預(yù)處理后的輿情素材信息進(jìn)行挖掘、分析,可以實現(xiàn)用戶對輿情信息的跟蹤。預(yù)處理之后的文本被歸入不同的話題,將文檔進(jìn)行聚類,從一組文檔集中發(fā)現(xiàn)新熱點(diǎn),并在需要的時候建立話題。輿情的反饋是通過圖表等方式將分析后的結(jié)果反映給用戶,輿情展示包括話題敏感性話題變化顯示、熱點(diǎn)排序顯示等.并可以顯示出輿情在網(wǎng)站中的變化趨勢。
2.4 量化方法在網(wǎng)絡(luò)輿情監(jiān)測中的運(yùn)用
網(wǎng)絡(luò)輿情量化法是網(wǎng)絡(luò)輿情研究中涉及的具體數(shù)理化模型、方法以及技術(shù),并且研究中存在相關(guān)數(shù)據(jù)匯集、統(tǒng)計與分析。為了確保方法和模型的實現(xiàn),需要使用特定的軟件。
在量化研究中,模型的構(gòu)建比較重要,模型可分為理論模型與數(shù)理模型,自建模型與移植模型、有統(tǒng)計顯示,網(wǎng)絡(luò)輿情的量化研究主要以自建型模型為主。
網(wǎng)絡(luò)輿情中的自建模型在輿情的識別與研判方面有主題詞的識別、情感傾向分析、偽輿情識別等模型;在監(jiān)測與預(yù)警方面有熱點(diǎn)評價、監(jiān)測、預(yù)警等模型;在傳播與演變階段有信息傳播、群體極化等模型;在輿情應(yīng)對方面有影響力評價、最優(yōu)監(jiān)控等模型。近年來,網(wǎng)絡(luò)輿情量化研究已經(jīng)形成了一些較為成熟的方法。在輿情識別與分析方面有支持向量機(jī)(SUM)等分類算法、K-均值算法等,情感分析以及語意分析法等;在輿情傳播方面有層次分析法、BA無標(biāo)度網(wǎng)絡(luò)法、社會網(wǎng)絡(luò)分析、博奕論等方法[6]。在輿情監(jiān)測與預(yù)警方面有層次分析法、模糊綜合評價方法以及BP神經(jīng)網(wǎng)絡(luò)法等。在輿情應(yīng)對方面,有德爾菲法、層次分析法、博奕分析法等方法。近年來,一些研究機(jī)構(gòu)已經(jīng)能夠很好地掌握相關(guān)技術(shù)及方法的運(yùn)用,網(wǎng)絡(luò)輿情的量化研究也有所發(fā)展。
3 結(jié)束語
網(wǎng)絡(luò)輿情具有兩面性,既有積極的一面,也有消極的一面。對網(wǎng)絡(luò)輿情要做到有效管理和引導(dǎo),注重“線上與線下”,“虛擬和現(xiàn)實”相互結(jié)合的原則[7],進(jìn)一步提升整個互聯(lián)網(wǎng)文化品味的建設(shè),加強(qiáng)網(wǎng)絡(luò)輿情的監(jiān)控,正確引導(dǎo)良好的網(wǎng)絡(luò)文化。營造積極向上的,健康活躍的校園網(wǎng)絡(luò)輿情文化氛圍。
參考文獻(xiàn):
[1] 陳純柱,敖永春.網(wǎng)絡(luò)環(huán)境下高校輿情的傳播及引導(dǎo)機(jī)制研究[J]. 重慶大學(xué)學(xué)報(社會科學(xué)版),2011(2): 154-159.
[2] 劉瑾. 高校網(wǎng)絡(luò)輿情分析[J]. 西安郵電學(xué)院學(xué)報, 2012(7): 85-88.
[3] 葉昭暉,曾瓊,李強(qiáng). 基于搜索引擎的網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)設(shè)計與實現(xiàn)[J]. 廣西大學(xué)學(xué)報(自然科學(xué)版), 2011(10): 302-307.
[4] 黃美璇. 基于聚類分析的網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)的設(shè)計[J]. 寶雞文理學(xué)院學(xué)報(自然科學(xué)版), 2011(10): 40-44.
[5] 何佳,周長勝,石顯鋒.網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)的實現(xiàn)方法[J]. 鄭州大學(xué)學(xué)報(理學(xué)版), 2010(3): 82-85.
[6] 方付建.網(wǎng)絡(luò)輿情研究中量化方法應(yīng)用態(tài)勢分析[J]. 情報雜志,2014(10):47-50.
[7] 徐琦. 高校校園網(wǎng)絡(luò)輿情監(jiān)控與引導(dǎo)研究—以陜西師范大學(xué)為例[J]. 中國教育信息化, 2013(19): 36-39.