黃燁
摘 要:隨著大數(shù)據(jù)時(shí)代的到來(lái),網(wǎng)絡(luò)輿情的力量不容小覷。高校作為網(wǎng)絡(luò)輿情的聚集地,由于其主體的特殊性,容易引起輿情的聚集和爆發(fā)。所以做好高校網(wǎng)絡(luò)輿情監(jiān)測(cè),防范輿情危機(jī)的發(fā)生,可以有效保障校園網(wǎng)絡(luò)信息安全,促進(jìn)高校和諧穩(wěn)定發(fā)展。
隨著互聯(lián)網(wǎng)的發(fā)展,大眾喜歡在網(wǎng)絡(luò)中發(fā)表個(gè)人意見(jiàn),意見(jiàn)一旦聚集形成龐大的輿論就容易導(dǎo)致輿情爆發(fā)。網(wǎng)絡(luò)輿情的力量不容小覷,現(xiàn)代互聯(lián)網(wǎng)發(fā)展迅速,互聯(lián)網(wǎng)上時(shí)刻充斥著各種各樣的信息,稍有不慎,可能一件小事也會(huì)愈演愈烈,給互聯(lián)網(wǎng)帶來(lái)形形色色的風(fēng)險(xiǎn)。例如今年網(wǎng)上爆發(fā)的“肖戰(zhàn)227”事件,本來(lái)是肖戰(zhàn)粉絲之間的摩擦,卻愈演愈烈,如同滾雪球一樣,造成影響巨大的網(wǎng)絡(luò)輿情。肖戰(zhàn)本人也因此受到很大的牽連,個(gè)人形象和資源都大受影響?!靶?zhàn)227”事件證明網(wǎng)絡(luò)輿情影響不可忽視,良好的輿情分析管理和監(jiān)控能力必不可少。
1高校網(wǎng)絡(luò)輿情現(xiàn)狀
高校是網(wǎng)絡(luò)輿情的聚集地。大學(xué)生是一個(gè)特殊群體,他們年輕,有朝氣,具有較高的知識(shí)水平和較強(qiáng)的認(rèn)知探索能力,接受新生事物能力強(qiáng),敢于并且善于表達(dá)個(gè)人觀點(diǎn)、熱衷于參與輿情討論,容易對(duì)一件事情產(chǎn)生共鳴。在大學(xué)生當(dāng)中,可能因?yàn)闆](méi)有重視一個(gè)小的輿情,導(dǎo)致一系列連鎖反應(yīng)。網(wǎng)絡(luò)輿情在高校傳播的主要方式有: 微信、QQ等即時(shí)通訊;各類論壇;網(wǎng)絡(luò)新聞的評(píng)論區(qū);微博、博客(Blog);抖音、快手等短視頻軟件。這些都是輿情的形成和表達(dá)的主要途徑,大學(xué)生對(duì)這些平臺(tái)都比較熟悉,也比較熱衷于在這些平臺(tái)發(fā)表意見(jiàn)和情緒,這對(duì)輿情會(huì)產(chǎn)生重要的影響。
高校需重視新時(shí)代網(wǎng)絡(luò)輿情帶來(lái)的挑戰(zhàn),并且建立起完善的網(wǎng)絡(luò)輿情應(yīng)對(duì)機(jī)制,做好網(wǎng)絡(luò)輿情監(jiān)控以及輿論引導(dǎo)工作,在輿情爆發(fā)之前未雨綢繆,減少負(fù)面輿情對(duì)高校正常工作的沖擊,充分發(fā)揮網(wǎng)絡(luò)文化的教育與管理功能。
2高校網(wǎng)絡(luò)輿情的基本特征
從高校網(wǎng)絡(luò)輿情的特征上來(lái)說(shuō),它實(shí)際上是一對(duì)矛盾的綜合體:高校網(wǎng)絡(luò)表達(dá)能夠開(kāi)放、互動(dòng)、自由,但同時(shí)也是可控的。高校網(wǎng)絡(luò)信息是學(xué)生情緒化和非理性的表達(dá),但這些內(nèi)容卻能客觀地反映學(xué)生的真實(shí)心理狀況。做好網(wǎng)絡(luò)輿情監(jiān)控要了解高校網(wǎng)絡(luò)的特征,在此基礎(chǔ)上做出正確的輿論引導(dǎo)和管理。
2.1產(chǎn)生主體特殊
高校網(wǎng)絡(luò)輿情的主體是大學(xué)生。他們的特殊性在于大學(xué)生是一個(gè)群體,他們年齡相仿,受教育程度相同,生活和知識(shí)水平往往在同一個(gè)層次。當(dāng)網(wǎng)絡(luò)輿情發(fā)生時(shí),他們很容易產(chǎn)生認(rèn)同并達(dá)成共識(shí)。大學(xué)生表達(dá)觀點(diǎn)的欲望強(qiáng)烈,愿意在網(wǎng)絡(luò)上發(fā)表對(duì)事情的看法和見(jiàn)解,但有時(shí)候可能會(huì)出現(xiàn)極端現(xiàn)象,容易被煽動(dòng)情緒,尤其是在網(wǎng)絡(luò)這個(gè)自由便捷的空間里,大學(xué)生往往在未經(jīng)過(guò)深思熟慮且探討不深入的情況下發(fā)表意見(jiàn),形成聲勢(shì)浩大的意見(jiàn)傾向,導(dǎo)致網(wǎng)絡(luò)輿情危機(jī)。
2.2輿情內(nèi)容多元性
高校網(wǎng)絡(luò)輿論涉及的內(nèi)容廣泛、主題多樣,可能涉及到社會(huì)的各個(gè)層面。學(xué)生們通過(guò)各種渠道了解信息,傳播信息,對(duì)于感興趣的內(nèi)容發(fā)表各自的看法,宣泄情緒。在虛擬的網(wǎng)絡(luò)空間里,不同的意識(shí)和思想相互碰撞,網(wǎng)絡(luò)輿情呈多元性發(fā)展。
2.3網(wǎng)絡(luò)輿情突發(fā)性
網(wǎng)絡(luò)輿情的爆發(fā)往往沒(méi)有征兆和預(yù)警,屬于突然爆發(fā)。大學(xué)生經(jīng)常上網(wǎng)沖浪,對(duì)網(wǎng)上的事件也比較敏感,一個(gè)事件在網(wǎng)上曝光時(shí),大學(xué)生往往能迅速反應(yīng)并發(fā)表評(píng)論,個(gè)人意見(jiàn)很快聚集形成公眾意見(jiàn)。
3網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)關(guān)鍵技術(shù)
3.1網(wǎng)絡(luò)爬蟲(chóng)技術(shù)
信息采集的主要載體包括網(wǎng)絡(luò)媒體網(wǎng)站、論壇、微博、微信等,可利用爬蟲(chóng)技術(shù)進(jìn)行信息采集。網(wǎng)絡(luò)爬蟲(chóng)是一種基于索引引擎技術(shù)的網(wǎng)絡(luò)信息獲取工具。它可以根據(jù)需要提取網(wǎng)頁(yè)的腳本或程序,其基本原理是通過(guò)遍歷URL,不斷搜索網(wǎng)絡(luò)信息,并將在URL中獲得的數(shù)據(jù)保存到本地?cái)?shù)據(jù)庫(kù)中,實(shí)現(xiàn)信息獲取。
3.2網(wǎng)頁(yè)解析技術(shù)
要實(shí)現(xiàn)對(duì)某網(wǎng)站數(shù)據(jù)的爬取,需要對(duì)該網(wǎng)站上網(wǎng)頁(yè)數(shù)據(jù)進(jìn)行分析,了解網(wǎng)頁(yè)的結(jié)構(gòu)之后,在爬蟲(chóng)代碼中編寫(xiě)提取網(wǎng)頁(yè)中特定數(shù)據(jù)的代碼。這是將互聯(lián)網(wǎng)數(shù)據(jù)轉(zhuǎn)化為通俗易懂的信息數(shù)據(jù)的重要一步,也是決定輿情監(jiān)測(cè)效果的關(guān)鍵。目前主要有三種web頁(yè)面解析技術(shù):
3.2.1正則表達(dá)式:一種字符串匹配的模式,其由普通字符和一些元字符組成。根據(jù)特定的語(yǔ)法來(lái)設(shè)置字符串的匹配規(guī)則,用于快速檢查一個(gè)字符串是否匹配該規(guī)則,還可以從字符串中抽取或者替換滿足條件的子串。正則表達(dá)式適用于簡(jiǎn)單的字符串,但涉及到難度較大的就無(wú)法提取,正則表達(dá)式寫(xiě)起來(lái)較為復(fù)雜并且出錯(cuò)率高。
3.2.2XPath:一種在XML和HTML文檔中查找信息的語(yǔ)言,可用于遍歷XML和HTML文檔中的元素和屬性,并根據(jù)網(wǎng)頁(yè)的樹(shù)層次結(jié)構(gòu)獲取節(jié)點(diǎn)。這些路徑表達(dá)式與常規(guī)計(jì)算機(jī)文件系統(tǒng)中看到的表達(dá)式非常相似。
3.2.3BeautifulSoup:是一個(gè)一個(gè)從HTML或XML中提取數(shù)據(jù)的Python庫(kù),可以按照節(jié)點(diǎn)的名稱、節(jié)點(diǎn)的屬性值、節(jié)點(diǎn)的文本來(lái)搜索符合條件的節(jié)點(diǎn)。它是靈活方便的網(wǎng)頁(yè)解析庫(kù),處理高效,而且支持多種解析器。使用Beautifulsoup可以不用編寫(xiě)正則表達(dá)式就方便的實(shí)現(xiàn)網(wǎng)頁(yè)信息的提取,可以高效節(jié)約開(kāi)發(fā)者時(shí)間。
3.3分詞技術(shù)
分詞技術(shù)用于將語(yǔ)句拆分成單詞。計(jì)算機(jī)要理解語(yǔ)義,必須先要識(shí)別出關(guān)鍵詞,將完整的句子拆分成詞串,就是分詞技術(shù)了?,F(xiàn)在常用的分詞算法可分為三類。一種是基于字符串匹配的分詞方法,這種方法需要有一個(gè)字典,根據(jù)一定的策略,將要待分析的字符串與字典中的條目進(jìn)行匹配。如果匹配正確,則字符串是一個(gè)單詞。根據(jù)不同的匹配方法,可以將匹配方法分為正最大匹配法(從左到右)、反向最大匹配法(從右到左)和最小分割法(將每句話中切出的單詞數(shù)量最小化)。字符串匹配方法快速、容易實(shí)現(xiàn),但不能有效處理歧義詞。第二種是基于統(tǒng)計(jì)的分詞方法,這種方法是對(duì)句子中字與相鄰字共現(xiàn)的頻率來(lái)計(jì)算,共現(xiàn)信息量越大,表明關(guān)系越緊密,共現(xiàn)次數(shù)越多,越有可能是一個(gè)詞。第三種是基于理解的分詞方法,這種方法可以使計(jì)算機(jī)能夠模擬人類對(duì)分詞的語(yǔ)法和語(yǔ)義進(jìn)行分析。但是這種方法還不成熟,因?yàn)闈h語(yǔ)結(jié)構(gòu)復(fù)雜詞匯量龐大,計(jì)算機(jī)需要大量的語(yǔ)言知識(shí)和信息。
隨著互聯(lián)網(wǎng)在全球范圍內(nèi)的快速發(fā)展,網(wǎng)絡(luò)輿情給高校的穩(wěn)定和大學(xué)生的成長(zhǎng)發(fā)展帶來(lái)了挑戰(zhàn)。教育領(lǐng)域的輿論發(fā)展變化規(guī)律極不可控。因此,研究和監(jiān)測(cè)網(wǎng)絡(luò)輿情,對(duì)于高校的穩(wěn)定發(fā)展具有重要的現(xiàn)實(shí)意義。做好高校網(wǎng)絡(luò)輿情監(jiān)測(cè)與管理,防范輿情危機(jī)的發(fā)生,可以有效保障校園網(wǎng)絡(luò)信息安全,促進(jìn)高校和諧穩(wěn)定發(fā)展。
參考文獻(xiàn):
[1]孫洪慶,李曉光.大數(shù)據(jù)時(shí)代高校輿情導(dǎo)向機(jī)制【J】.繼續(xù)教育研究,2018(8):27-31.
[2]曹彬,顧怡立,謝珍真 . 一種基于大數(shù)據(jù)技術(shù)的輿情監(jiān)控系統(tǒng) [J]. 信息網(wǎng)絡(luò)安全,2014(12):38-42.
[3]陳燕.近十年高校輿情及輿情引導(dǎo)研究綜述【J】.陜西理工大學(xué)學(xué)報(bào),2017(35):85-96.
[4]韋媛媛. 高校網(wǎng)絡(luò)輿情引導(dǎo)中的微信應(yīng)用探討【J】. 當(dāng)代教育實(shí)踐與教學(xué)研究, 2015( 4) .
[5]馮如曉,劉志明,雷龍艷. 基于搜索引擎的關(guān)鍵詞輿情過(guò)濾算法研究【J】 .計(jì)算機(jī)工程應(yīng)用技術(shù),2014,10( 6):1328-1332.
[6]劉毅.網(wǎng)絡(luò)輿情研究概論【M】.天津:天津人民出版社, 2007:51—52.
[7]胡靜,蔣外文,朱華. W e b 文本挖掘中數(shù)據(jù)預(yù)處理技術(shù)研究【J】. ?現(xiàn)代計(jì)算機(jī),20 0 9( 3).
(江西警察學(xué)院)