王子豪 崔 浩
(中國(guó)傳媒大學(xué) 北京 100026)
移動(dòng)通信平臺(tái)和無線網(wǎng)絡(luò)的迅猛發(fā)展,使人們更加經(jīng)常地通過移動(dòng)網(wǎng)絡(luò)獲取信息,而作為其副產(chǎn)品的網(wǎng)絡(luò)輿情也應(yīng)運(yùn)而生。互聯(lián)網(wǎng)空間可以被視為現(xiàn)實(shí)社會(huì)的虛擬映射,而網(wǎng)絡(luò)輿情則是社會(huì)輿情在互聯(lián)網(wǎng)上的映射,是社會(huì)輿情的另一種表現(xiàn)方式。作為大眾思想文化信息的主要集散地的互聯(lián)網(wǎng),以其為平臺(tái)的新型媒體、通訊工具的影響力已形成規(guī)模。
舍恩伯格的《大數(shù)據(jù)時(shí)代》中有這樣一句話,“大數(shù)據(jù)帶來的信息風(fēng)暴正在變革我們的生活、工作和思維,大數(shù)據(jù)開啟了一次重大的時(shí)代轉(zhuǎn)型?!雹俅髷?shù)據(jù)背景下改變的還有輿情傳播形態(tài)等。大輿情亦是大數(shù)據(jù),人類運(yùn)營(yíng)數(shù)據(jù)、人類感知數(shù)據(jù)、人類原創(chuàng)數(shù)據(jù)。海量的數(shù)據(jù)使得網(wǎng)絡(luò)輿情變得可預(yù)測(cè)其走向和傳播模式,更加科學(xué)地對(duì)輿情進(jìn)行引導(dǎo)和化解。目前有關(guān)突發(fā)公共事件網(wǎng)絡(luò)輿情的研究點(diǎn)主要集中在理論框架內(nèi)。實(shí)踐研究中首先暴露出來的第一個(gè)問題就是缺乏量化分析的體系,在量化分析之后如何實(shí)時(shí)將輿情可視化也是應(yīng)該考慮到的方面。
將大數(shù)據(jù)移植到輿情應(yīng)用。當(dāng)公共事務(wù)發(fā)生后,網(wǎng)民在瀏覽、搜索、互動(dòng)的過程中會(huì)隨時(shí)發(fā)表言論信息,這些信息直接呈現(xiàn)了網(wǎng)民的情緒、態(tài)度、意見,這些構(gòu)成了網(wǎng)絡(luò)輿情的顯性和隱性輿情,而網(wǎng)絡(luò)社區(qū)用戶彼此之間建立相互關(guān)系網(wǎng)絡(luò),建立了新的社會(huì)群體,帶來了新的群體行為,志同道合的人聚到一起,形成了具有影響力的輿情。
網(wǎng)絡(luò)輿情的定性方法可以為研究提供增量性的成果,但是卻并不能將網(wǎng)絡(luò)輿情的趨勢(shì)預(yù)測(cè)達(dá)到最高效度。傳統(tǒng)的網(wǎng)絡(luò)輿情的量化研究可以分為涉及數(shù)理結(jié)構(gòu)模型、方法和技術(shù),注重對(duì)輿情傳播過程中的數(shù)據(jù)統(tǒng)計(jì)及分析。在前面學(xué)者的努力下,大概形成了一系列體系和模型,種類數(shù)不勝數(shù)。
首先,傳播影響力的加速與擴(kuò)大。網(wǎng)民們更喜歡選擇與自己觀點(diǎn)相近的內(nèi)容,“沉默螺旋”的效果在網(wǎng)絡(luò)平臺(tái)有所加強(qiáng),快速表達(dá)意見會(huì)加速網(wǎng)絡(luò)輿情的迅速反應(yīng),產(chǎn)生雪崩式一邊倒現(xiàn)象。因此,對(duì)于大部分網(wǎng)絡(luò)輿情事件,越早回應(yīng)越主動(dòng)。大數(shù)據(jù)時(shí)代要求我們對(duì)于網(wǎng)絡(luò)輿情的收集速度和深度要有所增加,收集的方式要由靜態(tài)向動(dòng)態(tài)轉(zhuǎn)向。
第二,重視微力量。反饋式的閉環(huán)傳播會(huì)激蕩從而擴(kuò)大某一個(gè)事件的傳播效果。一個(gè)郭美美會(huì)引起全國(guó)對(duì)于紅十字會(huì)的敵視,這種例子屢見不鮮。大數(shù)據(jù)分析可以幫助我們了解情況,那些小的情緒會(huì)引起未來雪崩式的輿情變化。
第三,大數(shù)據(jù)更重視相關(guān)。小數(shù)據(jù)注重回歸;大數(shù)據(jù)時(shí)代,我們更注重相關(guān)。澤字節(jié)的數(shù)據(jù)集,我們關(guān)注的是其宏觀的關(guān)系,而不是對(duì)其追根溯源,通過對(duì)信息的解構(gòu)與重構(gòu),發(fā)現(xiàn)各個(gè)因素間的關(guān)系,進(jìn)行輿情管理。
第四,大數(shù)據(jù)時(shí)代使得我們更重視輿情的主導(dǎo)者、人的存在,我們關(guān)注于有多少人有這樣的意見。對(duì)于文字的過分解讀,會(huì)使得我們忽視多元的社會(huì)價(jià)值觀的沖撞。
第五,顯性輿情和隱性輿情。常見的網(wǎng)民對(duì)于公共事務(wù)發(fā)表評(píng)論、消息轉(zhuǎn)發(fā)等,這些可以呈現(xiàn)網(wǎng)民直接態(tài)度的被定義為顯性的網(wǎng)絡(luò)輿情。大數(shù)據(jù)的到來,使得我們對(duì)于隱性的網(wǎng)絡(luò)輿情進(jìn)行觀測(cè)的能力增強(qiáng),像是服務(wù)器會(huì)記錄瀏覽的URL等,不是直接對(duì)于輿情內(nèi)容進(jìn)行反應(yīng),卻可以告訴我們網(wǎng)民的關(guān)注熱點(diǎn)是什么。
基于大數(shù)據(jù)背景下的網(wǎng)絡(luò)輿情分析技術(shù),應(yīng)有三個(gè)主要的功能模塊,信息采集模塊、數(shù)據(jù)處理模塊、前端應(yīng)用模塊。②根據(jù)這三個(gè)模塊,應(yīng)具有以下功能:
1.信息采集,可以代替人工搜索,自動(dòng)發(fā)現(xiàn)輿情信息,比如自動(dòng)對(duì)于媒體所發(fā)布的新聞內(nèi)容進(jìn)行抓取、對(duì)于微博的關(guān)鍵詞進(jìn)行抓??;
2.數(shù)據(jù)處理,自動(dòng)對(duì)所抓取的關(guān)鍵詞進(jìn)行詞頻統(tǒng)計(jì),當(dāng)某一些或者某一類詞的數(shù)量達(dá)到一定限度,要對(duì)重大的負(fù)面輿情信息及時(shí)發(fā)出預(yù)警。除此之外,還應(yīng)該定性定量相結(jié)合的分析輿情信息,幫助輿情管理,判斷某一輿情的發(fā)展變化趨勢(shì);
3.前端應(yīng)用,能夠自動(dòng)生成輿情報(bào)道和數(shù)據(jù)。數(shù)據(jù)可視化技術(shù),不但是簡(jiǎn)簡(jiǎn)單單地對(duì)于數(shù)據(jù)進(jìn)行圖形化,更是會(huì)影響使用者對(duì)于輿情的反映速度和處理態(tài)度,提高工作效率,幫助決策。
網(wǎng)絡(luò)輿情信息與繁雜的大數(shù)據(jù)有著相似特征,由海量的結(jié)構(gòu)化數(shù)據(jù)組成,但其中包含更多的非結(jié)構(gòu)化數(shù)據(jù)。當(dāng)今互聯(lián)網(wǎng)已經(jīng)沒有時(shí)間再去允許你海底撈針般地對(duì)于數(shù)據(jù)結(jié)構(gòu)化進(jìn)行處理或者界定,傳統(tǒng)的量化方式已經(jīng)無法滿足準(zhǔn)確快速地對(duì)于輿情進(jìn)行預(yù)警,大數(shù)據(jù)的分析技術(shù)也應(yīng)運(yùn)而生。
不同于引擎搜索注重的是信息的廣度,網(wǎng)絡(luò)輿情的數(shù)據(jù)抓取更注重深度和對(duì)于轉(zhuǎn)發(fā)、評(píng)論、搜索等的精確采集。采用專門的抓取器,像是Goseeker、import.io、編程語(yǔ)言Python,將抓取的數(shù)據(jù)結(jié)構(gòu)化后存儲(chǔ)下來。文本挖掘利用網(wǎng)絡(luò)爬蟲技術(shù),在制定的網(wǎng)站、特定的形式進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)收集,以備使用,但是這種做法會(huì)影響數(shù)據(jù)采集和分析的效率以及數(shù)據(jù)的精度。
蝴蝶效應(yīng)用在當(dāng)今互聯(lián)網(wǎng)空間再合適不過,每一條發(fā)布在網(wǎng)絡(luò)上的信息都有可能引起一場(chǎng)風(fēng)暴,網(wǎng)絡(luò)預(yù)警模型是整個(gè)技術(shù)分析過程中關(guān)鍵的組成部分。大數(shù)據(jù)注重的是對(duì)于整體宏觀的走勢(shì)把握和數(shù)據(jù)的相關(guān)關(guān)系,但是要對(duì)于異常值很敏感,才能及時(shí)抓住癥結(jié)。
文本內(nèi)容的挖掘是對(duì)于輿情信息內(nèi)容最核心的處理,將整句按照詞性進(jìn)行詞語(yǔ)劃分,經(jīng)過詞頻統(tǒng)計(jì)和情感分析,很容易便知道大多數(shù)網(wǎng)民的態(tài)度傾向和關(guān)注熱點(diǎn),從而對(duì)輿情進(jìn)行分析和未來走勢(shì)預(yù)測(cè)。語(yǔ)義分析是網(wǎng)絡(luò)輿情定量分析的重要環(huán)節(jié),相比直接的采訪和訪談,對(duì)搜集到的自然語(yǔ)言進(jìn)行處理,也更為客觀和真實(shí)。
大數(shù)據(jù)分析得以實(shí)現(xiàn)的根本是數(shù)據(jù)可獲得,由大眾化向分眾化轉(zhuǎn)變,就像用戶由微博向微信轉(zhuǎn)變。而大數(shù)據(jù)的抓取卻無法向這類信息下手,大數(shù)據(jù)的輿情分析基于的是用戶想公開表達(dá),否則輿情是不可測(cè)的。同時(shí),像是微博平臺(tái)也在出臺(tái)一系列措施,防止隨意抓取數(shù)據(jù)。
產(chǎn)品社會(huì),將以上技術(shù)組成相應(yīng)的技術(shù)組件放在云平臺(tái)上,可以實(shí)時(shí)使用,這才是未來技術(shù)的發(fā)展方向,其組件包括可以抓取數(shù)據(jù)的爬蟲軟件、搜索軟件、云平臺(tái)提供的信息儲(chǔ)存器等。云平臺(tái),將為未來大數(shù)據(jù)輿情分析提供強(qiáng)大的助力。
被譽(yù)為新時(shí)代黃金的數(shù)據(jù),其最大價(jià)值體現(xiàn)在其二次分析上。二次分析和一次分析,表面上被告知和許可的信息不同,二次分析的結(jié)果是未知的,分析之后的結(jié)果可能讓人出乎意料。大數(shù)據(jù)時(shí)代的信息安全保護(hù),應(yīng)有所不同。
網(wǎng)絡(luò)輿情數(shù)據(jù)獲取與話題分析技術(shù),限制著網(wǎng)絡(luò)輿情分析的質(zhì)量。網(wǎng)絡(luò)輿情分析需要廣泛的數(shù)據(jù)來源、長(zhǎng)時(shí)間的數(shù)據(jù)積累和成熟的分析技術(shù)作為支撐,大數(shù)據(jù)的誕生會(huì)成為當(dāng)今網(wǎng)絡(luò)輿情分析新的助力,雖然還有很多限制和問題有待解決,但確實(shí)為作為社會(huì)科學(xué)的學(xué)科的輿情增添了一些更為科學(xué)的因子。
[1]葉平浩、張李義:《基于知識(shí)圖譜的網(wǎng)絡(luò)輿情研究現(xiàn)狀分析》,《情報(bào)雜志》2013年02期
[2]王青:《網(wǎng)絡(luò)輿情監(jiān)測(cè)及預(yù)警指標(biāo)體系研究綜述》,《情報(bào)科學(xué)》2011年07期
[3]朱毅華:《網(wǎng)絡(luò)輿情研究中的仿真方法應(yīng)用綜述》,《情報(bào)雜志》2013年01期
注釋:
①維克托·邁爾-舍恩伯格、袁杰:《大數(shù)據(jù)時(shí)代》浙江人民出版社2013年1月
②尹培培:《大數(shù)據(jù)時(shí)代的網(wǎng)絡(luò)輿情分析系統(tǒng)》,《廣播電視技術(shù)》2013年07期