杜亞軍, 吳 越, 李顯勇, 陳曉亮, 劉文君, 范永全
(西華大學(xué)計(jì)算機(jī)與軟件工程學(xué)院, 四川 成都 610039)
互聯(lián)網(wǎng)、云計(jì)算、人工智能技術(shù)的不斷發(fā)展和快速普及,催生了網(wǎng)絡(luò)數(shù)據(jù)爆炸式增長。依托互聯(lián)網(wǎng),網(wǎng)民可以借助新聞評(píng)論、BBS、博客、微博、QQ、微信等網(wǎng)絡(luò)應(yīng)用平臺(tái),對(duì)感興趣的話題自由發(fā)表言論并交換意見。當(dāng)圍繞某一話題的分散觀點(diǎn)不斷聚集并逐步演化為群體性極化觀點(diǎn)時(shí),就形成了網(wǎng)絡(luò)輿情。作為現(xiàn)實(shí)社會(huì)輿情的映射和延伸,網(wǎng)絡(luò)輿情已發(fā)展成為與現(xiàn)實(shí)社會(huì)輿情相互影響、相互補(bǔ)充、相互制約和相互推長的一種重要的輿情形式。截至2018年7月,我國網(wǎng)民規(guī)模達(dá)到8.02億人,手機(jī)網(wǎng)民規(guī)模達(dá)7.88億人,互聯(lián)網(wǎng)普及率為57.7%[1],也就是說可能有超過半數(shù)的國人會(huì)成為網(wǎng)絡(luò)新聞的參與者,網(wǎng)絡(luò)空間已經(jīng)成為不可忽視的輿情載體。據(jù)不完全統(tǒng)計(jì),新浪微博每天發(fā)布數(shù)億條微博,產(chǎn)生50 GB的數(shù)據(jù);騰訊微信日登錄用戶數(shù)達(dá)9.02億(2017年9月),每天產(chǎn)生380億條消息;百度每天處理數(shù)據(jù)量達(dá)到100 PB。在社交網(wǎng)絡(luò)大數(shù)據(jù)的時(shí)代背景下,面對(duì)海量的數(shù)據(jù),如何有效地挖掘輿情數(shù)據(jù),準(zhǔn)確判別輿情方向,并自主引導(dǎo)其向正向輿論轉(zhuǎn)化成為亟待解決的問題。
網(wǎng)絡(luò)輿情需要正向引導(dǎo)是由時(shí)代和社會(huì)背景、網(wǎng)絡(luò)信息傳播特點(diǎn)和網(wǎng)民群體自身特點(diǎn)決定的。就時(shí)代和社會(huì)背景而言,我國正處于社會(huì)轉(zhuǎn)型期,網(wǎng)絡(luò)信息的監(jiān)控與監(jiān)管剛剛開始,相關(guān)法制不夠健全,民眾的合理訴求相對(duì)受到限制。就網(wǎng)絡(luò)信息傳播特點(diǎn)而言,網(wǎng)絡(luò)信息具備傳播快、范圍廣、易復(fù)制,且真實(shí)性難以考究的特點(diǎn),這就使得不法群體能輕易編造網(wǎng)絡(luò)謠言,夸大事實(shí),扭曲真相。就網(wǎng)民群體自身而言,當(dāng)前我國網(wǎng)民的主要群體是30歲以下的年輕人,其對(duì)事物的辨別能力相對(duì)較弱,容易受誘導(dǎo)而成為謠言傳播者。
縱觀我國網(wǎng)絡(luò)輿情的發(fā)展歷程,一般認(rèn)為,2003年廣州“孫志剛事件”在網(wǎng)上曝光,引起了廣大網(wǎng)民的積極參與和討論,是我國網(wǎng)絡(luò)輿情正式出現(xiàn)的標(biāo)志。自此之后,網(wǎng)絡(luò)逐漸發(fā)展成一種民意表達(dá)的新平臺(tái)。從“華南虎事件”(2007)、“上海踩踏事件”(2015)到最近的 “紅綠藍(lán)幼兒園虐童事件”(2017)、“鴻茅藥酒事件”( 2018),幾乎所有重大新聞都首先在網(wǎng)絡(luò)上展開討論,并迅速形成熱點(diǎn)話題,其所產(chǎn)生的社會(huì)巨大影響甚至超過了事件本身。特別是一些負(fù)面效應(yīng)的網(wǎng)絡(luò)輿情,可能本身并不是很大的事件,但在互聯(lián)網(wǎng)的助推下,迅速演變成具有廣泛社會(huì)影響力的輿論事件,甚至群體事件,如“西安手術(shù)臺(tái)醫(yī)生自拍事件”發(fā)生后,加劇了醫(yī)患矛盾。另外,這類突發(fā)性轉(zhuǎn)變通常令人猝不及防,使得相關(guān)部門對(duì)事件的反應(yīng)和處理顯得滯后于事態(tài)發(fā)展,甚至陷入被動(dòng)局面。如2011年的“7·23甬溫線特別重大鐵路交通事故”,由于有關(guān)部門沒有認(rèn)清互聯(lián)網(wǎng)時(shí)代網(wǎng)絡(luò)輿情的新特點(diǎn),對(duì)網(wǎng)絡(luò)負(fù)面輿情采取“不聞不問不說”的態(tài)度,沒能在正確的時(shí)間合理地處理問題,最終對(duì)政府部門的形象造成了消極影響。在輿情網(wǎng)絡(luò)化的環(huán)境下,如何借助計(jì)算機(jī)手段,自動(dòng)引導(dǎo)網(wǎng)絡(luò)輿情已成為社會(huì)日益關(guān)注的重要問題。自動(dòng)引導(dǎo)網(wǎng)絡(luò)輿情的實(shí)現(xiàn)需要解決多個(gè)問題,例如,如何從海量的社交信息中,準(zhǔn)確挖掘負(fù)面輿情信息? 如何在時(shí)、度上把握社交網(wǎng)絡(luò)平臺(tái)中輿情(量)到輿論(質(zhì))的轉(zhuǎn)化[2]? 選擇什么樣的策略,去影響輿情的發(fā)展和演化?如何評(píng)判引導(dǎo)的效果好壞?
盡管相關(guān)方面的研究取得很大進(jìn)展,但次主題的研究還處于起步階段,理論體系尚未建成,效果顯著的實(shí)證研究還較為欠缺,依舊存在很多問題需要進(jìn)一步探討。基于此,文章對(duì)當(dāng)下國內(nèi)外的網(wǎng)絡(luò)輿情研究發(fā)展進(jìn)行較為系統(tǒng)的綜述,在全面分析當(dāng)前技術(shù)存在問題的基礎(chǔ)上,為各個(gè)問題的解決提出了對(duì)應(yīng)的思路。
針對(duì)社交網(wǎng)絡(luò)上的輿情引導(dǎo),目前許多國家已出臺(tái)了相關(guān)政策,組建了相關(guān)機(jī)構(gòu)并開發(fā)了相關(guān)軟件,但完整的輿情引導(dǎo)策略與實(shí)施系統(tǒng)未見報(bào)道。對(duì)此,需要對(duì)輿情引導(dǎo)策略進(jìn)行系統(tǒng)性研究,包括挖掘網(wǎng)絡(luò)短文本,獲取群體話題討論觀點(diǎn);分析引導(dǎo)策略類型,尤其是基于特殊節(jié)點(diǎn)人物的輿情引導(dǎo)策略,通過識(shí)別網(wǎng)絡(luò)中的特殊節(jié)點(diǎn)人物,從語義上理解他及其粉絲、偶像、朋友發(fā)表的言論,并利用結(jié)構(gòu)平衡理論調(diào)控特殊節(jié)點(diǎn)觀點(diǎn)和節(jié)點(diǎn)關(guān)系,達(dá)到引導(dǎo)整個(gè)群體輿情觀點(diǎn)的目的。圍繞這些研究內(nèi)容,對(duì)現(xiàn)有的研究方法綜合分析,其相關(guān)的研究工作主要包括網(wǎng)絡(luò)短文本觀點(diǎn)挖掘,結(jié)構(gòu)平衡理論的演化動(dòng)力學(xué),網(wǎng)絡(luò)輿情引導(dǎo)政策、機(jī)構(gòu)與軟件,網(wǎng)絡(luò)輿情引導(dǎo)策略類型,網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)人物識(shí)別,基于特殊節(jié)點(diǎn)人物的網(wǎng)絡(luò)輿情引導(dǎo)。
從海量網(wǎng)絡(luò)短文本(如微博帖子、微信和QQ對(duì)話、短信等)中挖掘網(wǎng)民對(duì)輿情話題的觀點(diǎn)是掌握網(wǎng)絡(luò)輿情態(tài)勢,制定引導(dǎo)方案的必要條件。相對(duì)于傳統(tǒng)長文本情感分析,網(wǎng)絡(luò)短文本觀點(diǎn)挖掘的難度更大。這主要是由于網(wǎng)絡(luò)短文本表情符號(hào)多,噪聲大,情感特征稀疏,網(wǎng)絡(luò)新詞層出不窮等。此外,觀點(diǎn)挖掘不僅要提取喜怒哀樂等情感,還要識(shí)別情感所涉及的話題。為解決這些問題,近年來相繼出現(xiàn)了許多有針對(duì)性的研究工作。
2008年,Tayfun等[3]通過大量采集用戶聊天信息,建立了用戶聊天問題定義模型,并形成用戶對(duì)問題觀點(diǎn)的挖掘方法,是短文本數(shù)據(jù)分析和觀點(diǎn)挖掘的早期研究之一。2010年,趙妍妍等[4]將文本情感分析歸納為情感信息抽取、情感信息分類、情感信息檢索與歸納三大任務(wù),并認(rèn)為大量網(wǎng)絡(luò)短文本觀點(diǎn)挖掘方法建立在傳統(tǒng)長文本,如新聞稿、網(wǎng)頁、報(bào)刊、雜志等基礎(chǔ)之上,總體可分為無監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)兩大類。2012年,楊震等[5]面對(duì)微博短文本特征稀疏和上下文缺失的情況,借由時(shí)間、空間、聯(lián)系等要素挖掘文本間隱含的關(guān)聯(lián)關(guān)系,重構(gòu)文本上下文范疇,以提升情感極性分類的有效性。2013年,Ren等[6]提出一種結(jié)合社交網(wǎng)絡(luò)文本和話題文本的矩陣因子分解框架,利用可觀測的微博知識(shí),預(yù)測用戶對(duì)某一具體話題的觀點(diǎn)。
2014年,網(wǎng)絡(luò)短文本觀點(diǎn)挖掘的相關(guān)研究開始爆發(fā)。Montejo-Ráez等[7]提出一種領(lǐng)域無關(guān)的無監(jiān)督學(xué)習(xí)方法,從WordNet圖中提取加權(quán)節(jié)點(diǎn)向量,這些被用在SentiWordNet的權(quán)重可計(jì)算微博最終情感極性。張林等[8]對(duì)移動(dòng)設(shè)備上的用戶評(píng)論進(jìn)行了研究,歸納出短文本具有字?jǐn)?shù)少、跨度大、短小評(píng)論數(shù)量眾多等特點(diǎn),提出了一種基于短評(píng)論特征共現(xiàn)的特征篩選方法,并分析輕型評(píng)論的情感極性。Ouyang等[9]先利用樸素貝葉斯(NB)分類方法判別微博文本是否具有情感,然后結(jié)合支持向量機(jī)(SVM)和k最近鄰分類器(k-NN)分析文本的情感類別。楊陽等[10]提出了一種基于詞向量的情感新詞發(fā)現(xiàn)方法,先用基于統(tǒng)計(jì)量的方法識(shí)別微博語料中的新詞,然后利用神經(jīng)網(wǎng)絡(luò)去訓(xùn)練語料中詞語的詞向量,從語料自身挖掘詞與詞之間的相關(guān)性,實(shí)驗(yàn)表明該方法能有效發(fā)現(xiàn)情感新詞。Tan等[11]在潛在狄利克雷分布(LDA)模型的基礎(chǔ)上,提出了前景和背景LDA模型,用于提取顯著的話題并過濾長期存在的背景話題,這些顯著話題能夠?yàn)榫W(wǎng)民情感的變化做出可能的解釋。Pandarachalil等[12]提出一種無監(jiān)督的微博情感分析方法,該方法利用SenticNet、 SentiWordNet和SentilangNet三種情感詞典分析微博文本的情感極性,其中SentilangNet情感詞典搜集了微博俚語和縮略詞。實(shí)驗(yàn)結(jié)果顯示,該方法對(duì)大規(guī)模網(wǎng)絡(luò)文本情感分析具有良好效果。在基于有監(jiān)督學(xué)習(xí)的情感分類方法中,訓(xùn)練數(shù)據(jù)不平衡是一個(gè)嚴(yán)重的問題,最終能影響到分類準(zhǔn)確率。為解決這個(gè)問題,2015年,Xu等[13]在詞向量語義合成的基礎(chǔ)上提出一種過擬合方法,然后在遞歸神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上,設(shè)計(jì)了一種綜合算法,用于構(gòu)造句子向量,最后利用合成少數(shù)過采樣(SMOTE)算法,產(chǎn)生完全平衡的訓(xùn)練集。Huang等[14]采用共現(xiàn)詞分析,借助短文本中自動(dòng)提取主題的方法,通過熱點(diǎn)事件的挖掘和演化規(guī)律的分析,提出了熱點(diǎn)事件演化挖掘算法。Yamamoto等[15]考慮到表情符號(hào)對(duì)于文本情感的影響,提出了基于表情符號(hào)的微博多維度情感計(jì)算方法。馬長林等[16]提出一個(gè)話題情感混合最大熵LDA模型,對(duì)網(wǎng)絡(luò)評(píng)論文本進(jìn)行細(xì)粒度觀點(diǎn)挖掘,實(shí)驗(yàn)證實(shí)了所提模型的有效性。2016年,王仲遠(yuǎn)等[17]認(rèn)為要解決搜索引擎、問答系統(tǒng)等智能系統(tǒng)中用戶查找的問題這一類型短文本的理解問題,解決短文本中語境信息不足是前提,并提出了基于向量的短文本主題觀點(diǎn)的理解框架。2017年,Kang等[18]提出一個(gè)從用戶個(gè)人微貼中提取用戶興趣的模型,該模型使用Wikipedia作為知識(shí)庫,將用戶微貼表示成了特征詞空間,將微貼內(nèi)容映射成了用戶個(gè)人興趣類標(biāo)簽。2018年,Zhao等[19]使用在線社交網(wǎng)絡(luò)中用戶對(duì)產(chǎn)品的評(píng)分作為弱監(jiān)督信號(hào),建立基于產(chǎn)品評(píng)論情感分類的深度學(xué)習(xí)框架。該方法首先將評(píng)分用于模型高層得到產(chǎn)品評(píng)分情感的總體分布,然后在網(wǎng)絡(luò)中間層和底層加入一個(gè)分類器,分析用戶對(duì)產(chǎn)品評(píng)價(jià)語句中包含的情感。
就網(wǎng)絡(luò)短文本觀點(diǎn)挖掘相關(guān)研究而言,其在信息檢索領(lǐng)域的應(yīng)用比較成熟,如有關(guān)常規(guī)文本的話題分析、觀點(diǎn)挖掘、情感分析已有大量的研究工作,方法相對(duì)比較成熟。但在社交網(wǎng)絡(luò)領(lǐng)域,文本內(nèi)容具備信息短、網(wǎng)絡(luò)新詞頻繁、符號(hào)層出不窮、數(shù)據(jù)量大等特點(diǎn),常規(guī)文本處理方法很難適應(yīng)短文本處理。其主要問題表現(xiàn)在普通情感詞典難以識(shí)別短文本中新詞、新符號(hào)的情感傾向;社交網(wǎng)絡(luò)文本短小,文本特征矩陣稀疏,常規(guī)文本處理方法效果不佳,且話題與情感的同步提取困難。因此如何結(jié)合社交網(wǎng)絡(luò)會(huì)話的情景,充分利用會(huì)話的上下文信息,采用話題熱度和話題觀點(diǎn)、話題情感傾向的時(shí)間序列特征,挖掘其網(wǎng)絡(luò)輿情話題、觀點(diǎn)、情感是亟待解決的問題。
在社交網(wǎng)絡(luò)研究中,常將用戶、評(píng)論等作為節(jié)點(diǎn),以節(jié)點(diǎn)之間的各種聯(lián)系作為邊,構(gòu)成符號(hào)網(wǎng)絡(luò)。網(wǎng)絡(luò)結(jié)構(gòu)平衡理論的基礎(chǔ)是社會(huì)心理學(xué)理論,起源于1946年Heider[20]提出的人們對(duì)事物態(tài)度的平衡模型,該模型把人與人或人與物之間的關(guān)系分為積極和消極兩種類型,并實(shí)證分析關(guān)系類型的演化規(guī)律。1956年,Cartwright等[21]將Heider的理論進(jìn)一步推廣,用數(shù)學(xué)語言將包含積極和消極兩類關(guān)系的系統(tǒng)形式化地描述為符號(hào)網(wǎng)絡(luò),網(wǎng)絡(luò)中用邊的正、負(fù)符號(hào)分別表示積極關(guān)系和消極關(guān)系。結(jié)構(gòu)平衡理論圍繞三角形的平衡性分析[22],用網(wǎng)絡(luò)節(jié)點(diǎn)代表社交網(wǎng)絡(luò)中的網(wǎng)民,網(wǎng)絡(luò)連接邊代表網(wǎng)民之間的關(guān)系(“+”代表正關(guān)系,即觀點(diǎn)相同;“-”代表負(fù)關(guān)系,即觀點(diǎn)相反),則三角形的關(guān)系具有如圖1所示的4種模式。其中圖1(a)和圖1(b)被認(rèn)為是結(jié)構(gòu)平衡的,圖1(c)和圖1(d)被認(rèn)為是結(jié)構(gòu)不平衡的??紤]到社交網(wǎng)絡(luò)中的網(wǎng)民數(shù)量多,且因興趣和觀點(diǎn)聚集成不同小團(tuán)體,小團(tuán)體內(nèi)部的網(wǎng)民觀點(diǎn)相同,不同團(tuán)體間的網(wǎng)民觀點(diǎn)相反,進(jìn)一步在完全圖的弱平衡性基礎(chǔ)上分析社交網(wǎng)絡(luò)的弱平衡性。網(wǎng)絡(luò)輿情的形成過程實(shí)質(zhì)上是一個(gè)從分散的網(wǎng)民觀點(diǎn)發(fā)展為有限個(gè)小團(tuán)體觀點(diǎn),最終經(jīng)過演化小團(tuán)體逐漸合并而形成一種統(tǒng)一觀點(diǎn),或兩種對(duì)立觀點(diǎn)的過程。
圖1 符號(hào)網(wǎng)絡(luò)中三元閉包關(guān)系組合
結(jié)構(gòu)平衡理論是符號(hào)網(wǎng)絡(luò)領(lǐng)域最基礎(chǔ)的理論[23]。然而,現(xiàn)實(shí)中的符號(hào)網(wǎng)絡(luò)絕大多數(shù)不是靜態(tài)的平衡網(wǎng)絡(luò),而是從非平衡結(jié)構(gòu)不斷演化為平衡結(jié)構(gòu)或近似平衡結(jié)構(gòu)的網(wǎng)絡(luò),因此符號(hào)網(wǎng)絡(luò)演化動(dòng)力學(xué)成為學(xué)者關(guān)注的重點(diǎn)。
符號(hào)網(wǎng)絡(luò)演化動(dòng)力學(xué)早期的研究大多基于離散時(shí)間步的模擬。為了驗(yàn)證基于結(jié)構(gòu)平衡理論的符號(hào)網(wǎng)絡(luò)演化過程是否總能到達(dá)全局結(jié)構(gòu)平衡態(tài),2003年,Wang等[24]提出一個(gè)離散時(shí)間的符號(hào)網(wǎng)絡(luò)演化模型,模型假設(shè)初始時(shí)網(wǎng)絡(luò)中邊的符號(hào)隨機(jī)配置,每個(gè)時(shí)間步依次檢查每個(gè)三角形是否為結(jié)構(gòu)平衡,對(duì)于非結(jié)構(gòu)平衡的三角形,隨機(jī)選擇其包含的一條邊改變符號(hào)。通過蒙特卡羅實(shí)驗(yàn)發(fā)現(xiàn)這些符號(hào)網(wǎng)絡(luò)最終均演化到結(jié)構(gòu)平衡狀態(tài)。當(dāng)符號(hào)網(wǎng)絡(luò)處于平衡態(tài)時(shí),網(wǎng)絡(luò)節(jié)點(diǎn)分處于兩個(gè)完全對(duì)立的節(jié)點(diǎn)集合。2006年,Antal等[25]提出了類似的離散時(shí)間符號(hào)網(wǎng)絡(luò)演化模型,該模型將三角形按照包含的負(fù)邊數(shù)分為四類。每個(gè)時(shí)間步隨機(jī)選擇一個(gè)三角形,若負(fù)邊數(shù)量為3,其中的一條邊符號(hào)將會(huì)被改變,從而得到負(fù)邊數(shù)量為2的三角形;如果負(fù)邊數(shù)量為1,則以概率ρ(0≤ρ≤1)轉(zhuǎn)變?yōu)樨?fù)邊數(shù)量為0,或以概率1-ρ轉(zhuǎn)變?yōu)樨?fù)邊數(shù)量為2的三角形。實(shí)驗(yàn)結(jié)構(gòu)表明,網(wǎng)絡(luò)獲得平衡狀態(tài)的時(shí)間依賴于網(wǎng)絡(luò)規(guī)模,且與ρ值相關(guān)。另外,模型在模擬時(shí)存在相變點(diǎn),當(dāng)正邊比例小于該相變點(diǎn)時(shí),網(wǎng)絡(luò)最終達(dá)到的平衡狀態(tài)由兩個(gè)完全對(duì)立的節(jié)點(diǎn)集合構(gòu)成。正邊比例越小,兩個(gè)節(jié)點(diǎn)集合的大小越接近;正邊比例越大,則兩個(gè)節(jié)點(diǎn)集合的大小差異越大,最后,當(dāng)正邊的比例大于相變點(diǎn)時(shí),整個(gè)網(wǎng)絡(luò)在達(dá)到平衡狀態(tài)時(shí)僅包含一個(gè)節(jié)點(diǎn)集合,即所有邊均為正邊。2005年,Kulakowski等[26]提出了一個(gè)連續(xù)時(shí)間模型,仿真實(shí)驗(yàn)結(jié)果表明,對(duì)于任意的初始條件和網(wǎng)絡(luò),在有限時(shí)間步內(nèi),系統(tǒng)都會(huì)達(dá)到Heider 平衡狀態(tài),其中大部分測試網(wǎng)絡(luò)演變?yōu)閮蓚€(gè)完全對(duì)立的派系。同年,Gawronski 等[27]將該模型應(yīng)用于多個(gè)網(wǎng)絡(luò)中,包括經(jīng)典的BA無標(biāo)度模型網(wǎng)絡(luò)、Natchez 的婦女網(wǎng)絡(luò)和Zachary 空手道俱樂部網(wǎng)絡(luò),驗(yàn)證了模型的有效性。2010年,Szell等[28]為模擬一個(gè)大規(guī)模在線游戲網(wǎng)絡(luò)中不同類型三角形的演化過程,提出了STC(Signed Triadic Closure)模型。2011年,Marvel 等[29]在上述連續(xù)時(shí)間模型的基礎(chǔ)上給出了一個(gè)閉合表達(dá)式,并證明,在大規(guī)模社會(huì)網(wǎng)絡(luò)中,初始的正邊數(shù)量決定了網(wǎng)絡(luò)最終的演化結(jié)果——兩個(gè)相互對(duì)立的派系并存和僅存在一個(gè)派系。同年,Malekzadeh等[30]基于博弈論提出了一個(gè)動(dòng)態(tài)模型,將各節(jié)點(diǎn)調(diào)整關(guān)系的策略設(shè)置為使自身參與的平衡三角形盡可能地多。研究發(fā)現(xiàn),該模型下任意初始狀態(tài)的網(wǎng)絡(luò)最終都會(huì)達(dá)到平衡。
有關(guān)符號(hào)網(wǎng)絡(luò)演化動(dòng)力學(xué)目前還僅限于學(xué)術(shù)性研究,主要目的在于探討具有符號(hào)屬性的真實(shí)系統(tǒng)可能的演化模式和相應(yīng)機(jī)制的作用分析。雖然這部分研究成果目前還未見具體的應(yīng)用,但存在潛在的應(yīng)用場景,比如輿情引導(dǎo),可以通過定位一些關(guān)鍵節(jié)點(diǎn)或邊,對(duì)當(dāng)前符號(hào)網(wǎng)絡(luò)加入少量的干擾,使其最終演化收斂到所希望的狀態(tài)。近年來,符號(hào)網(wǎng)絡(luò)結(jié)構(gòu)平衡及其演化方法,在各個(gè)社交網(wǎng)絡(luò)領(lǐng)域得到廣泛應(yīng)用。2013年,Nuria等[31]分析了16個(gè)團(tuán)體中86個(gè)小團(tuán)體成員之間沖突表現(xiàn)和團(tuán)體網(wǎng)絡(luò)平衡狀態(tài)特征,將社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)的無參數(shù)模型,成功用于預(yù)測小團(tuán)體之間的沖突。2014年,Hao等[32]針對(duì)現(xiàn)有k-團(tuán)體發(fā)現(xiàn)方法,要求符號(hào)網(wǎng)絡(luò)中邊的正負(fù)性單一的情況,通過分析社會(huì)網(wǎng)絡(luò)的潛在結(jié)構(gòu)和功能特性,提出了挖掘社交網(wǎng)絡(luò)k個(gè)信任平衡團(tuán)體的算法,解決了網(wǎng)絡(luò)中邊可以是正鏈接邊也可以是負(fù)鏈接邊的問題。2015年,Cai等[33]提出了一種解決網(wǎng)絡(luò)結(jié)構(gòu)平衡問題的兩步法。方法包括改進(jìn)的多目標(biāo)離散粒子群優(yōu)化、限定域問題的模型選擇策略,產(chǎn)生最優(yōu)帕累托解,然后將最佳解用于分析網(wǎng)絡(luò)結(jié)構(gòu),發(fā)現(xiàn)網(wǎng)絡(luò)中的不平衡邊,再將不平衡邊翻轉(zhuǎn),從而使網(wǎng)絡(luò)結(jié)構(gòu)達(dá)到平衡。2017年,Abtin等[34]認(rèn)為符號(hào)網(wǎng)絡(luò)是一類社會(huì)關(guān)系網(wǎng)絡(luò),其中關(guān)系可以是正的,也可以是負(fù)的。網(wǎng)絡(luò)中出現(xiàn)信任和不信任構(gòu)成了網(wǎng)絡(luò)的不平衡。他們?cè)贓pinions、Slashdot和維基百科三個(gè)真實(shí)的符號(hào)網(wǎng)絡(luò)基礎(chǔ)上,提出了正反網(wǎng)絡(luò)中的符號(hào)預(yù)測算法,可以推斷出社交網(wǎng)絡(luò)未知關(guān)系類型。
輿情演化機(jī)制對(duì)輿情正確引導(dǎo)具有重要的影響。常規(guī)輿情演化方法以信息擴(kuò)散、傳播理論為基礎(chǔ),研發(fā)了一些輿情演化模型。社交網(wǎng)絡(luò)輿情從產(chǎn)生到消亡,經(jīng)歷了不同的階段。輿情的演化伴隨著輿情的生命周期,從網(wǎng)絡(luò)結(jié)構(gòu)角度,輿情生命周期的推移與網(wǎng)絡(luò)本身的結(jié)構(gòu)平衡是緊密聯(lián)系的。探討社交網(wǎng)絡(luò)平衡理論、輿情生命周期、輿情演化機(jī)制三者之間的關(guān)系,是正確、高效地建立輿情引導(dǎo)方法需要解決的重要問題。
信息傳播是個(gè)人意見融合的過程,在這個(gè)過程中相互作用的主體根據(jù)既定的融合規(guī)則,不斷磨合對(duì)同一問題的意見,最終達(dá)成共識(shí),或兩級(jí)分化和分裂。目前,國內(nèi)外學(xué)者在輿情傳播模型方面開展了大量的研究,也取得了一些進(jìn)展。信息擴(kuò)散模型源于傳染病動(dòng)力學(xué)模型[35],如SI(Susceptible-Infected)、SIS(SI-Susceptible)、SIR(SI-Refractory)、SEIR(Susceptible-Exposed-Infected -Refractory)模型,其中S(易受感染)、I(受感染體)、R(移出者)分別代表三種不同狀態(tài)。SI模型定義易傳染者,即可以被感染者的鄰居以一定的概率傳染,成為新的傳染者。這就意味著,在進(jìn)化后所有的病原體都將成為傳染者。SIS模型感染者有可能恢復(fù)到易感人群。SIR引入了難傳染狀態(tài),如用戶中存在免疫性,不能再次被感染。SEIR模型中,易感染者已經(jīng)被感染,但是在潛伏期內(nèi)不能感染其他易感染者。這些經(jīng)典的流行病模型廣泛應(yīng)用于謠言傳播和輿情傳播。
Sudbury[36]最先應(yīng)用傳染病的SIR模型來描述在不同村莊之間散布謠言的過程,其中沒有聽說傳聞的人處于易感染狀態(tài),聽到并希望傳播的人處于感染狀態(tài),已經(jīng)聽到但不感興趣的人處于難感染狀態(tài)。Sudbury研究的情況類似于在完整的隨機(jī)網(wǎng)絡(luò)散布謠言的過程。隨后,在小世界網(wǎng)絡(luò)和復(fù)雜無標(biāo)度網(wǎng)絡(luò)上,許多謠言的動(dòng)態(tài)傳播被提出。信息的傳播通常伴隨著輿情的擴(kuò)散, Deffuant、Krause-Hegselmann等模型的提出為輿情研究提供了堅(jiān)實(shí)的理論基礎(chǔ)。2000年,Deffuant等[37]指出在一組用戶某種意見形成的過程中,一般來說用戶不會(huì)簡單地分享其他用戶的意見,也不會(huì)對(duì)他人意見保持絕對(duì)冷漠,而是在一定程度上會(huì)考慮其他用戶的意見從而形成自己的意見。2002年,Kamo等[38]引入一個(gè)用于謠言傳播的隨機(jī)模型,導(dǎo)出描述復(fù)雜社交網(wǎng)絡(luò)模型演化的均值方程。利用這些方程的解析和數(shù)值解來檢驗(yàn)該模型在隨機(jī)圖、不相關(guān)的無標(biāo)度網(wǎng)絡(luò)和具有相關(guān)的無標(biāo)度網(wǎng)絡(luò)等幾種模型上的閾值。經(jīng)過證明,在閾值范圍內(nèi)謠言不能在系統(tǒng)中傳播。2003年,Moreno等[39]對(duì)復(fù)雜異構(gòu)網(wǎng)絡(luò)進(jìn)行分析和計(jì)算,提出了無標(biāo)度網(wǎng)絡(luò)隨機(jī)的演化過程。2012年,Roshani等[40]考慮代表關(guān)系密切程度的用戶之間的聯(lián)合強(qiáng)度,使傳統(tǒng)的常數(shù)感染因子成為用戶之前而定的強(qiáng)度函數(shù)。
近幾年,研究者從不同角度分析輿情的演化與傳播。2016年,Cheng等[41]指出當(dāng)意見具有相似且可接受性時(shí),有更多決策組支持的觀點(diǎn)最終會(huì)贏得更多的支持者,引入觀點(diǎn)可接受性和決策組對(duì)輿情傳播的促進(jìn)作用被得到證明。個(gè)體觀點(diǎn)的多樣性是導(dǎo)致輿情傳播不確定的一個(gè)重要因素。換而言之,意見之間的差異性會(huì)影響輿情擴(kuò)散的概率,而觀點(diǎn)的演化會(huì)導(dǎo)致擴(kuò)散概率的不確定性。2016年,Yan等[42]在不確定因素近似估計(jì)的基礎(chǔ)上,以觀點(diǎn)之間距離影響建立輿情擴(kuò)散模型。其認(rèn)為情感程度是決定網(wǎng)民傳播行為的關(guān)鍵,引入情感傳播的閾值(感染閾值和難治愈性閾值),提出基于Bayesian更新規(guī)則的交互模型。2017年,Alatas等[43]指出用戶觀點(diǎn)的水平和屬性受到其他連接用戶的社會(huì)連通性影響,試圖引入意見和連接性感知指數(shù)的概念來描述用戶的內(nèi)在行為。
為了有效引導(dǎo)網(wǎng)絡(luò)輿情,先要判別網(wǎng)民觀點(diǎn)以了解整個(gè)網(wǎng)絡(luò)輿情的觀點(diǎn)分布,再根據(jù)網(wǎng)絡(luò)輿情動(dòng)態(tài)特征,選擇特殊的主體及合適的策略進(jìn)行輿情引導(dǎo),使分散或負(fù)面的網(wǎng)絡(luò)輿情朝著正面的方向發(fā)展。網(wǎng)絡(luò)輿情引導(dǎo)是全球性問題,也得到全球主要國家的關(guān)注。基本的網(wǎng)絡(luò)輿情引導(dǎo)法可以總結(jié)為法律法規(guī)規(guī)范、專門機(jī)構(gòu)制約、技術(shù)手段控制三種方法。
從法律法規(guī)上,規(guī)范網(wǎng)絡(luò)輿情內(nèi)容?;诰W(wǎng)絡(luò)輿情的重要性,至今全球有60多個(gè)國家和地區(qū)制定和公布了與網(wǎng)絡(luò)輿情引導(dǎo)相關(guān)的法律法規(guī)。美國是網(wǎng)絡(luò)輿情立法最早的國家,其相關(guān)法律法規(guī)也最健全。其中1996年,美國頒布的《電信法》規(guī)定,如果利用網(wǎng)絡(luò)傳播信息,危害國家安全和社會(huì)穩(wěn)定、煽動(dòng)和誘導(dǎo)犯罪、損毀他人名譽(yù)、欺詐侵權(quán)、黑客攻擊、傳播色情信息等,一律追究刑事責(zé)任[44]。同年,英國頒布了《3R互聯(lián)網(wǎng)安全規(guī)則》[45]。我國最高人民法于2013年發(fā)布了《最高人民法院、最高人民檢察院關(guān)于辦理利用信息網(wǎng)絡(luò)實(shí)施誹謗等刑事案件適用法律若干問題的解釋》[46]等。法律法規(guī)在一定程度上能遏制負(fù)面網(wǎng)絡(luò)輿情的產(chǎn)生和傳播,但不能完全保證網(wǎng)絡(luò)輿情環(huán)境的健康。
設(shè)立網(wǎng)絡(luò)輿情機(jī)構(gòu),管理和規(guī)范網(wǎng)絡(luò)輿情傳播。由于法律法規(guī)的局限性,為更有效地管理網(wǎng)絡(luò)輿情,各國紛紛組建了網(wǎng)絡(luò)輿情監(jiān)測機(jī)構(gòu)。在國外,美國自“911”事件后,啟動(dòng)了“Total Information Awareness”計(jì)劃,通過搜集各種公開信息獲取有價(jià)值的情報(bào),并于2006資助了“Software Being Developed to Monitor Opinions of U.S.”項(xiàng)目,專門為政府開發(fā)各種負(fù)面輿情的監(jiān)視軟件。英國Autonomy公司推出的“互聯(lián)網(wǎng)輿情分析系統(tǒng)”目前已在許多領(lǐng)域中使用,引起各國輿情研究者的廣泛關(guān)注。在國內(nèi),軍犬、方正電子、拓爾思、飛科達(dá)等企業(yè)均開發(fā)了輿情監(jiān)測軟件,主要負(fù)責(zé)采集信息、自動(dòng)識(shí)別熱點(diǎn)新聞、預(yù)警負(fù)面消息、動(dòng)態(tài)展示輿情變化態(tài)勢等。一些主流媒體也建立了輿情監(jiān)測平臺(tái),監(jiān)測境內(nèi)外論壇、微博、博客、新聞網(wǎng)站等,如人民網(wǎng)輿情監(jiān)測室、中電傳媒輿情監(jiān)測、新華網(wǎng)“輿情在線”等。網(wǎng)絡(luò)輿情監(jiān)測機(jī)構(gòu)對(duì)于網(wǎng)絡(luò)中特定信息的搜集、挖掘,熱點(diǎn)、敏感話題的發(fā)現(xiàn)、跟蹤以及網(wǎng)絡(luò)輿情預(yù)警具有積極作用。然而,當(dāng)前的監(jiān)測機(jī)構(gòu)還難以準(zhǔn)確計(jì)算網(wǎng)絡(luò)輿情的觀點(diǎn)分布,難以精準(zhǔn)識(shí)別網(wǎng)絡(luò)輿情的意見領(lǐng)袖,從而無法提供精準(zhǔn)的輿情引導(dǎo)方案及策略。
從技術(shù)手段上,監(jiān)控和引導(dǎo)負(fù)面網(wǎng)絡(luò)輿情。目前常見的引導(dǎo)和監(jiān)控方式包括對(duì)突發(fā)事件的網(wǎng)絡(luò)輿情網(wǎng)站進(jìn)行過濾、刪貼,限制IP;開發(fā)虛擬機(jī)器人,在線跟蹤網(wǎng)絡(luò)謠言;采用強(qiáng)制手段對(duì)網(wǎng)絡(luò)輿情的制造者進(jìn)行干涉、打壓和報(bào)復(fù)。目前,從技術(shù)引導(dǎo)和控制手段上的網(wǎng)絡(luò)輿情引導(dǎo)方式單一、引導(dǎo)觀念滯后、引導(dǎo)效率低、缺乏自動(dòng)化的監(jiān)督形式。
目前網(wǎng)絡(luò)輿情引導(dǎo)策略研究比較零散,研究形式多樣,尚未構(gòu)成一套系統(tǒng)性的研究方案。從策略針對(duì)的客體,可分為網(wǎng)絡(luò)文本內(nèi)容的調(diào)控和輿情主體的調(diào)控。2014年,吳越等[47-48]認(rèn)為網(wǎng)絡(luò)文本內(nèi)容的調(diào)控包括敏感詞帖子的過濾、熱點(diǎn)帖子的自動(dòng)識(shí)別、帖子情感傾向的分類統(tǒng)計(jì)等。輿情主體的調(diào)控主要指對(duì)輿情主體進(jìn)行引導(dǎo),是目前網(wǎng)絡(luò)輿情引導(dǎo)的主流方法。2017年,毛乾任等[49]借助元胞自動(dòng)機(jī)模型,定義元胞基于鄰域影響和本身異質(zhì)屬性決定的狀態(tài)轉(zhuǎn)換規(guī)則,建立了一種網(wǎng)絡(luò)輿情導(dǎo)控策略。
從策略的強(qiáng)硬程度上,2011年,崔鑫等[50]將網(wǎng)絡(luò)輿情控制與引導(dǎo)分為硬調(diào)控和軟調(diào)控。硬調(diào)控是指出臺(tái)相關(guān)的法律法規(guī),并利用強(qiáng)硬技術(shù)手段對(duì)網(wǎng)絡(luò)輿情實(shí)施強(qiáng)制管理。例如,經(jīng)過對(duì)有害輿情信息關(guān)鍵詞的提取,設(shè)置關(guān)鍵詞過濾功能,禁止有害網(wǎng)絡(luò)輿情信息的出現(xiàn)。2017年,Wu等[51]總結(jié)了現(xiàn)有網(wǎng)絡(luò)輿情控制方法,當(dāng)發(fā)現(xiàn)有害網(wǎng)絡(luò)輿情,立即刪除并封堵地址、斷網(wǎng)查處是當(dāng)前比較常用的方法。軟調(diào)控是指利用“意見領(lǐng)袖”、主流媒體或網(wǎng)絡(luò)評(píng)論的影響力,潛移默化地影響網(wǎng)民的觀點(diǎn),把網(wǎng)民不正確或不理性的輿情引導(dǎo)到正確的方向。例如,說服教育,利用“意見領(lǐng)袖”引導(dǎo)觀點(diǎn)或改變?cè)掝}等。相比較而言,軟調(diào)控更符合構(gòu)建和諧社會(huì)和走可持續(xù)發(fā)展道路的需要。網(wǎng)絡(luò)輿情倡導(dǎo)的是自由、開放地發(fā)表言論,一味地封鎖消息只能起到暫時(shí)緩解的作用,引導(dǎo)網(wǎng)民的思想朝積極、健康的方向發(fā)展才是輿情控制的根本之道。
關(guān)鍵節(jié)點(diǎn)人物的輿情引導(dǎo)策略是眾多網(wǎng)絡(luò)輿情引導(dǎo)策略中一種可行性較高、效果較好的策略。關(guān)鍵節(jié)點(diǎn)人物的輿情引導(dǎo)并非對(duì)所有輿情節(jié)點(diǎn)人物觀點(diǎn)進(jìn)行引導(dǎo),而是先選擇少量特殊的輿情節(jié)點(diǎn)人物進(jìn)行引導(dǎo),然后通過節(jié)點(diǎn)人物在社交網(wǎng)絡(luò)中的關(guān)系進(jìn)行相互影響,進(jìn)而達(dá)到引導(dǎo)整個(gè)網(wǎng)絡(luò)輿情的目的。這些特殊的輿情節(jié)點(diǎn)人物包括主流媒體、極端主義者和意見領(lǐng)袖。2009年,張立[52]認(rèn)為主流媒體引導(dǎo)策略就像是群體外部的一個(gè)磁場對(duì)群體施加影響,影響范圍通常比較廣泛甚至是整個(gè)群體。由于主流媒體的權(quán)威性和長期以來網(wǎng)民對(duì)其建立起的信任和依賴,主流媒體發(fā)布的消息能夠得到網(wǎng)民的認(rèn)同或是不自覺地接受。因此,主流媒體是整個(gè)網(wǎng)絡(luò)輿情方向的引導(dǎo)器,在群體情感走向上起到至關(guān)重要的作用。主流媒體引導(dǎo)可以看作是網(wǎng)絡(luò)外部力量對(duì)網(wǎng)絡(luò)內(nèi)部節(jié)點(diǎn)人物強(qiáng)加觀點(diǎn)的一種引導(dǎo)模式。2010年,劉智等[53]提出了嵌入型引導(dǎo)策略,通過在網(wǎng)絡(luò)中選取某些特殊節(jié)點(diǎn)人物,使其對(duì)周圍節(jié)點(diǎn)人物施加影響,從而達(dá)到引導(dǎo)整個(gè)群體觀點(diǎn)的目的。在嵌入型引導(dǎo)策略中,極端節(jié)點(diǎn)人物和意見領(lǐng)袖通常是決定引導(dǎo)效果的關(guān)鍵因素。同年,Boccara[54]的實(shí)驗(yàn)結(jié)果表明,使觀點(diǎn)極端節(jié)點(diǎn)人物放棄他們觀點(diǎn)的最有效辦法是盡可能讓他們與其他輿情節(jié)點(diǎn)人物接觸,交流次數(shù)越多,觀點(diǎn)的偏激程度越能降低。Martins等[55](2010)在CODA模型中引入了與一般大眾想法相反的輿情節(jié)點(diǎn)人物,并研究其產(chǎn)生的效果。實(shí)驗(yàn)結(jié)果顯示,觀點(diǎn)相反的輿情節(jié)點(diǎn)人物的引入,能夠更有效降低群體中的極端觀點(diǎn),前提條件是這部分輿情節(jié)點(diǎn)人物的觀點(diǎn)沒那么極端。
觀點(diǎn)偏激的輿情節(jié)點(diǎn)人物是輿情形成中的一部分特殊群體,他們的立場堅(jiān)定、很難動(dòng)搖,且容易感染周圍沒有主見的其他節(jié)點(diǎn)人物。對(duì)于這部分人群,如果引導(dǎo)不善,很有可能引發(fā)暴亂,因此是網(wǎng)絡(luò)輿情引導(dǎo)中重要的研究部分。2013年,Shutters等[35]指出,極端主義者在群體觀點(diǎn)極化過程中起到了關(guān)鍵作用,并且設(shè)計(jì)了兩種方法用于防止群體觀點(diǎn)的極化,一種方法是移除網(wǎng)絡(luò)中的極端節(jié)點(diǎn)人物,另一種方法是引進(jìn)與原極端節(jié)點(diǎn)人物觀點(diǎn)相反的極端節(jié)點(diǎn)人物。實(shí)驗(yàn)證明,后者在任何時(shí)間引進(jìn)均有效果,和前者相比,不受時(shí)間限制。之后,Shutters進(jìn)一步研究了輿情節(jié)點(diǎn)人物接受新觀點(diǎn)程度的指標(biāo),發(fā)現(xiàn)指標(biāo)越小,極端節(jié)點(diǎn)人物越難帶動(dòng)整個(gè)群體的觀點(diǎn)發(fā)生極化現(xiàn)象。
此外,許多研究者在制定引導(dǎo)策略的過程中都提到了針對(duì)敏感問題,在網(wǎng)站、網(wǎng)絡(luò)論壇等網(wǎng)絡(luò)社交平臺(tái)中培養(yǎng)專業(yè)的意見領(lǐng)袖,將正面的、權(quán)威的言論置頂,正確引導(dǎo)主流言論,促進(jìn)社會(huì)和諧穩(wěn)定的發(fā)展。由此可見,意見領(lǐng)袖在整個(gè)網(wǎng)絡(luò)輿情導(dǎo)向中的作用不容小覷。2016年,F(xiàn)an 等[56]的方法值得借鑒,他們定義的知情代理人是受雇或選擇傳播預(yù)先設(shè)定意見的普通代理人,提出了一種基于動(dòng)力學(xué)模型的知情代理人影響力下的輿情演化方案。
綜上,在網(wǎng)絡(luò)輿情引導(dǎo)上,人工手段干預(yù)依舊是主流方式。盡管學(xué)者從多個(gè)角度展開相關(guān)研究,但當(dāng)前研究依舊缺乏系統(tǒng)的理論方法對(duì)網(wǎng)絡(luò)負(fù)面輿情加以引導(dǎo)。如何從輿情演化的角度,融合社交網(wǎng)絡(luò)平衡理論、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等方法,建立輿情引導(dǎo)理論模型,研究模型的特征參數(shù)和引導(dǎo)學(xué)習(xí)算法,達(dá)到負(fù)面輿情向著正向演化,是一個(gè)有待深入研究的問題。
網(wǎng)絡(luò)輿情引導(dǎo)應(yīng)用系統(tǒng)開發(fā)也是主要研究方向之一。目前國內(nèi)外存在部分有關(guān)網(wǎng)絡(luò)輿情的應(yīng)用系統(tǒng),這些應(yīng)用系統(tǒng)功能重點(diǎn)在于網(wǎng)絡(luò)輿情監(jiān)控、發(fā)現(xiàn)、感知等方面。它們多應(yīng)用在新聞學(xué)、傳播學(xué)、社會(huì)科學(xué)等領(lǐng)域,從政策、法律、管理、硬調(diào)控等方法防止負(fù)面輿情的傳播。如何充分利用人工智能方法,對(duì)互聯(lián)網(wǎng)海量的文本信息進(jìn)行自動(dòng)處理與分析、挖掘輿情情感傾向、設(shè)計(jì)負(fù)面輿情正向引導(dǎo)式學(xué)習(xí)算法,開發(fā)其應(yīng)用系統(tǒng)還需要深入研究。特別是開發(fā)面向社交網(wǎng)絡(luò)短文本信息的輿情引導(dǎo)系統(tǒng)是當(dāng)務(wù)之急。
綜上,網(wǎng)絡(luò)文本觀點(diǎn)挖掘、社交網(wǎng)絡(luò)結(jié)構(gòu)平衡、網(wǎng)絡(luò)輿情演化等是近年來的熱門研究領(lǐng)域,研究方法很多。但是,這三者對(duì)網(wǎng)絡(luò)輿情引導(dǎo)的效果并未得到驗(yàn)證。當(dāng)前網(wǎng)絡(luò)輿情引導(dǎo)策略和方法零散,未有系統(tǒng)性框架及具體實(shí)施方案,更沒有從網(wǎng)絡(luò)結(jié)構(gòu)平衡的角度出發(fā)而進(jìn)行輿情引導(dǎo)策略的研究。
為構(gòu)建一套完整的網(wǎng)絡(luò)輿情引導(dǎo)策略、系統(tǒng)理論、方法及應(yīng)用技術(shù),結(jié)合以上綜述,本文基于結(jié)構(gòu)平衡理論對(duì)社交網(wǎng)絡(luò)輿情正向引導(dǎo)方法進(jìn)行了初步設(shè)計(jì),重點(diǎn)從以下四個(gè)方面展開:1)構(gòu)建話題熱度、話題觀點(diǎn)、話題情感傾向時(shí)間序列,利用時(shí)序特性分析方法判別話題討論是否構(gòu)成負(fù)面網(wǎng)絡(luò)輿情。2)建立正負(fù)關(guān)系網(wǎng)絡(luò),分析網(wǎng)絡(luò)輿情演化生命周期,網(wǎng)絡(luò)結(jié)構(gòu)從非平衡狀態(tài)向平衡狀態(tài)演化的相變過程。3)在平衡理論指導(dǎo)下,從生命周期模型中抽象出各階段特征演化規(guī)律,建立刻畫網(wǎng)絡(luò)輿情演化的特征參數(shù)。4)針對(duì)微博話題討論平臺(tái),構(gòu)建基于網(wǎng)絡(luò)結(jié)構(gòu)平衡理論的輿情正向引導(dǎo)學(xué)習(xí)算法、策略、方法及應(yīng)用系統(tǒng)。各部分研究內(nèi)容之間的關(guān)系如圖2所示。
圖2 主要研究內(nèi)容及各部分間關(guān)系
面對(duì)社交媒體海量話題的相關(guān)討論,如何從中準(zhǔn)確判別網(wǎng)絡(luò)負(fù)面輿情是制定有效輿情引導(dǎo)策略的必要前提。話題討論最終演化為大規(guī)模輿情需要滿足兩個(gè)基本條件:一是話題討論群體數(shù)量要達(dá)到一定規(guī)模,二是群體觀點(diǎn)需逐步極化趨于一致。以這兩個(gè)基本條件為約束,可將網(wǎng)絡(luò)輿情演化過程形式化為話題熱度、話題觀點(diǎn)、話題情感傾向時(shí)間序列。其中,熱度時(shí)間序列是以話題參與人數(shù)為變量值構(gòu)成的時(shí)間序列;話題觀點(diǎn)時(shí)間序列是話題討論群體的觀點(diǎn)分布隨時(shí)間的變化數(shù)值;話題情感傾向時(shí)間序列是話題觀點(diǎn)正面和負(fù)面極性隨時(shí)間變化的分布。對(duì)此可重點(diǎn)研究以下幾個(gè)方面。
1)話題聚類。研究社交網(wǎng)絡(luò)話題搜索策略,搜索與給定話題相關(guān)的網(wǎng)絡(luò)文本及其評(píng)論文本集合。
2)網(wǎng)絡(luò)輿情知識(shí)圖譜。針對(duì)社交網(wǎng)絡(luò)平臺(tái),分析歷史文本內(nèi)容,提取情感詞實(shí)體,分析實(shí)體之間的關(guān)系,描述實(shí)體和關(guān)系不同特征的程度詞,建立特定領(lǐng)域網(wǎng)絡(luò)輿情情感傾向知識(shí)圖譜。
3)數(shù)據(jù)融合。借助知識(shí)圖譜,對(duì)收集到的社交網(wǎng)絡(luò)文本數(shù)據(jù)進(jìn)行清洗。過濾垃圾文本、無觀點(diǎn)文本;對(duì)不同話題進(jìn)行語義分析,從語義上歸并同詞多義、多詞同義話題;對(duì)描述話題的文本進(jìn)行規(guī)范化。
4)分析時(shí)間窗口的劃分粒度,定義話題熱度變量,構(gòu)建話題熱度時(shí)間序列。通過提取社交網(wǎng)絡(luò)文本的評(píng)論對(duì)象和評(píng)論觀點(diǎn),計(jì)算單位時(shí)間粒度中群體觀點(diǎn)分布大小,構(gòu)建話題觀點(diǎn)時(shí)間序列。再結(jié)合話題熱度和觀點(diǎn)時(shí)間序列,分析話題情感,建立網(wǎng)絡(luò)輿情的判別模型。
社交網(wǎng)絡(luò)上的群體觀點(diǎn)由分散狀態(tài)向極化狀態(tài)轉(zhuǎn)化,究其根本動(dòng)因是初始的社交網(wǎng)絡(luò)中存在矛盾個(gè)體,這些個(gè)體位于不同觀點(diǎn)甚至反向觀點(diǎn)之間的不穩(wěn)定位置,從而打破了網(wǎng)絡(luò)結(jié)構(gòu)的平衡性,導(dǎo)致網(wǎng)絡(luò)結(jié)構(gòu)不斷發(fā)生演變,直至最后達(dá)到另一種平衡狀態(tài)。文章認(rèn)為可以利用網(wǎng)絡(luò)結(jié)構(gòu)平衡理論解釋并分析網(wǎng)絡(luò)輿情演化過程,并探討其與輿情生命周期之間的關(guān)系。研究點(diǎn)主要包括以下方面。
1)網(wǎng)絡(luò)輿情的生命周期模型。在網(wǎng)絡(luò)輿情演變過程中,借助網(wǎng)絡(luò)文本情感傾向時(shí)間序列,分析社交網(wǎng)絡(luò)結(jié)構(gòu)特性和網(wǎng)絡(luò)文本內(nèi)容變化之間的關(guān)聯(lián)關(guān)系,建立網(wǎng)絡(luò)輿情從話題誕生到輿情消亡的生命周期模型。
2)構(gòu)建社交網(wǎng)絡(luò)的正負(fù)關(guān)系網(wǎng)絡(luò)。以輿情話題為中心,在不同的時(shí)間點(diǎn)上,提取不同輿情話題討論中個(gè)體之間的正向關(guān)系和負(fù)向關(guān)系,構(gòu)建一個(gè)混有正向和負(fù)向關(guān)系的符號(hào)網(wǎng)絡(luò)。
3)對(duì)基于輿情話題的正負(fù)關(guān)系社交網(wǎng)絡(luò)進(jìn)行k-核分解,提取中心結(jié)構(gòu)的網(wǎng)絡(luò)。
4)根據(jù)個(gè)體之間的正負(fù)關(guān)系對(duì)中心網(wǎng)絡(luò)進(jìn)行超節(jié)點(diǎn)辨別,解構(gòu)正負(fù)關(guān)系網(wǎng)絡(luò),生成簡約圖。 利用網(wǎng)絡(luò)結(jié)構(gòu)弱平衡特性分析簡約圖的平衡性,發(fā)現(xiàn)非平衡結(jié)構(gòu)及矛盾節(jié)點(diǎn)。
5)根據(jù)真實(shí)輿情數(shù)據(jù)建立群體觀點(diǎn)情感傾向變化與網(wǎng)絡(luò)結(jié)構(gòu)協(xié)同演化模型,分析社交網(wǎng)絡(luò)結(jié)構(gòu)平衡特性與時(shí)間變化趨勢。
網(wǎng)絡(luò)平衡理論已充分證實(shí)破窗原理、羊群效應(yīng)、群體極化效應(yīng)是三種有效打破網(wǎng)絡(luò)平衡的策略。一個(gè)不平衡網(wǎng)絡(luò)的重要特征是出現(xiàn)結(jié)構(gòu)洞和同質(zhì)化現(xiàn)象。在社交網(wǎng)絡(luò)輿情演化過程中,發(fā)現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)洞,是利用破窗原理引導(dǎo)網(wǎng)絡(luò)輿情發(fā)展趨勢的方法。網(wǎng)絡(luò)輿情中的關(guān)鍵節(jié)點(diǎn)人物是對(duì)輿情導(dǎo)向起到重要作用的領(lǐng)袖人物,他們能潛移默化地引導(dǎo)甚至改變普通群眾的觀點(diǎn),利用意見領(lǐng)袖的作用引導(dǎo)社交網(wǎng)絡(luò)輿情發(fā)展是羊群效應(yīng)的體現(xiàn)。社交網(wǎng)絡(luò)群體中,網(wǎng)絡(luò)話題情感傾向往往朝著大多數(shù)人的觀點(diǎn)演化,最后形成網(wǎng)絡(luò)輿情, 這種群體極化效應(yīng)典型的特征是網(wǎng)絡(luò)觀點(diǎn)的同質(zhì)化。對(duì)此可重點(diǎn)研究以下幾個(gè)方面。
3.3.1 網(wǎng)絡(luò)結(jié)構(gòu)洞分析
1)充分利用網(wǎng)絡(luò)三元閉包原理,分析社交網(wǎng)絡(luò)節(jié)點(diǎn)本身的聚集系數(shù)。
2)研究網(wǎng)絡(luò)中節(jié)點(diǎn)與節(jié)點(diǎn)之間的強(qiáng)關(guān)系和弱關(guān)系?;谏缃淮笠?guī)模網(wǎng)絡(luò),節(jié)點(diǎn)之間的聯(lián)系強(qiáng)度反映節(jié)點(diǎn)之間的關(guān)系本身的緊密程度,建立計(jì)算模型將符號(hào)網(wǎng)絡(luò)邊的關(guān)系進(jìn)行量化。
3)研究網(wǎng)絡(luò)中節(jié)點(diǎn)與節(jié)點(diǎn)之間的鄰里重疊度。鄰里重疊度是網(wǎng)絡(luò)節(jié)點(diǎn)之間的信任度關(guān)系大小衡量的標(biāo)準(zhǔn)。
4)從網(wǎng)絡(luò)結(jié)構(gòu)分析角度,融合聚集系數(shù)、聯(lián)系強(qiáng)度、鄰里重疊度,設(shè)計(jì)算法挖掘網(wǎng)絡(luò)中捷徑邊(節(jié)點(diǎn)之間聯(lián)系弱、信任小、兩邊節(jié)點(diǎn)聚集系數(shù)小)。研究捷徑邊在網(wǎng)絡(luò)中分布規(guī)律,社交網(wǎng)絡(luò)中結(jié)構(gòu)洞發(fā)現(xiàn)方法。
3.3.2 網(wǎng)絡(luò)意見領(lǐng)袖挖掘
1)分析在不同時(shí)間點(diǎn)與不同話題應(yīng)用場景的符號(hào)網(wǎng)絡(luò)結(jié)構(gòu)特性及不同節(jié)點(diǎn)對(duì)應(yīng)人物的文本信息,深度挖掘?qū)π畔鞑?、輿情演化具有重要作用的用戶指?biāo)。
2)分析不同用戶指標(biāo)對(duì)話題信息傳播的影響力大小。選取影響力大的指標(biāo)集合構(gòu)建用戶影響力模型,以此識(shí)別社交網(wǎng)絡(luò)中具有影響力的用戶。
3)結(jié)合平衡理論,設(shè)計(jì)關(guān)鍵節(jié)點(diǎn)人物識(shí)別方法與算法,區(qū)分對(duì)鄰居用戶具有正向影響力的意見領(lǐng)袖和具有負(fù)向影響力的靶子領(lǐng)袖。
3.3.3 網(wǎng)絡(luò)同質(zhì)化分析
1) 結(jié)合網(wǎng)絡(luò)約簡圖,研究社交符號(hào)網(wǎng)絡(luò)、網(wǎng)絡(luò)輿情觀點(diǎn)情感傾向的分布。針對(duì)不同輿情網(wǎng)絡(luò),將網(wǎng)絡(luò)節(jié)點(diǎn)分為持有正向觀點(diǎn)和負(fù)向觀點(diǎn)兩類。
2)量化網(wǎng)絡(luò)同質(zhì)性,建立同質(zhì)化強(qiáng)度指標(biāo)。將持有相同觀點(diǎn)的節(jié)點(diǎn),占網(wǎng)絡(luò)總節(jié)點(diǎn)比例作為網(wǎng)絡(luò)同質(zhì)化強(qiáng)度指標(biāo)。
3)分析不同類別網(wǎng)絡(luò)節(jié)點(diǎn)分布情況,通過計(jì)算網(wǎng)絡(luò)中跨類邊顯著水平,建立網(wǎng)絡(luò)輿情情感傾向分布的同化能力。
面對(duì)不同社交網(wǎng)絡(luò),輿情的引導(dǎo)策略存在個(gè)體化差異。選擇合適的社交網(wǎng)絡(luò)作為應(yīng)用場景,制定有針對(duì)性的輿情引導(dǎo)策略與方法,通過改變網(wǎng)絡(luò)內(nèi)正向關(guān)鍵節(jié)點(diǎn)人物、負(fù)向關(guān)鍵節(jié)點(diǎn)人物的鄰居節(jié)點(diǎn)觀點(diǎn),在網(wǎng)絡(luò)的不同位置,適當(dāng)增加意見領(lǐng)袖等措施,以改變網(wǎng)絡(luò)結(jié)構(gòu)平衡的特征參數(shù),達(dá)到引導(dǎo)目的。一個(gè)網(wǎng)絡(luò)輿情引導(dǎo)模型包括特征參數(shù)、學(xué)習(xí)算法、引導(dǎo)策略、引導(dǎo)效果度量、學(xué)習(xí)系統(tǒng)等。因此,本文認(rèn)為可以微博平臺(tái)數(shù)據(jù)為應(yīng)用場景,研究微博平臺(tái)上的社交網(wǎng)絡(luò)輿情正向引導(dǎo)式學(xué)習(xí)算法,確定引導(dǎo)模型及系統(tǒng)。需要進(jìn)一步研究的內(nèi)容如下。
3.4.1 引導(dǎo)策略
1)制定基于結(jié)構(gòu)平衡的微博輿情引導(dǎo)策略。針對(duì)微博熱點(diǎn)敏感輿情話題,獲取網(wǎng)民觀點(diǎn),研究負(fù)向輿情觀點(diǎn)對(duì)立的(正向)觀點(diǎn)的形成。
2)調(diào)整關(guān)鍵節(jié)點(diǎn)人物鄰居關(guān)系,增加正向關(guān)鍵節(jié)點(diǎn)人物影響力,降低負(fù)向關(guān)鍵節(jié)點(diǎn)人物的影響力。在適當(dāng)?shù)奈恢迷黾诱嬗^點(diǎn)的意見領(lǐng)袖,使其成為關(guān)鍵人物。局部調(diào)整正負(fù)關(guān)系網(wǎng)絡(luò)的結(jié)構(gòu),使其從一種網(wǎng)絡(luò)狀態(tài)向另一種平衡狀態(tài)進(jìn)行演化,利用網(wǎng)絡(luò)結(jié)構(gòu)平衡理論研究微博輿情引導(dǎo)方法。
3.4.2 學(xué)習(xí)算法
1)建立正向引導(dǎo)式學(xué)習(xí)算法。網(wǎng)絡(luò)輿情在其生命周期內(nèi)的每個(gè)階段,從話題誕生,到輿情負(fù)向的影響,再到負(fù)向輿情的激化,乃至高潮的爆發(fā),是社交網(wǎng)絡(luò)用戶觀點(diǎn)逐漸受到其它觀點(diǎn)影響的過程。網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)都是一個(gè)智能體,每個(gè)智能體間觀點(diǎn)交互影響的過程,實(shí)質(zhì)就是一個(gè)智能體學(xué)習(xí)到其它智能體(特別是意見領(lǐng)袖)的觀點(diǎn),而使自己的觀點(diǎn)更新變化的過程。每個(gè)參與網(wǎng)絡(luò)輿情的智能體通過學(xué)習(xí)正向觀點(diǎn),讓他們的觀點(diǎn)朝正向發(fā)展,就是一個(gè)正向引導(dǎo)。文章認(rèn)為可以網(wǎng)絡(luò)輿情生命周期的連續(xù)兩個(gè)階段為一個(gè)學(xué)習(xí)過程,探討輿情生命周期每個(gè)階段學(xué)習(xí)的特征參數(shù)分布情況。
2)研究意見領(lǐng)袖智能體與其它智能體之間觀點(diǎn)變化,建立特征參數(shù)損失函數(shù);可借鑒有監(jiān)督的Dual Learning機(jī)器學(xué)習(xí)方法的基本思想,建立網(wǎng)絡(luò)輿情正向式引導(dǎo)學(xué)習(xí)算法。
3.4.3 構(gòu)建學(xué)習(xí)系統(tǒng)和度量引導(dǎo)效果
1)以微博輿情為載體,實(shí)現(xiàn)學(xué)習(xí)算法,搭建引導(dǎo)模型的具體引導(dǎo)系統(tǒng),設(shè)計(jì)并實(shí)現(xiàn)相關(guān)應(yīng)用模塊、可視化界面及接口。
2)針對(duì)不同應(yīng)用場景和不同輿情話題,分析網(wǎng)絡(luò)輿情引導(dǎo)策略的差異性,評(píng)估系統(tǒng)及訪問接口的可移植性。
3)設(shè)計(jì)評(píng)估指標(biāo),結(jié)合仿真實(shí)驗(yàn)與真實(shí)輿情數(shù)據(jù)測試,分析輿情引導(dǎo)策略的實(shí)施效果。
為促進(jìn)社交網(wǎng)絡(luò)輿情正向引導(dǎo),本文從網(wǎng)絡(luò)短文本觀點(diǎn)挖掘、結(jié)構(gòu)平衡理論及其演化動(dòng)力學(xué)、網(wǎng)絡(luò)輿情傳播方法、網(wǎng)絡(luò)輿情引導(dǎo)方法以及相應(yīng)系統(tǒng)設(shè)計(jì)五個(gè)方面較為系統(tǒng)全面地對(duì)本領(lǐng)域國內(nèi)外相關(guān)研究進(jìn)行綜述。當(dāng)前國內(nèi)外在網(wǎng)絡(luò)輿情引導(dǎo)策略、相關(guān)理論、實(shí)用方法和應(yīng)用技術(shù)上研究比較欠缺,遠(yuǎn)未成體系。在研究綜述的基礎(chǔ)上,以構(gòu)建完整網(wǎng)絡(luò)輿情引導(dǎo)理論體系和設(shè)計(jì)實(shí)用方法技術(shù)為目的,基于結(jié)構(gòu)平衡理論對(duì)社交網(wǎng)絡(luò)輿情正向引導(dǎo)方法進(jìn)行了初步設(shè)計(jì),以期更有效地對(duì)社交網(wǎng)絡(luò)輿情進(jìn)行基于計(jì)算機(jī)技術(shù)的引導(dǎo)和干預(yù)。