張思龍 王蘭成 婁國(guó)哲
收稿日期:2020-08-03
基金項(xiàng)目:全軍研究生重點(diǎn)課題(項(xiàng)目編號(hào):2018JY62);裝備軍內(nèi)科研2019年課題和國(guó)防大學(xué)數(shù)據(jù)工程專項(xiàng)(項(xiàng)目編號(hào):DSJGCZY19012)。
作者簡(jiǎn)介:張思龍(1987-),男,講師,博士研究生,研究方向:計(jì)算機(jī)情報(bào)分析、網(wǎng)絡(luò)輿情監(jiān)測(cè)。王蘭成(1962-),男,教授,博士生導(dǎo)師,研究方向:計(jì)算機(jī)情報(bào)分析、網(wǎng)絡(luò)輿情監(jiān)測(cè)。婁國(guó)哲(1982-),男,講師,博士,研究方向:網(wǎng)絡(luò)輿情監(jiān)測(cè)、政工信息化。
摘要:[目的/意義]知識(shí)圖譜基礎(chǔ)應(yīng)用對(duì)于加強(qiáng)網(wǎng)絡(luò)輿情研判系統(tǒng)智能化水平具有重要意義。[方法/過(guò)程]本文在相關(guān)研究基礎(chǔ)上,針對(duì)知識(shí)圖譜在系統(tǒng)中融合路徑進(jìn)行了探析,并提出了基于知識(shí)圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)模型,對(duì)網(wǎng)絡(luò)輿情研判系統(tǒng)構(gòu)建實(shí)踐和應(yīng)用進(jìn)行了探討。[結(jié)果/結(jié)論]研究表明,基于知識(shí)圖譜的應(yīng)用,有利于網(wǎng)絡(luò)輿情大數(shù)據(jù)的精準(zhǔn)獲取和智能化計(jì)算,有利于統(tǒng)一網(wǎng)絡(luò)輿情信息資源和加強(qiáng)語(yǔ)義分析,有利于準(zhǔn)確分析研判網(wǎng)絡(luò)輿情的風(fēng)險(xiǎn)點(diǎn)、矛盾點(diǎn),有利于輿情自動(dòng)編報(bào)、精準(zhǔn)推薦和決策支持。
關(guān)鍵詞:知識(shí)圖譜;網(wǎng)絡(luò)輿情;研判系統(tǒng);人工智能;融合路徑
DOI:10.3969/j.issn.1008-0821.2021.04.002
〔中圖分類號(hào)〕G203〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2021)04-0010-07
Research on Network Public Opinion Analysis and
Judgment System Based on Knowledge Graph
Zhang SilongWang LanchengLou Guozhe
(National Defense University Political College,Shanghai 200433,China)
Abstract:[Purpose/Significance]The research of knowledge graph is at the cutting edge of world information technology,and the basic application of that is of great significance to strengthen the intelligent level of network public opinion analysis and judgment system;[Method/Process]On the basis of related research,this paper discussed the fusion path of knowledge graph in the system,then put forward the network public opinion analysis and judgment system model based on knowledge graph,and discussed the construction practice and application of system;[Result/Conclusion]The research showed that the application of knowledge graph was conducive to the accurate acquisition and intelligent calculation of network public opinion big data,the unification of network public opinion information resources and the enhancement of semantic analysis,the accurate analysis and judgment of risk points and contradiction points of network public opinion,as well as the automatic public opinion reporting,accurate recommendation and decision support.
Key words:knowledge graph;network public opinion;analysis and judgment system;artificial intelligence;fusion path
知識(shí)圖譜是一種面向人工智能的高級(jí)語(yǔ)義建模、知識(shí)組織、知識(shí)匹配和推理計(jì)算技術(shù)。在基于知識(shí)圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)中,任務(wù)關(guān)聯(lián)的目標(biāo),例如事件、機(jī)構(gòu)、地區(qū)、人物、行業(yè)、企業(yè)、產(chǎn)品等與領(lǐng)域情報(bào)相關(guān)的概念或?qū)嶓w,以及各類概念或?qū)嶓w之間的關(guān)系(比如任職、發(fā)布等),都在知識(shí)圖譜中以節(jié)點(diǎn)和邊的形式結(jié)構(gòu)化。網(wǎng)絡(luò)輿情研判數(shù)據(jù)采集、分析處理、輿情編報(bào)等業(yè)務(wù)運(yùn)用知識(shí)圖譜技術(shù)進(jìn)行有效數(shù)據(jù)管理,同時(shí)針對(duì)業(yè)務(wù)需求中的任何分析意圖,進(jìn)行細(xì)粒度的語(yǔ)義理解和精確匹配。
大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)輿情研判任務(wù)更加復(fù)雜,知識(shí)分布更加分散,有效數(shù)據(jù)獲取和精準(zhǔn)研判更加困難。研究基于知識(shí)圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)旨在達(dá)到3個(gè)方面的期望:①在網(wǎng)絡(luò)輿情文本等數(shù)據(jù)語(yǔ)義表達(dá)和關(guān)聯(lián)上,突破傳統(tǒng)的關(guān)鍵詞詞袋、向量空間等模型,轉(zhuǎn)變?yōu)楦Ⅲw、更全面、更開放、更規(guī)范的語(yǔ)義網(wǎng)絡(luò)模型,使得研判業(yè)務(wù)目標(biāo)數(shù)據(jù)都能包含在統(tǒng)一的模型框架中;②在網(wǎng)絡(luò)輿情研判知識(shí)匹配和擴(kuò)展上,借鑒人工智能技術(shù)的應(yīng)用,使之更加智能化和精確化;③在輿情知識(shí)推理和智能化研判上,運(yùn)用知識(shí)圖譜積累的大量知識(shí)點(diǎn)及其關(guān)系,機(jī)器學(xué)習(xí)自動(dòng)發(fā)現(xiàn)隱含的知識(shí)和關(guān)系模式,提高大數(shù)據(jù)知識(shí)發(fā)現(xiàn)及預(yù)測(cè)的效果和可解釋性。
1相關(guān)研究現(xiàn)狀
1.1網(wǎng)絡(luò)輿情研判相關(guān)研究
1.1.1網(wǎng)絡(luò)輿情研判信息處理流程
網(wǎng)絡(luò)輿情研判屬于網(wǎng)絡(luò)輿情管理的研究范疇,是對(duì)網(wǎng)絡(luò)媒體和用戶產(chǎn)生的并在網(wǎng)絡(luò)上進(jìn)行傳播的輿情信息進(jìn)行價(jià)值或趨向判定的過(guò)程。在工作實(shí)踐中,網(wǎng)絡(luò)輿情研判的信息處理一般包括網(wǎng)絡(luò)輿情信息搜集、網(wǎng)絡(luò)輿情信息分析、網(wǎng)絡(luò)輿情信息編報(bào)和網(wǎng)絡(luò)輿情信息控制等流程,如圖1所示。
其中,信息搜集是網(wǎng)絡(luò)輿情研判的開始;信息分析是網(wǎng)絡(luò)輿情研判的關(guān)鍵,主要完成真?zhèn)闻袛唷⒎诸惡Y選、統(tǒng)計(jì)分析等工作,提煉出輿情矛盾點(diǎn)、異化點(diǎn)、風(fēng)險(xiǎn)點(diǎn),為網(wǎng)絡(luò)輿情信息編報(bào)提供數(shù)據(jù)支撐;信息編報(bào)是網(wǎng)絡(luò)輿情研判的重要過(guò)程,研判人員通過(guò)編報(bào)選題、材料海選、資料歸集、歸納意見形成編報(bào)內(nèi)容,按照對(duì)應(yīng)編輯刊物的格式編寫,審查核對(duì)后上報(bào)相關(guān)部門,網(wǎng)絡(luò)輿情的重要性主要通過(guò)輿情編報(bào)體現(xiàn);信息控制是網(wǎng)絡(luò)輿情研判的反饋機(jī)制,目的是減少有害信息傳播,預(yù)防輿情危機(jī)事件發(fā)生。從業(yè)務(wù)流程上看,它并不屬于網(wǎng)絡(luò)輿情研判的范疇,但它卻是研判成果作用于網(wǎng)絡(luò)輿情發(fā)展的進(jìn)一步行動(dòng),同時(shí)信息控制的效果也需要研判進(jìn)行評(píng)估。
1.1.2網(wǎng)絡(luò)輿情研判方法和模型
網(wǎng)絡(luò)輿情研判相關(guān)研究主要有兩個(gè)思路:一是從輿情安全評(píng)估和預(yù)警角度研究網(wǎng)絡(luò)輿情評(píng)估指標(biāo)和方法;二是從信息傳播角度研究網(wǎng)絡(luò)輿情演化模型。
網(wǎng)絡(luò)輿情評(píng)估指標(biāo)體系相關(guān)研究主要集中在通用輿情、特定事件輿情和特定領(lǐng)域輿情的評(píng)估等,比如劉健等[1]面向微博信息傳播,研究設(shè)計(jì)了信息傳播者、受傳者、信息內(nèi)容、傳播渠道、傳播環(huán)境屬性等指標(biāo);陳建敏等[2]引入信息空間模型,提出涉軍網(wǎng)絡(luò)輿情信息指標(biāo)體系設(shè)計(jì)思路、原則和方法等。對(duì)應(yīng)的評(píng)估方法主要有基于層次分析法(APH)和基于模糊評(píng)價(jià)法的研究方法。層次分析法廣泛應(yīng)用于指標(biāo)體系設(shè)計(jì),同時(shí)基于指標(biāo)體系的輿情評(píng)估也多基于層次分析法分析指標(biāo)權(quán)重?;谀:u(píng)價(jià)法即通過(guò)概率等數(shù)學(xué)手段處理模糊的評(píng)價(jià)對(duì)象,比如輿情熱點(diǎn)詞匯、評(píng)論意見等。近幾年兩種方法趨于結(jié)合,如王高飛等[3]將層次分析法與模糊綜合分析法相結(jié)合,構(gòu)建基于AHP-模糊綜合分析的移動(dòng)社交網(wǎng)絡(luò)輿情預(yù)警模型,通過(guò)實(shí)證說(shuō)明模型的有效性和準(zhǔn)確性。
網(wǎng)絡(luò)輿情演化模型及模擬仿真研究方面,早期主要基于生命周期理論對(duì)網(wǎng)絡(luò)輿情生命周期進(jìn)行劃分。隨著大數(shù)據(jù)時(shí)代的到來(lái),面對(duì)海量的輿情數(shù)據(jù)和復(fù)雜的網(wǎng)絡(luò)傳播路徑,越來(lái)越多的學(xué)者引入了復(fù)雜網(wǎng)絡(luò)、模擬仿真、數(shù)據(jù)挖掘、人工智能等技術(shù)研究輿情擴(kuò)散機(jī)理、群體性事件預(yù)測(cè)等。如劉繼等[4]基于復(fù)雜網(wǎng)絡(luò)對(duì)輿情團(tuán)落進(jìn)行分析,利用深度學(xué)習(xí)提高輿情智能計(jì)算能力,對(duì)網(wǎng)絡(luò)輿情事件進(jìn)行演化推理,提升網(wǎng)絡(luò)輿情態(tài)勢(shì)智能分析水平;彭程等[5]基于SIR傳染病模型與EGM灰色預(yù)測(cè)模型,提出一種實(shí)現(xiàn)輿情預(yù)警與輿情防控模型等。
1.2知識(shí)圖譜及其在網(wǎng)絡(luò)輿情研究中的應(yīng)用
知識(shí)圖譜(Knowledge Graph,KG)由Google最先提出,目標(biāo)是使其主營(yíng)的搜索業(yè)務(wù)實(shí)現(xiàn)智能化,目前已成為人工智能領(lǐng)域的技術(shù)前沿。知識(shí)圖譜是指描述現(xiàn)實(shí)世界中概念、常識(shí)及其關(guān)系的結(jié)構(gòu)化的語(yǔ)義知識(shí)庫(kù),其基本組成單元是〈概念/實(shí)體,關(guān)系,概念/實(shí)體〉三元組和〈概念/實(shí)體,屬性,屬性值〉三元組。知識(shí)圖譜通過(guò)兩種基本組成單元將知識(shí)表達(dá)為圖結(jié)構(gòu),易于知識(shí)的展現(xiàn)、維護(hù)、檢索和推理?;谥R(shí)圖譜的應(yīng)用,可以提升社交網(wǎng)絡(luò)的輿情分析管控能力,如馬哲坤等[6]基于突發(fā)事件網(wǎng)絡(luò)輿情的時(shí)間特征指標(biāo)建立含有語(yǔ)義關(guān)系的突發(fā)話題圖譜,實(shí)現(xiàn)突發(fā)事件網(wǎng)絡(luò)輿情熱點(diǎn)話題傳播分析。
也有研究者基于知識(shí)圖譜構(gòu)建事件類知識(shí)圖譜用于網(wǎng)絡(luò)輿情事件研判。如Gottschalk S等[7]提出了一種以事件為中心的多語(yǔ)言時(shí)序知識(shí)圖譜,從現(xiàn)有大型知識(shí)圖譜中抽取事件、關(guān)系,并進(jìn)行了融合;彭立發(fā)[8]以事件類型的實(shí)體為例,提出并構(gòu)建了一個(gè)以事件為中心、通過(guò)事件要素進(jìn)行關(guān)聯(lián)擴(kuò)展的網(wǎng)絡(luò)社區(qū)知識(shí)圖譜。
基于知識(shí)圖譜,Li Z等[9]于2018年提出了事理圖譜概念,描述事件之間的順承關(guān)系和因果關(guān)系,用于發(fā)現(xiàn)事件的演化規(guī)律和后續(xù)事件的預(yù)測(cè)。周京艷等[10]比較了概念地圖、知識(shí)圖譜、事理圖譜的概念內(nèi)涵,界定了情報(bào)事理圖譜的概念,認(rèn)為事理圖譜在情報(bào)理論、情報(bào)判讀和情報(bào)預(yù)測(cè)等方面均具有重要價(jià)值。單曉紅等[11]以醫(yī)療領(lǐng)域網(wǎng)絡(luò)輿情事件為例,分別構(gòu)建網(wǎng)絡(luò)輿情事理圖譜和抽象網(wǎng)絡(luò)輿情事理圖譜,從兩個(gè)層次分析網(wǎng)絡(luò)輿情的演化路徑。
1.3研究評(píng)述
首先,大數(shù)據(jù)時(shí)代海量數(shù)據(jù)規(guī)模成為網(wǎng)絡(luò)輿情研判首要解決的一大難題,而當(dāng)前的輿情評(píng)估方法還大多限于抽樣式的評(píng)估方法,缺乏全面的綜合評(píng)估;其次,網(wǎng)絡(luò)輿情研判的內(nèi)容也主要以社會(huì)安全事件為主,其中應(yīng)急性、個(gè)案化較多,長(zhǎng)遠(yuǎn)性的研究較少,輿情預(yù)警和應(yīng)對(duì)也多采取人工搜索和自覺發(fā)現(xiàn);最后,從輿情分析的重要目的,輿情決策的角度講,當(dāng)前輿情研判的現(xiàn)狀還存在不足,在輿情案例研究、政策法規(guī)和領(lǐng)域知識(shí)等方面出現(xiàn)了供需不匹配的問(wèn)題,尤其當(dāng)前大數(shù)據(jù)環(huán)境下,網(wǎng)絡(luò)輿情形勢(shì)瞬息萬(wàn)變,更需要即時(shí)作出輿情決策,知識(shí)需求更為迫切。
鑒于此,本文研究基于知識(shí)圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng),旨在構(gòu)建各領(lǐng)域網(wǎng)絡(luò)輿情研判知識(shí)圖譜,加強(qiáng)大數(shù)據(jù)和人工智能聯(lián)合應(yīng)用,推動(dòng)網(wǎng)絡(luò)輿情研判工作從抽樣式模糊評(píng)估向綜合式精準(zhǔn)評(píng)估轉(zhuǎn)變,推動(dòng)網(wǎng)絡(luò)輿情研判工作從就事論事的應(yīng)急式向統(tǒng)攬全局的跟蹤式轉(zhuǎn)變,推動(dòng)網(wǎng)絡(luò)輿情研判案例庫(kù)知識(shí)庫(kù)建設(shè),不斷強(qiáng)化網(wǎng)絡(luò)輿情研判決策支持能力。
2基于知識(shí)圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)模型
2.1知識(shí)圖譜在系統(tǒng)中的融合路徑探析
結(jié)合輿情研判信息處理流程,探討知識(shí)圖譜在網(wǎng)絡(luò)輿情研判數(shù)據(jù)管理、信息處理和知識(shí)服務(wù)過(guò)程中的融合路徑,以期更好發(fā)揮知識(shí)圖譜技術(shù)優(yōu)勢(shì),強(qiáng)化系統(tǒng)功能。
1)基于知識(shí)圖譜構(gòu)建網(wǎng)絡(luò)輿情信息資源的分類和畫像,強(qiáng)化系統(tǒng)數(shù)據(jù)管理功能
網(wǎng)絡(luò)輿情信息資源分類和畫像,就是匹配輿情數(shù)據(jù)、需求數(shù)據(jù)、案例庫(kù)、業(yè)務(wù)數(shù)據(jù)等信息資源的特征和屬性,分析獲知信息資源的使用度、接受度和使用任務(wù)等。比如構(gòu)建輿情事件和典型媒體主題圖譜、輿情應(yīng)急響應(yīng)決策圖譜[12],借鑒知識(shí)圖譜的方法深度挖掘數(shù)據(jù),構(gòu)建基于資源畫像的社交媒體內(nèi)部、外部資源聚合模型等[13]。
通過(guò)構(gòu)建的信息資源的分類和畫像還可以較為精準(zhǔn)地確定數(shù)據(jù)采集方向,加之基于知識(shí)圖譜的數(shù)據(jù)采集和存儲(chǔ)方案,面向不同任務(wù)自動(dòng)關(guān)聯(lián)采集站點(diǎn)、自動(dòng)確定數(shù)據(jù)格式和存儲(chǔ)方式也是強(qiáng)化輿情數(shù)據(jù)采集管理、保證輿情研判質(zhì)量的重要手段。如麻友等[14]在數(shù)據(jù)主題挖掘基礎(chǔ)上,利用知識(shí)圖譜發(fā)掘領(lǐng)域?qū)嶓w及其關(guān)聯(lián),實(shí)現(xiàn)特定領(lǐng)域數(shù)據(jù)的抽取。
2)基于知識(shí)圖譜創(chuàng)新輿情信息處理技術(shù),強(qiáng)化系統(tǒng)智能分析能力
知識(shí)圖譜在網(wǎng)絡(luò)輿情研判信息處理中的融合應(yīng)用是基于知識(shí)圖譜構(gòu)建網(wǎng)絡(luò)輿情研判系統(tǒng)的主要目的,主要集中在事件分析、用戶分析和輿情可視化分析等方面的創(chuàng)新研究。事件分析任務(wù)主要有事件監(jiān)測(cè)、事件摘要、事件演化追蹤、事件預(yù)測(cè)等[6-11]。用戶分析任務(wù)主要有用戶畫像[15]、用戶推薦[16]、行為分析[17]等??梢暬治鋈蝿?wù)包括可視化事件知識(shí)圖譜、事理圖譜構(gòu)建和可視化輿情展示等。王晰巍等[12]構(gòu)建了校園突發(fā)網(wǎng)絡(luò)輿情事件主題圖譜,并對(duì)“北京交通大學(xué)實(shí)驗(yàn)室爆炸”事件進(jìn)行可視化分析;牟冬梅等[18]構(gòu)建微博輿情社會(huì)屬性與外化表現(xiàn)模型,并以某疫苗事件為例進(jìn)行實(shí)證研究及可視化展示。
3)基于知識(shí)圖譜強(qiáng)化系統(tǒng)知識(shí)管理、知識(shí)檢索和服務(wù)能力
基于知識(shí)圖譜為網(wǎng)絡(luò)輿情研判業(yè)務(wù)提供知識(shí)管理和優(yōu)化,比如面向重大主題輿情監(jiān)控構(gòu)建重大輿情主題知識(shí)圖譜;面向事件演變追蹤構(gòu)建網(wǎng)絡(luò)輿情事理圖譜;面向關(guān)鍵組織和人物分析構(gòu)建組織或人物圖譜等。
當(dāng)前,網(wǎng)絡(luò)輿情知識(shí)檢索服務(wù)面臨3個(gè)難題,極大限制了系統(tǒng)效能:一是海量的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)無(wú)法自動(dòng)建立有效的標(biāo)簽或索引;二是存在大量冗余數(shù)據(jù);三是語(yǔ)義解析和檢索能力不足。針對(duì)以上問(wèn)題,知識(shí)圖譜等語(yǔ)義網(wǎng)技術(shù)提供了研究思路。如王丹等[19]針對(duì)數(shù)據(jù)冗余和語(yǔ)義解析問(wèn)題,提出了基于元數(shù)據(jù)的信息知識(shí)組織智能檢索系統(tǒng)設(shè)計(jì)方法等。
2.2系統(tǒng)模型設(shè)計(jì)
基于知識(shí)圖譜技術(shù)并融合大數(shù)據(jù)處理理論設(shè)計(jì)網(wǎng)絡(luò)輿情研判系統(tǒng)模型,包括輿情知識(shí)庫(kù)(知識(shí)圖譜)、數(shù)據(jù)源及其獲取、網(wǎng)絡(luò)輿情大數(shù)據(jù)資源管理、網(wǎng)絡(luò)輿情圖譜分析、分析結(jié)果展示和決策支持等功能模塊,如圖2所示。該模型中各模塊之間信息和知識(shí)互通,形成有機(jī)整體。
圖2基于知識(shí)圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)模型
1)輿情知識(shí)庫(kù)(知識(shí)圖譜)模塊。該模塊主要用于整合業(yè)務(wù)知識(shí)、提煉知識(shí)需求、指導(dǎo)數(shù)據(jù)獲取、輿情知識(shí)匹配、知識(shí)管理服務(wù)等。本文設(shè)計(jì)輿情知識(shí)庫(kù)包括領(lǐng)域知識(shí)庫(kù)、業(yè)務(wù)知識(shí)庫(kù)、輿情事件庫(kù)、用戶行為庫(kù)、輿情案例庫(kù)和決策支持庫(kù)等。這里需要注意的是,知識(shí)圖譜技術(shù)并非是所有用于研判的輿情信息和知識(shí)的最佳組織方案,比如研判系統(tǒng)中的業(yè)務(wù)流程知識(shí)使用工作流更合適,體量較大的輿情數(shù)據(jù)(照片、長(zhǎng)視頻、軟件、文件等)使用組織好的文件系統(tǒng)更合適,但輿情處理時(shí)這些信息的摘要或索引數(shù)據(jù)需要添加到知識(shí)圖譜中,便于輿情知識(shí)檢索利用。
2)數(shù)據(jù)源及其獲取模塊。該模塊主要用于輿情研判數(shù)據(jù)篩選和獲取。大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)輿情信息涉及的范圍十分廣泛,網(wǎng)絡(luò)輿情研判系統(tǒng)數(shù)據(jù)來(lái)源不僅包括網(wǎng)絡(luò)新聞媒體、社交網(wǎng)絡(luò)、論壇博客、網(wǎng)絡(luò)直播以及微博、微信自媒體,還包括電子政務(wù)網(wǎng)站、輿情工作部門的業(yè)務(wù)數(shù)據(jù)等。根據(jù)不同領(lǐng)域、不同類型的研判任務(wù),其數(shù)據(jù)源的選擇和各數(shù)據(jù)源的價(jià)值評(píng)價(jià)是不同的,此時(shí)輿情知識(shí)庫(kù)必須為數(shù)據(jù)源選擇和數(shù)據(jù)獲取提供業(yè)務(wù)指導(dǎo),既能保證研判信息全面無(wú)遺漏,又能保證精準(zhǔn)避免不必要的數(shù)據(jù)冗余和資源浪費(fèi),從而構(gòu)建包含媒體報(bào)道、網(wǎng)民意見、政府工作等全角度、全方位、立體化的輿情數(shù)據(jù)來(lái)源。
3)網(wǎng)絡(luò)輿情大數(shù)據(jù)資源管理模塊。數(shù)據(jù)獲取后首先解決的是快速存取、檢索和計(jì)算問(wèn)題,研究基于Hadoop+Spark等大數(shù)據(jù)存儲(chǔ)和計(jì)算架構(gòu),構(gòu)建網(wǎng)絡(luò)輿情大數(shù)據(jù)資源管理平臺(tái),研究構(gòu)建網(wǎng)絡(luò)輿情內(nèi)容數(shù)據(jù)倉(cāng)庫(kù)和用戶行為數(shù)據(jù)倉(cāng)庫(kù),進(jìn)行初步的數(shù)據(jù)融合和特征計(jì)算,為后續(xù)分析工作提供數(shù)據(jù)支撐。
4)網(wǎng)絡(luò)輿情圖譜分析模塊。該模塊借助知識(shí)圖譜將網(wǎng)絡(luò)輿情研判目標(biāo)各類信息都集中到知識(shí)圖譜構(gòu)建及應(yīng)用的統(tǒng)一架構(gòu)中。從數(shù)據(jù)、信息和知識(shí)的關(guān)系上來(lái)看,知識(shí)往往是對(duì)數(shù)據(jù)和信息進(jìn)行組織、總結(jié)、體系化歸納而得到的,而這個(gè)過(guò)程需要借助語(yǔ)義分析的能力。網(wǎng)絡(luò)輿情圖譜分析借助知識(shí)圖譜語(yǔ)義表達(dá)的優(yōu)勢(shì)強(qiáng)化輿情研判信息的組織、集成和分析,首先針對(duì)輿情研判任務(wù),可以從事件(內(nèi)容傳播)和人物(用戶行為)兩個(gè)角度對(duì)信息進(jìn)行組織,構(gòu)建網(wǎng)絡(luò)輿情事件知識(shí)圖譜和網(wǎng)絡(luò)輿情人物知識(shí)圖譜。具體的,綜合運(yùn)用數(shù)據(jù)融合、文本分析、深度語(yǔ)義挖掘、智能信息處理等大數(shù)據(jù)處理技術(shù),同時(shí)結(jié)合輿情知識(shí)庫(kù)中相關(guān)領(lǐng)域知識(shí)、業(yè)務(wù)知識(shí)和輿情案例等知識(shí)保障,實(shí)現(xiàn)網(wǎng)絡(luò)輿情大數(shù)據(jù)的數(shù)據(jù)整合、信息要素提取、事件抽取和人物畫像等圖譜構(gòu)建任務(wù),根據(jù)圖譜分析的方法完成態(tài)勢(shì)分析、專題分析、熱點(diǎn)發(fā)現(xiàn)、預(yù)警等輿情事件分析任務(wù),完成人物畫像、軌跡識(shí)別、情感分析和行為預(yù)測(cè)等輿情用戶行為分析任務(wù),且兩者之間存在關(guān)聯(lián)分析。另外,通過(guò)跟蹤式圖譜分析還可以專門針對(duì)某一特定事件進(jìn)行監(jiān)控,探索其演化規(guī)律和傳播效應(yīng),為輿情監(jiān)督和管控等提供必要的案例素材。
5)分析結(jié)果展示和決策支持模塊。該模塊功能面向的是網(wǎng)絡(luò)輿情研判工作人員或輿情決策者,主要用于針對(duì)特定時(shí)期和特定任務(wù)條件下,根據(jù)輿情圖譜分析結(jié)果進(jìn)行可視化展示,比如輿情態(tài)勢(shì)圖譜、輿情指數(shù)發(fā)展曲線、用戶情緒分布等,同時(shí)還需要支持輿情信息的即時(shí)查詢,支持針對(duì)特定用戶的輿情信息精準(zhǔn)推薦,支持輿情行動(dòng)決策的智力支持。另外,通過(guò)人機(jī)交互,實(shí)現(xiàn)輿情研判系統(tǒng)與輿情決策者的交互,交互方式力求簡(jiǎn)單明了,能夠?qū)浨闆Q策者的知識(shí)需求進(jìn)行實(shí)時(shí)的準(zhǔn)確傳遞和反饋,發(fā)揮輿情決策者通過(guò)自身業(yè)務(wù)知識(shí)對(duì)網(wǎng)絡(luò)輿情的把控優(yōu)勢(shì)。
3基于知識(shí)圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)建構(gòu)和探討
3.1新冠疫情條件下涉政網(wǎng)絡(luò)輿情研判系統(tǒng)建構(gòu)實(shí)踐
基于知識(shí)圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)能力還需要不斷地實(shí)踐應(yīng)用,進(jìn)行檢驗(yàn)。2020年春節(jié)前突發(fā)新型冠狀病毒肺炎疫情,相關(guān)部門十分警惕由此產(chǎn)生的網(wǎng)絡(luò)空間信息疫情,即針對(duì)疫情產(chǎn)生的虛假、恐慌、不穩(wěn)定的危害性信息傳播。即使當(dāng)前國(guó)內(nèi)已然進(jìn)入了后疫情時(shí)期,但仍需關(guān)注國(guó)際疫情發(fā)展?fàn)顩r以及潛在的輿情風(fēng)險(xiǎn),并做好應(yīng)對(duì)和治理工作。
本文對(duì)基于知識(shí)圖譜的新冠疫情條件下涉政網(wǎng)絡(luò)輿情研判進(jìn)行了研究,認(rèn)為系統(tǒng)研究核心任務(wù)在于對(duì)輿情應(yīng)對(duì)業(yè)務(wù)的理解和疫情輿情知識(shí)圖譜的設(shè)計(jì)。本文結(jié)合業(yè)務(wù)工作,設(shè)定應(yīng)用場(chǎng)景為新冠疫情條件下涉政網(wǎng)絡(luò)輿情事件發(fā)現(xiàn)、跟蹤和應(yīng)對(duì)的研判任務(wù),主要從網(wǎng)絡(luò)輿情研判和應(yīng)對(duì)業(yè)務(wù)問(wèn)題、事件解析、數(shù)據(jù)獲取、知識(shí)圖譜構(gòu)建和應(yīng)用等方面介紹相關(guān)工作。
3.1.1網(wǎng)絡(luò)輿情研判和應(yīng)對(duì)業(yè)務(wù)問(wèn)題
政府應(yīng)對(duì)新冠疫情的發(fā)生、發(fā)現(xiàn)、防控等工作過(guò)程中涉及政策法規(guī)、行政監(jiān)督、科學(xué)研究、社區(qū)防控和群眾工作等方方面面,牽扯各級(jí)政府機(jī)關(guān)、各地區(qū)社會(huì)組織和團(tuán)體、公民個(gè)體等復(fù)雜關(guān)系,任何矛盾問(wèn)題都有可能在互聯(lián)網(wǎng)、社會(huì)化媒體環(huán)境下被曝光放大,演變?yōu)樯嬲浨槲C(jī)。同時(shí),自媒體時(shí)代信息發(fā)布較為自由,起點(diǎn)較低,任何不實(shí)的舉報(bào)、虛假的宣傳、曲解的報(bào)道都有可能浪費(fèi)行政力量,造成社會(huì)恐慌情緒。比如武漢市青山區(qū)“垃圾車送肉”事件、“武漢9日夜轉(zhuǎn)運(yùn)病人一幕”事件、“火神山醫(yī)院漏水”事件等。因此新冠疫情條件下網(wǎng)絡(luò)輿情應(yīng)對(duì)業(yè)務(wù)的核心是發(fā)現(xiàn)疫情防控中的矛盾問(wèn)題并提出解決這些矛盾問(wèn)題的應(yīng)對(duì)意見。具體的,通過(guò)監(jiān)控網(wǎng)絡(luò)上主流媒體、微博微信等社會(huì)化媒體平臺(tái)信息流,以輿情事件為切入點(diǎn),構(gòu)建新冠疫情條件下網(wǎng)絡(luò)輿情知識(shí)圖譜,跟蹤和發(fā)現(xiàn)新的輿情事件,解析事件背后利益訴求,在符合政策法規(guī)、行業(yè)規(guī)程以及一定情理?xiàng)l件下給出解決問(wèn)題的意見。
3.1.2網(wǎng)絡(luò)輿情研判事件解析
事件是在時(shí)間和空間中發(fā)生的事情,具有一定的時(shí)序特征和發(fā)展規(guī)律。在傳統(tǒng)的研究中,通常運(yùn)用“5W1H”分析法,即何事(What)、何人(Who)、何時(shí)(When)、何地(Where)、何故(Why)和如何(How)6個(gè)要素的有機(jī)組合表示事件。將“5W1H”描述為事情、對(duì)象(人物、機(jī)構(gòu)或物體等對(duì)象)、時(shí)間、地點(diǎn)、動(dòng)機(jī)、動(dòng)作等要素,圖3為事件要素解析示例。
“事情”可以理解為事件的發(fā)生情況、發(fā)展情況、結(jié)果影響等;“對(duì)象”指事件參與或涉及的主體或客體,能反映事件涉及群體范圍及相互關(guān)系;“時(shí)間”指事件發(fā)生的時(shí)間,能反映事件影響時(shí)間;“地點(diǎn)”指事件發(fā)生的地域或行政區(qū)劃,能反映事件影響空間;“動(dòng)機(jī)”指對(duì)象采取動(dòng)作的原因或考慮,可以借此考察事件因果或順承關(guān)系;“動(dòng)作”指事件發(fā)生的方式,一般為動(dòng)詞或名詞,一定程度上能夠反映事件本體特征;主題事件是由一系列元事件組成,元事件一般由觸發(fā)詞區(qū)分,同一主題下元事件具有關(guān)聯(lián)性,其關(guān)系一般包括因果、順承、并發(fā)、組成等關(guān)系。為便于元事件分類,ACE評(píng)測(cè)會(huì)議定義了8種事件類型和33種子類型。本文借鑒“5W1H”分析法和ACE評(píng)測(cè),認(rèn)為輿情事件可以表示為事件要素的組合Event=(類型,{觸發(fā)詞},{屬性:屬性值},{關(guān)系}),其中類型、觸發(fā)詞、屬性及屬性值等都是事件要素的存在方式。
3.1.3網(wǎng)絡(luò)輿情研判數(shù)據(jù)獲取
對(duì)于新冠疫情條件下涉政網(wǎng)絡(luò)輿情應(yīng)對(duì),需要實(shí)時(shí)跟隨疫情的發(fā)展,包括國(guó)內(nèi)外新冠肺炎確診和疑似病例數(shù)、臨床醫(yī)療研究進(jìn)展情況、可用的防護(hù)指南、各地現(xiàn)行的防控政策、網(wǎng)民在各媒體平臺(tái)的討論話題等,這些數(shù)據(jù)網(wǎng)絡(luò)上基本得到很好的公開,目前借助在用系統(tǒng),初步具備系統(tǒng)采集功能。網(wǎng)民熱議的政策問(wèn)題、熱點(diǎn)事件均應(yīng)成為輿情發(fā)現(xiàn)和應(yīng)對(duì)的關(guān)鍵點(diǎn),并且相對(duì)應(yīng)的涉及政府工作的政策及后續(xù)、民間問(wèn)題反映應(yīng)列入知識(shí)圖譜中,以便后期查詢和推理。
3.1.4網(wǎng)絡(luò)輿情研判知識(shí)圖譜構(gòu)建
本文以《國(guó)家突發(fā)公共事件總體應(yīng)急預(yù)案》《國(guó)家突發(fā)公共衛(wèi)生事件應(yīng)急預(yù)案》提出的突發(fā)公共事件、突發(fā)公共衛(wèi)生事件所屬關(guān)系,并結(jié)合當(dāng)前普遍關(guān)注的疫情防控情況,依次定義事件、突發(fā)公共事件等6個(gè)上層概念。結(jié)合網(wǎng)絡(luò)輿情領(lǐng)域普遍關(guān)注的國(guó)際關(guān)系層面、國(guó)家政策層面、政府機(jī)關(guān)行政層面、基層工作層面等相關(guān)事件設(shè)計(jì)新冠肺炎疫情通報(bào)及防控的下層概念,包括國(guó)際疫情通報(bào)、國(guó)內(nèi)疫情通報(bào)、國(guó)際疫情防控、國(guó)內(nèi)疫情防控等,如圖4所示。
3.2新冠疫情條件下涉政網(wǎng)絡(luò)輿情研判系統(tǒng)應(yīng)用啟示
面對(duì)重大疫情輿情,輿情研判和應(yīng)對(duì)需要切實(shí)找準(zhǔn)業(yè)務(wù)問(wèn)題,直指疫情防控矛盾焦點(diǎn)。重大疫情背景下,要以解決實(shí)際問(wèn)題為基礎(chǔ),將風(fēng)險(xiǎn)防控的關(guān)口前移,同時(shí)亟需在疫情認(rèn)知的維度研判網(wǎng)絡(luò)輿情風(fēng)險(xiǎn),提出針對(duì)疫情輿情風(fēng)險(xiǎn)的防范化解之策。新冠疫情爆發(fā)后,網(wǎng)絡(luò)成為最大的信息集散地,重大疫情表現(xiàn)為全國(guó)性的,各地區(qū)疫情輿情在網(wǎng)絡(luò)空間都會(huì)集中呈現(xiàn),這首先考驗(yàn)各地應(yīng)急處置能力,輿情事件的發(fā)展走向,很大取決于官方的處置措施。
面對(duì)重大疫情輿情,輿情研判和應(yīng)對(duì)需要切實(shí)找準(zhǔn)“時(shí)度效”。輿情研判和應(yīng)對(duì),首先要在“時(shí)”上下功夫,網(wǎng)絡(luò)輿情信息發(fā)布門檻不高、傳播快速、網(wǎng)民接收信息又容易先入為主,因此輿情研判和應(yīng)對(duì)的窗口期十分有限,必須基于正確的輿情態(tài)勢(shì)的研判,理清頭緒,第一時(shí)間發(fā)聲,闡明事實(shí)要緊扣群眾訴求、開誠(chéng)布公地做好信息公開;把握好宣傳的“度”,同時(shí)跟進(jìn)后續(xù)報(bào)道,梳理群眾意見、社會(huì)呼聲,提高輿情應(yīng)對(duì)“效能”,同時(shí)防止片面或負(fù)面信息出現(xiàn)。
面對(duì)重大疫情輿情,輿情研判和應(yīng)對(duì)需要切實(shí)找準(zhǔn)疫情應(yīng)急響應(yīng)與輿情研判風(fēng)險(xiǎn)應(yīng)對(duì)的契合點(diǎn)。高等級(jí)的輿情研判風(fēng)險(xiǎn)一般會(huì)與高等級(jí)的疫情應(yīng)急響應(yīng)對(duì)應(yīng),包括輿情主體、區(qū)域、話題等都有趨同性,尤其在疫情爆發(fā)之初尤為明顯。當(dāng)前,國(guó)內(nèi)已進(jìn)入常態(tài)化疫情防控的后疫情時(shí)期,各地均有降低疫情應(yīng)急響應(yīng)等級(jí),但這不能代表網(wǎng)絡(luò)空間輿情風(fēng)險(xiǎn)的減少,相反,應(yīng)急響應(yīng)等級(jí)的降低容易使得社會(huì)一定程度上放松警惕,之前嚴(yán)禁聚餐等人員的聚集活動(dòng)開始出現(xiàn),甚至聚眾賭博等高風(fēng)險(xiǎn)事件也在網(wǎng)上爆出,增加了輿情燃點(diǎn)爆點(diǎn),也引起了輿論擔(dān)憂。因此,疫情應(yīng)急響應(yīng)與輿情研判風(fēng)險(xiǎn)應(yīng)對(duì)并不是同步的,隨著疫情防控呈現(xiàn)“總體平穩(wěn)”態(tài)勢(shì),先前網(wǎng)絡(luò)空間不斷積累的未完全化解的矛盾問(wèn)題和風(fēng)險(xiǎn)因素有可能再次爆發(fā),后疫情時(shí)代網(wǎng)絡(luò)疫情輿情仍可能帶來(lái)一系列波次的輿情破壞事件。
4結(jié)束語(yǔ)
本文在分析網(wǎng)絡(luò)輿情研判和知識(shí)圖譜及其在輿情研究中應(yīng)用等相關(guān)工作后,提出基于知識(shí)圖譜的網(wǎng)絡(luò)輿情研判系統(tǒng)模型,針對(duì)知識(shí)圖譜在系統(tǒng)中融合路徑進(jìn)行了討論,對(duì)網(wǎng)絡(luò)輿情研判系統(tǒng)構(gòu)建實(shí)踐和應(yīng)用進(jìn)行了探討。本文認(rèn)為,基于知識(shí)圖譜的應(yīng)用,有利于網(wǎng)絡(luò)輿情大數(shù)據(jù)的精準(zhǔn)獲取和智能化計(jì)算,有利于統(tǒng)一網(wǎng)絡(luò)輿情信息資源,有利于準(zhǔn)確分析研判網(wǎng)絡(luò)輿情的風(fēng)險(xiǎn)點(diǎn)、矛盾點(diǎn),有利于做到自動(dòng)編報(bào)、精準(zhǔn)推薦和決策支持。知識(shí)圖譜等人工智能技術(shù)在網(wǎng)絡(luò)輿情研判中的基礎(chǔ)性應(yīng)用,可以提升網(wǎng)絡(luò)空間的輿情安全態(tài)勢(shì)分析管控能力,是提高國(guó)家政府部門突發(fā)應(yīng)急響應(yīng)能力的關(guān)鍵路徑和重要體現(xiàn),也是響應(yīng)國(guó)家戰(zhàn)略切實(shí)提高執(zhí)政能力的必然要求。
參考文獻(xiàn)
[1]劉健,畢強(qiáng),李瑞.微博輿情信息傳播效果評(píng)價(jià)指標(biāo)體系構(gòu)建研究——基于模糊數(shù)據(jù)包絡(luò)分析法[J].情報(bào)理論與實(shí)踐,2016,39(12):31-38.
[2]陳建敏,余遵成.涉軍網(wǎng)絡(luò)輿情安全評(píng)估指標(biāo)體系研究[J].圖書情報(bào)研究,2018,(1):29-36.
[3]王高飛,李明.基于AHP-模糊綜合分析的移動(dòng)社交網(wǎng)絡(luò)輿情預(yù)警模型研究[J].現(xiàn)代情報(bào),2017,37(1):41-44.
[4]劉繼,李磊.大數(shù)據(jù)背景下網(wǎng)絡(luò)輿情智能預(yù)警機(jī)制分析[J].情報(bào)雜志,2019,38(12):92-97,183.
[5]彭程,祁凱,黎冰雪.基于SIR-EGM模型的復(fù)雜網(wǎng)絡(luò)輿情傳播與預(yù)警機(jī)制研究[J].情報(bào)科學(xué),2020,38(3):145-153.
[6]馬哲坤,涂艷.基于知識(shí)圖譜的網(wǎng)絡(luò)輿情突發(fā)話題內(nèi)容監(jiān)測(cè)研究[J].情報(bào)科學(xué),2019,37(2):33-39.
[7]Gottschalk S,Demidova E.Event KG:A Multilingual Event-centric Temporal Knowledge Graph[C]//European Semantic Web Conference,2018:272-287.
[8]彭立發(fā).網(wǎng)絡(luò)社區(qū)事件知識(shí)圖譜構(gòu)建[D].武漢:華中科技大學(xué),2019.
[9]Li Z,Ding X,Liu T.Constructing Narrative Event Evolutionary Graph for Script Event Extraction[C]//Proceedings of the 27th International Joint Conference on Artificial Intelligence,2018:4201-4207.
[10]周京艷,劉如,李佳娛,等.情報(bào)事理圖譜的概念界定與價(jià)值分析[J].情報(bào)雜志,2018,37(5):31-36,42.
[11]單曉紅,龐世紅,劉曉燕,等.基于事理圖譜的網(wǎng)絡(luò)輿情演化路徑分析——以醫(yī)療輿情為例[J].情報(bào)理論與實(shí)踐,2019,42(9):85,99-103.
[12]王晰巍,張柳,韋雅楠,等.社交網(wǎng)絡(luò)輿情中意見領(lǐng)袖主題圖譜構(gòu)建及關(guān)系路徑研究——基于網(wǎng)絡(luò)謠言話題的分析[J].情報(bào)資料工作,2020,41(2):47-55.
[13]徐海玲,張海濤,魏明珠,等.社交媒體用戶畫像的構(gòu)建及資源聚合模型研究[J].圖書情報(bào)工作,2019,63(9):109-115.
[14]麻友,岳昆,張子辰,等.基于知識(shí)圖譜和LDA模型的社會(huì)媒體數(shù)據(jù)抽取[J].華東師范大學(xué)學(xué)報(bào):自然科學(xué)版,2018,(5):183-194.
[15]王杰.基于公安知識(shí)圖譜的用戶畫像研究[D].武漢:武漢理工大學(xué),2019.
[16]張興宇.基于知識(shí)圖譜構(gòu)建的微博話題推薦研究[D].淮南:安徽理工大學(xué),2019.
[17]侯位昭,張欣海,宋凱磊,等.融合知識(shí)圖譜及貝葉斯網(wǎng)絡(luò)的智能推薦方法[J].中國(guó)電子科學(xué)研究院學(xué)報(bào),2020,15(5):488-494.
[18]牟冬梅,邵琦,韓楠楠,等.微博輿情多維度社會(huì)屬性分析與可視化研究——以某疫苗事件為例[J].圖書情報(bào)工作,2020,64(3):111-118.
[19]王丹,張祥合,趙浩宇.基于元數(shù)據(jù)的信息知識(shí)組織智能檢索系統(tǒng)設(shè)計(jì)[J].情報(bào)科學(xué),2019,37(9):113-116.
(責(zé)任編輯:郭沫含)