■詹海寶
習(xí)近平總書記指出:“讓互聯(lián)網(wǎng)成為我們同群眾交流溝通的新平臺,成為了解群眾、貼近群眾、為群眾排憂解難的新途徑,成為發(fā)揚人民民主、接受人民監(jiān)督的新渠道?!痹谌斯ぶ悄?、大數(shù)據(jù)、全媒體時代背景下,政法網(wǎng)絡(luò)輿情應(yīng)對面臨一系列新問題、新挑戰(zhàn)。作為輿情中關(guān)涉面最廣、影響程度最深、發(fā)生頻率最高的政法網(wǎng)絡(luò)輿情,是社會穩(wěn)定的晴雨表,如若對其風(fēng)險防范不慎,便可能對政法機關(guān)的公信力帶來較大負(fù)面影響,甚至影響社會穩(wěn)定。政法網(wǎng)絡(luò)輿情風(fēng)險防范是衡量司法公開成效、表征司法公正實現(xiàn)程度、測量民意走向的重要量化手段,利用人工智能技術(shù)助力政法網(wǎng)絡(luò)輿情風(fēng)險防范,不僅能破解傳統(tǒng)技術(shù)支持下政法網(wǎng)絡(luò)輿情風(fēng)險評估諸多現(xiàn)實困境,而且還能提升司法公信力和司法權(quán)威,進(jìn)而實現(xiàn)民意與司法的和諧互動。
面對突發(fā)事件如潮的網(wǎng)絡(luò)輿情,近年來各級政府、企事業(yè)單位及機構(gòu)日益重視,成立專門機構(gòu),啟用監(jiān)測系統(tǒng)。但是,一些地方對輿情的風(fēng)險評價仍然認(rèn)識不足,重視不夠,難以適應(yīng)現(xiàn)實需求。現(xiàn)階段政法網(wǎng)絡(luò)輿情分析的不足可以主要歸結(jié)為“人機不協(xié)調(diào)”的問題。在應(yīng)當(dāng)使用機器進(jìn)行學(xué)習(xí)和處理的權(quán)重配比、走勢預(yù)測、情感分析、效果檢查上,現(xiàn)實應(yīng)用顯得機械化、淺層次;而在應(yīng)當(dāng)使用人工進(jìn)行分析的特征維度劃分、對策建議提供上,現(xiàn)實應(yīng)用又顯得粗糙、重復(fù),且機器對人的輔助不夠有力,分工協(xié)同的模式還不成熟。
得益于數(shù)理算法和計算機科學(xué)的發(fā)展,人工智能時代的機器學(xué)習(xí)能力日益增強,這為政法網(wǎng)絡(luò)輿情分析領(lǐng)域?qū)崿F(xiàn)自動化、精準(zhǔn)化、智能化創(chuàng)造了新的契機,而實現(xiàn)新要求的關(guān)鍵點在于切實實現(xiàn)網(wǎng)絡(luò)輿情分析領(lǐng)域中的人機互動與雙向協(xié)同。盡管當(dāng)前政法網(wǎng)絡(luò)輿情風(fēng)險評估的學(xué)理爭鳴持續(xù)發(fā)酵,司法實務(wù)部門的試點改革也如火如荼,然而從防范結(jié)果的實際運用來看,仍面臨著信度和效度的雙重考驗,以及防范結(jié)果的形式化和淺表化等現(xiàn)實困境。
傳統(tǒng)技術(shù)環(huán)境下,基于小樣本抽樣調(diào)查的政法輿情風(fēng)險評估與防范策略,無法避免個人經(jīng)驗的有限性對輿情風(fēng)險評估與防范過程的客觀性造成較大不利影響,而且無法實時動態(tài)評估與防范政法網(wǎng)絡(luò)輿情風(fēng)險。即便利用大數(shù)據(jù)技術(shù)可以實時抓取與分析政法網(wǎng)絡(luò)輿情數(shù)據(jù),但若缺乏人工智能技術(shù)強大的分析算法,所有的分析都難免粗糙與淺表,無法滿足政法網(wǎng)絡(luò)輿情風(fēng)險準(zhǔn)確實時評估的要求。
人工智能的數(shù)據(jù)挖掘技術(shù)、可視化技術(shù)和自動化分析在評估政法網(wǎng)絡(luò)輿情風(fēng)險中具有巨大的優(yōu)勢,可助推司法輿情監(jiān)測的常態(tài)化、預(yù)警決策的精準(zhǔn)化。通過政法網(wǎng)絡(luò)輿情典型案例的人工智能語義分析與關(guān)鍵詞識別,可以建立政法網(wǎng)絡(luò)輿情辨識語料庫,基于該語料庫構(gòu)建主題爬蟲程序,全網(wǎng)采集信息形成該主題輿情大數(shù)據(jù)。對所采集的大數(shù)據(jù)輿情進(jìn)行智能情感值判斷,通過設(shè)定風(fēng)險基準(zhǔn)值構(gòu)建政法網(wǎng)絡(luò)輿情風(fēng)險預(yù)警機制,以實時準(zhǔn)確評估政法網(wǎng)絡(luò)輿情風(fēng)險水平,為政法網(wǎng)絡(luò)輿情風(fēng)險防范提高決策參考,為相關(guān)司法政策的制定提供重要支持。
人工智能算法強大的處理能力,以及大數(shù)據(jù)主題爬蟲實時的采集能力,可保障政法網(wǎng)絡(luò)輿情風(fēng)險評估的實時性,大數(shù)據(jù)輿情信息來源的多樣性與全樣本性保障了評估的準(zhǔn)確性。若該政法網(wǎng)絡(luò)輿情信息的情感值低于所設(shè)定的風(fēng)險基準(zhǔn)值,應(yīng)及時預(yù)警并根據(jù)政法網(wǎng)絡(luò)輿情的傳播規(guī)律科學(xué)引導(dǎo),疏散相應(yīng)極端負(fù)面輿情,以防范極端言論的肆意傳播。
此外,大數(shù)據(jù)時代數(shù)據(jù)是創(chuàng)新理論研究與實踐應(yīng)用的重要驅(qū)動力,利用大數(shù)據(jù)的關(guān)聯(lián)算法可深度挖掘研究主體或應(yīng)用主體的潛在特質(zhì)與規(guī)律。維度多元、噪音量低的大數(shù)據(jù)集非常難尋,特別是政法網(wǎng)絡(luò)輿情意識形態(tài)數(shù)據(jù)的獲取更是難上加難,建立此類問題研究或應(yīng)用的基礎(chǔ)數(shù)據(jù)共建共享機制便顯得尤為必要。
政法網(wǎng)絡(luò)輿情是一個對象特殊、意義重大的研究問題,其關(guān)涉社會穩(wěn)定與國家安全,網(wǎng)絡(luò)社會的隱匿性與易傳播性使政法網(wǎng)絡(luò)輿情的研究更為復(fù)雜,需要各界研究力量共同參與,以政法網(wǎng)絡(luò)輿情的監(jiān)測與干預(yù)開放案例庫為基礎(chǔ),建立政法網(wǎng)絡(luò)輿情數(shù)據(jù)庫,通過共建共享機制,發(fā)揮學(xué)界、業(yè)界與政界等各方力量,按照一定的規(guī)范共同參與數(shù)據(jù)的上傳、共同享用數(shù)據(jù)的使用權(quán),數(shù)據(jù)內(nèi)容涵蓋該主題輿情事件的實體、關(guān)鍵詞、事件要素與引導(dǎo)成效等維度。該數(shù)據(jù)庫可實現(xiàn)學(xué)術(shù)資源的共享,為政法網(wǎng)絡(luò)輿情相關(guān)研究提供數(shù)據(jù)支撐,同時也可為政法部門的決策提供一定的參考。
人工智能技術(shù)雖有強大的分析算法,但若缺乏大量優(yōu)秀經(jīng)典的訓(xùn)練集作為機器學(xué)習(xí)的對象,算法模型的分析智力也只會處于初級水平。若要利用人工智能技術(shù)評估與防范政法網(wǎng)絡(luò)輿情風(fēng)險,就需要構(gòu)建一個可供人工智能算法學(xué)習(xí)的政法網(wǎng)絡(luò)輿情監(jiān)測與干預(yù)案例庫。人工智能算法在基于該數(shù)據(jù)庫進(jìn)行機器學(xué)習(xí)的過程中,可尋找出大量政法網(wǎng)絡(luò)輿情概率上的特征,憑借之前的監(jiān)測與干預(yù)經(jīng)驗,將有可能產(chǎn)生重大影響的政法網(wǎng)絡(luò)輿情在萌芽期識別出來,并設(shè)計回應(yīng)辦法,進(jìn)行智能化輿情引導(dǎo),以達(dá)到風(fēng)險防范之目的。
在此探討一下政法網(wǎng)絡(luò)輿情監(jiān)測與干預(yù)案例庫的構(gòu)建方法。首先,基于監(jiān)測過程中所采集到的政法網(wǎng)絡(luò)輿情數(shù)據(jù),利用政法輿情傳播理論,推演出該政法網(wǎng)絡(luò)輿情的傳播規(guī)律,在深度分析傳播規(guī)律的基礎(chǔ)上,形成政法網(wǎng)絡(luò)輿情的引導(dǎo)對策。接下來,收集完整的監(jiān)測、引導(dǎo)活動,并以此為基礎(chǔ)構(gòu)建某主題輿情的監(jiān)測與干預(yù)案例庫。為保障該案例庫中相似度計算和議題推演的科學(xué)運行,便于司法部門對相關(guān)案例進(jìn)行檢索和瀏覽,并能實時查看相關(guān)事件的處置決策辦法與處置效果,需要對該案例庫中每一個入庫案例進(jìn)行細(xì)致詳盡的描述。案例庫中事件字段越細(xì)粒度,新增案例知識的相似度計算越方便。為提高對類似輿情事件處理的參考性,還需專門設(shè)計數(shù)據(jù)表以存儲輿情處置方法與過程、司法部門對輿情事件的干預(yù)措施。該案例庫也可以遵循共建共享的原則,任何致力于研究或管理政法網(wǎng)絡(luò)輿情的學(xué)術(shù)機構(gòu)或管理機構(gòu),都可以申請加入該數(shù)據(jù)庫的建設(shè),貢獻(xiàn)本機構(gòu)擁有的相關(guān)數(shù)據(jù),同時擁有對該數(shù)據(jù)庫相應(yīng)數(shù)據(jù)的使用權(quán)限,以此提高該數(shù)據(jù)庫的生命力。
基于以上所構(gòu)建的數(shù)據(jù)庫進(jìn)行人工智能分析,可歸納出政法網(wǎng)絡(luò)輿情的議題框架,該議題框架可精準(zhǔn)反映政法網(wǎng)絡(luò)輿情存在的問題,為政法網(wǎng)絡(luò)輿情風(fēng)險防范策略的制定提供科學(xué)依據(jù)。
關(guān)于政法網(wǎng)絡(luò)輿情議題框架的構(gòu)建,包括基于語義網(wǎng)絡(luò)的整體框架提取、議題框架量化分析兩個過程。在整體框架提取的過程中,調(diào)用漢語分詞系統(tǒng)進(jìn)行文本分詞等數(shù)據(jù)預(yù)處理,根據(jù)詞頻篩選來確定核心詞匯,并對核心詞匯進(jìn)行共詞分析,從而得到核心詞匯的初步語義網(wǎng)絡(luò)關(guān)系矩陣,再對該共詞關(guān)系矩陣進(jìn)行聚類分析,從而獲取核心詞匯的不同集群,采用核心算法,模塊化分析全部案例的語義網(wǎng)絡(luò),識別出特質(zhì)相異集群與其分布比例。最后,基于集群中的核心特征詞匯,利用機器學(xué)習(xí)自動編碼每個集群的議題,從而計算出整個案例庫的議題框架分布。在議題框架量化的過程中,采用高階統(tǒng)計語言模型對每個案例所含的議題框架進(jìn)行精確統(tǒng)計,并且計算出每個議題討論量的相對大小。
利用以上對政法網(wǎng)絡(luò)輿情的大數(shù)據(jù)挖掘、人工智能語義網(wǎng)絡(luò)分析以及無監(jiān)督機器學(xué)習(xí),可科學(xué)提取與量化其議題框架,動態(tài)精準(zhǔn)診斷其中存在的問題,為政法網(wǎng)絡(luò)輿情風(fēng)險防范策略的制定提供科學(xué)依據(jù)。
應(yīng)該說,人工智能的實現(xiàn),得益于科學(xué)界量化整個世界的嘗試。科學(xué)界試圖構(gòu)建模型來表達(dá)紛繁復(fù)雜的客觀世界,并得到了許多成就。這些成就在一定程度上鼓勵了“計算主義”哲學(xué)的發(fā)展,信奉計算主義的人認(rèn)為世界在極大程度上是可以被量化的,因此,人工智能才能夠比我們想象的更接近人類。顯然,這種信仰并不代表真理,相反,有更多的學(xué)者質(zhì)疑,我們的世界中不能量化的問題遠(yuǎn)遠(yuǎn)多于可以量化的問題?,F(xiàn)代經(jīng)濟(jì)學(xué)、社會學(xué)、政治學(xué)的一些研究也表明,在人為世界中,人的復(fù)雜程度遠(yuǎn)超過人類自己的想象和技術(shù)可以完全把握的能力,所以人工智能只能無限接近人類而不能完全替代人類。