李紅梅,常淑惠,劉麗娟,張立國
河北農(nóng)業(yè)大學信息科學與技術學院,河北保定 071001
隨著計算機網(wǎng)絡技術及其應用的迅速發(fā)展,以數(shù)字內(nèi)容為標志、以互聯(lián)網(wǎng)為主要載體、以開放、多元、虛擬、交互為特征的網(wǎng)絡文化,成為文化傳播的主要形式之一?;ヂ?lián)網(wǎng)在為人們提供大量的有用信息,給學習、生活帶來便利的同時,也帶來制造和傳播不良甚至非法網(wǎng)絡信息等新問題。在 Internet 普及的過程中,網(wǎng)民們積極參與網(wǎng)絡討論、自由表達個人觀點、自主傳播思想文化,從而形成網(wǎng)絡輿情,網(wǎng)絡輿情是社會輿情的直接反映。由于網(wǎng)絡的開放性和虛擬性,決定了網(wǎng)絡輿情具有直接性、突發(fā)性和偏差性等特點[1]。網(wǎng)絡輿情的廣泛傳播常常導致現(xiàn)實社會有關事件的放大升級,甚至對事件的發(fā)展和結果產(chǎn)生巨大的影響力。針對網(wǎng)絡文化中存在的安全威脅,實現(xiàn)對網(wǎng)絡文化內(nèi)容的有效監(jiān)管,加強對網(wǎng)絡輿情的及時監(jiān)測和有效引導,成為當前亟待解決的問題。
要保障網(wǎng)絡文化安全,實現(xiàn)全面、準確、及時地掌握網(wǎng)絡輿情,必須依靠科學的方法體系,運用信息化手段,構建網(wǎng)絡文化安全監(jiān)管系統(tǒng),網(wǎng)絡文化安全預警系統(tǒng)是其重要組成部分。
首先必須明確網(wǎng)絡文化安全預警系統(tǒng)的性質(zhì)和類型,采用科學的研究方法才能建立符合需求的應用模型,進而實現(xiàn)系統(tǒng)安全、可靠、有效的應用目標。
Internet安全對象不是一般的系統(tǒng),而是開放、人在其中、與社會系統(tǒng)緊密耦合的復雜巨系統(tǒng), Internet安全過程不是一般工程化的過程,而是一個時時處處有人參與的、自適應的、不斷演化的、不斷涌現(xiàn)出新的整體特性的過程[2]。因此,在建立網(wǎng)絡文化安全預警系統(tǒng)時是由人、機和環(huán)境構成的人機系統(tǒng),應采用“人網(wǎng)結合、人機結合”的模式,運用錢學森提出的綜合集成方法[3],將各行專家的經(jīng)驗、知識與先進的數(shù)據(jù)挖掘、檢測與阻斷、模式識別、趨勢分析等處理技術結合起來,充分發(fā)揮各自優(yōu)勢,建立基于“專家群體+數(shù)據(jù)信息+計算機技術+專家經(jīng)驗知識”的系統(tǒng)應用模型。圖1為運用綜合集成方法構建網(wǎng)絡文化安全預警系統(tǒng)的理想?yún)⒖寄P汀?/p>
互聯(lián)網(wǎng)技術的發(fā)展日新月異,威脅網(wǎng)絡文化安全的網(wǎng)絡犯罪日益趨向智能化、技術化,要保障網(wǎng)絡文化安全,必須綜合運用互聯(lián)網(wǎng)技術、信息處理技術、人工智能技術及數(shù)據(jù)挖掘等技術。運用綜合集成方法構建的網(wǎng)絡文化安全預警系統(tǒng)模型分為支撐層、數(shù)據(jù)層、分析層和應用層四個層次,具體框架如圖2所示。
支撐層由Internet和計算機軟硬件平臺構成,利用互聯(lián)網(wǎng)技術,為系統(tǒng)上層提供海量數(shù)據(jù)源和信息處理平臺。
數(shù)據(jù)層實現(xiàn)信息采集的功能,利用網(wǎng)絡爬蟲對互聯(lián)網(wǎng)信息進行實時監(jiān)控和采集,并進行有效的過濾和存儲,建立網(wǎng)絡輿情信息庫。
信息采集是網(wǎng)絡輿情分析的基礎,采用縱向橫向結合的采集方式,滿足實時網(wǎng)絡信息和互動信息源定點提取的需要。定向采集保證監(jiān)控的深度和實時性,主要實現(xiàn)對新聞、論壇、評論、博客等設定站點板塊的信息采集。全網(wǎng)采集主要通過搜索引擎進行廣度采集,保證監(jiān)控的覆蓋面。對采集到的信息需要進行必要的預處理,如格式轉(zhuǎn)換、數(shù)據(jù)清理、主題提取、相關性判斷等,最后形成格式化信息,存儲在數(shù)據(jù)庫中。
分析層作為系統(tǒng)模型的核心層,主要利用人工智能和數(shù)據(jù)挖掘等技術實現(xiàn)對輿情信息的智能分析,生成輿情分析報告提交給決策機構實現(xiàn)智能輔助決策。
1)自動摘要
自動摘要是通過智能手段為文檔自動形成摘要的技術,是進行信息抽取的重要形式,融合了數(shù)據(jù)挖掘和機器學習技術[4]。用戶無需查看全部文檔內(nèi)容,通過該智能摘要即可快速了解文檔核心內(nèi)容,提高信息利用效率。主要采用基于統(tǒng)計與基于理解的方法,對輿情信息中各類主題、各類傾向形成自動摘要。
2)熱點發(fā)現(xiàn)
根據(jù)輿情信息出處的權威度、評論數(shù)量、發(fā)言時間密集程度等參數(shù),識別出給定時間段內(nèi)的熱門話題,利用關鍵字布控和語義分析,識別敏感話題。
3)主題跟蹤
由于主題具有實時動態(tài)性,所以主題跟蹤是一個動態(tài)學習過程。針對熱點話題,實時地進行信息跟蹤,分析網(wǎng)絡上新發(fā)表的新聞文章和論壇帖子,關注話題是否與已有主題相同或類似。
4)趨勢分析
通過對某個主題在不同的時間段內(nèi)被關注的程度進行跟蹤,可以獲取輿情隨時間的發(fā)展變化趨勢或規(guī)律,以及地域信息分布,從而提供階段性的分析,實現(xiàn)對輿情環(huán)境的監(jiān)控和預警,進行適時控制和疏導。
5)傾向性分析
對每個主題,將各種信息進行自動聚合并利用文本聚類和觀點挖掘技術對信息闡述的觀點、主旨進行傾向性分析,判別信息的發(fā)展趨勢,從而明確公眾對相關熱點事件所持的態(tài)度和傾向,以便幫助政府職能部門及時了解社情民意,做出及時反饋。
6)輿情分析報告
將智能分析的結果形成簡報、報告、圖表等智能輿情報告,為相關職能部門快速、全面掌握網(wǎng)絡輿情爆發(fā)點和事態(tài)發(fā)展趨勢,做出正確輿論引導,提供可信的分析依據(jù)。
應用層是人機交互層,一方面用戶可以通過一定的軟件環(huán)境對輿情信息的采集及輿情分析過程加以指導;另一方面則將輿情分析結果以直觀、簡潔的形式展現(xiàn)給用戶,便于用戶深入理解輿情信息,同時,提供信息檢索功能,用戶可以針對系統(tǒng)預設關鍵詞進行定制查詢,并能夠根據(jù)指定條件對熱點話題、關鍵信息及傾向性進行查詢,采用多種檢索方式,可以有效提高信息檢索的準確率。
更為重要的是,應用層將結合智能決策系統(tǒng)實現(xiàn)對輿情信息的智能決策。針對熱點信息與突發(fā)事件進行監(jiān)測分析,構建趨勢預測模型,根據(jù)知識庫存儲的先驗專家知識進行推理判斷,形成最終的輿情分析結果,進而實現(xiàn)輿情預警。同時,對每次輿情預警進行必要的評價,優(yōu)化預測模型的參數(shù),調(diào)整和完善知識庫存儲的知識,使預測意見更接近實際情況,提高輿情分析的準確率。
本文針對Internet安全對象的特點,運用綜合集成方法構建了網(wǎng)絡文化安全預警系統(tǒng)模型。該模型采用縱向橫向相結合的采集方式,保證了對互聯(lián)網(wǎng)海量信息監(jiān)測的深度、廣度和實時性,運行人工智能、數(shù)據(jù)挖掘等技術和智能決策系統(tǒng)對輿情信息進行智能分析和智能決策,發(fā)現(xiàn)網(wǎng)絡熱點問題并實時跟蹤,從而實現(xiàn)對網(wǎng)絡文化安全態(tài)勢的預報和對危機的快速反應,通過輿情評價模塊將有助于完善系統(tǒng)模型,提高預警的準確率。
[1]張虹.基于統(tǒng)計分析和知識挖掘的網(wǎng)絡輿情管理決策平臺研究[J].科技信息,2011(7):495,502.
[2]何德全.互聯(lián)網(wǎng)時代信息安全的新思維[J].科學中國人,2003(1):14-15.
[3]于景元.錢學森綜合集成體系[J].西安交通大學學報:社會科學版,2006,26(6):40-47.
[4]于淼,李遠.網(wǎng)絡輿情的關鍵技術與系統(tǒng)構架研究[J].網(wǎng)絡信息安全,2011(1):21-22,45.