• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    淺析高校網(wǎng)絡(luò)輿情信息來源及采集方法

    2016-05-14 08:56:00劉儒夢陳銀茹趙麗娜
    青春歲月 2016年8期
    關(guān)鍵詞:博客頁面輿情

    劉儒夢 陳銀茹 趙麗娜

    【摘要】隨著網(wǎng)絡(luò)的膨脹式增長,建立完善的網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)是現(xiàn)代高校急需解決的問題,它有利于準(zhǔn)確掌握學(xué)校輿情動態(tài)、把握學(xué)生發(fā)展方向、維護(hù)學(xué)校的和諧穩(wěn)定。網(wǎng)絡(luò)輿情來源主要分為網(wǎng)站BBS,即時通訊軟件、貼吧、微博。輿情信息的采集方法包含基于博客的采集、基于貼吧的采集、基于網(wǎng)站的采集以及利用關(guān)鍵詞詞頻分析法采集。

    【關(guān)鍵詞】高校;網(wǎng)絡(luò)輿情;信息采集

    新媒體時代,網(wǎng)絡(luò)對大學(xué)生的影響越來越大,但是由于大學(xué)生社會經(jīng)驗(yàn)不足、辨識能力有限,面對網(wǎng)上良莠不齊的信息,有時會產(chǎn)生錯誤的判斷,甚至被一些別有用心的人利用,產(chǎn)生嚴(yán)重負(fù)面影響,進(jìn)而影響校園的和諧穩(wěn)定。因此,高校職能部門迫切需要做好網(wǎng)絡(luò)輿情信息的監(jiān)管工作。對負(fù)面的網(wǎng)絡(luò)輿情做到事先預(yù)防,事中引導(dǎo),事后處理。因此,對高校輿情來源及輿情信息采集方法的分析具有很大的現(xiàn)實(shí)意義。

    一、高校網(wǎng)絡(luò)輿情信息來源及特點(diǎn)

    通俗來講,網(wǎng)絡(luò)輿情是因各種熱點(diǎn)或者與自身利益相關(guān)的事件而產(chǎn)生的通過互聯(lián)網(wǎng)傳播的人們對于該事件的所有認(rèn)知、態(tài)度、情感和行為傾向的總和。

    新媒體時代的高校網(wǎng)絡(luò)輿情信息來源極為豐富,主要包括學(xué)校門戶網(wǎng)站BBS、各學(xué)院網(wǎng)站BBS、微博、貼吧、博客,即時通訊軟件qq、微信,以及各種新聞app。

    高校網(wǎng)絡(luò)輿情信息具有迅捷性和互動性。由于移動通信工具的便捷性、大學(xué)生休閑時間相對充裕以及大學(xué)生積極互動的特點(diǎn),使得一些新出現(xiàn)的熱點(diǎn)信息,可以在很短的時間內(nèi)進(jìn)行蔓延,形成輿情。以河北金融學(xué)院為例,2016年三月份發(fā)生在校園內(nèi)的白色轎車事件。在沒有確認(rèn)真?zhèn)蔚那闆r下,“白色轎車內(nèi)幾個大漢遇單身女學(xué)生遍追拉上車”的消息在一天之內(nèi)已經(jīng)在百度貼吧,各個qq群,微信群,以及qq空間,朋友圈內(nèi)瘋傳了。就此事件而言,如果學(xué)校處理不當(dāng),會對學(xué)校治安以及學(xué)生心理產(chǎn)生不良影響。

    高校網(wǎng)絡(luò)輿情信息具有多元性和目的性。大學(xué)生關(guān)注的信息既包含與自身利益相關(guān)的問題、也包含學(xué)術(shù)問題和政治問題。他們參與輿情的目的多樣化,包括結(jié)交朋友、交流情感、學(xué)術(shù)討論、開闊眼界、解決問題等。學(xué)校的貼吧、網(wǎng)站BBS、qq群、微信群、新聞app等,為他們提供了交流的平臺。一般這些平臺基本上不需要實(shí)名認(rèn)證,便于同學(xué)們暢所欲言。

    高校網(wǎng)絡(luò)輿情具有爆發(fā)性。由于熱點(diǎn)信息傳播迅速,參與者多,且客體是沒有社會經(jīng)驗(yàn)、辨識力不足、正義感較強(qiáng)的大學(xué)生。若學(xué)校網(wǎng)絡(luò)輿情信息監(jiān)管力度不夠,極易偏離熱點(diǎn)本態(tài),在短時間內(nèi)形成負(fù)能量網(wǎng)絡(luò)輿情,在學(xué)校在不知情的情況下,影響學(xué)校聲譽(yù)、學(xué)校良好氛圍、學(xué)生態(tài)度。

    二、高校網(wǎng)絡(luò)輿情信息采集方法

    網(wǎng)絡(luò)輿情采集的核心在于網(wǎng)信收集,即快速準(zhǔn)確收集延時輿情信息,在互聯(lián)網(wǎng)中,由于信息量龐大,存在形式多樣復(fù)雜,僅僅采用人工收集顯然難以實(shí)現(xiàn),必須運(yùn)用信息技術(shù),利用軟件自動收集。以自動收集為主、人工收集為輔,對互聯(lián)網(wǎng)信息進(jìn)行廣泛收集。本文主要從以下幾個方面介紹輿情信息獲取方法。

    1、基于博客的信息采集

    首先,每個博客服務(wù)托管商(以下簡稱BSP)下的注量都很龐大,且BSP首頁鏈接較少,難以在互聯(lián)網(wǎng)上識別出較多的博客頁面。其次,blog數(shù)據(jù)源更新頻繁,需要使用實(shí)時刷新采集機(jī)制采集博客信息。再次,博客中一般都用到了RSS(Really Simple Syndication)技術(shù),RSS是描述及同步網(wǎng)站的一種具有格式化特點(diǎn)的格式,在Web應(yīng)用中被廣泛使用?;诓┛偷倪@些特點(diǎn),可以利用基于抓取時間和分析HTML文檔的方法來識別博客。設(shè)計(jì)基于RSS的分布式博客搜索引擎,實(shí)現(xiàn)對更新頻繁的頁面進(jìn)行實(shí)時性搜索。

    2、基于貼吧的信息采集

    貼吧的信息采集主要用到了頁面爬取技術(shù)和內(nèi)容提取技術(shù)。頁面爬取技術(shù)主要用于完整地對貼吧內(nèi)各個主貼、回帖的內(nèi)容進(jìn)行爬取,得到頁面代碼。該爬蟲優(yōu)先搜索主貼,再根據(jù)主貼分析出各主貼的回帖鏈接,并將主貼和回帖全部下載。由于下載下來的為源代碼,所以需要利用內(nèi)容提取技術(shù),對網(wǎng)頁html、css、JavaScript源代碼進(jìn)行分析,提取代碼中的帖子的全部內(nèi)容信息。然后再將非結(jié)構(gòu)化的語句結(jié)構(gòu)化,存入數(shù)據(jù)庫中。

    3、基于網(wǎng)站的信息采集

    隨著Ajax技術(shù)在網(wǎng)站的應(yīng)用越來越普遍。傳統(tǒng)的網(wǎng)絡(luò)爬取技術(shù)已經(jīng)不能滿足現(xiàn)在網(wǎng)站信息采集的需要。

    信息采集過程包含兩個部分,信息爬取和信息優(yōu)化。信息爬取的頁面分為兩種,靜態(tài)頁面和動態(tài)頁面。對靜態(tài)頁面的采集比較簡單,一般采用將HTML頁面解析成文檔DOM樹,采用遞歸方式,對DOM樹種的文本節(jié)點(diǎn)以及元素節(jié)點(diǎn)進(jìn)行信息提取。動態(tài)頁面中嵌入了很多JavaScript、Ajax異步調(diào)用腳本語言,動態(tài)頁面爬取相對靜態(tài)頁面提取比較復(fù)雜。在動態(tài)頁面中,很多有價值的信息是用戶主動與界面進(jìn)行交互之后出現(xiàn)的,因此,必須對傳統(tǒng)的爬蟲程序進(jìn)行改進(jìn)。Ajax頁面可通過傳統(tǒng)爬蟲程序獲得,之后對Ajax頁面進(jìn)行加載和渲染,保存用戶與頁面交互前的DOM結(jié)構(gòu),并將DOM結(jié)構(gòu)中的所有時間添加到指定事件隊(duì)列,然后依次對事件進(jìn)行觸發(fā),并將變化后的DOM結(jié)構(gòu)保存,直至所有的事件觸發(fā)完畢,再將所有保存過的DOM結(jié)構(gòu)輸出,完成初步的Ajax網(wǎng)頁信息爬取。再通過對DOM結(jié)構(gòu)進(jìn)行抗干擾優(yōu)化,存入數(shù)據(jù)庫,即完成網(wǎng)站信息的采集。

    三、關(guān)鍵詞與變異關(guān)鍵詞頻率分析

    網(wǎng)絡(luò)輿情信息一般是非結(jié)構(gòu)化的,需要將非結(jié)構(gòu)化信息轉(zhuǎn)換成結(jié)構(gòu)化信息之后,存儲在專門的數(shù)據(jù)庫中。采用關(guān)鍵詞與變異關(guān)鍵詞詞頻分析法,對相近關(guān)鍵詞及變異關(guān)鍵詞匯總,繪制關(guān)鍵詞隨時間的頻率變化曲線,并對其進(jìn)行排序。可以分析出當(dāng)前熱點(diǎn)輿情以及有熱點(diǎn)輿情發(fā)展趨勢的信息。以便于高校有針對性的對輿情進(jìn)行管理。

    四、總結(jié)

    完善的高校網(wǎng)絡(luò)輿情信息管理,可以對學(xué)校穩(wěn)定和和諧起到預(yù)警作用,可以為學(xué)校的管理和教學(xué)提供現(xiàn)實(shí)依據(jù),可以使學(xué)校了解學(xué)生層次素質(zhì)與心理,有益于學(xué)校發(fā)展。網(wǎng)絡(luò)輿情信息的采集方法,必將受到學(xué)校職能部門重視。

    基金項(xiàng)目:河北金融學(xué)院大學(xué)生科學(xué)研究基金資助項(xiàng)目,項(xiàng)目編號:DXSKYY2015030

    【參考文獻(xiàn)】

    [1] 高天宏. 互聯(lián)網(wǎng)輿情分析中信息采集技術(shù)的研究與設(shè)計(jì)[D]. 北京郵電大學(xué), 2015,3.

    [2] 孟東霞, 陳 剛, 封二英. 基于校內(nèi)貼吧的高校輿情預(yù)警系統(tǒng)的設(shè)計(jì)與構(gòu)建[J]. 青春歲月, 2015,4.

    [3] 李雁行. 基于詞頻分析法的高校網(wǎng)咯輿情研究熱點(diǎn)分析[J]. 內(nèi)蒙古科技與經(jīng)濟(jì), 2015,4.

    [4] 張東霞. 基于高校學(xué)生微博的網(wǎng)絡(luò)熱點(diǎn)發(fā)現(xiàn)及輿情分析研究[D]. 華南理工大學(xué), 2013,6.

    [5] 溫淑春. 試論經(jīng)濟(jì)社會轉(zhuǎn)型時期的輿論特征[J]. 理論界, 2008,7.

    [6] 劉前紅. 新媒體背景下輿情的特征分析[J]. 新媒體研究, 2016,4.

    【作者簡介】

    劉儒夢(1994—),女,河北邢臺人,河北金融學(xué)院本科在讀,主要研究方向:計(jì)算機(jī)科學(xué)與技術(shù)。

    陳銀茹(1993—),女,河北張家口人,河北金融學(xué)院本科在讀,主要研究方向:計(jì)算機(jī)科學(xué)與技術(shù)。

    趙麗娜(1994—),女,內(nèi)蒙古赤峰人,河北金融學(xué)院本科在讀,主要研究方向:金融學(xué)。

    猜你喜歡
    博客頁面輿情
    大狗熊在睡覺
    刷新生活的頁面
    輿情
    中國民政(2016年16期)2016-09-19 02:16:48
    輿情
    中國民政(2016年10期)2016-06-05 09:04:16
    輿情
    中國民政(2016年24期)2016-02-11 03:34:38
    博客天下
    博客天下(2015年2期)2015-09-15 14:12:57
    微博的輿情控制與言論自由
    同一Word文檔 縱橫頁面并存
    淺析ASP.NET頁面導(dǎo)航技術(shù)
    博客相冊
    博客天下(2009年12期)2009-08-21 07:35:10
    伊吾县| 高要市| 丰县| 台安县| 拉萨市| 理塘县| 道孚县| 兴和县| 青河县| 红安县| 旅游| 长岭县| 大姚县| 神农架林区| 星子县| 襄城县| 普陀区| 马边| 广安市| 鄂州市| 松原市| 黔西县| 通山县| 湘乡市| 辽宁省| 商南县| 罗山县| 伊金霍洛旗| 吴川市| 黄浦区| 道真| 弋阳县| 出国| 天峨县| 迁安市| 永顺县| 航空| 交口县| 仁寿县| 罗城| 肥城市|