• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于LDA模型的學(xué)術(shù)次生衍生輿情傳播的演化分析

      2022-08-09 08:21:10蔡政群李詩軒吳玉敏楊斯涵
      關(guān)鍵詞:不端輿情公眾

      蔡政群,李詩軒,吳玉敏,楊斯涵

      (1.武漢理工大學(xué) 安全科學(xué)與應(yīng)急管理學(xué)院,湖北 武漢 430070;2.中南大學(xué) 資源與安全工程學(xué)院,湖南 長沙 410083;3.東北大學(xué) 資源與土木工程學(xué)院,遼寧 沈陽 110819)

      近年來,高校學(xué)術(shù)話題是網(wǎng)民關(guān)注度最高的話題之一,與此同時,有關(guān)高校學(xué)術(shù)不端的事件也層出不窮,在“翟天臨事件”爆發(fā)之后,媒體和公眾對學(xué)術(shù)界新聞的關(guān)注不斷走高,由此引發(fā)的輿論也持續(xù)發(fā)酵。此后,越來越多的學(xué)術(shù)不端事件出現(xiàn)在公眾的視野,如中國人民大學(xué)章勝玉的碩士學(xué)位論文全文抄襲華東師范大學(xué)李潔論文、江蘇大學(xué)理學(xué)院教授戴美鳳刊發(fā)于Nature雜志旗下知名期刊《科學(xué)報告》(Scientific Reports)的論文被撤稿等事件均引發(fā)了激烈的討論,形成了高校學(xué)術(shù)不端事件的原生輿情。

      原生輿情的出現(xiàn)往往伴隨或引發(fā)次生、衍生輿情[1]。次生輿情是指輿情事件在互聯(lián)網(wǎng)中因某一因素觸發(fā)的再生或演化的新輿情[2];衍生輿情,是指由原事件網(wǎng)絡(luò)輿情演變而產(chǎn)生的新輿情[3]。由于兩類輿情概念與性質(zhì)相似,文章中不再對兩類輿情進(jìn)行區(qū)分,統(tǒng)稱為次生衍生輿情。

      目前,國內(nèi)外對原生輿情的研究已較為成熟,但對次生衍生輿情的研究較少,而次生衍生輿情往往在事件爆發(fā)后難以預(yù)測和評估。因此,掌握次生衍生輿情的發(fā)展規(guī)律有利于相關(guān)部門預(yù)測與治理次生衍生輿情。鑒于此,文章以三起具有代表性的高校學(xué)術(shù)不端事件的次生衍生輿情為研究對象,基于LDA主題模型進(jìn)行主題提取,利用困惑度指標(biāo)確定最佳主題數(shù),揭示次生衍生輿情的發(fā)展方向與演化規(guī)律。

      1 文獻(xiàn)綜述

      1.1 次生衍生輿情相關(guān)研究

      目前國內(nèi)外針對網(wǎng)絡(luò)次生衍生輿情的研究主要集中在衍生輿情的形成要素、傳播方式、治理對策和預(yù)警研究四方面。單曉紅[4]等通過采集微博話題數(shù)據(jù),構(gòu)建以輿情主體和客體為核心的衍生話題分析框架,利用模糊集定性比較分析法,探究了衍生話題形成路徑;DONG等[5]提出了在線/離線社交網(wǎng)絡(luò)環(huán)境下的衍生輿情動力學(xué)模型,研究了衍生輿情動力學(xué)模型中形成共識的分析條件,為網(wǎng)絡(luò)輿情的管理提供了科學(xué)的依據(jù);范曉萌[6]立足于文獻(xiàn)調(diào)研法、Matlab數(shù)值仿真等研究方法,建立基于Logistic模型的分析微分方程,進(jìn)一步闡明出現(xiàn)衍生輿情擴(kuò)散時所傳播的基本規(guī)律以及預(yù)警的必要性;GURBUZ等[7]用數(shù)值方法研究了衍生輿情傳播模型的動力學(xué),解釋了參數(shù)模型的敏感性分析,最后通過數(shù)值模擬證明了該方法的有效性;劉文強(qiáng)[8]利用子系統(tǒng)分析次生輿情的因果關(guān)系,提出基于系統(tǒng)動力學(xué)模型和三角模糊數(shù)的移動社交網(wǎng)絡(luò)次生輿情動態(tài)預(yù)警方法;ZHANG等[9]鑒于新聞在微博上傳播時會產(chǎn)生衍生話題,開創(chuàng)性地提出了一種包含原始話題層和派生話題層兩層耦合的SEIR輿情傳播模型。

      綜上所述,網(wǎng)絡(luò)次生衍生輿情等相關(guān)問題的研究已經(jīng)成為新時代互聯(lián)網(wǎng)背景下,相關(guān)研究人員重點關(guān)注的課題之一。熱點事件引起的網(wǎng)絡(luò)輿情能夠反應(yīng)公眾的態(tài)度和心聲,而原生輿情引發(fā)的次生衍生輿情會更直接影響原生事件的發(fā)展或引發(fā)其他事件。因此,能否正確把握次生衍生輿情的發(fā)展與演化規(guī)律并進(jìn)行合理的引導(dǎo),將直接影響社會的發(fā)展和穩(wěn)定。

      1.2 學(xué)術(shù)不端網(wǎng)絡(luò)輿情相關(guān)研究

      學(xué)術(shù)不端是指高等學(xué)校及其教學(xué)科研人員,在科學(xué)研究及相關(guān)活動中發(fā)生的違反學(xué)術(shù)準(zhǔn)則、違背學(xué)術(shù)誠信,以及以學(xué)生為主體的學(xué)業(yè)上的非道德行為。近年來,國內(nèi)學(xué)術(shù)不端類事件頻發(fā),相關(guān)研究人員也漸漸對學(xué)術(shù)不端網(wǎng)絡(luò)輿情保持較高的關(guān)注度。田秀秀等[10]以梁瑩學(xué)術(shù)不端輿情事件為例,運用內(nèi)容分析法對微博平臺上媒體、意見領(lǐng)袖、公眾三者之間的議題與框架進(jìn)行量化統(tǒng)計分析,得出意見領(lǐng)袖和公眾更容易達(dá)成趨同性意見和框架;張柳等[11]以新浪微博“高校學(xué)術(shù)不端”話題為例,基于樸素貝葉斯分類器進(jìn)行高校輿情情感演化圖譜研究,為微博環(huán)境下高校輿情情感的演化規(guī)律提供新的理論支撐;侯治平等[12]通過語義關(guān)聯(lián)分析發(fā)現(xiàn)學(xué)術(shù)網(wǎng)絡(luò)輿情信息傳播的規(guī)律,為社交網(wǎng)絡(luò)環(huán)境下學(xué)術(shù)輿情的傳播提供了新的視角和分析方法;李娟[13]通過計算對微博用戶節(jié)點進(jìn)行影響力分析,結(jié)合用戶情感傾向與用戶節(jié)點影響力展示社交媒體中高校輿情情感圖譜。

      總體而言,現(xiàn)有學(xué)者已對學(xué)術(shù)不端網(wǎng)絡(luò)輿情的主體、形成要素及傳播形式和特點進(jìn)行了豐富的研究,但對學(xué)術(shù)不端次生衍生輿情的研究較少,且現(xiàn)有研究中沒有明確的次生衍生輿情判定規(guī)則。鑒于此,探索學(xué)術(shù)不端次生衍生輿情的發(fā)展規(guī)律,對輿情監(jiān)管部門及時準(zhǔn)確地監(jiān)控、預(yù)測和引導(dǎo)高校輿情的走向具有重要意義。

      2 研究框架與方法

      2.1 研究框架

      文章基于LDA主題模型進(jìn)行學(xué)術(shù)次生衍生輿情傳播演化分析的研究框架如圖1所示。

      圖1 次生衍生輿情傳播演化研究框架

      2.2 LDA主題模型

      LDA(latent dirichlet allocation)主題模型,是由BLEI等[15]人在2003年提出的三層貝葉斯概率模型,LDA是一種基于詞袋模型的無監(jiān)督機(jī)器學(xué)習(xí)文本分析方法,可以用來識別大規(guī)模的語料庫或文檔集中的潛在主題信息。LDA組成結(jié)構(gòu)包含文檔、主題和詞三種粒度,在不考慮詞匯出現(xiàn)順序的情況下,構(gòu)成“文檔-主題分布”和“主題-詞分布”[16]。因此,可借助LDA模型進(jìn)行高校學(xué)術(shù)輿情主題識別和聚類等基于文本的分析過程。

      作為無監(jiān)督機(jī)器學(xué)習(xí),需要事先確定三個超參數(shù)α、β、k(最優(yōu)主題數(shù)),α、β選取默認(rèn)值為α=0.37、β=0.02,最優(yōu)主題數(shù)k通過困惑度(perplexity)計算確定。困惑度常用來度量一個概率分布或概率模型預(yù)測樣本的優(yōu)劣程度,可用于調(diào)節(jié)主題個數(shù),困惑度的計算公式如式(1)所示。

      (1)

      式中:D為文檔中所有詞的集合;M為文檔的數(shù)量;Wd為文檔d中的詞;Nd為每個文檔中d的詞數(shù);P(Wd)為文檔中詞出現(xiàn)的概率;log底數(shù)為10。困惑度為文檔d所屬主題的不確定性,困惑度越小,模型性能越好,困惑度最低或處于拐點時所對應(yīng)的k值為最優(yōu)主題數(shù)。

      2.3 數(shù)據(jù)獲取及預(yù)處理

      根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)在京發(fā)布第48次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》的數(shù)據(jù)顯示,截至2021年6月,我國網(wǎng)民規(guī)模達(dá)10.11億,其中微博用戶規(guī)模達(dá)5.66億[17]。新浪微博也成為眾多社交平臺中活躍人數(shù)最多和影響力最為廣泛的社交媒體之一,因而在社交網(wǎng)絡(luò)的樣本選擇上,選擇新浪微博作為數(shù)據(jù)采集的平臺。

      文章分別以“湖南大學(xué)劉夢潔抄襲”“翟天臨學(xué)術(shù)造假”“天津大學(xué)張裕卿”作為三起事件的關(guān)鍵詞,利用網(wǎng)頁數(shù)據(jù)爬取工具“八爪魚采集器”爬取相關(guān)微博數(shù)據(jù),包括博文內(nèi)容、評論內(nèi)容、評論時間、轉(zhuǎn)發(fā)數(shù)等,獲得微博評論數(shù)據(jù)26 723條。

      在數(shù)據(jù)預(yù)處理階段,爬取到的微博評論中含有各種與主題無關(guān)的干擾因素,為得到規(guī)范的文本數(shù)據(jù)集,首先對獲取到的數(shù)據(jù)進(jìn)行去重、清洗和整理,利用正則表達(dá)式將文本內(nèi)容僅為“@用戶名”“#”等各種特殊符號以及不能表達(dá)主題的文字刪除,以降低數(shù)據(jù)噪聲,再調(diào)用Jieba中文文本分詞,并默認(rèn)使用精確模式對微博評論進(jìn)行分詞,根據(jù)去停用詞詞表去除停用詞,最終獲得微博評論數(shù)據(jù)20 286條。

      3 實驗結(jié)果與分析

      3.1 生命周期劃分

      生命周期是指生物體從出生、成長、成熟、衰退到死亡的全部過程,泛指客觀事物的階段性變化及規(guī)律。網(wǎng)絡(luò)輿情的發(fā)展和演化過程也符合這一規(guī)律,鑒于此,筆者參照劉國威和成全將輿情生命周期劃分為三階段的方法[18],將網(wǎng)絡(luò)輿情生命周期劃分為醞釀期、爆發(fā)期和衰退期三個階段。在知微事見平臺中分別搜索三起學(xué)術(shù)不端案例,得到它們隨時間變化的傳播趨勢圖,根據(jù)不同時段微博輿情的發(fā)文量、發(fā)文增量和發(fā)文增長率,三起學(xué)術(shù)不端事件的次生衍生輿情生命周期如表1所示。

      表1 學(xué)術(shù)不端事件次生衍生輿情生命周期劃分表

      (1)醞釀期。即網(wǎng)絡(luò)輿情的發(fā)生期,這個時期的輿情正處于萌芽階段,互聯(lián)網(wǎng)上出現(xiàn)零散化的相關(guān)信息,瀏覽量和關(guān)注度有限。一小部分網(wǎng)友開始點贊、評論和轉(zhuǎn)發(fā),因此網(wǎng)絡(luò)輿情的關(guān)注度和熱度較低。

      (2)爆發(fā)期。即網(wǎng)絡(luò)輿情的成長期,這個時期的輿情處于發(fā)酵階段,媒體報道紛紛加入進(jìn)來。網(wǎng)友開始群體性的轉(zhuǎn)發(fā)和評論,與此同時,學(xué)術(shù)界專家學(xué)者們也紛紛加入進(jìn)來,網(wǎng)絡(luò)輿情開始廣泛傳播,爆發(fā)范圍迅速擴(kuò)大,因此網(wǎng)絡(luò)輿情的關(guān)注度和熱度達(dá)到最高水平。

      (3)衰退期。即網(wǎng)絡(luò)輿情的消退期,這個時期的輿情處于消散階段,輿論事件的處理結(jié)果已經(jīng)被公眾知情并且接受,此時只有一小部分網(wǎng)友在關(guān)注此事,因此網(wǎng)絡(luò)輿情的關(guān)注度和熱度都達(dá)到最低水平。

      3.2 確實主題聚類個數(shù)

      文章選用gensim包中的LDA主題模型對預(yù)處理后的文本進(jìn)行訓(xùn)練。設(shè)定0~20區(qū)間內(nèi)的整數(shù)為最優(yōu)主題數(shù),通過計算不同主題數(shù)下的困惑度得出局部最小值,從而確定最優(yōu)主題數(shù)。三個事件主題困惑度隨主題數(shù)變化如圖2中的(a)(b)(c)所示。

      圖2 困惑度—主題折線圖

      由圖2可以看出,湖南大學(xué)劉夢潔抄襲事件醞釀期、爆發(fā)期和衰退期的困惑度局部最小值點出現(xiàn)在主題數(shù)分別為5、5、6時。翟天臨學(xué)術(shù)造假事件醞釀期、爆發(fā)期和衰退期的困惑度局部最小值點出現(xiàn)在主題數(shù)分別為5、7、6時。天津大學(xué)張裕卿學(xué)術(shù)不端事件醞釀期、爆發(fā)期和衰退期的困惑度局部最小值點出現(xiàn)在主題數(shù)分別為7、5、6時。

      3.3 主題模型訓(xùn)練

      在確定最優(yōu)主題數(shù)后,對分詞后的文本進(jìn)行LDA主題模型訓(xùn)練得到高頻詞,結(jié)合這些高頻詞進(jìn)行主題歸納。利用LDA主題模型訓(xùn)練得到的湖南大學(xué)劉夢潔抄襲事件醞釀期主題與關(guān)鍵詞如表2所示;翟天臨學(xué)術(shù)造假事件主題與關(guān)鍵詞如表3所示;張裕卿學(xué)術(shù)不端事件主題與關(guān)鍵詞如表4所示。

      表2 湖南大學(xué)劉夢潔抄襲事件主題與關(guān)鍵詞

      表3 翟天臨學(xué)術(shù)造假事件主題與關(guān)鍵詞

      表4 張裕卿學(xué)術(shù)不端事件主題與關(guān)鍵詞

      3.4 構(gòu)建次生衍生輿情判定規(guī)則

      文章主要研究高校學(xué)術(shù)次生衍生輿情的形成與演化規(guī)律,三起高校事件存在多個次生衍生輿情。根據(jù)衍生輿情的基本特點、生成機(jī)制以及相關(guān)文獻(xiàn)對次生輿情和衍生輿情的描述,結(jié)合筆者利用LDA主題模型對文本的處理結(jié)果,獲取次生衍生輿情的判定規(guī)則如下:

      (1)話題影響力,具有一定的影響力,不論是積極正面還是消極負(fù)面的影響;

      (2)話題關(guān)鍵詞差異,是原生話題的擴(kuò)展或拆分,表現(xiàn)為脫離了原生話題相關(guān)關(guān)鍵詞又出現(xiàn)新的關(guān)鍵詞;

      (3)話題出現(xiàn)時間,在原生話題出現(xiàn)之后產(chǎn)生并獨立于原生話題;

      (4)話題導(dǎo)火索,事件有隱情或者事件應(yīng)對不當(dāng);

      (5)話題評價主體差異,原生話題的評價主體發(fā)生改變。原生輿情與次生衍生輿情的評價主題不同,且原生輿情的評價主題容易辨別,因此根據(jù)主體的不同,篩選出次生衍生輿情。將歸納總結(jié)出的主題根據(jù)以上判定規(guī)則進(jìn)行判定,篩選出次生衍生輿情。

      3.5 判斷次生衍生輿情

      根據(jù)次生衍生輿情判定規(guī)則,對三起高校學(xué)術(shù)不端事件的主題進(jìn)行分析。將相同的主題合并為一個,對事件及主題進(jìn)行編號:數(shù)字1代表湖南大學(xué)劉夢潔抄襲事件,2代表翟天臨學(xué)術(shù)不端事件,3代表天津大學(xué)張裕卿事件;字母a代表醞釀期,b代表爆發(fā)期,c代表衰退期,最終得到表5所示的高校學(xué)術(shù)事件各生命周期的次生衍生輿情。

      表5 高校學(xué)術(shù)事件次生衍生輿情

      由表5可以發(fā)現(xiàn),三起學(xué)術(shù)不端事件的次生衍生輿情均涉及當(dāng)事人、公眾和高校三種主體。其中,涉及當(dāng)事人層面的次生衍生輿情最多,其次是高校層面,最后是公眾層面。當(dāng)事人層面的次生衍生輿情包括相關(guān)人員私生活被扒、被調(diào)查與革職、當(dāng)事人科研成果被取消、當(dāng)事人致歉;公眾層面的次生衍生輿情包括公眾譴責(zé)當(dāng)事人、支持高校開展調(diào)查、質(zhì)疑高校審查機(jī)制;高校層面的次生衍生輿情包括核查相關(guān)事件、處罰相關(guān)人員、取消涉事人相關(guān)科研成果。

      (1)當(dāng)事人。當(dāng)事人包括抄襲者、被抄襲者以及相關(guān)人員。抄襲者通過不當(dāng)手段和方法進(jìn)行學(xué)術(shù)造假、剽竊來盜取學(xué)術(shù)成果,對社會和學(xué)術(shù)界造成了極其惡劣的影響;相關(guān)人員則對抄襲者的學(xué)術(shù)造假行為進(jìn)行隱瞞,協(xié)助其獲得非正規(guī)利益與學(xué)術(shù)成果;被抄襲者在發(fā)現(xiàn)自己科研成果被他人剽竊后往往選擇在網(wǎng)絡(luò)上進(jìn)行公開,以求獲得學(xué)者和機(jī)構(gòu)的關(guān)注并進(jìn)行調(diào)查與處理,以期能維護(hù)學(xué)術(shù)尊嚴(yán),懲治學(xué)術(shù)腐敗。

      (2)公眾。公眾是輿情傳播的核心主體,當(dāng)學(xué)術(shù)不端事件發(fā)生,公眾會關(guān)注學(xué)術(shù)事件的相關(guān)信息,試圖了解事件真相。初步了解后,通過網(wǎng)絡(luò)平臺發(fā)表自己的觀點和看法。由于廣大網(wǎng)友的受教育水平、情緒狀態(tài)和自身利益訴求各不相同,發(fā)表的言論出現(xiàn)信息不對稱、信息異化等現(xiàn)象,不僅會關(guān)注原生輿情的起因和發(fā)展動態(tài),還會討論由學(xué)術(shù)事件引發(fā)的其他領(lǐng)域的話題,將輿論推向兩極化,從而導(dǎo)致次生衍生輿情的形成與演化。

      (3)高校。學(xué)術(shù)不端事件必然涉及高校,面對外界的質(zhì)疑和公眾的追問,若高校封鎖消息,不出面給予回應(yīng),則會導(dǎo)致公眾不得不通過其他渠道了解事件情況。而一些媒體為追求熱度與時效性,往往會在傳播過程中扭曲和歪解事件的真實性,此時的公眾極易受其誤導(dǎo),造成公眾的揣測和猜疑,更容易引發(fā)次生衍生輿情的形成。因此,高校及時公開信息和發(fā)表聲明是遏制次生衍生輿情傳播的必要手段,在發(fā)布聲明的渠道上,要做到信息的多元性和覆蓋的全面性,以提升信息公開質(zhì)效,正向應(yīng)對次生衍生輿情的傳播演化。

      4 結(jié)論與啟示

      (1)筆者通過選取三件高校學(xué)術(shù)不端的案例,將獲取到的微博數(shù)據(jù)按照生命周期劃分為醞釀期、爆發(fā)期和衰退期三個階段,采用困惑度評價指標(biāo)對每個階段的數(shù)據(jù)進(jìn)行最優(yōu)主題數(shù)確定,基于LDA進(jìn)行主題模型訓(xùn)練,得到相關(guān)事件的用戶評論高頻詞并進(jìn)行主題歸納。

      (2)通過構(gòu)建次生衍生輿情判定規(guī)則,判斷出高校學(xué)術(shù)次生衍生輿情,及其涉及的主體有當(dāng)事人、公眾和高校。其中,涉及當(dāng)事人的次生衍生輿情數(shù)量最多,高校層面的次生衍生輿情數(shù)量次之,公眾層面的次生衍生輿情數(shù)量最少。

      (3)學(xué)術(shù)不端次生衍生輿情的演化貫穿整個生命周期,大部分次生衍生輿情主要集中在爆發(fā)期和衰退期。在網(wǎng)絡(luò)輿情的醞釀期,高校應(yīng)做好輿情衍生的預(yù)警工作;在網(wǎng)絡(luò)輿情的爆發(fā)期和衰退期,高校應(yīng)積極回應(yīng)群眾的關(guān)注,及時發(fā)布調(diào)查真相,使群眾能夠合理地看待輿情事件,以防止次生衍生輿情的蔓延。

      (4)本研究主要針對高校學(xué)術(shù)不端事件進(jìn)行研究,為同類事件引發(fā)的次生衍生輿情提供參考。在事件的選取方面存在一定的局限性,不同事件進(jìn)行實驗得到的次生衍生輿情及其主體也會不同。因此,未來研究可以完善實驗對象的選取,從而為預(yù)防和處理次生衍生輿情提供更好的方法。

      猜你喜歡
      不端輿情公眾
      規(guī)范科學(xué)技術(shù)活動 抵制學(xué)術(shù)不端行為
      公眾號3月熱榜
      公眾號9月熱榜
      公眾號8月熱榜
      公眾號5月熱榜
      論文作者學(xué)術(shù)不端行為類型
      輿情
      中國民政(2016年16期)2016-09-19 02:16:48
      輿情
      中國民政(2016年10期)2016-06-05 09:04:16
      輿情
      中國民政(2016年24期)2016-02-11 03:34:38
      《肝膽胰外科雜志》來稿中常見的學(xué)術(shù)不端問題
      葫芦岛市| 镇平县| 望江县| 万州区| 呈贡县| 奉化市| 广宁县| 城步| 上林县| 临洮县| 大港区| 绍兴县| 沭阳县| 商丘市| 黑龙江省| 吉林市| 敦化市| 秭归县| 淮阳县| 湖口县| 光泽县| 九江市| 东山县| 东城区| 台中市| 陆川县| 呼和浩特市| 沾益县| 连山| 宁陵县| 喀什市| 甘德县| 临泽县| 玉门市| 永靖县| 万全县| 海淀区| 孝感市| 阿尔山市| 蒲城县| 彰武县|