• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      開放互聯(lián)網(wǎng)環(huán)境基于信息熵的信息傳播影響力計算方法

      2022-05-06 08:56:50李攀攀謝正霞王贈凱靳銳
      電信科學(xué) 2022年4期
      關(guān)鍵詞:信息熵輿情影響力

      李攀攀,謝正霞,王贈凱,靳銳

      (1. 嘉興學(xué)院信息科學(xué)與工程學(xué)院,浙江 嘉興 314001;2. 嘉興學(xué)院建筑工程學(xué)院,浙江 嘉興 314001;3. 哈爾濱工業(yè)大學(xué)計算機科學(xué)與技術(shù)學(xué)院,黑龍江 哈爾濱 150001)

      0 引言

      信息技術(shù)的更新迭代一直是社會發(fā)展的核心推動力之一,科學(xué)技術(shù)的關(guān)鍵創(chuàng)新推動了信息傳播方式的重大變化,信息傳播一直朝著速度更快、受眾面更廣、傳播成本更低的方向發(fā)展[1]。當(dāng)今,在泛互聯(lián)網(wǎng)空間環(huán)境下,信息傳播的門檻被極大地降低,信息傳播速度及傳播模式的變革深深影響了人類社會的發(fā)展[2-3]。作為衡量信息傳播能量的重要指標(biāo),信息影響力的度量在研究信息傳播過程中扮演著重要的角色,因此,研究信息在開放互聯(lián)網(wǎng)環(huán)境中的傳播影響力、對受眾的影響程度以及探究信息演化的趨勢具有重要的現(xiàn)實意義。

      互聯(lián)網(wǎng)的出現(xiàn)改變了信息的傳播模式,一方面,信息傳播的廣度顯著增加,所傳播范圍的不確定性日益突出,相比傳統(tǒng)環(huán)境,信息共享與傳播的邊界不斷擴大,人們能更便捷地享受信息高效傳播帶來的便利;另一方面,共享開放的網(wǎng)絡(luò)空間給信息影響力的傳播帶來了深刻的變革,信息傳播的跨時空性給量化信息的傳播影響力帶來更為嚴(yán)峻的挑戰(zhàn)[4-5]。

      傳統(tǒng)的信息傳播影響力計算方法有如下研究。在信息影響力關(guān)鍵要素抽取方面,文獻[6]使用信息熵建立了中文公眾事件的抽取方法,未對傳播影響力進一步研究;在傳播影響力分析方面,文獻[7]和InfoIBP(influence propagation Indian Buffet process)模型[8]側(cè)重于信息主體與信息內(nèi)容之間相互影響力的分析,忽視了信息之間的傳播影響力,而基于粒子群的LAPSO-IM(a learning automata based discrete particle swarm optimization influence maximization)方法[9]或基于蟻群優(yōu)化的ACO-IM(ant colony optimization influence maximization)方法[10]通常依賴大規(guī)模特定領(lǐng)域的數(shù)據(jù)集作為初始訓(xùn)練集,應(yīng)用范圍受限;在關(guān)鍵傳播節(jié)點或關(guān)鍵事件影響力分析方面,文獻[11]和文獻[12]分別使用貝葉斯方法和實測方法進行了研究,該類方法通常忽略了信息的跨領(lǐng)域傳播。

      針對上述問題,本文研究了開放互聯(lián)網(wǎng)環(huán)境下多維信息因素的建模,充分考慮了互聯(lián)網(wǎng)環(huán)境的開放性、多維性等特點,研究了基于最大熵理論的信息傳播影響力計算方法。互聯(lián)網(wǎng)中海量的信息并非互相獨立,隨著互聯(lián)網(wǎng)信息共享能力的提升,大多數(shù)傳統(tǒng)的信息“孤島”和數(shù)據(jù)“壁壘”已被打破,用戶通過互聯(lián)網(wǎng)接收傳播信息的同時,其認(rèn)知也同樣經(jīng)歷著影響與被影響的過程?;ヂ?lián)網(wǎng)信息傳播的影響力涉及信息對信息、信息對用戶、用戶對用戶等多個方面[13-15]。理論上講,傳播影響力是衡量信息重要程度的內(nèi)在特征屬性,如何量化這種影響力的傳播過程,探究信息傳播的影響力是研究信息傳播及其演化模型的基礎(chǔ)。

      在傳播速度更快、環(huán)境復(fù)雜性更高的公共互聯(lián)網(wǎng)環(huán)境中,評價與量化信息傳播影響力主要面臨的挑戰(zhàn)有以下方面。

      · 互聯(lián)網(wǎng)信息影響力涉及因素眾多,如信息主體、傳播路徑、客體影響等,在開放的公共互聯(lián)網(wǎng)中難以獲得完備的信息傳播影響力要素集。

      · 互聯(lián)網(wǎng)信息類型多樣,如文本、圖片、音/視頻等,信息影響力各因素極其復(fù)雜,尤其是各因素相互疊加影響,難以統(tǒng)一量化。

      · 信息傳播渠道多樣化,如社交網(wǎng)絡(luò)轉(zhuǎn)發(fā)引用、新聞評論、學(xué)術(shù)論文引用與評述等,不同渠道難以用統(tǒng)一的量綱描述信息的影響力。

      鑒于此,本文提出了一種在公共互聯(lián)網(wǎng)環(huán)境基于信息熵的信息傳播影響力計算方法,通過“奧卡姆剃刀原理”選取關(guān)鍵特征。針對多維變量權(quán)重的相互影響,難以用傳統(tǒng)的統(tǒng)計學(xué)函數(shù)分布描述問題展開研究,本文采用最大熵理論探究并量化信息在公共互聯(lián)網(wǎng)中傳播的影響力,為信息傳播影響力的可度量、可計算方面的研究提供了理論基礎(chǔ)和實踐指導(dǎo)。

      1 互聯(lián)網(wǎng)信息傳播動力學(xué)模型

      1.1 信息傳播影響力模型

      經(jīng)典的影響力傳播模型主要有兩種:線性閾值模型(linear threshold model,LT)和獨立級聯(lián)模型(independent cascade model,IC)。這兩種基于概率的傳播影響力模型[16]在計算過程中,通過引入隨機性參數(shù)在一定程度上體現(xiàn)了信息傳播的特點,LT在信息傳播前為節(jié)點隨機地選擇概率的閾值,IC中一個節(jié)點通常以概率p激活鄰居節(jié)點。信息實體A,B,···,H基于LT的信息影響力傳播過程如圖1所示。

      圖1 信息實體A,B,···,H基于LT的信息影響力傳播過程

      從圖1可以看出,LT通過隨機地選擇閾值作為計算信息傳播影響力的基礎(chǔ),顯然這種隨機性難以準(zhǔn)確反映信息傳播的具體環(huán)境特點,尤其在開放的互聯(lián)網(wǎng)環(huán)境。從理論上看,信息傳播影響力最大化求解過程可抽象力在一個子集上面向特定目標(biāo)的查找組合優(yōu)化問題,因此,基于LT和IC的影響力最大化問題屬于非確定性多項式(non-deterministic polynomial,NP)難問題[7],難以適用于開放互聯(lián)網(wǎng)中信息傳播影響力的計算,主要原因有以下兩點。

      · 這兩種模型的相對隨機性難以適用于互聯(lián)網(wǎng)信息影響力的計算,主要因為開放互聯(lián)網(wǎng)中信息影響力涉及因素多且這些因素?zé)o統(tǒng)一可計算的量綱。

      · LT概率閾值及IC激活概率的隨機性使得采用這些模型計算的傳播影響力通用性不高。

      信息傳播影響力涉及內(nèi)、外部因素諸多,難以量化這些因素與傳播影響力之間的關(guān)系,如瀏覽、引用、點擊量等。因此,需要使用多維可計算性衡量信息傳播影響力,以使影響力具有通用性。信息傳播影響力具備以下3個主要特征。

      · 可度量性:對信息傳播影響力的指標(biāo)進行綜合分析并量化而成的特性,是信息傳播影響力可計算的基礎(chǔ)。

      · 可計算性:不同類型信息傳播影響力具備可計算能力,實現(xiàn)信息傳播過程中影響力的計算。

      · 多維性:信息傳播影響力不僅包含較多的因素,而且不同領(lǐng)域的信息影響力具有各自的特性,信息傳播力衡量的特征要具備容納多維特征的能力。

      根據(jù)文獻[18],信息傳播影響力關(guān)系可抽象成有向圖G(V,E,W),其中,V是節(jié)點(信息實體)的集合,E是有向邊的集合(信息個體之間的影響關(guān)系),W是信息傳播影響力的集合,節(jié)點v∈V表示一個信息實體,邊(u,v)?E表示節(jié)點u到節(jié)點v的影響關(guān)系[19]?;ヂ?lián)網(wǎng)信息傳播過程可從以下兩個角度描述。

      · 傳播廣度:信息在互聯(lián)網(wǎng)被引用、轉(zhuǎn)載、評述等的次數(shù),是對信息直接影響力的度量。

      · 傳播深度:信息被引用、轉(zhuǎn)載、評述后,還能被后續(xù)信息引用、轉(zhuǎn)載、評述的次數(shù),是對信息間接影響力的度量。

      信息的傳播過程由信息及信息之間的引用、轉(zhuǎn)載、引述、評論等關(guān)系組成一個復(fù)雜網(wǎng)絡(luò),這種復(fù)雜的信息傳播拓撲結(jié)構(gòu)對信息影響力的傳播和擴散起著至關(guān)重要的作用。

      1.2 影響力傳播形式化表示方法

      本書詳細討論特征參數(shù)的選取規(guī)則。設(shè)信息為全集U,由n個子集構(gòu)成:U1,U2,…,Ui,…,Un。假設(shè)n=10,U1表示信息主題集合,U2表示信息類型集合,U3表示所有者集合,U4表示出版源集合,U5表示時間集合,U6表示被引用或被轉(zhuǎn)載次數(shù),U7表示所屬領(lǐng)域集合,U8表示關(guān)鍵詞集合,U9表示摘要信息集合,U10表示其他信息(未抽取信息)集合。顯然,U=U1∪U2∪…Ui∪…∪Un。上述形式化描述是一種對互聯(lián)網(wǎng)信息的簡化表述方式,最大限度地包含了涉及信息傳播影響力的要素。

      信息傳播是信息主體與被影響主體之間強度的表示方式,由信息影響力元數(shù)據(jù)(如信息主體、信息傳播路徑等)指標(biāo)綜合而成,公共互聯(lián)網(wǎng)信息傳播影響力關(guān)聯(lián)要素示意圖如圖2所示,信息的影響力傳播建?;A(chǔ)工作是從影響信息傳播的眾多因素中選取對傳播影響力有較大貢獻的特征變量,即將信息傳播影響力量化為求解影響力邊際增益或收益最大的問題。

      圖2 公共互聯(lián)網(wǎng)信息傳播影響力關(guān)聯(lián)要素示意圖

      在評估信息傳播影響力時涉及信息的引用、轉(zhuǎn)發(fā)、評論等多個參數(shù),這些參數(shù)難以分別具體量化,參數(shù)之間的相互影響程度難以評估,因此,本文采用最大熵理論作為信息影響力傳播的重要理論依據(jù),即從信息熵的原理出發(fā),在評估信息的傳播影響力時,選擇在滿足全部已知條件的情況下,對未知的情況不做任何主觀假設(shè)[7-8,19]。

      1.3 面向傳播影響力的多維特征選擇

      合理的特征選擇是量化信息傳播影響力的基礎(chǔ),根據(jù)“奧卡姆剃刀原理”進行特征工程選取,即在特定的環(huán)境下,選用信息傳播影響力最大的特征作為其數(shù)學(xué)模型的參數(shù),基于信息熵和“奧卡姆剃刀原理”信息傳播影響力特征選擇流程如圖3所示。

      圖3 基于信息熵和“奧卡姆剃刀原理”信息傳播影響力特征選擇流程

      在圖3中,信息影響力可表示為IDINIA→INIB,顯然,影響力是具有方向性的矢量,因此,信息客體受信息主體的影響力如式(1)所示。

      其中,f:IDA→IDB表示信息A對信息B的影響力,需要指出的是f:IDA→IDB≠f: IDB→IDA。

      需要進一步指出的是,在參數(shù)規(guī)則建模過程中,沒有選取信息類型,是因為通過信息摘要能確定信息的所屬領(lǐng)域。根據(jù)上述分析,對于有n個隨機變量組成的信息實體,其傳播影響力可以表示為(X1,X2,...,Xn),信息的影響力組成一個隨機信息系統(tǒng)X。因此,X等價于(X1,X2, ...,Xn),其聯(lián)合概率分布為(p1,p2, ...,pi, ...,pn)。

      2 基于信息熵的信息傳播影響力計算方法

      作為一種系統(tǒng)中信息含量的分析方法,信息熵理論已被廣泛運用于物理學(xué)、信息技術(shù)、統(tǒng)計學(xué)等領(lǐng)域[3,20]。在互聯(lián)網(wǎng)信息傳播領(lǐng)域,信息傳播影響力實質(zhì)是信息傳播力的熵值隨著信息的傳播和擴散階段不斷減小的過程,消除了信息傳播影響力的不確定性和無序性,從而形成信息傳播影響力不斷提升的過程,因此,信息熵理論非常適合在信息傳播影響力場景中展開研究[21-22]。

      2.1 互聯(lián)網(wǎng)信息影響力的信息熵計算方法

      在開放互聯(lián)網(wǎng)環(huán)境下,信息的影響力涉及較多的因素,如信息的發(fā)布者、信息的轉(zhuǎn)發(fā)者、信息的評論次數(shù)、引用者身份、發(fā)布渠道等,這就造成了在衡量信息傳播影響力時,難以量化各指標(biāo)的權(quán)重及其相互之間影響程度的權(quán)重,因此,本文使用最大熵模型解決此問題,用最大熵模型描述并量化信息傳播的影響力。

      針對不同的信息構(gòu)建完備合理的語料庫是提取信息特征的基礎(chǔ),本文通過不同方面的領(lǐng)域?qū)<覙?gòu)建語料庫,并針對不同的應(yīng)用環(huán)境使用不同的語料庫。信息的特征選擇主要包括以下3個步驟。

      步驟1使用領(lǐng)域知識對信息進行文本分詞以及詞頻權(quán)重統(tǒng)計,分詞ti詞頻權(quán)重統(tǒng)計wf(ti)方法如式(2)所示。

      其中,N為總的信息數(shù),ni為包含ti信息的總數(shù),mi為特征詞在該類中出現(xiàn)的次數(shù),Mi為該類信息的總數(shù)。

      步驟2計算分詞之間的逐點互信息(pointwise mutual information,PMI),PMI用于衡量信息變量間相互依賴的程度,因此ni和nj使用聯(lián)合概率分布的計算過程如式(3)所示。

      其中,若ni和nj無關(guān),則有p(ni,nj) =p(ni)p(nj),此時PMI(ni,nj) = 0;若ni和nj的相關(guān)性越大,那么p(ni,nj)/(p(ni)p(nj))越大,隨之PMI(ni,nj)越大。

      步驟3根據(jù)“奧卡姆剃刀原理”篩選關(guān)鍵特征,構(gòu)成信息的特征集。

      經(jīng)過上述步驟,信息的特征是離散的隨機變量,用X表示影響信息傳播影響力的離散特征值集合,設(shè)離散變量X的概率分布是P(X),根據(jù)香農(nóng)信息熵理論,離散隨機變量X的熵H(X)如式(4)所示。

      隨機變量X的熵H(X)是p(x)概率分布函數(shù),用于衡量信息的傳播強度。當(dāng)p(x)=0時,定義0lg(0)=0。從式(4)可以看出,H(X)僅依賴于X的分布,而與X的具體取值無關(guān)。還可以看出,熵滿足其中,是X取值的個數(shù),當(dāng)且僅當(dāng)X均勻分布時右邊的等號成立。

      采用拉格朗日乘子法求解在一定約束條件下X的分布情況,將最大信息熵問題轉(zhuǎn)化為無約束極值問題進行求解,記拉格朗日函數(shù)L(p(xi)) =H(X),文獻[6]采用拉格朗日乘子法求解該問題,得到熵函數(shù)H(x)如式(5)所示。

      從式(5)可以看出,對于取值有限的離散型隨機變量X來說,當(dāng)每個變量的取值相等時,其信息熵最大,即當(dāng)X服從均勻分布時熵最大。信息的影響深度可以表示該信息對后續(xù)信息的影響強度,如學(xué)術(shù)領(lǐng)域的高被引論文通常被認(rèn)為具有較高的影響力,新聞信息被轉(zhuǎn)載或評論的次數(shù)愈多其影響力也就愈大。因此,若使信息的傳播影響力最大,則式(5)滿足

      通過上述推理證明,可得出以下兩個結(jié)論。

      結(jié)論1X均勻分布時,H(X)=lgn,根據(jù)定義,此時信息傳播影響力達到最大。

      因此,H(x)極值點在時,此時有H(X)=lgn。

      結(jié)論2推導(dǎo)出因此,信息熵H(X)是關(guān)于x的嚴(yán)格單調(diào)函數(shù)。

      其中,結(jié)論1和結(jié)論2保證了信息傳播影響力計算結(jié)果的嚴(yán)格單調(diào)性,是本文方法可用性的基礎(chǔ)。

      舉例說明,在n=2時,H(P)的表達式可寫成:

      最大熵理論認(rèn)為所采用的概率模型首先必須滿足既存事實,即約束條件,同時不對未知的情況做任何主觀假設(shè),即在所有可能的概率模型(分布)中。因此,使用最大熵模型評估信息影響力在理論上是可行的。此外,從信息論相關(guān)理論上看,信息傳播的最大熵模型中往往包含更多的關(guān)聯(lián)信息影響力特征,用最大熵計算的影響力也相應(yīng)最大。包含更大信息量的信息容易造成較大的影響力,根據(jù)前文,在(0~1)分布的函數(shù)、概率r=0.5時,熵值H(X)最大,這也很好地解釋了互聯(lián)網(wǎng)熱點事件或有重大影響力屬性的事件有較高傳播影響力的原因,與文獻[6]的研究結(jié)論吻合。

      2.2 基于最大熵理論的信息影響力定量計算流程

      基于最大熵理論的信息影響力定量分析方法需要經(jīng)過一定的預(yù)處理流程,以便于將信息分解為離散、可被計算的參數(shù)[23],開放互聯(lián)網(wǎng)環(huán)境基于信息熵的影響力計算示意圖如圖4所示。

      圖4 開放互聯(lián)網(wǎng)環(huán)境下基于信息熵的影響力計算示意圖

      從圖4可以看出,首先,結(jié)合社會學(xué)理論以及領(lǐng)域知識,利用搜索引擎、網(wǎng)絡(luò)爬蟲等工具在互聯(lián)網(wǎng)中提取海量領(lǐng)域信息建立合理且完備的語料庫;其次,使用語料庫對待處理的信息進行分詞處理,并由領(lǐng)域?qū)<矣嬎阒瘘c互信息;再次,由領(lǐng)域?qū)<沂褂没凇皧W卡姆剃刀原理”的關(guān)鍵特征篩選方法進行預(yù)處理,經(jīng)過上述預(yù)處理后,待處理信息被量化為可計算的離散變量;最后,將這些離散變量進行去重和共指消解以提升后續(xù)影響力計算的準(zhǔn)確性[6]。

      具體來說,互聯(lián)網(wǎng)信息影響力的信息熵計算方法如算法1所示。

      算法1互聯(lián)網(wǎng)信息影響力的信息熵計算方法

      輸入信息ti(i∈|G|)及其傳播拓撲圖G、語料庫D

      輸出信息ti的影響力pi

      使用語料庫D對信息ti進行分詞

      詞頻及權(quán)重統(tǒng)計

      計算逐點互信息PMI

      提取ti特征集

      }

      對信息G采用廣度優(yōu)先遍歷分析信息之間的影響與被影響的關(guān)系

      執(zhí)行去重流程

      執(zhí)行共指消解流程

      根據(jù)拉格朗日乘子法計算ti的影響力信息熵pi

      returnpi

      }

      綜上分析,本文所提方法支持了信息傳播過程中影響力的可度量、可計算并支持多維性因素,并通過領(lǐng)域?qū)<抑С至诵畔⒌目珙I(lǐng)域傳播過程中影響力的計算。

      3 信息傳播力影響力熵定量分析

      3.1 信息傳播影響力建模

      使用隨機變量X表示信息傳播影響力,假設(shè)n=10,那么X等價于(X1,X2,…,X10),其中,X1,X2,…,X10是信息傳播影響力指標(biāo)的參數(shù)化表示。X1,X2,…,X10作為影響自變量與熵值H的關(guān)系無法確定,難以通過具體的函數(shù)模型或量化指標(biāo)描述X1,X2,…,X10與熵值H的關(guān)系,因此,本問題適用文獻[6]所提的最大熵模型加以解決,這使最大熵表示信息影響力的熵值更接近信息在公開互聯(lián)網(wǎng)傳播的實際情況。

      3.2 基于信息熵的傳播力計算方法

      信息傳播影響力要素由(X1,X2,…,X10)構(gòu)成,為了計算傳播影響力信息熵,需要分別確定各分變量的取值范圍,則傳播影響力由各分要素組合構(gòu)成一個多維向量空間。使用ci表示隨機變量Xi的取值次數(shù),當(dāng)Xi的取值次數(shù)為0時,ci為空,對計算結(jié)果無影響。因此,根據(jù)文獻[6],信息傳播影響力涉及的多維變量取值見表1。的約束。

      表1 信息傳播影響力涉及的多維隨機變量取值

      在計算信息傳播影響力的最大熵時,受

      根據(jù)最大熵理論,為了獲得信息的最大傳播影響力,各影響力要素的概率均勻分布,有p(c1)=p(c2)=…=p(c10),根據(jù)約束條件,則有p(c1,c2, …,c10) = 1/n,因此,熵函數(shù)如式(6)所示。

      式(6)是由互聯(lián)網(wǎng)信息影響力各特征要素構(gòu)成的傳播影響力計算方法。

      4 實驗分析

      為了衡量本文方法的有效性,本節(jié)使用不同領(lǐng)域的數(shù)據(jù)集對本文方法進行量化評估。

      4.1 實驗數(shù)據(jù)及實驗環(huán)境

      隨著互聯(lián)網(wǎng)的發(fā)展和廣泛應(yīng)用,學(xué)術(shù)論文的傳播以互聯(lián)網(wǎng)為主要載體,學(xué)術(shù)論文的傳播路徑單一,通常以引用、評述為主要傳播路徑,因此,研究學(xué)術(shù)論文影響力可作為評估本文方法的手段之一。不失一般性,隨著Web3.0、移動互聯(lián)網(wǎng)、短視頻等媒體技術(shù)的普及,互聯(lián)網(wǎng)輿情事件傳播途徑多樣化。因此,選用學(xué)術(shù)論文、熱點事件為互聯(lián)網(wǎng)的內(nèi)容實體評估本文方法,數(shù)據(jù)集有以下兩個。

      · 針對學(xué)術(shù)論文信息,數(shù)據(jù)集來自DBLP(DataBase systems and Logic Programming)學(xué)術(shù)社交網(wǎng)絡(luò),收集了1997年至今公開發(fā)表的計算機類學(xué)術(shù)論文元數(shù)據(jù)及引文記錄[24]。物理學(xué)論文數(shù)據(jù)集選取美國物理協(xié)會(American Physical Society,APS)公布的物理學(xué)領(lǐng)域自1893年以來論文元數(shù)據(jù)及其引文記錄[25]。本文選取長期活躍的研究者為研究對象,為了體現(xiàn)橫向?qū)Ρ刃裕疚囊宰匀荒隇闀r間單位評價和衡量影響力。

      · 針對熱點輿情事件,數(shù)據(jù)集選用近3年來有影響力的輿情事件作為研究對象,評估本文方法的有效性。

      在實驗環(huán)境方面,本文使用MATLAB仿真本文的算法,并與LAPSO-IM方法[9]和ACO-IM方法[10]對比分析,其中,LAPSO-IM方法和ACO-IM方法分別是基于粒子群算法和蟻群算法的影響力最大化分析方法。

      4.2 基于信息熵的學(xué)術(shù)論文的傳播影響力分析

      在開放互聯(lián)網(wǎng)中,信息傳播影響力與時間緊密相關(guān),首先分析信息影響力隨時間變化的趨勢,針對此在DBLP引文數(shù)據(jù)庫中,隨機選取2000—2005年每年各100篇會議論文和期刊論文,DBLP中不同論文影響力隨時間變化趨勢如圖4所示。

      圖4 DBLP中不同論文影響力隨時間變化趨勢

      從圖4可以看出,會議論文的影響力在刊發(fā)1~2年后影響力持續(xù)爆發(fā),期刊論文的影響力約在2年后持續(xù)爆發(fā),這主要是由于會議論文的評審和刊出時間相比于期刊論文較短,最新的研究成果能更快地在學(xué)術(shù)會議論文集上刊發(fā),使得其影響力較大,而期刊論文的評審和刊發(fā)周期則相對較長,其影響力的爆發(fā)時間滯后。與LAPSO-IM方法和ACO-IM方法對比來看,本文方法計算的影響力對其隨時間的變化更為敏感,而另外兩種方法基于粒子群和蟻群隨時間變化的速度慢,驗證了本文方法的高效性。

      為了更合理地橫向?qū)Ρ雀髡撐牡挠绊懥?,本文引入了?guī)格化的影響力,將各學(xué)術(shù)論文的影響力放在統(tǒng)一的量綱對比分析,選取相同主題的論文,按“IPv6”(105篇)、“人工智能”(178篇)兩個主題范圍進行影響力量化分析,DBLP不同研究方向論文影響力隨時間變化趨勢如圖5所示。

      圖5 DBLP不同研究方向論文影響力隨時間變化趨勢

      從圖5可以看出,“IPv6”向?qū)W術(shù)論文的影響力約在2010年度達到頂峰,“人工智能”領(lǐng)域的學(xué)術(shù)論文在2016年左右萌芽,影響力至今仍呈現(xiàn)上升的趨勢,這與技術(shù)的整體發(fā)展趨勢相吻合[6,18],實驗結(jié)果與LAPSO-IM方法和ACO-IM方法保持一致,驗證了本文方法的有效性。

      下面進一步地衡量物理學(xué)領(lǐng)域相關(guān)論文,從物理學(xué)引文數(shù)據(jù)庫中隨機選取相關(guān)論文,物理學(xué)領(lǐng)域論文影響力隨時間變化趨勢如圖6所示。

      圖6 物理學(xué)領(lǐng)域論文影響力隨時間變化趨勢

      選取相似領(lǐng)域的多篇文獻,以年度為單位進行影響力計算,通過綜合對比圖4與圖6,進一步看出,物理學(xué)論文影響力的上升速度較為明顯,這主要體現(xiàn)了物理學(xué)學(xué)術(shù)論文的累積效應(yīng),而計算機領(lǐng)域的論文的累積效應(yīng)較弱,這與兩個學(xué)科的特點有關(guān),物理學(xué)學(xué)術(shù)論文的既往成果對后繼成果有較大的影響力,而計算機領(lǐng)域的論文發(fā)展迅速,新興成果的影響力相對較大,本文方法的結(jié)果與LAPSO-IM方法和ACO-IM方法計算的結(jié)果保持一致。需要指出的是,隨著成果應(yīng)用領(lǐng)域的不斷拓展,如傳統(tǒng)的計算機網(wǎng)絡(luò)技術(shù)向物聯(lián)網(wǎng)、網(wǎng)絡(luò)空間安全、社會計算等領(lǐng)域橫向擴展的范圍不斷加大,導(dǎo)致了既往成果對后續(xù)關(guān)聯(lián)成果的影響力逐漸降低,而新興重要成果的影響力較高。

      4.3 基于信息熵的網(wǎng)絡(luò)事件傳播影響力分析

      學(xué)術(shù)論文的影響力傳播在相對封閉學(xué)術(shù)團體的范圍內(nèi),無法綜合評估本文方法的有效性。不失一般性,進一步分析開放互聯(lián)網(wǎng)中網(wǎng)絡(luò)輿情事件的傳播影響力。分別選取2019—2021年熱點網(wǎng)絡(luò)輿情的事件以確保實驗樣本的豐富性,分別包括文化、科技、民生等領(lǐng)域,范圍來自社交網(wǎng)絡(luò)、大眾媒體等,近3年網(wǎng)絡(luò)輿情事件實驗數(shù)據(jù)集見表2,對輿情事件影響力的量化以發(fā)布主題、瀏覽次數(shù)、評論次數(shù)和轉(zhuǎn)載次數(shù)等指標(biāo)為特征變量。

      表2 近3年網(wǎng)絡(luò)輿情事件實驗數(shù)據(jù)集

      通常網(wǎng)絡(luò)輿情的發(fā)展主要有4個階段:潛伏期、擴散期、爆發(fā)期和消散期[6]。針對上述網(wǎng)絡(luò)輿論事件,選取評論或轉(zhuǎn)載作為受影響的客體衡量其影響力,為了便于橫向?qū)Ρ确治觯緦嶒炇褂眉訖?quán)的影響力計算方法,網(wǎng)絡(luò)輿情事件隨時間影響力變化趨勢如圖7所示。

      由圖7可知,網(wǎng)絡(luò)輿情事件的影響力隨時間呈上升的趨勢,但是,影響力增速呈整體下降的趨勢,這與直觀感受和PageRank算法吻合。另外,通過對比事件1、事件3、事件5與事件2、事件4、事件6,可以進一步發(fā)現(xiàn),事件4、事件6的輿情影響力升上趨勢較為強勁,究其原因,這3件輿情事件來自有影響力的官方媒體,而另外3件的輿情事件影響力發(fā)展趨勢較為緩和,這3件輿情事件主題均來自民間團體,其影響力稍遜于官方媒體,這導(dǎo)致了事件影響力的發(fā)展出現(xiàn)差距。與圖4的研究結(jié)果保持一致,對比圖7(a)、圖7(b)和圖7(c)可以看出,本文方法較LAPSO-IM方法和ACO-IM方法所計算的影響力對時間更為敏感,即對事件影響力的響應(yīng)表現(xiàn)更為積極,這也與粒子群和蟻群算法的收斂速度不高有關(guān)。

      圖7 網(wǎng)絡(luò)輿情事件隨時間影響力變化趨勢

      進一步地,事件4和事件6官方媒體的輿情事件的擴散期、爆發(fā)期影響力上升較為強勢,這與官方媒體的權(quán)威性有密切聯(lián)系;而民間力量的潛伏期較長,這與輿情的前期在廣大民眾中的逐步醞釀的過程有關(guān),互聯(lián)網(wǎng)中的意見領(lǐng)袖等對事件的評論轉(zhuǎn)述在輿情初期及發(fā)展期均能引發(fā)更持續(xù)的傳播影響力。此外,輿情事件的潛伏期與影響力的大小有關(guān),這也驗證了本文方法的有效性。還可以得知,隨著時間的變化,不同網(wǎng)絡(luò)輿情事件的影響力發(fā)生一定的變化,影響力不是積累的過程,而是由萌芽期、發(fā)生期、爆發(fā)期以及平緩期等階段組成的。

      5 結(jié)束語

      人類社會互聯(lián)網(wǎng)顛覆了信息傳播的方式并深刻影響著社會的發(fā)展,研究面向公共互聯(lián)網(wǎng)的信息傳播影響力具有較強的現(xiàn)實意義。本文提出了一種基于香農(nóng)信息熵的公共互聯(lián)網(wǎng)信息傳播影響力計算模型和方法,首先,根據(jù)“奧卡姆剃刀原理”選取信息事件的多維變量,形成信息可計算的形式化表述;接著,使用香農(nóng)信息熵理論和最大熵理論研究了公共互聯(lián)網(wǎng)最大影響力建模;最后,提出了基于最大熵的信息傳播影響力計算方法,并通過實驗驗證了方法的有效性和可用性。

      猜你喜歡
      信息熵輿情影響力
      基于信息熵可信度的測試點選擇方法研究
      天才影響力
      NBA特刊(2018年14期)2018-08-13 08:51:40
      基于信息熵的實驗教學(xué)量化研究
      電子測試(2017年12期)2017-12-18 06:35:48
      黃艷:最深遠的影響力
      一種基于信息熵的雷達動態(tài)自適應(yīng)選擇跟蹤方法
      輿情
      中國民政(2016年16期)2016-09-19 02:16:48
      輿情
      中國民政(2016年10期)2016-06-05 09:04:16
      輿情
      中國民政(2016年24期)2016-02-11 03:34:38
      基于信息熵的IITFN多屬性決策方法
      3.15消協(xié)三十年十大影響力事件
      武义县| 区。| 蒙自县| 大化| 获嘉县| 西乌| 赤水市| 大洼县| 象州县| 祁东县| 葫芦岛市| 新竹市| 沁水县| 五家渠市| 确山县| 延吉市| 咸丰县| 临沭县| 洛南县| 盐津县| 石狮市| 永胜县| 行唐县| 托克逊县| 乾安县| 皮山县| 正宁县| 东乌| 开原市| 北辰区| 新竹县| 个旧市| 原平市| 卓尼县| 大厂| 陕西省| 塘沽区| 嘉义市| 临澧县| 沙河市| 城步|