• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      W eb輿情的長期趨勢預(yù)測方法

      2011-02-10 05:45:28王沙沙
      關(guān)鍵詞:模型庫輿情聚類

      高 輝,王沙沙,傅 彥,

      (1. 電子科技大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院 成都 610054;2. 電子科技大學(xué)軟件學(xué)院 成都 610054)

      輿情是在一定時(shí)期、一定范圍內(nèi)民眾對(duì)社會(huì)現(xiàn)實(shí)的主觀反映,是群體性的思想、心理、情緒、意見和要求的綜合表現(xiàn)[1]。隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)媒體作為一種新的信息傳播形式已經(jīng)深入人們的日常生活,公眾在網(wǎng)絡(luò)上的言論活躍程度也達(dá)到了前所未有的地步。不論是國內(nèi)還是國際重大事件,都能迅速在網(wǎng)絡(luò)上傳播開來,并引起公眾的極大關(guān)注和熱烈討論,進(jìn)而產(chǎn)生巨大的輿論壓力,達(dá)到任何部門和機(jī)構(gòu)都無法忽視的地步。

      網(wǎng)絡(luò)的特性決定了Web輿情表達(dá)快捷、信息多元、方式互動(dòng)的特點(diǎn),也從根本上改變了傳播者與受傳者之間的關(guān)系,具備傳統(tǒng)媒體無法比擬的優(yōu)勢。一種新的輿情類型——Web輿情逐漸形成,但互聯(lián)網(wǎng)的虛擬性、隱蔽性、發(fā)散性、滲透性、隨意性、即時(shí)性等特點(diǎn)決定了Web輿情的直接性、突發(fā)性和偏差性。文獻(xiàn)[2-4]分別根據(jù)網(wǎng)絡(luò)輿情的概念、特點(diǎn)、表達(dá)及傳播方式,對(duì)輿情的變動(dòng)規(guī)律和我國網(wǎng)絡(luò)輿情的研究與發(fā)展現(xiàn)狀進(jìn)行了分析。

      Web輿情的產(chǎn)生,不僅打破了傳統(tǒng)媒介對(duì)社會(huì)輿論的相對(duì)壟斷,改變了傳統(tǒng)的輿論形態(tài),而且還迅速顯現(xiàn)出其強(qiáng)勢。可以說,互聯(lián)網(wǎng)已成為思想文化信息的集散地和社會(huì)輿論的放大器,如果引導(dǎo)不善,負(fù)面的Web輿情將會(huì)對(duì)社會(huì)公共安全形成較大威脅。對(duì)相關(guān)政府部門來說,加強(qiáng)對(duì)網(wǎng)絡(luò)輿情的及時(shí)監(jiān)測和有效引導(dǎo),提前預(yù)測網(wǎng)絡(luò)輿情的發(fā)展趨勢,以積極化解網(wǎng)絡(luò)輿論危機(jī),對(duì)維護(hù)社會(huì)穩(wěn)定和促進(jìn)國家發(fā)展具有重要的現(xiàn)實(shí)意義;加強(qiáng)對(duì)網(wǎng)絡(luò)輿情的監(jiān)測和引導(dǎo)也是創(chuàng)建和諧社會(huì)的應(yīng)有內(nèi)涵。

      近幾年,預(yù)測方法被廣泛應(yīng)用于各個(gè)領(lǐng)域并且起到了很好的作用。較早期的預(yù)測方法主要有自回歸模型(AR)、滑動(dòng)平均模型(MA)、自回歸滑動(dòng)平均模型(ARMA)、歷史平均模型(HA)和Box-Cox法等。隨著研究的逐漸深入,又出現(xiàn)了一批更復(fù)雜、更精確的預(yù)測方法,總體可以分為兩類:1) 以現(xiàn)代科學(xué)技術(shù)和方法為主要研究手段而形成的預(yù)測模型,包括非參數(shù)回歸模型、KARIMA算法、基于小波理論的方法、基于多維分形的方法、譜分析方法、狀態(tài)空間重構(gòu)模型和多種與神經(jīng)網(wǎng)絡(luò)相結(jié)合的預(yù)測模型等,這類模型的共同特點(diǎn)是采用模型和方法,不追求嚴(yán)格意義上的數(shù)學(xué)推導(dǎo)和明確的物理意義,更重視對(duì)真實(shí)數(shù)據(jù)的擬合效果;2) 以數(shù)理統(tǒng)計(jì)和微積分等傳統(tǒng)的數(shù)學(xué)和物理方法為基礎(chǔ)的預(yù)測模型,包括時(shí)間序列模型、卡爾曼濾波模型、參數(shù)回歸模型、指數(shù)平滑模型等。

      隨著互聯(lián)網(wǎng)的快速發(fā)展,公眾在網(wǎng)絡(luò)上發(fā)表言論的活躍程度達(dá)到了前所未有的地步,對(duì)容易滋生社會(huì)輿情的Web輿情事件的發(fā)展態(tài)勢做出及時(shí)準(zhǔn)確的預(yù)測顯得越來越重要。準(zhǔn)確的長期趨勢預(yù)測可為相關(guān)部門制定相應(yīng)的應(yīng)對(duì)措施,并為各大主流網(wǎng)站做出正確的輿論引導(dǎo)贏得寶貴時(shí)間。但是,目前我國對(duì)于網(wǎng)絡(luò)輿情的預(yù)測還處于探索階段[5-6],主要是將現(xiàn)有成熟的時(shí)間序列預(yù)測和人工智能技術(shù)應(yīng)用于Web輿情的趨勢分析[7]。時(shí)間序列短期趨勢預(yù)測方法在網(wǎng)絡(luò)輿情中的應(yīng)用效果不錯(cuò),但是該方法很難做出長期趨勢預(yù)測,尤其是對(duì)拐點(diǎn)的預(yù)測,并且預(yù)測時(shí)需要假設(shè)所選預(yù)測模型滿足某一函數(shù)分布,比如多項(xiàng)式回歸中多項(xiàng)式最高次數(shù)的選擇等。

      針對(duì)傳統(tǒng)預(yù)測方法無法有效預(yù)測Web輿情長期趨勢拐點(diǎn)的不足,本文提出一種長期趨勢預(yù)測方法。該方法首先通過周期分析和層次聚類為每類已發(fā)生輿情事件的發(fā)展趨勢建立類模型庫,然后通過對(duì)預(yù)測輿情事件已知發(fā)展趨勢進(jìn)行自適應(yīng)變換后,應(yīng)用最小二乘法從相應(yīng)事件類別的類模型庫中選取均方誤差和最小的模型預(yù)測事件未來的發(fā)展趨勢。

      1 預(yù)測模型

      模型預(yù)測允許預(yù)測人員對(duì)預(yù)測條件做一定程度的假設(shè),本文提出的事件長期趨勢預(yù)測模型是基于歷史會(huì)重演的假設(shè)。研究發(fā)現(xiàn),不僅同一類事件的發(fā)展趨勢有較高的相似性,而且同一事件的發(fā)展會(huì)經(jīng)歷不同的周期。為了進(jìn)一步提高模型的擬合精度和預(yù)測效果,本文首先對(duì)事件進(jìn)行分類和切取周期處理,然后為每類事件按周期建立類模型并形成類模型庫,再從中挑取與待預(yù)測事件均方誤差和最小的類模型進(jìn)行長期預(yù)測。

      模型的建立需要數(shù)據(jù)的支撐,為了獲取歷史事件的時(shí)間序列,首先使用網(wǎng)絡(luò)爬蟲從網(wǎng)絡(luò)上獲取數(shù)據(jù),并將數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫中;通過使用基于向量空間的LP聚類算法[8]對(duì)數(shù)據(jù)庫中描述同一個(gè)事件的數(shù)據(jù)進(jìn)行自動(dòng)標(biāo)記,形成事件集;根據(jù)輿情的特點(diǎn),通過分類方法[9-10]將事件分為刑事案件、恐怖襲擊、經(jīng)濟(jì)安全、自然災(zāi)難、公共衛(wèi)生事件和社會(huì)安全事件等事件類別;根據(jù)預(yù)測的需要,可獲取數(shù)據(jù)庫中某事件類別包含的所有事件對(duì)應(yīng)的時(shí)間序列。時(shí)間序列的過去值會(huì)影響將來值,影響的大小及影響的方式可由時(shí)間序列中的趨勢、周期及非平穩(wěn)等特征來刻畫,因此可采用一個(gè)事件的時(shí)間序列進(jìn)行預(yù)測。

      時(shí)間序列的獲取可以根據(jù)實(shí)驗(yàn)條件選取。本文所處理的時(shí)間序列值來源于Google trends所統(tǒng)計(jì)的數(shù)據(jù)。所謂Google trends數(shù)據(jù)并不是原始的搜索量,而是在過去的一段時(shí)間里,相對(duì)于在Google上執(zhí)行的總搜索量即某個(gè)字詞被搜索了多少次,經(jīng)過標(biāo)準(zhǔn)化并以0~100的縮放結(jié)果值表示。Google trends所有的數(shù)據(jù)都從2004年1月4日開始,建模的具體流程如圖1所示。

      圖1 建模流程圖

      1.1 時(shí)間序列的預(yù)處理

      現(xiàn)有的預(yù)測方法在進(jìn)行短期預(yù)測時(shí)都取得了一定的成效,但均無法預(yù)測長期趨勢中的拐點(diǎn),影響長期預(yù)測的效果。研究發(fā)現(xiàn),一個(gè)事件的發(fā)展可能會(huì)經(jīng)歷幾個(gè)周期的循環(huán),因此,為了更好地預(yù)測長期趨勢中的拐點(diǎn),以進(jìn)行較準(zhǔn)確的長期趨勢預(yù)測,在對(duì)曲線進(jìn)行平滑處理后,應(yīng)對(duì)每條曲線進(jìn)行切取周期處理,以獲取事件發(fā)展的不同周期。本文提出的切取周期的方法為:

      1) 遍歷原始曲線,保留明顯的關(guān)鍵轉(zhuǎn)折點(diǎn),用直線把這些關(guān)鍵轉(zhuǎn)折點(diǎn)連接起來形成折線圖。選擇關(guān)鍵轉(zhuǎn)折點(diǎn)的具體做法是:將曲線開始和結(jié)尾的點(diǎn)選為關(guān)鍵轉(zhuǎn)折點(diǎn),然后從第一個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn)開始,嘗試用直線連接它和它后面的每一個(gè)點(diǎn),直到中間有點(diǎn)與該直線的距離超過給定范圍值d,該超出給定范圍值的點(diǎn)就被認(rèn)為是一個(gè)新的關(guān)鍵轉(zhuǎn)折點(diǎn)。再從該新的關(guān)鍵轉(zhuǎn)折點(diǎn)開始,重復(fù)上面的過程,直到曲線的最后一個(gè)點(diǎn)。

      2) 采用遍歷折線圖上各關(guān)鍵轉(zhuǎn)折點(diǎn)的方法尋找每個(gè)周期T的開始和結(jié)束的位置,以避免無關(guān)起伏的干擾。周期開始的判斷標(biāo)準(zhǔn)為:從第一個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn)開始,當(dāng)折線圖中相鄰兩個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn)構(gòu)成的線段的斜率超過人為給定的閾值(如本文實(shí)驗(yàn)中取為3,可以根據(jù)具體的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行調(diào)整)時(shí),就判定周期開始。周期結(jié)束的判斷標(biāo)準(zhǔn)為:周期開始后,滿足下列兩個(gè)條件之一,就判斷周期結(jié)束。① 趨勢的起伏在一個(gè)給定的范圍值d內(nèi),即在給定范圍值d內(nèi)選擇關(guān)鍵轉(zhuǎn)折點(diǎn),并且該關(guān)鍵轉(zhuǎn)折點(diǎn)距周期開始的時(shí)間跨度至少為min T,曲線的當(dāng)前高度不超過周期開始時(shí)的2倍;② 周期的長度已經(jīng)超過給定的最大時(shí)間跨度max T。

      預(yù)處理的最后一步工作就是對(duì)切取的周期曲線的時(shí)間長度進(jìn)行規(guī)范化處理。根據(jù)建立類模型庫需確保度量一致性的原則,將所有周期曲線的時(shí)間長度統(tǒng)一規(guī)范化為max T。因此需要對(duì)周期曲線進(jìn)行插值處理,具體的插值方法為:假設(shè)某周期曲線對(duì)應(yīng)的時(shí)間序列為長度為len(x),時(shí)間序列 經(jīng)過插值后,時(shí)間長度規(guī)范化為max T的時(shí)間序列則有:

      1.2 類模型庫的建立

      對(duì)某事件類別包含的所有事件進(jìn)行預(yù)處理后,可獲得規(guī)范化的周期曲線,再使用層次聚類算法將規(guī)范化的周期曲線進(jìn)行聚類。確定數(shù)據(jù)集的聚類數(shù)目是聚類分析中一項(xiàng)基礎(chǔ)性的難題,文獻(xiàn)[12]提出了一種基于層次聚類思想的計(jì)算方法,不需要對(duì)數(shù)據(jù)集進(jìn)行反復(fù)的聚類,其主要步驟為:

      1) 首先掃描數(shù)據(jù)集獲得聚類特征統(tǒng)計(jì)值。

      2) 然后自底向上地生成不同層次的數(shù)據(jù)集劃分,增量地構(gòu)建一條關(guān)于不同層次劃分的聚類質(zhì)量曲線,該曲線極值點(diǎn)所對(duì)應(yīng)的劃分用于估計(jì)最佳的聚類數(shù)目。

      將周期曲線聚類后得到的各個(gè)聚類簇視為小類,對(duì)于每一小類的類模型,應(yīng)用最小二乘法求出與該小類包含的所有周期曲線均方誤差和最小的類模型。具體方法為:設(shè)某小類包含的周期曲線集為{y1,y2,…,yn},每個(gè)周期曲線yi對(duì)應(yīng)的時(shí)間序列為{yi1,yi2,…,yim},其中1≤i≤n。定義所求的該小類的類模型為:

      將式(3)代入式(4)后,式(4)可視為關(guān)于a0、a1、…、ak的多元函數(shù),根據(jù)多元函數(shù)求極值的方法,分別對(duì)a0、a1、…、ak求一階偏導(dǎo),并令其等于零得到非齊次線性方程組:

      解該非齊次線性方程組可以求出所有駐點(diǎn)(a0,a1,…,ak),并與邊界值上的最大值和最小值進(jìn)行比較,最小值所對(duì)應(yīng)的駐點(diǎn)即為所求類模型式(4)中的各個(gè)系數(shù),從而可建立該小類的類模型。采用同樣的方法,可建立其他小類的類模型,從而建立該事件類別的類模型庫。

      1.3 長期趨勢預(yù)測

      當(dāng)新的輿情事件發(fā)生時(shí),首先確定該事件所屬的事件類別,并獲取該事件已發(fā)生的時(shí)間序列;將該時(shí)間序列進(jìn)行自適應(yīng)縮放變換后,逐一與其所屬事件類別對(duì)應(yīng)的類模型庫中的類模型進(jìn)行匹配,選取類模型庫中與待預(yù)測事件已知時(shí)間序列均方誤差和最小的類模型作為待預(yù)測事件的長期預(yù)測模型,從而實(shí)現(xiàn)對(duì)新輿情事件的長期預(yù)測,具體流程如圖2所示。

      圖2 趨勢預(yù)測流程

      為了提高周期性長期預(yù)測的準(zhǔn)確率和有效性,當(dāng)識(shí)別到新的輿情事件發(fā)生時(shí),按一定的時(shí)間間隔采集其現(xiàn)有的時(shí)間序列Y,并對(duì)時(shí)間序列Y對(duì)應(yīng)的曲線的斜率進(jìn)行分析,如果斜率大于或等于某閾值,說明該事件已經(jīng)開始被廣泛關(guān)注,開始將該事件已有的時(shí)間序列Y與其所屬事件類別的類模型庫里的類模型進(jìn)行匹配,設(shè)時(shí)間序列Y的長度為len(Y)。具體方法為:

      1) 對(duì)時(shí)間序列Y對(duì)應(yīng)曲線的橫坐標(biāo)和縱坐標(biāo)分別按照比例k1和k2進(jìn)行縮放變換。為了尋找合適的縮放比例k1和k2,采用雙重循環(huán)進(jìn)行遍歷查找,設(shè)1≤k1≤100,1≤k2≤100,循環(huán)遍歷的步長為0.1。每一次循環(huán),對(duì)時(shí)間序列Y對(duì)應(yīng)曲線中的橫坐標(biāo)和縱坐標(biāo)進(jìn)行縮放調(diào)整,經(jīng)過縮放變換以后曲線的橫坐標(biāo)xi和縱坐標(biāo)yi分別為:

      2 實(shí)驗(yàn)部分

      本部分預(yù)測實(shí)驗(yàn)針對(duì)屬于公共衛(wèi)生類的豬流感事件,選取的測試數(shù)據(jù)為從Google趨勢上獲取的“豬流感”在2009年3月~2009年7月期間的Google trends時(shí)間序列。

      2.1 實(shí)驗(yàn)效果

      對(duì)公共衛(wèi)生類事件的預(yù)測需要以該類事件的類模型庫為基礎(chǔ),為了構(gòu)建類模型庫,需要對(duì)相似性較高的該類事件的曲線進(jìn)行聚類并為各小類建立類模型。對(duì)已有公共衛(wèi)生類其他事件聚類和建模的效果圖如圖3所示,其中用虛線分開的4個(gè)區(qū)域分別表示該類事件按層次聚類方法所聚的4個(gè)小類,每個(gè)區(qū)域中位于上方的圖為該小類曲線聚類的結(jié)果,位于下方的圖為該小類按前面介紹的多元函數(shù)求極值的方法所建的類模型。

      圖3 聚類和建模效果圖

      為驗(yàn)證本文所提長期趨勢預(yù)測方法的有效性,取從Google趨勢上獲取的豬流感時(shí)間序列前10天的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),10天以后的數(shù)據(jù)作為測試數(shù)據(jù),進(jìn)行長期預(yù)測,具體過程為:

      1) 對(duì)采集到的豬流感前10天的數(shù)據(jù)進(jìn)行自適應(yīng)縮放變化。鑒于Google trend數(shù)據(jù)最大標(biāo)準(zhǔn)化值為100,設(shè)定橫坐標(biāo)縮放比例k1和縱坐標(biāo)縮放比例k2的取值區(qū)間均為[1,100],步長為0.1。當(dāng)k1=1.5,k2=1時(shí),從公共衛(wèi)生事件類模型庫中選取的第4小類模型(即圖4中的實(shí)曲線)與進(jìn)行縮放后的豬流感數(shù)據(jù)的均方誤差和最小。

      2) 選定類模型后,對(duì)該類模型的橫坐標(biāo)和縱坐標(biāo)分別按1/k1和1/k2進(jìn)行縮放變換,并將縮放后的前10天的數(shù)據(jù)替換為豬流感事件給定的前10天的數(shù)據(jù),得到豬流感事件的長期趨勢預(yù)測曲線,即圖4中的虛曲線,圖4中的實(shí)曲線表示從Google趨勢上獲取的豬流感的實(shí)際數(shù)據(jù)。

      圖4 預(yù)測效果圖

      從圖4的預(yù)測效果來看,本文方法能在事件發(fā)生初期較好地預(yù)測事件長期發(fā)展趨勢的拐點(diǎn)。

      2.2 對(duì)比分析

      建立預(yù)測模型后,必須檢驗(yàn)?zāi)P皖A(yù)測的有效性?,F(xiàn)有檢驗(yàn)方法中的關(guān)聯(lián)度檢驗(yàn)法被廣泛用于衡量模型預(yù)測的精度。因此,本文采用關(guān)聯(lián)度分析檢驗(yàn)預(yù)測模型的精度,并將本文提出的預(yù)測方法與幾種傳統(tǒng)的預(yù)測方法進(jìn)行對(duì)比。關(guān)聯(lián)度檢驗(yàn)法主要是比較實(shí)際時(shí)間序列和各預(yù)測時(shí)間序列中實(shí)際值與各預(yù)測值的相對(duì)大小,找出差別的最大值和最小值,進(jìn)而求得實(shí)際數(shù)據(jù)與各預(yù)測數(shù)據(jù)之間的關(guān)聯(lián)度。

      表1 關(guān)聯(lián)度對(duì)比

      選取10個(gè)不同事件的前10天的數(shù)據(jù),分別采用式(8)對(duì)本文所提出的預(yù)測方法與傳統(tǒng)預(yù)測方法(包括多項(xiàng)式回歸模型、自回歸模型和灰色理論模型)進(jìn)行關(guān)聯(lián)度對(duì)比分析,關(guān)聯(lián)度對(duì)比結(jié)果如表1所示。

      從表1所示的實(shí)驗(yàn)結(jié)果來看,本文所提出的預(yù)測方法的關(guān)聯(lián)度均大于經(jīng)驗(yàn)閾值0.6,說明該方法預(yù)測的結(jié)果是有效的。并且,本文所提出的預(yù)測方法的平均關(guān)聯(lián)度比其他3種傳統(tǒng)預(yù)測方法的最大平均關(guān)聯(lián)度高出40%,因此使用本文提出的預(yù)測方法比較適用于事件的長期趨勢預(yù)測。

      3 總 結(jié)

      互聯(lián)網(wǎng)的迅猛發(fā)展使得社會(huì)輿情有了新的載體,網(wǎng)絡(luò)輿情對(duì)社會(huì)政治、經(jīng)濟(jì)和文化的平穩(wěn)發(fā)展產(chǎn)生了較大的影響,因此有必要利用現(xiàn)有的人工智能和數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)對(duì)輿情的分析和預(yù)測,為進(jìn)一步治理和正面引導(dǎo)網(wǎng)絡(luò)輿情的發(fā)展奠定基礎(chǔ)。

      本文提出了一種Web輿情長期趨勢預(yù)測方法。該方法首先通過周期分析和層次聚類為每類已發(fā)生輿情事件的發(fā)展趨勢建立類模型庫。當(dāng)待預(yù)測輿情事件發(fā)生時(shí),首先確定其所屬事件類別并獲取已有的時(shí)間序列,將其進(jìn)行自適應(yīng)縮放變換后,應(yīng)用最小二乘法從其所屬事件類別的類模型庫中選取均方誤差和最小的模型預(yù)測該事件未來的發(fā)展趨勢。實(shí)驗(yàn)結(jié)果顯示,本文提出的預(yù)測方法比傳統(tǒng)方法更適合對(duì)輿情事件的長期趨勢預(yù)測,可以彌補(bǔ)現(xiàn)有預(yù)測技術(shù)無法預(yù)測情事件發(fā)展趨勢拐點(diǎn)的缺陷,更好地幫助政府和監(jiān)管部門采取及時(shí)有效的措施,提高網(wǎng)絡(luò)輿情監(jiān)管的功效。

      [1] 王來華. 輿情研究概論——理論、方法和現(xiàn)實(shí)熱點(diǎn)[M].天津: 天津社會(huì)科學(xué)院出版社, 2007.WANG LaiHua. Public opinion study—theory, method and reality hotspot[M]. Tianjin: Tianjin Social Sciences Press,2007.

      [2] 劉毅. 略談網(wǎng)絡(luò)輿情的概念、特點(diǎn)、表達(dá)與傳播[J]. 理論界, 2007, (1): 11-12.

      LIU Yi. Talk about web sentiment’s concept, characteristic,expression and communication[J]. Theory Horizon, 2007,(1): 11-12.

      [3] 彭丹, 許波, 宋仙磊. 基于網(wǎng)絡(luò)評(píng)論的網(wǎng)絡(luò)輿情研究[J].現(xiàn)代情報(bào), 2009, 29(12): 4-7.

      PENG Dan, XU Bo and SONG XianLei. Web sentiment study based on web comment [J]. Modern Information, 2009,29 (12): 4-7.

      [4] 曾潤喜. 我國網(wǎng)絡(luò)輿情研究與發(fā)展現(xiàn)狀分析[J]. 圖書館學(xué)研究, 2009, 19(1): 24-37.

      ZENG Run-xi. Study our country’s web sentiment and analyze its state-of-the-art[J]. Study of Library Science,2009, 19(1): 24-37.

      [5] 騰達(dá). 基于趨勢分析的網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)(TANCMS)的研究與實(shí)現(xiàn)[D]. 長沙: 國防科學(xué)技術(shù)大學(xué), 2008.

      TENG Da. Research and realization of TANCMS based on trend analysis[D]. Changsha: National University of Defense Technology, 2008.

      [6] 程輝. 基于時(shí)間序列的網(wǎng)絡(luò)輿情預(yù)測模型[J]. 網(wǎng)際網(wǎng)路技術(shù)學(xué)刊, 2008, 9(5): 16-17.

      CHENG Hui. The prediction model of public opinion based on trend analysis[J]. Journal of Internet Technology, 2008,9(5): 16-17.

      [7] 張玨. 網(wǎng)絡(luò)輿情預(yù)測模型與平臺(tái)的研究[D]. 北京: 北京交通大學(xué), 2009.

      ZHANG Jue. Research on forecasting models and platform of online public opinion[D]. Beijing: Beijing Jiaotong University, 2009.

      [8] RAMAGE D, HEYMANN P, CHRISTOPHER D. Manning.Clustering the tagged web[C]//WSDM ’09 Proceedings of the Second ACM International Conference on Web Search and Data M ining. New York, USA: ACM, 2009: 54-63.

      [9] COUTO T, ZIVIANI N, CALADO P, et al. Classifying documents w ith link-based bibliometric measures[J].Information Retrieval, 2009, 13(4): 355-363.

      [10] WANG Pu, HU Jian, ZENG Hua-jun, et al. Using w ikipedia know ledge to improve text classification[J].Know ledge and Information Systems, 2008, 19(3):265-281.

      [11] TERRADO M, BARCELO D, TAULER R. Quality assessment of the multivariate curve resolution alternating least squares method for the investigation of environmental pollution patterns in surface water[J]. Environ Sci Techno,2009, 43(14): 5321-5326.

      [12] 陳黎飛, 姜青山, 王聲瑞. 基于層次劃分的最佳聚類數(shù)確定方法[J]. 軟件學(xué)報(bào), 2008, 19(1): 24-37.

      CHEN Li-fei, JIANG Qing-shan, WANG Sheng-rui, A hierachical method for determining the number of cluster[J]. Journal of Software, 2008, 19(1): 24-37.

      編 輯 蔣 曉

      猜你喜歡
      模型庫輿情聚類
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      輿情
      中國民政(2016年16期)2016-09-19 02:16:48
      輿情
      中國民政(2016年10期)2016-06-05 09:04:16
      輿情
      中國民政(2016年24期)2016-02-11 03:34:38
      基于改進(jìn)的遺傳算法的模糊聚類算法
      基于模型庫系統(tǒng)的金融體系流動(dòng)性風(fēng)險(xiǎn)預(yù)警機(jī)制研究
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      基于模型庫的現(xiàn)代成本會(huì)計(jì)計(jì)量系統(tǒng)研究
      自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
      微博的輿情控制與言論自由
      兰州市| 江孜县| 江都市| 龙陵县| 颍上县| 广宗县| 灵宝市| 霍城县| 铜鼓县| 谢通门县| 镇平县| 乐业县| 五峰| 济阳县| 无为县| 黄陵县| 金沙县| 沂水县| 宁武县| 华池县| 浠水县| 内乡县| 龙口市| 平武县| 疏附县| 孟州市| 四川省| 策勒县| 潜江市| 城固县| 深泽县| 柳州市| 宁海县| 天水市| 贵南县| 北辰区| 固镇县| 正安县| 蒲江县| 宝山区| 泸水县|