• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于情感主題特征詞加權(quán)的微博評(píng)論聚類(lèi)算法研究

      2020-12-23 04:33:21吳迪楊瑞欣申超
      現(xiàn)代電子技術(shù) 2020年23期
      關(guān)鍵詞:聚類(lèi)算法情感分析

      吳迪 楊瑞欣 申超

      摘 ?要: 為了提高微博評(píng)論的情感分析聚類(lèi)效果,提出一種基于情感主題特征詞加權(quán)的微博評(píng)論聚類(lèi)算法。該算法首先通過(guò)定義情感主題詞袋提取情感主題詞;然后利用語(yǔ)義相似度計(jì)算獲得情感主題特征詞,進(jìn)一步通過(guò)定義情感主題特征詞重要度和分布度對(duì)其進(jìn)行加權(quán),充分考慮情感主題特征詞對(duì)主題的貢獻(xiàn)度;最后通過(guò)LDA聚類(lèi)獲得加權(quán)的情感主題特征詞。實(shí)驗(yàn)結(jié)果表明,該算法表現(xiàn)出較好的情感分析聚類(lèi)效果,對(duì)網(wǎng)絡(luò)輿情分析有一定的指導(dǎo)作用。

      關(guān)鍵詞: 微博評(píng)論; 聚類(lèi)算法; LDA聚類(lèi); 情感分析; 特征詞加權(quán); 主題詞提取

      中圖分類(lèi)號(hào): TN911.1?34; TP391.1 ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? 文章編號(hào): 1004?373X(2020)23?0067?05

      Abstract: In order to enhance clustering effect of sentiment analysis on microblog comments, a microblog comment clustering algorithm based on the weighted sentiment topic feature words is proposed in this paper. With the algorithm, the sentiment topic words are extracted by defining the sentiment topic word bag, and then the sentiment topic feature words are obtained by calculation of semantic similarity. The sentiment topic feature words are weighted by defining their importance and distribution. The contribution of sentiment topic feature words to the topic is considered fully in the algorithm. The weighted sentiment topic feature words have been obtained by latent Dirichlet allocation (LDA) clustering. The experimental results show that the algorithm has a good clustering effect of sentiment analysis, and has a certain guiding role for network public opinion analysis.

      Keywords: microblog comment; clustering algorithm; LDA clustering; sentiment analysis; feature word weighting; topic word extraction

      0 ?引 ?言

      隨著網(wǎng)絡(luò)的普及,微博已成為獲取社會(huì)資訊的重要渠道[1]。用戶微博上的評(píng)論包含主觀情感的表達(dá),并攜帶大量用戶信息和數(shù)據(jù)信息,微博用戶的情感表達(dá)也會(huì)對(duì)其他用戶的情感甚至對(duì)政府的決策行為產(chǎn)生影響。因此,亟需對(duì)微博評(píng)論進(jìn)行有效的情感分析,從而把握網(wǎng)絡(luò)輿情走向[2]。

      目前,主題模型已成為微博評(píng)論分析領(lǐng)域的熱點(diǎn)。LDA(Latent Dirichlet Allocation,隱含的狄利克雷分配)主題模型是包括詞項(xiàng)、主題和文檔三層結(jié)構(gòu)的文檔生成概率模型[3],可以識(shí)別大規(guī)模文檔集或語(yǔ)料庫(kù)中潛在的主題信息。傳統(tǒng)的LDA主題模型只能對(duì)微博評(píng)論中隱含的主題進(jìn)行建模,僅考慮了微博評(píng)論表面語(yǔ)義信息之間的關(guān)系,在情感分析方面能力欠佳。

      文獻(xiàn)[4]在LDA中加入情感層與微博用戶關(guān)系參數(shù),提出基于LDA和微博用戶關(guān)系的主題情感模型,該模型具有良好的情感分類(lèi)能力;文獻(xiàn)[5]在LDA主題模型的基礎(chǔ)上提出了適用于短文本的情感分析模型,該模型可增強(qiáng)情感詞匯之間的共現(xiàn)頻率,提高了在情感極性分類(lèi)上的效率;文獻(xiàn)[6]基于LDA主題模型,對(duì)產(chǎn)業(yè)產(chǎn)品進(jìn)行文本挖掘,利用情感詞典對(duì)提取主題詞進(jìn)行情感標(biāo)注,有效地對(duì)產(chǎn)品評(píng)論進(jìn)行情感分析。

      上述文獻(xiàn)在情感分析方面表現(xiàn)出較好的性能,但在兼顧情感與語(yǔ)義兩方面的分析效果上不太理想。文獻(xiàn)[7]提出一種情感主題聯(lián)合模型(Joint Sentiment Topic Model for Sentiment Analysis,JST),該模型在LDA的基礎(chǔ)上增加情感層,使之與文檔、主題和詞語(yǔ)相關(guān)聯(lián),具有一定的情感和語(yǔ)義分析能力;文獻(xiàn)[8]提出了隱含情感模型(Latent Sentiment Model,LSM),將主題劃分為三種帶有情感的特殊主題,從而實(shí)現(xiàn)對(duì)文檔的情感分析;文獻(xiàn)[9]中提出了LTM模型,將情感先驗(yàn)知識(shí)以頻繁項(xiàng)集的形式集成到主題模型中,提高了語(yǔ)義分析能力;文獻(xiàn)[10]提出了平均加權(quán)的WLDA模型,引入平均加權(quán)值和支持向量機(jī)算法,有效提高主題區(qū)分度和語(yǔ)義分析方面的質(zhì)量。

      上述文獻(xiàn)在情感和語(yǔ)義分析兩方面都有所突破,但卻忽略了主題內(nèi)部詞與詞之間的相關(guān)度。本文充分考慮主題詞的貢獻(xiàn)度和詞與詞之間的相關(guān)度,建立更加完善的情感主題詞袋,提出基于情感主題特征詞加權(quán)的微博評(píng)論聚類(lèi)算法MCCWSFW(Microblog Comment Clustering Based on the Weighted Sentiment Topic Feature Words),旨在挖掘出微博評(píng)論中的情感主題特征詞集和隱含語(yǔ)義特征,以達(dá)到較好的情感分析聚類(lèi)效果。

      1 ?算法分析

      對(duì)于情感分析,一般選取主觀性文本,也就是分析用戶用微博發(fā)布的對(duì)某事物或事件的評(píng)論。本文處理微博評(píng)論步驟主要包括:數(shù)據(jù)預(yù)處理、特征處理與詞向量獲取、詞向量相似度計(jì)算、特征選擇和特征加權(quán),最后給出MCCWSFW算法的詳細(xì)描述。

      1.1 ?數(shù)據(jù)預(yù)處理

      數(shù)據(jù)預(yù)處理主要包括三個(gè)步驟。首先,利用ACHE爬蟲(chóng)法爬取微博評(píng)論,并對(duì)微博評(píng)論數(shù)據(jù)進(jìn)行清洗,消除詞干、停止詞,刪除評(píng)論頻率很低的詞;然后采用jieba進(jìn)行中文分詞,并通過(guò)LDA主題模型訓(xùn)練語(yǔ)料庫(kù)進(jìn)行降維處理;最后,針對(duì)微博評(píng)論定義情感主題詞袋,用來(lái)匹配情感主題詞。定義的情感主題詞袋是為后續(xù)情感分析工作做準(zhǔn)備,其具體定義如下。

      定義1:情感主題詞袋[F](ST)。

      [F(ST)=c1is(adj)?c1ks(adv)?c1js(v)?c1ns(else)] (1)

      式中:adj代表形容詞;adv代表副詞;v代表動(dòng)詞;else代表其他詞性;[i],[k],[j],[n]分別代表[F](ST)中的形容詞、副詞、動(dòng)詞以及其他詞性的數(shù)量;[c1is(adj)],[c1ks(adv)],[c1js(v)],[c1ns(else)]分別代表形容詞、副詞、動(dòng)詞和其他詞性詞袋;“[?]”表示字符串的拼接。

      1.2 ?特征處理與詞向量獲取

      經(jīng)過(guò)1.1節(jié)數(shù)據(jù)預(yù)處理過(guò)程,對(duì)其得到的情感主題詞袋作進(jìn)一步處理。處理過(guò)程主要包括情感主題詞的提取和對(duì)其詞向量的獲取兩部分。

      1) 從情感主題詞袋中提取情感主題詞,此步驟由特征處理過(guò)程完成。特征處理主要用來(lái)降低向量空間維數(shù),從而簡(jiǎn)化計(jì)算,提高文本處理的速度和效率。本文采用TF?IDF進(jìn)行特征處理。

      2) 對(duì)情感主題詞進(jìn)行詞向量獲取。首先獲取語(yǔ)料并對(duì)語(yǔ)料進(jìn)行預(yù)處理,進(jìn)一步在數(shù)據(jù)預(yù)處理和特征處理的基礎(chǔ)上,采用基于word2vec的詞向量獲取方式對(duì)處理過(guò)的微博評(píng)論做訓(xùn)練,最后采用Gibbs抽樣法對(duì)模型求解。

      1.3 ?詞向量相似度計(jì)算

      在完成TF?IDF特征處理和詞向量獲取后,微博評(píng)論之間的相似度問(wèn)題轉(zhuǎn)變成了向量之間的相似度問(wèn)題。情感主題詞是根據(jù)詞與詞之間的相似度檢測(cè)的,本文采用文本處理中最常用的相似性度量方式,即余弦相似度。

      利用Sim[(a,b)]表示計(jì)算向量[a]和向量[b]的相似度,則相似度公式描述如下:

      [Sim(a,b)=x1x2+y1y2x21+y21x22+y22] (2)

      式中:[a[x1,y1]]和[b[x2,y2]]代表兩個(gè)不同的向量;[x1],[y1],[x2],[y2]分別表示兩個(gè)向量的橫、縱坐標(biāo)。

      1.4 ?特征選擇

      將提取的情感主題詞作為候選情感主題詞,在詞向量模型上將其轉(zhuǎn)換成具有語(yǔ)義知識(shí)的詞向量形式,再采用Pearson相關(guān)系數(shù)[11]計(jì)算詞向量,得到候選情感主題詞之間的語(yǔ)義相似度值,以此對(duì)微博評(píng)論進(jìn)行特征選擇,最后將上述特征選擇得到的主題詞定義為情感主題特征詞[Si],利用情感主題特征詞對(duì)微博評(píng)論進(jìn)行聚類(lèi)。

      情感主題特征詞提取流程圖如圖1所示。

      圖1中,該流程通過(guò)匹配情感主題詞袋,判斷微博評(píng)論是否為情感主題詞,“是”則進(jìn)一步進(jìn)行語(yǔ)義相似度計(jì)算,得到情感主題特征詞集;“否”則繼續(xù)匹配情感主題詞袋,直到遍歷整個(gè)微博評(píng)論集。

      1.5 ?特征加權(quán)

      由于在同主題內(nèi)概率較高的詞語(yǔ)間的相似度越高,則這個(gè)特征表達(dá)就越好。因此,本文充分考慮情感主題特征詞對(duì)主題的貢獻(xiàn)度,實(shí)現(xiàn)概率較高詞語(yǔ)的相似度及內(nèi)部相似度計(jì)算,最終得到主題的權(quán)值計(jì)算結(jié)果。

      本文定義了情感主題特征詞重要度和情感主題特征詞分布度兩個(gè)參數(shù),并分別對(duì)它們進(jìn)行權(quán)重加權(quán),再將情感主題特征詞重要度和分布度進(jìn)行線性相加。情感主題特征詞重要度和分布度定義分別如下所示。

      定義2:情感主題特征詞重要度。假設(shè)微博評(píng)論[D]由[m]個(gè)情感主題特征詞構(gòu)成,[D=]{[S1],[S2],…,[Si],…,[Sm]},則情感主題特征詞[Si]的重要度[T]([Si])的計(jì)算公式如下:

      [T(Si)=j=1mSim(wi,wj)] ?(3)

      式中[Simwi,wj]表示微博評(píng)論[D]中第[i]句和第[j]句之間的余弦相似度值。

      情感主題特征詞的重要度主要描述情感詞對(duì)于主題的貢獻(xiàn)作用。如果情感主題特征詞中的詞塊與其他詞塊的相似度之和最大,則其很有可能就是微博評(píng)論的情感主題特征詞或者與微博評(píng)論有較強(qiáng)的相關(guān)性。

      與情感主題特征詞相關(guān)的情感詞的個(gè)數(shù)稱(chēng)為情感主題特征詞分布度。情感主題特征詞與越多的其他語(yǔ)句滿足相似度閾值,則其覆蓋的內(nèi)容也就越多,因而成為情感主題特征詞的可能性就越大。

      定義3:情感主題特征詞分布度。假設(shè)微博評(píng)論[D]的情感詞數(shù)目為[m],情感主題特征詞[Si]的分布度[CSi]計(jì)算公式如下:

      [C(Si)=q(wi)m] (4)

      式中[qwi]是微博評(píng)論[D]中與情感主題特征詞[Si]滿足相似度閾值的評(píng)論個(gè)數(shù)。

      根據(jù)前面對(duì)情感主題特征詞的分析,情感主題特征詞權(quán)值計(jì)算通過(guò)重要度和分布度線性相加得到。權(quán)值計(jì)算公式如下:

      [Weight=d?T(Si)+(1-d)?C(Si)] (5)

      式中[d]表示阻尼系數(shù),一般設(shè)置為0.85。

      情感主題特征詞加權(quán)算法流程如下:

      算法1:情感主題特征詞加權(quán)算法

      輸入:主題數(shù)為[n],情感主題特征詞集[Ti], 主題集[T]

      輸出:情感主題特征詞加權(quán)的主題集[Ti]′

      1) for每個(gè)情感主題特征詞集[Ti∈T];

      2) 用式(5)計(jì)算情感主題特征詞[Tn]的權(quán)重;

      3) 得到情感主題特征詞集[Ti]′;

      4) end for;

      5) output [Ti]′。

      通過(guò)主題特征詞重要度和分布度兩個(gè)參數(shù)對(duì)情感主題特征詞進(jìn)行加權(quán),充分考慮情感主題特征詞對(duì)主題的貢獻(xiàn)度,從而優(yōu)化情感分析能力。

      1.6 ?MCCWSFW算法

      MCCWSFW算法的圖模型如圖2所示。

      圖2中,[θ],[φ]和[Ψ]分別為超參數(shù)[α],[β]和[δ]的概率分布,[mi]表示情感主題詞袋,([z],[m])表示特征詞加權(quán)過(guò)程,[sn]表示加權(quán)后情感主題特征詞。

      圖模型主要描述微博情感主題建模和情感主題特征詞加權(quán)過(guò)程,MCCWSFW算法具體過(guò)程如圖3所示。

      MCCWSFW算法描述如下。

      算法2:MCCWSFW算法

      輸入:主題數(shù)為[n],情感主題詞袋[F](ST),主題集[T]

      輸出:情感主題特征詞加權(quán)的主題集[Ti]′

      1) 利用情感主題詞袋[F](ST)匹配情感主題詞;

      2) 利用語(yǔ)義相似度對(duì)情感主題詞進(jìn)行計(jì)算,提取到情感主題特征詞,構(gòu)成情感主題特征詞集;

      3) 采用word2vec工具獲取情感主題詞集的詞向量;

      4) 得到詞向量,使用情感主題特征詞加權(quán)算法(算法1)進(jìn)行加權(quán)計(jì)算;

      5) 對(duì)主題特征詞加權(quán)后的分布訓(xùn)練,利用LDA主題模型聚類(lèi),輸出情感主題特征詞加權(quán)的主題集[Ti]′。

      MCCWSFW算法挖掘語(yǔ)料庫(kù)潛在的情感主題特征詞,通過(guò)LDA構(gòu)建微博情感主題模型。LDA主題模型參數(shù)設(shè)置:主題數(shù)為[n],[α=]0.5,[β=]0.01。采用Gibbs抽樣法,將情感主題?詞語(yǔ)分布從狄利克雷分布中抽取出來(lái)。

      2 ?實(shí)驗(yàn)結(jié)果與分析

      對(duì)MCCWSFW算法從情感主題特征詞維度、準(zhǔn)確率、綜合指標(biāo)值和時(shí)間效率進(jìn)行測(cè)試,與JST,LSM,LTM,WLDA模型進(jìn)行對(duì)比分析。實(shí)驗(yàn)首先確定MCCWSFW算法在3個(gè)數(shù)據(jù)集上最優(yōu)情感主題特征詞數(shù),然后分別在自身最優(yōu)情況下進(jìn)行對(duì)比實(shí)驗(yàn),并分析實(shí)驗(yàn)結(jié)果。

      2.1 ?數(shù)據(jù)集

      數(shù)據(jù)集從2018年10月的52個(gè)微博主題評(píng)論爬取,選取3個(gè)微博主題一周內(nèi)的評(píng)論數(shù)據(jù)6 557條進(jìn)行實(shí)驗(yàn),其信息如表1所示。

      用Python語(yǔ)言,在CPU為Intel Core I5?7200U@2.50 GHz,內(nèi)存8 GB,操作系統(tǒng)為Windows 7環(huán)境下進(jìn)行測(cè)試。

      2.2 ?聚類(lèi)評(píng)價(jià)指標(biāo)

      實(shí)驗(yàn)采用準(zhǔn)確率(Accuracy)、召回率(Recall)和綜合指標(biāo)[F1]值衡量聚類(lèi)算法的有效性,計(jì)算公式如下:

      [Accuracy=正確識(shí)別的微博評(píng)論情感個(gè)數(shù)識(shí)別出的微博評(píng)論總數(shù)N] (6)

      [Recall=正確識(shí)別的微博評(píng)論情感個(gè)數(shù)測(cè)試集中微博評(píng)論情感的總數(shù)n] (7)

      [F1=2×Accuracy×RecallAccuracy+Recall] (8)

      2.3 ?情感主題特征詞維度測(cè)試

      由于主題數(shù)對(duì)特征詞提取有重要的影響,因此確定聚類(lèi)最優(yōu)時(shí)的主題數(shù)就很重要。下面通過(guò)設(shè)置不同情感主題特征詞數(shù),對(duì)微博評(píng)論語(yǔ)料進(jìn)行LDA建模,最后采用綜合指標(biāo)[F1]值衡量主題數(shù)最優(yōu)值。

      實(shí)驗(yàn)分別在聚類(lèi)指標(biāo)準(zhǔn)確率、召回率和[F1]值下進(jìn)行維度測(cè)試,確保在自身最優(yōu)的情況下與其他模型進(jìn)行對(duì)比。結(jié)果如圖4所示。

      如圖4所示,在主題1、主題2和主題3中,情感主題特征詞數(shù)分別為15,10,20時(shí),[F1]值達(dá)到最好效果。因此確定主題1、主題2和主題3的最優(yōu)情感主題特征詞數(shù)分別為15,10和20。

      綜上所述,3個(gè)數(shù)據(jù)集情感主題特征詞數(shù)在10~20時(shí),均取得較好聚類(lèi)效果。情感主題特征詞代表主題的特征,當(dāng)特征維數(shù)較小時(shí),難以分辨主題特征;當(dāng)特征維數(shù)較大,主題噪聲會(huì)對(duì)實(shí)驗(yàn)結(jié)果產(chǎn)生干擾,從而降低聚類(lèi)效果。

      2.4 ?準(zhǔn)確率測(cè)試

      在主題1、主題2和主題3的情感主題特征詞數(shù)分別為15,10,20時(shí),將MCCWSFW算法分別與JST,LSM,LTM,WLDA模型的情感分類(lèi)準(zhǔn)確率進(jìn)行對(duì)比。對(duì)比結(jié)果如圖5所示。

      由圖5可知,MCCWSFW算法的準(zhǔn)確率較WLDA、LTM、LSM和JST都有提升。在主題2上,該算法較WLDA和LTM有明顯的優(yōu)勢(shì),正確率分別提高了8%和11%;在主題1和主題3上,該算法較其他模型的準(zhǔn)確率均有提升。其中,較WLDA提高了5.33%,較LTM提高7%,較LSM提高8.6%,較JST提高10.7%。

      2.5 ?指標(biāo)值測(cè)試

      實(shí)驗(yàn)在準(zhǔn)確率、召回率和[F1]值上,將MCCWSFW算法分別與JST,LSM,LTM和WLDA模型進(jìn)行對(duì)比,結(jié)果如圖6所示。

      由圖6可知,MCCWSFW算法較其他模型的指標(biāo)值均有所提升,具有一定的優(yōu)越性。這是因?yàn)樵撍惴ㄔ赪LDA基礎(chǔ)上,添加定義的情感主題詞袋[F(ST)]和加權(quán)的情感主題特征詞集,從而可以在確保提取正確主題特征的前提下進(jìn)行情感分析。

      MCCWSFW算法聚類(lèi)結(jié)果如表2所示,主題1、主題2和主題3加權(quán)的情感主題特征詞數(shù)分別為自身最優(yōu)維度下的15,10和20。

      聚類(lèi)結(jié)果表明,主題1關(guān)于游客不文明行為的評(píng)論居多,且評(píng)論中呼吁游客文明旅游、綠色出行。主題2的評(píng)論質(zhì)疑剖宮產(chǎn)指標(biāo)的合理性,呼吁理性健康的醫(yī)患關(guān)系。主題3的評(píng)論指責(zé)涉事副所長(zhǎng)濫用職權(quán),應(yīng)注重對(duì)公民權(quán)利的保障,謹(jǐn)慎行使自己的職權(quán),并認(rèn)為教師的教育尺度越來(lái)越難以把握,維護(hù)老師尊嚴(yán)很有必要。由此可見(jiàn),MCCWSFW算法對(duì)網(wǎng)絡(luò)輿情有一定指導(dǎo)作用。

      2.6 ?時(shí)間效率測(cè)試

      對(duì)MCCWSFW算法效率進(jìn)行測(cè)試。在主題1、主題2和主題3上對(duì)各模型進(jìn)行20次平均執(zhí)行時(shí)間對(duì)比實(shí)驗(yàn),結(jié)果如表3所示。

      由表3可知:在微博語(yǔ)料數(shù)據(jù)量小于2 000的主題1和主題3中,本文算法平均執(zhí)行時(shí)間較其他模型相差不大;但在主題2中,可以看出,隨著微博語(yǔ)料數(shù)據(jù)量的增加,MCCWSFW算法平均執(zhí)行時(shí)間較其他模型明顯增加,這是由于該算法利用情感主題詞袋來(lái)匹配情感信息和獲取主題情感特征,導(dǎo)致效率降低。

      3 ?結(jié) ?語(yǔ)

      本文提出一種基于情感主題特征詞加權(quán)的微博評(píng)論聚類(lèi)算法,通過(guò)定義情感主題詞袋,充分利用微博評(píng)論中包含的情感信息;在此基礎(chǔ)上,通過(guò)加權(quán)情感主題特征詞,充分利用微博評(píng)論之間的主題特征,考慮情感主題特征詞對(duì)主題的貢獻(xiàn)度,從而提高微博評(píng)論的情感分析聚類(lèi)效果。

      實(shí)驗(yàn)結(jié)果表明,MCCWSFW算法與JST、LSM、LTM和WLDA模型相比,在情感主題特征詞維度、準(zhǔn)確率、綜合指標(biāo)值和時(shí)間效率四個(gè)方面,表現(xiàn)出較好的情感分析聚類(lèi)效果,能有效地應(yīng)用到微博領(lǐng)域,提高網(wǎng)絡(luò)輿情分析能力。下一步將針對(duì)提出算法時(shí)間效率不高的問(wèn)題展開(kāi)進(jìn)一步研究。

      注:本文通訊作者為申超。

      參考文獻(xiàn)

      [1] 代明竹,高嵩峰.聚類(lèi)算法在高校學(xué)生微博的應(yīng)用研究[J].現(xiàn)代電子技術(shù),2019,42(7):177?180.

      [2] LIU Zheng, LIU Chiyu, XIA Bin, et al. Multiple relational topic modeling for noisy short texts [J]. International journal of software engineering and knowledge engineering, 2018, 28(11/12): 1559?1574.

      [3] ZHANG Y, EICK C F. Tracking events in twitter by combining an LDA?based approach and a density—contour clustering approach [J]. International journal of semantic computing, 2019, 13(1): 87?110.

      [4] 黃發(fā)良,于戈,張繼連,等.基于社交關(guān)系的微博主題情感挖掘[J].軟件學(xué)報(bào),2017,28(3):694?707.

      [5] 沈冀,馬志強(qiáng),李圖雅,等.面向短文本情感分析的詞擴(kuò)充LDA模型[J].山東大學(xué)學(xué)報(bào)(工學(xué)版),2018,48(3):120?126.

      [6] TAGO K, JIN Q. Influence analysis of emotional behaviors and user relationships based on twitter data [J]. Tsinghua science and technology, 2018, 23(1): 104?113.

      [7] YANG Qinjuan, RAO Yanghui, XIE Haoran, et al. Segment?level joint topic?sentiment model for online review analysis [J]. IEEE intelligent systems, 2019, 34(1): 43?50.

      [8] CHEN Zhenpeng, SHEN Sheng, HU Ziniu, et al. Emoji?powered representation learning for cross?lingual sentiment classification [C]// The World Wide Web Conference. San Francisco, CA, USA: ACM, 2019: 251?262.

      [9] CHEN Zhiyuan, LIU Bing. Topic modeling using topics from many domains, lifelong learning and big data [C]// International Conference on Machine Learning (ICML). Beijing: [s.n.], 2014: 2168?2177.

      [10] 郭曉慧.基于LDA主題模型的文本語(yǔ)料情感分類(lèi)改進(jìn)方法[J].延邊大學(xué)學(xué)報(bào)(自然科學(xué)版),2018(3):266?273.

      [11] MU Yashuang, LIU Xiaodong, WANG Lidong. A Pearson′s correlation coefficient based decision tree and its parallel implementation [J]. Information sciences, 2017, 435: 40?58.

      猜你喜歡
      聚類(lèi)算法情感分析
      基于語(yǔ)義的互聯(lián)網(wǎng)醫(yī)院評(píng)論文本情感分析及應(yīng)用
      基于雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的評(píng)價(jià)對(duì)象抽取研究
      數(shù)據(jù)挖掘算法性能優(yōu)化的研究與應(yīng)用
      K—Means聚類(lèi)算法在MapReduce框架下的實(shí)現(xiàn)
      基于SVM的產(chǎn)品評(píng)論情感分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
      基于K?均值與AGNES聚類(lèi)算法的校園網(wǎng)行為分析系統(tǒng)研究
      基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
      在線評(píng)論情感屬性的動(dòng)態(tài)變化
      基于改進(jìn)的K_means算法在圖像分割中的應(yīng)用
      文本觀點(diǎn)挖掘和情感分析的研究
      新绛县| 旺苍县| 建阳市| 宁远县| 许昌市| 石门县| 富源县| 兴城市| 砀山县| 肥东县| 长泰县| 田阳县| 碌曲县| 昌平区| 阳新县| 霍城县| 察哈| 高碑店市| 永泰县| 盐边县| 南投市| 长白| 专栏| 横山县| 新丰县| 双鸭山市| 酉阳| 东安县| 张掖市| 洪江市| 额敏县| 和林格尔县| 托里县| 长沙县| 昔阳县| 金堂县| 泊头市| 炎陵县| 抚远县| 禹州市| 合水县|