• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于依存句法關(guān)系的在線(xiàn)評(píng)論情感屬性的降維

    2018-01-01 00:00:00蔡文嘉

    大規(guī)模文本的觀點(diǎn)挖掘已成為研究熱點(diǎn),基于機(jī)器學(xué)習(xí)技術(shù)的情感分析應(yīng)運(yùn)而生,特征降維是其中的關(guān)鍵環(huán)節(jié)。方法:常見(jiàn)的特征降維方法有DF、IG、MI和CHI,這些方法運(yùn)用了統(tǒng)計(jì)的思想,沒(méi)有考慮特征詞之間的語(yǔ)義關(guān)系,在一定程度上影響了分類(lèi)效果。針對(duì)中文產(chǎn)品評(píng)論的特點(diǎn),采用依存關(guān)系對(duì)句子進(jìn)行句法分析,并結(jié)合常見(jiàn)的降維方法進(jìn)行情感屬性降維。最后,采用SVM分類(lèi)器進(jìn)行文本分類(lèi)實(shí)驗(yàn)。結(jié)果:降維后的特征詞能更好地表示文本。結(jié)論:基于依存句法關(guān)系的情感屬性降維方法能夠有效提高情感分類(lèi)的效果。

    隨著社交網(wǎng)絡(luò)與在線(xiàn)商城的融合,越來(lái)越多的用戶(hù)在線(xiàn)發(fā)表產(chǎn)品評(píng)論。產(chǎn)品評(píng)論是消費(fèi)者根據(jù)自己對(duì)商品的使用體驗(yàn),從使用者的角度來(lái)描述商品屬性和評(píng)價(jià)商品性能。Podium于2016年的調(diào)查顯示,60%的網(wǎng)民至少每周都會(huì)瀏覽在線(xiàn)商品評(píng)論,其中93%認(rèn)為商品評(píng)論影響了他們的購(gòu)買(mǎi)決策。情感分析利用自然語(yǔ)言處理和文本挖掘等技術(shù),自動(dòng)識(shí)別和分析主觀性評(píng)論文本信息。其中,情感屬性的降維是影響情感分析效果的重要環(huán)節(jié)。本文以依存句法關(guān)系為基礎(chǔ),對(duì)情感屬性的降維方法進(jìn)行比較,旨在優(yōu)化降維模型,從而提高情感分析的效果。

    情感分類(lèi)相關(guān)研究綜述

    (一) 情感分類(lèi)基本流程

    網(wǎng)絡(luò)評(píng)論的情感分類(lèi)是通過(guò)對(duì)非結(jié)構(gòu)化的網(wǎng)絡(luò)評(píng)論文本進(jìn)行分析,自動(dòng)將其判斷為正面評(píng)價(jià)或負(fù)面評(píng)價(jià),從而識(shí)別消費(fèi)者的觀點(diǎn)?;具^(guò)程:經(jīng)過(guò)預(yù)處理、文本表示(特征項(xiàng)選擇、特征項(xiàng)降維、特征項(xiàng)權(quán)重設(shè)置)、分類(lèi)器處理,最終得到一個(gè)有關(guān)情感類(lèi)別的輸出。

    (二)特征項(xiàng)選擇方法

    特征項(xiàng)選擇,即選取語(yǔ)義單元作為特征項(xiàng)。特征項(xiàng)既要真實(shí)地反映文檔的情感信息,也要對(duì)不同文檔有較強(qiáng)的區(qū)分能力,可以是詞、詞的組合、N元組等。

    1、選取詞或詞的組合。徐軍等利用樸素貝葉斯和最大熵方法對(duì)新聞?wù)Z料進(jìn)行情感分類(lèi)。實(shí)驗(yàn)顯示,選擇形容詞和名詞作為特征項(xiàng)時(shí),具有較高分類(lèi)準(zhǔn)確率,且分類(lèi)性能好于只選擇形容詞[1]。周杰等針對(duì)新聞評(píng)論的特點(diǎn),選取不同的特征集、特征維度、詞性進(jìn)行分類(lèi)測(cè)試,研究顯示,名詞和動(dòng)詞的分類(lèi)效果好于形容詞和副詞 [2]。

    2、選取N-gram。Pang等分別以詞頻作為權(quán)重的Unigrams、以布爾值作為權(quán)重的Unigrams、Bigrams、Unigrams + Bigrams等作為情感特征項(xiàng)。實(shí)驗(yàn)表明,使用布爾值作為權(quán)重的Unigram作為特征的分類(lèi)效果最好,使用Bigram作為特征未達(dá)到預(yù)期的分類(lèi)準(zhǔn)確率[3]。Zhang ZQ等選取N-gram作為情感特征項(xiàng),結(jié)果顯示,Bigram的分類(lèi)效果好于Unigram 和Trigram[4]。Cui等指出Pang的語(yǔ)料較小,無(wú)法體現(xiàn)N-grams(n≥3)的優(yōu)勢(shì),高階N-gram項(xiàng)能夠提高情感分類(lèi)準(zhǔn)確率[5]。與Cui的結(jié)論相反,Ng等發(fā)現(xiàn)將Bigram和Trigram加入U(xiǎn)nigram項(xiàng)后能夠提高SVM的分類(lèi)性能,但單獨(dú)使用Unigram、Bigram或Trigram作為特征項(xiàng),分類(lèi)準(zhǔn)確率隨著階數(shù)增加而下降[6]。

    (三) 情感屬性降維

    通過(guò)向量空間模型,非結(jié)構(gòu)化的評(píng)論文本可以轉(zhuǎn)換成可機(jī)器處理的結(jié)構(gòu)化數(shù)據(jù)。采用向量空間模型需要降維,即根據(jù)語(yǔ)料庫(kù)的文本生成特征項(xiàng)的初始集。

    常用降維方法有:文檔頻率法(Document Frequency,DF)、信息增益法(Information Gain,IG)、統(tǒng)計(jì)量法(Chi-square Statistic,CHI)、互信息法(Mutual Information,MI)等。學(xué)者對(duì)特征項(xiàng)降維方法進(jìn)行比較。劉勰等對(duì)DF、IG、CHI進(jìn)行比較,實(shí)驗(yàn)顯示DF法優(yōu)于CHI和IG[7]。Yao等對(duì)DF、MI、CHI和IG進(jìn)行比較,實(shí)驗(yàn)顯示,DF 方法的分類(lèi)效果較好,同時(shí)發(fā)現(xiàn)MI方法不適用于情感特征項(xiàng)的降維[8]。

    此外,還需要設(shè)置特征權(quán)重。根據(jù)選取出的特征項(xiàng),對(duì)訓(xùn)練集和測(cè)試集的每一條語(yǔ)料進(jìn)行權(quán)重賦值、歸一化等處理,將文本語(yǔ)料轉(zhuǎn)化為特征向量形式。

    (四)依存句法分析

    在進(jìn)行情感分析的句子中,需要確定評(píng)論的主題和修飾它的詞。所謂“依存”是指詞與詞之間支配與被支配的關(guān)系,一個(gè)關(guān)系連接兩個(gè)詞語(yǔ),這種關(guān)系不是對(duì)等的,而是有方向的,處于支配地位的成分即為核心詞語(yǔ),而處于被支配地位的成為被稱(chēng)為修飾詞語(yǔ)。直觀來(lái)講,依存句法分析識(shí)別句子中的“主謂賓”、“定狀補(bǔ)”這些語(yǔ)法成分,從而可以確定核心詞語(yǔ)與修飾詞語(yǔ) [9]。

    一般來(lái)說(shuō),依存句法分析的任務(wù)有三個(gè):(1)判斷輸入的字符串是否屬于某種語(yǔ)言;(2)消除輸入的句子中詞法和結(jié)構(gòu)等方面的歧義;(3)分析輸入句子的內(nèi)部結(jié)構(gòu),如成分構(gòu)成、上下文關(guān)系。常見(jiàn)的應(yīng)用有以下兩種:(1)利用句法分析結(jié)果,對(duì)捜索問(wèn)題的通用性改寫(xiě)和答案標(biāo)題匹配,提高改寫(xiě)和匹配的質(zhì)量,從而改善搜索結(jié)果的質(zhì)量。(2)利用句法信息對(duì)機(jī)器翻譯結(jié)果做調(diào)序處理?;诖?,本文將依存句法分析引入情感屬性降維中,以期解決傳統(tǒng)基于詞頻統(tǒng)計(jì)的降維方法中存在的忽略文本語(yǔ)義信息的缺陷,提高情感屬性降維的準(zhǔn)確性和可信度。

    (五) 研究評(píng)述

    在情感分析研究中,分類(lèi)算法相對(duì)成熟,但是情感屬性降維方面仍存在不足。依存句法分析通過(guò)解析語(yǔ)言單位內(nèi)部各成員之間的依存關(guān)系,挖掘詞語(yǔ)構(gòu)成句子過(guò)程中發(fā)生的搭配關(guān)系并找出句子核心成分,基于此本文提出依存句法分析會(huì)對(duì)情感屬性降維效果起正向作用的實(shí)驗(yàn)假設(shè)。因此,本文提出了基于依存句法關(guān)系的特征降維方法,將特征降維和依存句法分析相結(jié)合。依存句法分析有助于從句法結(jié)構(gòu)找出支配地位的特征詞,讓情感屬性的特征降維結(jié)果更具代表性和準(zhǔn)確性,彌補(bǔ)傳統(tǒng)特征提取中忽略文本結(jié)構(gòu)信息的不足。

    實(shí)驗(yàn)設(shè)計(jì)

    (一)實(shí)驗(yàn)流程

    實(shí)驗(yàn)流程分為文本表示、語(yǔ)料訓(xùn)練和文本分類(lèi)。文本表示模塊,抓取在線(xiàn)評(píng)論語(yǔ)料進(jìn)行預(yù)處理,單句依存句法分析并進(jìn)行節(jié)點(diǎn)重要度計(jì)算;設(shè)立對(duì)比實(shí)驗(yàn),對(duì)照組采用DF\IG\MI\CHI方法進(jìn)行特征項(xiàng)降維,實(shí)驗(yàn)組結(jié)合依存句法分析進(jìn)行特征項(xiàng)降維;特征項(xiàng)權(quán)重計(jì)算,構(gòu)建空間向量表示文本。語(yǔ)料訓(xùn)練模塊,采用SVM分類(lèi)算法,對(duì)訓(xùn)練集語(yǔ)料進(jìn)行訓(xùn)練。文本分類(lèi)模塊,對(duì)測(cè)試集語(yǔ)料進(jìn)行情感極性分類(lèi)實(shí)驗(yàn),以文本分類(lèi)精度驗(yàn)證并比較降維效果優(yōu)劣。

    (二)語(yǔ)料庫(kù)

    選擇手機(jī)作為評(píng)論主體。中關(guān)村在線(xiàn)是全球第一中文科技門(mén)戶(hù),每日影響超過(guò)80%的采購(gòu)用戶(hù)。因此選擇中關(guān)村在線(xiàn)的三星GALAXY Note 4(N9100/公開(kāi)版/雙4G)評(píng)論。抓取10000條評(píng)論,7000條用于訓(xùn)練,3000條用于測(cè)試,訓(xùn)練集和測(cè)試集中的正類(lèi)和負(fù)類(lèi)評(píng)論均比為1:1,待分類(lèi)文本屬于平衡數(shù)據(jù)。

    (三)評(píng)論語(yǔ)料的預(yù)處理

    選用哈工大社會(huì)計(jì)算與信息檢索研究中心研發(fā)的“語(yǔ)言技術(shù)平臺(tái)(LTP)” 進(jìn)行依存句法分析。中文評(píng)論在語(yǔ)言組織、句式表達(dá)上較隨意。這會(huì)導(dǎo)致LTP在切詞、詞性標(biāo)注的過(guò)程中產(chǎn)生大量空格,且會(huì)錯(cuò)誤識(shí)別標(biāo)點(diǎn)的詞性,對(duì)后續(xù)分類(lèi)器的訓(xùn)練結(jié)果造成影響。

    為了后期處理單條評(píng)論的簡(jiǎn)潔性和易讀性,人工將原始語(yǔ)料進(jìn)行預(yù)處理。將空格、標(biāo)點(diǎn)符號(hào)作為分句的依據(jù)。而對(duì)于“、”,比如“屏幕、電池都很好”,作為一個(gè)分句處理,無(wú)需分開(kāi)。

    (四)依存句法分析及節(jié)點(diǎn)重要度計(jì)算

    依存語(yǔ)法通過(guò)分析語(yǔ)言單位內(nèi)成分之間的依存關(guān)系,揭示其句法結(jié)構(gòu)。利用依存關(guān)系確定關(guān)聯(lián)詞對(duì),既可保證關(guān)聯(lián)詞對(duì)之間存在一定句法關(guān)聯(lián),又可實(shí)現(xiàn)有向關(guān)聯(lián),從而保證文本網(wǎng)絡(luò)構(gòu)建的準(zhǔn)確性。依存句法分析標(biāo)注關(guān)系(共14種)。

    在LTP中對(duì)單句的依存句法分析結(jié)果示例如下圖1:

    LTP將句子切分成詞語(yǔ)視圖。其中,節(jié)點(diǎn)代表詞語(yǔ);邊代表特征詞之間的語(yǔ)義關(guān)聯(lián);邊的權(quán)重代表詞之間語(yǔ)義關(guān)聯(lián)的程度。由此得到:大→屏幕(SBV)、屏幕→手機(jī)(ATT)、效果→顯示(ATT)、好→效果(SBV)、好→很(ADV)等。

    將LTP單句分析的結(jié)果批量導(dǎo)出,其中包含大量有標(biāo)點(diǎn)符號(hào)產(chǎn)生的關(guān)聯(lián)對(duì),LTP依存句法分析將其標(biāo)注為WP。如圖3中的大→,(WP)。本文將其刪除,以得到最終的有效關(guān)聯(lián)詞對(duì)集。

    (3)節(jié)點(diǎn)重要度的計(jì)算

    文本網(wǎng)絡(luò)的邊由節(jié)點(diǎn)所代表的特征詞的依存句法分析結(jié)果確定。邊的權(quán)重由其所連接的節(jié)點(diǎn)代表的特征詞之間存在關(guān)聯(lián)的頻次決定,且需考慮邊的方向。本文參考了文獻(xiàn)[10]進(jìn)行邊權(quán)重計(jì)算,公式如式(1)所示:

    其中,wij表示由節(jié)點(diǎn)i指向節(jié)點(diǎn)j的邊的權(quán)重, fre(ti )和fre(tj )分別表示節(jié)點(diǎn)i和j代表的特征詞在文本Di中出現(xiàn)的頻次,fre(ti,tj )表示詞對(duì)“i→j”在文本Di的有效關(guān)聯(lián)詞對(duì)集中出現(xiàn)的頻次。

    根據(jù)邊權(quán)重計(jì)算節(jié)點(diǎn)重要度的公式如式(2)所示:

    其中,Qi表示節(jié)點(diǎn)i的節(jié)點(diǎn)重要度,wij表示由節(jié)點(diǎn)i指向節(jié)點(diǎn)j的邊的權(quán)重,wji表示由節(jié)點(diǎn)j指向節(jié)點(diǎn)i的邊的權(quán)重。

    (五)特征項(xiàng)降維

    1、特征選擇

    若把所有切詞結(jié)果作為文本的特征項(xiàng),特征向量空間的維數(shù)將過(guò)大,增加計(jì)算復(fù)雜度,也對(duì)分類(lèi)器性能產(chǎn)生負(fù)面效應(yīng)。特征選擇在保留文本核心信息表述的情況下,剔除不重要的詞,降低特征向量的維度,縮短訓(xùn)練時(shí)間,提高分類(lèi)處理的精度。本文參考文獻(xiàn)[7]選取特定的詞性特征來(lái)減少抽取成本、減少噪音。

    文獻(xiàn)[10]的實(shí)驗(yàn)結(jié)果顯示:在句子級(jí)別的情感分類(lèi)中,名詞、形容詞、副詞、動(dòng)詞單獨(dú)作為特征時(shí)達(dá)到的分類(lèi)效果排序依次是:形容詞>動(dòng)詞>副詞>名詞。形容詞最為關(guān)鍵,評(píng)論的情感傾向大多由形容詞表達(dá);動(dòng)詞作為分類(lèi)特征時(shí)所能達(dá)到的分類(lèi)效果較好;程度副詞和被修飾詞語(yǔ)一同作為特征詞對(duì)文本的情感極性有很大影響;名詞作為特征項(xiàng)產(chǎn)生的分類(lèi)貢獻(xiàn)微乎其微,從分類(lèi)成本上講,多一類(lèi)詞性增加了選取和篩選成本。由此,本文選取詞性為形容詞、動(dòng)詞、副詞作為文本特征項(xiàng)。

    2、特征降維

    特征降維方法DF、IG、MI、CHI的性能在不同的文本分類(lèi)任務(wù)和不同的語(yǔ)言環(huán)境下結(jié)論不同。為此,本文將在后續(xù)電子產(chǎn)品評(píng)論情感極性判斷的研究中展開(kāi)比較。

    本文將降維方法計(jì)算出的特征項(xiàng)評(píng)分值和根據(jù)依存句法關(guān)系得到的節(jié)點(diǎn)重要度相結(jié)合,得到特征項(xiàng)的綜合評(píng)分值。實(shí)驗(yàn)發(fā)現(xiàn),DF\IG\MI\CHI特征項(xiàng)評(píng)分值和節(jié)點(diǎn)重要度歸一方程,確定量綱比例為1:0.5時(shí)分類(lèi)效果最好。

    3、特征項(xiàng)權(quán)重計(jì)算

    在空間向量模型里,特征項(xiàng)的權(quán)重代表了它的表述能力、相關(guān)度和重要性。同時(shí),特征項(xiàng)的權(quán)重大小將影響文本分類(lèi)的效果。常用的方法有布爾權(quán)重、頻度權(quán)重、TF-IDF權(quán)重。

    本文采用最簡(jiǎn)便的布爾權(quán)重法,如果特征項(xiàng)在語(yǔ)料中出現(xiàn),則其權(quán)重計(jì)為1;如果特征項(xiàng)在語(yǔ)料中不出現(xiàn),則其權(quán)重計(jì)為0。

    (六)文本分類(lèi)器的選擇

    常用的分類(lèi)算法有:Rocchio、k-最近鄰算法(KNN)、樸素貝葉斯(NB)、支持向量機(jī)(SVM)、線(xiàn)性最小平方擬合(LLSF)和神經(jīng)網(wǎng)絡(luò)法(NNet)等。

    在情感分類(lèi)領(lǐng)域,Pang等[11]、Ni等[12]、 Mullen等[13]和Whitelaw等[14]研究了SVM在情感分類(lèi)中的表現(xiàn),發(fā)現(xiàn)SVM比其他分類(lèi)算法能達(dá)到更好的精度。因此,本文選擇SVM作為分類(lèi)算法,并選擇臺(tái)灣大學(xué)開(kāi)發(fā)的LIBSVM軟件包實(shí)施分類(lèi)。

    實(shí)驗(yàn)結(jié)果分析

    (一)特征抽取數(shù)量的閾值

    特征數(shù)量的閾值是指令分類(lèi)效果最佳的特征數(shù)目。數(shù)目較少時(shí),每個(gè)文本的特性無(wú)法充分表達(dá),分類(lèi)效果顯然不佳;數(shù)目增加,文本充分表達(dá),分類(lèi)效果也會(huì)改善;當(dāng)數(shù)目達(dá)到一定程度,再增加特征數(shù)目會(huì)加重分類(lèi)成本,增加特征噪音,導(dǎo)致分類(lèi)效果降低。為此,針對(duì)不同語(yǔ)料環(huán)境,需要通過(guò)實(shí)驗(yàn)來(lái)確定特征最佳數(shù)目。在不同降維方法下,不同特征抽取數(shù)量下所能達(dá)到的分類(lèi)精度,如表1所示。

    共有4組實(shí)驗(yàn),分別以50、100、200、300為特征數(shù)量確定最佳抽取數(shù)量的范圍。結(jié)果顯示,分類(lèi)精度先提高后降低。每種降維方法拐點(diǎn)基本都在100左右,最高精確度能達(dá)到78.79%。不同的情境下合理的特征數(shù)會(huì)有所不同,為此,下文比較不同特征降維方法時(shí),特征抽取數(shù)量均取100。

    (二)DF\IG\MI\CHI的特征降維結(jié)果

    分別采用DF\IG\MI\CHI構(gòu)造特征評(píng)估函數(shù),計(jì)算特征項(xiàng)的評(píng)分值。表2分別給出各個(gè)特征降維方法下評(píng)分值排名前5位的特征項(xiàng)。

    (三)基于依存句法關(guān)系的特征降維結(jié)果

    根據(jù)公式(2),計(jì)算節(jié)點(diǎn)重要度。表2沒(méi)有考慮依存句法關(guān)系對(duì)評(píng)分值的影響。如果引入基于依存句法分析得到的節(jié)點(diǎn)重要度,可得到特征項(xiàng)的綜合評(píng)分值,如表3所示。

    (四) 不同特征降維方法下的分類(lèi)性能比較

    1階段使用傳統(tǒng)的4種降維方法DF\IG\MI\CHI,2階段將依存句法分析結(jié)果和4種傳統(tǒng)降維方法結(jié)合,分別抽取100個(gè)特征詞,分別進(jìn)行4次分類(lèi)訓(xùn)練實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果見(jiàn)圖2。

    在特征抽取數(shù)量為100的情況下,得到以下結(jié)論:

    (1)不同降維方法達(dá)到的分類(lèi)精度略有不同,但是均保持在73%以上,因此本文的分類(lèi)實(shí)驗(yàn)是有效的,可作為推導(dǎo)以下實(shí)驗(yàn)結(jié)論的基礎(chǔ)。

    (2)單一使用傳統(tǒng)降維方法時(shí),分類(lèi)效果最好的是DF法,分類(lèi)精度達(dá)到78.79%。將依存句法分析和傳統(tǒng)降維方法相結(jié)合,分類(lèi)效果最好的是依存句法分析結(jié)合DF法,分類(lèi)精度達(dá)到79.34%。

    (3)圖2顯示,“結(jié)合依存句法分析”總位于“單一傳統(tǒng)方法”之上,即每組對(duì)比試驗(yàn)中,結(jié)合了依存句法分析的降維方法之分類(lèi)精度更高。由此得到趨勢(shì)假設(shè),依存句法分析對(duì)降維效果起到正向作用。

    (五)實(shí)驗(yàn)結(jié)論

    (1)特征項(xiàng)數(shù)量不足會(huì)導(dǎo)致文本信息表達(dá)不充分,導(dǎo)致分類(lèi)精度下降。增加特征項(xiàng)數(shù)量能夠提高特征空間的維度,從而提高文本的分類(lèi)精度。但是,過(guò)多的特征項(xiàng)也會(huì)造成信息紊亂,降低文本分類(lèi)效率?;诖?,確定特征規(guī)模時(shí)應(yīng)平衡效率和準(zhǔn)確率的關(guān)系。在本文語(yǔ)料集規(guī)模下,特征數(shù)量在100附近分類(lèi)效果最佳。因此,語(yǔ)料規(guī)模不同的情況,應(yīng)通過(guò)實(shí)驗(yàn)來(lái)確定特征項(xiàng)的數(shù)量以保證文本分類(lèi)試驗(yàn)準(zhǔn)確度。

    (2)選用不同詞性和詞性組合作為特征項(xiàng),分類(lèi)的效果也不同。實(shí)驗(yàn)證明,選取形容詞為特征項(xiàng)的實(shí)驗(yàn)分類(lèi)效果比較理想,動(dòng)詞、副詞次之。對(duì)大量文本進(jìn)行分類(lèi)時(shí),可以選擇形容詞、動(dòng)詞、副詞作為特征項(xiàng),以提高文本分類(lèi)的準(zhǔn)確度。

    (3)實(shí)驗(yàn)結(jié)果表明,將特征降維和依存句法分析相結(jié)合,降維效果更好,彌補(bǔ)了傳統(tǒng)特征提取中忽略文本結(jié)構(gòu)信息的不足,能夠在一定程度上提高文本分類(lèi)的效果,為后續(xù)的情感分析奠定了基礎(chǔ)。

    結(jié)語(yǔ)

    以中文在線(xiàn)評(píng)論為研究對(duì)象,分別采用基于詞頻的降維方法、結(jié)合依存句法分析的降維方法選擇特征項(xiàng)。實(shí)驗(yàn)研究證明,依存句法分析對(duì)情感屬性降維效果起到正向作用。今后將在以下幾方面進(jìn)一步探討:

    (1)依存句法分析中計(jì)算節(jié)點(diǎn)重要度方法。

    (2)情感屬性降維結(jié)果和依存句法分析結(jié)果的擬合方法。

    (3)非結(jié)構(gòu)化的數(shù)據(jù)中的某些標(biāo)點(diǎn)符號(hào)和表情符號(hào)也表達(dá)了強(qiáng)烈的用戶(hù)情感。希望在后續(xù)的研究中將納入數(shù)據(jù)集進(jìn)行處理。

    井研县| 汾西县| 贵溪市| 苍南县| 维西| 南丹县| 肇源县| 荣昌县| 徐水县| 峡江县| 陆良县| 正安县| 磴口县| 汝南县| 邵东县| 图片| 广德县| 谷城县| 鲁山县| 郧西县| 视频| 东港市| 东阿县| 通山县| 湖口县| 兰考县| 开原市| 咸阳市| 麦盖提县| 房产| 云林县| 中西区| 富平县| 瓦房店市| 永康市| 布尔津县| 旬邑县| 多伦县| 建德市| 九龙县| 武夷山市|