王啟發(fā),周 敏,王中卿,李壽山,周國棟
(蘇州大學 計算機科學與技術學院,江蘇 蘇州 215006)
伴隨著互聯(lián)網(wǎng)技術的飛速發(fā)展,形形色色的社交平臺、電商平臺也在不斷繁衍,如淘寶、京東、大眾點評、豆瓣、Yelp、Amazon等諸多在線評論網(wǎng)站早已深入我們的日常生活。這些平臺上的評論對于用戶和商家都具有很重要的參考價值[1],比如,對于網(wǎng)絡購物的消費者而言,在線評論可以幫助他們做出有效的購買決策,進而買到心儀的產(chǎn)品。而對于商家,通過挖掘大量的評論數(shù)據(jù)來了解其產(chǎn)品的用戶體驗,幫助商家做出有效的商業(yè)決策,從而帶來可觀的收益。由此可見,對在線評論的數(shù)據(jù)挖掘具有重要的應用價值。
在線評論的情感分類,正是評論文本數(shù)據(jù)挖掘方面的一個重要任務,其主要目的是識別主觀文本情感[2]。隨著在線評論的數(shù)量不斷增加,評論內(nèi)容更是復雜多樣,想要通過人工判別的方法去一一分析每一條評論的情感幾乎是不可能的,在這個大數(shù)據(jù)時代,我們迫切地需要一種自動判別的方法來實現(xiàn)在線評論的情感分類,從而高效地幫助消費者和商家在海量評論文本中獲取有價值的信息。
國內(nèi)外的相關學者已經(jīng)對在線評論文本的情感分類做了相關的研究,并取得了一些顯著的成果。但是,在以往的研究中,通常把每條評論看成獨立的文本,只關注評論文本內(nèi)容本身,而忽略了用戶和產(chǎn)品的關聯(lián)影響,實際上用戶的偏好和產(chǎn)品的特性對于評論的情感分類都是有一定影響的。對于不同的用戶,表達情感的方式也會有所差異,如個人偏好、措辭習慣、語義邏輯等方面,而這些用戶信息都會對最終的評論情感分類產(chǎn)生一定的影響。另外,產(chǎn)品信息也會對評論的情感分類產(chǎn)生一定的影響,產(chǎn)品的質(zhì)量越高,往往評價也會越好。我們在Yelp2013實驗數(shù)據(jù)集上抽取了一個用戶發(fā)表的1條主評論、該用戶的2條歷史評論,以及2條產(chǎn)品相關評論,表1給出了評論示例。
表1 評論示例
從表1的例子可以看出,主評論文本比較簡短,沒有過多的情感修飾詞,僅僅有一句“so sweet”,很容易判定為積極的情感,但是通過這位用戶的兩條歷史評論,我們發(fā)現(xiàn)“sweet”往往和“don’t like”“hate”這些情感詞聯(lián)系在一起,由此可見該用戶是不喜歡吃甜食的,即在用戶信息的輔助下,該主評論更傾向于負向情感;另外再來看看產(chǎn)品信息,從兩條產(chǎn)品相關評論中得知這家的Pizza被貼上了“not very good”“not recommended”負面標簽,由此可見,這家的Pizza并不是很受歡迎,評價更傾向于負面情感。故綜合用戶信息和產(chǎn)品信息,可以判斷主評論實際想要表達的是不滿意的情緒,故這條主評論應該被判定為消極。
因此,在本文的研究中,我們不再只提取主評論本身的特征來實現(xiàn)評論的情感傾向性分析,而是引入用戶和產(chǎn)品信息作為輔助特征,為了能夠有效地利用產(chǎn)品和用戶信息,并構(gòu)建用戶、產(chǎn)品信息與主評論之間的關聯(lián),本文提出了一種基于圖網(wǎng)絡的模型,將用戶與產(chǎn)品信息和主評論信息之間的關系構(gòu)建為一個圖,并基于圖卷積網(wǎng)絡模型學習產(chǎn)品與用戶信息對主評論的影響,從而提升評論情感分類的準確率。通過設計相關實驗,驗證了在評論文本信息中融入用戶、產(chǎn)品信息,并引入圖卷積神經(jīng)網(wǎng)絡模型,對評論情感分類的準確率提升具有明顯的作用。
本文后續(xù)內(nèi)容安排如下:第1節(jié)主要介紹情感分類和基于用戶與產(chǎn)品信息的情感分類的相關工作;第2節(jié)主要介紹模型的三個重要組成部分,分別為基于多文本信息的語義表示、基于用戶與產(chǎn)品信息的圖網(wǎng)絡構(gòu)建以及圖卷積模型的訓練與優(yōu)化;第3節(jié)介紹實驗數(shù)據(jù)集、實驗參數(shù)設置、評價標準、基準系統(tǒng)以及實驗結(jié)果分析;最后,在第4節(jié)中對研究工作進行總結(jié)。
情感分類是情感分析的任務之一,一直以來都是自然語言處理領域的研究熱點。情感分類是指根據(jù)文本所表達的含義和情感信息將文本劃分成褒揚的或貶義的兩種或幾種類型,是對文本作者傾向性、觀點和態(tài)度的劃分,因此有時也稱傾向性分析(opinion analysis)。情感分類的方法隨著科技的進步,也在不斷地演變,從相對傳統(tǒng)的基于情感詞典的方法,到基于機器學習的方法,如支持向量機、樸素貝葉斯等分類方法,再到當下比較火熱的基于深度學習的方法,通過不斷地推陳出新,使得情感分類的準確率不斷攀升。
在基于深度學習方法方面,隨著卷積神經(jīng)網(wǎng)絡(CNN)[3]在計算機視覺領域取得了實質(zhì)性的進展,Kim[4]在預處理的詞向量上訓練卷積神經(jīng)網(wǎng)絡進行句子級分類任務的一系列實驗,其中就包括情感分類任務,他提出的基于CNN的句子分類模型在多個公共數(shù)據(jù)集上都取得了較好的分類效果。Tang等人[5]提出一種基于門控遞歸神經(jīng)網(wǎng)絡的文檔建模方法,對來自IMDB的4個大型review數(shù)據(jù)集進行了文檔級情感分類,實驗結(jié)果表明門控遞歸神經(jīng)網(wǎng)絡在情感分類文檔建模方面明顯優(yōu)于標準遞歸神經(jīng)網(wǎng)絡。Wang等人[6]將長短期記憶網(wǎng)絡(LSTM)[7]應用到Tweets的情感分類任務中,取得了不錯的效果。Tai等人[8]將傳統(tǒng)的LSTM結(jié)構(gòu)推廣到樹狀網(wǎng)絡拓撲結(jié)構(gòu)來進行情感分類。后來,國內(nèi)外學者又將注意力機制[9-11]引入文本情感分類任務中,如Yang等人[12]針對文本分類提出一個層次化的注意力機制,分別就詞和句子構(gòu)建兩個層次的注意力機制,從而使得文本中重要性不同的句子和詞被給予了不同的“注意力”能力,實驗結(jié)果相較以往的模型效果提升顯著。
Gui等人[13]利用異構(gòu)網(wǎng)絡對產(chǎn)品評論中的共享極性進行建模,并學習用戶、評論的產(chǎn)品以及他們同時使用的詞語的表示形式?;舅枷胧鞘紫葮?gòu)建一個異構(gòu)網(wǎng)絡,該網(wǎng)絡將用戶、產(chǎn)品、出現(xiàn)在產(chǎn)品評論中的單詞以及單詞的極性連接起來。根據(jù)構(gòu)建的網(wǎng)絡,使用網(wǎng)絡嵌入方法學習節(jié)點的表示,隨后將其合并到卷積神經(jīng)網(wǎng)絡中以進行情感分析。
Tang等人[14]采用深度學習的方法對用戶信息和產(chǎn)品信息進行建模,捕獲重要的全局線索,然后將用戶、產(chǎn)品、評論文檔三者信息結(jié)合在一個統(tǒng)一的神經(jīng)網(wǎng)絡中,從而有效地提升了評論文檔情感分類的性能。
Chen等人[15]提出了一個層次神經(jīng)網(wǎng)絡,首先構(gòu)建一個分層的LSTM模型用于生成句子和文檔的表示,然后通過不同語義層次注意力機制來捕獲用戶和產(chǎn)品信息中的關鍵語義成分,從而實現(xiàn)評論的情感分類。該模型在IMDB、Yelp數(shù)據(jù)集上較Tang等人[14]提出的用戶產(chǎn)品神經(jīng)網(wǎng)絡(UPNN)模型取得了顯著的性能提升。
Ma等人[16]提出了一個級聯(lián)多路注意力(CMA)模型,該模型將用戶和產(chǎn)品信息的多種使用方式進行級聯(lián),以影響單詞和句子層上注意力的產(chǎn)生。然后,通過多個表示向量很好地建模句子和文檔,為情感分類提供了豐富的信息。在IMDB和Yelp數(shù)據(jù)集上的實驗均證明了該模型的有效性。
Dou[17]提出了一個用于文檔級情感分類的深層存儲網(wǎng)絡,該網(wǎng)絡可以同時捕獲用戶和產(chǎn)品信息。
Zou等人[18]提出了一種基于詞匯的有監(jiān)督注意力模型(LBSA),通過遞歸神經(jīng)網(wǎng)絡關注情感內(nèi)容,從而生成情感信息表示,該模型的優(yōu)勢是具有更好的可解釋性和更少的噪聲。
Wu等人[19]提出了一個新的網(wǎng)絡框架(HUAPA),從兩個不同的角度對評論進行編碼,對兩個層次網(wǎng)絡分別通過用戶注意力和產(chǎn)品注意力來生成文本表示,然后通過一個組合策略最大限度地利用這兩種表示進行訓練和最終預測。
Kim等人[20]使用基向量來有效地合并基于神經(jīng)網(wǎng)絡的模型各個部分的分類元數(shù)據(jù),通過該方法可以更有效地表示分類元數(shù)據(jù),以定制模型的各個部分,包括未開發(fā)的部分,從而大大提高了模型的性能。
由以上相關工作可知,我們提出的基于用戶和產(chǎn)品信息對評論進行情感分類的方案是可行的,為了更好地構(gòu)建用戶、產(chǎn)品信息與評論之間的關聯(lián),我們嘗試引入Kipf 等人[21]提出的一種名為圖卷積神經(jīng)網(wǎng)絡(graph convolutional network,GCN)的神經(jīng)網(wǎng)絡模型,由于GCN近兩年才興起,在自然語言處理領域應用并不多,尤其是在文本的情感分類任務方面,于是,我們嘗試將圖卷積神經(jīng)網(wǎng)絡引入評論的情感分類的任務中,經(jīng)過在Yeap.com(1)www.yelp.com數(shù)據(jù)集上測試,模型的實驗效果得到穩(wěn)步提升。
本文首先通過詞嵌入層(embedding)分別對主評論文本(comment)、用戶歷史評論即用戶信息(user)、產(chǎn)品相關評論即產(chǎn)品信息(product)進行詞向量矩陣轉(zhuǎn)換,將離散的序列映射為連續(xù)的向量,與此同時,為了讓三者更有效地實現(xiàn)信息融合,并構(gòu)建用戶、產(chǎn)品信息與主評論之間的關聯(lián),本文引入圖的方法,將主評論信息、用戶信息、產(chǎn)品信息各自的文本作為節(jié)點,又根據(jù)三者之間的依賴關系在各個節(jié)點之間構(gòu)建邊,得到一個鄰接矩陣。然后,將通過嵌入層得到的詞向量矩陣和通過構(gòu)建圖得到的鄰接矩陣一起傳入圖卷積神經(jīng)網(wǎng)絡,進一步地捕獲文本中的重要信息。最后將三者信息融合后的文本表示經(jīng)過一個全連接層,使用sigmiod激活函數(shù),輸出一個0~1之間的概率值,本文規(guī)定概率值大于0.5視為正向情感,反之視為負向情感。整體模型如圖1所示。
圖1 基于用戶與產(chǎn)品信息和圖卷積網(wǎng)絡的情感分類模型
本文考慮綜合用戶、產(chǎn)品、主評論三者的信息,通過三者之間的聯(lián)系,捕獲重要信息,從而實現(xiàn)評論的情感分類。于是我們先對整理好的每一組評論數(shù)據(jù)進行預處理,每一組評論數(shù)據(jù)包含1條主評論、m條用戶歷史評論、n條產(chǎn)品相關評論,根據(jù)詞頻統(tǒng)計后得到的詞匯表對每一條評論序列中的每一個單詞進行編碼,對于主評論、用戶歷史評論、產(chǎn)品相關評論的第k條評論可以分別表示為:
其中,Ck表示主評論文本向量,Uk表示用戶歷史評論文本向量,Pk表示產(chǎn)品相關評論文本向量,另外,wCkn∈R(R:0~74 826的正整數(shù)集合,wCkn即為該詞在詞匯表V中對應的編號)。由于本實驗中限定了輸入文本的最大長度為250,于是對輸入的評論文本向量進行長度統(tǒng)一,長度超過250的從句子前端截斷,長度不足的在句子前端補0。然后將以上得到的句子向量Ck、Uk、Pk傳至詞嵌入層(embedding)表示,分別得到詞向量表示如式(4)~式(6)所示。
為了讓神經(jīng)網(wǎng)絡更好地捕獲主評論、用戶歷史評論、產(chǎn)品相關評論三者之間的關聯(lián)信息,從而得到更準確的文本表示,我們引入了圖的方法。先是創(chuàng)建節(jié)點,本文中,我們將一條主評論文本和與之對應的m條用戶歷史評論、n條產(chǎn)品相關評論各建一個節(jié)點,即一張圖人1+m+n個節(jié)點;然后構(gòu)建邊,本文中,我們構(gòu)建的是有向邊,將主評論文本的節(jié)點分別與用戶歷史評論的m個節(jié)點、產(chǎn)品相關評論的n個節(jié)點之間構(gòu)建雙向邊,為了加強對主評論文本自身重要信息的挖掘,我們對主評論文本建了一條自循環(huán)邊。另外,為了更好地從用戶的歷史評論中捕獲到用戶相關信息,我們又在用戶歷史評論的m個節(jié)點之間互相建立雙向邊。例如,對于表1中的樣例,我們將主評論文本記為C節(jié)點,兩條用戶歷史評論分別記為U1節(jié)點、U2節(jié)點,產(chǎn)品相關評論記為P1節(jié)點、P2節(jié)點,然后,C節(jié)點分別與U1、U2、P1、P2節(jié)點構(gòu)建雙向邊,再對C節(jié)點建一條自循環(huán)邊。另外,再對U1、U2節(jié)點之間構(gòu)建雙向邊。本文的實驗模型圖網(wǎng)絡的構(gòu)建如圖2所示,鄰接矩陣如圖3所示。
圖2 圖的構(gòu)建
圖3 鄰接矩陣
本文的研究目的是在線評論的情感分類,為了提升分類的準確率,我們將主評論、用戶歷史評論、產(chǎn)品相關評論三者進行信息融合來進行評論情感分類。基于此,本文提出一種基于圖卷積神經(jīng)網(wǎng)絡模型,首先通過2.1節(jié)可以得到主評論、用戶歷史評論、產(chǎn)品相關評論各自的文本表示,同時從2.2節(jié)中可以得到三者之間的鄰接矩陣,然后將三個文本向量矩陣和鄰接矩陣一同傳入圖卷積神經(jīng)網(wǎng)絡,圖卷積神經(jīng)網(wǎng)絡主要分為以下三個步驟:
第一步:發(fā)射(send)。每一個節(jié)點將自身的特征信息經(jīng)過變換后發(fā)送給鄰居節(jié)點。也就是將主評論、用戶歷史評論、產(chǎn)品相關評論各自的特征信息進行抽取變換,然后發(fā)送給各自的鄰居節(jié)點。
第二步:接收(receive)。每個節(jié)點將鄰居節(jié)點的特征信息聚集起來,這一步是在對節(jié)點的局部結(jié)構(gòu)信息進行融合。在本文中,我們將用戶信息和產(chǎn)品信息相關節(jié)點中的重要特征信息與主評論文本信息進行融合。
第三步:變換(transform)。把前面的信息聚集之后做非線性變換,增加模型的表達能力,即對第二步中主評論信息、用戶信息、產(chǎn)品信息三者匯集融合后的特征信息進行非線性變換。
經(jīng)過圖網(wǎng)絡的一次傳播,每個節(jié)點都表示成了其鄰域節(jié)點的集合,但是這樣缺少了自身的特征,于是本文中我們還添加了自循環(huán),在應用傳播規(guī)則前將單位矩陣添加到鄰接矩陣A中,通過GCN執(zhí)行正向傳播。傳播規(guī)則如式(7)所示。
f(Hi,A)=σ(A*Hi*Wi)
(7)
隨后將sigmoid函數(shù)逐行應用于GCN中的最后一層,計算已知節(jié)點標簽上的交叉熵損失,反向傳播損失并更新每層中的權重矩陣W,最后,用作分類器的邏輯回歸是一個分類層,它通過對最后一個圖形卷積層提供的每個節(jié)點的特性求和并對該和應用sigmoid函數(shù)來執(zhí)行邏輯回歸。
本文使用的是Yelp Dataset Challenge 2013提供的數(shù)據(jù)。在實驗中,我們先對數(shù)據(jù)進行清洗、歸類、整理等一系列預處理,得到兩個數(shù)據(jù)集:一個是訓練集,38 139組數(shù)據(jù),正樣例為32 264組,負樣例為5 875組;另一個是測試集,16 168組數(shù)據(jù),正樣例為13 671組,負樣例為2 497組。其中,每組數(shù)據(jù)包含一條主評論,即需要進行情感分類的評論文本,另外還包含與之對應的m條該用戶的歷史評論,即通過該用戶的歷史評論來獲取該用戶的相關信息,以及n條產(chǎn)品的相關評論,即通過產(chǎn)品的相關評論來獲取該產(chǎn)品的相關信息。這里的m條用戶歷史評論和n條產(chǎn)品相關評論是通過與主評論文本計算相似度篩選得到的,需要篩選出相似度較高的評論文本,且評論文本長度不低于25個字符。經(jīng)過嚴格的篩選,很多評論文本不符合要求,我們發(fā)現(xiàn)很多主評論最多對應4條用戶歷史評論、4條產(chǎn)品相關評論,為了保證用戶信息和產(chǎn)品信息對主評論的客觀影響相對均衡,故這里的m、n均取4。
本實驗為了避免模型對數(shù)據(jù)的過度依賴,同時為了保證神經(jīng)網(wǎng)絡學到的信息更為準確,做了訓練樣本的均衡處理;又為了保證和基準模型實驗的一致性,為了增強模型的泛化能力,我們每次的模型訓練都是從總訓練集隨機抽取正負樣例各800組,共計1 600組作為訓練集。再對訓練集用直接計數(shù)統(tǒng)計法進行詞頻統(tǒng)計,根據(jù)詞頻由高到低進行倒排序,再將排序好的詞表依次從0開始編號,詞為鍵,編號為值,隨后得到一個具有74 826個鍵-值對的詞匯字典。然后根據(jù)詞匯字典對每一組評論數(shù)據(jù)的每一條評論文本序列進行編碼,即就是將文本序列的每個詞轉(zhuǎn)換成詞匯字典中該詞相對應的編號,于是就得到主評論文本向量表示Ck、用戶歷史評論文本向量表示Uk、產(chǎn)品評論文本向量表示Pk。實驗數(shù)據(jù)集的分布情況如表2所示。
表2 實驗數(shù)據(jù)集分布情況
為了獲取模型的最優(yōu)參數(shù)集合,需要調(diào)節(jié)的參數(shù)如表3所示。
表3 模型參數(shù)調(diào)節(jié)列表
本實驗主要采用準確率來衡量分類的效果,相關公式如式(8)所示。
Acc=TP/(TP+FP)
(8)
其中,TP表示將正例預測為正例的個數(shù),F(xiàn)P表示將負例預測為正例的個數(shù)。
隨著人工智能時代的快速發(fā)展,計算機科學與技術不斷地進步,在情感分析領域已經(jīng)產(chǎn)生了很多優(yōu)秀的算法模型,本實驗選用了近年來相對優(yōu)異的以下幾種方法來進行實驗的對比分析。
(1)LSTM:自Wang等人[6]將LSTM應用到Tweets的情感分類任務中取得了不錯的效果后,大家紛紛效仿,將LSTM應用到各個任務中,本實驗直接采用LSTM模型對評論文本進行建模,并進行評論情感分類,將其作為本文的基準模型。
(2)CMRCTC:該模型是Kim等人[20]提出的一種用于自定義文本分類的分類元數(shù)據(jù)的表示方法,使用基向量來有效地合并基于神經(jīng)網(wǎng)絡模型的各個部分的分類元數(shù)據(jù),通過該方法可以更有效地表示分類元數(shù)據(jù),以定制模型的各個部分,包括未開發(fā)的部分,從而大大提高模型的性能。
(3)NSC:該模型是Chen等人[15]提出的一個層次神經(jīng)網(wǎng)絡,構(gòu)建一個分層的LSTM模型,即詞級和句子級LSTM層,分別用于生成句子和文檔的表示,從而實現(xiàn)評論的情感分類。
(4)NSC+LA:Chen等人[15]在NSC模型基礎上添加本地語義注意力機制來捕獲評論信息中的關鍵語義成分,從而實現(xiàn)評論的情感分類。
(5)NSC+UPA:Chen等人[15]在NSC模型基礎上,引入用戶和產(chǎn)品的信息,并且用詞級的用戶產(chǎn)品注意力機制(UPA)獲得句子表示,再用句子級的UPA獲得文檔表示,從而實現(xiàn)評論的情感分類。
(6)HUAPA:該模型是Wu等人[19]提出的一個新的網(wǎng)絡框架,從兩個不同的角度對評論進行編碼,對兩個層次網(wǎng)絡分別通過用戶注意力和產(chǎn)品注意力來生成文本表示,然后通過一個組合策略最大限度地利用這兩種表示進行訓練和最終預測。
本文主要進行了兩組實驗,一是將本文提出的基于用戶、產(chǎn)品信息和圖卷積網(wǎng)絡的情感分類模型(GCN+UP)與基準系統(tǒng)一一進行對比;二是將GCN+UP與網(wǎng)絡結(jié)構(gòu)不同的GCN模型做對比。
3.5.1 實驗對比分析
為了驗證我們基于用戶、產(chǎn)品信息的評論情感分類方法的有效性,同時也為了驗證引入圖卷積神經(jīng)網(wǎng)絡模型情感分類的效果,本文選擇了在自然語言處理領域一直表現(xiàn)優(yōu)異的長短期記憶網(wǎng)絡LSTM模型進行對比,以及同近年來同樣基于用戶與產(chǎn)品信息進行情感分類的模型中表現(xiàn)相對優(yōu)異的模型進行對比,實驗結(jié)果如表4所示。
表4 與基準模型進行對比
從表4可以總結(jié)出以下結(jié)論:
(1)將GCN+UP模型同LSTM、NSC、NSC+LA這三個模型進行對比,從實驗結(jié)果可以看出,GCN+UP的準確率明顯高于其他三個模型,這是因為LSTM、NSC、NSC+LA這三個模型只是針對主評論文本本身建模,而GCN+UP則是融合了用戶與產(chǎn)品信息的模型,由于加入用戶與產(chǎn)品信息可以讓神經(jīng)網(wǎng)絡捕獲到更多的重要信息,學習到更準確的特征表示,故從這幾組對比實驗可以驗證我們提出的基于用戶與產(chǎn)品信息進行評論情感分類的方法是可行且有效的。
(2)通過GCN+UP模型與6個基準模型的對比實驗結(jié)果可以看出,本文提出的基于用戶與產(chǎn)品信息和圖卷積網(wǎng)絡的情感分類模型準確率要明顯高于其他6個基準模型,尤其是和CMRCTC、NSC+UPA、HUAPA這3個基準模型相比,同樣都是基于用戶、產(chǎn)品信息來進行情感分類,但GCN+UP模型效果明顯優(yōu)于其他3個模型,這是因為采用圖卷積的方法,通過節(jié)點和邊,讓信息進行有效的傳遞、匯集、變換,這樣不僅可以很好地構(gòu)建三者之間的聯(lián)系,還可以從中捕獲到重要的信息,從而提高模型的學習表示能力。
由此,不僅可以證明我們提出的將用戶與產(chǎn)品信息作為輔助特征進行評論情感分類的方法是有效的,還很好地驗證了我們設計的基于圖卷積神經(jīng)網(wǎng)絡的情感分類模型也是可行的,且模型效果明顯優(yōu)于基準模型。
3.5.2 網(wǎng)絡結(jié)構(gòu)的影響
為了驗證模型的有效性,在模型相應參數(shù)保持不變的情況下,考慮不同網(wǎng)絡結(jié)構(gòu)的影響,我們將本文提出的GCN+UP模型與以下幾種網(wǎng)絡結(jié)構(gòu)不同的GCN模型做對比實驗,實驗結(jié)果如表5所示。
表5 不同結(jié)構(gòu)GCN對比
(1)GCN_C:在構(gòu)建圖時,僅對主評論節(jié)點自身構(gòu)建自循環(huán)邊,然后傳入圖卷積神經(jīng)網(wǎng)絡學習主評論自身的重要信息,從而實現(xiàn)情感分類。
(2)GCN_C+CU:在構(gòu)建圖時,不僅對主評論節(jié)點自身構(gòu)建自循環(huán)邊,還在主評論文本和用戶歷史評論之間構(gòu)建雙向邊,使得圖卷積神經(jīng)網(wǎng)絡可以捕獲主評論和用戶歷史評論之間的關聯(lián)信息,從而實現(xiàn)情感分類。
(3)GCN_C+CP:該模型和GCN_C+CU模型類似,不僅對評論節(jié)點自身構(gòu)建自循環(huán)邊,還在主評論文本和產(chǎn)品相關評論之間構(gòu)建雙向邊,使得圖卷積神經(jīng)網(wǎng)絡可以捕獲主評論和產(chǎn)品相關評論之間的關聯(lián)信息,從而實現(xiàn)情感分類。
(4)GCN_C+CU+CP:該模型相當于是對上述的三個模型進行了結(jié)合,不僅對主評論節(jié)點自身構(gòu)建自循環(huán)邊,還在主評論文本和用戶歷史評論之間,以及主評論文本和產(chǎn)品相關評論之間構(gòu)建雙向邊,使得圖卷積神經(jīng)網(wǎng)絡不僅可以捕獲主評論和用戶歷史評論之間的關聯(lián)信息,還可以捕獲主評論和產(chǎn)品相關評論之間的關聯(lián)信息,從而實現(xiàn)情感分類。
(5)GCN+UP:即本文提出的主模型,在上述GCN_C+CU+CP模型基礎上,再對用戶歷史評論文本自身構(gòu)建自循環(huán)邊,從而實現(xiàn)用戶歷史評論中重要信息的捕獲、主評論中重要信息的捕獲、主評論和用戶歷史評論之間關聯(lián)信息的捕獲、主評論和產(chǎn)品相關評論之間關聯(lián)信息的捕獲,以達到提升情感分類的準確率的作用。
從表5的實驗結(jié)果我們可以得出以下結(jié)論:
(1)由GCN_C模型實驗結(jié)果可見,只對主評論構(gòu)建自循環(huán)邊的模型分類準確率較低,因為這樣無法獲取到用戶的歷史評論中的用戶信息以及產(chǎn)品相關評論中的產(chǎn)品信息。
(2)通過GCN_C+CU和GCN_C+CP兩組模型的對比可以看出,GCN_C+CP的準確率略高于GCN_C+CU,我們猜測是主評論和產(chǎn)品相關評論之間有較多的交互信息,所以它們的聯(lián)系更密切一些,捕獲到重要的信息更多一些。
(3)將本文提出的GCN+UP模型和其他4個不同結(jié)構(gòu)的GCN模型做對比,我們可以很明顯地看出GCN+UP模型的分類效果最佳,同時也可以看出不同結(jié)構(gòu)的GCN模型的實驗結(jié)果是有一定差異的,說明雖然引入圖卷積對評論的情感分類有一定的幫助,但是需要合理構(gòu)建圖和邊才能讓圖卷積發(fā)揮出比較好的作用,從而更好地實現(xiàn)評論的情感分類。
本文針對在線評論網(wǎng)站的主評論進行情感分類,考慮到用戶的歷史評論、產(chǎn)品相關評論與主評論之間有著密切的聯(lián)系,可能會對主評論的情感分類產(chǎn)生一定的影響,提出了一種基于用戶與產(chǎn)品信息和圖卷積網(wǎng)絡的情感分類模型,通過對三者之間合理地建圖建邊,高效地捕獲文本重要信息,增強模型對于文本的特征表示能力,從而實現(xiàn)主評論的情感分類。經(jīng)過反復實驗,與其他模型一一對比,最終得到了本文的GCN+UP模型,實驗效果相比基準模型有顯著的提升。