魏曉聰, 林鴻飛, 楊亮
(1.大連理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,遼寧 大連 116024; 2.大連外國語大學(xué) 軟件學(xué)院,遼寧 大連 116044)
?
基于情感距離和領(lǐng)域自適應(yīng)的評(píng)論者聲譽(yù)度
魏曉聰1,2, 林鴻飛1, 楊亮1
(1.大連理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,遼寧 大連 116024; 2.大連外國語大學(xué) 軟件學(xué)院,遼寧 大連 116044)
為有效地從評(píng)論文本中評(píng)估消費(fèi)評(píng)論者的聲譽(yù)度,本文提出一種基于情感距離和領(lǐng)域自適應(yīng)的評(píng)論者聲譽(yù)度評(píng)估方法。通過度量待評(píng)估評(píng)論者發(fā)表的商品評(píng)論與該商品其他評(píng)論者的情感距離、情感傾向一致性,從而衡量該消費(fèi)評(píng)論者在評(píng)價(jià)商品時(shí)的客觀性以及與大眾情感極性的一致性。最后,以亞馬遜產(chǎn)品評(píng)論為實(shí)驗(yàn)語料,與亞馬遜Reviewer ranking排序結(jié)果進(jìn)行對(duì)比表明該方法的合理性。該方法對(duì)評(píng)論文本有效性研究以及規(guī)范電商平臺(tái)消費(fèi)者行為具有重要意義。
產(chǎn)品評(píng)論;聲譽(yù)度;評(píng)論者;情感距離;情感傾向一致性;領(lǐng)域自適應(yīng)
聲譽(yù)是在商品交易過程中所形成的買賣雙方的一種依賴關(guān)系,體現(xiàn)為贏得交易對(duì)方信任的能力。一個(gè)人的聲譽(yù)越高,人們對(duì)他的信任程度就越高[1]。Sussman和Siegal指出消費(fèi)者對(duì)信息的采納來源于信息質(zhì)量和信息源可信性兩個(gè)因素[2]。郭國慶指出,評(píng)論者的資信度是影響評(píng)論信息感知可信度的重要因素之一[3]。隨著電子商務(wù)和Web 2.0的迅速發(fā)展,越來越多的消費(fèi)者需要從海量的、質(zhì)量參差不齊的評(píng)論信息中獲得真實(shí)可靠、值得信賴的消費(fèi)者評(píng)論,從而降低信息搜索成本、快速做出購買決策。國外的電商平臺(tái)—Amazon.com消費(fèi)評(píng)論者聲譽(yù)度評(píng)價(jià)機(jī)制Reviewer ranking主要考慮兩個(gè)因素:1)其他消費(fèi)者對(duì)該消費(fèi)者所發(fā)表的全部評(píng)論的“有用”性投票數(shù)量;2)該消費(fèi)評(píng)論者近期發(fā)布的產(chǎn)品評(píng)論數(shù)量。這種評(píng)價(jià)機(jī)制無法避免零投票導(dǎo)致的“有用”性投票機(jī)制失效問題,并且比較注重消費(fèi)者近期發(fā)表的評(píng)論數(shù)量。國內(nèi)的電商平臺(tái)—淘寶網(wǎng)對(duì)于發(fā)布產(chǎn)品評(píng)論的消費(fèi)者聲譽(yù)度評(píng)估主要通過賣家對(duì)交易進(jìn)行標(biāo)記(好評(píng)、中評(píng)或差評(píng))以及文字評(píng)價(jià)兩種方式。然而,對(duì)交易進(jìn)行標(biāo)記是粗粒度的情感度量,無法有效的衡量賣家對(duì)消費(fèi)者的情感。而且,為討好消費(fèi)評(píng)論者,通常情況下賣家都會(huì)給出好評(píng)。在文字評(píng)價(jià)上,由于賣家的日交易量很大,其沒有精力針對(duì)每位消費(fèi)評(píng)論者的交易一一給出客觀的文字評(píng)價(jià),通常都是統(tǒng)一的評(píng)價(jià)文本。在這種評(píng)價(jià)機(jī)制下,淘寶網(wǎng)的消費(fèi)評(píng)論者誠信監(jiān)管嚴(yán)重缺失。如果能夠引入一種有效的、自動(dòng)的消費(fèi)評(píng)論者聲譽(yù)度評(píng)估方法,那么賣家可以此為依據(jù)決定是否將自己的商品出售給聲譽(yù)度低的消費(fèi)評(píng)論者,其他用戶可以此為參考決定是否根據(jù)該消費(fèi)者的評(píng)論做出購買決策。這樣,消費(fèi)評(píng)論者在對(duì)商品做出評(píng)論時(shí)出于對(duì)失信的后果有所顧忌,會(huì)更傾向于給出真實(shí)、客觀的評(píng)價(jià)。國內(nèi)外現(xiàn)有的相關(guān)研究主要集中在消費(fèi)者對(duì)賣家的信用評(píng)價(jià)機(jī)制上,對(duì)消費(fèi)評(píng)論者信用評(píng)價(jià)方面,即消費(fèi)評(píng)論者聲譽(yù)度,邵婷等通過定性分析進(jìn)行了討論[4]。據(jù)了解,目前還沒有相關(guān)工作從評(píng)論文本情感分析角度進(jìn)行定量研究。本文借鑒文本情感分析相關(guān)研究成果,從定量客觀的視角出發(fā),將情感進(jìn)行量化,以Amazon.com在線評(píng)論為例,同時(shí)考慮消費(fèi)評(píng)論者與其他評(píng)論者對(duì)同一商品的情感距離、情感傾向一致性兩個(gè)因素,提出一種基于情感距離和領(lǐng)域自適應(yīng)的方法對(duì)消費(fèi)評(píng)論者進(jìn)行聲譽(yù)度分析。
基于評(píng)論文本情感距離和領(lǐng)域自適應(yīng)的評(píng)論者聲譽(yù)度研究總體框架如圖1所示。首先,根據(jù)給定消費(fèi)評(píng)論者,在商品庫中搜索該消費(fèi)評(píng)論者評(píng)論過的商品。從商品評(píng)論庫中將上述商品的該消費(fèi)者評(píng)論和其他評(píng)論檢索出來分別進(jìn)行情感距離和情感極性一致性計(jì)算,最后根據(jù)上述兩個(gè)分值進(jìn)行消費(fèi)者聲譽(yù)度分析。
圖1 消費(fèi)者聲譽(yù)度研究總體框架Fig.1 The architecture of consumer reputation research
1.1 情感距離計(jì)算
1.1.1 情感量化
SentiWordNet 3.0[6]是一個(gè)面向情感分類和觀點(diǎn)挖掘應(yīng)用的開源詞典資源,它是在WordNet同義詞集的基礎(chǔ)上建立起來的。它為每個(gè)同義詞集分配包含褒、貶、中性3個(gè)維度的打分,每個(gè)維度得分介于[0, 1.0],3個(gè)維度得分總和為1。對(duì)于情感詞wi,可以通過SentiWordNet字典獲得情感詞在褒、貶、中性三個(gè)維度上的情感分值sen(wi)=(Poswi,Negwi,Objwi),從而量化每條評(píng)論的情感。
1.1.2 詞義消歧
字典中存在著大量一詞多義的情況,例如:“terrible”總共有四種詞義。在SentiWordNet情感字典中,多義詞可能具有不同的維度得分。當(dāng)處理一條評(píng)論文本時(shí)需要對(duì)多義詞進(jìn)行詞義消歧,確定其詞義后在情感字典中找到對(duì)應(yīng)的情感分值。例如“I was very hesitant to purchase this set due to the terrible reviews regarding the packaging”,其中的“terrible”需要確定是四種詞義中的哪種詞義,然后在SentiWordNet中查找對(duì)應(yīng)詞義的情感分值。
詞義消歧是指根據(jù)多義詞所處的上下文環(huán)境來確定詞義。本文采取基于詞典的Lesk[7]詞義消歧算法。該算法認(rèn)為:一個(gè)詞在詞典中的詞義解釋與該詞所在句子具有相似性。如給定上下文“I was very hesitant to purchase this set due to the terrible reviews regarding the packaging”,指定歧義詞“terrible”,Lesk算法給出的語義解釋為“intensely or extremely bad or unpleasant in degree or quality”。
由于Lesk算法和SentiWordNet情感字典是基于同一英語詞典WordNet,存在一部分詞的解釋(定義)描述是相同的。針對(duì)這部分詞,只需根據(jù)Lesk算法給出的多義詞解釋在SentiWordNet中尋找相同解釋的同義詞集,并采用其對(duì)應(yīng)的情感分值即可。因此,上述句子中“terrible”情感分值sen(“terrible”)=(0,0.875,0.125)。而對(duì)于描述不相同的解釋,需要計(jì)算句子相似度找出最相似的解釋(定義)。
1.1.3 句子相似度計(jì)算
在實(shí)驗(yàn)中,存在Lesk算法給出的歧義詞解釋在SentiWordNet情感字典中沒有相匹配的解釋。例如“I honestly believe the stories are the best stuff Tad′s written so far”中的歧義詞“best”, Lesk算法給出的解釋為“in a manner affording benefit or advantage”,但在SentiWordNet情感字典“best”的各種解釋中沒有與之相匹配的解釋。這時(shí),需要計(jì)算Lesk算法給出的解釋與SentiWordNet字典“best”的各種解釋的句子相似度,將相似度最大的解釋對(duì)應(yīng)的情感分值作為“best”的情感分值。
傳統(tǒng)的句子相似度計(jì)算很多都是基于詞袋模型(bag-of-words, BOW)的。但是,詞袋模型會(huì)丟失詞序信息并且忽略詞的語義信息。n-gram詞袋模型雖然可以通過窗口捕捉詞序信息,但是其會(huì)產(chǎn)生高維稀疏問題。因此,需要一種句子的表示方法既可以保留上下文詞序信息又可以捕捉到詞語之間的語義信息,并且避免高維稀疏問題。Paragraph2Vec[8]算法是Le等2014年提出的。該算法是一種句子、段落和文檔的連續(xù)分布式向量表示方法。它從可變長度的文本中,通過滑動(dòng)的、固定大小的上下文窗口為每個(gè)句子、段落或文檔學(xué)習(xí)一個(gè)稠密的向量表示。由于該算法可以從無標(biāo)注數(shù)據(jù)中無監(jiān)督的學(xué)習(xí)到這種向量表示,因此非常適合沒有足夠標(biāo)注數(shù)據(jù)的訓(xùn)練任務(wù)。同時(shí),該算法能夠克服詞袋模型的缺點(diǎn),避免n-gram詞袋模型的高維稀疏和推廣能力差等問題。例如,在本實(shí)驗(yàn),針對(duì)上述上下文中的“best”,SentiWordNet情感字典中與Lesk算法給出的解釋句子相似度最大的同義詞集語義解釋為“in a most excellent way or manner”,因此該上下文中的“best”情感分值為sen(“best”)=(0.5,0,0.5)。
1.1.4 評(píng)論情感分值
將一條評(píng)論表示為P{wi|i∈n},其中wi為該條評(píng)論中的情感詞,n為該評(píng)論包含的情感詞數(shù)量,那么,該條評(píng)論的情感分值:
例如“I honestly believe the stories are the best stuff Tad′s written so far”,經(jīng)過詞義消歧后各情感詞的情感分值如表1所示。經(jīng)過計(jì)算,上述例句的情感分值E=(0.14,0.03,0.83)。
表1 各情感詞情感分值
1.2 情感極性一致性計(jì)算
1.2.1 計(jì)算方法
1.2.2 領(lǐng)域自適應(yīng)情感極性自動(dòng)識(shí)別方法
以Amazon.com上的評(píng)論為例,消費(fèi)者在發(fā)表文字評(píng)論的同時(shí)會(huì)給該商品賦予一個(gè)打分,該打分范圍為[1,5]。這些屬于評(píng)論的弱標(biāo)簽。然而,有時(shí)消費(fèi)者發(fā)表的評(píng)論與其給出的打分并不一致。為了彌補(bǔ)上述問題帶來的不足并檢測(cè)本文提出方法的有效性,本工作從挖掘評(píng)論文本情感的角度,利用Amazon網(wǎng)站已有的、大量的、帶有弱標(biāo)簽的評(píng)論文本進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練,用訓(xùn)練得到的模型去自動(dòng)判斷每條評(píng)論的情感極性。
然而,機(jī)器學(xué)習(xí)的一個(gè)重要假設(shè):訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)必須在同一特征空間下并且分布相同。但是不同產(chǎn)品的評(píng)論很難保證這一點(diǎn)。目前,領(lǐng)域自適應(yīng)學(xué)習(xí)解決的就是這些問題[9-11]。然而大量文獻(xiàn)提出的領(lǐng)域自適應(yīng)學(xué)習(xí)方法過度依賴于領(lǐng)域,而對(duì)于本文的任務(wù),領(lǐng)域是隨機(jī)的,領(lǐng)域的種類同商品種類一樣,數(shù)量很大且不確定。前人的方法很難實(shí)施到本文的任務(wù)中。因此,需要訓(xùn)練一個(gè)在很多領(lǐng)域都能很好完成領(lǐng)域自適應(yīng)學(xué)習(xí)任務(wù)、具有較強(qiáng)泛化能力的模型。
近年來文獻(xiàn)表明,深度神經(jīng)網(wǎng)絡(luò)能夠從源輸入變量的所有因素中捕捉到具有一般性的因素,能夠在不同領(lǐng)域之間自動(dòng)的學(xué)習(xí)被不同領(lǐng)域共享的、對(duì)任務(wù)具有辨別力的特征表示,因此適合解決跨領(lǐng)域自適應(yīng)學(xué)習(xí)問題。深度神經(jīng)網(wǎng)絡(luò)在文本領(lǐng)域已開展了少量的工作,如Xiao Ding等提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的領(lǐng)域自適應(yīng)學(xué)習(xí)方法識(shí)別電影領(lǐng)域用戶消費(fèi)意圖[12]。該工作驗(yàn)證了卷積神經(jīng)網(wǎng)絡(luò)在文本領(lǐng)域挖掘消費(fèi)意圖任務(wù)上的領(lǐng)域自適應(yīng)學(xué)習(xí)能力。本文提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的多源領(lǐng)域自適應(yīng)學(xué)習(xí)框架,該框架如圖2所示。
圖2 基于卷積神經(jīng)網(wǎng)絡(luò)的多源領(lǐng)域自適應(yīng)學(xué)習(xí)框架Fig.2 The architecture of multi-source domain adaptation based on convolutional neural network
層1:詞向量層。構(gòu)建一個(gè)字典,將各評(píng)論中的每個(gè)詞用其對(duì)應(yīng)的索引值表示并作為該層輸入,對(duì)應(yīng)的Word2Vec[13]訓(xùn)練的詞向量初始化該層的權(quán)重。這樣該層在進(jìn)行訓(xùn)練時(shí)權(quán)重值會(huì)根據(jù)任務(wù)進(jìn)行微調(diào)。接下來為了防止訓(xùn)練的模型過擬合,引入dropout機(jī)制。本層的輸出作為下一層的輸入。
層2:由一維卷積操作和一維最大池化操作組成。卷積操作將滑動(dòng)窗口大小為n的文本區(qū)域轉(zhuǎn)化為特征向量。向量m∈Rn是一個(gè)卷積核,也叫權(quán)重向量。大小為n的卷積核通過捕捉一個(gè)詞的上下文特征從而學(xué)習(xí)內(nèi)部特征表達(dá)。對(duì)于一個(gè)詞向量vi,首先將詞向量vi周圍的n個(gè)詞向量串聯(lián)起來,然后通過卷積操作與權(quán)重向量m∈Rn進(jìn)行點(diǎn)乘。
fi=mTvj-n+1:j
(1)
最后進(jìn)行激活函數(shù)計(jì)算:
O=σ(fj+b)
(2)
式中:σ為非線性激活函數(shù),b∈Rn為偏置向量。在同一層,m∈Rn和b∈Rn權(quán)值共享,它們通過訓(xùn)練學(xué)習(xí)得到。然后應(yīng)用一個(gè)一維最大池化操作來捕捉對(duì)本任務(wù)有用的局部特征。本層的輸出作為下一層的輸入。
層3:層3的結(jié)構(gòu)與層2相同,也是由一個(gè)一維卷積操作和一個(gè)最大池化操作組成。層3的輸出經(jīng)過Flatten函數(shù)“壓平”,即把多維的輸入一維化從而作為下一層的輸入。
層4:該層為全連接層,其輸出作為下一層的輸入。
層5:該層為全連接層,最后進(jìn)行情感極性二元分類。
2.1 實(shí)驗(yàn)數(shù)據(jù)集
本文實(shí)驗(yàn)語料采用McAuley等[14]收集的Amazon產(chǎn)品評(píng)論語料。該語料包含了消費(fèi)評(píng)論者的商品信息及打分。打分范圍介于[1,5]。其中1分為最低分,5分為最高分。從上述語料中隨機(jī)抽取5位評(píng)論者,這些評(píng)論者評(píng)價(jià)產(chǎn)品次數(shù)需滿足大于等于5次,語料統(tǒng)計(jì)如表2所示。
表2 語料統(tǒng)計(jì)表
2.2 Paragraph2Vec模型訓(xùn)練
將SentiWordNet情感字典中所有同義詞集的解釋及例句共114 076個(gè)句子,以及2.1實(shí)驗(yàn)數(shù)據(jù)集中的每個(gè)歧義詞的Lesk算法給出的解釋,共同作為Paragraph2Vec模型訓(xùn)練語料。經(jīng)過實(shí)驗(yàn)選擇訓(xùn)練模型最優(yōu)參數(shù)組合為特征向量維數(shù)300維、預(yù)測(cè)詞與上下文單詞最大距離為8、保留低頻詞匯,其余參數(shù)如表3所示。采用gensim工具包[15]實(shí)現(xiàn)的Paragraph2Vec算法。
表3 Paragraph2Vec模型訓(xùn)練參數(shù)
2.3 領(lǐng)域自適應(yīng)情感極性自動(dòng)識(shí)別實(shí)驗(yàn)
2.3.1 詞向量訓(xùn)練
本文從McAuley等[14]收集的Amazon產(chǎn)品評(píng)論語料中抽取了2014年Books, Movies & TV, Electronics 和 Home & Kitchen 四個(gè)領(lǐng)域的所有評(píng)論作為Word2Vec訓(xùn)練語料。該語料包含696萬條產(chǎn)品評(píng)論、38 600萬個(gè)單詞。將語料中的單詞全部變換為小寫并去除標(biāo)點(diǎn)符號(hào)之后進(jìn)行Word2Vec詞向量訓(xùn)練,詞向量維數(shù)為300維。
2.3.2 多源領(lǐng)域自適應(yīng)學(xué)習(xí)的情感極性自動(dòng)識(shí)別
為了驗(yàn)證本文提出的深度神經(jīng)網(wǎng)絡(luò)領(lǐng)域自適應(yīng)學(xué)習(xí)框架在跨領(lǐng)域產(chǎn)品評(píng)論情感分類上的有效性,本文進(jìn)行如下實(shí)驗(yàn)。本文從McAuley等[14]收集的Amazon產(chǎn)品評(píng)論語料中抽取了2014年Books(B)、Movies & TV(D)、Electronics(E) 和 Home & Kitchen(K) 四個(gè)領(lǐng)域的所有評(píng)論(不包含2.1中的評(píng)論),去除中性評(píng)論(打分為0)。與文獻(xiàn)[16]相同,將每條評(píng)論的用戶打分作為該條評(píng)論的情感極性標(biāo)簽,打分為1分、2分的認(rèn)為其情感極性為負(fù)向,打分為4分、5分的為正向。對(duì)語料進(jìn)行預(yù)處理,去除標(biāo)點(diǎn)符號(hào)、將每個(gè)單詞轉(zhuǎn)化為小寫形式。分別從上述四個(gè)領(lǐng)域中抽取1萬條正向評(píng)論和1萬條負(fù)向評(píng)論。將其中三個(gè)領(lǐng)域作為源領(lǐng)域,余下的一個(gè)領(lǐng)域作為目標(biāo)領(lǐng)域進(jìn)行實(shí)驗(yàn),例如:將Books(B)、Movies & TV(D)、Electronics(E)三個(gè)領(lǐng)域共6萬條語料作為源領(lǐng)域訓(xùn)練語料,對(duì)本文提出的領(lǐng)域自適應(yīng)學(xué)習(xí)框架進(jìn)行模型訓(xùn)練,訓(xùn)練后的模型對(duì)Home & Kitchen(K)領(lǐng)域進(jìn)行預(yù)測(cè),此任務(wù)表示為BDE→K。由此,構(gòu)建了四組領(lǐng)域自適應(yīng)學(xué)習(xí)任務(wù)BDE→K、BDK→E、BEK→D、DEK→B。本文的實(shí)驗(yàn)評(píng)價(jià)標(biāo)準(zhǔn)為準(zhǔn)確率。在對(duì)多源領(lǐng)域進(jìn)行訓(xùn)練時(shí),訓(xùn)練集為5.4萬,驗(yàn)證集為0.6萬。由于卷積神經(jīng)網(wǎng)絡(luò)要求輸入序列為固定長度,因此本實(shí)驗(yàn)將每條評(píng)論組織為長度為100個(gè)單詞。若原評(píng)論長度超過100個(gè)單詞則截?cái)?,不?00個(gè)單詞時(shí)則將不足部分填充數(shù)字0。訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí)batch size設(shè)置為128,卷積核數(shù)量為250,卷積核窗口大小為5,卷積層邊界模式為same,激活函數(shù)為relu,最大池化長度為2,所有dropout都為0.1。第一個(gè)全連接層激活函數(shù)為relu,隱層單元數(shù)為250。第二個(gè)全連接層激活函數(shù)為sigmoid,隱層單元數(shù)為1。一共訓(xùn)練15輪。每輪訓(xùn)練都對(duì)數(shù)據(jù)重新shuffle。損失函數(shù)為binary cross-entropy,測(cè)試性能取決于最后一輪驗(yàn)證準(zhǔn)確率,實(shí)驗(yàn)結(jié)果如圖3所示。實(shí)驗(yàn)表明本文提出的多源領(lǐng)域自適應(yīng)情感極性自動(dòng)識(shí)別學(xué)習(xí)框架在四個(gè)任務(wù)都能很好的完成分類,平均準(zhǔn)確率達(dá)到了89.75%。該框架能夠從多個(gè)不同且相關(guān)的源領(lǐng)域自動(dòng)學(xué)習(xí)對(duì)分類任務(wù)有用的特征,無需手工構(gòu)造特征,模型可以廣泛的用來預(yù)測(cè)各種領(lǐng)域的商品評(píng)論情感極性,比較適合本文的任務(wù)。因此,本文采取該領(lǐng)域自適應(yīng)學(xué)習(xí)框架進(jìn)行2.1實(shí)驗(yàn)語料的情感極性自動(dòng)識(shí)別。情感極性一致性分值計(jì)算方法如1.2.1節(jié)所示。
2.4 聲譽(yù)度計(jì)算及結(jié)果分析
2.4.1 聲譽(yù)度計(jì)算
每位消費(fèi)評(píng)論者對(duì)其發(fā)表的商品評(píng)論與大眾的平均情感距離Ave(EDEi)、平均情感極性一致性分值A(chǔ)ve(PolarityScorePi)如表4第2、3列所示??梢钥闯觯楦芯嚯x與情感傾向性分值并沒有在同一個(gè)數(shù)據(jù)范圍。情感距離分值范圍介于[0.004 9,0.035 0],情感傾向性分值介于[0.314 8,1]。為了便于計(jì)算,采取與文獻(xiàn)[17]相同的方法將情感距離分值取值范圍按比例增加到和情感傾向性分值相同范圍,計(jì)算方法為
(3)
式中:min和max為x的原始最小值和最大值,minnew和maxnew為新的最小值和最大值。f(x)函數(shù)將x由原始的取值范圍按比例增加到新的取值范圍minnew和maxnew中。例如,按比例增加到新的取值范圍之后,消費(fèi)者Ron H的情感距離為
所有評(píng)論情感距離按比例增加后的結(jié)果如表4第4列所示。聲譽(yù)度得分Score計(jì)算方法如下:
Score=αAve(EDEi)+
(1-α)Ave(PolarityScorePi)
(4)
分?jǐn)?shù)越高代表聲譽(yù)度越高。其中α∈(0,1)為平衡Ave(EDEi)和Ave(PolarityScorePi的調(diào)解因子。本文邀請(qǐng)一些專家對(duì)α的經(jīng)驗(yàn)值進(jìn)行討論,最后給出α經(jīng)驗(yàn)值為0.4。最終聲譽(yù)度排名如表4第五列所示。表4中第6列列出了亞馬遜Reviewer ranking給出的排名,如:消費(fèi)者評(píng)論者GCM在Amazon.com網(wǎng)站上排名為第627 765名。第7列為其他用戶認(rèn)為該消費(fèi)者所發(fā)表的評(píng)論有用的票數(shù)以及總投票數(shù),第8列為該消費(fèi)者第一次發(fā)表評(píng)論的時(shí)間。
圖3 多源領(lǐng)域自適應(yīng)學(xué)習(xí)的情感極性自動(dòng)識(shí)別實(shí)驗(yàn)結(jié)果Fig.3 Results of sentiment polarity recognition based on multi-source domain adaptation
表4 情感距離、情感傾向一致性分值及聲譽(yù)度排名對(duì)比
2.4.2 結(jié)果分析
從表4可以看出,排名為第2~5名的消費(fèi)者排列順序與Reviewer ranking的排名相一致,這說明本文提出的方法具有一定的合理性。但是本文排名第1名的消費(fèi)者maewest64和排名第2名的消費(fèi)者GCM排名順序與Reviewer ranking不一致。從第一條評(píng)論發(fā)表時(shí)間來看,maewest64晚于其他消費(fèi)者,而且maewest64發(fā)表的其余15條評(píng)論全部集中在2013年和2014年。而Reviewer ranking排序機(jī)制考慮的因素之一為其他消費(fèi)者對(duì)該消費(fèi)者所發(fā)表的全部評(píng)論的“有用”性投票數(shù)量,考慮到評(píng)論的累積性,越是近期發(fā)表的評(píng)論得到關(guān)注的幾率越小,越容易出現(xiàn)零投票現(xiàn)象。因此,在Reviewer ranking中maewest64排名落后于GCM。而本文提出的聲譽(yù)度排序方法是從情感距離和情感極性一致性角度出發(fā),不依賴于其他用戶給出的有用性投票,因此能夠避免零投票現(xiàn)象帶來的機(jī)制失效所導(dǎo)致的排序不穩(wěn)定問題。
從消費(fèi)者maewest64和GCM已有的“有用投票/總票數(shù)”來看,這兩位消費(fèi)者發(fā)表的評(píng)論幾乎所有參與投票用戶都認(rèn)為是有用的,這也說明這兩位消費(fèi)者發(fā)表的評(píng)論得到了幾乎所有參與投票者的認(rèn)可,他們的評(píng)論質(zhì)量、客觀性也一定比較高,因此在本文提出的聲譽(yù)度排序中名次靠前。另外,由于經(jīng)驗(yàn)豐富的消費(fèi)者其評(píng)價(jià)更為客觀,而經(jīng)驗(yàn)較少的消費(fèi)者,常常對(duì)商品充滿幻想,當(dāng)商品與想象存在落差,會(huì)給出一些極端的評(píng)論。這兩位消費(fèi)者在Amazon.com上購買并評(píng)價(jià)過的商品數(shù)量皆多于其他消費(fèi)者,購物經(jīng)驗(yàn)較之其他消費(fèi)者更豐富,這也可能致使他們?cè)谠u(píng)價(jià)產(chǎn)品時(shí)更客觀,因此聲譽(yù)度排名更高。以上兩方面分析這也驗(yàn)證了認(rèn)同理論,高級(jí)別發(fā)帖者在發(fā)布平臺(tái)中的行為更積極,主要體現(xiàn)于發(fā)布更多、準(zhǔn)確性更高的信息。
1)本文根據(jù)消費(fèi)者對(duì)所購買商品的情感與大眾越一致,其評(píng)價(jià)方式越客觀,可信度越大,聲譽(yù)度越高這一常識(shí),采用自然語言處理技術(shù)和文本領(lǐng)域自適應(yīng)技術(shù)量化情感,衡量待評(píng)估聲譽(yù)度消費(fèi)者與大眾對(duì)同一產(chǎn)品的情感距離以及情感極性一致性,進(jìn)行了評(píng)論者聲譽(yù)度方法研究。
2)實(shí)驗(yàn)結(jié)果表明,該方法與亞馬遜Reviewer ranking排名大體相一致,具有一定的合理性。而該方法不依賴其他用戶給出的有用性投票,可以有效避免零投票導(dǎo)致的聲譽(yù)度評(píng)估失效問題。
3)本文提出的方法為評(píng)論信息質(zhì)量研究、評(píng)論文本有效性研究以及改善電商平臺(tái)信用評(píng)價(jià)機(jī)制提供了定量分析的新思路。
下一步工作會(huì)考慮加入更多聲譽(yù)度相關(guān)特征,如評(píng)論者是否實(shí)名等,從而進(jìn)一步提高聲譽(yù)度分析的評(píng)估能力。
[1]楊曉梅.基于C2C電子商務(wù)網(wǎng)站的聲譽(yù)評(píng)價(jià)機(jī)制研究[J]. 山西大學(xué)學(xué)報(bào):哲學(xué)社會(huì)科學(xué)版, 2009(2): 116-120.
YANG Xiaomei.Research on the reputation mechanism of the C2C-based E-commerce sites[J]. Journal of Shanxi University: Philosophy & Social Science, 2009(2): 116-120.
[2]SUSSMAN S W, SIEGAL W S. Informational influence in organizations: an integrated approach to knowledge adoption[J]. Information systems research, 2003, 14(1): 47-65.
[3]郭國慶,陳凱,何飛.消費(fèi)者在線評(píng)論可信度的影響因素研究[J]. 當(dāng)代經(jīng)濟(jì)管理, 2010, 10: 17-23.
GUO Guoqing, CHEN Kai, HE Fei.An empirical study on the influence of perceived credibility of online consumer reviews[J]. Contemporary economy & management, 2010, 10: 17-23.
[4]邵婷,林建宗.B2C平臺(tái)買家誠信約束機(jī)制探析[J]. 廈門理工學(xué)院學(xué)報(bào), 2013, 04: 83-86.
SHAO Ting, LIN Jianzong.Buyers′ trust constraint on B2C platform: a case study on Tmall[J]. Journal of Xiamen University of Technology, 2013, 04: 83-86.
[5]孟搖歡.大眾傳播心理距離的嬗變[D].長春:吉林大學(xué), 2011: 7-8.
MENG Yaohuan.Evolution of psychological distance in mass communication[D]. Changchun: Jilin University, 2011: 7-8.
[6]BACCIANELLA S, ESULI A, SEBASTIANI F. SentiWordNet 3.0: an enhanced lexical resource for sentiment analysis and opinion mining[C]//Proceeding of the 7thInternational Conference on Language Resources and Evaluation, Malta, 2010(10): 2200-2204.
[7]LESK M. Automatic sense disambiguation using machine readable dictionaries: how to tell a pine cone from an ice cream cone[C]//Proceeding of the 5thAnnual International Conference on Systems Documentation, Canada, 1986: 24-26.
[8]LE Q V, MIKOLOV T. Distributed representations of sentences and documents[C]//Proceeding of the 31thInternational Conference on Machine Learning, China, 2014(14): 1188-1196.
[9]BLITZER J, Mcdonald R, PEREIRA F. Domain adaptation with structural correspondence learning[C]//Proceeding of the 2006 Conference on Empirical Methods in Natural Language Processing, Australia, 2006: 120-128.
[10]PAN S J, NI X, SUN J T, et al. Cross-domain sentiment classification via spectral feature alignment[C]//Proceeding of the 19thInternational Conference on World Wide Web, USA, 2010: 751-760.
[11]PAN J, HU X, LI P, et al. Domain adaptation via multi-layer transfer learning[J]. Neurocomputing, 2016, 190: 10-24.
[12]DING X, LIU T, DUAN J, et al. Mining user consumption intention from social media using domain adaptive convolutional neural network[C]//Proceeding of the 29thAAAI Conference on Artificial Intelligence, USA, 2015: 2389-2395.
[13]MIKOLOV T, SUTSKEVER I, CHEN K, et al. Distributed representations of words and phrases and their compositionality[C]//Proceeding of Advances in Neural Information Processing Systems, USA, 2013: 3111-3119.
[14]MCAULEY J, PANDEY R, LESKOVEC J. Inferring networks of substitutable and complementary products[C]//Proceeding of the 21thACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Australia, 2015: 785-794.
[15]REHUREK R, SOJKA P. Software framework for topic modeling with large corpora[C]//Proceeding of the LREC 2010 Workshop on New Challenges for NLP Frameworks, Malta, 2010: 45-50.
[16]KOTZIAS D, DENIL M, De FREITAS N, et al. From group to individual labels using deep features[C]//Proceeding of the 21thACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Australia, 2015: 597-606.
[17]HU N, KOH N, REDDY S. Rating lead you to the product, reviews help you clinch it? the mediating role of online review sentiments on product sales[J]. Decision support system, 2014, 57: 42-53.
本文引用格式:
魏曉聰,林鴻飛,楊亮. 基于情感距離和領(lǐng)域自適應(yīng)的評(píng)論者聲譽(yù)度[J]. 哈爾濱工程大學(xué)學(xué)報(bào), 2017, 38(6): 907-913.
WEI Xiaocong, LIN Hongfei, YANG Liang. Reviewer reputation based on emotion distance and self-adaption[J]. Journal of Harbin Engineering University, 2017, 38(6): 903-917.
Reviewer reputation based on emotion distance and self-adaption
WEI Xiaocong1,2, LIN Hongfei1, YANG Liang1
(1.School of Computer Science and Technology, Dalian University of Technology, Dalian 116024, China; 2.School of Software Engineering, Dalian University of Foreign Languages, Dalian 116044, China)
In order to evaluate a reviewer′s reputation effectively from his or her written reviews, we propose a method for evaluating reviewer reputation based on emotional distance and domain self-adaption. By calculating the emotional distance and the consistency of emotional tendency between the reviews written by the target reviewer and those by other reviewers, the review objectivity and the emotional consistency between the target reviewer and the public are measured. Finally, by using product reviews on Amazon.com as the experimental data, we compare the results of the proposed method with the sequencing results of the Amazon Reviewer ranking to show the rationality of the method. The proposed method would be of great significance to research on text effectiveness and regularizing the behavior of consumers on e-commerce platforms.
product review; reputation; reviewer; emotion distance; sentiment orientation consistency; domain self-adaption
2016-04-26. 網(wǎng)絡(luò)出版日期:2017-03-30.
國家自然科學(xué)基金項(xiàng)目(61572102,61562080); 大連外國語大學(xué)科研基金項(xiàng)目(2014XJQN14).
魏曉聰(1982-), 女, 講師,博士研究生; 林鴻飛(1962-), 男, 教授,博士生導(dǎo)師.
魏曉聰,E-mail:weixiaocong@dlufl.edu.cn.
10.11990/jheu.201604078
http://www.cnki.net/kcms/detail/23.1390.u.20170330.1503.022.html
TP391
A
1006-7043(2017)06-0907-07