崔永生
摘 要:目前各大電子商務網(wǎng)站每天都產(chǎn)生大量的在線評論,電商企業(yè)面對數(shù)量巨大的在線評論,能夠快速地找到消費者所關注商品或服務的評價信息,了解消費者真正的購物需求,存在一定的難度。在線評論文本內(nèi)容是能夠表達買家對所購商品質(zhì)量、電商企業(yè)服務、快遞物流服務等詳實的感受或體驗的部分,反映出消費者對購買全過程的滿意度。本文通過對在線評論文本挖掘的研究,設計基于語義詞典的評論商品屬性<特征詞、觀點詞>對抽取方法和在線評論情感極性及強度計算方法,可以幫助電商企業(yè)準確而快速地挖掘出在線評論文本中消費者感知有用性商品評價信息,進而改進企業(yè)產(chǎn)品或服務質(zhì)量,幫助商家有效地制定精準營銷服務策略。
關鍵詞:在線評論 文本挖掘 情感分析 語義詞典
中圖分類號:F724.6 文獻標識碼:A 文章編號:2096-0298(2018)11(c)-017-07
1 引言
在線評論文本數(shù)據(jù)是一種非結構化或半結構化數(shù)據(jù),數(shù)據(jù)中蘊藏著豐富的價值。在線評論文本數(shù)據(jù)中的高價值信息,對潛在消費者的感知、購買決策行為具有重要影響,進而對電商平臺和生產(chǎn)企業(yè)產(chǎn)品銷量產(chǎn)生重要影響。在線評論文本挖掘目前受到了學術界專家學者普遍關注,已經(jīng)成為研究和企業(yè)實踐的一大熱點。
針對在線評論文本數(shù)據(jù)的非結構化數(shù)據(jù)特征,在線評論文本挖掘目前普遍采用文本數(shù)據(jù)挖掘技術和自然語言處理等技術,對在線評論文本半結構化和非結構化數(shù)據(jù)進行挖掘。主要任務包括評論產(chǎn)品屬性特征提取、在線評論情感分析及在線評論文本分類。所以目前在線評論文本挖掘的研究也主要集中在這三個方面的實現(xiàn)技術手段和實際商業(yè)應用研究。
基于在線評論的客戶細分應用研究。蔡淑琴等(2015)[1]構建了在線評論文本挖掘客戶偏好模型,使用數(shù)據(jù)挖掘中的兩階段聚類方法展開客戶細分的實證研究。首先,通過在線評論文本中的同義詞特征識別和抽取方法提取客戶偏好特征向量,然后基于產(chǎn)品屬性結構細粒度的客戶偏好向量計算客戶偏好,最后利用C均值聚類方法對客戶依據(jù)偏好值進行細分。
在線評論文本挖掘也常用于企業(yè)產(chǎn)品定價的研究。郭愷強等(2014)[2]基于消費者效用理論,構建了在線評論文本挖掘的產(chǎn)品銷售兩階段定價模型。劉洋等(2014)[3]通過在線評論文本挖掘,選擇用戶風險規(guī)避程度與在線評論數(shù)量作為關鍵指標,研究了在線評論對應用軟件產(chǎn)品及基于平臺的軟件開發(fā)者定價策略的影響。
在線評論文本挖掘用于電商企業(yè)網(wǎng)絡口碑預警系統(tǒng)研發(fā)的研究。李金海等(2015)[4]運用在線評論文本挖掘方法,針對電商企業(yè)目前所面臨的網(wǎng)絡口碑危害問題,提出并構建了基于在線評論文本挖掘的網(wǎng)絡口碑危機預警模型。該模型使用了大數(shù)據(jù)并行處理技術MapReduce來完成在線評論產(chǎn)品屬性挖掘,并使用情感模糊隸屬函數(shù)進行在線評論情感分析,進而獲得企業(yè)網(wǎng)絡口碑目前現(xiàn)狀及未來走勢,最后采用人工智能信息處理方法完成企業(yè)網(wǎng)絡口碑的評估以達到系統(tǒng)預警目標。
在線評論文本內(nèi)容不僅包含了消費者購物滿意度信息,而且還包含其對新產(chǎn)品或服務的接納度和期望信息,所以通過在線評論文本挖掘可以分析確定新產(chǎn)品升級策略。龔艷萍和梁樹霖(2014)[5]基于精確似然ELM理論構建了在線評論雙重選擇路徑模型,通過產(chǎn)品特征提取來考察消費者對新產(chǎn)品接納度。實證結果表明,正向在線評論、客觀事實在線評論、在線評論內(nèi)容質(zhì)量對消費者的新產(chǎn)品感知有用性具有正向影響,進而顯著影響新產(chǎn)品的接納度。Lee和Yang(2015)[6]以亞馬遜網(wǎng)站為實例,采集143條產(chǎn)品在線評論。通過在線評論文本挖掘后發(fā)現(xiàn),在線評論感知有用性對新產(chǎn)品接納度具有積極影響,在線評論的情感極性對新產(chǎn)品接納度具有負向影響,標題吸引力在在線評論情感極性對新產(chǎn)品接納度的影響上具有顯著調(diào)節(jié)作用。張璐等(2015)[7]采集小米品牌手機在線評論樣本數(shù)據(jù),通過產(chǎn)品屬性特征提取,分析在線評論內(nèi)容中產(chǎn)品屬性特征與產(chǎn)品升級和質(zhì)量改進的關系。實證研究發(fā)現(xiàn),在線評論中消費者對產(chǎn)品的客觀評價變化與產(chǎn)品改進方向和改進程度具有強關聯(lián)性,電商企業(yè)可以依據(jù)消費者對產(chǎn)品的客觀評價決定新產(chǎn)品升級和改進的內(nèi)容和方向。
通過在線評論文本挖掘可以分析消費者對在線評論的響應程度并進行管理。Gu和Ye(2013)[8]以攜程網(wǎng)酒店在線評論樣本數(shù)據(jù)進行在線評論挖掘管理響應實證研究,結果發(fā)現(xiàn)管理響應對低滿意度客戶具有顯著影響而對其他類型客戶作用不顯著。低滿意度客戶如果收到管理響應,其將來滿意度會隨之增加;如果沒收到管理響應,會降低其對酒店將來的預期。Liu等(2014)[9]通過在線評論文本挖掘的實證研究發(fā)現(xiàn)高星級酒店更樂于接受響應管理;通過在線評論文本挖掘酒店響應率指標,發(fā)現(xiàn)星級不同的酒店響應管理并沒有表現(xiàn)出顯著的不同;具有針對性的響應管理對酒店評級具有正向影響作用。Xie等(2014)[10]采集843家酒店在線評論和管理響應面板數(shù)據(jù),通過在線評論文本挖掘發(fā)現(xiàn),評論效價、購買價值和位置及清潔度評分、在線評論方差及在線評論數(shù)量、管理響應數(shù)量與酒店業(yè)績具有顯著相關性,管理響應及在線評論方差在評論效價對酒店業(yè)績的影響作用上具有調(diào)節(jié)效應。
就目前已有在線評論文本挖掘研究成果來看,在線評論文本挖掘所用語料大部分是英語,所以針對中文在線評論文本挖掘的研究還不多見。Fong和Burton[11]在對比中國和美國的消費者在線口碑傳播行為的研究發(fā)現(xiàn),由于中國消費者和美國消費者在個人文化背景、網(wǎng)購自信程度及消費市場特征方面的差異,在線評論對中國消費者的影響程度遠遠高于美國的消費者,而且中國在線消費市場規(guī)模巨大。因此,有針對性的研究中國消費者在線評論對企業(yè)產(chǎn)品績效影響作用,將具有重要的理論和實踐意義。
在線評論文本挖掘研究目前存在的不足表現(xiàn)在以下幾個方面。
首先,中文在線評論語言特征不規(guī)范,采用主題分類法會導致分詞錯誤,嚴重影響情感分類效果。
其次,使用監(jiān)督學習方法進行在線評論文本情感分類,需要人工建立大規(guī)模的訓練語料集,才能獲得較好的分類效果,而這對中文在線評論語料顯然不現(xiàn)實。因此,從語義角度來研究中文在線評論情感分類才具有現(xiàn)實意義。
最后,在線評論情感分類處理最重要的處理環(huán)節(jié)是能夠自動處理并區(qū)分主、客觀文本信息,就目前已有研究成果來看,這方面研究還比較缺乏,需要進一步的理論探索和研究。
綜上所述,目前國內(nèi)外學者對中文在線評論文本挖掘研究并不多見,特別是對基于語義詞典的在線評論文本挖掘方法還沒有形成一個系統(tǒng)的研究體系。
2 研究框架和設計思路
在線評論文本挖掘就是對在線評論的文本內(nèi)容進行特征分類挖掘,它的過程遵循文本挖掘通用的幾個步驟。本文借鑒文獻[12]將在線評論句的結構化單元劃分成三個層次:最上層為在線評論對象;中間層為在線評論對象的屬性特征;最底層為屬性特征的情感表示。在線評論的商品屬性特征詞的抽取和與情感分析的具體流程如下。
(1)收集在線評論語料集,對語料數(shù)據(jù)集預處理。過程通常包括文本挖掘技術中的分詞、刪除停用詞、詞性標注等步驟,對語句中使用頻率高的單詞還需進行詞頻統(tǒng)計。
(2)篩選在線評論主題句,屬性特征詞集和<特征詞,觀點詞>對抽取,這一步驟對應的是文本挖掘的特征選擇和特征抽取部分,針對抽取的特征詞重要程度的差異,引入屬性特征詞權重因子。常見的權重因子計算法包括布爾權重法、基于熵的權重法、特征頻率法和TF-IDF法等,本文選擇TF-IDF方法來計算特征詞權重因子。
(3)基于情感詞典模型,依據(jù)抽取后的<特征詞,觀點詞>對,對在線評論文本集情感極性量化計算。
(4)根據(jù)計算出的情感量化分值來確定每條在線評論的情感傾向,選擇準確度(Accuracy)和F度量指標來評價算法的性能。
本文基于語義詞典的在線評論文本挖掘流程,如圖1所示。
3 在線評論商品屬性的特征抽取
3.1 特征詞和觀點詞的范圍界定
本文依據(jù)本體論的原理,將表征商品內(nèi)部屬性和外部屬性的詞條統(tǒng)一定義為商品屬性特征詞。建立商品屬性特征本體機構,以手機商品為例,手機屬性特征本體結構(部分)如圖2所示,圖中“手機”為商品屬性特征本體結構根節(jié)點,“顏色”“樣式”“價格”為手機屬性的特征詞,同時作為手機根節(jié)點的子節(jié)點,“鮮艷”與“時尚”“便宜”為描述手機屬性特征的觀點詞,由手機屬性特征詞和觀點詞共同構成本體結構樹。
3.2 在線評論文本集的預處理
在篩選在線評論主題句,商品屬性<特征詞,觀點詞>對抽取之前,需要將在線評論語料集進行特征表示并格式化為標準格式,剔除數(shù)據(jù)噪聲,為后續(xù)的特征選擇和<特征詞,觀點詞>對抽取作好準備。對于在線評論語料中的數(shù)字及特殊符號,可以采用統(tǒng)一轉(zhuǎn)換成易識別的符號或空格,然后依據(jù)停用詞詞典或詞匯表將停用詞或稀有詞從語料中清除,預處理具體包括以下步驟。
(1)分詞。
分詞即將在線評論中的句子按照特定的算法分成獨立的單詞的過程。針對中文的分詞,本文使用中科院的中文分詞軟件ICTCLAS,它不僅可以進行詞性標注,而且可以加入分詞詞典,所以對詞語糾錯同時方便加入領域詞,進而提高分詞準確性。
(2)停用詞和稀有詞處理。
稀有詞是指在文本中使用頻率不高,對文本特征表示沒有價值而應該刪除的詞條。對于這類詞的處理一般采用預先設置詞頻閥值,經(jīng)統(tǒng)計詞條使用頻后,如果低于閥值就刪除該詞條。停用詞是指目前在某一行業(yè)領域已經(jīng)不在使用的詞條。對于這類詞的刪除,可以基于已有的停用詞詞典,如果特殊需要可以手動建立詞典。
(3)詞條歸并。
在文本中存在許多同義詞或近義詞,為了降低這些語義重復的詞條,需要將這類詞進行合并處理,提高分類的準確性。中文中“價位”“價錢”“價位”就是同義詞。
3.3 文本特征選擇與特征加權
在使用詞袋法表示文本特征時,特征向量會膨脹達到幾萬維甚至于幾十萬維,即使經(jīng)過文本預處理,還會有很多的特征向量留下。所以在文本的特征抽取時,對高維特征詞降維處理至關重要。文本特征抽取和特征選擇是文本高維特征降維的兩個常用方法,本文將運用文本特征選擇的方法實現(xiàn)在線評論文本高維特征降維。
本文采用互信息(PMI)的方法抽取在線評論互信息高的名詞或名詞性短語來選取為選產(chǎn)品屬性特征,互信息的計算公式為式(1):
其中Wi表示該特征詞在文本集中的權重,等于特征詞詞頻TF與逆向文檔頻率IDF之積。
3.4 在線評論文本中<特征詞,觀點詞>對的抽取
在線評論語句中的商品屬性特征詞通常以名詞形式的形式出現(xiàn),例如“外觀”“性價比”“價位”等,所以一般將語料分詞后經(jīng)詞性標注所得到名詞作為候選商品屬性特征詞。將抽取到在線評論語句中表達消費者對商品屬性特征的評價和情緒的詞語,一般為形容詞和動詞,本文統(tǒng)稱為觀點詞,并以<特征詞,觀點詞>對的形式進行抽取,這主要是考慮觀點詞的傾向性主要依賴于商品的屬性特征,更能表達消費者對商品屬性特征的感受。
<特征詞,觀點詞>對抽取的過程為以下幾點。
(1)對照商品屬性詞典里的特征詞,逐一搜索在線評論語句集中的每一語句,將匹配的特征詞從語句中抽取出來,保存在指定的特征詞文件里。
(2)累計每個在線評論句中所抽取出的特征詞數(shù)量,如果結果為1,則將該語句標識為簡單在線評論句;如果結果大于1,則將該語句標識為復雜在線評論句。
(3)對標識為復雜在線評論句重復步驟1和步驟2的操作,直到所有復雜在線評論句都被切分成簡單在線評論句為止。
(4)將簡單評價句中的所有形容詞和動詞抽取出來作為該在線評論句的候選觀點詞,并加入和保存到指定的<特征詞,觀點詞>對文件中。對抽取的特征詞和觀點詞的關聯(lián)度進行評估,設定關聯(lián)度閥值,低于閥值的<特征詞,觀點詞>對將被從文件中刪除。對篩查后的<特征詞,觀點詞>對還需人工檢查,剔除無關聯(lián)或關聯(lián)不大的<特征詞,觀點詞>對,最終保留在文件中的<特征詞,觀點詞>對集作為詞典為在線評論情感分析提供支持。
4 在線評論文本情感極性量化
基于語義詞典的在線評論情感極性量化分析是從語言學的角度來展開問題研究的方法,該方法的核心是語義詞匯的分類規(guī)則。它借助于詞匯間的同義關系或反義關系,通過一定的算法準則計算出詞匯間的語義距離,得到詞匯語義間的情感極性及強度。目前已有研究普遍采用的語義詞典:英文常見有Word Net、Frame Net等,中文常見有 How Net(《知網(wǎng)》)《同義詞詞林》等。
本文利用Turney(2002)[13]提出的計算在線評論情感傾向的方法,計算情感詞和基準情感詞的距離。PMI-IR算法計算公式如式(5):
對照連詞詞典進行匹配標注,具體規(guī)則如下。
轉(zhuǎn)折連詞:在線評論語句中出現(xiàn)轉(zhuǎn)折連詞,連詞后面的語句則發(fā)生語義轉(zhuǎn)折,“前面正向,后面負向,則在線評論句情感極性為負向”;“前面負向,后面正向,則在線評論句情感極性為正向”。
遞進連詞:在線評論中出現(xiàn)遞進連詞,如英文中的“even、more、also等”,中文為“況且、不如、并”等,連詞后面所表達的情感極性得到增強。
5 文本挖掘有效性實證分析
5.1 在線評論語料的來源
本文收集的在線評論主要來自亞馬遜網(wǎng)站、京東網(wǎng)站兩個大型知名的B2C電商網(wǎng)站的買家。采用網(wǎng)絡爬蟲軟件分別抓取亞馬遜中國、京東網(wǎng)站上的手機商品評論記錄。
5.2 數(shù)據(jù)的采集過程及數(shù)據(jù)清洗
本文選取亞馬遜中國、京東熱銷的12個知名品牌手機產(chǎn)品,采集在線用戶評論文本作為挖掘原始數(shù)據(jù),具體的步驟如下。
(1)對比研究兩大購物網(wǎng)站在線評論系統(tǒng)設置的異同,確定在線評論文本數(shù)據(jù)的采集格式、方法及工具的選用,本文將選用網(wǎng)絡爬蟲工具軟件八爪魚采集器V7.0作為評論數(shù)據(jù)采集工具。
(2)利用八爪魚工具軟件編輯器,采集數(shù)據(jù)范圍包括手機商品評價頁面信息(評論者用戶名、評論效價、評論題目、上傳圖片、評論發(fā)布時間等)及評論文本。
(3)數(shù)據(jù)收集的時間為2017年2月—2017年12月,共采集45892條評論記錄。
(4)對所得到的數(shù)據(jù)進行清洗,刪除同一用戶的重復評論后,對數(shù)據(jù)進行進一步篩選、整理和剔除沒有任何購物評價意義的在線評論,余下2842條在線評論,只保留評論標識ID和評論內(nèi)容作為挖掘?qū)ο?,將保留評論信息合并保存為手機評論.xls。
5.3 在線評論樣本的統(tǒng)計描述
本文整理評論語料集如表2所示,其中京東網(wǎng)站采集各類品牌手機評論文本1542條,亞馬遜中國網(wǎng)站評論文本1300條。通過手工標注整理京東正面評論871條,負面評論671條,亞馬遜正面評論500條,負面評論800條,作為后面的文本挖掘分類評價基準。
本文依據(jù)TFIDF特征選擇算法抽取的手機評論屬性特征詞(部分)如表3所示。
5.4 評價指標
本文采用通用的文本分類效果評價指標:全局查準率(accuracy)、查準率(precision)及查全率(recall)。文本分類效果評估通常使用二項分類列聯(lián)表(Contingency Table),表4為一個二項分類問題的列聯(lián)表。
5.5 <特征詞,觀點詞>對的抽取及情感強度計算結果
本文將程度副詞細分成6個級別,各級別權重系數(shù)依次設置為2、1.5、1.25、1.2、0.2、0.8、0.5,如果購物評價中不含程度副詞,則設置為1,否定詞、轉(zhuǎn)折連詞系數(shù)設置為-1。選擇知網(wǎng)(HowNet)和臺灣NTUSD情感詞典作為情感詞參照詞庫,如表5所示。
評論語料集經(jīng)過數(shù)據(jù)清洗,預處理和主觀句的對的抽取,經(jīng)情感極性量化及強度計算后,整理得到示例(部分)如表6所示。
采用3折交叉驗證方式,本文研究方法對比傳統(tǒng)的分類方法(決策樹、貝葉斯、SVM)進行了評價效果實驗,分別取評論句500條、1000條、1500條、2000條進行4次測試,準確率(accuracy)如表7所示,F(xiàn)-measure如表8所示。
依據(jù)全部輸入評論句集及在表3中整理出的手機屬性特征類,對消費者購物評價的情感極性分類計算,所得產(chǎn)品特征屬性類的抽取結果,如圖3所示。
由表7和表8可以看見,相比于傳統(tǒng)的機器學習的分類方法,本文研究方法分類效果良好。以評論句2000條為例,決策樹全局查準率(accuracy)和F1分別為91.28%、87.18%,貝葉斯為93.34%、87.23%、SVM為95.67%、91.34%、而本文研究方法達到97.21%、95.32%,明顯高于其他3種方法,這與各種詞典的詞匯準確性相關。
由圖3看出,消費者關注手機產(chǎn)品的性能情感程度明顯高于其他方面,其次是手機的配件,外觀和功效,通過特征類的情感對比,可以清楚地了解消費者的購物感受。
6 結語
本文設計了基于語義詞典的在線評論文本挖掘方法,對在線評論文本內(nèi)容進行特征分類挖掘。在線評論文本挖掘有效性實證分析結果發(fā)現(xiàn),基于語義詞典,運用細粒度的<特征詞,觀點詞>對抽取方法,可以理想地挖掘出在線評論文本中消費者購物評價信息,并實現(xiàn)情感極性量化和強度計算。采用此方法比其他的傳統(tǒng)的方法具有優(yōu)良的分類準確率。通過本文設計的在線評論文本挖掘方法,可以抽取在線評論文本內(nèi)容中的商品屬性特征好評度指標,提高了在線評論文本特征詞分類準確性。基于語義詞典的在線評論文本挖掘方法的研究,為從語義角度來研究中文在線評論情感分類相關研究提供了一個全新的視角。
參考文獻
[1] 蔡淑琴,蔣士淼,G D OLLE OLLE,等.基于在線客戶在線評論的客戶細分研究[J].管理學報,2015(7).
[2] 郭愷強,王洪偉,鄭晗.基于在線評論的網(wǎng)絡零售定價模型研究[J].商業(yè)經(jīng)濟與管理,2014(4).
[3] 劉洋,廖貅武,劉瑩.在線評論對應用軟件及平臺定價策略的影響[J].系統(tǒng)工程學報,2014(4).
[4] 李金海,何有世,馬云蕾,等.大數(shù)據(jù)時代基于在線評論挖掘的企業(yè)網(wǎng)絡口碑危機預警研究[J].情報雜志,2015(2).
[5] 龔艷萍,梁樹霖.在線評論對新技術產(chǎn)品消費者采用意愿的影響研究——基于ELM視角[J].軟科學,2014(2).
[6] Lee K Y,Yang S B.The role of online product reviews on information adoption of new product development professionals[J].Internet Research,2015,25(3).
[7] 張璐,吳菲菲,黃魯成.基于用戶網(wǎng)絡在線評論信息的產(chǎn)品創(chuàng)新研究[J].軟科學,2015(5).
[8] Gu B.,Ye Q.First Step in Social Media:Measuring the Influence of Online Management Responses on Customer Satisfaction[J].Production and Operations Management Society,2013.
[9] Liu X W,Schuckert M,Law R.Can Response Management Benefit Hotels?Evidence from Hong Kong Hotels[J].Journal of Travel & Tourism Marketing,2014,32(8).
[10] Xie K L,Zhang Z,Zhang Z.The business value of online consumer reviews and management response to hotel performance[J].International Journal of Hospitality Management,2014(43).
[11] J.Fong,S.Burton. Electronic Word of Mouth:A Comparison of Stated and Revealed Behavior on Electronic Discussion Boards[J].Journal of Interactive Advertising,2006,6(2).
[12] 李慧,柴亞青.基于屬性特征的在線評論文本情感極性量化分析[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2017,1(10).
[13] Turney P D.Thumbs up or thumbs down?:semantic orientation applied to unsupervised classification of reviews[C].Meeting on Association for Computational Linguistics.Association for Computational Linguistics,2002.
[14] 藺璜,郭姝慧.程度副詞的特點范圍與分類[J].山西大學學報(哲學社會科學版),2003,26(2).