• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于評論的商品改進需求獲取方法研究

      2017-05-13 03:48:04吳東勝王忠群蔣勝皇蘇斌
      關(guān)鍵詞:修飾詞句法基準

      吳東勝,王忠群,蔣勝,皇蘇斌

      (安徽工程大學(xué)管理工程學(xué)院,安徽 蕪湖 241000)

      基于評論的商品改進需求獲取方法研究

      吳東勝,王忠群,蔣勝,皇蘇斌

      (安徽工程大學(xué)管理工程學(xué)院,安徽 蕪湖 241000)

      基于在線商品評論文本中產(chǎn)品特征與觀點詞的句法依存關(guān)系,綜合關(guān)注度與觀點值以及特征修飾詞并考慮相關(guān)副詞對觀點詞的影響,提出了一種結(jié)合用戶的關(guān)注度和觀點值以及特征修飾詞來獲取商品改進需求的方法。研究表明,該方法能夠較好地獲取商品的改進需求,可以為企業(yè)提供產(chǎn)品設(shè)計改進的方向。

      在線商品評論;商品改進需求;產(chǎn)品特征

      隨著在線購物成為人們的一種常見的消費方式,在線商品評論已經(jīng)成為商家或者企業(yè)進行商品改進的信息重要來源。相對傳統(tǒng)商品改進需求獲取方式,網(wǎng)絡(luò)作為一個相對比較自由、寬松的環(huán)境,更能激發(fā)用戶對商品改進的表達欲望。商品改進需求的挖掘不但能夠幫助企業(yè)改進產(chǎn)品提升用戶的滿意度,而且還能為企業(yè)未來新產(chǎn)品的設(shè)計、研發(fā)提供一個明確的方向。

      在評論有用性的研究方面, Hu等[1]首先將基于關(guān)聯(lián)規(guī)則的Apriori算法應(yīng)用于英文產(chǎn)品評論的特征提取。由于中英文在文化、語言結(jié)構(gòu)以及語法上的差異,導(dǎo)致很多針對英文評論的研究無法應(yīng)用在中文評論中,在此基礎(chǔ)上,李實等[2]針對中文語言的相關(guān)特點,提出了中文網(wǎng)絡(luò)評論的特征提取方法;在面向篇章層級的情感分析中,徐芳平[3]利用Apriori的算法對在線評論進行產(chǎn)品屬性提取,再利用模糊的方法計算出各屬性的評價值,最后分析得到產(chǎn)品的改進需求,從而輔助產(chǎn)品進行再設(shè)計;姜巍等[4]提出了一種面向用戶需求的評論有用性分析方法,該方法采用復(fù)雜網(wǎng)絡(luò)的相關(guān)知識;采用本體和條件隨機場融合的特征提取方法并結(jié)合情感分析技術(shù);崔建苓等[5]提出了一種RERM的需求獲取方法,并通過實驗驗證了該方法能夠有效提升需求獲取的效率。

      事實上,商品的改進需求獲取并非僅僅依靠用戶對其的情感傾向(觀點值)——即情感傾向呈貶義的產(chǎn)品特征越有可能成為商品的改進需求,還應(yīng)考慮用戶的關(guān)注度,即關(guān)注度大且情感傾向呈貶義的產(chǎn)品特征才是商品最需要改進的。為此,筆者基于產(chǎn)品特征與觀點詞的句法依存關(guān)系,綜合關(guān)注度與觀點值以及特征修飾詞并考慮相關(guān)副詞對觀點詞的影響[6],提出了一種獲取商品改進需求的方法。

      1 商品改進需求獲取方法

      商品改進需求獲取方法框架主要包括數(shù)據(jù)預(yù)處理、結(jié)合用戶關(guān)注度與觀點值的改進需求獲取、結(jié)合特征修飾詞的改進需求獲取等部分,如圖1所示。

      1.1 數(shù)據(jù)預(yù)處理

      1)數(shù)據(jù)收集與清洗 剔除評論中一些無關(guān)的信息(如廣告等),對同一用戶多次重復(fù)的評論進行刪除。另外,對產(chǎn)品評論中包括一些網(wǎng)絡(luò)用語人工將其轉(zhuǎn)化為通俗易懂的文字,如“稀飯”轉(zhuǎn)化為“喜歡”等。

      2)分詞、詞性標注以及句法依存分析 使用哈爾濱工業(yè)大學(xué)社會計算與信息檢索研究中心所提供的語言處理平臺(LTP)對評論進行分詞、詞性標注以及句法依存分析,結(jié)果以XML文件的形式進行存儲。

      圖1 商品改進需求獲取方法框架

      1.2 結(jié)合用戶關(guān)注度與觀點值的改進需求獲取

      圖2 評論“手感還行,像素一般,充電非???。”的句法依存分析視圖

      1)產(chǎn)品特征詞與觀點詞識別 在對商品評論進行句法依存分析的基礎(chǔ)上,會發(fā)現(xiàn)在線商品的特征詞與觀點詞之間存在著一定的句法關(guān)系。

      例如,評論“手感還行,像素一般,充電非常快?!痹撛u論的句法依存分析視圖如圖2所示,各種分詞標識符代表的含義如表1所示。

      表1 分詞標識符號說明

      根據(jù)上述視圖的分析可以構(gòu)建相應(yīng)的識別規(guī)則:

      規(guī)則1 一個單句中滿足SBV(主謂關(guān)系)、CMP(動補關(guān)系)或者ATT(定中關(guān)系)依存結(jié)構(gòu)關(guān)系,那么句中對應(yīng)的名詞(或動名詞)或動詞為候選特征詞,對應(yīng)的形容詞為觀點詞。

      對上述識別出的產(chǎn)品特征詞利用《同義詞詞林擴展版》的層級結(jié)構(gòu)可以獲取候選特征詞之間的同義關(guān)系并對其進行相應(yīng)的聚類合并,對于同一主題下的產(chǎn)品特征統(tǒng)計出所有觀點詞的數(shù)量,以觀點詞的數(shù)量作為用戶對該產(chǎn)品特征的關(guān)注度,形成<產(chǎn)品特征,觀點詞,關(guān)注值>三元組的形式。

      2)觀點詞的相關(guān)修飾詞識別 對于在線商品評論中觀點詞相關(guān)修飾詞的識別仍然利用句法依存關(guān)系,如評論“外觀很漂亮,但拍照不清楚?!钡木浞ㄒ来娣治鲆晥D如圖3所示。

      類似構(gòu)建規(guī)則如下:

      規(guī)則2 一個單句中滿足ADV(狀中關(guān)系)依存結(jié)構(gòu)關(guān)系,那么句中對應(yīng)的副詞為觀點詞的修飾詞。

      圖3 評論“外觀很漂亮,但拍照不清楚?!钡木浞ㄒ来娣治鲆晥D

      3)觀點詞的褒貶程度計算 觀點詞的褒貶程度是由觀點詞與一些褒貶程度十分明顯的基準詞之間的緊密關(guān)系決定的,與褒義基準詞相似度越大,詞匯越具有褒義傾向,反之具有貶義傾向??梢允孪冗x取好k對具有代表性的基準詞(其中k個褒義詞,k個貶義詞),然后利用改進的基于知網(wǎng)的詞匯褒貶計算公式計算出詞匯的褒貶程度。具體計算公式如下:

      (1)

      式中,k表示k對基準詞,每對基準詞包括一個褒義詞和一個貶義詞,褒義基準詞為key-pi;貶義基準詞為key-nj;α和β是可調(diào)節(jié)參數(shù),根據(jù)給定的基準詞對,W可通過對α和β的調(diào)節(jié)提高算法的準確率;Sim(key-pi,W)和Sim(key-nj,W)分別為基于知網(wǎng)的觀點詞與褒義基準詞和貶義基準詞的相似度。

      4)觀點值的計算 產(chǎn)品評論中產(chǎn)品特征的觀點值通過觀點詞來計算。修飾每個產(chǎn)品特征的觀點詞不止一個,最終產(chǎn)品特征的觀點值可以用所有修飾其的觀點詞的褒貶程度值相加,并取平均值來計算。在進行觀點值計算時,考慮幾種詞性的詞對其計算的影響:一種是程度或頻度副詞;另一種是否定詞。程度副詞是指用來修飾形容詞的詞匯,如“十分流暢”,其中“十分”就為程度副詞,“流暢”則為形容詞。對于這類有程度副詞或否定詞修飾的觀點詞稱為復(fù)合觀點詞。因此,產(chǎn)品評論中的觀點詞劃分為以下幾類分別計算其相應(yīng)的褒貶程度:若觀點詞僅由形容詞構(gòu)成,褒貶程度計算直接利用式(1);若觀點詞為復(fù)合觀點詞,其結(jié)構(gòu)為“程度副詞+形容詞”,褒貶程度計算使用式(2):

      (2)

      式中,S1為程度副詞的修飾強度值;S2為根據(jù)式(1)計算出的形容詞的褒貶傾向值; Δμ為位移指數(shù),不妨取為0.5。如W為“非常流暢”,可先利用式(1)計算出“流暢”的褒貶傾向值為S2=0.4315,“非?!钡男揎棌姸戎禐镾1=0.7,分別代入式(2)中即可得到“非常流暢”的褒貶傾向SW=0.50。為了計算方便,可以將修飾詞分為相應(yīng)的等級,每級有一個基準詞,如表2所示。

      表2 修飾詞基準詞

      如果遇到其他的修飾詞時,可先根據(jù)相似度計算公式計算其與基準修飾詞的相似度,然后選取與其相似度最大的基準修飾詞的修飾強度為自身的修飾強度。若觀點詞為“頻度副詞+形容詞”結(jié)構(gòu)的復(fù)合觀點詞,計算方法如上類似;若觀點詞為“否定詞+形容詞”結(jié)構(gòu)的復(fù)合觀點詞,如W為“不漂亮”,先計算出形容詞“漂亮”的褒貶程度S1,則這類復(fù)合觀點詞的褒貶程度為:

      SW=-S1

      (3)

      經(jīng)過以上步驟,最終形成<產(chǎn)品特征,觀點詞,關(guān)注值,觀點值>四元組。

      根據(jù)以上分析,可獲得每個產(chǎn)品特征的關(guān)注值與觀點值,結(jié)合兩者最終形成相應(yīng)的改進需求(即選取關(guān)注值大,觀點值小(包括負值)的產(chǎn)品特征作為改進型需求對象),并將其添加到改進需求列表中。

      1.3 結(jié)合特征修飾詞的改進需求獲取

      1)基于句法依存關(guān)系的名詞短語識別 在線商品評論中由2個或3個相鄰的詞構(gòu)成且具有名詞功能的短語稱為名詞短語。由于由3個詞構(gòu)成的名詞短語較少,因此,筆者主要考慮2個相鄰的詞構(gòu)成的名詞短語,基于句法依存關(guān)系構(gòu)建在線商品評論中名詞短語的識別規(guī)則。商品評論中名詞短語的組成主要有2種形式:一種是特征名詞的修飾詞為名詞,另一種特征名詞的修飾詞為動詞。如評論“屏幕分辨率很高,運行速度很快?!钡木浞ㄒ来娣治鋈鐖D4所示。

      圖4 評論“屏幕分辨率很高,運行速度很快?!钡木浞ㄒ来娣治鲆晥D

      類似構(gòu)建識別規(guī)則如下:

      規(guī)則3 一個單句中,相鄰的2個名詞(動詞+名詞)滿足ATT(定中關(guān)系)依存結(jié)構(gòu)關(guān)系,那么這2個詞構(gòu)成一個名詞性短語。

      2)中文名詞短語的分類 在中文中,名詞與名詞構(gòu)成的名詞短語從語義上看,主要存在2種關(guān)系:一是隸屬關(guān)系,一是類屬關(guān)系。隸屬關(guān)系是指中心語名詞所代表的事物,隸屬于定語名詞所代表的事物;類屬關(guān)系是指定語名詞所代表的事物是中心語名詞所代表事物的性質(zhì)、品種、原料、燃料、動力、用途、產(chǎn)地、喻義等的分類標志,如“金屬外殼”、“移動硬盤”等。

      3)包含類屬關(guān)系的名詞短語的提取 根據(jù)上述對名詞短語的提取和分類,將提取到的具有類屬關(guān)系的名詞短語加入到改進型需求列表中。如短語“柔性屏幕”,“柔性”和“屏幕”構(gòu)成的是類屬關(guān)系,包含了“屏幕”的某種改進需求。這種包含類屬關(guān)系的名詞短語的改進型需求將用戶對產(chǎn)品特征的觀點傾向轉(zhuǎn)變?yōu)榻o出產(chǎn)品特征的具體的、明確要求,因而對商家或者產(chǎn)品生產(chǎn)者來說則更具有參考價值。

      2 試驗與結(jié)果分析

      利用八爪魚軟件從天貓商城上抓取了魅族MX5手機的600條用戶評論作為試驗語料。對評論進行相應(yīng)的篩選,最終獲得有效評論516條。對于評論文本的分詞采用哈爾濱工業(yè)大學(xué)語言云(http://www.ltp-cloud.com/)并使用Python調(diào)用API,結(jié)果以XML文件的形式顯示出來。對于其中相關(guān)詞的識別則根據(jù)相應(yīng)的識別規(guī)則利用Dom4j解析方法并結(jié)合Xpath技術(shù)對XML文件進行解析。

      2.1 產(chǎn)品特征關(guān)注值列表

      根據(jù)對XML文件的解析并統(tǒng)計相關(guān)觀點詞的數(shù)量,最終得到關(guān)注值靠前的12個產(chǎn)品特征,列于表3中。

      2.2 產(chǎn)品特征觀點值列表

      對修飾產(chǎn)品特征的觀點形容詞進行褒貶傾向的量化,其具體的數(shù)值區(qū)間為[-1,1]。其中,負數(shù)代表貶義傾向,正數(shù)代表褒義傾向,且絕對值越大,情感的強度越明顯。產(chǎn)品特征關(guān)注值-觀點值列于表3中。

      表3 添加基準觀點詞的產(chǎn)品特征關(guān)注值-觀點值列表

      通過表3中相關(guān)數(shù)據(jù)可以看出,關(guān)注度第4的“快充”和第5的“物流”的觀點值較低,但是考慮到在漢語中同一個表示觀點的形容詞在不同的語境中可能代表不同的情感傾向,例如“物流非???,很給力?!焙汀半姵夭荒陀?,耗電太快了?!边@2條評論中,都提及了觀點詞“快”,顯然兩者表現(xiàn)出的情感是不同的,前者是一種正向的評價,而后者是一種負向的評價。因此,在利用觀點詞情感傾向計算方法時可能就會出現(xiàn)觀點值計算不準確。例如,利用筆者的觀點詞情感傾向計算公式計算出“快”一詞的觀點值為0.129,對照上面“物流”這一特征的觀點值0.189,就實際情況來說,其實“物流”這一特征整體是令人滿意的,無需進行相應(yīng)的改進。為了使產(chǎn)品特征的觀點值能夠反映出實際的情況,筆者對產(chǎn)品特征設(shè)定一些常見的描述產(chǎn)品特征的基準觀點詞,根據(jù)這些基準觀點詞的觀點值來判斷該產(chǎn)品特征的觀點值處在一個怎樣的觀點值區(qū)間,從而為企業(yè)或者商家進行相應(yīng)的產(chǎn)品改進提供一定的依據(jù)。

      根據(jù)表3的內(nèi)容并結(jié)合觀點值與基準觀點值得值可以看出,“系統(tǒng)”這一產(chǎn)品特征關(guān)注值最大,同時觀點值與基準觀點詞的觀點值比較較低,因此在“系統(tǒng)”這一產(chǎn)品特征還需進一步的改進。此外,“指紋解鎖”與“電池”這2個產(chǎn)品特征關(guān)注值不是很大,但是其觀點值與基準觀點詞的觀點值相比較低,因此也需要進一步的改進。

      2.3 結(jié)合特征修飾詞的改進型需求

      由于在線商品評論中包含類屬關(guān)系的名詞詞組較少,在利用句法依存關(guān)系進行識別時,需要一定數(shù)量的評論文本,因此筆者在上述數(shù)量的基礎(chǔ)上進行了擴充,最終獲得有效的評論文本1536條。根據(jù)相應(yīng)的識別規(guī)則,最終得到具有類屬關(guān)系的名詞詞組:小屏手機、金屬外殼、光學(xué)防抖、雙色溫閃光燈、激光對焦、北斗導(dǎo)航、分屏技術(shù)。

      根據(jù)魅族MX5手機說明書,除去已存在的產(chǎn)品特征或?qū)傩?紅色部分為已存在的產(chǎn)品特征),最終得到該手機的改進型需求為“小屏手機”、“光學(xué)防抖”。根據(jù)上述改進需求,企業(yè)可以開發(fā)屏幕尺寸更小的手機。另外,對手機攝像頭增加“光學(xué)防抖”功能。

      3 結(jié)語

      在需求呈現(xiàn)多樣化的趨勢下,如何快速挖掘在線商品的改進需求并反饋于企業(yè)以此來提升用戶的滿意度顯得尤為重要。筆者在對在線商品網(wǎng)絡(luò)評論進行句法依存分析的基礎(chǔ)上,構(gòu)建產(chǎn)品特征與觀點詞識別規(guī)則,形成產(chǎn)品特征的關(guān)注度與觀點值。在對觀點值計算時考慮了修飾詞對觀點詞的影響,結(jié)合關(guān)注值與觀點值來構(gòu)建改進需求挖掘模型,從特征修飾詞的角度出發(fā)獲取一些更加具體的改進需求,并且驗證了提出商品改進需求獲取方法的有效性。筆者所提出的方法在進行產(chǎn)品特征和觀點詞識別時,需要根據(jù)相應(yīng)的規(guī)則,因此,對在線商品評論的格式要求比較規(guī)范且不能夠識別出評論中包含的隱性產(chǎn)品特征。此外,試驗選取的有限數(shù)據(jù)可能導(dǎo)致結(jié)果的局限性,這些都是今后需要進一步研究的問題。

      [1]HuM,LiuB.MiningandSummarizingCustomerReviews[A].Proceedingsofthe10thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining(KDD'04)[C].NewYork:ACM, 2004: 168~177.

      [2]李實, 葉強, 李一軍.中文網(wǎng)絡(luò)客戶評論的產(chǎn)品特征挖掘方法研究[J].管理科學(xué)學(xué)報, 2009(2): 142~152.

      [3]徐芳平. 基于在線評論的產(chǎn)品再設(shè)計需求研究[D].大連:大連理工大學(xué), 2012.

      [4]姜巍, 張莉, 戴翼,等.面向用戶需求獲取的在線評論有用性分析[J].計算機學(xué)報, 2013, 36(1): 119~131.

      [5]崔建苓, 楊達, 李娟.RERM: 一種基于評論挖掘的需求獲取方法[J].計算機應(yīng)用與軟件, 2015, 32(8): 28~33.

      [6]張曉勇, 章成志, 周清清. 基于電商產(chǎn)品評論的產(chǎn)品概念層次體系自動構(gòu)建研究[J]. 情報理論與實踐, 2016, 39(6): 120~125.

      [編輯] 洪云飛

      2016-11-18

      國家自然科學(xué)基金項目(71371012);教育部人文社會科學(xué)規(guī)劃項目(13YJA630098)。

      吳東勝(1990-),男,碩士生,現(xiàn)主要從事電子商務(wù)方面的研究工作。

      王忠群(1965-),男,碩士,教授,現(xiàn)主要從事信息管理與信息系統(tǒng)方面的教學(xué)與研究工作,1144376229@qq.com。

      TP311.52

      A

      1673-1409(2017)05-0044-05

      [引著格式]吳東勝,王忠群,蔣勝,等.基于評論的商品改進需求獲取方法研究[J].長江大學(xué)學(xué)報(自科版),2017,14(5):44~48.

      猜你喜歡
      修飾詞句法基準
      句法與句意(外一篇)
      中華詩詞(2021年3期)2021-12-31 08:07:22
      述謂結(jié)構(gòu)與英語句法配置
      學(xué)加修飾詞
      句法二題
      中華詩詞(2018年3期)2018-08-01 06:40:40
      詩詞聯(lián)句句法梳理
      中華詩詞(2018年11期)2018-03-26 06:41:32
      我屬“懶”
      明基準講方法??待R
      滑落還是攀爬
      巧用基準變換實現(xiàn)裝配檢測
      河南科技(2014年15期)2014-02-27 14:12:35
      Imagination率先展示全新Futuremark 3DMark OpenGL ES3.0基準測試
      诸暨市| 沐川县| 灌云县| 镇坪县| 铜山县| 永兴县| 醴陵市| 加查县| 阿合奇县| 沅江市| 兰坪| 昌黎县| 辉南县| 抚远县| 通州市| 南宁市| 怀安县| 中江县| 安龙县| 滁州市| 丹巴县| 阳谷县| 武川县| 洞口县| 汽车| 三亚市| 磐石市| 武穴市| 康马县| 稷山县| 德昌县| 龙州县| 武平县| 尖扎县| 读书| 大同市| 巴南区| 鄂尔多斯市| 甘洛县| 中阳县| 太康县|