• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于在線評論情感分析和模糊認知圖的產(chǎn)品差異性研究

    2022-01-22 14:56:20段恒鑫葉曉慶
    鄭州大學學報(理學版) 2022年1期
    關鍵詞:售后置信度文本

    段恒鑫, 劉 盾,2, 葉曉慶

    (1.西南交通大學 經(jīng)濟管理學院 成都 610031; 2.重慶郵電大學 計算智能重慶市重點實驗室 重慶 400065)

    0 引言

    隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展、在線支付的普及以及物流配送效率的提升,在線購物成為主流趨勢,電子商務成交量逐年增加[1]。然而,在電子商務飛速發(fā)展的同時,品牌之間的競爭也日益嚴重,品牌想要沖出重圍,需要形成自身特色,并以此來提高品牌的競爭力。為此,大多企業(yè)一般采取產(chǎn)品差異化戰(zhàn)略,通過突出品牌優(yōu)勢來吸引用戶,提高產(chǎn)品競爭力。

    產(chǎn)品差異性是用戶接受商家品牌與其他競爭者之間的差異程度[2]。以化妝品品牌為例,企業(yè)針對不同目標用戶,將旗下品牌按照“高端”、“輕奢”、“平價”進行市場細分。例如,世界著名化妝品巨頭歐萊雅集團旗下一線品牌有赫蓮娜;二線品牌有蘭蔻和碧歐泉;三線品牌有巴黎歐萊雅、科顏氏等。從企業(yè)角度,分析產(chǎn)品差異性可以幫助企業(yè)有效獲取用戶需求,精準定位目標用戶,核定市場細分,為生產(chǎn)安排提供反饋;從用戶角度,分析產(chǎn)品差異性可以給用戶更多的關于產(chǎn)品橫向?qū)Ρ刃畔?,輔助購買決策[3]。

    在線評論是獲取商品評價的重要渠道,對企業(yè)和用戶來說都有重要意義。借助互聯(lián)網(wǎng)平臺交互性、個性化、便捷性等特點,越來越多的用戶愿意在網(wǎng)絡社區(qū)或電子商務網(wǎng)站上瀏覽和發(fā)布信息,以達到產(chǎn)品信息交流和購物體驗分享的目的。對于用戶而言,在線評論反映了產(chǎn)品的真實信息,可以幫助用戶進行購買決策;對于企業(yè)而言,在線評論中蘊藏著有關產(chǎn)品、服務質(zhì)量和用戶情感態(tài)度等豐富的信息,是企業(yè)獲取用戶需求的重要來源。因此,近年來,在線評論逐漸成為商家和電子商務平臺關注的焦點[4]。一方面,在線評論直接反映了用戶對產(chǎn)品的滿意度;另一方面,在線評論間接地反映了用戶的主要需求,是實現(xiàn)品牌差異性分析的有效信息。

    然而,如果要實現(xiàn)精準的品牌差異性分析,我們不但需要挖掘用戶主要關注屬性,還要獲取用戶對不同屬性的情感傾向以及屬性間的關系?;诖?,本文提出了基于在線評論情感分析和模糊認知圖的產(chǎn)品差異化分析模型。該模型首先通過機器學習算法與深度學習技術(shù)從在線評論中挖掘用戶關注的屬性,進行情感判斷,再通過模糊認知圖(fuzzy cognitive map, FCM)獲取用戶對產(chǎn)品不同屬性的情感傾向,以此獲得產(chǎn)品差異性分析的綜合評價。

    1 相關理論

    1.1 LDA主題模型

    LDA是由Blei等[5]提出的文本主題提取模型,用于直接提取文本中具有語義解釋性的主題特征。在LDA中存在一個假設,即用戶在編輯評論文本時,在他的意識中會存在一些主題元素,而這些主題中會存在不同的詞或句,通過主題-詞選擇來構(gòu)成用戶產(chǎn)生的在線評論,LDA具體模型如圖1所示。其中:k表示提取主題的數(shù);N表示在線評論包含的詞數(shù)量;wm,n表示第m篇文檔的第n個詞;tm,n表示第m篇文檔第n個主題;φk表示各主題下對應的詞概率分布;θm表示各文檔下對應的主題分布。假設整體在線評論存在V個非重復詞匯,根據(jù)上述模型,可計算相應的聯(lián)合概率分布為

    圖1 LDA模型

    當超參數(shù)α、β給定時,可通過吉布斯采樣對LDA中參數(shù)θm和φk進行估計求解:

    通過對參數(shù)θm和φk進行求解,可獲得各在線評論文本的主題分布和各主題下的詞分布,由此來實現(xiàn)基于LDA的在線評論主題提取。

    1.2 長短期記憶網(wǎng)絡(LSTM)

    LSTM是Hochreiter等[6]提出的一種特殊的循環(huán)神經(jīng)網(wǎng)絡,主要為了解決長序列訓練過程中的梯度消失和梯度爆炸的問題。LSTM通過一個記憶單元與三個門(遺忘門、更新門、輸出門)結(jié)構(gòu)來實現(xiàn)對每個單元狀態(tài)的控制[7],其結(jié)構(gòu)如圖2所示。與循環(huán)神經(jīng)網(wǎng)絡相比,長短期記憶LSTM有2個傳輸狀態(tài):c1(cell state),h1(hidden state)。循環(huán)神經(jīng)網(wǎng)絡中的h1就是LSTM中的c1,這也是LSTM的關鍵。LSTM利用門的結(jié)構(gòu)來精確控制加入或移除信息到記憶狀態(tài)。

    圖2 LSTM結(jié)構(gòu)圖

    1.3 模糊認知圖(FCM)

    模糊認知圖(fuzzy cognitive map, FCM) 是一種利用現(xiàn)有知識和專家經(jīng)驗來模擬復雜系統(tǒng)的方法[8]。模糊認知圖利用接近于人類認知的方式描述一個系統(tǒng),通過強調(diào)因果連接和圖的結(jié)構(gòu)來表示知識,同時利用規(guī)則的形式將專家知識和從數(shù)據(jù)中獲得的有用知識合并在一起[9]。在網(wǎng)絡管理[10]、故障分析[11]、專家決策[12]等領域有廣泛應用。在模糊認知圖中,用有向弧表示概念節(jié)點之間的關系,從原因指向結(jié)果[13],其主要結(jié)構(gòu)如圖3所示。在模糊認知圖中,集合Ci(i=1,2,…,n)代表一組有語義的概念節(jié)點,其中n代表節(jié)點個數(shù)。節(jié)點間的有向弧表示兩者間的因果關系,權(quán)重Wij(-1≤Wij≤1)的大小表示原因節(jié)點對結(jié)果結(jié)點的影響程度[14]。當0

    圖3 FCM結(jié)構(gòu)圖

    2 基于在線評論情感分析和模糊認知圖的分析模型

    在本小節(jié)中,為了挖掘用戶對品牌特定屬性的情感傾向,探索品牌差異性,我們構(gòu)建了一種基于情感分析和模糊認知圖的在線評論分析模型。該分析模型主要有四個步驟:第一,利用LDA提取用戶關注屬性;第二,通過LSTM與概念語言術(shù)語集挖掘用戶對不同屬性的情感傾向;第三,構(gòu)造FCM挖掘?qū)傩灾g的關系;第四,基于EBM獲取綜合評價。為了更清楚地描述上述流程,圖4給出該模型的基本模型框架圖。

    圖4 基本模型框架圖

    2.1 挖掘用戶關注屬性

    本文利用LDA模型對評論文本進行主題提取,并根據(jù)LDA獲取的文本主題分布來確定用戶關注屬性。首先,將處理后的評論文本輸入LDA模型,為每個主題詞分配一個屬性;其次,遍歷所有主題詞,根據(jù)Gibbs抽樣公式對每個單詞的屬性分布進行重采樣和更新,直到結(jié)果收斂;最后,合并類似主題并給出相應屬性命名,并據(jù)此構(gòu)造每條評論文本在不同屬性下的文本-屬性矩陣。

    2.2 屬性情感分析

    為了挖掘用戶對品牌特定屬性的情感傾向,本文采用LSTM對每個評論文本的情感進行分析,并對文本信息進行量化。通過情感分析,每個評論文本都有一個介于0到1之間的情感得分,1表示最積極的情感,0表示最消極的情感。因此,每一個分數(shù)代表了評論文本的情感程度,可利用情感得分評估用戶對不同品牌的滿意度。為了更清晰地衡量用戶的情感態(tài)度,本文利用PLTSs來評估用戶對不同屬性的情感。在PLTSs的框架下,可以將滿意度分為5個等級:(1, 0.8);(0.8, 0.6);(0.6, 0.4);(0.4, 0.2);(0.2, 0)[16],它們分別對應了“非常滿意”、“滿意”、“一般”、“不滿意”、“非常不滿意”5種語言術(shù)語集。據(jù)此,本文將情感得分按照5個等級進行劃分,相應的情感分析過程可分為以下4個步驟。

    步驟1 對每條評論文本進行預處理,并得到屬性及主題詞;

    步驟2 用訓練集數(shù)據(jù)訓練LSTM模型,并利用訓練好的模型計算每條評論的得分;

    步驟3 利用PLTSs將情感得分劃分到5個等級中;

    步驟4 將5個情感水平百分比標準化為滿意度。

    2.3 屬性關系挖掘

    為了進一步挖掘?qū)傩灾g的關系,我們進一步通過模糊關聯(lián)規(guī)則進行屬性關系挖掘,建立描述屬性相互關系的FCM模型。其中,用Aj→Al表示屬性Aj和Al(j≠l)之間的模糊關聯(lián)規(guī)則,M為評論數(shù)量,vij和vil分別表示文本Texti(i=1,2,…,M)對屬性Aj和Al的影響,其值分別等于文本Texti屬于Aj、Al的概率。根據(jù)文獻[17],可以計算Aj→Al的支持度、置信度和提升度分別為

    (1)

    (2)

    lift(Aj→Al)=conf(Aj→Al)/supp(Al),

    (3)

    其中:supp(Aj→Al)為支持度,用于描述屬性Aj和Al同時出現(xiàn)的可能性;conf(Aj→Al)為置信度,它刻畫了Aj對Al的影響;lift(Aj→Al)為支持度,它可以衡量模糊關聯(lián)規(guī)則的極性。

    在構(gòu)建基于關聯(lián)規(guī)則的FCM模型時,需要設立一個最小支持度與最小置信度,用于刪除支持度小于最小支持度、置信度小于最小置信度的關聯(lián)規(guī)則。在其余的關聯(lián)規(guī)則中,選擇置信度作為關聯(lián)規(guī)則的絕對權(quán)重,用提升度確定權(quán)重的極性。對于每個關聯(lián)規(guī)則Aj→Al,如果lift(Aj→Al)=1,則Aj與Al相互獨立;如果lift(Aj→Al)>1,則Aj與Al正相關;如果lift(Aj→Al)<1,則Aj與Al負相關;在本文中,最小置信度設為0.25,最小支持度為0.30?;谏鲜龇治觯梢詷?gòu)造相應的模糊認知圖,具體分為3個步驟。

    步驟1 根據(jù)公式(1)~(3),計算supp(Aj→Al)、conf(Aj→Al)與lift(Aj→Al);

    步驟2 刪除支持度小于最小支持度的規(guī)則,刪除置信度小于最小置信度的規(guī)則;

    步驟3 根據(jù)lift(Aj→Al)計算出該關聯(lián)規(guī)則的權(quán)重。

    2.4 總體評價

    Itj=B·Ptj.

    (4)

    在FCM中,中心度被用來描述確定屬性重要性的度量,它可以利用屬性的索引值Indegree(Aj)和出度值Outdegree(Aj)計算權(quán)重信息。這里,屬性的度中心性定義為

    Degreecentrality(Aj)=Outdegree(Aj)+Indegree(Aj),

    (5)

    其中:索引值等于指向該屬性的所有關聯(lián)規(guī)則的權(quán)重之和;出度值等于從該屬性中指出的所有關聯(lián)規(guī)則的權(quán)重之和。如果一個屬性具有更高的度中心性,那么它在FCM圖中應該扮演更重要的角色。據(jù)此,我們可以進一步規(guī)范化屬性Aj的度中心性,并計算中心度的權(quán)重為

    (6)

    作為聚合算子的典型代表之一,BM算子(bonferroni mean operator)不僅可以計算每種屬性的重要性,而且能夠有效地捕獲屬性間的內(nèi)在聯(lián)系,因而常常被應用到多屬性群決策問題中。然而,雖然BM算子考慮了屬性之間的相互作用,但這種交互是非定向的。對于FCM而言,每個關聯(lián)規(guī)則表示屬性之間的因果關系?;谏鲜龇治觯瑢τ谝粋€特定的品牌,我們使用了改進的EBM算子來測量滿意度得分。

    對于第t個品牌,基于EBM的計算結(jié)果,分別使用乘法屬性計算每個屬性Aj的滿意度得分,

    (7)

    (8)

    3 實驗結(jié)果與分析

    3.1 實驗數(shù)據(jù)

    為了驗證所提出方法的有效性,選取京東商城化妝品真實數(shù)據(jù)進行驗證,爬取了2016年6月至2020年6月京東商城中歐萊雅、雅詩蘭黛、資生堂和愛茉莉太平洋4個化妝品品牌的在線評論數(shù)據(jù)。經(jīng)過數(shù)據(jù)清洗后有效評論為156 956條,其中包含111 365條正向評論和47 591條負向評論。平均每條評論長度為154字,經(jīng)過Jieba分詞后平均分詞數(shù)為54個。文本情感極性標簽分別用1和0表示,1代表正向評論,0代表負向評論。所有有效評論數(shù)據(jù)集包含4個大品牌,每個大品牌下均有一級、二級、三級產(chǎn)品。如雅詩蘭黛旗下一級產(chǎn)品有海藍之謎;二級產(chǎn)品有雅詩蘭黛、悅木之源;三級產(chǎn)品有朗仕等,其數(shù)據(jù)分布如表1所示。

    表1 4個品牌評論數(shù)據(jù)分布表

    3.2 實驗結(jié)果分析

    3.2.1屬性挖掘 根據(jù)圖4的提出的框架模型,利用LDA對在線評論進行主題提取,可以得到價格(A1)、性價比(A2)、效果(A3)、物流(A4)、售后(A5)5個屬性,每一個屬性及其對應的主要關鍵詞如表2所示。如在“價格”主題下,有“劃算”、“便宜”、“優(yōu)惠”等關鍵詞;售后主題下則有“客戶”、“保障”、“服務態(tài)度”等關鍵詞。

    表2 評論主題與核心關鍵詞表

    根據(jù)表2提取的5個主題,分別計算每條在線評論對5個屬性的概率分布,得到的文本-屬性概率矩陣結(jié)果如表3所示。以Text2為例,它對A1、A4的概率值分別為0.453 6、0.237 4,這說明第2條在線評論對應“性價比”概率為0.453 6,對應“物流”關鍵詞的概率為0.237 4。

    根據(jù)表3,可以分別計算文本-屬性概率矩陣中每一行的最大值,其代表該文本的主屬性,如:Text1的主屬性為“價格”;Text2的主屬性為“價格”;Text3的主屬性為“物流”等。此外,可以據(jù)此簡單統(tǒng)計各屬性下評論的主屬性分布情況,其中涉及價格屬性33 129條、性價比屬性55 513條、效果屬性8 598條、物流屬性7 965條、售后屬性53 751條。顯而易見地,在所有評論中,“性價比”和“售后”兩條主屬性的評論數(shù)量均超過5萬條,這說明所有評論對“性價比”和“售后”兩個屬性最為關注。然后,根據(jù)LSTM計算每條文本的情感分布,也可以計算每一條文本的情感得分情況,如:Text1的情感得分為0.808 0;Text2的主屬性情感得分為0.033 4;Text3的情感得分為0.102 6等。可以看到,每一條文本的輸出概率在0和1之間,其數(shù)字大小含義為:如果該條評論得分越高,就越接近正向評論;得分越低,則越接近負向評論。進一步地,通過LDA和LSTM計算的結(jié)果并結(jié)合 PLTSs,可以計算各個屬性的總體滿意度比例,如表4所示。

    表3 文本-屬性概率矩陣

    表4 屬性的總體滿意度比例表

    3.2.2屬性關系分析 根據(jù)表3和公式(1)~(3),可計算相應的置信度和提升度矩陣,計算結(jié)果如表5和表6所示。根據(jù)表5~6可以繪制總體FCM。在圖5中,箭頭代表兩屬性的關聯(lián)。在總體模糊認知圖中,其他幾個屬性均與屬性“售后”有關聯(lián),由此可見,該屬性在分析在線評論中具有很重要的意義。根據(jù)公式(4)~(7),可以分別計算不同品牌和不同產(chǎn)品等級的屬性綜合評分,如表7所示。

    表5 總體置信度矩陣

    表6 總體提升度矩陣

    圖5 總體FCM

    最后,根據(jù)品牌和產(chǎn)品等級數(shù)據(jù),通過公式(1)~(3)分別構(gòu)建相應的FCM,結(jié)果如圖6所示。一方面,通過圖6(a)可以發(fā)現(xiàn),不同品牌間屬性關系存在差異。如品牌“歐萊雅”的“價格”、“性價比”和“物流”屬性對“售后”屬性有正向關系;品牌“雅詩蘭黛”的“價格”、“性價比”、“效果”屬性對“售后”屬性有正向關系,“售后”對“物流”有正向關系,“售后”對“效果”有負向關系;另一方面,由圖6(b)可以得到,不同產(chǎn)品等級間屬性關系差異較大,一級產(chǎn)品的屬性“物流”、“效果”與“售后”存在正向關系,而“價格”與“售后”存在負向關系,一級產(chǎn)品價格較高,用戶在購買時更看重產(chǎn)品質(zhì)量與效果。

    圖6 不同品牌和不同產(chǎn)品等級FCM

    3.2.3綜合評價 根據(jù)表7~8和公式(8),可以得到不同品牌和不同產(chǎn)品等級的最終加權(quán)滿意度得分,其品牌得分排序情況:歐萊雅(0.903 1)<雅詩蘭黛(0.919 5)<資生堂(0.952 6)<愛茉莉太平洋(1.021 8);從等級角度,則有一級產(chǎn)品(1.010 7)>二級產(chǎn)品(0.952 1)>三級產(chǎn)品(0.852 1)。為了更加方便地對其進行比較,我們將不同品牌屬性和不同產(chǎn)品等級得分進行匯總,結(jié)果如圖7所示。

    表7 不同品牌的屬性評分表

    由圖7(a),從品牌角度,在綜合滿意度最高的愛茉莉太平洋中,“性價比”、“售后”是其應該關注的屬性。根據(jù)其模糊認知圖,可以發(fā)現(xiàn),“效果”、“價格”與“售后”呈明顯正相關,品牌方應多關注這兩個屬性;在資生堂中,“效果”、“價格”則需要引起高度關注;在雅詩蘭黛中,“價格”是其主要優(yōu)勢,需要在“物流”、“售后”方面投入更多精力;在歐萊雅中,各項屬性均落后于其他三個品牌。由圖7(b)從用戶角度,三個產(chǎn)品的等級呈現(xiàn)出了明顯的大小關系。一級產(chǎn)品在除“價格”以外的幾個屬性上均優(yōu)于其他兩種產(chǎn)品;二級產(chǎn)品則在“售后”屬性上落后于三級產(chǎn)品。

    表8 不同產(chǎn)品等級的屬性評分表

    圖7 不同品牌和不同等級屬性得分圖

    基于上述分析,從品牌等級角度來看,一級產(chǎn)品的各項指標遠遠高于二級和三級產(chǎn)品,驗證了“差異化”營銷的有效性。同時,在所有屬性中,“售后”屬性表現(xiàn)最差,這說明所有品牌都需要對這一指標采取措施用以提升顧客滿意度。

    3.3 情感分析結(jié)果對比

    為了進一步驗證本文所用LSTM算法的有效性,我們選取情感分析常用的支持向量機(SVM),樸素貝葉斯(Naive Bayesian)、卷積神經(jīng)網(wǎng)(CNN)、極限梯度提升算法(XGBoost)作為基準算法。這里,我們采用精度(Precision)、召回率(Recall)和F1值三個指標作為評價標準來衡量不同算法在情感分析過程中的表現(xiàn)情況,算法所用公式為

    Precision=TP/(TP+FP);

    (9)

    Recall=TP/(TP+FN);

    (10)

    F1=2precision·recall/(precision+recall)。

    (11)

    結(jié)果匯總?cè)绫?所示。無論是在Precision、Recall還是F1值的表現(xiàn)上,LSTM相較其他算法都取得了較好的預測效果,這也間接說明本文利用LSTM進行情感分析是合理和有效的。

    表9 算法結(jié)果匯總表

    4 結(jié)論與展望

    為了幫助企業(yè)發(fā)現(xiàn)市場的差異化需求,對某產(chǎn)品或服務進行有效創(chuàng)新和改進,本研究以化妝品市場為例,針對差異性產(chǎn)品,分別從品牌和用戶兩個維度,挖掘產(chǎn)品差異化特征,分析用戶滿意度,對差異化產(chǎn)品的競爭性進行探討,并提出相應的改進建議。首先,利用LDA挖掘用戶所關心的產(chǎn)品特征;其次,利用長短期記憶和概率語言術(shù)語集更準確地測度了用戶對不同產(chǎn)品特征的情感;然后,利用模糊認知圖和關聯(lián)規(guī)則進一步研究了各產(chǎn)品特征之間的相互關系,構(gòu)建了特征之間的關系圖;最后,通過EBM算子對決策信息進行聚合,得到最終綜合評價??偠灾?,本文所提出的模型和方法能夠?qū)⒃诰€評論的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為定量信息,獲得產(chǎn)品特征的滿意度評價,并在主題提取、情感分析、以及綜合評價方面取得了一定的效果。在未來研究中,一方面可以將數(shù)據(jù)的時序性引入到研究中,根據(jù)時間動態(tài)變化來探索動態(tài)的用戶滿意度變化,并分析產(chǎn)品差異性變化趨勢;另一方面,考慮到模糊認知圖只是衡量屬性關系的一種形式,后續(xù)還可以探討其他模型來實現(xiàn)相關任務。

    猜你喜歡
    售后置信度文本
    硼鋁復合材料硼含量置信度臨界安全分析研究
    淺談汽車售后配件同步發(fā)布
    汽車工藝師(2021年7期)2021-07-30 08:03:40
    在808DA上文本顯示的改善
    基于doc2vec和TF-IDF的相似文本識別
    電子制作(2018年18期)2018-11-14 01:48:06
    正負關聯(lián)規(guī)則兩級置信度閾值設置方法
    計算機應用(2018年5期)2018-07-25 07:41:26
    舍弗勒售后發(fā)展歷程
    文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
    置信度條件下軸承壽命的可靠度分析
    軸承(2015年2期)2015-07-25 03:51:04
    雷貝斯托:技術(shù)革新讓OE與售后兩市場相得益彰
    第二屆法蘭克福成都汽配及售后展成功舉辦
    集贤县| 都江堰市| 漾濞| 综艺| 新邵县| 南汇区| 拉萨市| 成武县| 海城市| 娄烦县| 察雅县| 常山县| 通江县| 商都县| 洪江市| 台南市| 咸宁市| 平乡县| 嘉兴市| 库尔勒市| 松江区| 汉中市| 涿州市| 黄梅县| 连南| 迁安市| 灯塔市| 常州市| 长沙市| 三亚市| 城口县| 彝良县| 城固县| 精河县| 石嘴山市| 榆中县| 普格县| 韶山市| 桂平市| 鹰潭市| 翁牛特旗|