曾偲慧 陳原 郭舒敏
摘 要:在線評(píng)論作為獲取商品信息的重要途經(jīng),包含大量用戶產(chǎn)生的質(zhì)量信息且更新速度快。通過(guò)大數(shù)據(jù)處理技術(shù)對(duì)質(zhì)量信息進(jìn)行提取,可有效彌補(bǔ)傳統(tǒng)質(zhì)量抽檢樣本小、抽檢難等缺點(diǎn),提供質(zhì)量風(fēng)險(xiǎn)提示。在大數(shù)據(jù)分析的基礎(chǔ)上,本文通過(guò)數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、質(zhì)量屬性語(yǔ)義詞典構(gòu)建、文本量化,構(gòu)建基于產(chǎn)品屬性的質(zhì)量評(píng)價(jià)方法,對(duì)面膜產(chǎn)品的在線評(píng)論進(jìn)行分析,得出其各質(zhì)量屬性感知質(zhì)量情況以及總體質(zhì)量情況評(píng)價(jià),并對(duì)可能存在的質(zhì)量風(fēng)險(xiǎn)進(jìn)行分析。
關(guān)鍵詞:感知質(zhì)量;質(zhì)量評(píng)價(jià);在線評(píng)論;大數(shù)據(jù)分析;電子商務(wù)
中圖分類號(hào):F724.6 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-0298(2021)04(b)--06
李克強(qiáng)總理在“云上2020年中國(guó)品牌日”活動(dòng)中強(qiáng)調(diào),堅(jiān)持質(zhì)量第一,更好滿足群眾消費(fèi)升級(jí)和國(guó)家發(fā)展的需要?;谫|(zhì)量管理理論發(fā)展視角,質(zhì)量概念已從符合性質(zhì)量階段發(fā)展到卓越質(zhì)量階段,產(chǎn)品質(zhì)量的衡量標(biāo)準(zhǔn)不僅僅限于符合特定標(biāo)準(zhǔn)及相關(guān)法律,更需要滿足消費(fèi)者需求,甚至是提供遠(yuǎn)遠(yuǎn)超過(guò)消費(fèi)者期望的質(zhì)量[1]??梢?,產(chǎn)品質(zhì)量的主觀性越來(lái)越強(qiáng),消費(fèi)者對(duì)產(chǎn)品的感知質(zhì)量評(píng)價(jià)不容忽視。
但與消費(fèi)者日益提升的質(zhì)量需求形成強(qiáng)烈對(duì)比的是,隨著網(wǎng)上購(gòu)物時(shí)代的到來(lái),消費(fèi)者網(wǎng)購(gòu)的風(fēng)險(xiǎn)日益凸顯,網(wǎng)購(gòu)?fù)对V亦呈爆發(fā)性增長(zhǎng)趨勢(shì)。電子商務(wù)消費(fèi)糾紛調(diào)解平臺(tái)在2019年全年受理了306家主流電商平臺(tái)用戶的投訴,跨境電商占比14.05%,商品質(zhì)量問(wèn)題成為投訴熱點(diǎn)。如何提前識(shí)別商品質(zhì)量風(fēng)險(xiǎn)成為急需解決的難題。隨著大數(shù)據(jù)及數(shù)據(jù)挖掘技術(shù)的進(jìn)步,對(duì)產(chǎn)品質(zhì)量相關(guān)信息的全樣本抽取,可與傳統(tǒng)抽樣檢驗(yàn)相輔相成,彌補(bǔ)抽樣樣本小、抽檢難以發(fā)現(xiàn)未知威脅等缺點(diǎn),提供更客觀、全面的質(zhì)量數(shù)據(jù)。
立足于網(wǎng)絡(luò)渠道,如網(wǎng)易考拉海購(gòu)買家評(píng)論、京東商城買家評(píng)論等公共空間,從消費(fèi)者對(duì)消費(fèi)品最真實(shí)、直接的第一線評(píng)價(jià)中,可提煉產(chǎn)品的質(zhì)量情況。目前研究中大多選用易于量化的指標(biāo)來(lái)度量產(chǎn)品感知質(zhì)量,例如評(píng)分等級(jí)、評(píng)論數(shù)量等,忽視了產(chǎn)品評(píng)論內(nèi)容中各維度的信息。由于產(chǎn)品具有多特征的特點(diǎn),消費(fèi)者對(duì)各產(chǎn)品特征的態(tài)度構(gòu)成了消費(fèi)者產(chǎn)品感知質(zhì)量評(píng)價(jià)?;诖耍疚奶岢隽艘环N基于消費(fèi)者對(duì)產(chǎn)品特征態(tài)度的方法量化產(chǎn)品感知質(zhì)量。
1 文獻(xiàn)綜述
產(chǎn)品質(zhì)量的主觀性越來(lái)越強(qiáng),從消費(fèi)者感知角度進(jìn)行產(chǎn)品質(zhì)量研究具有重要意義。在眾學(xué)者對(duì)感知質(zhì)量概念進(jìn)行的描述中,Zeitbaml(1988)認(rèn)為感知質(zhì)量是關(guān)于一個(gè)產(chǎn)品優(yōu)越性或卓越性的判斷,是一種主觀全面的評(píng)價(jià),來(lái)源于消費(fèi)者在對(duì)比中作出的判斷[2]。Kirmani和Baumgartzner(2000)認(rèn)為感知質(zhì)量由顧客通過(guò)所能搜尋到的內(nèi)部線索和外部線索判斷形成的對(duì)產(chǎn)品優(yōu)越性評(píng)價(jià)[3]。畢雪梅(2004)認(rèn)為顧客感知質(zhì)量是顧客針對(duì)自己使用的需求和目的,結(jié)合經(jīng)由正式或非正式途徑獲得的市場(chǎng)相關(guān)信息,形成對(duì)產(chǎn)品抽象、主觀的評(píng)價(jià)[4]。鐘凱(2013)認(rèn)為網(wǎng)購(gòu)感知產(chǎn)品質(zhì)量是網(wǎng)絡(luò)消費(fèi)者根據(jù)自身需求出發(fā),通過(guò)購(gòu)物網(wǎng)站上所提供的圖片、文字以及視頻等信息,對(duì)某種商品或服務(wù)產(chǎn)生一定的主觀評(píng)價(jià)[5]。
當(dāng)前,衡量顧客感知質(zhì)量的方法多依靠成熟量表或?qū)Ψ?wù)流程的定性分析。張鶴冰等(2020)將在線顧客感知質(zhì)量分為感知產(chǎn)品質(zhì)量和物流服務(wù)質(zhì)量,使用Wells及Parasuraman研究的成熟量表對(duì)在線客戶感知質(zhì)量進(jìn)行衡量[6]。鄭蔓華等(2020)實(shí)證分析木制家具O2O顧客感知質(zhì)量對(duì)顧客在線黏性的影響?;?ABC 態(tài)度模型,將感知質(zhì)量劃分為感知系統(tǒng)質(zhì)量、感知服務(wù)質(zhì)量及感知產(chǎn)品質(zhì)量3個(gè)維度,針對(duì)福州某小區(qū)業(yè)主發(fā)放問(wèn)卷進(jìn)行調(diào)查[7]。宮華萍等(2020)基于互聯(lián)網(wǎng)學(xué)習(xí)服務(wù)交互流程的分析,歸納影響感知質(zhì)量的感知過(guò)程質(zhì)量因素和結(jié)果質(zhì)量因素[8]。但以上方法難以確保調(diào)查樣本顧客短期內(nèi)確實(shí)購(gòu)買過(guò)該商品,也難以確保在顧客完成消費(fèi)行為后第一時(shí)間收集數(shù)據(jù)。使用在線評(píng)論文本數(shù)據(jù)作為數(shù)據(jù)來(lái)源能有效彌補(bǔ)以上采樣缺陷。在線評(píng)論包括顧客對(duì)產(chǎn)品的評(píng)分及評(píng)價(jià),包含豐富的信息量。在線評(píng)論數(shù)據(jù)只來(lái)源于有實(shí)際購(gòu)買行為的客戶并限制于收貨后一定時(shí)間內(nèi)填寫,確保數(shù)據(jù)樣本的有效性以及時(shí)效性,更有參考價(jià)值。
在線評(píng)論文本數(shù)據(jù)一般呈現(xiàn)非結(jié)構(gòu)化或半結(jié)構(gòu)化特征。文本情感分析方法可高效量化非數(shù)值型數(shù)據(jù),主要依靠文本挖掘技術(shù)和自然語(yǔ)言處理技術(shù)。核心環(huán)節(jié)包括產(chǎn)品屬性特征提取、在線評(píng)論情感分析[9]。Hu和Liu等(2004)提出了一種基于特征的自然語(yǔ)言處理摘要方法,提取了與購(gòu)買者觀點(diǎn)相關(guān)產(chǎn)品的特征塊(例如單詞和短語(yǔ))。這些特征塊被定義為產(chǎn)品特性、屬性或功能。而意見塊被定義為用戶對(duì)功能的主觀評(píng)價(jià),情感詞用于表示積極或消極的意見[10]。多年后,Chung和Tseng(2012)使用關(guān)聯(lián)規(guī)則挖掘算法,學(xué)習(xí)最具有信息性的產(chǎn)品特性,以促進(jìn)商業(yè)智能[11]。Lee和Choeh(2014)基于總結(jié)的特征和觀點(diǎn),預(yù)測(cè)在線評(píng)論的有用性[12]。Kang(2014)用情感分析的方法分析了手機(jī)應(yīng)用程序的速度、穩(wěn)定性等6個(gè)特點(diǎn)[13]。Tuarob和Tucker(2015)提出利用情感分析量化產(chǎn)品的市場(chǎng)支持度,識(shí)別成功和失敗的產(chǎn)品,并將產(chǎn)品特征自動(dòng)分成兩類:滿意特征和抱怨特征[14]。Suryadi和Kim(2016)總結(jié)了評(píng)論中提到的特征,分析了產(chǎn)品特征與銷售等級(jí)之間的關(guān)系[15]。Zhang等(2016)通過(guò)分析不同評(píng)論者對(duì)不同產(chǎn)品特征的情感極性,提出了一種設(shè)計(jì)產(chǎn)品改進(jìn)策略的方法[16]。Law和Gruss(2017)使用監(jiān)督機(jī)器學(xué)習(xí)算法,根據(jù)產(chǎn)品特性和用戶意見自動(dòng)發(fā)現(xiàn)洗碗機(jī)的缺陷[17]。
基于中文評(píng)論,學(xué)者基于大數(shù)據(jù)及文本處理方法提出基于中文的產(chǎn)品特征提取方法。王科等(2016)從知識(shí)庫(kù)和語(yǔ)料庫(kù)及兩者結(jié)合的角度提出了情感詞典構(gòu)建方法[18]。王偉等(2017)指出基于統(tǒng)計(jì)及機(jī)器學(xué)習(xí)技術(shù)的產(chǎn)品特征及其觀點(diǎn)的識(shí)別算法[19]。周清清等(2017)提出細(xì)粒度在線評(píng)論產(chǎn)品屬性抽取方法,通過(guò)候選屬性抽取、候選屬性聚類、噪音過(guò)濾等步驟,提取細(xì)粒度更高的產(chǎn)品屬性[20]。楊程等(2020)通過(guò)隱含狄利克雷主題模型及情感分析,得到用戶對(duì)手機(jī)產(chǎn)品屬性的關(guān)注度及滿意指標(biāo),建立評(píng)價(jià)指標(biāo)體系[21]。陳榮義等(2020)抓取國(guó)內(nèi)大型旅游網(wǎng)站點(diǎn)評(píng)文本,從高頻詞分析、社會(huì)網(wǎng)絡(luò)與語(yǔ)義網(wǎng)絡(luò)分析和情感分析3個(gè)方面分析游客滿意度的影響因素[22]。馬鳳才等(2020)爬取生鮮產(chǎn)品的文本評(píng)論,通過(guò)詞頻統(tǒng)計(jì)影響消費(fèi)者生鮮產(chǎn)品滿意度的關(guān)鍵要素,構(gòu)建特征詞表,得出4類生鮮產(chǎn)品的總體滿意度情況[23]。
2 研究方法
2.1 數(shù)據(jù)來(lái)源
本文研究目標(biāo)商品為消費(fèi)品,選取銷量大、質(zhì)量問(wèn)題較為嚴(yán)峻的商品進(jìn)行研究更有代表性。近年來(lái)在中國(guó)經(jīng)濟(jì)快速發(fā)展的背景下,護(hù)膚品需求呈井噴式增長(zhǎng)。Euromonitor資料顯示,護(hù)膚品在2018年零售額達(dá)2122億元人民幣,護(hù)膚品同比增長(zhǎng)13.2%。但面膜作為護(hù)膚品中常見的品類,其質(zhì)量情況卻令人憂心,在監(jiān)管部門的多次抽查中,面膜一直是出事的“重災(zāi)區(qū)”。并且面膜成本相對(duì)較低的特點(diǎn),使得不合格產(chǎn)品太容易改頭換面,相較于定期的質(zhì)量抽檢,消費(fèi)后立即反饋的在線評(píng)論數(shù)據(jù),能更快速地識(shí)別面膜的質(zhì)量風(fēng)險(xiǎn)。因此,本文選擇面膜作為研究對(duì)象。
在線評(píng)論數(shù)據(jù)需從電商平臺(tái)爬取、網(wǎng)易海拉網(wǎng)購(gòu)和京東均位于跨境電商行業(yè)前列,市場(chǎng)份額占領(lǐng)跨境電商行業(yè)39.1%[24],因此本文分別在網(wǎng)易考拉海購(gòu)與京東全球購(gòu)選取銷量第一的天佑蘭及美迪惠爾面膜作為目標(biāo)商品。將京東全球購(gòu)美迪惠爾面膜評(píng)論數(shù)據(jù)作為原始語(yǔ)料庫(kù),提取面膜質(zhì)量屬性,建立面膜質(zhì)量屬性語(yǔ)義詞典。之后建立質(zhì)量測(cè)算程序,測(cè)量網(wǎng)易考拉海購(gòu)天佑蘭面膜及京東全球購(gòu)美迪惠爾面膜消費(fèi)者感知質(zhì)量并作對(duì)比分析。
2.2 數(shù)據(jù)采集
本文采用python的selenium模塊,模擬瀏覽器行為,爬取網(wǎng)易考拉海購(gòu)與京東全球購(gòu)選取銷量第一的天佑蘭及美迪惠爾面膜評(píng)論。原始數(shù)據(jù)包括網(wǎng)址、用戶名、用戶等級(jí)(是否為會(huì)員)、商品型號(hào)、評(píng)論時(shí)間、評(píng)論等級(jí)、評(píng)論原文、該評(píng)論的點(diǎn)贊數(shù)。原始數(shù)共31399條。
2.3 數(shù)據(jù)預(yù)處理
在進(jìn)行質(zhì)量評(píng)估之前,要對(duì)爬取的評(píng)論數(shù)據(jù)進(jìn)行預(yù)處理。首先,刪除評(píng)論中的重復(fù)值。重復(fù)評(píng)論大多來(lái)自于刷單行為,或是用戶為贏取平臺(tái)評(píng)論任務(wù)獎(jiǎng)勵(lì)而復(fù)制的無(wú)效評(píng)論,移除重復(fù)評(píng)論以提高在線評(píng)論數(shù)據(jù)的有效性。經(jīng)過(guò)去重后,共有30769條評(píng)論數(shù)據(jù)用于產(chǎn)品質(zhì)量分析;其次,去除句子中無(wú)意義的停用詞,一般的停用詞包括句子中的助詞、連詞、表情符號(hào)等,針對(duì)在線評(píng)論文本的處理,本文在哈工大停用詞表基礎(chǔ)上,加入了平臺(tái)名稱、面膜品牌、面膜型號(hào)等與質(zhì)量評(píng)估無(wú)關(guān)的詞形成停用詞表,以進(jìn)行數(shù)據(jù)清洗。
2.4 質(zhì)量屬性詞典的提取
我國(guó)現(xiàn)行的面膜標(biāo)準(zhǔn)主要是QB/T 2872-2017,標(biāo)準(zhǔn)主要圍繞面膜的感官指標(biāo)(外觀、香氣)、理化指標(biāo)(pH、耐熱、耐寒)、衛(wèi)生指標(biāo)及凈含量[25]。在線評(píng)論中消費(fèi)者表達(dá)的更多是直觀的使用感受和產(chǎn)品的使用效果,如外觀、氣味等容易感知的質(zhì)量屬性被較多提及,而需要精密測(cè)量的理化指標(biāo),大部分消費(fèi)者并無(wú)法精確評(píng)價(jià),僅僅按照?qǐng)?zhí)行標(biāo)準(zhǔn)來(lái)提取質(zhì)量屬性是有局限的,需要結(jié)合在線文本語(yǔ)料以確定質(zhì)量屬性詞典,處理步驟如下。
(1)通過(guò)分詞及詞性標(biāo)注提取潛在質(zhì)量屬性詞
質(zhì)量屬性詞一般多為名詞、動(dòng)詞和形容詞,因此首先使用python的JIEBA模塊對(duì)在線評(píng)論語(yǔ)料進(jìn)行分詞及詞性標(biāo)注(POS),提取所有的名詞、動(dòng)詞和形容詞,進(jìn)行人工聚類,最終確定補(bǔ)水保濕、精華液、過(guò)敏性、膜布、嫩膚、提亮膚色、氣味、使用感、清潔排毒、包裝、真?zhèn)巍⒆甜B(yǎng)修復(fù)、控油、抗皺緊致、保質(zhì)期15種質(zhì)量屬性。
(2)減少歧義
對(duì)評(píng)論文本進(jìn)行分詞后,不可避免地使詞語(yǔ)喪失了上下文的支撐,提取的屬性詞容易產(chǎn)生歧義。在大部分情況下,屬性詞與某些限定詞進(jìn)行搭配,則可以確定其表意。對(duì)于這一部分的詞語(yǔ),形成限定詞和屬性詞組合,在識(shí)別中采用正則表達(dá)式匹配。限定詞與屬性詞組合提取規(guī)則如下:首先定位屬性詞所在的句子,再根據(jù)屬性詞詞性,確定提取規(guī)則。根據(jù)王偉(2017)基于特征的挖掘算法及人工標(biāo)注結(jié)果,限定詞和屬性詞抽取規(guī)則如表1所示。
(3)隱性特征的處理
由于在線評(píng)論具有表達(dá)不規(guī)范、多樣化、口語(yǔ)化的特征,存在部分詞語(yǔ)無(wú)法找到限定詞搭配的情況,容易產(chǎn)生歧義,如保濕屬性下的干燥一詞,在“秋冬季皮膚很干燥”下,并沒(méi)有描述產(chǎn)品的質(zhì)量,但在“用后皮膚還是很干燥”一句中則提到了面膜保濕弱的特征。對(duì)于這類容易產(chǎn)生歧義的詞語(yǔ),本文建造歧義詞庫(kù),對(duì)于該類詞語(yǔ),返回人工再次判斷。
(4)為情感極性賦分
最后,提取所有屬性特征后,對(duì)屬性特征情感賦分,1為正向情緒,-1為負(fù)向情緒。表2以面膜紙這一質(zhì)量屬性為例,展示質(zhì)量屬性語(yǔ)義詞典。
2.5 文本得分判斷
在該步驟中,計(jì)算在線評(píng)論文本情感的得分。該步驟用到自行整理的質(zhì)量屬性語(yǔ)義詞典、否定詞詞典及程度詞詞典。參考施曉彥等(2017)[26]的研究,假設(shè)質(zhì)量屬性包含在每個(gè)短句中(以標(biāo)點(diǎn)符號(hào)為分隔),以短句為單位識(shí)別質(zhì)量屬性,具體量化步驟如下。
第一,進(jìn)行限定詞與屬性詞的匹配并根據(jù)情感極性賦分,例如評(píng)論“這款面膜的材質(zhì)也是非常舒服的哦”,由于材質(zhì)+舒服搭配位于情感極性為1分的詞庫(kù)中,因此,該評(píng)論得分標(biāo)注為:“這款面膜的材質(zhì)也是非常舒服(+1)的哦”。
第二,判斷匹配成功的短句中是否存在程度詞及否定詞。若存在程度詞,則將程度詞得分(2或0.5)乘以產(chǎn)品屬性特征得分。若存在否定詞,則將否定詞得分(-1)乘以產(chǎn)品屬性特征得分。如上例“這款面膜的材質(zhì)也是非常舒服的哦”,識(shí)別到程度詞“非?!?,該評(píng)論得分標(biāo)注為:“這款面膜的材質(zhì)也是非常舒服(+2)的哦”。
第三,進(jìn)行隱形特征的匹配,若匹配成功,返回人工識(shí)別。
通過(guò)以上步驟,可量化每個(gè)評(píng)論中提及的質(zhì)量屬性評(píng)分,每個(gè)屬性的值為通過(guò)匹配得出的用戶情感值,得到消費(fèi)者對(duì)質(zhì)量屬性的評(píng)價(jià)。
3 質(zhì)量屬性感知質(zhì)量情況
3.1 質(zhì)量屬性關(guān)注度
識(shí)別消費(fèi)者最為關(guān)注的質(zhì)量屬性,有利于獲得質(zhì)量監(jiān)督中的重點(diǎn)方向。消費(fèi)者在評(píng)論中提及某種質(zhì)量屬性次數(shù)越多,該質(zhì)量屬性的關(guān)注度及重要性越高。通過(guò)統(tǒng)計(jì)提及質(zhì)量屬性的短句數(shù)目,計(jì)算消費(fèi)者對(duì)各分類質(zhì)量屬性的關(guān)注度。計(jì)算公式如下:
(1)
其中,Ai為特定質(zhì)量屬性的消費(fèi)者關(guān)注度, Fi為提及該質(zhì)量屬性的總句數(shù), i為各質(zhì)量屬性,以此計(jì)算消費(fèi)者對(duì)各分類質(zhì)量屬性的關(guān)注度,結(jié)果如表3所示。消費(fèi)者最為關(guān)注的質(zhì)量屬性前四位,皆為感官指標(biāo)??梢?,大數(shù)據(jù)挖掘在線評(píng)論進(jìn)行質(zhì)量識(shí)別,可有效補(bǔ)充質(zhì)量抽檢中無(wú)法檢測(cè)的用戶體驗(yàn)質(zhì)量。
3.2 質(zhì)量屬性情感評(píng)價(jià)
通過(guò)以短句為單位的情感分析,可以計(jì)算質(zhì)量屬性的情感極性,得到各個(gè)產(chǎn)品屬性的感知質(zhì)量(如表4、表5所示)。本文參考Wenhao Zhang(2012)[27],將正向情感比率60%設(shè)為門檻值,低于該門檻值的產(chǎn)品質(zhì)量屬性可能存在一定的質(zhì)量風(fēng)險(xiǎn)。對(duì)于網(wǎng)易考拉平臺(tái)售賣的天佑蘭面膜產(chǎn)品,消費(fèi)者對(duì)面膜紙、過(guò)敏性、保質(zhì)期正向評(píng)價(jià)率皆低于60%。通過(guò)對(duì)面膜紙、過(guò)敏性的負(fù)向評(píng)論進(jìn)行詞頻統(tǒng)計(jì)后可見(如圖1、圖2所示),消費(fèi)者認(rèn)為面膜紙不服帖、紙質(zhì)太厚、使用上不夠舒服;在面膜過(guò)敏性上,大部分負(fù)評(píng)消費(fèi)者反映開始使用時(shí)有刺痛的感覺(jué),對(duì)面部太刺激,部分消費(fèi)者甚至有過(guò)敏的現(xiàn)象。由于跨境電商平臺(tái)售賣海外進(jìn)口產(chǎn)品,跨境商品原產(chǎn)地質(zhì)量、安全、衛(wèi)生、環(huán)保、標(biāo)識(shí)等標(biāo)準(zhǔn)或技術(shù)規(guī)范要求可能與我國(guó)標(biāo)準(zhǔn)有所不同,而導(dǎo)致質(zhì)量風(fēng)險(xiǎn)的存在。對(duì)于保質(zhì)期的評(píng)價(jià),大部分負(fù)向評(píng)價(jià)消費(fèi)者皆表示收到距離生產(chǎn)日期較遠(yuǎn)的產(chǎn)品。由于與線下購(gòu)物相比,網(wǎng)購(gòu)體驗(yàn)環(huán)節(jié)缺失,商家打擦邊球售賣臨近保質(zhì)期產(chǎn)品而難以被追究責(zé)任,這提示了消費(fèi)者承擔(dān)信息不對(duì)稱性導(dǎo)致的質(zhì)量風(fēng)險(xiǎn)。
對(duì)于在京東平臺(tái)售賣的美迪惠爾面膜產(chǎn)品而言,所有的產(chǎn)品質(zhì)量屬性正向情感比率都在60%以上。在消費(fèi)者最關(guān)注的質(zhì)量屬性前五位中,真?zhèn)?、補(bǔ)水保濕、嫩膚消費(fèi)者正向評(píng)價(jià)皆在95%以上,對(duì)質(zhì)量的滿意度高;但對(duì)于精華液、使用感,消費(fèi)者總體評(píng)價(jià)相對(duì)較低,但都遠(yuǎn)超60%,如表5所示。
4 產(chǎn)品感知質(zhì)量評(píng)價(jià)
4.1 產(chǎn)品總體感知質(zhì)量評(píng)價(jià)
消費(fèi)者關(guān)注度越高的質(zhì)量屬性,越大程度上影響消費(fèi)者對(duì)質(zhì)量的認(rèn)知。因此,以每一質(zhì)量屬性的關(guān)注度確定質(zhì)量總體評(píng)價(jià)中各屬性的權(quán)重,計(jì)算公式如下:
(2)
其中,Ai為質(zhì)量屬性的關(guān)注度, Si為各質(zhì)量屬性的情感傾向比率, i為各質(zhì)量屬性,計(jì)算結(jié)果如表6所示。
由表6可見,京東售賣的美迪惠爾面膜正向質(zhì)量評(píng)價(jià)率比網(wǎng)易考拉售賣的佑天蘭面膜高4.9%,整體質(zhì)量評(píng)價(jià)更好。整體平均質(zhì)量為92%,該數(shù)據(jù)略低于上海市藥監(jiān)局2019年第1期化妝品抽檢質(zhì)量合格率98.3%,主要原因是相比于抽檢中使用的理化、衛(wèi)生等安全性指標(biāo),消費(fèi)者對(duì)感官指標(biāo)的感知更為靈敏。對(duì)比2019年《中國(guó)化妝品電子商務(wù)行業(yè)報(bào)告》中,消費(fèi)者對(duì)化妝品電商商品滿意度87.9%相比較高,原因主要是售賣平臺(tái)皆為行業(yè)頭部平臺(tái),平臺(tái)管理機(jī)制較為完善。
4.2 基于質(zhì)量屬性與基于評(píng)分的質(zhì)量評(píng)價(jià)對(duì)比
目前評(píng)價(jià)消費(fèi)者感知質(zhì)量,多使用消費(fèi)者在平臺(tái)上的評(píng)分(1~5分)進(jìn)行估計(jì),本文聚焦于評(píng)論文本這一非結(jié)構(gòu)化數(shù)據(jù),通過(guò)質(zhì)量屬性詞典提取用戶情感,對(duì)質(zhì)量進(jìn)行評(píng)價(jià),具有細(xì)粒度更高、信息承載量更大的特點(diǎn)。本文將上文計(jì)算得出的總體質(zhì)量正向計(jì)算結(jié)果與消費(fèi)者評(píng)分為4~5分的評(píng)論占比進(jìn)行比較,發(fā)現(xiàn)基于質(zhì)量屬性的評(píng)價(jià)方法能發(fā)現(xiàn)更多的感知質(zhì)量問(wèn)題,更大程度地還原消費(fèi)者的感知質(zhì)量評(píng)價(jià),如表7所示。
4.3 產(chǎn)品感知質(zhì)量離散程度
謝光明等(2019)指出,總體質(zhì)量評(píng)價(jià)的高低和評(píng)價(jià)的一致性都會(huì)影響消費(fèi)者的購(gòu)買決策。質(zhì)量評(píng)價(jià)的離散性越高,代表質(zhì)量評(píng)價(jià)褒貶不一的程度越高[28]。由表8可知,京東平臺(tái)售賣的美迪惠爾面膜產(chǎn)品正向感知質(zhì)量評(píng)價(jià)較高且離散程度較低,說(shuō)明該產(chǎn)品好評(píng)度較為集中;而網(wǎng)易考拉平臺(tái)售賣的佑天蘭面膜產(chǎn)品正向感知質(zhì)量評(píng)價(jià)較低但產(chǎn)品感知質(zhì)量離散程度較高,該產(chǎn)品對(duì)不同的消費(fèi)者可能產(chǎn)生不同的質(zhì)量風(fēng)險(xiǎn)。
5 結(jié)語(yǔ)
本研究提出了基于大數(shù)據(jù)分析的產(chǎn)品質(zhì)量評(píng)估方法。以面膜產(chǎn)品在線評(píng)論為數(shù)據(jù)源,評(píng)估方法包括的步驟有:數(shù)據(jù)收集、預(yù)處理、質(zhì)量屬性詞典的構(gòu)建、文本量化、質(zhì)量情況評(píng)估及質(zhì)量風(fēng)險(xiǎn)提示。通過(guò)分析30769條產(chǎn)品評(píng)論,構(gòu)建基于15個(gè)質(zhì)量屬性的質(zhì)量屬性語(yǔ)義詞典,得出2個(gè)面膜產(chǎn)品的平均合格率為92%。根據(jù)進(jìn)一步的數(shù)據(jù)分析,研究發(fā)現(xiàn):(1)消費(fèi)者最為關(guān)注的質(zhì)量屬性四位為精華液、補(bǔ)水保濕功效、使用感、嫩膚功效,多為感官指標(biāo)。通過(guò)大數(shù)據(jù)挖掘在線評(píng)論進(jìn)行質(zhì)量識(shí)別,可有效補(bǔ)充質(zhì)量抽檢中無(wú)法檢測(cè)的用戶體驗(yàn)質(zhì)量。(2)通過(guò)對(duì)正向情感比率低于60%的產(chǎn)品屬性進(jìn)行分析,發(fā)現(xiàn)網(wǎng)易考拉海購(gòu)平臺(tái)佑天蘭面膜存在跨境商品原產(chǎn)地標(biāo)準(zhǔn)或技術(shù)規(guī)范要求與我國(guó)標(biāo)準(zhǔn)不同而導(dǎo)致質(zhì)量風(fēng)險(xiǎn),以及網(wǎng)購(gòu)體驗(yàn)環(huán)節(jié)缺失導(dǎo)致的信息不對(duì)稱性所帶來(lái)的產(chǎn)品質(zhì)量風(fēng)險(xiǎn)。(3)與基于評(píng)分的質(zhì)量評(píng)估方法相比,基于質(zhì)量屬性的評(píng)價(jià)方法能發(fā)現(xiàn)更多的感知質(zhì)量問(wèn)題,更大程度地還原消費(fèi)者的感知質(zhì)量評(píng)價(jià)。(4)通過(guò)計(jì)算產(chǎn)品感知質(zhì)量離散程度,可提示正向感知質(zhì)量評(píng)價(jià)較低但產(chǎn)品感知質(zhì)量離散程度較高的產(chǎn)品,對(duì)不同的消費(fèi)者可能產(chǎn)生不同的質(zhì)量風(fēng)險(xiǎn)。
參考文獻(xiàn)
劉欣欣.基于消費(fèi)者感知的網(wǎng)絡(luò)購(gòu)物中商品質(zhì)量的影響因素研究[D]. 濟(jì)南:山東大學(xué),2005.
Valarie A. Zeithaml. Consumer Perceptions of Price, Quality, and Value: A Means-End Model and Synthesis of Evidence[J]. Journal of Marketing,1988,52(03).
Kirmani, Arena and Hans Baumgartner. Reference Points Treed in Quality and Value Judgments[J]. Marketing Letters, 2000, 11(04):299-310.
畢雪梅.顧客感知質(zhì)量研究[J].華中農(nóng)業(yè)大學(xué)學(xué)報(bào),2004,53(03): 42-45.
鐘凱.網(wǎng)絡(luò)消費(fèi)者感知價(jià)值對(duì)購(gòu)買意愿影響的研究[D].沈陽(yáng):遼寧大學(xué),2013.
張鶴冰,李春玲,魏勝.在線顧客感知質(zhì)量、感知價(jià)值對(duì)購(gòu)買意愿的影響——基于消費(fèi)者異質(zhì)性視角[J].企業(yè)經(jīng)濟(jì),2020(05):113-121.
鄭蔓華,黃夢(mèng)嵐,湯德聰,等.顧客感知質(zhì)量對(duì)顧客在線粘性的影響[J].林業(yè)經(jīng)濟(jì)問(wèn)題,2020,40(02):189-198.
宮華萍,尤建新,王岑嵐.互聯(lián)網(wǎng)學(xué)習(xí)產(chǎn)品學(xué)習(xí)者感知質(zhì)量因素研究[J].中國(guó)遠(yuǎn)程教育,2020(03):51-57+79+81.
崔永生.在線評(píng)論文本挖掘?qū)﹄娚痰挠绊懷芯縖J].中國(guó)商論,2018(33):17-23.
Hu,M.,& Liu, B. Mining and summarizing customer reviews[D]. Paper presented at the proceedings of the tenth ACM SIGKDD international conference on knowledge discovery and data mining,2004.
Chung, W., & Tseng, T.-L. B. Discovering business intelligence from online product reviews: A rule-induction framework[J]. Expert Systems with Applications,2012,39(15),11870-11879.
Lee, S., & Choeh, J. Y. Predicting the helpfulness of online reviews using multilayer perceptron neural networks. Expert Systems with Applications,2014, 41(06),3041-3046.
Kang, D., Y. Part.Review -based measurement of customer satisfaction in mobile service: Sentiment analysis and VIKOR approach[J]. Expert Systems with Applications,2014(41):1041-1050.
Tuarob, S., and Tucker, C. S. Quantifying Product Favorability and Extracting Notable Product Features Using Large Scale Social Media Data[J]. ASME. J. Comput. Inf. Sci. Eng. September, 2015, 15(03):031003.
Suryadi, D., & Kim, H. Identifying the relations between product features and sales rank from online reviews[D]. Paper presented at the ASME 2016 international design engineering technical conferences and computers and information in engineering conference,2016.
Zhang, H., Sekhari, A., Ouzrout, Y., & Bouras, A. Jointly identifying opinion mining elements and fuzzy measurement of opinion intensity to analyze product features[J]. Engineering Applications of Artificial Intelligence,2016(47):122-139.
Law, D., Gruss, R., & Abrahams, A. S. Automated defect discovery for dishwasher appliances from online consumer reviews[J]. Expert Systems with Applications,2017(67):84-94.
王科,夏睿.情感詞典自動(dòng)構(gòu)建方法綜述[J].自動(dòng)化學(xué)報(bào),2016,42(04):495-511.
王偉,王洪偉.特征觀點(diǎn)對(duì)購(gòu)買意愿的影響:在線評(píng)論的情感分析方法[J].系統(tǒng)工程理論與實(shí)踐,2016,36(01):63-76.
周清清,章成志.在線用戶評(píng)論細(xì)粒度屬性抽取[J].情報(bào)學(xué)報(bào),2017,36(05):484-493.
楊程,譚昆,俞春陽(yáng).基于評(píng)論大數(shù)據(jù)的手機(jī)產(chǎn)品改進(jìn)[J].計(jì)算機(jī)集成制造系統(tǒng),2020,26(11):1-19.
陳榮義,韓百川,呂梁,等.國(guó)家公園游憩利用區(qū)游客滿意度影響因素分析[J].林業(yè)經(jīng)濟(jì)問(wèn)題,2020,40(04):427-433.
馬鳳才,李春月.消費(fèi)者對(duì)電子商務(wù)平臺(tái)銷售生鮮產(chǎn)品滿意度測(cè)算研究——基于京東生鮮在線評(píng)論的分析[J].價(jià)格理論與實(shí)踐,2020(05):1-4.
艾瑞咨詢.2018年中國(guó)跨境進(jìn)口零售電商行業(yè)發(fā)展研究報(bào)告[EB/OL].http://report.iresearch.cn/report/201805/3203.shtml,2018-05-02.
陳麗暖.QB/T 2872-2017《面膜標(biāo)準(zhǔn)》的解讀與分析[J].質(zhì)量與認(rèn)證,2018(03):75-77.
施曉彥,曹喆岫,陳超,等.基于大數(shù)據(jù)的電商產(chǎn)品質(zhì)量評(píng)價(jià)研究——以兒童木制玩具為例[J].廣西財(cái)經(jīng)學(xué)院學(xué)報(bào),2017, 30(05):64-83.
Wenhao Zhang, Hua Xu, Wei Wan. Weakness Finder: Find product weakness from Chinese reviews by using aspects based sentiment analysis[J].Expert Systems With Applications,2012, 39(11).
謝光明,蔣玉石,石純來(lái).考慮稟賦效應(yīng)調(diào)節(jié)作用的網(wǎng)絡(luò)口碑離散對(duì)消費(fèi)者購(gòu)買意愿的影響[J].管理學(xué)報(bào),2019,16(03):425-438+455.