劉愉
摘要:本文通過國內(nèi)主流網(wǎng)購平臺收集用戶購買陶瓷產(chǎn)品后的評價信息,將評價內(nèi)容作為研究對象。應(yīng)用數(shù)據(jù)挖掘技術(shù),分析評價內(nèi)容中的情感分布、偏好。詞頻分析中外觀類的詞頻最高,所占比例為43.3%。說明顧客對陶瓷的藝術(shù)性、觀賞性、裝飾性考慮的比較多。這也符合現(xiàn)代社會人們追求個性的特點。研究表明,質(zhì)量、包裝兩個詞匯的緊密程度最高,陶瓷具有易碎,體積大、不易搬運等特性,所以許多顧客會擔憂商品會有破損、瑕疵等問題。建議陶瓷生產(chǎn)企業(yè)注重好的創(chuàng)意,在商品的外觀上滿足顧客個性化需求。在包裝上要考慮堅固性、密封性。在質(zhì)量上提升產(chǎn)品的耐用度和做工精細度。
關(guān)鍵詞:陶瓷產(chǎn)品;評價內(nèi)容;數(shù)據(jù)挖掘;詞頻
中圖分類號:TP311 ? ? ?文獻標識碼:A
文章編號:1009-3044(2020)28-0255-03
1 引言
近年來,隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,陶瓷行業(yè)的規(guī)模不斷擴大,用戶需求不斷增多。傳統(tǒng)的線下產(chǎn)品銷售方式無法滿足行業(yè)日新月異的變化。陶瓷企業(yè)需要結(jié)合電子商務(wù)的特點,開拓線上市場,發(fā)掘新的陶瓷產(chǎn)品的銷售渠道,達到多渠道相互交融。截至2019年6月,我國網(wǎng)絡(luò)購物用戶規(guī)模達6.39億,較2018年底增長2871萬,占網(wǎng)民整體的74.8%;手機網(wǎng)絡(luò)購物用戶規(guī)模達6.22億,較2018年底增長2989萬,占手機網(wǎng)民的73.4%。用戶在網(wǎng)購的過程中,會產(chǎn)生許多的行為數(shù)據(jù),如瀏覽、點擊、交易、評價等數(shù)據(jù)。其中商品的可量化或定性評價,最能直觀地反映用戶對到手的商品性價比、質(zhì)量等。本文以用戶購買后對商品的評價作為分析用戶偏好的主要研究對象。對數(shù)據(jù)分析處理,發(fā)現(xiàn)其中隱含的有價值的信息。為相關(guān)陶瓷企業(yè)提供生產(chǎn)決策。
2 商品評價數(shù)據(jù)的采集與處理
網(wǎng)絡(luò)購物市場規(guī)模巨大,其中天貓和京東作為國內(nèi)主要的電商平臺,無論是用戶數(shù)量還是商品數(shù)量都領(lǐng)先于其他電商平臺。電商平臺中,每件商品都會有用戶的評價數(shù)據(jù),其中包含了用戶昵稱、評價內(nèi)容、發(fā)表評價時間、評價圖片、顏色、尺碼等等。我們對它們進行采集、整理和歸類。本文主要使用Python數(shù)據(jù)爬蟲技術(shù)來獲取天貓、京東用戶的相關(guān)商品評價信息,作為研究數(shù)據(jù)源,提取出評價內(nèi)容作為主要研究對象。采集完數(shù)據(jù)后,我們要對采集的數(shù)據(jù)進行處理,對數(shù)據(jù)采用數(shù)據(jù)清洗,刪除無效數(shù)據(jù)等操作。對評價數(shù)據(jù)中的評價內(nèi)容進行文本分析。使用文本處理工具,便于我們觀察和得出結(jié)論。
2.1 客戶評價數(shù)據(jù)采集
由于各平臺的店鋪很多,并且各個店鋪對陶瓷產(chǎn)品的類型劃分有所差異。假設(shè)我們無規(guī)律隨意獲取平臺數(shù)據(jù),將會給后期數(shù)據(jù)的整理分類帶來很大的困擾。于是,我們首先現(xiàn)在各平臺,輸入“日用陶瓷”,再根據(jù)綜合、人氣、新品、銷量、價格、數(shù)據(jù)是否真實等條件。綜合考慮,挑選出排名比較靠前具有代表性的商家店鋪。店鋪選取步驟如圖1所示。
本文從天貓、京東各挑選出三個店鋪,從這些店鋪中獲得顧客評價信息數(shù)據(jù)樣本。將店鋪中某些商品評價數(shù)據(jù)采集,商品有景德鎮(zhèn)骨瓷餐具、韓式竹葉廚房陶瓷套裝等。然后將數(shù)據(jù)保存至json文件。包括評價時間、評價星級、評價昵稱、評價內(nèi)容、評價圖片、點贊數(shù)、評論數(shù)等等。其中評價內(nèi)容是用戶收到商品后的客觀反映,對分析用戶的偏好最具參考價值。將所有的評價內(nèi)容都保存為csv文件。
為了提高結(jié)果的準確性,評價內(nèi)容必須具有實際參考意義。此處,我們定義一個參數(shù)Q:
如果Q值大于20%,說明選取的該商品評論中重復(fù)評論占比例較大,對最后的分析結(jié)果準確性影響很大。我們選擇Q值小于20%的商品作為研究的數(shù)據(jù)樣本。最終我們得到所有評價內(nèi)容數(shù)據(jù)樣本,京東9080條,天貓14551條。
2.2 評價數(shù)據(jù)預(yù)處理
通過數(shù)據(jù)采集中的Q值標準,我們已經(jīng)得到了用于研究的數(shù)據(jù)樣本。我們需要對這些評價內(nèi)容的樣本數(shù)據(jù)進行預(yù)處理。將評價中包括空評價、評價內(nèi)容過短的、重復(fù)評價等無效數(shù)據(jù)進行過濾。字符不超過5個的評價我們認定為過短評價。評價內(nèi)容完全一致的認定為重復(fù)評價。經(jīng)過數(shù)據(jù)預(yù)處理后,我們得到天貓有效評價內(nèi)容數(shù)據(jù)10929條.京東有效評價內(nèi)容為9080條。經(jīng)過數(shù)據(jù)預(yù)處理后的數(shù)據(jù)存儲為CSV文件,用于數(shù)據(jù)分析。部分數(shù)據(jù)如圖2所示。
3 結(jié)果與分析
3.1 情感分析研究
情感分析是對帶有感情色彩的詞語進行分析、處理、歸納和推理。本文研究對象是評價內(nèi)容的文本,它可以表達出用戶的主觀傾向性。文本中反饋的情感信息可以判斷出商品是否受消費者喜愛。并且可以通過某些含有情緒的詞語,找出影響消費者情緒的特征。
對所有評價數(shù)據(jù)分析后得,積極情緒為17688條,占比89.37%;中性情緒為1461條,占比7.46%;消極情緒為643條,占比3.17%。其中積極情緒和消極情緒分段的統(tǒng)計結(jié)果如下表1:
以上可以反映出大多數(shù)的購買者對這些商品整體的評價是好的。評價內(nèi)容中含有如”顏色漂亮”“釉色干凈”“質(zhì)量好”快遞速度快‘等積極情緒描述。還有一些消極情緒的描述“小瑕疵”“黑點”“凸起”等,反映出部分商品不足的地方。
3.2 社會網(wǎng)絡(luò)和語義網(wǎng)絡(luò)分析
在語義網(wǎng)絡(luò)中,每一個節(jié)點和弧都必須有標志,用來說明它所代表的實體或語義。詞匯之間連線越多的詞,代表著它和其他詞匯的聯(lián)系越緊密。所有商品評價內(nèi)容社會網(wǎng)絡(luò)語義和網(wǎng)絡(luò)分析如圖3所示:
在這些評價內(nèi)容中,我們不難發(fā)現(xiàn)中心的詞匯有“質(zhì)量”、“包裝”、“物流”、“服務(wù)”等。這些詞匯在評價中經(jīng)常出現(xiàn),并且與其他詞匯關(guān)系緊密。將詞匯連接強度排名前10的提取出來。如表2:
從表中可以清晰地看出“質(zhì)量—包裝”連接強度為953,“破損—包裝”連接強度為869,“滿意—包裝”連接強度為843,“漂亮—包裝”連接強度765,排名前4。表明在所有評價中,包裝與其他詞匯的關(guān)系最為緊密。可以很清晰地看到客戶比較在意包裝,這可能和陶瓷這類商品的屬性特征有關(guān)。陶瓷商品大部分易碎、具有一定重量、體積大、不易搬運,快遞運輸過程中會有點麻煩。堅固的包裝可以防止商品破損變形,在運輸過程中抗震抗摔性更強,顧客更加放心。漂亮的包裝可以吸引顧客的眼球,愛美之心人皆有之,商品更能得到顧客的青睞。
3.3 偏好分析
采集的所有評價數(shù)據(jù),在經(jīng)過數(shù)據(jù)處理后,對評價內(nèi)容文本,進行了分詞處理,然后進行詞頻統(tǒng)計分析。本文取詞頻排名前45的詞匯,統(tǒng)計結(jié)果如表3。
經(jīng)過仔細的研究和查閱資料。本文將這些詞匯主要劃分為五大類:“質(zhì)量”“外觀”“物流”“服務(wù)”“其他”。在詞頻排名前45的詞匯中,與前四類相關(guān)的詞匯所占比例比較大,所以用這四類總結(jié)概括,其他詞頻相對較少的詞匯都歸為“其他”類。最終我們得出:外觀類詞頻最多,所占比例為43.3%;其次是質(zhì)量類,所占比例為23.4%;然后是物流類,所占比例17.1%;接著是服務(wù)類:所占比例為9.9%;最后其他類,所占比例6.3%。
對主要的類別進行分析:
外觀類:所有評論中外觀類詞匯出現(xiàn)的頻率最高,現(xiàn)在的顧客的消費習慣已經(jīng)更注重商品的外在設(shè)計。商品的顏色、花紋、款式等是否有新意,是否能博取顧客的眼球越來越重要了。有創(chuàng)意的產(chǎn)品,可以提升商品的價值。商品的外觀融入更多的元素,結(jié)合更多的文化,更能滿足現(xiàn)代社會人們的精神追求。
質(zhì)量類:質(zhì)量的內(nèi)容比較抽象,表示產(chǎn)品的優(yōu)劣程度和耐用程度的好壞。做工精細、細膩等是質(zhì)量的重要保證。根據(jù)前面社會網(wǎng)絡(luò)和語義網(wǎng)絡(luò)分析,購買和質(zhì)量的連接強度值遠遠大于其他幾個類詞匯;并且結(jié)合具體評價內(nèi)容數(shù)據(jù),可知顧客往往會因為商品的耐用度等考慮再次購買。質(zhì)量的好壞對客戶忠誠度的影響很大。
4 結(jié)論與建議
4.1 結(jié)論
根據(jù)對評價內(nèi)容做出的分析可知,在社會網(wǎng)絡(luò)和語義網(wǎng)絡(luò)分析中,可以發(fā)現(xiàn)“包裝”這個中心詞匯,非常重要,和其他詞匯的緊密性排名靠前,顧客比較在意。因為陶瓷具有易碎、體積大、重量大、不易搬運等特征,商品容易出現(xiàn)意外損壞、摩擦產(chǎn)生瑕疵、受潮受污染等情況,這對包裝的堅固性、密封性是一種考驗。并且包裝精美的陶瓷商品更能贏得顧客的好感。偏好分析中,外觀類詞匯所占比例為43.3%,得出顧客最在乎陶瓷商品的外觀,商品的顏色、風格、圖案、花紋等都是顧客關(guān)注的方面。商品的外觀設(shè)計尤為重要,現(xiàn)在的顧客更容易被外觀新穎的商品所吸引。這也符合現(xiàn)在人們對個性化的追求。而對于吸引顧客是否會再次購買的最重要因素包括商品的質(zhì)量即商品的耐用度、做工精細程度等。質(zhì)量好的商品,客戶的忠誠度更高。
4.2 建議
4.2.1 商品包裝
因為陶瓷商品的特性,顧客比較在意包裝。陶瓷企業(yè)或者商家應(yīng)該在商品的包裝上下功夫。首先應(yīng)該強化包裝的堅固性和密封性。找抗震抗摔等材料做外殼,讓商品在整個運輸過程中避免受損變形。另一方面,包裝具有美化的功能,對顧客視覺上有一定的沖擊,容易留下對產(chǎn)品的最初印象。同時精美的包裝能提升產(chǎn)品的檔次,得到顧客的贊許。
4.2.2 商品外觀設(shè)計
根據(jù)顧客當前的消費習慣,找到迎合顧客的商品外觀甚至引領(lǐng)潮流的外觀設(shè)計。外觀設(shè)計方面要注重好的創(chuàng)意,對市場上流行的顏色、花紋、圖案等方面進行再創(chuàng)新,可以多元文化相互融合,可以加入時代特性,可以添加多種元素風格,例如中國風、民族風等。提升產(chǎn)品的藝術(shù)性、觀賞性、裝飾性等。體現(xiàn)商品的內(nèi)在價值,讓商品既有藝術(shù)性,又有實用性,最大程度上地滿足客戶的個性化需求。
4.2.3 商品耐用度
滿足客戶的個性化追求的同時,也要保證商品的耐用度。探索研發(fā)新材料新技術(shù),提高做工的精細度,減少商品的瑕疵,做好質(zhì)量把控。
【通聯(lián)編輯:李雅琪】