劉寶順,陳越
基于評(píng)論文本的產(chǎn)品意象參數(shù)化評(píng)價(jià)方法
劉寶順,陳越
(河北工業(yè)大學(xué),天津 300132)
將評(píng)論文本挖掘方法與設(shè)計(jì)調(diào)研的多樣化需求相匹配,將文本挖掘結(jié)果與設(shè)計(jì)方案的參數(shù)化分析與評(píng)價(jià)相結(jié)合。通過(guò)網(wǎng)絡(luò)爬蟲(chóng)獲取購(gòu)物網(wǎng)站中的產(chǎn)品評(píng)論文本,明確調(diào)研目標(biāo),使用意象詞匯進(jìn)行描述,采用關(guān)鍵詞提取與詞匯相似度計(jì)算方法,計(jì)算產(chǎn)品在調(diào)研目標(biāo)上的意象傾向,并進(jìn)行參數(shù)化表示。分類(lèi)提取產(chǎn)品的特征參數(shù),使用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建產(chǎn)品特征參數(shù)與意象參數(shù)間的映射關(guān)系,形成產(chǎn)品評(píng)論模型,將產(chǎn)品特征參數(shù)輸入映射關(guān)系中,得到調(diào)研目標(biāo)上的意象參數(shù),實(shí)現(xiàn)產(chǎn)品意象的參數(shù)化挖掘與評(píng)價(jià)。以手機(jī)為例進(jìn)行驗(yàn)證,所得意象參數(shù)預(yù)測(cè)值與真實(shí)值之間的差異均值分別為0.016 0、-0.014 6、-0.013 7,評(píng)價(jià)模型較為有效。所提方法能夠從評(píng)論文本中有效地提取意象傾向,并表示為調(diào)研目標(biāo)上的傾向參數(shù),加強(qiáng)了產(chǎn)品評(píng)論文本挖掘與設(shè)計(jì)調(diào)研之間的關(guān)系,提高了文本挖掘結(jié)果的可理解性。
產(chǎn)品評(píng)論;文本挖掘;設(shè)計(jì)調(diào)研;感性工學(xué);BP神經(jīng)網(wǎng)絡(luò)
隨著互聯(lián)網(wǎng)浪潮的來(lái)臨,網(wǎng)絡(luò)購(gòu)物也日益普及,目前已成為消費(fèi)者選購(gòu)商品的重要手段。在網(wǎng)絡(luò)購(gòu)物過(guò)程中,相應(yīng)產(chǎn)品的已有評(píng)論是影響消費(fèi)者購(gòu)物決策的重要因素,因此,分析在線商城中消費(fèi)者的評(píng)論文本,以此對(duì)產(chǎn)品進(jìn)行改進(jìn),可以提高產(chǎn)品銷(xiāo)量。
文本挖掘是數(shù)據(jù)挖掘領(lǐng)域的一個(gè)重要分支,指從大量的文本集合或語(yǔ)料庫(kù)中抽取具有潛在實(shí)用價(jià)值的模型或知識(shí)。文本挖掘具有多學(xué)科融合的特點(diǎn),涵蓋信息技術(shù)、文本分析、統(tǒng)計(jì)學(xué)、數(shù)據(jù)可視化等多個(gè)方面[1]。
文本挖掘作為一種文本分析技術(shù),被廣泛應(yīng)用于情感分析、自動(dòng)摘要、對(duì)話系統(tǒng)等場(chǎng)景中,也有學(xué)者將文本挖掘方法應(yīng)用于產(chǎn)品評(píng)論文本的分析挖掘中,如郝玫等[2]結(jié)合中文句法關(guān)系以及特征與觀點(diǎn)的匹配關(guān)系,使用產(chǎn)品特征樹(shù)來(lái)分析同類(lèi)產(chǎn)品的觀點(diǎn)差異;金吉瓊等[3]通過(guò)主題模型對(duì)消費(fèi)者評(píng)論文本的主題進(jìn)行分類(lèi),分析了國(guó)內(nèi)消費(fèi)者對(duì)電子煙的關(guān)注點(diǎn);趙志濱等[4]使用細(xì)粒度情感分析方法,分析了消費(fèi)者評(píng)論文本中各個(gè)維度的情感傾向,以及消費(fèi)者對(duì)產(chǎn)品整體的情感傾向。這些研究表明,文本挖掘能夠有效提取產(chǎn)品評(píng)論文本中所包含的產(chǎn)品體驗(yàn)信息。
現(xiàn)有的產(chǎn)品評(píng)論文本挖掘方法大多是對(duì)評(píng)論文本進(jìn)行分析,難以滿(mǎn)足設(shè)計(jì)調(diào)研的多樣化需求。同時(shí),文本挖掘的結(jié)果主要通過(guò)詞匯的形式進(jìn)行表達(dá),難以進(jìn)一步參與設(shè)計(jì)方案的參數(shù)化分析與評(píng)價(jià)。
感性工學(xué)起源于日本,指將較為模糊的感性需求及意象轉(zhuǎn)化為細(xì)節(jié)設(shè)計(jì)的形態(tài)要素[5]。感性工學(xué)專(zhuān)家系統(tǒng)又被稱(chēng)為KE模型,其核心是產(chǎn)品特征與意象之間的關(guān)聯(lián)關(guān)系,并以此實(shí)現(xiàn)感性意象與產(chǎn)品特征之間的轉(zhuǎn)換[6],從而將消費(fèi)者對(duì)現(xiàn)有產(chǎn)品的體驗(yàn)信息融入新產(chǎn)品的設(shè)計(jì)中。
目前,感性工學(xué)被廣泛應(yīng)用于產(chǎn)品的分析與設(shè)計(jì)指導(dǎo),如王天賦等[7]采用語(yǔ)義差異分析法和Likert心理量表分析法,從造型、色彩、材質(zhì)、功能和體驗(yàn)5個(gè)方面進(jìn)行了感性意象分析,推導(dǎo)出了汽車(chē)內(nèi)飾設(shè)計(jì)需求與形態(tài)的關(guān)聯(lián)關(guān)系;付成杰等[8]分析了目前的鏡框造型要素,調(diào)研了使用者對(duì)鏡框的感性認(rèn)知,采用了因子分析等方法篩選了符合意象的感性詞匯,最后運(yùn)用灰關(guān)聯(lián)分析法,得到了造型與產(chǎn)品意象的關(guān)聯(lián)程度;趙艷云等[9]以表帶材質(zhì)為例進(jìn)行了調(diào)查分析,以感性工學(xué)為理論依據(jù),量化了用戶(hù)對(duì)材質(zhì)的感性認(rèn)知,構(gòu)建了材質(zhì)意象的決策模型,并驗(yàn)證了方法的有效性。這些研究表明,感性工學(xué)能夠有效分析用戶(hù)感性意象與設(shè)計(jì)要素之間的關(guān)系。
基于感性工學(xué)方法,通過(guò)分析產(chǎn)品體驗(yàn)信息與產(chǎn)品設(shè)計(jì)要素間的映射關(guān)系,形成KE模型,對(duì)新生成的產(chǎn)品進(jìn)行評(píng)價(jià),從而將消費(fèi)者的評(píng)價(jià)數(shù)據(jù)應(yīng)用于產(chǎn)品后續(xù)的設(shè)計(jì)參考。
現(xiàn)有產(chǎn)品評(píng)論文本挖掘方法難以滿(mǎn)足設(shè)計(jì)調(diào)研的多樣化需求,文本挖掘結(jié)果難以進(jìn)一步參與設(shè)計(jì)方案的參數(shù)化分析與評(píng)價(jià)。針對(duì)上述問(wèn)題,基于感性工學(xué)理論,結(jié)合關(guān)鍵詞提取、BP神經(jīng)網(wǎng)絡(luò)等方法,提出了基于評(píng)論文本的產(chǎn)品意象參數(shù)化挖掘與評(píng)價(jià)方法,主要步驟為產(chǎn)品評(píng)論文本獲取、目標(biāo)驅(qū)動(dòng)的產(chǎn)品意象參數(shù)化挖掘、產(chǎn)品特征參數(shù)提取、基于BP神經(jīng)網(wǎng)絡(luò)的KE模型構(gòu)建、基于KE模型的產(chǎn)品評(píng)論。方法流程見(jiàn)圖1。
圖1 方法流程
產(chǎn)品評(píng)論文本主要分散于各個(gè)購(gòu)物網(wǎng)站的相關(guān)產(chǎn)品頁(yè)面中,需要對(duì)其進(jìn)行收集與匯總。網(wǎng)絡(luò)爬蟲(chóng)是一種方便高效的網(wǎng)頁(yè)信息獲取工具。網(wǎng)絡(luò)爬蟲(chóng)按設(shè)定的規(guī)則抓取特定的網(wǎng)頁(yè),再通過(guò)對(duì)網(wǎng)頁(yè)內(nèi)容的解析和提取來(lái)獲取文本信息[10],是目前常用的信息收集方式,因此,可通過(guò)爬蟲(chóng)工具來(lái)獲取網(wǎng)絡(luò)購(gòu)物網(wǎng)站中的評(píng)論文本。在得到相關(guān)產(chǎn)品的評(píng)論文本與產(chǎn)品信息后,對(duì)其進(jìn)行整理與保存,以便后續(xù)進(jìn)行分析。
為了保證產(chǎn)品評(píng)論文本挖掘的準(zhǔn)確性,需要對(duì)獲取到的產(chǎn)品評(píng)論文本進(jìn)行預(yù)處理。由于部分購(gòu)物網(wǎng)站會(huì)對(duì)參與產(chǎn)品評(píng)論的用戶(hù)進(jìn)行獎(jiǎng)勵(lì),所以部分消費(fèi)者為了快速獲取相關(guān)獎(jiǎng)勵(lì)會(huì)選擇復(fù)制他人的評(píng)論,導(dǎo)致獲取到的文本會(huì)出現(xiàn)大量的重復(fù)文本。為了保證評(píng)論文本的唯一性,減小重復(fù)評(píng)論造成的影響,需要對(duì)文本進(jìn)行去重處理。隨后,對(duì)文本進(jìn)行分詞處理,以便后續(xù)進(jìn)行文本關(guān)鍵詞的提取。
首先,確定設(shè)計(jì)調(diào)研目標(biāo)詞匯,將其作為產(chǎn)品評(píng)論文本挖掘與參數(shù)化表達(dá)的基準(zhǔn)。設(shè)計(jì)調(diào)研目標(biāo)一般由多個(gè)意象詞匯組合而成,若假設(shè)調(diào)研目標(biāo)為,包含個(gè)感性意象,則設(shè)計(jì)調(diào)研目標(biāo):
形容詞通常被用于表達(dá)人的主觀感受,在產(chǎn)品評(píng)論文本中主要用來(lái)表示用戶(hù)對(duì)產(chǎn)品的態(tài)度。通過(guò)提取評(píng)論文本中形容詞性的關(guān)鍵詞,并將其作為用戶(hù)對(duì)產(chǎn)品的意象詞匯,相應(yīng)的關(guān)鍵詞權(quán)重即意象詞匯的傾向,能夠反映消費(fèi)者對(duì)產(chǎn)品的意象傾向。
TF-IDF由Salton[11]于1988年提出,是目前較為常用的無(wú)監(jiān)督文本提取方法。TF為詞頻,表示該詞條在文檔中的出現(xiàn)頻率。IDF是逆向文件頻率,表示該詞條在其他文檔中的區(qū)分能力[12]。通過(guò)TF與IDF的乘積運(yùn)算,能有效得到詞條在文檔間的區(qū)分效果?;赥F-IDF算法,提取到的樣本感性意象詞匯:
最后,結(jié)合樣本意象關(guān)鍵詞權(quán)重參數(shù),對(duì)各個(gè)目標(biāo)意象詞匯與樣本意象關(guān)鍵詞之間的相似度進(jìn)行匯總,樣本感性意象表示如下:
如式(4)所示,產(chǎn)品評(píng)論文本意象挖掘結(jié)果被表示為設(shè)計(jì)調(diào)研目標(biāo)上的傾向參數(shù),以此為基礎(chǔ),能夠?qū)崿F(xiàn)以設(shè)計(jì)調(diào)研目標(biāo)為基礎(chǔ)的產(chǎn)品意象參數(shù)化挖掘。
產(chǎn)品的色彩、形態(tài)、硬件配置等元素的提取方法,可按照是否由人工主觀判斷,劃分為基于人工的方式和基于參數(shù)化的方式[6]。人工提取方式包括形態(tài)分析法、類(lèi)目層次法等,旨在通過(guò)研究員的主觀判斷,將產(chǎn)品元素進(jìn)行拆解和編號(hào),該類(lèi)方式除產(chǎn)品形態(tài)外,還可對(duì)產(chǎn)品配置和服務(wù)等特征進(jìn)行分析,適用范圍較廣?;趨?shù)化的方式包括參數(shù)模型法、曲線控制法等,通過(guò)對(duì)產(chǎn)品的特征進(jìn)行描繪,得到連續(xù)型參數(shù),該類(lèi)方式多用于分析產(chǎn)品的外觀細(xì)節(jié)。
基于參數(shù)化的提取方式要求產(chǎn)品特征較為統(tǒng)一,且無(wú)法提取配置類(lèi)產(chǎn)品的特征參數(shù),因此,此次研究采用基于人工的處理方式。類(lèi)目層次法對(duì)產(chǎn)品進(jìn)行編號(hào)時(shí),容易因?qū)蛹?jí)關(guān)系導(dǎo)致編號(hào)位數(shù)增長(zhǎng),在構(gòu)建關(guān)聯(lián)關(guān)系時(shí),容易對(duì)部分?jǐn)?shù)值敏感型算法的構(gòu)建精度產(chǎn)生不利影響。為了擴(kuò)大產(chǎn)品特征參數(shù)提取的適用范圍,同時(shí)避免對(duì)后續(xù)關(guān)聯(lián)關(guān)系的構(gòu)建產(chǎn)生不利影響,使用形態(tài)分析法獲取產(chǎn)品特征參數(shù),對(duì)各個(gè)類(lèi)別的特征進(jìn)行人工分類(lèi)編號(hào),得到的產(chǎn)品特征參數(shù):
神經(jīng)網(wǎng)絡(luò)是一種機(jī)器學(xué)習(xí)模型,通過(guò)將感知器進(jìn)行相互連接,形成一種類(lèi)似人腦神經(jīng)元連接方式的網(wǎng)絡(luò)結(jié)構(gòu),常用于處理分類(lèi)問(wèn)題,以及輸入與輸出變量之間的關(guān)系問(wèn)題等[13]。BP神經(jīng)網(wǎng)絡(luò)是指使用反向傳播算法(Back Propagation,BP)進(jìn)行誤差校正以實(shí)現(xiàn)網(wǎng)絡(luò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò),是目前使用范圍較廣的神經(jīng)網(wǎng)絡(luò)之一。
由于神經(jīng)網(wǎng)絡(luò)能夠自動(dòng)學(xué)習(xí)數(shù)據(jù)中的知識(shí)與信息,并能夠利用神經(jīng)元之間的連接強(qiáng)度儲(chǔ)存所學(xué)到的信息,所以能夠自動(dòng)逼近任何非線性函數(shù)[14],在產(chǎn)品設(shè)計(jì)研究中有著廣泛的應(yīng)用,如Guo等[15]使用BP神經(jīng)網(wǎng)絡(luò),分析了感性意象參數(shù)與求職網(wǎng)站設(shè)計(jì)要素之間的映射關(guān)系。BP神經(jīng)網(wǎng)絡(luò)通過(guò)輸入的數(shù)據(jù),可以自動(dòng)學(xué)習(xí)數(shù)據(jù)間非線性相關(guān)關(guān)系的特點(diǎn),能夠有效處理產(chǎn)品設(shè)計(jì)與感性工學(xué)專(zhuān)家系統(tǒng)的映射關(guān)系[16]。
BP神經(jīng)網(wǎng)絡(luò)一般包含輸入層、隱含層、輸出層,其中輸入層的神經(jīng)元數(shù)量一般與自變量的數(shù)量相等,輸出層的神經(jīng)元數(shù)量與因變量的數(shù)量相等,隱含層的數(shù)量:
BP神經(jīng)網(wǎng)絡(luò)一般通過(guò)梯度下降算法進(jìn)行訓(xùn)練:
在得到設(shè)計(jì)特征參數(shù)與產(chǎn)品意象參數(shù)的映射關(guān)系(前向式KE模型)后,可進(jìn)行新產(chǎn)品的感性意象評(píng)價(jià)。首先,結(jié)合已有的各類(lèi)產(chǎn)品特征中的編號(hào)依據(jù),對(duì)新產(chǎn)品的產(chǎn)品特征進(jìn)行分類(lèi)編號(hào),得到新產(chǎn)品的產(chǎn)品特征參數(shù)。隨后,將得到的產(chǎn)品特征參數(shù)輸入KE模型中,輸出感性意象參數(shù)。
將計(jì)算得到的感性意象參數(shù)直接用于評(píng)價(jià)的效果不佳,需要與已有的樣本數(shù)值對(duì)比進(jìn)行分析。為方便直觀地理解輸出的感性意象參數(shù),使用歸一化法進(jìn)行數(shù)據(jù)處理,將數(shù)據(jù)統(tǒng)一映射到0~1,并將有量綱的數(shù)據(jù)轉(zhuǎn)化為無(wú)量綱的純數(shù)值[17]。歸一化的處理方式能保持原始數(shù)據(jù)排序不變,同時(shí)方便解讀及評(píng)價(jià),因此,歸一化法常用于比較和評(píng)價(jià)指標(biāo)處理。得到歸一化的數(shù)據(jù)處理結(jié)果后,可從數(shù)值直觀地感受到用戶(hù)的情感傾向:歸一值越接近1,代表消費(fèi)者對(duì)應(yīng)感性意象下的評(píng)價(jià)表現(xiàn)越好;歸一值越接近0,代表消費(fèi)者對(duì)應(yīng)感性意象下的評(píng)價(jià)表現(xiàn)越差。歸一化表達(dá)式:
通過(guò)代入產(chǎn)品特征參數(shù)來(lái)預(yù)測(cè)市場(chǎng)評(píng)價(jià),能快速預(yù)測(cè)新產(chǎn)品的市場(chǎng)評(píng)價(jià),從而確定新產(chǎn)品的宣傳方式和定價(jià)策略。另外,研究員可結(jié)合公司戰(zhàn)略設(shè)定產(chǎn)品評(píng)價(jià)傾向的目標(biāo),并不斷調(diào)整輸入的產(chǎn)品特征參數(shù),直至達(dá)到預(yù)定的產(chǎn)品評(píng)價(jià)目標(biāo)。
手機(jī)是一種在生活中被廣泛使用的電子產(chǎn)品,同時(shí)也是網(wǎng)絡(luò)購(gòu)物中的重要商品,有關(guān)的產(chǎn)品評(píng)論文本較為豐富,因此,此次研究選取手機(jī)作為驗(yàn)證對(duì)象。為了避免不同品牌的印象造成的意象差異,因此,僅選定華為手機(jī)作為研究對(duì)象。首先,使用網(wǎng)絡(luò)爬蟲(chóng)從京東商城中獲取40款近期尚在銷(xiāo)售的手機(jī)的評(píng)論文本,并將爬取到的數(shù)據(jù)進(jìn)行分類(lèi)保存。隨后,從互聯(lián)網(wǎng)上查找并保存所獲取到的手機(jī)的配置信息,結(jié)合配置信息對(duì)手機(jī)進(jìn)行編號(hào),將同一名稱(chēng)、不同配置的手機(jī)視為不同的樣本,共計(jì)75個(gè)樣本。對(duì)各個(gè)樣本的評(píng)論文本進(jìn)行預(yù)處理,刪除其中的重復(fù)文本,并使用Jieba工具包對(duì)其進(jìn)行分詞處理。
在進(jìn)行產(chǎn)品意象參數(shù)計(jì)算時(shí),需要首先確定調(diào)研目標(biāo)。選定手機(jī)中較為重要的3個(gè)感性意象作為調(diào)研目標(biāo),分別為“流暢”“清晰”“漂亮”。隨后,結(jié)合各個(gè)樣本編號(hào)所表示的機(jī)型,選取對(duì)應(yīng)的評(píng)論文本,然后,使用TF-IDF算法提取各個(gè)樣本的關(guān)鍵詞。設(shè)定每個(gè)樣本評(píng)論文本中提取的關(guān)鍵詞數(shù)量為5,關(guān)鍵詞提取的部分結(jié)果見(jiàn)表1。
表1 關(guān)鍵詞提取結(jié)果(部分)
Tab.1 Key words extraction results (partial)
為了計(jì)算產(chǎn)品意象詞匯與調(diào)研目標(biāo)詞匯之間的相似度,需要構(gòu)建能夠表達(dá)部分語(yǔ)義關(guān)系的文本詞向量模型。對(duì)預(yù)處理后的文本進(jìn)行匯總,使用word2vec工具構(gòu)建詞向量模型,設(shè)定維度為50。以詞向量模型為基礎(chǔ),對(duì)感性意象詞匯與調(diào)研目標(biāo)詞匯進(jìn)行參數(shù)化表示,通過(guò)式(3)計(jì)算感性意象關(guān)鍵詞與調(diào)研目標(biāo)詞匯之間的相關(guān)度,通過(guò)式(4)計(jì)算相應(yīng)樣本的感性意象參數(shù),所得到的感性意象參數(shù)見(jiàn)圖2。
圖2 感性意象參數(shù)分布
通過(guò)互聯(lián)網(wǎng)獲取75個(gè)樣本的配置信息,結(jié)合京東商城中手機(jī)的部分分類(lèi)方式,對(duì)樣本的產(chǎn)品特征進(jìn)行分類(lèi),見(jiàn)表2。得到的產(chǎn)品特征參數(shù)部分結(jié)果見(jiàn)表3。
由于實(shí)例中參與分析的產(chǎn)品特征有處理器、運(yùn)行內(nèi)存、存儲(chǔ)容量、后置相機(jī)像素、前置相機(jī)類(lèi)型、屏幕分辨率(短邊)、屏幕尺寸等7類(lèi),所以設(shè)定輸入層的神經(jīng)元數(shù)量為7。由于調(diào)研目標(biāo)中的目標(biāo)意象詞匯有3個(gè),所以設(shè)定輸出層的神經(jīng)元數(shù)量為3。隨后,基于式(6)設(shè)定隱含層的神經(jīng)元數(shù)量為8,相應(yīng)的BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)見(jiàn)圖3。
結(jié)合輸入和輸出的數(shù)據(jù)特點(diǎn)及其取值范圍,通過(guò)多次優(yōu)選,設(shè)定輸入層、隱含層、輸出層的激活函數(shù)分別為tanh、tanh、relu,損失函數(shù):
在樣本中進(jìn)行隨機(jī)抽樣,將總樣本的20%(15個(gè))作為驗(yàn)證集,剩余的樣本(60個(gè))作為訓(xùn)練集。使用訓(xùn)練集樣本來(lái)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò),由于神經(jīng)元數(shù)量較少,所以訓(xùn)練次數(shù)也相應(yīng)減少,設(shè)定訓(xùn)練次數(shù)為200,損失函數(shù)值隨訓(xùn)練次數(shù)的變化見(jiàn)圖4。
隨后,對(duì)所得BP神經(jīng)網(wǎng)絡(luò)的有效性進(jìn)行驗(yàn)證。將驗(yàn)證樣本作為新的設(shè)計(jì)方案,將其產(chǎn)品特征參數(shù)依次輸入訓(xùn)練完成的BP神經(jīng)網(wǎng)絡(luò)中,隨后,將輸出的各個(gè)調(diào)研目標(biāo)意象詞匯上的預(yù)測(cè)參數(shù)與相應(yīng)樣本的真實(shí)值進(jìn)行對(duì)比,見(jiàn)圖5。經(jīng)過(guò)驗(yàn)證得到預(yù)測(cè)值與真實(shí)值之間差異的均值分別為0.016 0、–0.014 6、–0.013 7。
表2 產(chǎn)品特征編號(hào)
Tab.2 Product feature number
表3 產(chǎn)品特征提取結(jié)果(部分)
Tab.3 Extraction results of product feature parameters (partial)
圖3 BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
圖4 損失函數(shù)值隨訓(xùn)練次數(shù)變化情況
圖5 評(píng)價(jià)模型有效性驗(yàn)證結(jié)果
根據(jù)圖5所示結(jié)果,結(jié)合預(yù)測(cè)值與真實(shí)值之間差異的均值大小,可以看出在3個(gè)調(diào)研目標(biāo)意象上的預(yù)測(cè)值與真實(shí)值較為相近,評(píng)價(jià)模型能夠較為有效地對(duì)輸入的產(chǎn)品配置組合進(jìn)行評(píng)價(jià)。
最后以測(cè)試樣本6為例,輸入產(chǎn)品特征參數(shù)后,在流暢、清晰、漂亮3個(gè)調(diào)研目標(biāo)上的傾向參數(shù)值分別為0.276 5、0.363 3、0.328 7。對(duì)得到的數(shù)據(jù)與訓(xùn)練樣本的參數(shù)值進(jìn)行歸一化處理,通過(guò)式(8)得到的結(jié)果分別為0.462 6,0.632 2,0.735 9,可知該樣本在調(diào)研目標(biāo)上的表現(xiàn)情況為:在流暢方面該樣本表現(xiàn)較差;在清晰方面該樣本表現(xiàn)一般;在漂亮方面該樣本表現(xiàn)較好。
若數(shù)值表現(xiàn)不符合新產(chǎn)品的戰(zhàn)略規(guī)劃,可設(shè)定產(chǎn)品評(píng)價(jià)的傾向目標(biāo),隨后逐步調(diào)整設(shè)計(jì)參數(shù),并輸入模型生成相應(yīng)的意象參數(shù),不斷循環(huán)直至達(dá)到設(shè)計(jì)目標(biāo),完成新的方案設(shè)計(jì)。
網(wǎng)絡(luò)購(gòu)物的普及產(chǎn)生了大量的產(chǎn)品評(píng)論文本,為產(chǎn)品評(píng)價(jià)提供了新的數(shù)據(jù)基礎(chǔ)。針對(duì)現(xiàn)有產(chǎn)品評(píng)論文本挖掘方法難以匹配設(shè)計(jì)調(diào)研的多樣化需求、文本挖掘結(jié)果難以進(jìn)一步參與設(shè)計(jì)方案的參數(shù)化分析與評(píng)價(jià)等問(wèn)題,提出了基于評(píng)論文本的產(chǎn)品意象參數(shù)化挖掘與評(píng)價(jià)方法。通過(guò)網(wǎng)絡(luò)爬蟲(chóng)等方法獲取互聯(lián)網(wǎng)中的產(chǎn)品評(píng)論文本數(shù)據(jù),確定調(diào)研目標(biāo),通過(guò)關(guān)鍵詞提取與詞語(yǔ)相似度計(jì)算,對(duì)調(diào)研目標(biāo)的產(chǎn)品意象進(jìn)行參數(shù)化表示。分類(lèi)提取產(chǎn)品配置參數(shù),使用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建產(chǎn)品評(píng)價(jià)模型,通過(guò)輸入產(chǎn)品配置來(lái)輸出產(chǎn)品在調(diào)研目標(biāo)上的感性意象參數(shù),實(shí)現(xiàn)了產(chǎn)品意象的參數(shù)化挖掘與評(píng)價(jià),以手機(jī)為例驗(yàn)證該方法的有效性。該方法能夠從調(diào)研目標(biāo)的角度對(duì)產(chǎn)品進(jìn)行參數(shù)化評(píng)價(jià),從而增強(qiáng)設(shè)計(jì)調(diào)研目標(biāo)與產(chǎn)品評(píng)論文本挖掘間的聯(lián)系,使產(chǎn)品評(píng)論文本挖掘的有用性更高。同時(shí),產(chǎn)品評(píng)論數(shù)據(jù)挖掘結(jié)果通過(guò)設(shè)計(jì)調(diào)研目標(biāo)進(jìn)行參數(shù)化表達(dá),提高了文本挖掘結(jié)果的可理解性。此外,基于評(píng)論文本的感性意象參數(shù)化模型,能夠輔助設(shè)計(jì)方案的評(píng)價(jià)以及新設(shè)計(jì)的指導(dǎo)。
目前主要使用基礎(chǔ)的TF-IDF算法進(jìn)行關(guān)鍵詞提取,主要針對(duì)產(chǎn)品整體來(lái)提取意象詞匯,在未來(lái)的研究中,需要對(duì)意象關(guān)鍵詞的提取方法進(jìn)行深入研究,實(shí)現(xiàn)更細(xì)致的感性意象分析。此外,文中對(duì)所提方法在設(shè)計(jì)方案的優(yōu)選與迭代方面的研究尚不深入,有待后續(xù)進(jìn)一步改進(jìn)。
[1] 梅馨, 邢桂芬. 文本挖掘技術(shù)綜述[J].江蘇大學(xué)學(xué)報(bào)(自然科學(xué)版), 2003(5): 72-76.
MEI Xin, XING Gui-fen. On Technology of Document Mining[J]. Journal of Jiangsu University(Natural Science Edition), 2003(5): 72-76.
[2] 郝玫, 馬建峰. 在線評(píng)論中基于動(dòng)態(tài)窗口提取特征觀點(diǎn)對(duì)的產(chǎn)品推薦模型[J]. 系統(tǒng)工程理論與實(shí)踐, 2018, 38(9): 2363-2375.
HAO Mei, MA Jian-feng. Product Recommendation Model Based on Dynamic Windows for Feature Opinion Pair Extraction in Online Reviews[J]. Systems Engineering-Theory & Practice, 2018, 38(9): 2363-2375.
[3] 金吉瓊, 劉鴻, 鄭賽晶. 基于在線評(píng)論文本挖掘技術(shù)的電子煙市場(chǎng)消費(fèi)熱點(diǎn)分析[J]. 煙草科技, 2019, 52(12): 106-114.
JIN Ji-qiong, LIU Hong, ZHENG Sai-jing. Analysis of Consumption Hotspots of Electronic Cigarette Market Based on Online Comment Text Mining Technology[J]. Tobacco Science & Technology, 2019, 52(12): 106-114.
[4] 趙志濱, 劉歡, 姚蘭, 等. 中文產(chǎn)品評(píng)論的維度挖掘及情感分析技術(shù)研究[J]. 計(jì)算機(jī)科學(xué)與探索, 2018, 12(3): 341-349.
ZHAO Zhi-bin, LIU Huan, YAO Lan, et al. Research on Dimension Mining and Sentiment Analysis for Chinese Product Comments[J]. Journal of Frontiers of Computer Science and Technology, 2018, 12(3): 341-349.
[5] 譚傲楠, 李洪海. 產(chǎn)品情感化設(shè)計(jì)研究文獻(xiàn)綜述[J]. 設(shè)計(jì), 2016(1): 74-75.
TAN Ao-nan, LI Hong-mei. A Summary of Product Emotional Design Researches[J]. Design, 2016(1): 74-75.
[6] 林麗, 張?jiān)汽d. 感性工學(xué)中的參數(shù)化設(shè)計(jì)方法關(guān)鍵技術(shù)研究現(xiàn)狀與展望[J]. 圖學(xué)學(xué)報(bào), 2019, 40(5): 936-944.
LIN-Li, ZHANG Yun-kun. Key Technologies in Parametric Design Methods in Kansei Engineering: State of Art and Progress[J]. Journal of Graphics, 2019, 40(5): 936-944.
[7] 王天賦, 徐子豪. 基于感性工學(xué)的汽車(chē)駕駛空間內(nèi)飾優(yōu)化設(shè)計(jì)[J]. 包裝工程, 2020, 41(24): 98-103.
WANG Tian-fu, XU Zi-hao. Optimal Interior Design of Car Driving Space Based on Perceptual Engineering[J]. Packaging Engineering, 2020, 41(24): 98-103.
[8] 付成杰, 畢延剛, 沈?qū)W會(huì). 基于感性工學(xué)的框架眼鏡造型意象研究[J]. 包裝工程, 2020, 41(2): 269-275.
FU Cheng-jie, BI Yan-gang, SHEN Xue-hui. The Shape Image of Frame Glasses Based on Kansei Engineering[J]. Packaging Engineering, 2020, 41(2): 269-275.
[9] 趙艷云, 邊放, 李巨韜. 基于感性工學(xué)的產(chǎn)品材質(zhì)意象研究[J]. 機(jī)械設(shè)計(jì), 2015, 32(8): 117-121.
ZHAO Yan-yun, BIAN Fang, LI Ju-tao. Image Research of Product Material Based on Kansei Engineering[J]. Journal of Machine Design, 2015, 32(8): 117-121.
[10] 李德源. 電商在線評(píng)論的文本情感傾向性分析[D]. 長(zhǎng)春: 吉林大學(xué), 2019.
LI De-yuan. Emotional Inclination Analysis of E-com-merceOnline Commentary[D]. Changchun: Jilin University, 2019.
[11] SALTON G, BUCKLEY C. Term-weighting Approaches in Automatic Text Retrieval[J]. Pergamon, 1988, 24(5): .
[12] 黃承慧, 印鑒, 侯昉. 一種結(jié)合詞項(xiàng)語(yǔ)義信息和TF-IDF方法的文本相似度量方法[J]. 計(jì)算機(jī)學(xué)報(bào), 2011, 34(5): 856-864.
HUANG Cheng-hui, YIN Jian, HOU Fang. A Text Similarity Measurement Combining Word Semantic Information with TF-IDF Method[J]. Chinese Journal of Computers, 2011, 34(5): 856-864.
[13] SU J N, JIANG P Y, LI H Q. Research on Kansei Image- driven Method of Product Styling Design[J]. International Journal of Product Development, 2009, 7(1): 113-126.
[14] PALIWAL M, KUMAR U A. Review: Neural Networks and Statistical Techniques: A Review of Applications[J]. Expert Systems with Applications, 2009, 36(1): 2-17.
[15] GUO F, LIU W L, CAO Y, et al. Optimization Design of a Webpage Based on Kansei Engineering[J]. Human Factors And Ergonomics In Manufacturing & Service Industries, 2016, 26(1): 110-126.
[16] 李永鋒, 朱麗萍. 基于神經(jīng)網(wǎng)絡(luò)的產(chǎn)品意象造型設(shè)計(jì)研究[J]. 包裝工程, 2009, 30(7): 88-90.
LI Yong-feng, ZHU Li-ping. Research on Product Image Form Design Based on Neural Network[J]. Packaging Engineering, 2009, 30(7): 88-90.
[17] 宋勇, 蔡志平. 大數(shù)據(jù)環(huán)境下基于信息論的入侵檢測(cè)數(shù)據(jù)歸一化方法[J]. 武漢大學(xué)學(xué)報(bào)(理學(xué)版), 2018, 64(2): 121-126.
SONG Yong, CAI Zhi-ping. Normalized Method of Intrusion Detection Data Based on Information Theory in Big Data Environment[J]. Journal of Wuhan University (Natural Science Edition), 2018, 64(2): 121-126.
Parametric Evaluation Method of Product Image Based on Review Text
LIU Bao-shun, CHEN Yue
(Hebei University of Technology, Tianjin 300132, China)
The paper aims to match the product review text mining method with the diversified demands of design research and to combine the text mining results with the parametric analysis and evaluation of design schemes. Product evaluation on the network shopping website is retrieved by crawlers. The research objectives are defined and described with imagery words. Keywords extraction and word similarity calculation method are used to calculate the image orientation of product on the research target, and are parameterized. Feature parameters are extracted by classification, and the mapping relationship between feature parameters and image parameters is constructed by BP neural network to form a product review model. The product feature parameters are input into the mapping relation to obtain the image parameters of the research objective, and realize the parametric mining and evaluation of product image. Taking mobile phone as an example, the mean differences between the predicted value and the real value of the image parameter output by the evaluation model are 0.0160, –0.0146 and –0.0137 respectivel, indicating that the evaluation model is effective.The method can effectively extract the image tendency from the evaluation text and express it as the tendency parameter on the research target, strengthen the relationship between product evaluation text mining and design research, and improve the intelligibility of text mining results.
product evaluation; text mining; design research; Kansei Engineering; BP neural network
TB472
A
1001-3563(2022)12-0142-07
10.19554/j.cnki.1001-3563.2022.12.016
2022–01–10
劉寶順(1982—),男,博士,教授,主要研究方向?yàn)樵O(shè)計(jì)藝術(shù)學(xué)。
責(zé)任編輯:馬夢(mèng)遙