吳敏
摘要:本文從電子商務(wù)信息挖掘的角度來研究數(shù)據(jù)挖掘在電子商務(wù)中的商務(wù)應(yīng)用。針對(duì)目前已有的一些WEB數(shù)據(jù)挖掘方法,作者將數(shù)據(jù)挖掘中的模糊關(guān)聯(lián)規(guī)則應(yīng)用到電子商務(wù)中的信任評(píng)價(jià)系統(tǒng)中去,并對(duì)這種方法的流程進(jìn)行詳細(xì)說明。
關(guān)鍵詞:電子商務(wù);數(shù)據(jù)挖掘;模糊關(guān)聯(lián)規(guī)則;信任評(píng)價(jià)系統(tǒng)
1引言
電子商務(wù)中的信息挖掘一直是人們研究的熱點(diǎn)。很多研究數(shù)據(jù)挖掘的學(xué)者紛紛將其研究的成果應(yīng)用到實(shí)際當(dāng)中,并作為市場預(yù)測、市場細(xì)分與分類、客戶關(guān)系管理以及其他商務(wù)應(yīng)用的參考模型。電子商務(wù)信息挖掘一般采用的是WEB數(shù)據(jù)挖掘中的一部分。例如,文獻(xiàn)[1]就是利用SVM來進(jìn)行電子商務(wù)中的應(yīng)用挖掘——網(wǎng)絡(luò)日志的分析,以提取客戶分類及評(píng)分。
在電子商務(wù)環(huán)境中,一個(gè)電子商務(wù)支撐環(huán)境能夠產(chǎn)生一個(gè)信任值,通過衡量已交付的服務(wù)質(zhì)量以及從顧客和信任管理機(jī)構(gòu)中獲得的服務(wù)評(píng)價(jià)。沒有任何信任管理機(jī)制,許多消費(fèi)者也許會(huì)因?yàn)槠垓_性的廣告而請(qǐng)求了欺騙性的服務(wù)。另一方面,一個(gè)簡單但是不完整的信任管理系統(tǒng)也許讓服務(wù)提供商有選擇性地欺騙顧客(例如,通過給許多低價(jià)的交易提供好的服務(wù),但是在高價(jià)的交易中欺騙顧客來謀取大量的好處),以及欺騙信任管理機(jī)構(gòu)(例如,通過在信任評(píng)價(jià)中合謀欺騙)。一些如此的欺騙可能導(dǎo)致服務(wù)質(zhì)量降級(jí),并且給客戶帶來經(jīng)濟(jì)損失。因此,電子商務(wù)行業(yè)必須有有效的信任管理[2]。
2關(guān)聯(lián)規(guī)則的分類
關(guān)聯(lián)規(guī)則的一個(gè)要求是結(jié)果得有透明度和可用性,這些結(jié)果是以產(chǎn)品群組規(guī)則的形式表示的,它表述了現(xiàn)實(shí)的產(chǎn)品和服務(wù)是如何組合到一起的。關(guān)聯(lián)規(guī)則容易理解,但它們并不總是有用的。
有用的規(guī)則包含高質(zhì)量、可操作的信息。平凡的結(jié)果早已被熟悉商業(yè)的任何一個(gè)人所知曉。平凡規(guī)則確實(shí)有一個(gè)用處,盡管它不是直接的數(shù)據(jù)挖掘應(yīng)用。當(dāng)一個(gè)規(guī)則應(yīng)當(dāng)在該時(shí)間100%出現(xiàn),然后它卻沒有出現(xiàn),這種情形可以提供關(guān)于數(shù)據(jù)質(zhì)量的許多信息。換句話說,不遵循平凡規(guī)則的例外情況指出了商業(yè)運(yùn)作、數(shù)據(jù)收集和處理等可能需要進(jìn)一步改進(jìn)的方面。費(fèi)解的規(guī)則似乎沒法解釋,并且不給出行動(dòng)過程。
當(dāng)應(yīng)用購物籃分析時(shí),許多結(jié)果常常是平凡的或費(fèi)解的。平凡規(guī)則再現(xiàn)商業(yè)常識(shí),浪費(fèi)了利用高級(jí)分析技術(shù)的努力。費(fèi)解的規(guī)則是數(shù)據(jù)中的偶然事件,是不可操作的。[3]
關(guān)聯(lián)規(guī)則有三個(gè)度量。支持度反映在交易數(shù)據(jù)中發(fā)現(xiàn)該規(guī)則的頻繁程度,置信度說明當(dāng)“如果”部分為真時(shí)“那么”部分也為真的頻繁程度,而提升度反映該規(guī)則預(yù)測“那么”部分額相對(duì)根本沒有規(guī)則要好多少。
這樣生成的規(guī)則可以分成三類:有用的規(guī)則闡明可能沒有預(yù)料到的關(guān)系,平凡規(guī)則闡明已知(或應(yīng)該知道)存在的關(guān)系,費(fèi)解的規(guī)則沒有意義。費(fèi)解規(guī)則常常有很弱的支持度。
3基于模糊關(guān)聯(lián)規(guī)則的電子商務(wù)評(píng)價(jià)系統(tǒng)設(shè)計(jì)
3.1電子商務(wù)信任評(píng)價(jià)系統(tǒng)
一些著名的電子商務(wù)網(wǎng)站采用的是集中式信任管理機(jī)制[8]。在淘寶,每完成一筆交易之后,買家能夠給一個(gè)反饋給系統(tǒng),這個(gè)反饋是有關(guān)賣家的服務(wù)質(zhì)量的,也許是良、中評(píng)或差評(píng)。淘寶服務(wù)器將這個(gè)評(píng)分存儲(chǔ)在中心管理系統(tǒng)中。它用公式S=P-N來計(jì)算出這個(gè)反饋的分,其中P表示好評(píng)個(gè)數(shù),N表示差評(píng)個(gè)數(shù)。淘寶網(wǎng)將這個(gè)S值顯示在賣家的網(wǎng)頁上。另一值R=(P – N)/(P + N)(1 ≥ R ≥ 0)是好評(píng)率。如果僅用好評(píng)率來作為信任評(píng)價(jià)的標(biāo)準(zhǔn)是不對(duì)的。通過模糊關(guān)聯(lián)規(guī)則中,防止一些欺騙。例如,通過給許多低價(jià)的交易提供好的服務(wù),但是在高價(jià)的交易中欺騙顧客來謀取大量的好處。
規(guī)則集相似度可以量化地表示當(dāng)前的交易狀態(tài)是否與正常的狀態(tài)的相似程度,由此可以推斷出此次交易的風(fēng)險(xiǎn)程度。并且可以根據(jù)其風(fēng)險(xiǎn)程度來進(jìn)行報(bào)警或者提醒。
基于模糊關(guān)聯(lián)規(guī)則的電子商務(wù)信任評(píng)價(jià)系統(tǒng)的流程如下圖所示。
3.2模糊集和模糊隸屬函數(shù)的建立
模糊集的建立實(shí)際上就是把數(shù)據(jù)集中的所有屬性用模糊屬性表示[4],每個(gè)模糊屬性包含多個(gè)模糊值,每個(gè)模糊值有其對(duì)應(yīng)的模糊集。模糊隸屬函數(shù)用來描述一個(gè)確定屬性值對(duì)于一個(gè)模糊屬性集的隸屬度。一個(gè)確定屬性值可以隸屬于多個(gè)模糊值,對(duì)應(yīng)有多個(gè)隸屬度。
如表1所示交易數(shù)據(jù)庫T={t1,t2,t3,t4},屬性I={num,money}(i1=num,i2=money)。
將每個(gè)屬性又分別劃分為若干個(gè)模糊集,對(duì)表1所示的數(shù)據(jù)庫,在計(jì)算其各數(shù)據(jù)項(xiàng)隸屬度之后數(shù)據(jù)庫被轉(zhuǎn)換為如表2所示。
4結(jié)束語
本文從電子商務(wù)信任管理中所發(fā)現(xiàn)的一些問題,結(jié)合現(xiàn)在數(shù)據(jù)挖掘在電子商務(wù)的應(yīng)用,找到了一種基于模糊集的關(guān)聯(lián)規(guī)則算法應(yīng)用到電子商務(wù)信任評(píng)價(jià)中。在基于信譽(yù)的電子商務(wù)評(píng)價(jià)問題中,電子商務(wù)的評(píng)價(jià)往往是通過反饋的信息來完成,但是反饋回來的信息以及交易過程中本身所產(chǎn)生的信息要盡量將其中所隱含的信息挖掘出來,進(jìn)行一定的分析,就可以得到一些有用的規(guī)則。而對(duì)于一些平凡的規(guī)則,也可以利用其來尋找其中的問題。這個(gè)系統(tǒng)還可以在進(jìn)一步的進(jìn)行擴(kuò)展。例如,對(duì)規(guī)則集進(jìn)行修正,去掉一些費(fèi)解的規(guī)則,還可以去掉一些冗余的關(guān)聯(lián)規(guī)則。這些都可以對(duì)整個(gè)流程有更好的改進(jìn)。本文主要是對(duì)交易管理中的一些數(shù)據(jù)屬性進(jìn)行提取和發(fā)現(xiàn)規(guī)則。
參考文獻(xiàn):
[1] 過蓓蓓,方兆本.基于SVM的Web日志挖掘及潛在客戶發(fā)現(xiàn)[J].管理工程學(xué)報(bào),2010(1).
[2] Yan Wang and Kwei-Jay Lin.Reputation-Oriented Trustworthy Computing in E-Commerce Environments.
[3] Michael J.A.Berry,Gordon S.Linoff.別榮芳 尹靜 鄧六愛譯.Data Mining Techniques:For Marketing,Sales,and Customer Relationship Management 數(shù)據(jù)挖掘技術(shù):市場營銷、銷售與客戶關(guān)系管理領(lǐng)域應(yīng)用(原書第2版)[M].北京:機(jī)械工業(yè)出版社,2006.
[4] 王坤.模糊關(guān)聯(lián)規(guī)則挖掘在入侵檢測中的應(yīng)用研究[D].西南交通大學(xué),2006.
[5] 吳君輝,殷肖川,張薇.基于模糊關(guān)聯(lián)規(guī)則挖掘改進(jìn)算法的IDS研究[J].計(jì)算機(jī)測量與控制..2009.17(11)
[6] 邵峰晶,于忠清,著.數(shù)據(jù)挖掘原理與算法[M].北京:中國水利水電出版社,2003.
[7] Min Wu.Cloud Trust Model in E-Commerce[C].The Second International Symposium on Networking and Network Security(ISNNS 2010).JingGangShan.2010.4