趙志超
(河北中信聯(lián)信息技術(shù)有限公司河北 石家莊 050091)
蔬菜銷售電子商務(wù)平臺的推薦系統(tǒng)研究
趙志超
(河北中信聯(lián)信息技術(shù)有限公司河北 石家莊 050091)
應(yīng)用中的區(qū)域蔬菜電子商務(wù)系統(tǒng)大多具備網(wǎng)上購銷的主要功能,但在提高銷售量和消費者應(yīng)用體驗方面有重要作用的推薦系統(tǒng)則建設(shè)不多,或不夠完善。從用戶管理和交易行為特點數(shù)據(jù)中提取用戶特征和購銷行為模型,生成k—均值聚類簇和簇中心,計算新用戶相應(yīng)信息與聚類簇中的最近鄰居集數(shù)據(jù)的最大相似度,生成銷售推薦信息,可構(gòu)建出適合區(qū)域蔬菜電子商務(wù)網(wǎng)站用戶規(guī)模和應(yīng)用的推薦系統(tǒng)。
蔬菜銷售電子商務(wù)聚類簇協(xié)同過濾算法推薦系統(tǒng)
區(qū)域性蔬菜產(chǎn)銷電子商務(wù)系統(tǒng)可實現(xiàn)定域內(nèi)蔬菜產(chǎn)業(yè)重點縣的專業(yè)合作社與超市、消費者的直接對接,為蔬菜合作社、蔬菜生產(chǎn)企業(yè)(單位)、農(nóng)資供應(yīng)單位、物流配送企業(yè)、超市和蔬菜消費者提供信息發(fā)布、瀏覽和交易等功能。用戶通過蔬菜和農(nóng)資產(chǎn)品展示、信息發(fā)布、撮合洽談及物流配送等功能,實現(xiàn)供需雙方“鍵對鍵”的網(wǎng)上交易,包括蔬菜、農(nóng)資的網(wǎng)上銷售、電子支付、物流配送管理以及客戶關(guān)系管理等功能[1,2]。
這些建設(shè)中的蔬菜電子商務(wù)系統(tǒng)雖然具備了網(wǎng)上購銷的主要功能,但仍有借鑒學(xué)習(xí)大規(guī)模電子商務(wù)網(wǎng)站先進(jìn)營銷技術(shù)和豐富完善自有特點功能的發(fā)展空間。蔬菜和農(nóng)產(chǎn)品銷售時間因素很重要,利用信息技術(shù)提高交易效率是解決此類問題的有效手段。
結(jié)合農(nóng)產(chǎn)品銷售和消費者的活動特點,綜合用戶信息和購銷行為數(shù)據(jù),經(jīng)過聚類分析和協(xié)同過濾等算法,為網(wǎng)上銷售對時令節(jié)氣依賴很強的蔬菜和農(nóng)產(chǎn)品創(chuàng)新設(shè)計推薦系統(tǒng),有助于縮短銷售供需周期,提高銷售量,降低購銷成本,優(yōu)化銷售體驗。
區(qū)域性蔬菜產(chǎn)銷電子商務(wù)系統(tǒng)通的基本系統(tǒng)功能結(jié)構(gòu)如
圖1所示,主要由系統(tǒng)管理、合作社管理、會員管理、后臺運營管理、推薦系統(tǒng)、第三方支付管理、交易管理和商品管理等多個功能相對集中,數(shù)據(jù)相互共享的子系統(tǒng)組成[3]。
推薦系統(tǒng)在傳統(tǒng)農(nóng)產(chǎn)品銷售的電子商務(wù)網(wǎng)站上應(yīng)用較少,但對時令節(jié)氣依賴很強的蔬菜和農(nóng)產(chǎn)品上網(wǎng)銷售來說,個性化推薦系統(tǒng)能大大提高網(wǎng)站銷售額,有效縮短供需銷售周期,優(yōu)化銷售體驗,值得投資建設(shè)。
協(xié)同過濾算法推薦系統(tǒng)的基本思想是興趣和需求相近的消費者可能對同樣的商品感興趣,并可能產(chǎn)生相同的采購行為。因此,推薦系統(tǒng)的運行離不開積累用戶的歷史交易數(shù)據(jù)。為了結(jié)合行業(yè)和地域特點,并有效地管理和應(yīng)用用戶數(shù)據(jù),蔬菜電子商務(wù)網(wǎng)站以會員機制運作。蔬菜合作社、蔬菜生產(chǎn)企業(yè)、農(nóng)資供應(yīng)企業(yè)、蔬菜加工企業(yè)、蔬菜銷售企業(yè)(超市、批發(fā)市場)、普通消費者或其他組織和個人等,經(jīng)網(wǎng)上注冊和審核后,均可成為交易級會員。
可供蔬菜電子商務(wù)交易推薦系統(tǒng)利用的用戶信息和行為數(shù)據(jù)主要有以下3類。
①用戶檔案:用戶會員的基本信息,如會員級別和會員分類;注冊的基本信息,如組織的名稱、法人、單位屬性、經(jīng)營范圍、注冊資金和地域、經(jīng)營規(guī)模和財務(wù)狀況等,個人的姓名、性別、年齡、職業(yè)、地域、收入及教育背景等資料;
②用戶交易記錄:用戶在電子商務(wù)網(wǎng)站上購買商品的信息,會員積分信息等;
③用戶行為特征:用戶對商品的評分信息、瀏覽行為、需求信息和反饋信息等。
這些數(shù)據(jù)只有部分是用戶會員登錄注冊提供的,大部分是用戶在網(wǎng)上瀏覽、交易過程中,依靠電子商務(wù)網(wǎng)站收集整理的。
目前許多協(xié)同過濾推薦算法使用用戶對商品的評分?jǐn)?shù)據(jù)作為推薦基礎(chǔ),用戶評分?jǐn)?shù)據(jù)分為顯式評分和隱式評分2類。蔬菜電子商務(wù)系統(tǒng)采用顯式評分和隱式評分相結(jié)合的方式,對于只能通過顯式記錄才能獲得有效的記分或便于顯式記分的記錄項采用顯式評分,其他則應(yīng)用隱式評分,以便提高用戶購買體驗。
協(xié)同過濾推薦系統(tǒng)通過對系統(tǒng)可以捕獲的操作進(jìn)行分析以獲取隱式評分,這些操作稱為隱含興趣指示操作。隱含興趣指示操作主要有:
①標(biāo)記網(wǎng)頁操作:包括將網(wǎng)頁添加到收藏夾、從收藏夾刪除網(wǎng)頁、將網(wǎng)頁另存為本地文件、打印網(wǎng)頁、以及將網(wǎng)頁以電子郵件方式發(fā)送給好友等;
②編輯網(wǎng)頁操作:包括剪切、復(fù)制和粘貼等編輯操作,還包括在新窗口中打開鏈接,在網(wǎng)頁中搜索文本和下拉滾動條等操作;
③重復(fù)行為:如果用戶在某個網(wǎng)頁上重復(fù)某些操作行為,可能暗示用戶對該網(wǎng)頁有更多興趣。如某網(wǎng)頁的打開時間比較長,反復(fù)上下左右拉動滾動條,重復(fù)訪問某一網(wǎng)頁等行為。
為了避免用戶數(shù)據(jù)庫體積龐大影響算法效率,系統(tǒng)設(shè)計首先對歷史數(shù)據(jù)進(jìn)行k—均值聚類,預(yù)先分成k個不同的簇,而且每個簇的中心采用簇中所含記錄的均值計算而成,通過機器學(xué)習(xí)算法聚成用戶興趣特征類簇,然后再用類中心與新用戶的行為數(shù)據(jù)進(jìn)行相似分析,快速歸類后,再與類中的元素進(jìn)行最大相似分析,做出推薦建議。
有了用戶行為數(shù)據(jù),就可以進(jìn)行推薦分析。為此,可以建立下面的數(shù)學(xué)模型。
設(shè)有具有n個用戶的p個商務(wù)行為的觀測樣本數(shù)據(jù)xi= (xi1,xi2,…,xip)T,i=1,2,…,n
這樣,每個行為可視為p元空間的一個點,n個行為序列組成p元空間的n個行為向量。任意2個向量xi,xj的歐氏距離定義為
圖1 蔬菜銷售電子商務(wù)平臺總體結(jié)構(gòu)設(shè)計
根據(jù)觀測樣本數(shù)據(jù)空間的規(guī)模,選擇適當(dāng)?shù)腄=dij將所有用戶聚類分成k個興趣特征用戶數(shù)目不等的,互不相交的類簇集N={N 1,N 2…Nk},其中心可表示為yi=(yi1,yi2,…,yip) T,i=1,2,…,k,k 通過上面的相似性度量方法可以得到目標(biāo)用戶的最近鄰居(聚類集),衡量用戶u與最鄰近用戶行為簇Nu中所有用戶行為向量之間的相似性程度,常用向量的相關(guān)系數(shù)和夾角余弦來描述。任意兩向量xi,xj的夾角余弦cos(xi,xj)為: cos(xi,xj)的絕對值越接近于1,說明向量xi和xj之間的夾角越小,相互關(guān)聯(lián)性越大。 用戶u對某商品項i的預(yù)測評分Pu,i可以通過用戶u從最近鄰居行為數(shù)據(jù)簇集合Nu={U 1,U 2,…,Us}中鄰居對該項的評分獲到: 式中,cos(u,uh)表示用戶u與其最近鄰居簇中用戶uh之間的相似性,uhi表示用戶uh對項目i的評分。和分別表示用戶u和用戶uh對行為項的平均記分。 上述方法可以預(yù)測用戶對所有未評分項的評分,然后選擇預(yù)測評分最高的前若干個項作為推薦結(jié)果反饋給當(dāng)前用戶u。當(dāng)使用交易數(shù)據(jù)作為算法輸入時,則可以采用如下2種方式產(chǎn)生top—N推薦: ①最頻項推薦:掃描當(dāng)前用戶每一個最近鄰居的購買記錄,對其購買的商品進(jìn)行計數(shù),選擇出現(xiàn)頻率最高且當(dāng)前用戶沒有購買過的前N件商品作為推薦結(jié)果; ②關(guān)聯(lián)推薦:將當(dāng)前用戶最近鄰居的交易數(shù)據(jù)作為一個虛擬的交易數(shù)據(jù)庫,進(jìn)行關(guān)聯(lián)重合挖掘。如果在關(guān)聯(lián)用戶重合部的商品已出現(xiàn)在當(dāng)前用戶的購買商品集合中,就向當(dāng)前用戶推薦在預(yù)測關(guān)聯(lián)部分中用戶尚未購買的商品[5]。 根據(jù)上述思想設(shè)計的電子商務(wù)推薦系統(tǒng)由3個主要部分構(gòu)成,如下圖2所示。 圖2 推薦系統(tǒng)主體結(jié)構(gòu)示意圖 ①用戶行為記錄:收集和記錄用戶行為和反饋數(shù)據(jù); ②推薦引擎:分析用戶行為數(shù)據(jù),按照模型生成推薦結(jié)果并展示在用戶界面上; ③頁面展現(xiàn):展示推薦結(jié)果,收集用戶對推薦結(jié)果的反饋。 用戶行為記錄系統(tǒng)是推薦系統(tǒng)的基礎(chǔ),首先需要實時更新用戶的行為數(shù)據(jù),同時還需要能夠?qū)Υ髷?shù)據(jù)量的快速存儲和處理。沒有大量翔實的數(shù)據(jù)記錄,推薦引擎的工作成果就會大打折扣。推薦引擎的設(shè)計與推薦算法策略,則決定著整個系統(tǒng)的效率。推薦系統(tǒng)的人機交互界面設(shè)計有非常重要的作用,好的交互界面設(shè)計不僅能良好地展現(xiàn)推薦商品的信息,更能夠收集到更多,更準(zhǔn)確的用戶反饋,對提高推薦引擎的推薦的準(zhǔn)確性和系統(tǒng)的性能改善都有重要作用[6]。 因為銷售行為是持續(xù)的過程,推薦系統(tǒng)必然也是一個持續(xù)收集用戶行為,更新用戶興趣模型,調(diào)整用戶推薦算法和策略的閉環(huán)信息交互系統(tǒng),尤其是評價推薦轉(zhuǎn)化成銷售的效果更重要。消費者的行為不是一成不變的,推薦系統(tǒng)能夠隨之調(diào)整推薦模型和策略,提高推薦準(zhǔn)確有效率,是需要持續(xù)深入研究的課題,但隨著用戶行為數(shù)據(jù)積累的不斷增多和方法的改進(jìn),系統(tǒng)的推薦結(jié)果將會越來越準(zhǔn)確越有效。 雖然討論的是區(qū)域蔬菜電子商務(wù)平臺上推薦系統(tǒng)的設(shè)計應(yīng)用,由于互聯(lián)網(wǎng)的覆蓋特性,可以方便地擴展到全國乃至更廣的區(qū)域,但是,系統(tǒng)的組織,流程和數(shù)據(jù)管理,乃至推薦算法將需要根據(jù)用戶群和地域特性進(jìn)行相應(yīng)的調(diào)整。 [1]鄧愛林.電子商務(wù)推薦系統(tǒng)關(guān)鍵技術(shù)研究[D].上海:復(fù)旦大 學(xué),2003. [2]青海.電子商務(wù)推薦系統(tǒng)核心技術(shù)研究[D].北京:工業(yè)大學(xué),2009. [3]PETER H.機器學(xué)習(xí)實戰(zhàn)[M].李銳,李鵬,譯.北京:人民郵電出版社,2013. [4]范金城,等.?dāng)?shù)據(jù)分析[M].北京:科學(xué)出版社,2002. [5]MARMAN ISH,BABENKO D.智能web算法[M].阿穩(wěn),陳鋼,譯.北京:電子工業(yè)出版社,2011. [6]秦壽康,等.綜合評價原理與應(yīng)用[M].北京:電子工業(yè)出版社, 2003. Research on Recomm endation System Based on Vegetable Sales E-comm erce Platform ZHAO Zhi-chao The local vegetable E-commerce systemsmostly have themain function of Internetmarketing,but the construction of recommendation systemswhich plays the important rolesin the aspectsof improvementof salesand consumer application experiencesare notmany or inadequate.This paper extracts the user characteristics and buying/selling behaviormodel from the usermanagement and trading behavior characteristic data to build the k-means cluster and cluster center,and calculates themaximum sim ilarity of the nearest neighbor setdata in the relevant information ofnew usersand clustersto generate the salesrecommendation information,in order to build the recommendation systemswhich are suitable for localvegetable E-commercewebsite user scale and application. vegetablessales;E-commerce;cluster;collaborative filtering algorithm;recommendation system TP393 A 1008-1739(2014)13-62-4 定稿日期:2014-06-125 推薦產(chǎn)生
6 推薦系統(tǒng)主體結(jié)構(gòu)設(shè)計
7 結(jié)束語
(HebeiUniW in Information Technology Co.,Ltd.,Shijiazhuang Hebei050091,China)