裘進 李秋霞 章珺彧
摘要:電子商務(wù)發(fā)展迅速,其作為信息時代的重要產(chǎn)物,給我們的生活帶來了諸多便利,但是隨著“信息過載”問題的出現(xiàn),我們很難從電子商務(wù)平臺上找到讓自己滿意的商品,商品推薦應(yīng)運而生。隨著技術(shù)的發(fā)展,其他電商平臺的推薦技術(shù)已趨于成熟,但是,對于農(nóng)產(chǎn)品的推薦技術(shù)和系統(tǒng)卻很少。所以,本文提出改進的基于物品的協(xié)同過濾算法,以推薦精準、快速為目標(biāo)。
關(guān)鍵詞:協(xié)同過濾;個性化推薦;農(nóng)產(chǎn)品電商
1 1綜述
電子商務(wù)發(fā)展迅速,淘寶、京東和亞馬遜等的出現(xiàn)使人們的消費方式發(fā)生了翻天覆地的變化。自2015年至今,多項扶持農(nóng)業(yè)的國家政策的出臺和上百億電商進農(nóng)村專項資金的下?lián)埽r(nóng)村電商像雨后春筍般蓬勃發(fā)展。
我國農(nóng)產(chǎn)品電商已經(jīng)經(jīng)過20幾年的發(fā)展,初步形成了電子商務(wù)網(wǎng)站、期貨交易,以及涉農(nóng)大宗商品交易、網(wǎng)上商城等多種農(nóng)產(chǎn)品電商形式。2015年,電子商務(wù)總交易額1364700億,其中,農(nóng)產(chǎn)品交易額48.7萬億元,占總量的36%;農(nóng)產(chǎn)品電商成交額超2000000億[1]。農(nóng)產(chǎn)品如此巨大的交易額表明農(nóng)產(chǎn)品地位的舉足輕重。越來越多的企業(yè)和個人,開始投資和參與到農(nóng)產(chǎn)品電子商務(wù)中來,農(nóng)產(chǎn)品冷鏈的發(fā)展進一步促進了農(nóng)產(chǎn)品電商的發(fā)展。
但是,農(nóng)村電商的發(fā)展還受到了很多問題的限制,其中很重要的一點就是:消費者很難找到符合自己要求的農(nóng)產(chǎn)品。消費者必須要花費大量的時間和精力在搜索和尋找喜愛的農(nóng)產(chǎn)品,這在很大程度上影響到消費者的購物體驗。而農(nóng)產(chǎn)品個性化推薦技術(shù),一方面,個性化推薦能夠在為消費者推薦商品的同時,為消費者節(jié)省了時間;另一方面,農(nóng)產(chǎn)品個性化推薦能降低商家的成本,最大程度為農(nóng)民謀福利。
推薦方法主要有五種:協(xié)同過濾、基于圖論的推薦算法、基于內(nèi)容的推薦、混合推薦算法以及其它[2]?;谏唐返耐扑]算法建立在在協(xié)同過濾算法上,它不依靠用戶對于商品的評分,而是根據(jù)用戶瀏覽的商品推薦與之類似的商品。但是不論運用哪一種推薦算法一定會包含以下四個模塊:信息采集、用戶模型建模、個性化推薦、用戶模型更新。
2 2協(xié)同過濾推薦算法
基于用戶的協(xié)同過濾算法的推薦過程可以分為三個步驟,第一步,獲取消費者購買過的商品、評分等數(shù)據(jù);第二步,獲取相似用戶;第三步,推薦。計算相似用戶是算法核心,相似用戶的選擇對推薦的準確性至關(guān)重要,目前計算用戶相似度的方法有皮爾遜相關(guān)系數(shù)、杰卡德相似和余弦相似度和等。
對每個相似用戶v(v∈N) ,用相似用戶v對商品i的評分R_vi,和相似用戶v與目標(biāo)用戶u之間的相似度Sim(u,v),加權(quán)得到目標(biāo)用戶u對目標(biāo)商品i的預(yù)測評分P_ui。
基于物品的協(xié)同過濾算法通過分析消費者商品的瀏覽歷史,將現(xiàn)有商品與之前的商品計算相似度,然后進行排序,將相似度排在前面的商品推薦給消費者。圖2是基于內(nèi)容的推薦算法的示意圖。基于內(nèi)容的系統(tǒng)過濾算法存在一個嚴重的弊?。簲?shù)據(jù)的稀疏性,這導(dǎo)致了推薦效果的準確度不夠。
對相似商品集合中每個商品j (j∈N),用目標(biāo)用戶u對相似商品j的評分值R_ui,和相似商品j與目標(biāo)商品i之間的相似度Sim(i,j),加權(quán)得到目標(biāo)用戶u對目標(biāo)商品P_ui。
3改進協(xié)同過濾算法的具體流程
本文為了解決協(xié)同過濾算法代碼數(shù)據(jù)稀疏的問題,提出一種改進的基于2物品的協(xié)同過濾算法。原有算法的相似公式為:
我們將原有的余弦相似度公式加入時間、用戶評分,得到新的相似計算公式:
下面文章將詳細介紹改進算法的流程。
第一步,按時間倒序獲取用戶購買農(nóng)產(chǎn)品的列表。首先,提取用戶訂單,包括農(nóng)產(chǎn)品id,用戶id,用戶評分和訂單時間,并按時間倒序排列農(nóng)產(chǎn)品列表。再獲得用戶購物車數(shù)據(jù),包括農(nóng)產(chǎn)品id,用戶id,加入購物車時間。最后把兩個數(shù)據(jù)表合二為一。
第二步,得到農(nóng)產(chǎn)品矩陣和農(nóng)產(chǎn)品-用戶表。該矩陣的每個值S[i][j]代表了同時喜歡物品i和物品j的用戶數(shù):
其中N(i)是喜愛農(nóng)產(chǎn)品i的用戶數(shù)量,而N(j)是喜愛農(nóng)產(chǎn)品j的用戶。然后,需要提取農(nóng)產(chǎn)品-用戶表,
第三步,獲取時間表。去重農(nóng)產(chǎn)品id和用戶id,得到農(nóng)產(chǎn)品-用戶-時間表。
第四步,建立農(nóng)產(chǎn)品評分表。遍歷第一步得到的表格,去除評分為零的數(shù)據(jù),計算每一個農(nóng)產(chǎn)品的平均評分。
計算得到的每個農(nóng)產(chǎn)品的平均評分即成為影響因子。
第五步,建立農(nóng)產(chǎn)品-農(nóng)產(chǎn)品相似度矩陣G。從以上步驟建立的表中提取有用信息,從而使用改進的相似度計算公式計算農(nóng)產(chǎn)品-農(nóng)產(chǎn)品相似度矩陣G。每個用戶都有屬于自己農(nóng)產(chǎn)品相似度矩陣。
第六步,歸一化農(nóng)產(chǎn)品相似度矩陣。歸一化公式為:
其中,W_ij^'是歸一化后的值,maxW_ij代表最大值,W_ij是歸一化前的相似度。歸一化不僅可以提高推薦系統(tǒng)的準確性,還能提高農(nóng)產(chǎn)品的覆蓋率。
第七步,獲得當(dāng)前用戶對農(nóng)產(chǎn)品j的興趣度。
其中Q_uxi代表U(x)的農(nóng)產(chǎn)品j興趣度,W_ij表示農(nóng)產(chǎn)品j對農(nóng)產(chǎn)品i的相似度R_uxi是當(dāng)前用戶U(x)對農(nóng)產(chǎn)品i的興趣,N(ux)表示當(dāng)前用戶喜歡的農(nóng)產(chǎn)品集合,Sim(j,k)是和農(nóng)產(chǎn)品j比較相近的k個農(nóng)產(chǎn)品的集合。
第八步,獲得當(dāng)前用戶的興趣度排序列表。
第九步,生成最終的農(nóng)產(chǎn)品推薦表。
4實驗與結(jié)果
文章采用的是由Minnesota大學(xué)的Grouplens研究小組創(chuàng)建的數(shù)據(jù)集進行實研。
我們使用召回率、準確率以及平均絕對誤差來衡量推薦算法。召回率表示推薦算法是否全面;準確率表示推薦是否正確。召回率和準確率公式如(9)和(10)所示。
我們將改進的算法與傳統(tǒng)基于項目的協(xié)同過濾算法進行對比。
本文提出的改進算法較之于傳統(tǒng)算法的MAE數(shù)值有所減小,也就是說推薦準確度更高。
表2顯示本文改進的算法比傳統(tǒng)算法的召回率和準確率都要高。
5結(jié)束語
本文主要介紹了農(nóng)產(chǎn)品推薦的必然性和基于內(nèi)容的協(xié)同過濾算法的主要思想;本文還介紹了目基于內(nèi)容的協(xié)同過濾算法存在的一些問題;本文致力于解決原有算法存在的矩陣稀疏性、新用戶和推薦實時性等問題,最后將其應(yīng)用與農(nóng)產(chǎn)品推薦中。在農(nóng)產(chǎn)品電商中可以運用本文提出的改進的基于內(nèi)容的協(xié)同過濾技術(shù)將農(nóng)產(chǎn)品推薦給對此農(nóng)產(chǎn)品感興趣的消費者手中。
文章雖然對算法進行了一定改進,但是依然存在一些問題。算法對于分析文本數(shù)據(jù)還可以,但是對于提取農(nóng)產(chǎn)品多媒體數(shù)據(jù)內(nèi)容的特征具有一定的困難,在為農(nóng)產(chǎn)品電商用戶發(fā)現(xiàn)新的產(chǎn)品資源能力有限。
參考文獻:
[1]全巧梅.農(nóng)產(chǎn)品電商中精準推薦算法應(yīng)用研究[J].科技廣場,2016(9):39-42.
[2]葉錫君,龔玥.基于項目別的協(xié)同過濾推薦算法多樣性研究[J].計算機工程,2015(10):42-46,52.
作者簡介;裘進(1974—)男,漢族,浙江杭州人,本科,中級,研究方向:農(nóng)業(yè)經(jīng)濟信息管理;李秋霞(1990—)女,漢族,江西南昌人,碩士,中級,研究方向:計算機技術(shù)應(yīng)用及產(chǎn)品管理;章珺彧(1991—)女,漢族,浙江長興人,本科,研究方向:農(nóng)業(yè)電子商務(wù)。