李微娜+王雪萍+富春巖+周虹+曲思龍+張競達(dá)
摘要:近幾年,隨著移動互聯(lián)網(wǎng)的迅速發(fā)展、移動終端計算速度的快速提升、移動操作系統(tǒng)的逐漸統(tǒng)一,移動終端的信息資源數(shù)量正呈爆炸性的增長。在移動網(wǎng)絡(luò)環(huán)境下,分析用戶的瀏覽行為,并從中提取相關(guān)偏好信息,從而實現(xiàn)向用戶推薦個性化的信息服務(wù)。
關(guān)鍵詞:移動環(huán)境;用戶偏好;挖掘推薦
中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)16-0064-02
1 概述
近些年,隨著移動網(wǎng)絡(luò)技術(shù)的日益成熟,大量日益增長的網(wǎng)絡(luò)信息資源涌入移動網(wǎng)絡(luò)環(huán)境中,因此信息過載和信息迷失已嚴(yán)重制約了人們對網(wǎng)絡(luò)信息的使用。隨之而來的是移動網(wǎng)絡(luò)客戶在移動設(shè)備上想要購買商品時的挫敗感。為了緩解這些問題,搜索引擎和信息檢索技術(shù)應(yīng)運而生。但是它們只是將用戶等同處理,其并沒有考慮用戶的特性,沒有針對不同的用戶反饋有針對性的資源,所以反饋的信息量很大,用戶很難找到自己真正喜愛的信息。另一方面,這些問題一部分原因是由于受到了手機(jī)的一些特性制約。與電腦相比,手機(jī)具有更小的屏幕、更小巧的輸入按鍵以及相對單一的瀏覽器。因此,移動用戶所使用的移動網(wǎng)絡(luò)應(yīng)用界面相對來說不如傳統(tǒng)網(wǎng)絡(luò)的親切適用。為了更好地滿足移動用戶的搜索偏好,一種更有效的搜索輔助功能應(yīng)運而生--個性化推薦服務(wù)。
本文通過移動環(huán)境下獲取用戶偏好信息,并將MADM算法結(jié)合OWA算子分析個性化用戶的偏好信息,進(jìn)而反饋用戶隱性信息需求。
2 基于移動環(huán)境下的用戶信息數(shù)據(jù)挖掘
用戶的偏好信息是通過移動站點中用戶瀏覽行為的相關(guān)信息獲取,以此建立模型并預(yù)測用戶偏好。數(shù)據(jù)的來源是移動網(wǎng)絡(luò)服務(wù)器內(nèi)的網(wǎng)頁數(shù)據(jù)記錄,這與傳統(tǒng)網(wǎng)絡(luò)有些類似,但移動網(wǎng)絡(luò)由于其獨特的特性更簡潔更具有優(yōu)勢。首先,在傳統(tǒng)網(wǎng)絡(luò)中,網(wǎng)頁中含有大量GIF、JPG、SWF文件等無關(guān)元素,并且清除耗時巨大。然而,在移動網(wǎng)絡(luò)中,受流量、屏幕限制,更多的元素是文本,例如。其次,在移動網(wǎng)絡(luò)環(huán)境中,所有用戶只能由單一的電話或是電子設(shè)備來接輸送數(shù)據(jù)。這是記錄用戶信息的必要條件,主要用于防止在用戶識別過程中出現(xiàn)混亂。另外,我們可以利用用戶的這些相關(guān)信息提供更有效的推薦服務(wù)。再次,在移動網(wǎng)絡(luò)中,每個用戶在一定時間內(nèi)所有頁面的接收,都會在日志中的特定字段用相同值記錄下來,例如會話標(biāo)識,并且我們可以用會話標(biāo)識字段作為識別每個用戶個體的標(biāo)識。
因此對于移動環(huán)境下的用戶信息處理可以分三個步驟:第一階段是規(guī)范化數(shù)據(jù)挖掘,主要任務(wù)是信息選取和信息預(yù)處理,可以將日志、Web內(nèi)容、用戶信息等資源中篩選出能為挖掘算法可用的規(guī)范化數(shù)據(jù),其結(jié)果是后續(xù)數(shù)據(jù)處理的基礎(chǔ),所以必須對數(shù)據(jù)源數(shù)據(jù)整理并規(guī)范化處理;第二階段是數(shù)據(jù)預(yù)處理,主要任務(wù)是識別用戶、用戶路徑記錄、識別會話、篩選相關(guān)數(shù)據(jù)等;第三階段是建模,主要是根據(jù)先前處理過的數(shù)據(jù)建立推薦模型向用戶提供進(jìn)行推薦服務(wù),這是個時時處理的過程,需要考慮用戶某時段內(nèi)瀏覽路徑,用戶的瀏覽路徑信息指的就是用戶在某時間段在網(wǎng)站內(nèi)所瀏覽的不同頁面。
3 用戶訪問偏好興趣挖掘
在移動網(wǎng)絡(luò)環(huán)境下,就前面提到,由于移動網(wǎng)絡(luò)的特殊性,我們可以借此對新注冊用戶和瀏覽用戶這些潛在消費群體推薦。通過用戶的瀏覽軌跡獲取偏好,進(jìn)而分析獨立客戶偏好特性來進(jìn)行有針對性的推薦服務(wù)。其整個過程如下圖1所示。
在此假定用戶對某有限數(shù)量的特定商品感興趣,其中該商品分類中的有限商品中每個商品是用戶點擊瀏覽過的一個頁面。用戶瀏覽時間、點擊率、頁面結(jié)束等信息,我們利用C.Shahabi提出的客戶追蹤機(jī)制原理獲取,所得信息自動記錄在用戶行為數(shù)據(jù)庫內(nèi),用來反應(yīng)用戶對該項目的偏好,從而推測出用戶的偏好興趣??筛鶕?jù)用戶當(dāng)前的行為數(shù)據(jù),獲取商品之間的關(guān)系,所要達(dá)到從用戶行為中反饋的不完全偏好信息提取某用戶對該商品的偏好序列,而后通過MADM方法估算每個屬性的權(quán)重。
假定用戶偏好程度有如下情況:
a.用戶對只瀏覽的商品,瀏覽累積時間越長用戶越偏好。
b.相比只瀏覽商品,用戶對放入購物籃的商品更偏好。
同時,首先通過最近產(chǎn)生的反饋產(chǎn)生對偏好判斷的最大數(shù)設(shè)置的約束集,以此類推。假定將某類商品定義成一個集合A={a1,a2,……,am},設(shè)該類商品集合中每個商品有同屬性集C={c1,c2,……,cn},PK是瀏覽頁面集合PK={pk|k=1,…,T},pk表示所瀏覽的第k個頁面,瀏覽某商品al所用時間是t(al)。
從用戶瀏覽行為中提取興趣項目。
根據(jù)圖1所示,根據(jù)用戶瀏覽行為的偏好獲取的具體過程如表1所示:
4 結(jié)束語
移動網(wǎng)絡(luò)服務(wù)的發(fā)展目標(biāo)更多的是體現(xiàn)在用戶在搜索過程中的快速準(zhǔn)確找到目標(biāo),并且因為移動網(wǎng)絡(luò)的特殊性,還應(yīng)考慮便利性和效益問題,需要針對上述問題探討更愉快的用戶購物體驗。因此本文通過移動網(wǎng)絡(luò)環(huán)境數(shù)據(jù)挖掘,提煉用戶反饋的不完全偏好信息,并通過分析用戶的訪問路徑向用戶推薦個性化的信息服務(wù),以期提高推薦的準(zhǔn)確率和用戶滿意率。
參考文獻(xiàn):
[1] 李微娜,馬小琪,馮艷光.基于MADM方法的個性化推薦研究[J].現(xiàn)代情報,2011(5).
[2] 查凱萊巴蒂.Web數(shù)據(jù)挖掘[M].北京:人民郵電出版社,2009.
[3] 王繼民,李雷明子,鄭玉鳳.基于日志挖掘的移動搜索用戶行為研究綜述[J].情報理論與實踐,2014(3).
[4] 李微娜.面向用戶偏好的MADM方法在個性化推薦中的應(yīng)用[D].哈爾濱:黑龍江大學(xué),2011.