韓欣欣
摘要:近年來,隨著定位技術的成熟,基于位置的社交網(wǎng)絡(Location-Based Social Networks,LBSN)應運而生。LBSN的出現(xiàn)使得傳統(tǒng)的社交網(wǎng)絡更加接近現(xiàn)實。位置網(wǎng)絡所包含的位置信息是相當重要的,綜合分析位置信息可以識別用戶的行為偏好,為用戶推薦可能感興趣的位置,即POI推薦,也是目前LBSN的熱門研究方向。由于涉及隱私問題,用戶的歷史位置數(shù)據(jù)存在高度稀疏性。因此,如何提升POI的推薦質量也是LBSN服務所面臨的挑戰(zhàn)。本文考慮融合地理位置因素、社交關系、時間因素、空間因素、熱門地區(qū)等,針對POI推薦所面臨的冷啟動以及推薦精度等問題進行分析與研究,對該領域在未來提升POI推薦質量提供參考。
關鍵詞:社交網(wǎng)絡;位置信息;稀疏性;融合;POI推薦
中圖分類號:TP311 ? ? ? ?文獻標識碼:A
文章編號:1009-3044(2020)24-0047-02
傳統(tǒng)的推薦系統(tǒng)主要應用于好友推薦和商品推薦,將位置這一特性加入社交網(wǎng)絡,使得傳統(tǒng)的推薦系統(tǒng)變得豐富多彩,同時,也帶來了許多商機。由于Web2.0技術的發(fā)展以及智能移動終端設備的普及,越來越多的用戶愿意通過社交網(wǎng)絡去分享自己的經(jīng)歷,如Foursquare、Gowalla、微博、微信、ins等熱門網(wǎng)站,用戶通過分享位置、照片、文本信息等記錄自己的行為軌跡,這些與位置信息相關的數(shù)據(jù)構成用戶-興趣點矩陣,可以用來挖掘用戶的興趣偏好,在未來的某個時刻為其推薦可能感興趣的位置。與傳統(tǒng)的推薦系統(tǒng)不同,POI推薦面臨數(shù)據(jù)稀疏的挑戰(zhàn),具有一定的復雜性。目前已有的POI推薦模型中,大多數(shù)僅僅考慮到一種相關影響因素,因此如何通過分析用戶的歷史行為記錄,對用戶偏好建模,準確有效地為用戶推薦感興趣的位置,是服務的主要任務。
1基于位置的社交網(wǎng)絡簡述
LBSN將位置信息嵌入社交網(wǎng)絡,可以從圖論的角度分析,把用戶和位置作為兩種類別的節(jié)點,因此由用戶行為產(chǎn)生的數(shù)據(jù)形成邊,主要有用戶與用戶的關聯(lián)度、位置與位置的關聯(lián)度、用戶與位置的聯(lián)系。將該網(wǎng)絡形式化描述為:U={u1,u2,…un},L={l1,l2,…ln},其中,U是該網(wǎng)絡中的用戶集合,從每個用戶位置數(shù)據(jù)中提取幾種特征屬性,L是位置點集合,每個位置用對應的經(jīng)度緯度信息表示。
2相關研究
目前,興趣點推薦主要包括連續(xù)位置推薦和非連續(xù)位置推薦。連續(xù)位置推薦是根據(jù)行為軌跡推薦下一時刻位置,比如李梅一般會在晚上六點鐘下班后去公司附近餐廳吃飯,吃過飯后會去家附近的健身房鍛煉一個小時,在周末經(jīng)常會去附近景點打卡或者購物。這是一種基于位置感知的推薦,Cheng 等人[1]將個人簽到序列看作馬爾科夫模型,并考慮地理區(qū)域限制,實現(xiàn)了短期的興趣點推薦。非連續(xù)位置推薦,也即是單個位置推薦,對用戶的行為偏好建模,通過協(xié)同過濾技術向用戶推薦沒有訪問過的位置。位置信息是基于位置的社交網(wǎng)絡不同于傳統(tǒng)社交網(wǎng)絡的關鍵,用戶在各種社交網(wǎng)絡中簽到分享與所處位置維度、時間段以及流行度等因素有著重要的聯(lián)系。Li 等人[2]分析了用戶行為模式隨著時間的變化趨勢,考慮用戶的長期偏好和短期偏好,提出一種基于時間感知的連續(xù)興趣點推薦算法。文獻[3]將地理位置影響引入 LBSNs 的興趣點推薦中,采用冪律概率模型捕捉興趣點對之間的地理位置影響,通過樸素貝葉斯方法計算擬推薦興趣點的地理位置對目標用戶的影響分數(shù),再使用統(tǒng)一的協(xié)同過濾方法進行興趣點推薦。Cho 等人[4]采用高斯分布模型,將用戶訪問地點劃分為工作-住宅區(qū)域,同時考慮時間因素與空間因素,提出基于社交網(wǎng)站的用戶移動軌跡模型。
3 POI推薦影響因素的分析與研究
3.1 地理位置
在位置社交網(wǎng)絡中,位置因素的影響權重占比較大,對用戶選擇興趣點其決策性的作用。許多研究工作模擬用戶在位置網(wǎng)絡中簽到曲線,發(fā)現(xiàn)用戶的位置偏好與距離呈一定的冪律分布、高斯分布、泊松分布等。 實際生活中,同樣用戶優(yōu)先考慮近鄰位置,比如以居住位置為中心,在興趣點推薦過程中使用距離計算函數(shù),通過設定一定的距離限制過濾掉位置相對較遠的位置點,一定程度上減少冗余數(shù)據(jù)。針對推薦效率,可以選擇將興趣點聚類,畢竟類別數(shù)量遠小于興趣點數(shù)量。因此基于以上分析,可以將用戶位置轉移概率類比距離相關函數(shù)進行興趣點推薦。
3.2 社交關系
在推薦系統(tǒng)中,用戶是推薦對象的主體,因此,用戶間社交關系在興趣點推薦過程中也是相當重要的。用戶簽到矩陣高度稀疏,通過計算好友相似度將用戶聚類,主要以基于用戶的協(xié)同過濾推薦,相關研究發(fā)現(xiàn),好友間訪問興趣點的行為有很強的關聯(lián)性,當好友推薦某一個餐廳或者電影院時,用戶更傾向于嘗試,這取決于社交關系中好友間的信任值。用戶間信任值越大,產(chǎn)生的影響越大。LBSN中,通過研究好友在某一位置的簽到信息分布,Ui、Uj分別表示用戶i和用戶j,E表示關系邊,W(i,j)表示兩用戶間信任值,Sim(i,j)表示兩用戶間的相似度。目前,用戶間相似度計算方法有很多,經(jīng)典的有歐式距離、余弦相似度、Pearson相關系數(shù)、Jaccard 相似性。
3.3 時間因素
基于位置的社交網(wǎng)絡中,時間偏好也會對興趣點偏好產(chǎn)生一定的影響, 在推薦興趣點時,給時間因子分配一定的權重也會提高推薦質量。一天可以分為24個時間戳,不同時間戳內用戶有不同的行為偏好,構建時間因子模型可以在位置網(wǎng)絡中捕捉到密集時間戳,計算不同時間戳之間的距離,將距離進行排序(類似權重W),得出用戶日?;顒悠靡灶A測POI。基于以上提出的位置相似度、好友相似度,時間因子也有時間相似度,采用平滑相似度和矩陣填充的方式可以解決簽到數(shù)據(jù)稀疏性問題,提高模型的推薦效果。目前,時間因素的研究在基于位置的服務領域具有很大的需求。研究表明,時間因素對興趣點偏好選擇的作用集中表現(xiàn)在:1)時間關聯(lián)度;2)時間獨立性;3)時間連續(xù)性;4)時間循環(huán)性。
3.4 基于時間因素的流行度
針對遠距離異地場景,用戶歷史簽到數(shù)據(jù)稀疏導致推薦精度低。引入流行度因素分析,可以在一定程度上緩解這種問題。興趣點流行度是該興趣點是否是熱門區(qū)域,簡單定義為一定時間下訪問該位置頻次的多少劃定,通常采用HITS鏈接分析模型獲取流行度高的興趣點,該模型有兩個主要的度量值中心度( Hub) 和權威度( Authority),興趣點的中心度越高,說明訪問該位置的用戶越多,權威度越高,說明該用戶有較高的可信性。興趣點流行度數(shù)學定義如下:P(li)=V(i)/Vmax(i)(i∈U),其中P(li)表示該興趣點li的流行度,V(i)表示興趣點li處被簽到記錄的次數(shù),Vmax(i)表示相同類別興趣點中最大的簽到頻次。
由于在位置社交網(wǎng)絡中用戶行為偏好是動態(tài)的,流行度也會隨時間而變化,一般小吃街在晚上八點至十點活動量較大,購物街在周末比較聚集,咖啡館在中午屬于熱點區(qū)域等。因此,在分析興趣點流行度因素時,融合時間因素將流行度密度曲線按照不同時間段劃分,可以得出不同時間段下興趣點的流行度,提高推薦精度。
4多因素融合框架構建
在LBSN中,POI推薦受多重因素影響,深入分析各因素的潛在影響,初步構建一種融合多因素的POI推薦框架通過建模分析形成一種線性加權模型,設置調節(jié)各因素的權重參數(shù),通過算法優(yōu)化實驗不斷調整參數(shù),與現(xiàn)有較優(yōu)的算法相比較,達到提高推薦精度的效果。
5 POI推薦所面臨的挑戰(zhàn)
POI推薦是基于位置服務的重要研究方向,目前,國內外已經(jīng)做出大量相關研究,但是仍然面臨一些問題,主要有:1)簽到數(shù)據(jù)稀疏面臨的冷啟動問題;2)數(shù)據(jù)特征提取;3)異地遠距離場景推薦精度低;4)用戶簽到信息涉及隱私問題有待保護。
6結束語
本文針對基于位置服務的POI推薦所存在的推薦精度低等問題進行相關研究,分析了地理位置、社交關系、時間因素以及流行度因素對POI推薦的影響,提出一種線性加權融合多因素的POI推薦模型,考慮模型多參數(shù)的優(yōu)化調整。在此基礎上,下一步將繼續(xù)深入分析影響POI興趣點推薦的因素,例如簽到文本信息所包含的情感因素等,并綜合以上幾種因素完善自己的推薦算法設置實驗進行驗證,達到POI推薦精確度和準確度提高的目的。
參考文獻:
[1] Cheng C,Yang H Q,Lyu M R,et al.Where You like to go next:successivepoint-of-interest recommendation[C]//Proceedings of the Twenty-Third International Joint Conference on ArtificialIntelligence,2013:2605-2611.
[2] Li X,Jiang M M,Hong H T,et al.A time-aware personalized point-of-interest recommendation via high-order tensor factorization[J].ACM Transactions on Information Systems, 2017,35(4):1-23.
[3] YeM,YinP F,Lee W C,et al.Exploiting geographical influence for collaborative point-of-interest recommendation[C]//Proceedings of the 34th international ACM SIGIRconference on Research and development in InformationRetrieval,July 24-28, 2011. Beijing, China. New York: ACM Press, 2011: 325-334.
[4] E Cho, S A Myers, Leskovec J. Friendship and mobility: user movement in location-based social networks[C]//Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining,ACM, 2011:1082-1090.
【通聯(lián)編輯:代影】