• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于協(xié)同過濾和標簽的混合音樂推薦算法研究

      2021-04-18 23:45:40黃川林魯艷霞
      軟件工程 2021年4期
      關(guān)鍵詞:協(xié)同過濾推薦系統(tǒng)標簽

      黃川林 魯艷霞

      摘? 要:結(jié)合音樂這一特定的推薦對象,針對傳統(tǒng)單一的推薦算法不能有效解決音樂推薦中的準確度問題,提出一種協(xié)同過濾技術(shù)和標簽相結(jié)合的音樂推薦算法。該算法先通過協(xié)同過濾技術(shù)確定相似用戶,再通過相似用戶對某一歌手的標簽評分預測另一用戶對該歌手的偏好程度,從而選擇更符合用戶喜好的音樂進行推薦,以此提升個性化推薦效率,為優(yōu)化音樂推薦系統(tǒng)提供參考方法。

      關(guān)鍵詞:協(xié)同過濾;標簽;音樂推薦;推薦系統(tǒng)

      中圖分類號:TP312? ? ?文獻標識碼:A

      文章編號:2096-1472(2021)-04-10-04

      Abstract: Traditional single recommendation algorithm cannot effectively solve the accuracy problem in music recommendation. In view of music, a specific recommendation object, this paper proposes a music recommendation algorithm combining collaborative filtering technology and tags. First, collaborative filtering technology is used to identify similar users. Then, another users preference for a singer is predicted through similar users' tag ratings for the singer. Thus, recommended music is more in line with the users preference, which enhances personalized recommendation efficiency and provides a reference method for optimizing music recommendation system.

      Keywords: collaborative filtering; tags; music recommendation; recommendation system

      1? ?引言(Introduction)

      隨著移動互聯(lián)網(wǎng)、云計算、智能終端、物聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,文本、音頻、視頻、圖像、社交網(wǎng)絡等各種各樣的信息在網(wǎng)絡上正以爆炸式的形勢增長,豐富了人們的日常生活和學習工作內(nèi)容[1-2]。信息技術(shù)和互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展產(chǎn)生了海量信息,這些信息雖然極大地豐富了我們的個人需求,但也帶來了信息過載的問題。為了更好地滿足用戶個性化需求,以及解決信息過載問題,推薦系統(tǒng)應運而生。在這個信息過載的時代,互聯(lián)網(wǎng)已經(jīng)成為人們生活中最重要的組成部分,然而,如何從海量的互聯(lián)網(wǎng)信息中篩選出我們感興趣的內(nèi)容就成為一個難題。推薦系統(tǒng)根據(jù)用戶興趣愛好等特征,個性化推薦滿足用戶需求的對象,目前已經(jīng)在電子商務、信息門戶、社交網(wǎng)絡、移動位置服務、多媒體娛樂等領(lǐng)域得到了廣泛應用[3]。

      硬件成本的降低和技術(shù)的進步導致了數(shù)字音樂的快速發(fā)展,無論是在線音樂還是移動音樂都深受人們的喜愛。Spotify、Pandora、豆瓣音樂等各類各樣的音樂網(wǎng)站和音樂電臺在飛速發(fā)展中為用戶提供了成千上萬首歌曲[1]。然而,大量可用的音樂使得用戶更難以找到他們喜歡的音樂,這就是所謂的選擇悖論[4]。由于音樂具有種類豐富、數(shù)量龐大、收聽時間短以及連貫性和次序性等特點,傳統(tǒng)單一的推薦算法并不能有針對性地解決音樂推薦的準確度問題。如Last.fm是通過協(xié)同過濾進行推薦的,Pandora是通過內(nèi)容相似性進行推薦的[5]。本文根據(jù)用戶偏好、歌曲標簽進行深度數(shù)據(jù)挖掘,運用協(xié)同過濾和基于標簽的AHP混合推薦算法為用戶推薦適合的音樂,以此提升個性化推薦效率,為優(yōu)化音樂推薦系統(tǒng)提供參考方法[6]。

      2? ?推薦算法(Recommendation algorithm)

      推薦算法是推薦系統(tǒng)的核心和關(guān)鍵部分,也是該領(lǐng)域研究最活躍的方向之一[7],推薦算法的好壞決定了推薦系統(tǒng)的性能和推薦結(jié)果的準確性[8]。協(xié)同過濾、基于內(nèi)容、基于規(guī)則等推薦算法各有優(yōu)缺點,為了取長補短,混合算法將各種推薦算法混合進行使用。

      2.1? ?協(xié)同過濾算法

      在音樂推薦系統(tǒng)中應用最多的一種算法是協(xié)同過濾算法,這種算法根據(jù)目標用戶的習慣愛好、個人興趣等歷史信息而對事物進行評價[9],然后推薦相關(guān)物品給用戶。這些歷史信息可能是用戶的瀏覽或購買記錄,也可能是問卷調(diào)查等用戶填寫的相關(guān)信息?;趨f(xié)同過濾的推薦算法具有很強的個性化,可以自動地發(fā)現(xiàn)用戶潛在的興趣,從而逐漸提高系統(tǒng)推薦性能[10]。這種方法適合很多推薦對象,包括處理電影、音樂、圖書和酒店等非結(jié)構(gòu)化的對象[11]。協(xié)同過濾算法的工作原理如圖1所示。

      2.2? ?層次分析法

      層次分析法(Analytic Hierarchy Process, AHP)是1980年美國著名運籌學家T. L. Saaty在其論文中首次提出的簡單而又靈活的多準則決策算法[12]。這種算法將決策專家的主觀判斷轉(zhuǎn)換為定量的客觀表述,本質(zhì)是一種決策思維方式,把復雜系統(tǒng)分解為各個組成因素,進而按支配關(guān)系把這些決策問題的核心影響因素分組,構(gòu)建層次結(jié)構(gòu),用層次化模型處理要解決的問題,設(shè)置優(yōu)先級,然后利用兩兩比較的方式,計算每個因素對最終決策的影響程度,最后還要進行一致性檢驗[13]。AHP算法通過如下五個步驟來確定屬性權(quán)重,并得出推薦的綜合評分。

      第一,定義其評估屬性,把要解決的問題層次化處理,如圖2所示。

      第二,構(gòu)造比較矩陣。

      第三,檢驗比較矩陣一致性。

      第四,計算矩陣權(quán)向量。

      第五,得出推薦的綜合評分。

      本文核心算法綜合使用了基于用戶的協(xié)同過濾推薦算法和基于標簽的AHP層次分析法。首先,分析計算用戶的聽歌記錄,根據(jù)用戶選擇歌手的播放次數(shù),建立了用戶與歌手矩陣模型,模型中的每行表示一個用戶,每列表示一個歌手,每個行向量表示用戶對每個歌手的喜好程度,再使用余弦相似度算法尋找目標用戶的相似用戶。然后,基于歌手標簽使用AHP層次分析法生成個性化推薦列表,以此推薦給經(jīng)過協(xié)同過濾算法產(chǎn)生的目標用戶。

      3? 個性化的音樂推薦系統(tǒng)(Personalized music recommendation system)

      本文的實驗數(shù)據(jù)來源于世界上最大的社交音樂平臺Last.fm

      在網(wǎng)上公布的數(shù)據(jù),在這個音樂庫里,有上億首歌曲曲目和來自全球250個國家超過一千萬的歌手[14]。用戶可以在Last.fm音樂網(wǎng)站獲取免費在線聽歌或者下載音樂等多種音樂服務,這使得Last.fm有上千萬的用戶每個月都在線聽歌,產(chǎn)生了海量的用戶數(shù)據(jù)。這些數(shù)據(jù)包括用戶編號、聽歌記錄、歌曲名、專輯、標簽(歌手、流派、年代、心情等描述性信息)、好友關(guān)系等豐富的信息。

      3.1? ?基于用戶的協(xié)同過濾算法尋找相似用戶

      在個性化的音樂推薦系統(tǒng)中,采用基于用戶的協(xié)同過濾算法,一般是通過計算用戶對音樂的偏好相似度,從而得到最近鄰用戶。例如,若用戶1需要進行個性化推薦,需要先找到同用戶1有相同偏好的其他用戶,然后將這些用戶喜歡的、感興趣的并且用戶1沒接觸過的歌曲推薦給用戶1。

      余弦相似度是最常用的相似度算法之一,它被廣泛地應用于圖像處理、文檔檢索等領(lǐng)域之中。在協(xié)同過濾推薦算法中,評分矩陣中的一行向量代表一個用戶。設(shè)向量分別為A、B,元素值是用戶對產(chǎn)品的評分值,0值代表用戶對該產(chǎn)品沒有評分。兩個向量A、B之間的夾角余弦值就代表了這兩個用戶之間的相似度。計算公式如下:

      本文選取音樂平臺中聽歌行為比較頻繁的用戶,其用戶編號為135、257、397、560、935、1551,以用戶播放次數(shù)為評分依據(jù),得到用戶對歌手的行為矩陣,如表1所示。

      根據(jù)矩陣數(shù)據(jù),對用戶進行兩兩比較,使用公式(1)計算用戶之間的相似度,計算結(jié)果如表2所示,例如用戶135與用戶257的相似度為0.38。由此可知,與用戶935最相似的用戶為用戶257,相似度為0.73。

      用戶257的播放列表中有50位歌手,其中有15首在用戶935的播放列表中。即如果把用戶257的播放列表中的50位歌手都變成推薦列表推薦給用戶935,則準確率為15/50×100%=30%。如果可以對用戶257的播放列表中的50位歌手按照用戶935的收聽喜好再進行一次篩選推薦,則可以有效地提高推薦的準確率。

      3.2? ?基于標簽的AHP層次分析法推薦音樂

      標簽是信息系統(tǒng)中用來代表一段信息的無層次的關(guān)鍵詞或術(shù)語,通過這種用來描述物品的關(guān)鍵詞,可以輔助系統(tǒng)對物品的檢索。不同系統(tǒng)打標簽的方式不盡相同,有作者或?qū)<掖虻臉撕?,也有普通用戶打的標簽。用戶可以以個人非正式化的語言來編輯標簽,表達對物品的看法。利用這些標簽數(shù)據(jù)能夠反映用戶的興趣偏好,將其引入推薦系統(tǒng)中,可以輔助建立偏好模型,提高推薦系統(tǒng)的性能。通過數(shù)學的方法,使用AHP量化決策因素獲得相對于目標層決策問題重要程度的比較值。整個過程需要經(jīng)過以下四個步驟:

      (1)建立問題模型

      AHP層次分析法建立了目標層、準則層、方案層三層模型,來定量分析那些抽象而主觀的決策問題。本文擬推薦的目標用戶為用戶935,影響用戶對歌手喜愛度的因素有很多。在聽歌過程中,用戶935最感興趣的標簽包括電子音樂(electronic)、電子體音樂(ebm)、工業(yè)音樂(industrial)、德國音樂(german)、合成音樂(synthpop)、暗黑電音(dark electro),這些標簽的使用次數(shù)如表3所示,以此構(gòu)建的推薦層次分析模型如圖3所示。

      由表3可以看出,用戶935在選擇歌手時最看重的是“電子音樂”,而“暗黑電音”的重要性是最低的。

      (2)構(gòu)建比較矩陣

      采用1—9量化指標構(gòu)建比較矩陣,來量化因素之間的重要程度。通過評價因素兩兩之間的相對重要程度,來得到某一決策問題的影響因素相對于解決該問題的權(quán)重。通過對全局的統(tǒng)籌把握,決策人對比兩兩因素之間的重要性,以此劃分為同等重要、稍微重要、明顯重要、強烈重要和極其重要共五個等級,并且每個等級都用1—9的數(shù)字進行標注[13],如表4所示。

      影響用戶對歌手喜好的因素有很多,且不同的用戶有不同的權(quán)重考量,通常用戶意識中對于這些因素重要性的考慮都是不清晰的。采用九級標度法構(gòu)造這些因素間重要程度比較矩陣,通過求解比較矩陣的特征向量,得到各因素相對重要性程度的權(quán)重向量,從而將各因素的重要性進行量化[15]。以目標用戶935所做的比較矩陣為例進行說明,如表5所示,例如:“電子音樂”相對于“工業(yè)音樂”的重要程度是4,而“工業(yè)音樂”相對于“電子音樂”的重要程度是1/4。

      (3)檢驗矩陣的一致性

      使用AHP方法,無論在何種階段、由何人分析,最終得到的決策結(jié)果都不能過分偏離理想決策方案,即需要保持思維的一致性。對于比較矩陣是否具有完全一致性,AHP決策分析法提出了數(shù)學化的指標:一致性指標CI(Consistency? Index)。利用CI反映比較矩陣偏離一致性的程度,CI值越大,表示該矩陣偏移一致性程度越大,反之越小,其計算如公式(2)所示:

      其中,為比較矩陣A的最大特征根,n為比較矩陣的階數(shù)。通過計算可得,用戶935所做的比較矩陣中最大特征值=6.3684,根據(jù)公式(2),CI=(6.3684-6)/5=0.0737。

      AHP通過引入平均隨機一致性指標RI(Random Index),對比較矩陣進行一致性檢驗,避免比較矩陣出現(xiàn)邏輯性錯誤[16]。RI與n值的對應關(guān)系如表6所示。

      通過隨機一致性比率CR(Consistency Ratio)的大小檢驗比較矩陣的一致性,如公式(3)所示:

      當CR<0.10時,說明比較矩陣構(gòu)建合理,通過一致性檢驗;反之,當CR≥0.10時,說明該比較矩陣包含邏輯判斷錯誤,就需要修正比較矩陣。用戶935所做的比較矩陣A為六階矩陣,所對應的RI值為1.24。根據(jù)公式(3),CR=0.0737/1.24=0.0594,經(jīng)計算CR<0.10,通過一致性檢驗。

      (4)計算矩陣權(quán)向量

      一致性檢驗通過合格后,構(gòu)建的比較矩陣就可以用來計算每個因素的權(quán)重值。計算得到的權(quán)向量為:

      U=(0.8243,0.4700,0.2636,0.1454,0.0819,0.0480)

      權(quán)向量U的各分量即為歌手在用戶935心中的重要性量化數(shù)值,可以看出,電子音樂、電子體音樂、工業(yè)音樂、德國音樂、合成音樂、暗黑電音在用戶935中的重要性依次為0.8243、0.4700、0.2636、0.1454、0.0819、0.0480。

      (5)歌手的綜合評分

      本文在Last.fm音樂網(wǎng)站中抽取了目標用戶935的相似用戶257對六位歌手關(guān)于評價因素的播放次數(shù),如表7所示。

      這里把播放次數(shù)作為標簽評分,用戶257對某位歌手的“電子音樂”標簽評分為h1,而“電子音樂”在用戶935心中的重要性為0.8243,那么可以認為該歌手的“電子音樂”在用戶935心中的加權(quán)評分為0.8243h1。同樣,計算電子體音樂、工業(yè)音樂、德國音樂、合成音樂、暗黑電音在用戶935心中的加權(quán)評分,分別計為0.4700h2、0.2636h3、0.1454h4、0.0819h5、0.0480h6。將各個因素的評分相加即為該歌手在用戶935心中的綜合評分H:

      H=0.8243h1+0.4700h2+0.2636h3+0.1454h4+0.0819h5+0.0480h6

      按照以上步驟分別計算歌手1、歌手2、歌手3、歌手4、歌手5、歌手6的綜合評分:

      H1=0.8243×2+0.4700×5+0.2636×8+0.1454×4+0.0819×9+0.0480×1=7.4741

      H2=0.8243×6+0.4700×4+0.2636×5+0.1454×2+0.0819×7+0.0480×3=9.1519

      H3=0.8243×9+0.4700×7+0.2636×2+0.1454×4+0.0819×5+0.0480×6=12.5150

      H4=0.8243×7+0.4700×8+0.2636×3+0.1454×3+0.0819×2+0.0480×5=11.1609

      H5=0.8243×8+0.4700×9+0.2636×4+0.1454×5+0.0819×6+0.0480×3=13.2412

      H6=0.8243×6+0.4700×2+0.2636×3+0.1454×4+0.0819×7+0.0480×9=8.2635

      最后將綜合評分較高的歌手3、歌手4、歌手5推薦給用戶935。

      按照上述AHP推薦方法,對用戶257的播放列表中的50位歌手全部進行綜合評分,篩選出評分較高的25位歌手進行推薦,實驗表明,推薦列表中有13首歌曲都是目標用戶935測試集中的歌曲,準確率為13/25×100%=52%。

      4? ?結(jié)論(Conclusion)

      隨著音樂業(yè)務的迅猛發(fā)展,音樂庫越來越豐富,用戶喜好的差異化也越來越大?,F(xiàn)在音樂業(yè)務推廣的一個難點就是如何便捷、快速地從龐大的音樂庫中對用戶進行精準的個性化推薦。本文通過對音樂網(wǎng)站中保存的海量用戶行為記錄進行分析,通過協(xié)同過濾算法確定相似用戶,再基于用戶的興趣標簽,為用戶做出個性化音樂推薦,給音樂領(lǐng)域的推薦算法提供了一種新的思路和參考。

      參考文獻(References)

      [1] 金蕾.個性化音樂推薦算法的研究與實現(xiàn)[D].濟南:山東大學,2017.

      [2] 盧麗靜,朱杰,楊志芳.基于大數(shù)據(jù)的個性化音樂推薦系統(tǒng)[J].廣西通信技術(shù),2015 (1):24-27.

      [3] 劉治宇.基于混合推薦算法的情境感知音樂推薦系統(tǒng)研究與實現(xiàn)[D].成都:電子科技大學,2015.

      [4] HYUNG Z, LEE K. Music recommendation using text analysis on song requests to radio stations[J]. Expert Systems with Applications, 2014, 41(5):2608-2618.

      [5] CAI R, ZHANG C, WANG C, et al. MusicSense: Contextual music recommendation using emotional allocation modeling[C]. The 15th ACM International Conference on Multimedia, 2007.

      [6] 胡昌平,查夢娟,石宇.融合個體興趣與群體認知的音樂個性化推薦模型[J].信息資源管理學報,2018,29(2):97-103.

      [7] 李新衛(wèi).基于Hadoop的音樂推薦系統(tǒng)的研究與實現(xiàn)[D].西安:西安工業(yè)大學,2018.

      [8] 李卓遠,曾丹,張之江.基于協(xié)同過濾和音樂情緒的音樂推薦系統(tǒng)研究[J].工業(yè)控制計算機,2018,31(7):130-131;134.

      [9] 林麗姍.基于協(xié)同過濾算法的社區(qū)音樂推薦系統(tǒng)的設(shè)計與實現(xiàn)[D].長沙:湖南大學,2016.

      [10] 蔡英文.基于多屬性評分的電子商務個性化推薦算法研究[D].南昌:江西財經(jīng)大學,2016.

      [11] 董曉梅.圖書借閱系統(tǒng)中的協(xié)同過濾推薦技術(shù)研究[D].大連:大連理工大學,2015.

      [12] 李亮.評價中權(quán)系數(shù)理論與方法比較[D].上海:上海交通大學,2009.

      [13] 王璐.基于本體的個性化推薦系統(tǒng)[D].成都:電子科技大學,2013.

      [14] 蔡瑞瑜.基于社會上下文約束和物品上下文約束的協(xié)同推薦[D].杭州:浙江大學,2012.

      [15] 郭宇紅,楊金然.一種基于AHP的智能電影推薦方法[J].南京郵電大學學報(自然科學版),2015(35):105.

      [16] 單毓馥,李丙洋.電子商務推薦系統(tǒng)中服裝推薦問題研究[J].毛紡科技,2016,335(5):70-73.

      作者簡介:

      黃川林(1979-),女,碩士,副教授.研究領(lǐng)域:電子商務數(shù)據(jù)分析,個性化推薦.

      魯艷霞(1977-),女,碩士,教授.研究領(lǐng)域:輿情分析,應急管理.

      猜你喜歡
      協(xié)同過濾推薦系統(tǒng)標簽
      無懼標簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      基于用戶偏好的信任網(wǎng)絡隨機游走推薦模型
      基于鏈式存儲結(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計與實現(xiàn)
      軟件導刊(2016年11期)2016-12-22 21:40:40
      基于相似傳播和情景聚類的網(wǎng)絡協(xié)同過濾推薦算法研究
      基于個性化的協(xié)同過濾圖書推薦算法研究
      個性化推薦系統(tǒng)關(guān)鍵算法探討
      基于協(xié)同過濾算法的個性化圖書推薦系統(tǒng)研究
      混合推薦算法在電影推薦中的研究與評述
      淺談Mahout在個性化推薦系統(tǒng)中的應用
      娄烦县| 彭泽县| 高阳县| 宁强县| 南阳市| 固安县| 基隆市| 滦南县| 崇州市| 磐石市| 云龙县| 藁城市| 望奎县| 南澳县| 南城县| 怀宁县| 莲花县| 云林县| 南汇区| 蓝山县| 措美县| 蓝田县| 九寨沟县| 廉江市| 沙田区| 库尔勒市| 保康县| 宣城市| 舒兰市| 永泰县| 凌云县| 界首市| 仁化县| 南江县| 百色市| 斗六市| 平山县| 兴城市| 肃北| 北海市| 宁都县|