胡昌平 查夢娟 石 宇
(1.武漢大學信息資源研究中心,武漢,430072; 2.武漢大學信息管理學院,武漢,430072)
為解決音樂資源急劇增長帶來的信息過載問題,個性化推薦作為一種解決手段受到了廣泛關注[ 1-3],并在實踐中得到廣泛應用,如last.fm、網易云音樂、蝦米音樂等都提供了音樂個性化推薦服務。
在實現音樂個性化推薦上,協(xié)同過濾和基于項目的推薦是兩種主流的實現方式,并且都取得了較好的效果[ 4-7]。在基于項目的個性化推薦中,音樂資源的特征描述是影響最終效果的一個核心問題,其方法主要包括聲學特征描述方法和音樂元數據描述方法兩類。其中,聲學特征描述方法是指通過音頻信號分析等技術方式獲取音樂作品的底層聲學特征進行音樂資源描述,據此進行基于內容的個性化推薦[ 8-9]。音樂元數據描述方法是指采用文本的方式對音樂的特征進行描述,如語種、創(chuàng)作者、時間等,具體實現上可以進一步細分為專家編輯和用戶編輯兩類,前一種是指由領域專家對音樂作品進行元數據添加[ 10-11],后一種是指由用戶進行元數據添加,如基于社會化標簽、評論挖掘進行元數據提取[ 12-13]。
縱觀當前的研究,基于聲學特征的音樂作品描述方法過于關注底層聲學特征,與用戶對音樂的認知存在語義鴻溝[ 14],從而難以準確地描述用戶的興趣偏好;基于專家編輯的元數據描述實現人力成本過高,而且與用戶的音樂感知存在一定的差異,從而可能影響用戶興趣建模的準確性[ 1];基于用戶編輯的元數據描述方法存在兩個突出問題,一是部分特征僅為少量用戶所關注,不能反映用戶普遍關注的焦點;二是大量未反映用戶共識的特征描述被用作資源的元數據。為解決以上幾個方面的問題,本文擬首先基于用戶對音樂作品的認知框架構建元數據體系,并以用戶的共識為基礎進行音樂作品的描述,進而構建融合群體認知與個人偏好的用戶興趣模型,優(yōu)化個性化推薦的效果。
基于項目的個性化推薦中首先需要解決的問題是資源特征的描述,為實現資源描述的角度與用戶決策時考慮的因素相匹配,需要首先建立用戶認識音樂作品的認知框架。以此框架為元數據體系,進行基于群體認知的資源描述,從而保障資源標注的結果與用戶的認識一致。在資源特征描述的基礎上,可以基于用戶感興趣的音樂作品,進行融合其偏好與情境信息的興趣建模,進而基于音樂作品與用戶興趣的相似度進行音樂推薦,各環(huán)節(jié)間的關聯(lián)關系如圖1所示。
圖1 基于個體興趣與群體認知的音樂個性化推薦模型圖
用戶對音樂作品的認知框架反映了其音樂選擇的因素,而基于項目的推薦中,只有依據用戶的決策因素進行資源特征的選取,才能取得更好的推薦效果?;诖耍枰M行用戶音樂作品認知框架的構建,并將其作為面向個性化推薦的音樂作品標注的元數據體系。在實現用戶認知框架構建上,可以采用社會調查法或日志分析法進行。其中,社會調查法是指通過訪談、問卷等形式對用戶展開調查,判斷用戶認知過程中的共性特征,并將其作為認知框架;日志分析法是指通過對用戶的評論、搜索、瀏覽、社會化標注等行為數據的分析,獲得用戶主要關注的資源特征,從而建立其對音樂作品的認知框架。
本研究基于對用戶社會化標簽數據的人工分析進行了認知框架的構建,并將大多數用戶共同關注的音樂作品特征作為其認知框架。根據統(tǒng)計結果,用戶音樂作品認知框架主要由4個要素構成:歌手、語種(地域)、風格流派、適用情境(如安靜,悲傷)。
在元數據體系構建的基礎上,基于群體認知的音樂作品標注主要包括如下幾個環(huán)節(jié)。第一,對于每一個用戶,基于其圍繞某部音樂作品的用戶生成內容數據(User-generatedcontent,簡稱UGC,包括評論、分享時的描述、標簽、收藏時的分類等)進行資源特征提取,從而獲得用戶的認知結果。第二,將每一個用戶的認知結果整合到一起,并以特征詞的頻次為分子,貢獻UGC數據的用戶為分母,進行歸一化處理。第三,設置閾值,獲得基于用戶認知的標注結果。需要指出的是,鑒于不同特征的認知難度不同[ 15],在閾值設置中需要針對不同的元數據設置差異化的閾值。第四,進行音樂作品標注結果的語義描述。鑒于用戶進行音樂作品選擇時,是在綜合考慮多個元數據的基礎上進行的,而每個元數據之間不具有完全的可替代性,因此為便于后續(xù)興趣建模及推薦結果生成,需要對標注結果進行語義描述。
識別用戶感興趣的資源是構建用戶興趣模型的基礎,其實現上既可以采取用戶主動反饋的方式也可以采用基于用戶行為的隱性反饋方式。其中,主動反饋是指用戶將自己對哪些資源感興趣或不感興趣主動反饋給個性化推薦系統(tǒng),這種方式下對感興趣資源的識別準確率高,但用戶成本較高,且不容易全面反饋其感興趣的資源。隱性反饋是指系統(tǒng)通過用戶的行為猜測其對哪些資源感興趣、哪些資源不感興趣,這是目前主流的方式。對于音樂來說,能夠反映用戶是否感興趣的典型行為包括瀏覽、搜索、在線收聽、下載、評論、分享等。但需要說明的是,不同類型的行為,其反映用戶偏好的能力是不同的,如相比于瀏覽,用戶更可能喜歡其分享了的音樂作品;同一個類型的行為,也需要綜合其他因素進行判斷,如在線收聽了一次的音樂,用戶不一定喜歡,但如果在線重復聽了多遍的音樂,則一般認為比較喜歡;因此,需要綜合考慮行為類型及相關影響因素進行用戶感興趣資源的識別。
用戶的音樂需求與其所處的情境具有密切關系,如高興與悲傷時、身處鬧市與安靜工作時所需要的音樂可能具有非常明顯的差異。因此在構建用戶需求時,除了需要考慮用戶偏好之外,還需要考慮用戶的即時情境。其中,偏好是根據用戶較長一段時間內的歷史行為計算的,而情境則是根據用戶當時所處的環(huán)境、狀態(tài)等信息決定的。由于用戶決策時會考慮多個因素模型,因此,用戶的偏好可以表征為一個二維向量,每一行都是用戶認知框架中的一個要素,每個取值都是一個包含關鍵詞和興趣度的二元組,在計算方法上,可以采用常見的向量空間模型進行。此外,需要指出的是,用戶興趣模型中的每一個要素對用戶決策的影響程度是不同的,因此為獲得更好的推薦效果,還需要對每一個要素進行賦權,從而實現各要素作用程度的差異化。
在實現了基于用戶認知框架的音樂作品標注和用戶興趣模型生成的基礎上,可以通過各個音樂作品與用戶興趣模型相似度計算的結果生成推薦結果。相似度計算中,可以將音樂作品的標注結果同樣表示為二維向量,然后通過其與用戶興趣向量的積來表征其與用戶興趣的相似度。鑒于網絡口碑相關研究表明,高質量的及流行度高的音樂更容易獲得用戶的青睞[ 16-17],因此在相似度的基礎上需要提高高質量和流行的音樂作品的權重。在計算各音樂作品相似度之后,對流行度、相似度進行權重計算,隨后降序排列,以采用閾值法進行候選推薦結果的生成。在閾值設置上,既可以采用TopK方法,即選擇相似度最高的K個或前K%個作為推薦結果;也可以設置一個相似度閾值,高于閾值則推薦給用戶,否則不將該音樂作品推薦給用戶。
為驗證模型的效果,選擇了豆瓣音樂這一國內知名的音樂社區(qū)網站作為數據源。鑒于豆瓣音樂中難以獲得用戶聽音樂時的情境信息,因此在實驗中只考慮用戶的長期偏好信息。
實驗目的是為了驗證前文提出的融合個體興趣與群體認知的音樂推薦策略,因此需要獲取用戶感興趣的音樂作品、用戶對感興趣音樂作品的標注信息。實驗數據集由從豆瓣音樂中抽取的36799位用戶、以及這些用戶收聽的307929張音樂專輯的全部標注數據構成,數據集中的字段包括用戶ID、用戶標記為“聽過”的歌曲專輯的URL、專輯名、用戶收聽該作品的時間、為作品添加的標簽;在此基礎上,獲取這些音樂專輯的基本信息,包括專輯名、表演者、流派、專輯類型、介質、發(fā)行時間、豆瓣成員常用標簽等。將用戶圍繞音樂作品添加的標簽進行規(guī)范化處理,包括標簽的規(guī)范化,復合標簽的拆分,繁簡體轉換,中英文轉換,同、近義詞轉換,并對各音樂作品特征的標注頻次進行統(tǒng)計。
在完成以上步驟后,從所得規(guī)范化的數據集中隨機抽取250名用戶,其中59名用戶標記“聽過”的專輯數量在20張以下。為避免收聽專輯的數量過少影響用戶興趣建模效果,在研究中剔除了這些收聽數量在20張以下的用戶,以剩余的191名用戶作為研究樣本。按用戶收聽時間將用戶的收聽記錄排序,并將前60%的用戶收聽記錄(記為α)用作訓練集進行用戶興趣建模,隨后的20%收聽記錄(記為β)作為確定各興趣特征權重系數的訓練集,最后20%的收聽記錄(記為γ)作為測試集用來檢驗音樂推薦的效果。
用戶感興趣的資源可以有多種識別方式,多種方式綜合識別能夠更準確地收集用戶感興趣的資源,考慮到實現方式的復雜性,本實驗以用戶標注為聽過的專輯作為用戶感興趣的資源。音樂作品特征描述框架的構建參照前文所述的用戶認知框架即表演者(歌手)、語種、風格流派、適用場景和地域。其中適用場景主要用于匹配用戶情境,本實驗不考慮情境因素,因此適用場景暫不列入標注框架和用戶興趣建模中。對于國內用戶來說,地域和語種具有很強的可替代性,因此這兩個特征作同義轉換合并為語種特征。
(1)基于群體認知的音樂特征標注
由于表演者是確定的,直接導入平臺數據即可,因此,僅對語種、風格流派進行基于群體認知的特征標注。用戶通過對專輯添加語種、風格流派等特征的標簽完成音樂特征的識別。參與識別語種、風格流派的用戶數量為所有添加了相關特征標簽的用戶數量,未對專輯添加相關特征標簽的用戶則默認其認同其他添加特征標簽用戶的觀點,因此專輯的特征標簽數量占參與標注用戶數量的比例代表了用戶群體對音樂專輯的認知。比值越高,說明專輯具有該特征的可能性越高。在不同閾值下音樂專輯語種、風格流派特征的識別結果存在差異,通過選取不同閾值進行預實驗,結果表明當閾值為0.5時,實驗效果最好。因此專輯在語種、風格流派相關特征上的特征標簽標注占比超過50%時,說明專輯具有該特征。對照組的音樂專輯采用數據集中已有的特征(豆瓣平臺提供的風格流派、語種等)識別結果。
(2)用戶興趣建模
為保證用戶興趣模型與音樂作品的匹配,用戶興趣模型構建也采用音樂作品特征標注的框架即表演者(歌手)、語種(地域)、風格流派。加權統(tǒng)計用戶感興趣專輯的風格流派、語種頻次即可獲得用戶對不同語種、風格流派的偏好,即含有某類特征的專輯數量越高代表用戶對具有該特征的專輯越感興趣。用戶對于歌手的偏好在本次實驗中,分為4個層級:0級,用戶對該歌手不感興趣,用戶聽過的專輯中不包含該歌手的專輯;1級,用戶聽過的專輯中包含該歌手的1張專輯;2級,用戶聽過的專輯中包含該歌手的2張專輯;3級,用戶聽過的專輯中包含該歌手的3張及以上數量專輯。用戶對于這4個層級歌手的偏好程度有很大的差異。通過對β集合的訓練,發(fā)現當0,1,2,3級的權重分別為0,0.3,0.6,1時表現效果最好。因此,以該比例作為用戶對歌手的興趣度計算方式。
(3)用戶興趣模型與音樂作品相似度計算
在獲取用戶興趣向量和音樂專輯歌手、語種、風格流派構成的描述模型向量的基礎上,計算初始候選集(即全部用戶聽過的專輯減去α)中每一張專輯與用戶興趣向量的相似度,并將相似度大于0的專輯作為候選推薦專輯。由于歌手、語種、流派的類型維度過于繁雜,本文分別計算用戶興趣向量與專輯描述模型在歌手、語種和風格流派特征上的相似度。歌手偏好相似度采取用戶對該專輯歌手的興趣度中分級統(tǒng)計的方法計算,相似度計算公式如(1)所示。語種經統(tǒng)計有國語、英文、粵語、日語、韓語、法語、其他等7種類型,風格流派有流行、民謠、爵士、搖滾、電子、布魯斯、古典、金屬、獨立音樂、純音樂、OST、說唱、治愈、清新、鄉(xiāng)村共15種類型,因此語種、風格流派的相似度計算如公式(2)所示。
(1)
(2)
其中,Sim1(ui,sj)表示用戶ui與專輯mj在歌手維度的相似度,R1表示用戶ui喜歡的專輯中統(tǒng)計頻數大于等于3的歌手集合,R2表示用戶ui喜歡的專輯中統(tǒng)計頻數等于2的歌手集合,R3表示用戶ui喜歡的專輯中統(tǒng)計頻數等于1的歌手集合,R4表示沒有出現在用戶ui喜歡的專輯中的歌手的集合,sk表示專輯mj中的歌手。Sim2(ui,mj)表示用戶ui與專輯mj在語種、風格流派維度的相似度,Fu(ui,tk)表示ui的興趣向量tk的權重,Fm(mj,tk)表示專輯mj的語種、風格流派tk的權重。需要說明的是,一部音樂專輯中可能有多個用戶喜歡的歌手,但對每一個歌手,可以用其最喜歡的歌手的興趣度來表征專輯與用戶興趣的匹配度。
(4)各特征維度相似度、流行度權重確定及推薦結果生成
專輯流行度與該專輯被多少用戶感興趣有關,以該專輯被標記為聽過的用戶數與被標記為聽過的用戶數最高的專輯的比值作為該專輯的流行度計算方式。專輯語種、風格流派向量與用戶語種、風格流派興趣向量間的相似度、以及歌手偏好相似度、流行度對于用戶選擇感興趣專輯時的權重是不完全相等的。利用β集合訓練出語種、風格流派相似度、歌手偏好相似度、流行度對于用戶選擇的權重系數。訓練得出各權重系數為0.2,0.4,0.4時效果最好,因此以專輯語種、風格流派相似度權重系數為0.2,歌手偏好相似度權重系數為0.4,流行度權重系數為0.4的權重分布進行后續(xù)實驗。得到每張專輯與用戶興趣相似度值之后,計算在以上權重分布下,待推薦候選專輯中每張專輯對應的綜合待推薦值,降序生成推薦結果。
(5)推薦效果評價指標
為評價該策略的效果,需要將其轉化為在對應個性化推薦中的應用效果進行評估,即通過以上步驟形成個性化推薦結果在測試集中的進行測試;對比實驗僅采用數據集中豆瓣平臺給出的流派及語種劃分結果,風格流派有流行、民謠、爵士、搖滾、電子、布魯斯、古典、輕音樂、說唱、原聲共10種類型,語種則采用系統(tǒng)提供的7種語種進行實驗,通過統(tǒng)計用戶歷史記錄中感興趣流派頻次形成興趣向量,同時采用相同的相似度計算及排序策略。
在評價指標上,由于用戶更為關心推薦排序靠前的項目,因此選取P@N指標進行推薦效果評價,即統(tǒng)計推薦的前N條項目中,用戶喜歡的項目占比[ 18]。其計算方法如公式(3)所示:
(3)
其中,P@Nitem指推薦的前Nr條項目中用戶喜歡的項目占比,Nr是指推薦列表的長度,Nri指該推薦列表中用戶喜歡的項目數量。
通過驗證實驗組與對照組在推薦準確度方面的差異,來評價該策略的效果。本文根據評價指標設定與計算方式,統(tǒng)計了在不同長度的推薦列表(N值)下推薦的P@N值,由于卡方檢驗可以用于檢驗兩組變量是否具有關聯(lián)性,本文選取卡方檢驗進行實驗組和對照組在推薦準確率方面的差異性檢驗。如表1所示。
表1 不同N值下實驗組與對照組的P@N值
注:*表示p<0.05,**表示p<0.01,***表示p<0.001
結果顯示,實驗組與對照組在不同N值下的推薦準確率方面均存在顯著差異,證明實驗組與對照組之間存在顯著性差異。表1可以看出,不同N值下,實驗組準確率始終比對照組高。隨著N值增大,實驗組、對照組的準確率均呈現下滑趨勢,但實驗組的準確率始終高于對照組的準確率。因此,實驗組推薦效果明顯優(yōu)于對照組推薦效果。
通過對比可以看出,融合個體興趣與群體認知的個性化推薦策略能更好地反映用戶興趣偏好,其原因有兩點:①實驗組基于群體認知框架進行興趣建模,把握了用戶選擇感興趣資源時的關鍵影響因素;②基于群體認知的流派識別結果更符合用戶的認知習慣,因而基于其進行的用戶興趣建模更加準確。
本文提出融合個體興趣與群體認知的音樂個性化推薦策略,從用戶對音樂資源的認知框架構建出發(fā),基于群體認知識別音樂資源特征,進行個性化的音樂推薦。結果表明,本策略與未基于群體認知的個性化推薦相比準確度更高。本文提出的個性化推薦策略闡明了用戶認知在資源選擇中的重要性,而且證明了群體認知對于個性化推薦的輔助作用,為音樂資源個性化推薦提出了一種可行的方案,對相關的推薦研究和實踐具有一定的參考意義。
同時,本文也存在一些局限性,主要表現在以下兩個方面:①由于平臺難以獲得與情境相關的信息,因此實驗未考慮情境因素;②用戶音樂作品認知框架的構建上,只考慮了普遍認可的資源特征(歌手、風格流派等),未能全面反映用戶在選擇感興趣資源時決策的維度特征,應建立更為全面的認知框架。
[1] 譚學清,何珊.音樂個性化推薦系統(tǒng)研究綜述[J].現代圖書情報技術,2014,(09):22-32.
[2]SerizawaK,KameiS,HayashiS,etal.Personalizedwebpagerecommendationbasedonpreferencefootprinttobrowsedpages[J].IeiceTransactionsonInformationandSystems,2016,99(11):2705-2715.
[3]IgnatovDI,NikolenkoSI,AbaevT,etal.Onlinerecommendersystemforradiostationhostingbasedoninformationfusionandadaptivetag-awareprofiling[J].ExpertSystemswithApplications,2016,55:546-558.
[4]Sánchez-MorenoD,GonzálezABG,VicenteMDM,etal.Acollaborativefilteringmethodformusicrecommendationusingplayingcoefficientsforartistsandusers[J].ExpertSystemswithApplications,2016,66:234-244.
[5] 魯凱,張冠元,王斌.CICF:一種基于上下文信息的協(xié)同過濾推薦算法[J].中文信息學報,2014(2):122-128.
[6]VandenOordA,DielemanS,SchrauwenB.Deepcontent-basedmusicrecommendation[C]//NZPS’13Proceedingsofthe26thInternationalNeuralInformationProcessingSystems.RedHook,NY,USA:CurranAssociatesInc,2013:2643-2651.
[7]SuJH,ChangWY,TsengVS.Effectivesocialcontent-basedcollaborativefilteringformusicrecommendation[J].IntelligentDataAnalysis,2017,21(S1):S195-S216.
[8]SiddiqueeMMR,RahmanMS,ChowdhurySUI,etal.Associationruleminingandaudiosignalprocessingformusicdiscoveryandrecommendation[J].InternationalJournalofSoftwareInnovation(IJSI),2016,4(2):71-87.
[9]BogdanovD,HaroMN,FuhrmannF,etal.Semanticaudiocontent-basedmusicrecommendationandvisualizationbasedonuserpreferenceexamples[J].InformationProcessing&Management,2013,49(1):13-33.
[10]SchedlM,LiemCCS,PeetersG,etal.Aprofessionallyannotatedandenrichedmultimodaldatasetonpopularmusic[C]//Proceedingsofthe4thACMMultimediaSystemsConference.ACM,2013:78-83.
[11]ChenYS,ChengCH,ChenDR,etal.Amood-andsituation-basedmodelfordevelopingintuitivepopmusicrecommendationsystems[J/OL].ExpertSystems,2015,33(1).Doi:10.1111/exsy.12132.[2017-05-25].https://www.researchgate.net/publication/282790667_A_mood-_and_situation-based_model_for_developing_intuitive_Pop_music_recommendation_systems.
[12] 閆俊,劉文飛,林鴻飛.基于標簽混合語義空間的音樂推薦方法研究[J].中文信息學報,2014(4):117-122.
[13] 李瑞敏,林鴻飛,閆俊.基于用戶-標簽-項目語義挖掘的個性化音樂推薦[J].計算機研究與發(fā)展,2014(10):2270-2276.
[14]ZhangJL,HuangXL,YangL,etal.Bridgethesemanticgapbetweenpopmusicacousticfeatureandemotion:Buildaninterpretablemodel[J].Neurocomputing,2016,208:333-341.
[15] 林鑫,周知.用戶認知對標簽使用行為的影響分析[J].情報理論與實踐,2015,38(10):85-88.
[16] 龔艷萍,張曉丹,張琴.行為視角下的網絡口碑國外研究綜述與展望[J].情報雜志,2016,35(5):161-166.
[17]ZhangX,KoM,CarpenterD.Developmentofascaletomeasureskepticismtowardelectronicword-of-mouth[J].ComputersinHumanBehavior,2016,56:198-208.
[18] 仲兆滿,管燕,胡云,等.基于背景和內容的微博用戶興趣挖掘[J].軟件學報,2017,28(2):278-291.