徐蕓芝,邵 曦
(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003)
基于MT-LDA的音樂標(biāo)簽主題檢索
徐蕓芝,邵 曦
(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003)
隨著協(xié)同標(biāo)注功能的普及,用戶可以通過對自己感興趣的音樂進(jìn)行標(biāo)注從而實(shí)現(xiàn)個(gè)性化的分類管理,因此音樂共享系統(tǒng)中的社會(huì)化標(biāo)簽已成為互聯(lián)網(wǎng)的重要資源??紤]到社會(huì)化標(biāo)簽的特性及其對音樂信息檢索系統(tǒng)的影響并綜合考慮了用戶的檢索行為、歌詞和音樂標(biāo)簽,利用MT-LDA方法對標(biāo)簽進(jìn)行聚類以獲取主題類別,從而進(jìn)行分析得出檢索主題,提高音樂信息檢索系統(tǒng)的效率和性能。實(shí)驗(yàn)結(jié)果表明:在沒有屬性數(shù)據(jù)信息的檢索情況下,基于標(biāo)簽主題的MT-LDA檢索模型相比于基于標(biāo)簽關(guān)鍵詞檢索模型,尤其是在音樂標(biāo)簽稀疏和非正規(guī)的情況下,在一定程度上更能夠提高音樂信息檢索性能。
音樂信息檢索;主題類別;關(guān)鍵詞檢索;MT-LDA模型
伴隨著數(shù)字技術(shù)的飛速發(fā)展,人們對音樂的需求量越來越大,同時(shí)對音樂的要求也越來越高。為了滿足這樣的要求和現(xiàn)狀,人們把越來越多的音樂資源上傳到網(wǎng)上,使得這些音樂資源以海量的速度增長,因此音樂信息檢索(MIR)系統(tǒng)得到的關(guān)注越來越多,但也給其處理音樂數(shù)據(jù)庫帶來了難度和挑戰(zhàn)。即使使用多媒體引擎為音樂信息檢索帶來了突破性的進(jìn)展,但是,目前仍然是以檢索歌曲的基本屬性為搜索歌曲的主要方式。當(dāng)只給定一個(gè)查詢,卻沒有精確匹配或與其近似匹配的記錄來匹配時(shí),谷歌音樂、酷狗音樂和Last.fm等眾多常見的音樂檢索系統(tǒng)很難查詢到滿足用戶要求的歌曲[1]。或者是,當(dāng)你的檢索詞屬于多種不同的歌曲類別時(shí),音樂檢索系統(tǒng)會(huì)特別混亂地將所有跟關(guān)鍵詞相關(guān)的歌曲推薦給你,這樣導(dǎo)致你反而不能聽到你想聽的歌。例如,當(dāng)你在百度MP3的音樂檢索欄中輸入“我希望找到些搖滾(rock)又古典(classic),但同時(shí)又比較動(dòng)感(dance)的歌”,系統(tǒng)會(huì)根據(jù)你的查詢,匹配數(shù)據(jù)庫中存儲(chǔ)的歌曲屬性關(guān)鍵詞,去除掉輸入的一些不要的詞匯,提取出“搖滾、古典、舞曲”,從而把和這些詞相關(guān)的歌曲推薦給你。在這一過程中,音樂標(biāo)簽在一定程度上起到了至關(guān)重要的作用。其實(shí)還可以根據(jù)這些詞提取出用戶的主要需求。
對音樂歌曲進(jìn)行輕量級的文字描述的過程就是所謂的標(biāo)注行為,這些描述的文字就是標(biāo)簽[2]。標(biāo)簽不僅表達(dá)和標(biāo)注出了用戶對資源的喜好和看法,還可以看作是用戶協(xié)作參與交互的一種途徑。雖然沒有一個(gè)通用的詞典或公共標(biāo)準(zhǔn)來約束用戶的標(biāo)注行為,但是標(biāo)簽里面暗含的信息也是不能忽視的,有時(shí)候?yàn)橛脩臬@取和分享信息提供相當(dāng)大的便利。因此,如果能從標(biāo)簽中挖掘出用戶能理解的語義信息,并且結(jié)合音樂本身具有的屬性數(shù)據(jù)來完成音樂的檢索和推薦,這將為MIR(Music Information Retrieval)領(lǐng)域研究者檢索音樂帶來巨大的突破。
文中主要使用MT-LDA(Music Tag Latent Dirichlet Allocation,音樂標(biāo)簽潛在狄利克雷分配模型)提取出用戶需要檢索的主題,從而改善音樂搜索引擎的數(shù)據(jù)處理過程。MT-LDA模型是一種來源于LDA模型的產(chǎn)生式概率模型,它適用于很多離散數(shù)據(jù)集(例如:音樂歌曲的標(biāo)簽集合)。該方法先將用戶的查詢映射到更廣闊的空間,通過泛化概念來更好地了解和理解用戶的檢索意圖和目的。
文中的研究重點(diǎn)在兩個(gè)方面:一方面是如何從網(wǎng)站上得到你想要的歌曲標(biāo)簽及挖掘出這些標(biāo)簽潛在的語義信息;另一方面根據(jù)你挖掘的信息進(jìn)行主題提取并進(jìn)行建模,得出相應(yīng)的主題并完成檢索。通過以上兩方面的研究,探索主題提取模型在MIR系統(tǒng)中的應(yīng)用。
目前,包括社會(huì)化標(biāo)簽的音樂分類檢索[3-4]應(yīng)用系統(tǒng)已經(jīng)廣泛地使用了社會(huì)化標(biāo)簽來滿足用戶多層次多角度的要求。利用已有的標(biāo)簽信息并將用戶標(biāo)注的標(biāo)簽聚類來完成相應(yīng)音樂的檢索,這種改進(jìn)檢索效果的方法是由Begelman和Karydis提出的[5-6]。
從以上研究成果可以看出,如果在一個(gè)應(yīng)用系統(tǒng)中將用戶標(biāo)注的標(biāo)簽進(jìn)行整合和應(yīng)用,這將大大提升MIR系統(tǒng)的檢索性能。詞以及低級特征(屬性數(shù)據(jù))已經(jīng)通過信息檢索模型被廣泛地應(yīng)用到含有標(biāo)注的圖像檢索系統(tǒng)等多媒體檢索系統(tǒng)中來進(jìn)行索引,但還沒有被用到音樂檢索系統(tǒng)里。實(shí)驗(yàn)結(jié)果表明,如果利用音樂對應(yīng)標(biāo)簽的潛在的語義信息再結(jié)合音樂的音頻特征和組成各個(gè)類別的同義詞典的方法,能在很大程度上提高M(jìn)IR的性能。
很多人都在進(jìn)行音樂信息檢索的相關(guān)研究,但他們主要研究的是音頻的處理和音樂分類,對用戶檢索意圖和音樂數(shù)據(jù)庫進(jìn)行理解和分析的研究相對較少。LDA模型是一種挖掘潛在語義和理解屬性數(shù)據(jù)語義信息的模型,它主要是將相關(guān)屬性聚合成人們看不到的簇團(tuán),但這些簇團(tuán)內(nèi)部又包含著相關(guān)的屬性聯(lián)系。LDA模型是由Blei等提出的,后來又被廣泛用到自然語言處理的各個(gè)相關(guān)領(lǐng)域,例如垃圾網(wǎng)頁的分類、檢測、去除以及主題識別等[7]。傳統(tǒng)的音樂檢索,都只是用關(guān)鍵詞匹配來得到歌曲推薦列表。Krestel等已經(jīng)將LDA模型應(yīng)用到標(biāo)簽推薦系統(tǒng)中[7-8],與傳統(tǒng)的音樂檢索方法——關(guān)鍵字匹配檢索相比,該方法能擴(kuò)展資源,在新資源中能夠較好地改進(jìn)搜索效果,從而極大地提高檢索性能。
3.1 音樂向量空間模型
通過對用戶的查詢進(jìn)行分析發(fā)現(xiàn):在大部分情況下,用戶只是輸入歌曲名、歌手信息或與歌曲相關(guān)的其他屬性數(shù)據(jù)而不會(huì)輸入其他數(shù)據(jù);這樣就有必要統(tǒng)計(jì)用戶的查詢來調(diào)整屬性數(shù)據(jù)特征的權(quán)重,從而修改傳統(tǒng)的屬性數(shù)據(jù)的向量空間模型[9]。結(jié)合用戶查詢,對本地組件包特征再賦權(quán)值,以這種方式重新組合集中的數(shù)據(jù)向量,式(1)是對音樂向量進(jìn)行的描述:
Vsong=(a1w1,a2w2,a3w3,a4w4)
(1)
其中,w1表示歌曲名;w2表示作者名字的維度;w3表示專輯;w4表示包括歌詞等其他維度的音樂信息;a1,a2,a3和a4分別表示修正參數(shù),考慮到四者在用戶查詢統(tǒng)計(jì)中的比重和查詢的意義,將四者初步設(shè)定為0.4,0.2,0.2,0.1。
對音樂的描述定義完后,用式(2)來計(jì)算歌曲查詢相似度。
3.2 關(guān)鍵詞音樂信息檢索
關(guān)鍵詞音樂信息檢索,是一種基于標(biāo)簽的檢索模式。該模式改變了傳統(tǒng)的檢索模式,允許用戶在不知道音樂的名稱、歌詞或歌手名等特定信息的情況下,輸入一些與想查詢的歌曲相關(guān)的標(biāo)簽信息來輔助查詢擴(kuò)展和結(jié)果的排序。用戶也可以在搜索引擎輸入框中輸入自己當(dāng)時(shí)的心情、自己當(dāng)時(shí)的情感以及當(dāng)時(shí)的環(huán)境,系統(tǒng)會(huì)根據(jù)用戶輸入的信息對檢索出來的結(jié)果進(jìn)行過濾、篩選和排序,最后實(shí)現(xiàn)音樂的檢索和自動(dòng)推薦[10]。為了提高音樂信息的檢索效果,要考慮到如下幾個(gè)因素:
(1)歌曲除了歌手、歌名等標(biāo)注,還有關(guān)于其他信息的標(biāo)簽。
(2)該歌曲被聽過的用戶數(shù)目,及標(biāo)簽是否大眾化而不是個(gè)別用戶標(biāo)注的。
(3)該歌曲的標(biāo)簽數(shù)目及標(biāo)簽的形式,標(biāo)簽是否有多余、重復(fù)和不相關(guān)的詞。
為此,文中從Last.fm網(wǎng)站上爬取了很多已經(jīng)進(jìn)行過分類的歌曲并進(jìn)行標(biāo)簽整理,去除多余、沒用和無關(guān)的標(biāo)簽,并且對標(biāo)簽數(shù)目進(jìn)行統(tǒng)計(jì)。用式(3)計(jì)算每首歌每個(gè)標(biāo)簽的概率:
(3)
其中,TFij是詞頻(TermFrequency),即某標(biāo)簽ti在該歌曲標(biāo)簽中出現(xiàn)的頻率;IDF是逆向文件頻率(InverseDocumentFrequency),可以由總歌曲數(shù)目除以包含該標(biāo)簽的歌曲的數(shù)目,再將得到的商取對數(shù)得到。
把搜索輸入框輸入的關(guān)鍵詞與音樂歌曲庫的標(biāo)簽進(jìn)行匹配,按照式(4)計(jì)算并推薦概率相對較大的歌曲:
(4)
從表1可以發(fā)現(xiàn),某歌曲屬于某一個(gè)主題類別時(shí),它的標(biāo)簽描述會(huì)大多數(shù)偏向于這種主題類別,說明用戶標(biāo)注不是盲目的。每首歌會(huì)有不同的標(biāo)簽,而且有的標(biāo)簽會(huì)被用戶重復(fù)標(biāo)注,這將直接影響到計(jì)算該標(biāo)簽的概率,從而會(huì)改變檢索歌曲的概率值,使該歌曲更容易被檢索到。
表1 隨機(jī)抽取的5首歌類別及標(biāo)簽
3.3 基于音樂標(biāo)簽理解的MT-LDA檢索
MT-LDA(Music Tags-Latent Dirichlet Allocation)是一種提取音樂標(biāo)簽主題的LDA模型。該模型(見圖1)不僅為音樂標(biāo)簽設(shè)置了潛在語義模型,還使每首歌對應(yīng)的標(biāo)簽內(nèi)容是一個(gè)隨機(jī)變量,用來顯示所歸屬的潛在主題(潛在類別)的概率值。在模型中,潛在話題定義為一個(gè)在有限詞典上的單詞(標(biāo)簽,這里主要考慮與流派相關(guān)的標(biāo)簽)的離散分布。MT-LDA假設(shè)每個(gè)歌曲標(biāo)簽是由一個(gè)帶有隨機(jī)選擇參數(shù)分布的隨機(jī)主題從可見以及非可見的歌曲標(biāo)簽群中產(chǎn)生的,主題單一平滑分布會(huì)將歌曲標(biāo)簽滿足的參數(shù)實(shí)例化一次[11]。
該方法中的隨機(jī)變量有:變量θ~p(θ);多項(xiàng)式變量c來表示主題類別;多項(xiàng)式變量t表示歌曲標(biāo)簽詞匯。
圖1 基于音樂標(biāo)簽的MT-LDA方法
其中,M是整個(gè)音樂標(biāo)簽數(shù)據(jù)集;α是Dirichlet先驗(yàn)參數(shù),在模型中用于生成一個(gè)主題θ向量;β是表示各個(gè)主題對應(yīng)的標(biāo)簽概率分布矩陣[12]。它證明了基于MT-LDA的音樂標(biāo)簽主題檢索方法在注重簡單詞語擴(kuò)展的相關(guān)規(guī)則下,可以從用戶協(xié)作標(biāo)注的標(biāo)簽中挖掘出一個(gè)共享的主題結(jié)構(gòu)。
在這個(gè)簡化基本模型中有一些假設(shè)。首先,假設(shè)維度為K的狄利克雷分布(即主題類別的維度變量c)是已知和固定的。其次,就是詞匯的概率參數(shù)β是一個(gè)K×V的矩陣,將其看成是固定的且可以估計(jì)出來的[13]。最后,泊松估計(jì)不是很重要,它可以根據(jù)歌曲的標(biāo)簽多少來調(diào)節(jié)使用。此外,發(fā)現(xiàn)N獨(dú)立于其他所有生成數(shù)據(jù)變量(θ和t),它是一個(gè)輔助變量,所以通常會(huì)忽略其隨機(jī)性對數(shù)據(jù)變量的影響。
(5)
式中,α為K維變量;Γ(x)是伽馬函數(shù)。
鑒于給定了參數(shù)α和β,混合主題θ、N個(gè)主題類別c、N個(gè)標(biāo)簽詞組的聯(lián)合概率如式(6):
(6)
該方法中歌曲的標(biāo)簽組t被當(dāng)成觀察變量,θ和c被當(dāng)成隱藏變量,于是就可以通過EM算法[14]學(xué)習(xí)訓(xùn)練出α和β。在這個(gè)學(xué)習(xí)訓(xùn)練求解過程中,若遇到后驗(yàn)概率p(θ,c|t)無法直接求解的情況,需要找到一個(gè)似然函數(shù)下界來輔助近似求解。文中使用基于分解假設(shè)的變分法進(jìn)行計(jì)算,用到了EM算法,每次E-step輸入α和β,計(jì)算得到所需的似然函數(shù),再用M-step最大化這個(gè)似然函數(shù),算出α和β,不斷循環(huán)迭代直到收斂[14]。
從以上的討論中可以看出,MT-LDA模型有三個(gè)重要的部分:
(1)α和β都是用來表示語料級別的參數(shù),也就是每首歌的標(biāo)簽組都被當(dāng)作是一樣的,因此生成過程只采樣一次;
(2)θ是歌曲標(biāo)簽組級別的變量,方法中每個(gè)歌曲標(biāo)簽組產(chǎn)生各個(gè)主題類別c的概率是不同的,因此每個(gè)歌曲標(biāo)簽組對應(yīng)一個(gè)不同的θ,也就是說,所有生成的每個(gè)歌曲標(biāo)簽組采樣一次θ;
(3)c和t都是標(biāo)簽詞匯級別變量,c由θ生成,t由c和β共同生成,一個(gè)標(biāo)簽詞匯t對應(yīng)一個(gè)主題類別c[15]。
至此,MT-LDA模型主要通過GibbsSampling學(xué)習(xí)求解出音樂標(biāo)簽集中標(biāo)簽在主題類別上的概率分布α,以及主題類別在標(biāo)簽詞匯上的概率分布β。根據(jù)α和β,就能求解出每次輸入的檢索詞匯向量組關(guān)于各個(gè)主題類別的概率分布以及主題類別關(guān)于各個(gè)標(biāo)簽詞匯的概率分布[16]。通過概率計(jì)算,就能分析出每次檢索最可能想要檢索到的歌曲主題類別,及各個(gè)主題類別最具代表性的標(biāo)簽詞匯,從而完成歌曲的檢索和推薦。
4.1 實(shí)驗(yàn)過程
音樂社會(huì)化標(biāo)簽可以從不同角度和方面反映人們對音樂的感受和想法,具有許多社會(huì)屬性的同時(shí),也包含了歌曲自身的許多客觀屬性。為了保證實(shí)驗(yàn)數(shù)據(jù)的客觀性及可再現(xiàn),文中使用了著名音樂社交網(wǎng)站Last.fm的數(shù)據(jù)語料。該數(shù)據(jù)集是從Last.fm上爬取了2014年下半年至2015年3月份全球各個(gè)地區(qū)的熱門音樂榜單,其中包括歌曲名、歌手名及其標(biāo)簽信息。
數(shù)據(jù)集本身包含的是原始的歌曲信息,其中有的歌曲標(biāo)簽只有一個(gè),選擇標(biāo)簽數(shù)為三個(gè)以上的歌曲。還有的標(biāo)簽是句子或詞組,要對其進(jìn)行處理和整理。對于一些無明確含義及對檢索沒有幫助的垃圾標(biāo)簽,如“first listen”,將垃圾標(biāo)簽從語料中去除。最終得到了500首歌曲和38個(gè)標(biāo)簽詞匯,而且大多數(shù)標(biāo)簽是有關(guān)音樂流派風(fēng)格。
使用MT-LDA模型對數(shù)據(jù)庫進(jìn)行主題類別挖掘,訓(xùn)練得出α和β,根據(jù)α和β,再結(jié)合檢索框輸入的檢索詞匯挖掘出用戶最想聽到什么樣的歌,把這些相關(guān)的歌推薦給用戶。
4.2 實(shí)驗(yàn)結(jié)果及分析
文中實(shí)驗(yàn)過程中一共進(jìn)行了9次檢索操作,每次檢索輸入多個(gè)檢索詞匯來查找自己想聽到的歌曲。分別用傳統(tǒng)的關(guān)鍵詞檢索和MT-LDA模型提取主題檢索兩個(gè)方法進(jìn)行檢索,檢索到的推薦歌曲數(shù)選擇最靠前的20首。抽出其中的一次檢索,可得到關(guān)鍵詞檢索歌曲推薦表,如表2所示。表3顯示的是用MT-LDA主題提取方法檢索得到的歌曲表。歌曲推薦表中不僅顯示了歌曲名,還包括檢索的相關(guān)歌曲類別。
表2 關(guān)鍵詞檢索歌曲推薦表
表3 MT-LDA主題檢索歌曲推薦表
文中采用MAP(Mean Average Precision),每個(gè)主題類別的平均準(zhǔn)確率的平均值指標(biāo),對實(shí)驗(yàn)結(jié)果進(jìn)行度量。MAP是度量檢索系統(tǒng)性能的常用指標(biāo),也是主題建模界常用的衡量方法。系統(tǒng)檢索出來的相關(guān)歌曲越靠前,MAP值越高,表示檢索性能越好,模型的推廣性越好。
圖2顯示了兩種檢索方式9次檢索的MAP值的比較。
圖2 兩種檢索方法的MAP值比較
把表2和表3進(jìn)行比較可以得出,雖然輸入的檢索詞匯都是“rap rock folk electronic”,但是,關(guān)鍵詞檢索方法只會(huì)匹配跟這四個(gè)檢索詞相關(guān)的歌曲,把概率值大的歌曲推薦給你。而MT-LDA檢索方法會(huì)結(jié)合訓(xùn)練出的參數(shù)得出你最想檢索的歌曲的主題類別,從而把這個(gè)主題類別相關(guān)的歌曲推薦給你。所以會(huì)發(fā)現(xiàn),表2中的歌曲的類別特別混亂,反而不知道你想聽什么歌;而表3主要給你推薦了“disco”和“electronic”的歌曲。
由圖2可以看出,MT-LDA主題檢索方法的MAP值比關(guān)鍵詞檢索方法的高出許多,證明MT-LDA主題檢索方法的檢索性能要高于關(guān)鍵詞檢索方法。
綜上所述,MT-LDA主題檢索方法在設(shè)計(jì)中不僅考慮了歌曲集的標(biāo)簽信息,還能從不知道歌曲歌名及歌手信息的用戶檢索信息中挖掘出用戶最想聽的歌曲的主題類別,從而把相關(guān)歌曲推薦給用戶,大大提高了檢索性能。
MT-LDA模型通過對已有的數(shù)據(jù)集進(jìn)行數(shù)據(jù)處理及分析,得出標(biāo)簽檢索主題,極大地提高了檢索的準(zhǔn)確性和性能。未來將側(cè)重于結(jié)合歌曲的音頻特性和MT-LDA模型給用戶標(biāo)注過的新歌曲進(jìn)行分類,使得歌曲數(shù)據(jù)集更具有準(zhǔn)確性,從而提高主題提取精度,進(jìn)一步增強(qiáng)檢索性能。
[1] Levy M,Sandler M.Music information retrieval using social tags and audio[J].IEEE Transactions on Multimedia,2009,11(3):383-395.
[2] Beckett D. Semantics through the tag[C]//Proceeding of XTech 2006:building web 2.0.[s.l.]:[s.n.],2006.
[3] Kim H,Breslin J G,Yang S,et al.Social semantic cloud of tag:semantic model for social tagging[C]//Proceedings of the 2nd KES international conference on agent and multi-agent systems:technologies and applications.[s.l.]:ACM,2008:83-92.
[4] Wang F,Wang X,Shao B,et al.Tag integrated multi-label music style classification with hypergraph[C]//Proc of 10th international society for music information retrieval conference.Kode,Japan:[s.n.],2009:363-368.
[5] Begelman G,Keller P,Smadja F.Automated tag clustering,improving search and exploration in the tag space[C]//Proc of the 15th international world wide web conference.Edinburgh,UK:[s.n.],2006.
[6] Karydis I,Nanopoulos A,Gabriel H,et al.Tag-aware spectral clustering of music items[C]//Proc of 10th international society for music information retrieval conference.Kode,Japan:[s.n.],2009:159-164.
[7] Krestel R,Fankhouser P,Nejdl W.Latent Dirichlet allocation for tag recommendation[C]//Proceedings of ACM conference on recommender systems.New York,USA:ACM,2009:61-68.
[8] Feng Y,Zhang Y,Pan Y.Popular music retrieval by detecting music[C]//Proc of ACM SIGIR’03.Toronto,Canada:ACM,2003.
[9] Baeza-Yates R,Ribeiro-Neto B.Modern information retrieval[M].New York:ACM Press,1999.
[10] Meila M,Heckerman D.An experimental comparison of several clustering and initialization methods[J].Machine Learning,2001,42:9-29.
[11] 周利娟,林鴻飛,閆 俊.基于TLDA和SVSM的音樂信息檢索模型[J].計(jì)算機(jī)科學(xué),2014,41(2):174-178.
[12] Stigler S M.Parametric empirical Bayes inference:theory and applications[J].Journal of the American Statistical Association,1983,78(381):47-65.
[13] Nigam A,McCallum A K,Thrun S.Text classification from labeled and unlabeled documents using EM[J].Machine Learning,2000,39:103-134.
[14] Popescul A,Ungar L H,Pennock D,et al.Probabilistic models for unified collaborative and content-based recommendation in sparse-data environments[C]//Proceedings of the seventeenth conference on uncertainty in artificial intelligence.San Francisco:Morgan Kaufmann,2001.
[15] Rennie J.Improving multi-class text classification with Naive Bayes[R].[s.l.]:MIT,2001.
[16] Ronning G.Maximum likelihood estimation of Dirichlet distributions[J].Journal of Statistical Computation and Simulation,1989,34(4):215-221.
Music Tags Topic Retrieval Based on MT-LDA
XU Yun-zhi,SHAO Xi
(College of Communication & Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China)
Music sharing systems with collaboratively tagging function have been important parts on the Internet.They make the system users annotate and categorize their own interests and thoughts about the resources possible.Considering the characteristics of social tagging and its influence on Music Information Retrieval (MIR) system,MT-LDA method by jointly considering lyrics,tags and searching behavior can be used to analyze collaboratively generated tags and the topic category of tags to catch the retrieval topic,so as to improve the efficiency and performance of MIR system.The experiment shows that MT-LDA retrieval model based on tags topic performs better than keywords retrieval model based on tags into improving the MIR system performance especially tags for tracks are extremely sparse and informal,when retrieval information have no attribute data.
music information retrieval;topic category;keywords retrieval;MT-LDA model
2015-09-28
2015-12-30
時(shí)間:2016-05-25
國家自然科學(xué)基金青年基金(60902065)
徐蕓芝(1989-),女,碩士研究生,研究方向?yàn)槎嗝襟w音樂信息處理和檢索;邵 曦,博士,副教授,研究生導(dǎo)師,研究方向?yàn)槎嗝襟w信息處理系統(tǒng)、基于內(nèi)容的音樂信息檢索等。
http://www.cnki.net/kcms/detail/61.1450.TP.20160525.1711.068.html
TP31
A
1673-629X(2016)07-0200-05
10.3969/j.issn.1673-629X.2016.07.043