歐陽督
(湖南師范大學(xué)附屬中學(xué) 410006)
淺談數(shù)字音頻指紋技術(shù)的應(yīng)用
歐陽督
(湖南師范大學(xué)附屬中學(xué) 410006)
數(shù)字音頻指紋技術(shù)的誕生給人們的娛樂生活帶來了更多的方便,利用該種技術(shù),可以快速尋找出想要的音樂。本文主要針對數(shù)字音頻指紋技術(shù)的基本概念、產(chǎn)生背景以及具體應(yīng)用進(jìn)行分析。
數(shù)字音頻指紋技術(shù);概念;應(yīng)用
隨著計算機(jī)網(wǎng)絡(luò)的發(fā)展,人們對網(wǎng)絡(luò)的運用日益增多,網(wǎng)上也出現(xiàn)了海量的視頻、音樂等信息,在此背景下如果采用傳統(tǒng)的手工選取歌曲顯得較為吃力,此時數(shù)字音頻指紋自動識別技術(shù)應(yīng)用而生,并且成為相關(guān)工業(yè)界相關(guān)科研研究的熱門問題。數(shù)字音頻指紋是指一種數(shù)字簽名,它代表了某段音樂的聲學(xué)特征。本文主要介紹數(shù)字音頻技術(shù)的產(chǎn)生背景、基本概念和性質(zhì)以及它的應(yīng)用,提出了里面存在的問題和有效措施。
1.1 數(shù)字音頻指紋技術(shù)的基本概念及產(chǎn)生背景
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,音頻壓縮技術(shù)得以完善,網(wǎng)上存儲了大量的音樂信息,原先采用的手工截取技術(shù)已經(jīng)不能適應(yīng)新的形式,這就使得數(shù)字音頻技術(shù)應(yīng)運而生。音頻指紋簡單地的說就是一種數(shù)字簽名,它代表了音樂中隱含的聲學(xué)特征。此種技術(shù)的主要目的就是建立起一個對兩種音頻數(shù)據(jù)的感知質(zhì)量進(jìn)行有效比較的系統(tǒng)。這里的比較對象不是音頻數(shù)據(jù)本身,而是對數(shù)字指紋的比較。比如說大量的音樂信息在數(shù)據(jù)庫里面存儲的時候,就有歌名和作者信息、歌詞等音頻數(shù)據(jù),這時指紋就可以作為截取歌曲的索引。
通常情況下音頻指紋系統(tǒng)包含聽覺特征計算算法和搜索對比算法兩個部分。對一段音樂的具體識別過程為,首先利用指紋識別算法分析出要識別的音樂的音頻特征,然后通過提取算法和指紋對比算法在數(shù)據(jù)庫中尋找出原始的指紋,并且提取出相關(guān)信息返回給用戶。
使用音頻指紋技術(shù)進(jìn)行信息提取的好處主要體現(xiàn)在:①有效減少了對硬盤容量的要求;②能夠進(jìn)行模糊對比,受音頻信號失真影響較?。虎壑讣y數(shù)據(jù)庫尺寸較小有利于高效搜索。
1.2 音頻檢索技術(shù)和數(shù)字水印技術(shù)的比較
在普通人的認(rèn)知中,音頻檢索技術(shù)和數(shù)字水印技術(shù)是沒有太大區(qū)別的,但是實質(zhì)上兩者的數(shù)字指紋概念有著本質(zhì)的區(qū)別。數(shù)字水印技術(shù)主要針對于盜版進(jìn)行追蹤的,每次音頻信息經(jīng)過拷貝以后,就會嵌入不同的水印,那么此項技術(shù)就可以有效追尋到盜版分發(fā)的源頭。而音頻檢索技術(shù)就是對于未知音頻的音頻識別技術(shù)。
1.3 音頻指紋的性質(zhì)
音頻指紋技術(shù)主要應(yīng)用在海量的音頻信息中檢索出需要的數(shù)據(jù),那么它具有以下幾個方面的特性:
準(zhǔn)確性:這一特性包括對信息檢索的正確識別率、還有檢索過程中的漏檢率以及誤檢率。
魯棒性:是指數(shù)據(jù)庫中的音頻信息遭受到了較為嚴(yán)重的信號處理以后,仍然能夠被識別出來。為了取得強(qiáng)魯棒性的特征,指紋需要具有對聽覺重要內(nèi)容的音頻特征進(jìn)行有效提取的能力。
區(qū)分性:不同歌曲之間的指紋差異較大,但是同一歌曲的不同版本也具有較小的指紋差異,那么音頻指紋技術(shù)就應(yīng)該能夠區(qū)分這些細(xì)小的差別。
可靠性:同一首歌曲的準(zhǔn)確識別是數(shù)字音頻指紋技術(shù)的重要保障,誤檢率越小,歌曲被準(zhǔn)確識別的幾率就會越大。
2.1 音樂識別
音樂識別是數(shù)字音頻技術(shù)最初的應(yīng)用目的,也是目前應(yīng)用最為廣泛的功能之一?,F(xiàn)在已經(jīng)廣泛應(yīng)用到了日常的商業(yè)產(chǎn)品當(dāng)中。如美國與荷蘭共同開發(fā)出了手機(jī)音樂識別軟件。比如說用戶想要知道歌曲的名字和作家信息的時候,就可以用手機(jī)撥打服務(wù)電話,通過手機(jī)傳給服務(wù)器一段音樂片段,隨后服務(wù)器就把相關(guān)信息發(fā)送到用戶的手機(jī)上。此外,西班牙、英國等多個娛樂公司都利用此技術(shù)進(jìn)行此類服務(wù)的提供。我國酷我音樂有限公司也利用此技術(shù)實現(xiàn)了歌曲的查找和匹配功能。
2.2 音頻內(nèi)容控制和跟蹤
一方面實現(xiàn)了發(fā)行端控制功能,歌曲上傳者在數(shù)據(jù)庫中搜索出音樂然后自己決定它的播放權(quán)。另一方面?zhèn)鬏斝诺赖谋O(jiān)控,通過此項功能發(fā)布者見識電視臺是否已經(jīng)支付了報仇,并且可以利用此功能進(jìn)行播放統(tǒng)計,以便進(jìn)行收費標(biāo)準(zhǔn)制定。同時廣告商也要利用此程序監(jiān)視電視臺是否按協(xié)議進(jìn)行播放了。這些需求都要求數(shù)據(jù)庫具有及時更新的功能。
2.3 增值服務(wù)
不同的用戶有著自己的性格特征,他們所要搜索的信息也不盡相同,所以元信息可以按照不同的功能進(jìn)行信息的存儲,利用指紋技術(shù)用戶可以根據(jù)自己的需求方便快捷地查找到自己需要的信息。
總之,隨著信息社會的發(fā)展,人們對網(wǎng)絡(luò)的需求日益增加,數(shù)字音頻指紋技術(shù)有效加強(qiáng)了網(wǎng)絡(luò)中音頻信息的檢索功能,為用戶提供了很大的方便。
[1]張敏,歐陽建權(quán),李澤洲,劉 煒.一種快速的特定音頻指紋提取方法[J].計算機(jī)工程,2010(02).
[2]劉亞多,李偉,李曉強(qiáng),汪竹蓉,馮瑞.壓縮域魯棒音樂指紋算法研究[J].電子學(xué)報,2010(05).
[3]關(guān)耀鏵,申 凌,吳 云,趙 勇.音頻指紋搜索中數(shù)據(jù)預(yù)處理的改進(jìn)算法[J].計算機(jī)工程與應(yīng)用,2010(21).
[4]周亦敏,牟同鑫.采用復(fù)倒譜和子串匹配的音頻指紋算法研究[J].上海理工大學(xué)學(xué)報,2010(03).
TP391.41
A
1004-7344(2016)35-0310-01
2016-11-20