• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于回聲狀態(tài)網(wǎng)絡(luò)的古典音樂分類模型

      2018-09-12 04:33:14徐溶澤
      現(xiàn)代電子技術(shù) 2018年17期
      關(guān)鍵詞:時(shí)間序列古典音樂正確率

      徐溶澤

      摘 要: 針對(duì)當(dāng)前音樂分類方法訓(xùn)練效率低、音樂分類精度差、分類不明確等問題,提出基于回聲狀態(tài)網(wǎng)絡(luò)的古典音樂分類模型。首先對(duì)古典音頻信號(hào)進(jìn)行預(yù)處理,提取古典音樂MFCC特征;然后通過基于回聲狀態(tài)網(wǎng)絡(luò)的古典音樂分類模型,完成古典音樂信號(hào)特征的準(zhǔn)確分類;最后通過計(jì)算三種分類模型,分10次對(duì)古典音樂音頻片段進(jìn)行平均分類測(cè)試。實(shí)驗(yàn)結(jié)果表明,回聲狀態(tài)網(wǎng)絡(luò)模型能夠?qū)崿F(xiàn)古典音樂的準(zhǔn)確分類,具有較高的分類效率和用戶滿意度。

      關(guān)鍵詞: 回聲狀態(tài)網(wǎng)絡(luò); 古典音樂; 特征提取; 分類模型; 時(shí)間序列; 正確率

      中圖分類號(hào): TN912.3?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)17?0076?04

      Abstract: Since the current music classification method has the problems of low training efficiency, poor classification accuracy and unclear classification, a classical music classification model based on echo state network is proposed. The classical audio signal is preprocessed to extract the MFCC features of classical music, and then the classical music classification model based on echo state network is used to classify the classical music signal characteristics accurately. Three kinds of classification models are calculated to perform the average classification test for classical music audio segments in 10 times. The experimental results show that the echo state network model can realize the accurate classification of classical music, and has high classification efficiency and user satisfaction.

      Keywords: echo state network; classical music; feature extraction; classification model; time series; correct rate

      隨著數(shù)字音樂在網(wǎng)絡(luò)中的應(yīng)用價(jià)值逐漸提升,大量的音樂用戶采用計(jì)算機(jī)自主采集感興趣的音樂,提高了工程技術(shù)人員對(duì)音樂信息檢索分析的興趣。以往的音樂分類方法[1]大都采用機(jī)器學(xué)習(xí)方法,需要基于大規(guī)模的高維訓(xùn)練樣本塑造音樂分類模型,導(dǎo)致模型訓(xùn)練效率復(fù)雜度提升,音樂分類精度降低。針對(duì)該問題,提出基于回聲狀態(tài)網(wǎng)絡(luò)的古典音樂分類模型,以提高古典音樂分類準(zhǔn)確度。

      1 回聲狀態(tài)網(wǎng)絡(luò)的古典音樂分類模型

      1.1 古典音樂特征提取

      古典音樂分類模型的基礎(chǔ)工作就是對(duì)古典音樂特征的提取,對(duì)古典音樂特征提取的好壞直接影響古典音樂分類模型的設(shè)計(jì)質(zhì)量。同語(yǔ)音信號(hào)相似,音樂信號(hào)也存在維度高和冗余性高的弊端,若直接將古典音樂音頻信號(hào)進(jìn)行分類,對(duì)古典音樂分類的效果較差。所以本文在對(duì)古典音樂進(jìn)行分類前需要對(duì)原始采集的音頻信號(hào)進(jìn)行預(yù)處理[2],處理內(nèi)容包括音頻信號(hào)的加窗、分幀和靜音判別等。圖1為古典音樂特征提取過程。

      古典音樂信號(hào)包括樂器發(fā)出的聲音信號(hào)和人唱歌的音頻信號(hào)。處理人聲信號(hào)時(shí)需考慮口腔和聲帶激勵(lì)對(duì)功率譜的影響。與人聲信號(hào)相比,高頻的古典音樂信號(hào)所占比例較小,在對(duì)高頻的音樂信號(hào)進(jìn)行特征提取時(shí),需對(duì)其高頻部分進(jìn)行提高以便獲取音頻信號(hào)的頻譜[3]。將濾波器應(yīng)用到高頻的信號(hào)中可使對(duì)古典音樂的高頻頻譜的獲取過程變得簡(jiǎn)單。濾波器的使用就是音樂信號(hào)的預(yù)加重過程,古典音樂信號(hào)方程為:

      由式(3)可以得出:對(duì)于音樂頻率在1 000 Hz以下的古典音樂信號(hào),其與梅爾倒譜系數(shù)呈線性相關(guān);頻率在1 000 Hz以上時(shí)二者為對(duì)數(shù)關(guān)系。下面為基于梅爾倒譜系數(shù)的MFCC古典音樂特征提取過程:

      1) 對(duì)古典音樂信號(hào)的預(yù)處理包括上文提到的預(yù)加重和分幀等過程;

      2) 對(duì)分幀后的音樂信號(hào)進(jìn)行FFT轉(zhuǎn)換得到每一幀音樂信號(hào)的頻譜,再進(jìn)行平方操作得到功率譜,假設(shè)古典音樂信號(hào)的DFT為:

      上述過程中得到古典音樂特征提取方程MFCC,提取的音樂特征MFCC屬于一種線性的時(shí)間序列,為下文古典音樂的分類做基礎(chǔ)。

      1.2 小波回聲狀態(tài)網(wǎng)絡(luò)

      回聲狀態(tài)網(wǎng)絡(luò)中輸入和輸出變量的選擇在古典音樂時(shí)間序列的預(yù)測(cè)中十分重要,選擇合適的變量在提高古典音樂時(shí)間序列預(yù)測(cè)速率的同時(shí)還能提高音樂分類模型的訓(xùn)練速度[4]。當(dāng)前對(duì)古典音樂信號(hào)的研究手段是將輸入信號(hào)導(dǎo)入存儲(chǔ)池中,將其分解成有規(guī)律的子信號(hào),利用回聲網(wǎng)絡(luò)對(duì)子信號(hào)進(jìn)行預(yù)測(cè),再將所有子信號(hào)的預(yù)測(cè)結(jié)果進(jìn)行聚合。利用回聲狀態(tài)網(wǎng)絡(luò)對(duì)古典音樂信號(hào)進(jìn)行預(yù)測(cè),提高對(duì)古典音樂時(shí)間序列的預(yù)測(cè)精度。

      基于回聲狀態(tài)網(wǎng)絡(luò)的基本原理[5],本文提出基于小波回聲的狀態(tài)網(wǎng)絡(luò),其基本結(jié)構(gòu)如圖2所示,采用小波分解將輸入的古典音樂信號(hào)分割成頻率不同的子信號(hào),再將其導(dǎo)入小波回聲狀態(tài)網(wǎng)絡(luò)中。

      本文提出基于小波回聲狀態(tài)網(wǎng)絡(luò),對(duì)過去回聲狀態(tài)網(wǎng)絡(luò)的原始古典音樂時(shí)間序列進(jìn)行改進(jìn)[6],將不規(guī)則的古典音樂時(shí)間序列轉(zhuǎn)化成規(guī)則的古典音樂時(shí)間序列,提高了古典音樂信號(hào)的預(yù)測(cè)精度,克服了小波回聲網(wǎng)絡(luò)學(xué)習(xí)不適應(yīng)的問題。

      1.3 基于回聲狀態(tài)網(wǎng)絡(luò)的古典音樂分類模型

      古典音樂信號(hào)屬于維度高的復(fù)雜信號(hào),過去人們采用的音樂信息的檢索方式已經(jīng)不適用于現(xiàn)在的音樂形式,人們追求古典音樂分類的個(gè)性化和準(zhǔn)確性,而音樂特征的提取為音樂分類的關(guān)鍵步驟[7]。在古典音樂的分類領(lǐng)域中數(shù)據(jù)庫(kù)樣本較少,大量的音樂資源未被利用,采用回聲狀態(tài)對(duì)古典音樂資源進(jìn)行訓(xùn)練,能夠加強(qiáng)古典音樂分類的效果。

      1.3.1 塑造古典音樂分類模型結(jié)構(gòu)

      采用每幀的短時(shí)能量作為輸入特征。原始的古典音樂信號(hào)特征維度較高,噪音和冗雜度較高,本文先將原始的古典音樂特征輸入到深度神經(jīng)網(wǎng)絡(luò),再對(duì)原始古典音樂信號(hào)進(jìn)行主成分分析(Principal Component Analysis,PCA)。PCA分析法是多變量相關(guān)性的多元統(tǒng)計(jì)方法,通過幾個(gè)主成分來揭示多變量的結(jié)構(gòu),盡可能保留其原始的特征信息。數(shù)學(xué)處理過程是將原始的[p]個(gè)指標(biāo)作為線性組合,構(gòu)成新的綜合指標(biāo)。將原始特征矩陣導(dǎo)入到PCA模塊中,將得到降低維度后的特征導(dǎo)入到回聲狀態(tài)網(wǎng)絡(luò)中,再對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練得到古典音樂分類模型。

      圖3中的分類模型訓(xùn)練過程:

      1) 采用wake?sleep算法,對(duì)回聲狀態(tài)網(wǎng)絡(luò)中的每一層的RBM網(wǎng)絡(luò)進(jìn)行單獨(dú)的訓(xùn)練,這種方式可以保證特征向量在映射到不同特征空間時(shí)能留存較多的特征信息。

      2) 構(gòu)建BP網(wǎng)絡(luò)于回聲狀態(tài)網(wǎng)絡(luò)的最后一層中,將RBM網(wǎng)絡(luò)的輸出特征向量視為BP網(wǎng)絡(luò)的輸出向量,采用這種做法可以有效地監(jiān)督和訓(xùn)練實(shí)體關(guān)系分析器。設(shè)置的BP網(wǎng)絡(luò)只能保證該層次中權(quán)值對(duì)特征向量的映射達(dá)到最優(yōu),無(wú)法確保整個(gè)DBN中特征向量的映射達(dá)到最優(yōu)。因此反向傳播網(wǎng)絡(luò)可能將有問題的信息傳播到每一層的RBM,對(duì)整個(gè)DBN起到小幅度調(diào)整的作用[9]。RBM網(wǎng)絡(luò)訓(xùn)練模型即為對(duì)一個(gè)深層的BP網(wǎng)絡(luò)進(jìn)行權(quán)值的初始化過程。該過程使DBN克服了由于BP網(wǎng)絡(luò)權(quán)值初始化的隨機(jī)變化帶來的訓(xùn)練時(shí)間增加和易出現(xiàn)局部最優(yōu)的問題。

      1.3.2 激活函數(shù)的選擇

      在本文回聲狀態(tài)網(wǎng)絡(luò)中,激活函數(shù)是非線性結(jié)構(gòu)。本文采用非線性的激活函數(shù)ReLU,能夠使古典音樂輸出的時(shí)間序列不是單純線性組合,而是可以與多種函數(shù)進(jìn)行組合的復(fù)雜函數(shù)。激活函數(shù)的種類有Sigmoid函數(shù)和Softplus函數(shù)等。圖4是幾種不同的激活函數(shù)對(duì)古典音樂信號(hào)的激活程度結(jié)果。

      從圖4中可以得出,本文古典音樂分類模型采用ReLU激活函數(shù)對(duì)古典音樂信號(hào)進(jìn)行激活的優(yōu)勢(shì)包括:

      1) 與Sigmoid激活函數(shù)相比,本文采用的ReLU函數(shù)在進(jìn)行反向的誤差梯度求值時(shí),求導(dǎo)數(shù)過程較簡(jiǎn)單;

      2) 處于小波回聲狀態(tài)網(wǎng)絡(luò)時(shí)ReLU函數(shù)在激活過程中不會(huì)出現(xiàn)梯度消失的情況;

      3) 采用ReLU函數(shù)得出輸出結(jié)果會(huì)出現(xiàn)部分為空值的現(xiàn)象,這種情況會(huì)使小波狀態(tài)網(wǎng)絡(luò)具有分散性,可緩解分類模型長(zhǎng)時(shí)間運(yùn)行導(dǎo)致的負(fù)荷過高的問題。

      2 實(shí)驗(yàn)結(jié)果與分析

      實(shí)驗(yàn)將采集到預(yù)處理后的古典音樂的音頻片段分別分為長(zhǎng)度相同的3段、6段、8段和10段的古典音頻片段,并對(duì)此進(jìn)行標(biāo)記。采用本文模型對(duì)古典音樂分類模型實(shí)施訓(xùn)練,共分為4個(gè)模型,每個(gè)音樂分類模型分別包含3段、6段、8段和10段音頻片段。實(shí)驗(yàn)采用的音頻片段包括10種不同的古典音樂,每種古典音樂的單詞上限為1 100。表1為采用本文模型對(duì)包含不同音樂片段的10類古典音樂分類正確率的計(jì)算結(jié)果。由表1結(jié)果可以看出,本文古典音樂分類模型包含6段音頻片段時(shí)的分類正確率最高,隨著音樂片段的增加模型對(duì)古典音樂分類的正確率逐漸下降,說明音樂片段的多少影響本文模型進(jìn)行古典音樂分類的正確率,進(jìn)而影響聽眾對(duì)古典音樂的選擇。

      表2是在取不同數(shù)量的音樂片段時(shí),本文古典音樂分類模型對(duì)應(yīng)的訓(xùn)練時(shí)間和測(cè)試時(shí)間。

      分析表2能夠看出,隨著本文古典音樂分類模型包含音樂片段的增加,本文模型對(duì)分類模型訓(xùn)練和測(cè)試的時(shí)間也有所增加,實(shí)驗(yàn)對(duì)本文模型的分類時(shí)間進(jìn)行測(cè)試,模型在訓(xùn)練期間的用時(shí)遠(yuǎn)遠(yuǎn)高于實(shí)驗(yàn)測(cè)試的實(shí)際值,說明本文模型對(duì)古典音樂分類的效率較高。

      為了驗(yàn)證本文模型在古典音樂分類中的分類效果,實(shí)驗(yàn)選取基于數(shù)據(jù)挖掘和基于神經(jīng)網(wǎng)絡(luò)的兩種音樂分類模型作為實(shí)驗(yàn)對(duì)照,選取包含6段古典音樂音頻片段,計(jì)算三種分類模型10次對(duì)該音樂片段的平均分類結(jié)果,表3為不同模型下人們對(duì)古典音樂分類的滿意率。由表3三種模型對(duì)音樂分類結(jié)果可以看出,本文模型采用回聲狀態(tài)網(wǎng)絡(luò)相比另外兩種分類模型,分類結(jié)果的滿意率較高,本文模型比基于數(shù)據(jù)挖掘的音樂分類模型高9個(gè)百分點(diǎn)左右,比基于神經(jīng)網(wǎng)絡(luò)的音樂分類模型高8.5個(gè)百分點(diǎn)左右,說明本文模型對(duì)古典音樂的分類效果更能令人滿意。

      表4表示在取相同數(shù)量的音樂片段時(shí),三種模型對(duì)古典音樂分類過程中的訓(xùn)練時(shí)間和測(cè)試時(shí)間。從表4可以看出,本文模型無(wú)論在模型訓(xùn)練和模型測(cè)試的時(shí)間都短于另外兩種模型,說明本文分類模型優(yōu)于另外兩種模型,證明本文模型對(duì)古典音樂能夠?qū)崿F(xiàn)高精度的分類,用戶滿意度高。

      3 結(jié) 論

      為了改善古典音樂的分類效果,提出基于回聲狀態(tài)網(wǎng)絡(luò)的古典音樂分類模型,采用具體古典音樂數(shù)據(jù)進(jìn)行古典音樂的分類測(cè)試。結(jié)果表明,本文模型獲得了理想的古典音樂分類結(jié)果,而且性能要優(yōu)于其他模型。

      參考文獻(xiàn)

      [1] 邵曦,姚磊.基于SVM主動(dòng)學(xué)習(xí)的音樂分類[J].計(jì)算機(jī)工程與應(yīng)用,2016,52(6):127?133.

      SHAO Xi, YAO Lei. Music classification based on SVM active learning [J]. Computer engineering and applications, 2016, 52(6): 127?133.

      [2] 韓敏,許美玲,王新迎.多元時(shí)間序列的子空間回聲狀態(tài)網(wǎng)絡(luò)預(yù)測(cè)模型[J].計(jì)算機(jī)學(xué)報(bào),2014,37(11):2268?2275.

      HAN Min, XU Meiling,WANG Xinying. A multivariate time series prediction model based on subspace echo state network [J]. Chinese journal of computers, 2014, 37(11): 2268?2275.

      [3] 王怡鷗,丁剛毅,蒙軍,等.基于三元回聲狀態(tài)網(wǎng)絡(luò)的二氧化碳濃度預(yù)測(cè)[J].計(jì)算機(jī)仿真,2016,33(2):475?479.

      WANG Yiou, DING Gangyi, MENG Jun, et al. The forecas?ting of carbon dioxide concentrations based on triplet echo state networks [J]. Computer simulation, 2016, 33(2): 475?479.

      [4] 吳淦洲.基于特征提取與神經(jīng)網(wǎng)絡(luò)的音樂分類方法[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2014,44(5):94?100.

      WU Ganzhou. Music category based on feature extraction and neural network [J]. Mathematics in practice and theory, 2014, 44(5): 94?100.

      [5] 郭偉,于鳳芹.基于負(fù)熵最大化改進(jìn)的語(yǔ)音音樂信號(hào)分離[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(4):209?212.

      GUO Wei, YU Fengqin. Speech?music separation based on improved algorithm of negentropy maximization [J]. Computer engineering and applications, 2015, 51(4): 209?212.

      [6] 劉鑫,鮑長(zhǎng)春.基于回聲狀態(tài)網(wǎng)絡(luò)的音頻頻帶擴(kuò)展方法[J].電子學(xué)報(bào),2016,44(11):2758?2766.

      LIU Xin, BAO Changchun. Audio bandwidth extension method based on echo state network [J]. Acta electronica Sinica, 2016, 44(11): 2758?2766.

      [7] 張鍵鋒,王勁.基于文本挖掘與神經(jīng)網(wǎng)絡(luò)的音樂風(fēng)格分類建模方法[J].電信科學(xué),2015,31(7):86?91.

      ZHANG Jianfeng, WANG Jin. A classification method of music style based on text mining and neural network [J]. Telecommunications science, 2015, 31(7): 86?91.

      [8] 黃文華.改進(jìn)回聲狀態(tài)網(wǎng)絡(luò)的熱點(diǎn)話題預(yù)測(cè)模型[J].計(jì)算機(jī)工程與應(yīng)用,2014,50(14):26?30.

      HUANG Wenhua. Hot topic prediction model based on improved echo state network [J]. Computer engineering and applications, 2014, 50(14): 26?30.

      [9] 李博,陳志剛,黃瑞,等.基于LDA模型的音樂推薦算法[J].計(jì)算機(jī)工程,2016,42(6):175?179.

      LI Bo, CHEN Zhigang, HUANG Rui, et al. Music recommendation algorithm based on LDA model [J]. Computer enginee?ring, 2016, 42(6): 175?179.

      [10] ALOMAR M L, CANALS V, PEREZ?MORA N, et al. FPGA?based stochastic echo state networks for time?series forecasting [J]. Computational intelligence & neuroscience, 2016(2): 391?397.

      猜你喜歡
      時(shí)間序列古典音樂正確率
      影視中的古典音樂
      門診分診服務(wù)態(tài)度與正確率對(duì)護(hù)患關(guān)系的影響
      古典音樂廣播節(jié)目的通俗化表達(dá)探析
      新聞傳播(2018年5期)2018-05-30 07:02:51
      集大成的交響樂《英雄》:兼談怎樣聽古典音樂
      歌劇(2017年7期)2017-09-08 13:09:37
      生意
      品管圈活動(dòng)在提高介入手術(shù)安全核查正確率中的應(yīng)用
      基于時(shí)間序列的我國(guó)人均GDP分析與預(yù)測(cè)
      商(2016年32期)2016-11-24 16:20:57
      基于線性散列索引的時(shí)間序列查詢方法研究
      軟件工程(2016年8期)2016-10-25 15:43:57
      生意
      基于組合模型的能源需求預(yù)測(cè)
      聊城市| 大关县| 天长市| 盐城市| 山阳县| 郑州市| 神木县| 大田县| 庄浪县| 嵩明县| 科技| 团风县| 墨竹工卡县| 休宁县| 于田县| 桐城市| 汝城县| 达孜县| 海林市| 郎溪县| 新邵县| 南川市| 岐山县| 安西县| 陕西省| 海安县| 土默特右旗| 栖霞市| 丽水市| 崇礼县| 西藏| 温泉县| 普兰县| 绵竹市| 汶上县| 淳安县| 舟山市| 襄垣县| 措勤县| 石柱| 巴东县|