張曉娜 趙晶晶
摘? 要: 針對基于神經(jīng)網(wǎng)絡(luò)算法構(gòu)建的電子音樂分類模型容易陷入局部最小值問題,分類精準(zhǔn)度低,提出基于粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的電子音樂分類模型。構(gòu)建模型時需先收集多種類型原生態(tài)電子音樂數(shù)據(jù),去噪處理收集到的電子音樂數(shù)據(jù),分幀和端點檢測去噪后的電子音樂,從檢測到的有效電子音樂信號中提取電子音樂的時域、頻域方差特征和短時能量特征,采用灰色關(guān)聯(lián)分析方法確定三種特征對電子音樂分類的貢獻(xiàn),加權(quán)操作上述特征,將加權(quán)后的三種特征作為粒子群算法優(yōu)化的神經(jīng)網(wǎng)絡(luò)輸入部分,通過優(yōu)化后的神經(jīng)網(wǎng)絡(luò)輸出電子音樂分類結(jié)果。經(jīng)過實驗分析發(fā)現(xiàn),該電子音樂分類模型對10種電子音樂類型的分類結(jié)果與實際電子音樂所屬類別相同,分類精準(zhǔn)度較高。
關(guān)鍵詞: 電子音樂分類模型; 神經(jīng)網(wǎng)絡(luò)優(yōu)化; 數(shù)據(jù)收集; 特征提取; 多特征融合; 分類結(jié)果輸出
中圖分類號: TN711?34? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼: A? ? ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)09?0101?04
An electronic music classification model based on neural network
optimized by particle swarm optimization
ZHANG Xiaona, ZHAO Jingjing
(Shijiazhuang University, Shijiazhuang 050035, China)
Abstract: As the electronic music classification model based on neural network algorithm is prone to occurring of local minimum value and its classification precision is low, the electronic music classification model based on neural network optimized by particle swarm optimization is proposed. For the construction of the model, a variety of types of original electronic music data should be collected firstly, and then, the collected electronic music data are subjected to the denoising processing. After that, the denoised electronic music is subjected to the framing and endpoint detection. The time domain variance feature, frequency domain variance feature and short?time energy feature are extracted from the detected valid electronic music signal. The grey relational analysis (GRA) is used to confirm the contribution of the three features to the electronic music classification. Then the above three features are weighted. The weighted features are taken as the neural network input part optimized by particle swarm optimization, and the classification results of the electronic music are output by the optimized neural network. It is found in experimental analysis that, as for the ten types of electronic music, the electronic music classification result got by the proposed model is corresponding to the actual category of the electronic music. Therefore, the proposed model is of high classification precision.
Keywords: electronic music classification model; neural network optimization; data collection; feature extraction; multi?feature fusion; classification result output
0? 引? 言
隨著經(jīng)濟(jì)技術(shù)和科技的不斷發(fā)展,人們和音樂之間的聯(lián)系越來越緊密,音樂市場中出現(xiàn)多種電子音樂[1]。電子音樂可以降低人們生活和工作上的壓力,由于不同用戶對電子音樂的類型偏好不同,如何從大量電子音樂庫中快速精準(zhǔn)地找到用戶所需電子音樂較為重要[2]。提高電子音樂查詢效率的關(guān)鍵技術(shù)是電子音樂分類,因此,應(yīng)重點研究如何建立一種分類性能較好的電子音樂分類模型[3]。
為建立分類性能較好的電子音樂分類模型,需分析當(dāng)下電子音樂分類模型存在的缺陷,經(jīng)過調(diào)查分析發(fā)現(xiàn),當(dāng)下最優(yōu)電子音樂分類模型是基于神經(jīng)網(wǎng)絡(luò)的電子音樂分類模型。但是隨著電子音樂數(shù)據(jù)的不斷增加,基于神經(jīng)網(wǎng)絡(luò)構(gòu)建的電子音樂分類模型出現(xiàn)分類效率低下、誤分率較高以及容易陷入局部最小值的問題[4],因此,應(yīng)優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),建立一種基于粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的電子音樂分類模型,加快神經(jīng)網(wǎng)絡(luò)尋優(yōu)能力[5],提升電子音樂分類效果和分類精度。基于粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的電子音樂分類模型需提取電子音樂特征,通過提取的電子音樂特征描述電子音樂信息[6],有效辨識電子音樂類型。
單一電子音樂特征能提供的電子音樂信息較少,無法精準(zhǔn)描述電子音樂具體內(nèi)容,不能實現(xiàn)電子音樂的正確分類[7]。電子音樂特征具有短時能量特征、時域特征和頻域特征等較多特征,通過電子音樂特征可描述電子音樂詳細(xì)的內(nèi)容,因此,本文構(gòu)建的基于粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的電子音樂分類模型中融合了多種電子音樂特征,實現(xiàn)了電子音樂的精準(zhǔn)分類。
1? 構(gòu)建電子音樂分類模型
1.1? 基本框架
基于粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的電子音樂分類步驟為:
1) 從電子音樂中提取不同類型的音樂特征;
2) 處理提取后的多個音樂特征,處理過程中采用灰色關(guān)聯(lián)分析方法運算每個電子音樂特征的貢獻(xiàn)率,用貢獻(xiàn)率表示電子音樂特征對電子音樂分類的重要程度[8];
3) 通過粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò),獲取最佳神經(jīng)網(wǎng)絡(luò)。通過該網(wǎng)絡(luò)獲取電子音樂分類結(jié)果。
電子音樂分類模型的基本框架如圖1所示。
從圖1中可以看出,構(gòu)建電子音樂分類模型時,應(yīng)先收集多種類型的原生態(tài)電子音樂數(shù)據(jù),去噪處理收集到的電子音樂數(shù)據(jù)。分幀和端點檢測去噪后的電子音樂,獲取有效的電子音樂信號[9]。從有效的電子音樂信號中提取電子音樂的時域、頻域方差特征和能量特征,組合提取特征形成特征向量。采用灰色關(guān)聯(lián)分析方法確定三種特征對電子音樂分類的貢獻(xiàn),加權(quán)操作上述特征,融合多種特征[10]。將加權(quán)后的三種特征作為基于粒子群算法優(yōu)化后的神經(jīng)網(wǎng)絡(luò)輸入部分,通過基于粒子群算法優(yōu)化后的神經(jīng)網(wǎng)絡(luò)輸出電子音樂分類結(jié)果。
1.2? 音樂的多特征融合
1.2.1? 提取音樂特征
針對電子音樂特征的多樣性,構(gòu)建電子音樂分類模型時需提取短時能量特征、時域方差特征等多種電子音樂特征,具體提取過程如下:
1) 電子音樂短時能量特征。普通聲音能量和電子音樂能量之間具有較大區(qū)別,與普通聲音相比,電子音樂具有更高的能量值[11],由此,可提取每一幀電子音樂短時能量特征。假設(shè)[Em]表示電子音樂信號[y(m)]的能量,則電子音樂信號[y(m)]的短時能量計算公式如下:
[Em=-∞+∞y(n)?c(n-m)2] (1)
式中[c(m)]表示窗函數(shù)。如果電子音樂信號幀的長度是[N],那么此時[Em]的計算公式為:
[Em=n=0N-1y(n)?c(n-m)2] (2)
2) 電子音樂時域方差特征??赏ㄟ^式(3)描述電子音樂的某幀:
[Yt(n)=yt(n,1),yt(n,2),…,yt(n,N)] (3)
式中[Yt(n)]表示電子音樂的某幀,采用小波變換平滑操作[Yt(n)]后,獲取處理后的電子音樂某幀為[Yt(n)],此時,可通過式(4)描述處理后電子音樂的某幀,具體描述如下:
[Yt(n)=yt(n,1),yt(n,2),…,yt(n,N)] (4)
結(jié)合式(4),計算電子音樂時域的均值[Et(n)]和方差[Dt(n)],均值和方差的計算公式如下:
[Et(n)=1Ni=1Nyt(n,i)] (5)
[Dt(n)=1Ni=1Nyt(n,i)-Et(n)2] (6)
3) 電子音樂的頻域方差特征。通過傅里葉變換電子音樂的某幀[Yi(n)],變換后得到[Yf(n)],變換后電子音樂的某幀描述過程如下:
[Yf(n)=yf(n,1),yf(n,2),…,yf(n,N)] (7)
采用小波變換平滑操作[Yf(n)=1Ni=1n(yf(n,i)-Ef(n))2],得到[Yf(n)],[Yf(n)]的表達(dá)式如下:
[Yf(n)=yf(n,1),yf(n,2),…,yf(n,N)] (8)
結(jié)合式(8)計算得到電子音樂的頻域均值[Ef(n)]和頻域方差[Df(n)],具體計算公式如下:
[Ef(n)=1Ni=1Nyf(n,i)] (9)
[Df(n)=1Ni=1Nyf(n,i)-Ef(n)2] (10)
1.2.2? 電子音樂特征具體融合
1) 假設(shè)[Yi=(yi(1),yi(2),…,yi(m))]表示電子音樂短時能量特征、時域方差特征和頻域方差特征構(gòu)成的特征向量,表達(dá)式中[i=1,2,…,m]。
2) 預(yù)處理[Yi=(yi(1),yi(2),…,yi(m))],將參考對象設(shè)置為隨機(jī)選擇的一組特征向量,選取的特征向量為[Y′0=(y′0(1),y′0(2),…,y′0(m))],選取的特征向量和其他組特征向量能構(gòu)成特征向量對。
3) 采用[Δi(k)=y′0(k)-y′i(k)]計算特征向量組最大偏差和最小偏差,最大偏差和最小偏差詳細(xì)計算過程如下:
[P1=maximaxkΔi(k)P2=miniminkΔi(k)] (11)
4) 計算電子音樂特征灰色關(guān)聯(lián)系數(shù),計算公式為:
[gi(k)=n+αMΔi(k)+αM] (12)
式中[α]表示分辨系數(shù)。
計算電子音樂特征的灰色關(guān)聯(lián)度:
[gi=k=1nwigi(k)] (13)
式中[wi]表示權(quán)重。根據(jù)式(13)可獲取電子音樂特征的貢獻(xiàn)值,通過貢獻(xiàn)值描述電子音樂中每種特征對電子音樂的影響程度[12]。
1.3? 基于粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)
采用粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò),獲取最優(yōu)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過最優(yōu)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)得到分類結(jié)果。采用粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)時,應(yīng)先分析粒子群算法原理,依照粒子群算法原理優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),下面詳細(xì)描述粒子群算法原理和粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的過程。
1.3.1? 粒子群優(yōu)化算法原理
標(biāo)準(zhǔn)粒子群算法的數(shù)學(xué)描述過程如下:假設(shè)搜索空間是[L]維空間,群體中總共含有[K]個粒子,第[j]個粒子的位置表示為[Xj=(xj1,xj2,…,xjl)],第[j]個粒子的位置對應(yīng)的最優(yōu)解是[Pj=(pj1,pj2,…,pjl)],[py]表示全局最優(yōu)個體,第[j]個粒子的位置速度表示為向量[Vj=(vj1,vj2,…,vjl)],根據(jù)下述公式迭代變化每個粒子的位置和速度:
[vjl(t+1)=g?vjl(t)+z1?rd()?(pjl(t)-xjl(t))+z2?rd()?(py(t)-xjl(t))] (14)
[xjl(t+1)=xjl(t)+vjl(t+1)] (15)
式中:[g]表示慣性因子;[z1]和[z2]表示加速因子,且加速因子為正常數(shù);[rd()]表示[0,1]之間的隨機(jī)數(shù)值;[t]表示當(dāng)前迭代代數(shù)。由于粒子群的速度和初始位置隨機(jī)產(chǎn)生,可通過式(14)和式(15)迭代粒子位置和速度,直到滿足終止條件時停止迭代。式(14)中慣性權(quán)重計算公式如下:
[g=gmax-(gmax-gmin)(s-save)smax-save,? ? ?s≥savegmax,? ? ?s 式中:[s]表示粒子適配值;[save]和[smax]分別表示每代粒子平均適配值和粒子群中最大適配值。 1.3.2? 粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的步驟 依照上述分析的粒子群算法原理優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過粒子群算法訓(xùn)練神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值,得到最優(yōu)的權(quán)值和閾值[13]。根據(jù)最優(yōu)權(quán)值和閾值構(gòu)建最優(yōu)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),優(yōu)化過程如下: 1) 先歸一化處理訓(xùn)練樣本和測試樣本,建立三層神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),將1.2節(jié)獲取的加權(quán)后三種特征向量對的維數(shù)[M]作為神經(jīng)網(wǎng)絡(luò)輸入層節(jié)點數(shù)[SI],電子音樂類別數(shù)[LB]作為神經(jīng)網(wǎng)絡(luò)輸出層節(jié)點數(shù)[CD],輸入層節(jié)點數(shù)和輸出層節(jié)點數(shù)的幾何均值為隱含節(jié)點數(shù)[YH],種群中個體粒子表示為實數(shù)向量,實數(shù)向量是通過編碼神經(jīng)元之間所有閾值和連接權(quán)值獲取的。此時,粒子群中每個粒子的維度[L]可表示為: [L=(SI?YH)+(YH?CD)+YH+CD] (17) 2) 設(shè)計適應(yīng)度函數(shù)。評價神經(jīng)網(wǎng)絡(luò)解決問題能力的指標(biāo)是適應(yīng)度函數(shù),采用神經(jīng)網(wǎng)絡(luò)輸出值均方差獲取目標(biāo)函數(shù),將目標(biāo)函數(shù)的倒數(shù)作為適應(yīng)度函數(shù)[14],神經(jīng)網(wǎng)絡(luò)輸出值均方差越小,說明對應(yīng)粒子自身性能越好。目標(biāo)函數(shù)計算公式為: [MB=1upi=1uj=1p(bij-rij)] (18) 式中:[u]表示輸出節(jié)點個數(shù);[p]表示訓(xùn)練樣本數(shù);[bij]表示網(wǎng)絡(luò)期望輸出值;[rij]表示網(wǎng)絡(luò)實際輸出值。 3) 初始化和設(shè)置參數(shù)。設(shè)置參數(shù)包括粒子個數(shù)、初始位置和速度,將初始位置和速度控制在[0,1]之間,同時設(shè)置加速因子、最大迭代次數(shù)等。 4) 通過輸入和輸出的樣本,依照式(18)計算種群中每個個體粒子適應(yīng)度函數(shù)值,將歷史最佳位置當(dāng)成每個粒子的最好位置,開始迭代粒子。 5) 采用粒子群算法中的式(14)~式(16)更新粒子的速度和位置。 6) 檢測粒子位置和速度是否在界限以內(nèi),如果粒子出現(xiàn)越界的狀況,需排除越界粒子,重新更新粒子的速度和位置。 7) 計算更新后粒子的適應(yīng)度值,依照適應(yīng)度值改變慣性權(quán)重,搜索粒子最佳位置。 8) 檢驗是否符合結(jié)束標(biāo)準(zhǔn)。假設(shè)粒子當(dāng)前位置與預(yù)定用的誤差要求相符合時,停止迭代粒子,將神經(jīng)網(wǎng)絡(luò)的最終權(quán)值和和閾值輸出[15]。假設(shè)粒子當(dāng)前位置與預(yù)定用的誤差要求相差較大時,需重新執(zhí)行步驟4),直到滿足條件為止。通過獲取的權(quán)值和閾值構(gòu)建最優(yōu)神經(jīng)網(wǎng)絡(luò),通過該網(wǎng)絡(luò)輸出電子音樂分類結(jié)果。 2? 仿真實驗 采用某電子音樂平臺作為實驗平臺,實驗中包含合奏樂、管弦樂、絲竹樂等10種電子音樂類型,實驗結(jié)果如下所示。 2.1? 分類結(jié)果 為驗證本文模型的分類結(jié)果,選取我國聯(lián)合電子音樂平臺中的10種電子音樂作為訓(xùn)練樣本,輸入所選電子音樂特征,其中,用電子音樂音高、音長表示電子音樂頻域特征,用混響時間和音調(diào)表示電子音樂時域特征,電子音樂短時能量均方根表示電子音樂能量特征,采用本文電子音樂分類模型分別輸出10種電子音樂所屬的電子音樂類型,實驗結(jié)果如表1所示。從表1中可以看出,采用本文電子音樂分類模型能夠有效分類10種電子音樂的類型,對比分類結(jié)果與電子音樂實際所屬類別發(fā)現(xiàn),本文電子音樂分類模型分類效果與實際電子音樂所屬類別相同,說明本文電子音樂分類模型分類精準(zhǔn)度較高。 2.2? 分類效果 為驗證本文電子音樂分類效果,實驗從聯(lián)合電子音樂平臺用戶中隨機(jī)選取100名用戶,讓用戶從10種電子音樂中選擇自身感興趣音樂。經(jīng)過調(diào)查統(tǒng)計發(fā)現(xiàn)喜歡合奏樂的人較多,其次是絲竹樂和琴樂,其他音樂類型人數(shù)相對較少,對比本文分類效果和神經(jīng)網(wǎng)絡(luò)分類效果,對比結(jié)果如圖2所示。從圖2中可以看出,采用本文電子音樂分類模型分類電子音樂后,合奏樂占總電子音樂的21%,絲竹樂和琴樂分別占總電子音樂的18%和13%,與選取100名用戶興趣愛好相同,而傳統(tǒng)神經(jīng)網(wǎng)絡(luò)分類模型分類后合奏樂占總電子音樂的5%,絲竹樂和琴樂分別占總電子音樂的5%和6%,與選取100名用戶的興趣愛好間存在一定偏差。綜上所述,本文電子音樂分類模型分類效果較好。 3? 結(jié)? 語 為提升電子音樂的分類精準(zhǔn)率,本文提出基于粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的電子音樂分類模型。采用粒子群優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),依照粒子群訓(xùn)練神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值構(gòu)建優(yōu)化后的神經(jīng)網(wǎng)絡(luò),將加權(quán)后的三種特征作為優(yōu)化神經(jīng)網(wǎng)絡(luò)的輸入,網(wǎng)絡(luò)輸出結(jié)果則為電子音樂分類結(jié)果。經(jīng)過實驗分析發(fā)現(xiàn),本文電子音樂分類模型在采用粒子群優(yōu)化神經(jīng)網(wǎng)絡(luò)實現(xiàn)分類的過程中,充分考慮了電子音樂的時域、頻域方差特征和短時能量特征,對繡球、炎黃風(fēng)情等10種電子音樂的分類精準(zhǔn)度較高。 參考文獻(xiàn) [1] 趙宏偉,李圣普.基于粒子群算法和RBF神經(jīng)網(wǎng)絡(luò)的云計算資源調(diào)度方法研究[J].計算機(jī)科學(xué),2016,43(3):113?117. [2] 王宗杰,邢明峰,王洪泊.基于粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的醫(yī)患關(guān)系風(fēng)險預(yù)警模型[J].北京工業(yè)大學(xué)學(xué)報,2017,43(1):8?12. [3] 徐大明,周超,孫傳恒,等.基于粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的水產(chǎn)養(yǎng)殖水溫及pH預(yù)測模型[J].漁業(yè)現(xiàn)代化,2016,43(1):24?29. [4] 閆濱,王闖.基于粒子群優(yōu)化算法的RBF神經(jīng)網(wǎng)絡(luò)在閘墩裂縫寬度預(yù)測中的應(yīng)用[J].水力發(fā)電,2018,44(3):33?36. [5] 程軍,李榮鈞.基于粒子群優(yōu)化的神經(jīng)網(wǎng)絡(luò)預(yù)測模型[J].數(shù)學(xué)的實踐與認(rèn)識,2015,45(3):176?180. [6] 張鍵鋒,王勁.基于文本挖掘與神經(jīng)網(wǎng)絡(luò)的音樂風(fēng)格分類建模方法[J].電信科學(xué),2015,31(7):80?85. [7] 肖曉紅,張懿,劉冬生,等.基于隱馬爾可夫模型的音樂分類[J].計算機(jī)工程與應(yīng)用,2017,53(16):138?143. [8] 杜威,林滸,孫建偉,等.一種基于分層結(jié)構(gòu)的音樂自動分類方法[J].小型微型計算機(jī)系統(tǒng),2018,39(5):888?892. [9] 邵曦,姚磊.基于SVM主動學(xué)習(xí)的音樂分類[J].計算機(jī)工程與應(yīng)用,2016,52(6):127?133. [10] 金梅,張偉亞,張淑清,等.基于改進(jìn)PSO和DE優(yōu)化神經(jīng)網(wǎng)絡(luò)的電能質(zhì)量擾動分類[J].高技術(shù)通訊,2018,28(4):291?298. [11] 楊曉宇,黃浩,王浩華.基于改進(jìn)的T型關(guān)聯(lián)度在音樂分類中的應(yīng)用[J].數(shù)學(xué)的實踐與認(rèn)識,2017,47(20):157?165. [12] 琚春華,汪澍.一種融入用戶情緒因素的綜合音樂推薦方法[J].情報學(xué)報,2017,36(6):578?589. [13] 李強(qiáng),劉曉峰.基于PNN的音樂情感分類[J].計算機(jī)工程與設(shè)計,2019,40(2):235?239. [14] 王珉,王永濱.網(wǎng)絡(luò)音樂標(biāo)簽效用度和穩(wěn)定性研究[J].計算機(jī)科學(xué)與探索,2015,9(5):535?545. [15] 孫輝,許潔萍,劉彬彬.基于多核學(xué)習(xí)支持向量機(jī)的音樂流派分類[J].計算機(jī)應(yīng)用,2015,35(6):1753?1756.