趙志成, 方力先
(杭州電子科技大學(xué),杭州 310018)
音樂是反映人類現(xiàn)實生活情感的一門藝術(shù),能夠喚起情感上的共鳴。當(dāng)聽覺系統(tǒng)接受音樂刺激時,都會短時提高一部分特定神經(jīng)細(xì)胞的興奮性,影響到情緒表達(dá)[1]。這個過程必然會影響人體內(nèi)分泌,促使人體產(chǎn)生一些激素或者酶。理論上,若能通過特定音樂刺激,促使人體產(chǎn)生一些有益的激素或者酶,則可達(dá)到加強(qiáng)新陳代謝,增強(qiáng)人體免疫力等對人體有益的效果。音樂的這種奇特功能是由音樂信號本身特征所決定的。
傳統(tǒng)的音樂物理學(xué)基本上是從線性的角度去分析的,但真實的音樂系統(tǒng)一定是一個時滯的非線性動力系統(tǒng)[2]。非線性的來源有媒質(zhì)中的黏滯性、非線性阻尼、熱傳導(dǎo)、弛豫現(xiàn)象和非局域性等等。而時滯系統(tǒng)往往具有多自由度、高維度特性,在系統(tǒng)的演化過程中,會伴隨著弱混沌現(xiàn)象[3]的產(chǎn)生。因此,應(yīng)用非線性的科學(xué)思想及方法對音樂信號進(jìn)行研究,論證音樂信號的混沌機(jī)制,揭示音樂信號的本質(zhì)規(guī)律并掌握信號的非線性特征[4],能夠更好的幫助我們應(yīng)用音樂信號治療疾病,特別是神經(jīng)系統(tǒng)疾病。
鋼琴曲自產(chǎn)生以來一直被譽為最有邏輯,最能打動人心的高雅藝術(shù)之一,從某種意義上它最能反映人的情感變化。本文選擇不同風(fēng)格的鋼琴曲以及Disco樂曲,經(jīng)“分幀”、分析功率譜、計算Lyapunov指數(shù)、計算關(guān)聯(lián)維數(shù)等步驟,從非線性的角度論證了音樂信號的特性,分析了不同風(fēng)格類型音樂信號的非線性特征變化。
音樂信號是一類非穩(wěn)態(tài)的非線性信號,混沌理論是分析非線性信號的有效方法,其中常用的分析方法有:分析Lyapunov指數(shù)[5]、分形理論[6]、熵理論[7]等。
分形是非線性動力學(xué)系統(tǒng)的一個重要的分支,研究的對象具有自仿射性或者自相似性,反應(yīng)了事物本身所固有的結(jié)構(gòu)特征。按照分形理論,分形內(nèi)部任何一個相對獨立的部分,在一定程度上都是整體的再現(xiàn)與縮影。
分析時間序列常采用關(guān)聯(lián)維數(shù)計算方法,它是在Token的“嵌入理論”以及Packard相空間重構(gòu)理論基礎(chǔ)上提出來的一種算法,又稱為G.P算法[8]。算法的原理是在m維相空間內(nèi)嵌入一個一維序列得到點集,序列的長度為n。用關(guān)聯(lián)積分來表示吸引子中的點之間距離分布的概率,并求出關(guān)聯(lián)維數(shù)的最佳估計。
相空間重構(gòu)[9]:設(shè)嵌入序列的值為N,選取恰當(dāng)?shù)臅r間延遲τ,則相空間中的向量為:
Xi=[xi,xi+1,…,xi+(m-1)τ]2
(1)
式中:i=1,2,…,N,N=n-(m-1)τ,n為原時間序列;m為嵌入維數(shù),通過上面的方法構(gòu)造出N個m維矢量,當(dāng)m≥2d+1時,吸引子的幾個特征可以由這些矢量在相空間中的軌跡特征描述。
G.P.算法定義如下:取一維序列中的數(shù)據(jù)構(gòu)成相空間中的m維向量將向量依次向后移動(取整數(shù)且為采樣間隔),構(gòu)成m維相空間中的另一個向量。以固定間隔向右依次移動便得到拓展而來的相空間中的點集{xi}i=1,2,…,N,其中N=n-(m-1)τ是點集中點的數(shù)量。
在相空間的點集中任取一點作為參考點,統(tǒng)計剩余點集中有多少點落在以該點為中心,以r為半徑的圓中,由此而得到關(guān)聯(lián)積分:
(2)
式中:H(·)為Heaviside單位函數(shù)。假設(shè)dmax是吸引子中的最大伸展量,當(dāng)r≥dmax時有:
(3)
當(dāng)N→∞時,C(m)≈1。關(guān)聯(lián)積分表示吸引子中點與點之間距離的概率函數(shù):
(4)
式中:D2(m,r)是與m及r有關(guān)的常數(shù)。對于相距距離很小的r1和r2有:
(5)
對上式兩邊同時取對數(shù),有:
lnCm(r2)-lnCm(r1)=
(6)
當(dāng)|r1-r2|很小時,有D2(m,r2)≈D2(m,r1)。所以,由上式得:
(7)
因此,計算關(guān)聯(lián)積分飽和狀態(tài)下曲線的線性段斜率,即可作為關(guān)聯(lián)維數(shù)的近似值。
時間延遲的選擇:根據(jù)文獻(xiàn)經(jīng)驗,時間延遲τ=15左右時,可得到的關(guān)聯(lián)維數(shù)最為清晰,且干擾誤差小。為了驗證這一觀點,在采樣頻率為44 100 Hz的條件下,截取鋼琴曲《For Elise》中的一小段音樂,利用平均位移法[10]進(jìn)行實驗。根據(jù)平均位移法的原理,在給定嵌入維數(shù)m=15,20,30的情況下,對時間延遲τ由小到大取值,重構(gòu)相空間后計算每一個τ處的平均位移量S(τ)。
(8)
當(dāng)S(τ)的增長率下降到初始值的40%時,該點對應(yīng)的τ即為最優(yōu)時間延遲。并且采用平均位移法可有效消除噪聲的影響。如下圖1所示。分析結(jié)果發(fā)現(xiàn)當(dāng)時間延遲為15和16時S(τ)的增長率下降到初始值的40%附近,即時間延遲取值較為理想,所以后續(xù)實驗計算均在時間延遲τ=15的條件下進(jìn)行。
圖1 平均位移量的增長率曲線
Lyapunov指數(shù)是非線性動力學(xué)系統(tǒng)中一個重要的參數(shù),代表了相空間中相鄰軌道發(fā)散或者收斂的情況,是衡量系統(tǒng)非線性特征的一個重要指標(biāo)。
對于一維離散映射:
xn+1=F(xn)
(9)
假設(shè)平均每次迭代所引起的指數(shù)分離中的指數(shù)為λ,于是原來相距為ε的兩個起始點經(jīng)過n次迭代后相距為
εenλ(x0)=Fn(x0+ε)-Fn(x0)
(10)
上式取對數(shù)求極限,可得:
(11)
稱其為Lyapunov指數(shù),代表了大量迭代的平均迭代分離指數(shù)。由上式可知,當(dāng)λ>0時,相鄰點運動呈分離趨勢,對應(yīng)于混沌運動;當(dāng)λ<0時,相鄰的點最終會合并成一點,對應(yīng)于無混沌特征的線性運動。常用Wolf方法[11]計算Lyapunov指數(shù)。
實驗選擇了已經(jīng)通過凱澤窗類型的高通數(shù)字濾波器去噪的三首不同風(fēng)格的鋼琴曲與一首Disco樂曲作為主要的分析對象,具體如表1所示。
通常一首樂曲是一個復(fù)雜冗長的音樂信號,對其非線性重構(gòu)后會是一個龐大的數(shù)據(jù)量,“分幀”是一個必然的選擇。音樂家在作曲時會根據(jù)要表達(dá)的情感內(nèi)容選擇不同的節(jié)律為框架,再將代表了作者思想的樂符序列填入,也就有了曲譜上的小節(jié)劃分。音樂家在譜寫每一小節(jié)的樂曲時,必定帶著整首曲子的思想,因此,每一小節(jié)都會是完整曲目信息片段的映射,不同幀的非線性特征構(gòu)成了音樂信號的整體特征。所以,按照音樂的小節(jié)劃分不會破壞整個音樂的非線性特征,通過幀的分析可以把握音樂信號的局部特征和整體特征,同時便于分析與計算[12]。
按照音樂曲式,我們將音樂信號按照曲式中的小節(jié)進(jìn)行劃分。如圖2所示是致愛麗絲第一樂句中小節(jié)的劃分,每兩個箭頭之間代表一個小節(jié)。
圖2 《致愛麗絲》第一樂句中小節(jié)的劃分
本次實驗一共選擇了三首不同風(fēng)格的鋼琴曲和一首Disco樂曲進(jìn)行處理,對音樂信號的劃分結(jié)果,如表2所示。
功率譜分析[13]可以定性地分析音樂信號是否具有混沌特性。周期運動在功率譜中對應(yīng)尖鋒,混沌的特征是譜中出現(xiàn)“噪聲背景”和寬鋒。下面先通過功率譜圖定性的驗證了音樂信號具有混沌的特征。
圖3是《致愛麗絲》某一片段的功率譜圖,由圖中我們可以看出,功率譜中的峰值連成了一片,存在一個寬峰,并在峰附近有明顯的“噪聲背景”,說明系統(tǒng)具有混沌的特征。各首音樂信號小節(jié)的功率譜圖都有相似的特征。
圖3 《致愛麗絲》片段的功率譜圖
Lyapunov指數(shù)是定量分析信號混沌特性的常用方法。圖4是致愛麗絲音樂信號每小節(jié)Lyapunov指數(shù)的計算結(jié)果的折線圖。
圖4 《致愛麗絲》的Lyapunov折線圖
各首音樂Lyapunov指數(shù)的最大值、最小值、平均值以及均方根統(tǒng)計如下表3所示。
從Lyapunov指數(shù)的變化值以及相關(guān)統(tǒng)計值可以看出,音樂信號屬于弱混沌信號,總體趨勢是可控的,但是特定的音符在某個時刻發(fā)聲的長短與強(qiáng)弱卻是無法精確控制的,具有隨機(jī)性。
計算關(guān)聯(lián)維數(shù)利用G.P算法,選擇時間延遲為15,缺省值為2,當(dāng)曲線的斜率隨著嵌入維數(shù)的增大而逐漸趨向于一個飽和值時,計算出此時飽和斜線的斜率,此時的值為關(guān)聯(lián)維數(shù)的值。如下圖5所示,當(dāng)m=20時,直線趨于飽和,此時的斜率為16.240 7。
圖5 《致愛麗絲》第30小節(jié)-關(guān)聯(lián)維數(shù)圖
以此方法可計算出所有小節(jié)關(guān)聯(lián)維數(shù),并計錄得表4。
以表4數(shù)據(jù)為基礎(chǔ)可畫得關(guān)聯(lián)維數(shù)折線圖,更直觀的表現(xiàn)出各小節(jié)關(guān)聯(lián)維數(shù)的變化趨勢。如圖6所示。
圖6 致愛麗絲分節(jié)關(guān)聯(lián)維數(shù)折線圖
用同樣方法獲得DISCO音樂的各小節(jié)關(guān)聯(lián)維數(shù)數(shù)據(jù),并繪制關(guān)聯(lián)維數(shù)折線圖作為對照。如圖7所示。
從以上關(guān)聯(lián)維數(shù)折線圖可分析得出,音樂信號是具有高維數(shù)的非線性信號,有復(fù)雜的周期運動特征,且維數(shù)的變化是有限的或具有隨機(jī)性。除此之外,鋼琴曲的整體維數(shù)要高于DISCO樂曲。
差分是一個線性降維過程。對音樂信號進(jìn)行差分處理后計算其關(guān)聯(lián)維數(shù),可分析討論差分階次對關(guān)聯(lián)維數(shù)變化的影響。對不同樂曲進(jìn)行多階差分并求出平均關(guān)聯(lián)維數(shù)可畫得關(guān)聯(lián)維數(shù)折線圖,更直觀的表現(xiàn)出各樂曲關(guān)聯(lián)維數(shù)的變化趨勢。如圖8所示。
圖7 DISCO音樂分節(jié)關(guān)聯(lián)維數(shù)折線圖
圖8 差分后關(guān)聯(lián)維數(shù)折線圖
由圖8可以看出,經(jīng)過多階差分以后,音樂信號的關(guān)聯(lián)維數(shù)都在無差分時得到的值上小范圍波動,考慮試驗中的誤差,我們可以認(rèn)定,關(guān)聯(lián)維數(shù)變化很小,音樂信號中的非線性特征具有穩(wěn)定性。也可以看出鋼琴曲的關(guān)聯(lián)維數(shù)相對集中且遠(yuǎn)高于Disco音樂的關(guān)聯(lián)維數(shù),這意味著鋼琴曲有更強(qiáng)的規(guī)律性。
根據(jù)計算分析三首鋼琴曲以及一首Disco樂曲的功率譜、Lyapunov指數(shù)和關(guān)聯(lián)維數(shù)等非線性特征量,可驗證音樂信號據(jù)有如下特征:
(1) 弱混沌是音樂信號的非線性特征之一,這與音樂信號的可控性是符合的。事實上,音樂也是由人主觀能控的彈奏各種樂器組合而成的。
(2) 準(zhǔn)周期運動是音樂信號的主要特征。以經(jīng)典鋼琴曲為例,以小節(jié)為劃分單位的維數(shù)變化具有隨機(jī)性,但維數(shù)變化始終維持在一個有序可控的范圍內(nèi),這體現(xiàn)了音樂信號是隨機(jī)性與秩序性的統(tǒng)一。其中經(jīng)典鋼琴曲的維數(shù)明顯高于其它音樂信號,表明經(jīng)典鋼琴曲的非線性特性更強(qiáng),更容易在生理上被人接受。
(3) 音樂信號具有非常穩(wěn)定的非線性特征。通過差分的方法對音樂信號進(jìn)行線性降維后并未明顯改變其平均關(guān)聯(lián)維數(shù),這體現(xiàn)了作曲時和聲的穩(wěn)定性原則。
傳統(tǒng)思維上,功率譜、李雅普諾夫指數(shù)、關(guān)聯(lián)維數(shù)等特征量只是針對自然界或工程界一般的信號分析量值。而將此方法引入到對樂曲這個人類高級思維活動的成果進(jìn)行研究,只是一個初步的探索。實際上,對樂曲的特征描述顯然遠(yuǎn)遠(yuǎn)不止這個范圍,所得結(jié)論也是有局限性。