摘? 要:MIDI技術(shù)具有靈活的演奏形式與超強(qiáng)的編輯能力,自20世紀(jì)80年代誕生以來,計(jì)算機(jī)音樂因?yàn)橛辛诉@個(gè)統(tǒng)一的接入標(biāo)準(zhǔn)以及在音樂制作上的便利性而得到了極大的發(fā)展。MIDI的主要特點(diǎn)在于其是一種數(shù)字文件,而非音頻文件,是一種描述性的數(shù)據(jù)“音樂語言”,僅僅是記錄了演奏樂曲的信息,因而占用的存儲(chǔ)空間極小且便于編輯、修改。MIDI音樂主旋的提取除了在技術(shù)上的實(shí)踐應(yīng)用,更重要的是有利于音樂數(shù)據(jù)庫的構(gòu)建,對(duì)于多音軌MIDI音樂主旋律提取方法的探析有著一定的實(shí)踐意義。
關(guān)鍵詞:多音軌? MIDI技術(shù)? 主旋律提取? 數(shù)字文件
中圖分類號(hào):TP391.42 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2021)07(a)-0072-03
On the Method of Extracting the Main Melody of
Multi Track MIDI Music
XIE Linling
(Jinggangshan University, Ji'an, Jiangxi Province, 343009? China)
Abstract: MIDI technology has flexible performance forms and super editing ability. Since its birth in the 1980s, computer music has been greatly developed because of this unified access standard and the convenience in music production. The main feature of MIDI is that it is a digital file, not an audio file. It is a descriptive data "music language", which only records the information of playing music, so it occupies very little storage space and is easy to edit and modify. In addition to the practical application in technology, the extraction of MIDI music theme is more important for the construction of music database. It has a certain practical significance for the analysis of multi track MIDI music theme extraction methods.
Key Words: Multi track; MIDI technology; Theme melody extraction; Digital file
MIDI音樂的出現(xiàn),激發(fā)了電子音樂最為強(qiáng)大的潛能,浩瀚、豐富的音色資源與計(jì)算機(jī)的超級(jí)編輯功能結(jié)合在一起,可以任意剪輯拼貼、更換樂器、調(diào)整速度、音調(diào),極大地提升了音樂創(chuàng)作、制作、剪輯的工作效率。帶動(dòng)了計(jì)算機(jī)音樂制作技術(shù)的進(jìn)步,降低了專業(yè)音樂制作的門檻,促進(jìn)了個(gè)人音樂工作室的誕生。隨著科技的發(fā)展,個(gè)人計(jì)算機(jī)以及相關(guān)的MIDI設(shè)施的購買成本越來越低,因此,只要有想法,有能力,加上可以獲得的相關(guān)軟、硬件設(shè)施就能實(shí)現(xiàn)自己的音樂夢想。MIDI技術(shù)有著比其他任何傳統(tǒng)樂器都更為豐富的演奏手段和難以想象的編輯能力。MIDI技術(shù)的發(fā)展,讓音樂制作得到了普及,造福了一大批“網(wǎng)絡(luò)音樂人”與“自由音樂人”。在MIDI研究過程中,對(duì)MIDI音樂的特點(diǎn)以及發(fā)展過程,讓多音軌MIDI的各個(gè)軌道各自工作起來,從多音軌中提取主旋律進(jìn)而構(gòu)建數(shù)據(jù)庫的方法等都是值得探討與分析的。
1? MIDI音樂的特點(diǎn)及其發(fā)展
MIDI的主要特點(diǎn)在于其是一種數(shù)字文件,而非音頻文件,是一種描述性的數(shù)據(jù)“音樂語言”,僅僅是記錄了演奏樂曲的信息,因而占用的存儲(chǔ)空間極小且便于編輯、修改[1]。正因MIDI的這一特點(diǎn),使其得到了飛速的發(fā)展與普及。對(duì)于國人而言,早期從事計(jì)算機(jī)音樂的人幾乎都是從MIDI開始的,MIDI甚至是計(jì)算機(jī)音樂的代名詞。MIDI到底是什么?簡而言之,MIDI(Musical Instrument Digital Interface)即音樂數(shù)字設(shè)備接口,是一種數(shù)字化通信語言,一種使相關(guān)設(shè)備之間相互兼容并實(shí)現(xiàn)技術(shù)交流的技術(shù)標(biāo)準(zhǔn)。通過MIDI技術(shù),音樂家可以像指揮家一樣對(duì)自己作品的聲音進(jìn)行全面的控制和實(shí)時(shí)操控,無論是在制作室還是演出現(xiàn)場,MIDI技術(shù)都可以改變電子樂器、錄音設(shè)備以及信號(hào)處理器等設(shè)備的參數(shù),可以根據(jù)需求進(jìn)行實(shí)時(shí)的操控,以呈現(xiàn)出最好的聲音效果。
20世紀(jì)80年代,電子科技的發(fā)展與計(jì)算機(jī)數(shù)字化技術(shù)的采用,推動(dòng)了電子樂器的大發(fā)展,但是不同生產(chǎn)廠家之間的設(shè)備要進(jìn)行同步是一件非常困難的事,因?yàn)槊總€(gè)廠家所生產(chǎn)設(shè)備的標(biāo)準(zhǔn)不一。為了解決設(shè)備之間的相互兼容性,MIDI標(biāo)準(zhǔn)被提上日程。1982年,國際樂器制造商協(xié)會(huì)通過了大衛(wèi)·史密斯提出的“通用合成器接口”的方案,命名為“音樂設(shè)備數(shù)字接口”,即“MIDI”接口,1983年,MIDI協(xié)議1.0正式確定。從此,所有電子樂器背后都有了一個(gè)五孔MIDI插座,為樂器之間的相互兼容架起了一座橋梁,不同的樂器之間有了統(tǒng)一的連接規(guī)范,可以使用統(tǒng)一的“音樂語言”。自20世紀(jì)80年代MIDI誕生以來,計(jì)算機(jī)音樂因其有了統(tǒng)一的接入標(biāo)準(zhǔn)以及在音樂制作上的便利性而得到了巨大的發(fā)展,同時(shí)也為音樂界帶來了一場重大的革命[2]。近年來,MIDI技術(shù)的重大變化在于采樣音源的介入,采樣音源是對(duì)傳統(tǒng)樂器以及現(xiàn)實(shí)音效進(jìn)行采錄后而制作編輯的,其最大的特點(diǎn)在于其具有更加真實(shí)的效果和越來越大的容量。比如當(dāng)下使用最為廣泛的Kontakt采樣器及所支持的音源,就Kontakt自帶的原廠音源就有23GB,支持其格式的愛麗絲鋼琴就占用了6GB(只是一種單獨(dú)的純鋼琴音色)。另外,大眾所熟知的好萊塢管弦樂,僅弦樂部分就有326GB,還有BFD鼓音源已經(jīng)超過了100GB,足見當(dāng)下采樣音色所占用的存儲(chǔ)容量,這也表明了在音樂制作領(lǐng)域無論是軟件還是硬件都在飛速的發(fā)展。早期的MIDI音樂制作都是建立在GM音色表基礎(chǔ)上的,雖然音色相對(duì)當(dāng)下的采樣音色差一點(diǎn),但是其優(yōu)勢在于在任何音序軟件中打開同一個(gè)MIDI文件都可以正常播放而基本不會(huì)出現(xiàn)亂碼的情況。而隨著音序軟件及音源的不斷發(fā)展,音序軟件開始支持VST、DX、AU等多種格式,同時(shí)眾多的音序軟件生成的文件已然不是單純的MIDI文件,而是有著自己的“工程文件”擴(kuò)展名。如Cubase就以“cpr”作為擴(kuò)展名,SONAR則是“cwp”為擴(kuò)展名等。這些發(fā)展變遷都表明著當(dāng)下的音序軟件、MIDI音樂技術(shù)都朝著個(gè)性化和豐富性的方向延展,體現(xiàn)了MIDI音樂制作技術(shù)的實(shí)質(zhì)性變化,使其逐步走向音源容量更大,效果更加精致,可調(diào)控性更強(qiáng)以及更加智能化。當(dāng)下,幾乎所有的音樂類型都脫離不了計(jì)算機(jī)音樂的相關(guān)技術(shù),隨著科技的不斷發(fā)展,計(jì)算機(jī)音樂也在飛速的普及[3]。在今天,電子音樂已成為一種廣為人知的藝術(shù)形式,并在高校中建立起了相對(duì)完整的學(xué)科體系[4]。音樂行業(yè)已然與MIDI技術(shù)不可分離,MIDI音樂主旋律的提取不僅在于技術(shù)上的應(yīng)用,同時(shí)對(duì)于音樂數(shù)據(jù)庫的構(gòu)建有著極為重要的意義。
2? 多音軌MIDI音樂主旋律的提取方法
隨著AI技術(shù)的不斷變化更新,音樂創(chuàng)作的形式化技術(shù)也在其中得到了進(jìn)一步的發(fā)展[5]。MIDI是音樂設(shè)備的數(shù)字接口,其電纜本身不帶有音頻數(shù)據(jù)信息,通過計(jì)算機(jī)向其他合成器等電子設(shè)備發(fā)出的MIDI信息是一些表演數(shù)據(jù),以這種手段方式向其他樂器發(fā)出指令,進(jìn)而控制其他操作系統(tǒng)。MIDI信息有許多不同的類型,大的方面來說,其包括了通道信息和系統(tǒng)信息。通道信息一般應(yīng)用在MIDI的具體通道之中,而系統(tǒng)信息指的是整個(gè)系統(tǒng)的信息。當(dāng)MIDI軌被編碼為一個(gè)單獨(dú)的統(tǒng)一體,這個(gè)統(tǒng)一體包括音樂音符和其他與演奏相關(guān)的事件信息。軌道內(nèi)所包含的信息是可以通過創(chuàng)造性的方式分離出來,成為一個(gè)獨(dú)立的音軌,用于諸如轉(zhuǎn)調(diào)、重新分配樂器、數(shù)據(jù)庫構(gòu)建等。在當(dāng)下的研究與實(shí)踐應(yīng)用中,MIDI主旋律的提取主要采用分層聚類算法、音軌特征量的方法。
2.1 分層聚類算法的多音軌MIDI音樂主旋律提取方法
隨著計(jì)算機(jī)科學(xué)和音樂科技的發(fā)展,算法在計(jì)算機(jī)作曲領(lǐng)域已有廣泛的研究和應(yīng)用[6]。選擇所有包含旋律音軌的方法來提取主旋律,被稱為分層聚類算法。分層聚類算法是基于音軌之間的距離而建立起來的一個(gè)音軌的聚集。此方法可以從保存基本信息(音高信息和距離特征)的MIDI軌道中獲得一個(gè)可選擇的最佳音軌,進(jìn)而從這個(gè)最佳音軌中提取主旋律。為了在提取主旋律時(shí)這一算法得以實(shí)現(xiàn),需要經(jīng)過以下6個(gè)步驟。第一,是對(duì)所要提取音樂中的所有音軌進(jìn)行輪廓算法,而所謂的輪廓算法主要是應(yīng)用在復(fù)調(diào)音樂中提取主旋律的一種方法,復(fù)調(diào)音樂是一種多旋律的音樂類型,一般來說,多條旋律都是主旋律,同等重要。因而,所謂的提取主旋律只是將所有音符聚集到一個(gè)音軌上,最好選擇最高音的音符,得出具有一定特征的音高柱狀圖的音符集合。第二,是計(jì)算出每一音軌的平均信息,在這些平均信息中,得出最為突出的音符集,將其視為主旋律。第三,是將每一個(gè)音符分成十二平均律,以十二平均律的形式來描述每一個(gè)音符,進(jìn)而計(jì)算出音高的柱狀圖。第四,是以音程的構(gòu)建形成音符的聚集,實(shí)現(xiàn)音符的集合。音程是旋律運(yùn)動(dòng)的基本動(dòng)力,通過音與音之間形成不同的距離(即音程度數(shù)),最終實(shí)現(xiàn)變幻莫測,豐富多彩的旋律組合。因而要提取旋律就需要對(duì)音程進(jìn)行計(jì)算與分析,最終獲得主旋律。第五,在以上四步完成后,基本得出旋律音軌,此時(shí)選擇所獲得的旋律音軌,然后再去除其余的聚集音軌。第六,再次運(yùn)用輪廓算法對(duì)旋律音軌進(jìn)行計(jì)算,獲得最高的音高線條,得出音樂的主旋律。
分層聚類算法是應(yīng)用數(shù)學(xué)模型來計(jì)算聚集的旋律音軌之間的距離,在提取MIDI主旋律時(shí)關(guān)照到了不同樂器軌以及弱音高的音軌,極大地減少了主旋律提取時(shí)的誤差,所提取的主旋律更為精細(xì)與準(zhǔn)確。
2.2 音軌特征量的多音軌MIDI音樂主旋律提取方法
音樂制作者在運(yùn)用MIDI創(chuàng)作音樂時(shí),一般都會(huì)給每一個(gè)MIDI軌道命名,雖然并沒有說一定要給MIDI軌道命名,但是通常為了便于修改與操作,基本都會(huì)給予MIDI軌道名稱。名稱明確就為主旋律的抽取提供了巨大的參考信息,同時(shí)也可以作為旋律音軌的特征向量來予以使用。一般的主旋律的音軌名稱可能是Melodies(旋律)、Vocal(人聲)、Solo(獨(dú)奏)等。而其他的伴奏聲部則有可能是吉他(Guitar)、貝斯(Bass)、Piano(鋼琴)等。當(dāng)然,也有名稱模糊的時(shí)候,當(dāng)音軌名稱模糊時(shí),也可以通過MIDI的通道號(hào)、左右聲道的平衡度、MIDI音符的平均力度、音軌主音量的大小以及MIDI音符的發(fā)音時(shí)間、發(fā)音面積來推算主旋律音軌。
無論是MIDI設(shè)備還是設(shè)備中的某個(gè)音源或者程序,只要被設(shè)定為響應(yīng)某一樂器音色或者人聲的通道號(hào),即會(huì)響應(yīng)這一通道上所傳輸?shù)男畔?,比如人聲、鋼琴或者小提琴等。但是?6通道的MIDI音軌中,一般情況第10通道都是留給打擊樂器的,所以根據(jù)這一固有特征,在進(jìn)行主旋律軌選擇時(shí)就可以排除第10通道。
一般來說,所有的MIDI軌道都會(huì)作一個(gè)聲像的平衡調(diào)節(jié),以達(dá)到人耳在聆聽音樂時(shí)的舒適度。對(duì)于主旋律音軌來說,通常情況下都會(huì)處于左右平衡的狀態(tài),即處于中間的位置。而其他樂器軌道在左右聲像上多少都會(huì)有所偏差。這也可以作為一個(gè)特征向量來參考。除此之外,作為主旋律的MIDI軌中的音符的平均力度一般來說都會(huì)高于其他聲部。為了突出主旋律的明確性,其主音量也會(huì)大于其他音軌的音量值。另外,主旋律的發(fā)音時(shí)間及發(fā)音面積(音長和音高)相比其他聲部都會(huì)更容易被人們感知。
在抓取與確定主旋律音軌的過程中,通過合理分析與選取各音軌的向量特征,建立分析模型,結(jié)合特征向量確定主旋律音軌。
3? 結(jié)語
縱觀電子音樂的發(fā)展歷程,無論是合成技術(shù)還是后來的采樣技術(shù),其最終的目的無非是朝著兩個(gè)方向發(fā)展,一方面是更為準(zhǔn)確地再現(xiàn)自然聲學(xué)的音響效果,即與MIDI技術(shù)緊密相連的部分,借助數(shù)字編輯的靈活度與強(qiáng)大功能,不斷拓展音色范疇與真實(shí)性,可以模仿任何一件傳統(tǒng)樂器的聲音,如小提琴等。另一方面則是開拓新的“聲音”,更為強(qiáng)調(diào)聲音的新穎性與實(shí)驗(yàn)性。MIDI已經(jīng)在音樂制作的各個(gè)領(lǐng)域內(nèi)進(jìn)行應(yīng)用,MIDI技術(shù)在其靈活度與自由的編輯能力上高于任何傳統(tǒng)樂器。在不斷的發(fā)展中,MIDI技術(shù)越來越豐富,越來越體現(xiàn)出了自己的東西,逐漸走上了一條漸進(jìn)式的創(chuàng)作之路。多音軌MIDI音樂主旋律的提取,對(duì)于在音樂數(shù)據(jù)庫的構(gòu)建上具有極大的意義,因此,對(duì)于其提取方法的探討也有著一定的實(shí)踐價(jià)值。
參考文獻(xiàn)
[1] 黃枕宇.西方電子與計(jì)算機(jī)音樂史——電子、數(shù)據(jù)科技影響下的西方音樂[M].北京:中央音樂學(xué)院出版社,2020.
[2] 謝林玲,李文韞.虛擬樂器人性化演奏效果的可實(shí)現(xiàn)性[J].科技資訊,2021(1):29-31.
[3] 梁威.基于Kontakt采樣器中虛擬樂器人性化效果的實(shí)現(xiàn)[J].科技創(chuàng)新導(dǎo)報(bào),2020(29):87-90.
[4] 趙曉雨.藝術(shù)理念與技術(shù)創(chuàng)新驅(qū)動(dòng)下的中國電子音樂發(fā)展[J].中央音樂學(xué)院學(xué)報(bào),2019(4):83-90,114.
[5] 馬丹,吳躍.基于生成對(duì)抗網(wǎng)絡(luò)的智能音樂綜述[J].計(jì)算機(jī)應(yīng)用研究,2021,38(3):641-646.
[6] 景宇陽.基于樂譜識(shí)別的深度學(xué)習(xí)算法作曲系統(tǒng)[D].南京:南京藝術(shù)學(xué)院,2020.