陳根方,董凌宇
(杭州師范大學杭州國際服務工程學院,浙江 杭州 311121)
基于聚類分析的多譜式工尺譜文稿的有效空間信息提取研究
陳根方,董凌宇
(杭州師范大學杭州國際服務工程學院,浙江 杭州 311121)
摘要:針對中國留存的大量古代多譜式工尺譜文稿的時空異構信息分類問題,通過分析多譜式工尺譜的記譜法準則,對文稿攜帶的異構信息進行時空拆分,提出了基于層次聚類分析的文稿有效空間信息提取方法.實驗數(shù)據(jù)表明,層次聚類分析對多譜式工尺譜文稿的有效空間信息提取具有較好的識別效果,能為工尺譜等傳統(tǒng)文化與藝術形式的數(shù)字化提供相應的思路與手段,對傳承和弘揚中國傳統(tǒng)文化具有一定意義和良好的應用前景.
關鍵詞:工尺譜;聚類分析;空間信息
五線譜是西歐傳統(tǒng)的音樂記譜法,中國傳統(tǒng)的音樂記譜法主要是工尺譜記譜法,存見的大多數(shù)傳統(tǒng)劇種(如昆曲)和中國傳統(tǒng)樂器(如琵琶)的樂譜都采用工尺譜記譜法來記錄音樂[1].工尺譜記譜法使用的記譜模式多樣,樂譜的譜式和書寫方法呈現(xiàn)多樣化異構特征(圖1).根據(jù)文獻[2]統(tǒng)計,存見的工尺譜譜字有30余種異構形態(tài),樂譜的書寫譜式有半蓑衣譜式、直行豎寫譜式(圖1a)、直行橫寫譜式(圖1b)等類型,字體有刻板印刷體(圖1a)、手寫體(圖1c)等,并形成了一些獨立的區(qū)域性工尺譜記譜子體系,如福建一帶的南音記譜法、北京智化寺的佛教用工尺譜譜字、西安鼓樂工尺譜等都與通用的工尺譜譜字略有變化[3].
聯(lián)合國教科文組織在2001年公布中國昆曲為第一批人類口頭與非物質文化遺產(chǎn)[4].昆曲遺產(chǎn)豐富,其劇本曲譜采用工尺譜記譜法,如清代乾隆十一年(1746年)允祿等奉旨編纂的《九宮大成南北詞宮譜》就收錄了工尺譜曲譜4 466首[5];在敦煌莫高窟中發(fā)現(xiàn)的《敦煌曲譜》(933年)有25首琵琶曲譜.工尺譜作為載體,保存了前人大量的音樂遺產(chǎn),為中華民族音樂的傳承與發(fā)展做出了巨大貢獻.
目前,有關工尺譜的研究主要集中在對工尺譜樂譜音樂理論的分析和研究上,利用信息技術處理工尺譜樂譜的研究和探索相對較少.如陳榮鑫等[6]設計開發(fā)了福建南音工尺譜的排版軟件,可以輸出工尺譜樂譜和簡譜或五線譜合成的樂譜;文獻[7]介紹了工尺譜的翻譯和排版軟件等.這些研究成果僅局限于工尺譜的翻譯和排版,為工尺譜在數(shù)字化時代的傳承打下了一定基礎.利用光學樂譜識別技術的傳統(tǒng)模式對工尺譜文稿的音樂信息提取已經(jīng)有了一些研究[8],它采用傳統(tǒng)的OMR技術,針對昆曲的工尺譜樂譜(樂譜主要來源于《納書楹曲譜》與《九宮大成南北詞宮譜》)進行了音樂信息的提取研究,但譜字分割正確率和譜字識別率較低,存在樂譜中噪音多、譜面復雜、分割算法對傾斜敏感等缺陷.
1多譜式工尺譜文稿的時空信息分析
音樂是時間藝術,樂譜中不僅要用空間符號體現(xiàn)出音高、節(jié)奏信息,而且要體現(xiàn)出樂音間的時間信息,工尺譜記譜法巧妙使用了頁面的二維空間,把音樂信息的三維結構或者二維結構進行合理的布局.三維結構譜面的第1維是歌詞,第2維是音高譜字,第3維是節(jié)奏譜字,如圖1;二維結構譜面的第1維是音高譜字,第2維是節(jié)奏譜字.各維度之間存在附屬關系,歌詞、音高譜字、節(jié)奏譜字之間的附屬關系明確,每個歌詞附屬若干個音高和節(jié)奏符號,每個音高譜字附屬若干個節(jié)奏符號.
a:來自《納書楹曲譜》[9];b:來自《遏云閣曲譜》[10];c:來自《太古傳宗》[11].圖1 不同書寫譜式的多譜式工尺譜曲譜圖例(時間跨度1 000年—從唐代到清代)Fig. 1 Different writing type of Gong-che notation musical scores
盡管工尺譜的書寫譜式多樣,但樂譜的時空信息在頁面記譜方式上仍有一定的規(guī)律:1)時間信息.樂譜的時間信息由符號的書寫順序決定,頁面書寫順序與中國傳統(tǒng)書寫方式一致,遵循從右到左、從上到下的順序.圖1的3張樂譜中,不僅歌詞符合這一規(guī)律,每個歌詞的若干個音高譜字也符合這一規(guī)律;2)空間信息.在字號大小上,歌詞(如有)的字號大于等于音高譜字的字號,音高譜字的字號大于節(jié)奏譜字字號.圖1a中,字號最大的符號是歌詞,其次是歌詞右邊的音高譜字,最小的是音高譜字右上角的節(jié)奏譜字.
工尺譜樂譜的歷史文稿汗牛充棟,是明清時期使用最普遍同時刊印出版樂譜最多的中國傳統(tǒng)音樂記譜法.但現(xiàn)今國內絕大多數(shù)音樂院校和普通中小學以西方的音樂體系教學和培養(yǎng)人才,中國原有的傳統(tǒng)音樂遺產(chǎn)只能在民間和音樂研究機構范圍內被傳承,極大地制約了傳統(tǒng)音樂的廣泛傳播.
2去除無效空間信息的聚類分析方法
盡管工尺譜的譜面形式多樣化,其中攜帶的信息包括了有語義的信息和無效的信息,從圖1的工尺譜譜面的二維空間分析,無效信息主要集中在邊框和邊框外的二維空間區(qū)域,因此,去除邊框和邊框外的二維空間區(qū)域即可提取有語義的有效信息.
2.1特征提取
特征是某物體區(qū)別其他物體信息的描述.圖像的特征通常有局部特征和統(tǒng)計特征之分,局部特征一般指圖像的空間特征,包括顏色、光亮、灰度、直方圖、連通區(qū)域等,而統(tǒng)計特征則指圖像空間的統(tǒng)計信息.
本文利用圖像的連通區(qū)域標記算法[12]對文稿圖像的連通區(qū)域進行標記,得到多維特征數(shù)據(jù)集,如連通區(qū)域的長、寬、面積、最小橫坐標、最小縱坐標等,圖2顯示了對圖1a進行連通區(qū)域標記后得到的特征數(shù)據(jù),其中子圖2a為所有連通區(qū)域的長、寬為坐標的圖示.很明顯,有些孤立點是頁面框架,有些是粘連在一起的譜字塊;圖2b為利用形態(tài)學變化聚類去掉孤立點后的所有連通區(qū)域的長、寬圖示;圖2c為連通區(qū)域的相同最小橫坐標出現(xiàn)的次數(shù)圖示;圖2d為連通區(qū)域的相同最小縱坐標出現(xiàn)的次數(shù)圖示.
圖2 對圖1a的連通區(qū)域標記后特征數(shù)據(jù)的圖示結果Fig. 2 Graphical results of the characteristic data of the connected-components from Fig. 1a
2.2聚類分析
聚類分析是人工智能的重要研究內容,是無監(jiān)督的分類方法,通常把一些具有某些特征表示的數(shù)據(jù)集按數(shù)據(jù)之間的相似性進行合并,最后達到分類的目的.常見的聚類方法有層次聚類算法、順序聚類算法、基于密度聚類算法、基于代價函數(shù)最優(yōu)聚類算法、概率聚類算法、模糊聚類算法、最小生成樹聚類、競爭學習算法、基于形態(tài)學變換聚類算法、邊界檢測聚類算法、分支與約束聚類算法、遺傳聚類算法等.
層次聚類具有距離和規(guī)則的相似度容易定義、限制少、不需要預先制定聚類數(shù)等優(yōu)點,適合工尺譜語義信息和無效信息的分類特征.它一般包含若干步,對于第t步而言,是在第t-1步的基礎上進行進一步聚類,包括合并聚類和分裂層次聚類兩種算法.工尺譜的有效空間信息提取采用合并算法,具體步驟如下:
3) 重復2),直到所有的數(shù)據(jù)加入到2個類別中,即有效語義信息類別和無效信息類別.
3實驗結果與分析
實驗選取了兩部經(jīng)典的清昆曲劇本《九宮大成南北詞宮譜》[5]和《納書楹曲譜》[9]為例,它們分別包含有6 951頁和4 242頁有效的樂譜.先利用圖像處理方法對每頁樂譜圖像進行二值化處理,然后對每頁樂譜圖像進行區(qū)域標記,提取出區(qū)域特征,包括面積、周長、寬高等,再利用層次聚類算法,對每頁樂譜進行有效語義信息和無效信息的分類,最后統(tǒng)計無效信息的識別效果.
隨機選取了《納書楹曲譜》的一頁曲譜,對分類結果進行圖示(圖3).圖3a為有效語義信息的空間圖像,圖3b為無效信息的空間圖像.很顯然,圖3b主要由邊框組成,利用邊框可以獲取邊框內的有效語義信息,而邊框外為無效信息的空間圖像.
表1統(tǒng)計了實驗用樂譜的無效信息的識別率,這里的無效信息以邊框為代表,統(tǒng)計了樂譜的三邊邊框或四邊邊框的識別率.顯然,每種圖像局部特征的三邊邊框的識別率都高于四邊邊框.觀察圖3可知,一般的樂譜由于版式上的安排,邊框的三條邊比另外第四條邊要明顯,這也符合人們的主觀感受.
表1 《九宮大成南北詞宮譜》和《納書楹曲譜》的樂譜空間無效信息的總識別率
4結語
工尺譜作為中國和東亞地區(qū)古代主要的音樂記譜法,記錄了大量的音樂作品,包括入選世界非物質文化遺產(chǎn)名錄的昆曲等戲劇和琵琶等樂器的樂譜都采用工尺譜為音樂信息的記錄方法.在現(xiàn)代,中國和東亞地區(qū)的音樂人大多使用五線譜和簡譜為音樂信息的傳承載體,攜帶有大量音樂信息的工尺譜樂譜已經(jīng)少有人用,因此分析和提取工尺譜樂譜的音樂信息,并用現(xiàn)代記譜法進行還原,是古代音樂復用的關鍵工作.
由于工尺譜的記譜方法和音樂符號在歷史的長河中變化多端,樂譜的譜式多樣,這給工尺譜的數(shù)字化帶來了諸多不便.本文通過分析工尺譜的時空信息布局特點,利用層次聚類分析方法,提取出樂譜中的有用信息,為進一步的音符音高識別、板眼識別、時序識別等后續(xù)時空信息的分類工作打下基礎.
參考文獻:
[1] 陳澤民.工尺譜入門[M].北京:華樂出版社,2006:1-6.
[2] 楊蔭瀏.工尺譜淺說[M].北京:音樂出版社,1962:15-18.
[3] 吳曉萍.中國工尺譜研究[M].上海:上海音樂學院出版社,2005:32-97.
[4] 周兵,蔣文博.昆曲六百年[M].北京:中國青年出版社,2009:1-2.
[5] 允祿,周祥鈺,鄒金生,等.九宮大成南北詞宮譜[M].[S.l.]:[s.n.],1746(清乾隆11年):1207-1230.
[6] 陳榮鑫,陳維斌.南音工尺譜排版軟件的設計與實現(xiàn)[J].計算機工程與設計,2005,26(8):2246-2248.
[7] 新華網(wǎng).南音工尺譜可直譯成五線譜:泉州兩教師用電腦立功[EB/OL].[2015-06-18].http://news.xinhuanet.com/newscenter/2002-10/17/content_599827.htm.
[8] CHEN G F,XU J X.A novel method of multiple classifiers combination forGong-chenotation musical score[J]. International Journal of Digital Content Technology and its Applications,2012,6(1):82-87.
[9] 葉堂.納書楹曲譜[M].[S.l.]:[s.n.],1792(清乾隆57年):1725.
[10] 王錫純.遏云閣曲譜[M].[S.l.]:[s.n.],1871(清同治10年):587.
[11] 湯斯質,顧峻德.太古傳宗[M].[S.l.]:[s.n.],1749(清乾隆14年):259.
[12] CHANG F, CHEN C J, LU C J. A linear-time connected-component labeling algorithms using contour tracing technique[J]. Computer Vision Image Understanding,2004,93(2):206-220.
Cluster-based Extraction Method for Effective Spatial Information of Multi-typeGong-cheNotation Musical Manuscript
CHEN Genfang, DONG Lingyu
(Hangzhou Institute of Service Engineering, Hangzhou Normal University, Hangzhou 311121, China)
Abstract:Aiming at the space-time heterogeneous information classification for the ancient-retained multi-type Gong-che notation musical manuscript in China, a hierarchical cluster-based extraction method is proposed by analyzing the criterion of Gong-che notation and the heterogeneous information in the manuscript. The results show that hierarchical cluster analysis has good recognition effect for multi-type Gong-che notation musical manuscript. The method provides relevant idea and methods for the digitization of traditional culture and art forms like Gong-che notation, and has important significance and good application prospect for the inheritance and development of Chinese traditional culture.
Key words:Gong-che notation; cluster analysis; spatial information
收稿日期:2015-07-31
基金項目:國家社會科學基金項目(14FYS004); 浙江省自然科學基金項目(LY14F020037).
通信作者:陳根方(1968—),男,教授,博士,主要從事非物質文化遺產(chǎn)數(shù)字化保護、數(shù)字音樂研究.E-mail:cgf@hznu.edu.cn
doi:10.3969/j.issn.1674-232X.2016.03.018
中圖分類號:TP391
文獻標志碼:A
文章編號:1674-232X(2016)03-0321-04