徐 今
大連理工大學(xué),遼寧 大連 116024
地方普通話是方言區(qū)的人們?cè)趯W(xué)習(xí)與使用標(biāo)準(zhǔn)普通話的過(guò)程中,受方言影響而形成的帶有不同程度方言色彩的普通話,表現(xiàn)出中介語(yǔ)的特點(diǎn),過(guò)去也叫作“藍(lán)青官話”。地方普通話在當(dāng)前跨地區(qū)交際中發(fā)揮著重要作用,全國(guó)范圍內(nèi)絕大多數(shù)人說(shuō)的都是地方普通話。了解地方普通話的狀況,探索地方普通話由低級(jí)向高級(jí)的發(fā)展規(guī)律,總結(jié)地方普通話的“板結(jié)”特點(diǎn),對(duì)于推廣普通話、研究語(yǔ)言學(xué)習(xí)規(guī)律等都具有重要意義。[1]
近些年,地方普通話的研究已然成為漢語(yǔ)研究一個(gè)新的增長(zhǎng)點(diǎn),但成果還遠(yuǎn)遠(yuǎn)不夠。我們認(rèn)為,地方普通話的研究應(yīng)該充分重視地方普通話有聲數(shù)據(jù)庫(kù)的建設(shè),它可為地方普通話的本體研究提供豐富的原始數(shù)據(jù),并實(shí)現(xiàn)地方普通話的長(zhǎng)效保存。
中國(guó)語(yǔ)言資源有聲數(shù)據(jù)庫(kù)在國(guó)家語(yǔ)委的籌劃組織下于2008年開(kāi)始建設(shè),這是國(guó)家語(yǔ)委的重大建設(shè)項(xiàng)目。該項(xiàng)目將地方普通話列為主要調(diào)研對(duì)象之一,體現(xiàn)了國(guó)家對(duì)地方普通話的重視。項(xiàng)目旨在將中國(guó)各縣域的語(yǔ)言實(shí)態(tài)記錄下來(lái),歸檔建庫(kù),永久保存,這一龐大工程目前正在各省陸續(xù)展開(kāi)。地方普通話的調(diào)查內(nèi)容是:1.用普通話講述規(guī)定故事《牛郎織女》;2.用普通話朗讀兩篇短文《誠(chéng)實(shí)與信任》與《大學(xué)生村官》。地方普通話分庫(kù)相對(duì)于重點(diǎn)建設(shè)的方言庫(kù)而言,明顯居于次要地位。方言分庫(kù)包括字庫(kù)、詞庫(kù)、句庫(kù)、話語(yǔ)庫(kù)等多個(gè)子庫(kù),地方普通話分庫(kù)則只有一個(gè)話語(yǔ)庫(kù),且所調(diào)查的內(nèi)容是限定內(nèi)容。方言庫(kù)的話語(yǔ)庫(kù)所調(diào)查的則是開(kāi)放內(nèi)容:一是任選話題進(jìn)行講述,每人共20分鐘;二是任選話題進(jìn)行對(duì)話,共20分鐘。地方普通話分庫(kù)無(wú)論在子庫(kù)種類、內(nèi)容存量上均和方言庫(kù)有明顯差異,反映出我國(guó)地方普通話有聲數(shù)據(jù)庫(kù)處于初步建設(shè)階段。
2015年,教育部和國(guó)家語(yǔ)委在國(guó)家財(cái)政的支持下,開(kāi)始實(shí)施中國(guó)語(yǔ)言資源保護(hù)工程,這是一項(xiàng)大型的語(yǔ)言文化類國(guó)家工程,計(jì)劃5年時(shí)間完成?!罢Z(yǔ)保工程”是2008年的中國(guó)語(yǔ)言資源有聲數(shù)據(jù)庫(kù)建設(shè)工作的延續(xù)、擴(kuò)充和提升。[2]然而,“語(yǔ)保工程”在地方普通話的調(diào)研上,與2018年的方案相比沒(méi)有變化,依然是整個(gè)建設(shè)工程中不被重視的部分。
遼寧普通話有聲數(shù)據(jù)庫(kù)的建庫(kù)目的有三:其一,旨在“保存”。記錄和保存地方普通話是方言保存的一種特殊形式,是對(duì)單純的方言保存工作的有機(jī)補(bǔ)充。
其二,旨在“研究”,地方普通話是方言向標(biāo)準(zhǔn)普通話過(guò)渡的一種中介語(yǔ)形式,中介語(yǔ)研究無(wú)論對(duì)于源語(yǔ)研究還是目的語(yǔ)研究均有積極意義。
其三,旨在“展示”,為其他省份的人以及遼寧地區(qū)的外國(guó)留學(xué)生了解和熟悉遼寧普通話提供有聲材料。
這一建庫(kù)目的區(qū)別于國(guó)家語(yǔ)保工程的“保存”目的,因此,遼寧普通話有聲數(shù)據(jù)庫(kù)的建庫(kù)設(shè)計(jì),將在參考國(guó)家語(yǔ)保工程的基礎(chǔ)上有些針對(duì)性的調(diào)整,主要體現(xiàn)在數(shù)據(jù)采集和數(shù)據(jù)處理兩個(gè)方面。
根據(jù)楊春宇的相關(guān)研究[3],遼寧境內(nèi)方言可分為五個(gè)片區(qū):朝峰片、遼西片、遼東片、蓋桓片和登連片。片區(qū)內(nèi)每個(gè)市、縣設(shè)立一個(gè)調(diào)查點(diǎn)。
片區(qū)朝峰片遼西片確定標(biāo)準(zhǔn)中古疑母、影母字是否與泥母相混,是否帶鼻化音中古精組字與知莊章組字是否相混、莊組字是否多于普通話遼東片中古精組字與知莊章組字是否相混、精組字是否多于普通話蓋桓片包含的市縣凌源市、建平縣、喀左縣、朝陽(yáng)縣、朝陽(yáng)市、北票市建昌縣、綏中縣、興城市、葫蘆島市、錦州市、凌海市;義縣、北寧市、黑山縣、阜新市、阜新縣、彰武縣、臺(tái)安縣、盤(pán)山縣、盤(pán)錦市、大洼縣康平縣、法庫(kù)縣、昌圖縣、開(kāi)原市、調(diào)兵山市、鐵嶺縣、鐵嶺市、西豐縣、沈陽(yáng)市、遼中縣、新民市;遼陽(yáng)市、燈塔市、遼陽(yáng)縣、鞍山市、海城市、撫順市、撫順縣、清原縣、新賓縣、本溪市、本溪縣、鳳城市營(yíng)口市、大石橋市、蓋州市、岫巖縣、桓仁縣、丹東市、東港市登連片調(diào)類多少與平聲調(diào)值的實(shí)際讀音,古清入聲母的今讀上聲,日母的有無(wú)等調(diào)類的多少與平聲調(diào)值的實(shí)際讀音,古清入聲母的今讀上聲,日母的有無(wú)等大連市、長(zhǎng)??h、寬甸縣、瓦房店市、普蘭店市、莊河市
每個(gè)調(diào)查點(diǎn)選擇2名地方普通話發(fā)音人,2名發(fā)音人的普通話水平均為二乙(即80-86.9)。不選擇普通話水平為二甲的發(fā)音人,二甲等級(jí)的普通話是比較標(biāo)準(zhǔn)的普通話,已經(jīng)不適宜看成方言向普通話的過(guò)渡態(tài)了。也不選擇普通話水平在二乙以下的發(fā)音人,主要考慮有二:一是因?yàn)閲?guó)家語(yǔ)保工程對(duì)這部分地方普通話發(fā)音人進(jìn)行了調(diào)查,國(guó)家語(yǔ)保工程在每個(gè)調(diào)查點(diǎn)選擇3名地方普通話發(fā)音人,1名發(fā)音人的普通話水平是三甲,另2名發(fā)音人的普通話水平不入級(jí)。選擇普通話水平是二乙的發(fā)音人,正好構(gòu)成對(duì)國(guó)家語(yǔ)保工程調(diào)研的有機(jī)補(bǔ)充。二是遼寧地區(qū)的方言主要是北方方言、東北方言和膠遼官話,和普通話的差異并不顯著,換句話說(shuō),遼寧人的整體普通話水平高于全國(guó)平均水平。因此,我們對(duì)遼寧普通話發(fā)音人的普通話水平的擇定等級(jí)略高于國(guó)家統(tǒng)一標(biāo)準(zhǔn)。
1.概況:包括調(diào)查點(diǎn)概況、發(fā)音人情況、調(diào)查人情況、調(diào)查情況。
2.語(yǔ)音:發(fā)音人念讀《中國(guó)語(yǔ)言資源調(diào)查手冊(cè)·漢語(yǔ)方言》[4]調(diào)查表中針對(duì)音系調(diào)查的字,調(diào)查人描寫(xiě)記錄,整理出地方普通話的聲韻調(diào)系統(tǒng)。
3.字:發(fā)音人念讀調(diào)查表中的1000個(gè)單字。
4.詞匯:發(fā)音人念讀調(diào)查表中的1200個(gè)詞匯。
5.朗讀:發(fā)音人朗讀短文《誠(chéng)實(shí)與信任》和《大學(xué)生村官》。
6.講述:
(1)發(fā)音人講述規(guī)定故事《牛郎織女》。發(fā)音人提前熟悉故事內(nèi)容,用普通話把故事的意思自然地講述出來(lái),內(nèi)容可發(fā)揮,篇幅可加長(zhǎng)。講述時(shí)不允許看文本。
(2)發(fā)音人從給定的7個(gè)話題(當(dāng)?shù)厍闆r、風(fēng)俗習(xí)慣、傳統(tǒng)節(jié)日、個(gè)人經(jīng)歷、工作情況、業(yè)余愛(ài)好、家庭情況)當(dāng)中選擇某幾個(gè)話題進(jìn)行講述。發(fā)音人提前熟悉講述的話題,用普通話自然地講述,越具體越詳細(xì)越好,不少于20分鐘。
(3)對(duì)話。2位發(fā)音人自由對(duì)話,不少于20分鐘。
采用“音像圖文”四位一體的調(diào)查方法。
1.錄音
(1)場(chǎng)所:安靜的房間,語(yǔ)音數(shù)據(jù)信噪在-48d b以下。
(2)器材:運(yùn)行噪音低的電腦,例如聯(lián)想Think-PadX、T系列(2G以上內(nèi)存,USB2.0以上接口,Windows XP、Windows7或Windows8操作系統(tǒng))。使用SAMSON C03U話筒(心形指向、全指向可調(diào),話筒內(nèi)帶聲卡)和奧創(chuàng)Alctron MA016防噴罩。
(3)錄音軟件:使用byly(北語(yǔ)錄音)或YBSL(語(yǔ)保攝錄機(jī)),YBSL可設(shè)置為僅錄音。這兩款軟件可對(duì)調(diào)查條目逐條錄音,錄音時(shí)同步顯示波形,自動(dòng)逐條保存并命名錄音文件。語(yǔ)保攝錄機(jī)還具備自動(dòng)錄音、語(yǔ)音質(zhì)量檢測(cè)、信息標(biāo)記、圖片關(guān)聯(lián)等功能。
(4)錄音參數(shù):?jiǎn)温暤?;采樣率?4100HZ;采樣精度為16bit;音頻格式為windows PCM(.WAV)。byly和YBSL已設(shè)置以上參數(shù)為默認(rèn)值。
2.攝像
(1)器材:使用索尼、佳能、松下等一線品牌的全高清數(shù)碼攝像機(jī),配套有線或無(wú)線話筒及三腳架。使用一線品牌計(jì)算機(jī),例如聯(lián)想(含Thinkpad和Lenovo)、戴爾(Dell)等,配置酷睿i7以上的非低電壓版CPU,DDR3 4G以上內(nèi)存,轉(zhuǎn)速7200轉(zhuǎn)以上硬盤(pán)(最好是固態(tài)硬盤(pán)),USB接口不少于3個(gè)。
(2)攝像要求:鏡頭對(duì)準(zhǔn)發(fā)音人的上半身,話筒放在發(fā)音人前方的適當(dāng)位置或夾在領(lǐng)口。盡量用最遠(yuǎn)拍攝模式拍攝,不使用變焦(拉近放大)功能。如果必須變焦,只能使用光學(xué)變焦,不能使用數(shù)碼變焦。發(fā)音人的背景應(yīng)整齊干凈平整,顏色不要太暗,使用純藍(lán)色背景。背景布上不要有明顯的陰影。發(fā)音人的臉部正對(duì)鏡頭,不要背光,臉部不要有陰影。
(3)攝像方式:使用YBSL。YBSL具備錄音和視頻同步采集功能,能按條目對(duì)錄音和視頻文件進(jìn)行自動(dòng)切分、命名和存儲(chǔ)。
(4)視頻文件:一律選擇攝像機(jī)的最高畫(huà)質(zhì)、采用全高清模式拍攝,視頻文件參數(shù)不低于1920×1080/50i(或 25p)/15000kbps。格式視攝像設(shè)備而定,例如:m2ts,mpg。
3.照相
(1)照相內(nèi)容:包括發(fā)音人像、調(diào)查工作場(chǎng)景和具有地方特色的事物和現(xiàn)象。
(2)照相器材:最好使用佳能、尼康等一線品牌1200萬(wàn)以上像素的數(shù)碼單反相機(jī)。
(3)照片文件:選擇相機(jī)的最高畫(huà)質(zhì)模式(最高分辨率和精細(xì)度)拍照,采用*jpg格式,分辨率最好不低于4368×2912像素。
音頻處理主要包括噪音消除和語(yǔ)音切分兩個(gè)環(huán)節(jié)。為使原始聲音干凈、清晰,需要進(jìn)行降噪處理,降噪處理可利用音頻處理軟件Audacity來(lái)實(shí)現(xiàn)。語(yǔ)音切分主要是針對(duì)話題講述和自由對(duì)話的音頻而言的,我們擬將這類話語(yǔ)切分為小句,每個(gè)小句對(duì)應(yīng)一段音頻,音頻按一定的序列排列,這可為遼寧普通話的觀測(cè)及語(yǔ)言研究帶來(lái)極大的便利。切音工作可由機(jī)器進(jìn)行,人工校正。我們經(jīng)過(guò)前期的尋找、對(duì)比、測(cè)試,發(fā)現(xiàn)軟件Aboboo有著強(qiáng)大的音頻自動(dòng)分句的功能,在錄音效果較好的情況下,初次斷句的準(zhǔn)確率不低于人工。
話題講述和自由對(duì)話的語(yǔ)音數(shù)據(jù)均需轉(zhuǎn)寫(xiě)為文字。軟件Aboboo雖有強(qiáng)大的切音能力,卻不具備轉(zhuǎn)寫(xiě)功能。我們對(duì)包括訊飛公司在內(nèi)的一些國(guó)內(nèi)生產(chǎn)的自動(dòng)語(yǔ)音轉(zhuǎn)寫(xiě)工具進(jìn)行了測(cè)試,發(fā)現(xiàn)機(jī)器對(duì)語(yǔ)音的識(shí)別轉(zhuǎn)寫(xiě)率隨著發(fā)音人口音的加重而大幅降低,本項(xiàng)目的輸入語(yǔ)言是帶口音的非標(biāo)準(zhǔn)普通話,機(jī)器僅能起到有限的輔助作用,主要還是依靠人工來(lái)完成語(yǔ)音轉(zhuǎn)寫(xiě)。
本項(xiàng)目擬建的遼寧普通話有聲數(shù)據(jù)庫(kù)將建設(shè)為向公眾開(kāi)放的數(shù)據(jù)庫(kù)。項(xiàng)目組會(huì)對(duì)相關(guān)語(yǔ)言材料進(jìn)行后期整理,包括規(guī)范文件名、文件歸檔、校對(duì)等。然后購(gòu)買域名和服務(wù)器,前端設(shè)計(jì)網(wǎng)頁(yè),后端接數(shù)據(jù)庫(kù)。最后內(nèi)部運(yùn)行測(cè)試,合格穩(wěn)定后向公眾開(kāi)放使用。
沈陽(yáng)師范大學(xué)學(xué)報(bào)(教育科學(xué)版)2019年3期