孟和吉雅,山 丹
(1.內(nèi)蒙古大學(xué) 計算機(jī)學(xué)院,內(nèi)蒙古 呼和浩特 010020;2. 內(nèi)蒙古社會科學(xué)院,內(nèi)蒙古 呼和浩特 010020)
蒙古語是中國蒙古族自治地方的通用語言之一。在上世紀(jì)70、80年代開始研究蒙古文信息處理時,主要是從文字處理開始的,而且制定的蒙古文編碼也是表現(xiàn)“字型”為主。經(jīng)過幾十年的發(fā)展,蒙古文信息處理研究已經(jīng)不僅僅局限于文字處理方面,在語音合成、語音識別、文字識別等也有了一定成果。雖然蒙古文Unicode編碼已經(jīng)在2000年公布,定義了名義字符編碼和變形顯現(xiàn)字符最小集[1],但是以前的很多文字資料還是用舊的編碼存儲,而且大多數(shù)人還在使用字型為主的舊的輸入法和編碼。如: 蒙科立、智能、方正、明安圖、賽音等編碼。
在《大綱》中要求的單詞按照音節(jié)數(shù)量來分類,篩選和檢索時,需要做對蒙古文單詞分音節(jié),并統(tǒng)計音節(jié)個數(shù)。所以在拉丁轉(zhuǎn)寫的基礎(chǔ)上又做了分音節(jié)和統(tǒng)計音節(jié)個數(shù)的工作。
選擇 “拉丁轉(zhuǎn)寫”和“分音節(jié)”方法的主要原因是考慮了我們的工作需要和程序里實現(xiàn)的簡單和準(zhǔn)確。原因如下:
我們根據(jù)《蒙古文編碼鍵盤布局》,又考慮校對和編程的方便,自己制定了一種蒙古文單詞拉丁轉(zhuǎn)寫規(guī)則,如表1所示。
表1 拉丁轉(zhuǎn)寫規(guī)則——蒙古文字母與拉丁轉(zhuǎn)寫對應(yīng)表
續(xù)表
表2 元音“”的各種字型拉丁轉(zhuǎn)寫表(蒙科立編碼)
//轉(zhuǎn)換編碼
function TFormZhuan.Convert(temp_str:WideString):WideString;
var
mid_str:WideString; WS:WideString; i,j:integer; WC: WideChar; Code: Word;
begin
mid_str:=′′; i:=1;
while i<=length(temp_str) do
begin
for j:=1 to array_len do
begin
WS:=MidStr(temp_str,i,1);
WC:=WS[1]; Move(WC, Code, SizeOf(WC));
if latin[j,0]=IntToHex(Code,2) then
begin mid_str:=mid_str+latin[j,1]; break; end;
end;
i:=i+1;
end;
Convert:=mid_str;
end;
轉(zhuǎn)換程序界面如圖1所示。
圖1 拉丁轉(zhuǎn)寫轉(zhuǎn)換程序界面
分音節(jié)算法的基本思路是根據(jù)蒙古文的以“元音為中心”組成音節(jié)的規(guī)律,按照音節(jié)類型去分音節(jié)。在算法中涉及到的蒙古文音節(jié)類型有(v: 表示元音;c: 表示輔音): v,vv,vvc,vc,vcc,cv,cvv,cvc,cvcc[2,4]。分音節(jié)的判斷條件見表3。分音節(jié)程序界面如圖2所示。
表3 音節(jié)類型及分音節(jié)判斷條件
續(xù)表
圖2 單詞分音節(jié)程序界面
本論文中主要討論了在有關(guān)蒙古文標(biāo)準(zhǔn)音測試方面的研究工作中對蒙古文單詞進(jìn)行拉丁轉(zhuǎn)寫轉(zhuǎn)換和分音節(jié)的原因以及實現(xiàn)方法。這里采用的拉丁轉(zhuǎn)寫規(guī)則和分音節(jié)條件的正確性在我們用蒙科立輸入法和編碼錄入的7 200多個單詞上得到了驗證。由于對蒙科立蒙古文編碼了解的局限性和做實驗的蒙古文單詞的局限性,可能存在遺漏,有待進(jìn)一步完善。
[1] 確精扎布. 蒙古文編碼[M]. 呼和浩特:內(nèi)蒙古大學(xué)出版社, 2000.
[2] 青格爾泰. 蒙古語語法[M]. 呼和浩特:內(nèi)蒙古人民出版社,1999.
[3] 蒙古語標(biāo)準(zhǔn)音水平測試大綱編寫組.蒙古語標(biāo)準(zhǔn)音水平測試大綱[M].呼和浩特:內(nèi)蒙古人民出版社,2003.
[4] 呼和,確精扎布. 蒙古語語音聲學(xué)分析[M].呼和浩特:內(nèi)蒙古大學(xué)大學(xué)出版社,1999.
[5] 湘滬科技. Delphi類庫查詢辭典[M]. 北京:中國鐵道出版社, 2004.
[6] Liscbner,里希納,朱騰輝,肖雪蓮. Delphi技術(shù)手冊[M]. 北京:中國電力出版社, 2001.