張利峰
摘 要 目前蒙語授課學(xué)生的英語教學(xué)主要包括學(xué)前、小學(xué)、中學(xué)和大學(xué)等階段。在學(xué)前和小學(xué)階段的課外輔導(dǎo)主要靠家長和老師,而到了中學(xué)和大學(xué)后主要靠學(xué)生本人的自學(xué)能力。而無論是家長、老師或?qū)W生在輔導(dǎo)和學(xué)習(xí)過程中都會(huì)遇到生詞或找不到某些多意詞在句子中的確定含義,而此時(shí)查找詞典很難準(zhǔn)確判斷其含義的,因?yàn)槌鯇W(xué)者很難把握某些單詞在句中的準(zhǔn)確含義。另外,在進(jìn)行例句翻譯時(shí)也會(huì)遇到使用哪個(gè)單詞更為準(zhǔn)確,而不會(huì)超出大綱。因此,基于蒙英機(jī)器翻譯工具的蒙英雙語語料庫的建設(shè)尤為重要,本文主要闡述了蒙英雙語語料庫的設(shè)計(jì)與實(shí)現(xiàn)。
【關(guān)鍵詞】蒙英翻譯 雙語語料庫
1 軟件平臺(tái)的搭建
1.1 操作系統(tǒng)
蒙英雙語語料庫(以下稱語料庫)的設(shè)計(jì)與制作可在WindowsXP操作系統(tǒng)或Linix操作系統(tǒng)下進(jìn)行。本設(shè)計(jì)是在WindowsXP操作系統(tǒng)下完成的,因?yàn)椋?/p>
(1)WindowsXP操作系統(tǒng)使用廣泛、通用性強(qiáng),操作簡練,功能完善強(qiáng)大;
(2)WindowsXP操作系統(tǒng)兼容性強(qiáng),支持多種應(yīng)用軟件,并且大多數(shù)蒙古文軟件、系統(tǒng)、輸入法是在WindowsXP操作系統(tǒng)下開發(fā)的。
1.2 應(yīng)用軟件
制作語料庫的應(yīng)用軟件使用了微軟公司Office2003系統(tǒng)中的Excel和蒙科立軟件公司開發(fā)的Mensoft Mongolian IME2012蒙古文輸入法。語料庫也可用TXT文本或其它類型的數(shù)據(jù)庫(Acesse、VFoxPro、SQLSever等)完成。
使用OfficeExcel設(shè)計(jì)制作雙語語料庫的原因是:
(1)Excel具有強(qiáng)大的編輯計(jì)算功能,操作易于掌握,并且使用廣泛,兼容性強(qiáng)。
(2)適用于簡單的數(shù)據(jù)格式設(shè)計(jì),且本翻譯系統(tǒng)無需設(shè)定復(fù)雜的數(shù)據(jù)完整性,安全性與約束性。
采用Mensoft Mongolian IME2012蒙古文輸入法輸入蒙古文的原因是:
(1)支持國際通用編碼;
(2)將多種文字集成為一體(包括傳統(tǒng)蒙古文,回鶻蒙古文,滿文等)為一體的音碼智能輸入法,具有較強(qiáng)的集成編碼轉(zhuǎn)換工具;
(3)鍵盤布局實(shí)現(xiàn)了字母拼寫一音一鍵的計(jì)算機(jī)輸入目標(biāo);
(4)解決了有些蒙古文字用語言拼寫方法編碼的難題,如一字多型,多字同型文字的編碼等;
(5)輸入法具有較強(qiáng)的智能性,大大的提高了輸入速度,并且支持在蒙古文輸入法狀態(tài)下回車輸入英文;
(6)將字體清晰度做了進(jìn)一步改進(jìn),并且在舊版本(2008版)的基礎(chǔ)上擴(kuò)大了字體庫。
1.3 MensoftIME2012蒙古文輸入法與蒙古字體
蒙古文輸入法的安裝:
第一步:雙擊執(zhí)行安裝包MensoftIME2012(可從網(wǎng)上免費(fèi)下載),出現(xiàn)安裝首頁界面。
第二步:點(diǎn)擊“”按鈕這時(shí)會(huì)彈出許可協(xié)議窗口。
第三步:認(rèn)真閱讀完協(xié)議后,選擇“”項(xiàng)表示同意協(xié)議,之后點(diǎn)擊界面上的“”按鈕繼續(xù)安裝會(huì)彈出安裝窗口。
第四步:點(diǎn)擊“”按鈕會(huì)繼續(xù)安裝,將出現(xiàn)安裝結(jié)束窗口。
第五步:點(diǎn)擊“”按鈕將會(huì)完成安裝過程,點(diǎn)擊任務(wù)欄中的輸入法欄將會(huì)看到Mensoft Mongolian IME2012蒙古文輸入法。
第六步:第一次啟動(dòng)輸入法時(shí),系統(tǒng)將會(huì)自動(dòng)彈出注冊(cè)界面。通過界面上的聯(lián)系方式獲得注冊(cè)碼,輸入注冊(cè)碼單擊“確定注冊(cè)”按鈕后便可正常使用輸入法。
2 蒙古文輸入法的使用
2.1 鍵盤布局
Mensoft Mongolian IME2012蒙古文輸入法的鍵位布局合理、易于掌握,其字母、符號(hào)布局如圖1所示。
2.2 蒙古文字的拼寫輸入
(1)蒙古文的基本輸入規(guī)則。由于蒙古文字中的部分發(fā)音與漢語拼音、英文字母的發(fā)音一樣或者相似相近,所以設(shè)計(jì)鍵盤布局時(shí)將發(fā)音相似或相近的字母放在了相應(yīng)的鍵位上,例如:(發(fā)音為“和”)在“h”鍵上;(發(fā)音為“啊”)在“a”。有些特殊的蒙古文字母根據(jù)其使用頻率放在了相應(yīng)的鍵位上,例如:在“c”鍵上;在“v”鍵上;多變體附加成(Tinyilgal,為介詞)放在數(shù)字鍵上,例如:在“1”鍵上選2,如圖2所示。
例:輸入,首先輸入的編碼“abv”將會(huì)出現(xiàn)如圖界面,選“1”或按空格鍵輸入后系統(tǒng)將會(huì)智能自動(dòng)的彈出介詞的輸入界面,如圖所示,選“1”或按空格鍵輸入,之后再輸入編碼“haira”選“1”或按空格鍵可輸入,如圖2所示。
(2)高效輸入規(guī)則。高效輸入的規(guī)則是只輸入文字每個(gè)音節(jié)的首字母,省略其余字母的輸入。
例如:的輸入,可編碼為“abn”,如圖所示。但存在排位靠后或不在本候選頁需翻頁的問題,這時(shí)可補(bǔ)充編碼“a”,既輸入“abna”時(shí)的排位可為第一,如圖3所示。
(3)英文的快速輸入。由于Mensoft Mongolian IME2012蒙古文輸入法支持在蒙古文輸入法狀態(tài)下回車輸入英文,所以不需要頻繁的進(jìn)行輸入法的切換,可以直接在蒙文輸入法的平臺(tái)下輸入英文。
(4)一字多型文字與多字同型文字的輸入。
2.3 字體的使用
字體Mensoft 是Mensoft Mongolian IME2012蒙古文輸入法的攜帶字體,使用時(shí)從字體庫中選擇即可,
2.3.1 雙語語料庫的格式設(shè)計(jì)
語料庫的數(shù)據(jù)格式設(shè)計(jì)較為簡單,無需定義復(fù)雜的數(shù)據(jù)字段以及數(shù)據(jù)的約束、安全性與完整性,只需定義相互對(duì)齊的英語句子字段和蒙古語句子字段即可。如圖4所示。
2.3.2 單詞、短語和句子的輸入整理
由于本翻譯系統(tǒng)采用的翻譯規(guī)則是基于統(tǒng)計(jì)的翻譯模型,所以在整理語料輸入時(shí)遵循以下原則:
(1)覆蓋面要全面,避免遺漏語料;
(2)無需單獨(dú)輸入單詞與短語,只輸入所有句子,句子中應(yīng)包含所有單詞與短語;
(3)沒有在句子中出現(xiàn)的單詞與短語需單獨(dú)列出輸入;
(4)輸入在教材中出現(xiàn),但不屬教學(xué)內(nèi)容的語料,如:Read aloud,Look and tick,Listen and colour等。
參考文獻(xiàn)
[1]趙鐵軍.機(jī)器翻譯原理[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2000.
[2]姚天順.自然語言理解[M].北京:清華大學(xué)出版社,1998.
[3]清格爾泰.現(xiàn)代蒙古語語法[M].呼和浩特:內(nèi)蒙古人民出版社,1992.
[4]馮志偉.自然語言機(jī)器翻譯新論[M].北京:語文出版社,1994.
[5]敖其爾.從英文到蒙文的機(jī)器翻譯[J].內(nèi)蒙古大學(xué)學(xué)報(bào)(哲學(xué)版),1988(03):39-50.
[6]力提甫·托乎提.維吾爾語及其他阿爾泰語言的生成句法研究[M].北京:民族出版社,2001.
作者單位
內(nèi)蒙古師范大學(xué)青年政治學(xué)院 內(nèi)蒙古自治區(qū)呼和浩特市 010051