林睿睿,黃錦橋
(陜西科技大學(xué)鎬京學(xué)院,陜西 西安712046)
到目前為止,全世界共有200多個國家和地區(qū),共有80余種民族語言,其中漢語、英語、俄語、法語、西班牙語是較為常用的語言[1]。語言是國與國之間、人與人之間交流的媒介和工具,一旦語言不通,就無法進(jìn)行進(jìn)一步的交流和合作。再加上,互聯(lián)網(wǎng)和信息技術(shù)的發(fā)展,依靠專業(yè)的翻譯人才進(jìn)行轉(zhuǎn)譯已經(jīng)無法滿足交流的實(shí)時性需要,因此在線翻譯輔助系統(tǒng)開始出現(xiàn)并被廣泛應(yīng)用。
在線翻譯系統(tǒng),也被稱為機(jī)器翻譯系統(tǒng)、自動翻譯系統(tǒng)。目前,在很多文獻(xiàn)中都將在線翻譯作為研究課題。文獻(xiàn)[2]基于實(shí)例設(shè)計(jì)了一種機(jī)器翻譯系統(tǒng),通過對比翻譯對象與現(xiàn)有實(shí)例庫內(nèi)容之間的相似度進(jìn)行參考翻譯;文獻(xiàn)[1]設(shè)計(jì)了基于多語言交互的英語翻譯在線輔助系統(tǒng),提高了多種語言翻譯成功率。文獻(xiàn)[3]設(shè)計(jì)了基于人機(jī)交互的網(wǎng)絡(luò)化智能翻譯系統(tǒng)。在該系統(tǒng)中采用主題詞特征匹配方法實(shí)現(xiàn)網(wǎng)絡(luò)化智能翻譯,提高了翻譯的智能性。
雖然現(xiàn)有的翻譯系統(tǒng)有很多,但是交互性并不是很好,存在一定的滯后性和錯誤性,尤其用于不同語言口語交流時,語言組織更為隨性,導(dǎo)致翻譯系統(tǒng)并不能很好地理解其中的含義,從而需要時間進(jìn)行語義分析,然后才能進(jìn)行翻譯,有時甚至因?yàn)檎Z義理解錯誤而導(dǎo)致翻譯錯誤。
針對上述問題,本文設(shè)計(jì)一種基于B/S(Browser/Server)框架的交互式在線翻譯系統(tǒng),該系統(tǒng)設(shè)計(jì)分為框架設(shè)計(jì)、硬件設(shè)計(jì)、軟件設(shè)計(jì)以及系統(tǒng)測試等四部分。最后經(jīng)測試,證明了所設(shè)計(jì)系統(tǒng)的翻譯準(zhǔn)確性和及時性,提高了交互體驗(yàn),為人與人之間的交流提供有效的媒介,促進(jìn)了國家之間的合作與發(fā)展。
語言的不同是阻擋人與人之間交流的主要障礙,但隨著經(jīng)濟(jì)全球化的發(fā)展,各國之間的聯(lián)系逐漸加強(qiáng),這種障礙必須打破[4]。在此背景下,各種輔助型的自動翻譯系統(tǒng)被設(shè)計(jì)出來,并被廣泛應(yīng)用在社交場合。由于自動翻譯系統(tǒng)是通過計(jì)算機(jī)進(jìn)行翻譯的,不同于人一樣具有靈活性,因此翻譯的內(nèi)容經(jīng)常出現(xiàn)錯誤,尤其是人與人之間通過口語交流時,這給翻譯系統(tǒng)又增加了語音識別和語義分析兩個方面上的障礙,更影響了機(jī)器翻譯系統(tǒng)的翻譯效果[5]。為了提高系統(tǒng)的交互性能,準(zhǔn)確且及時地進(jìn)行不同語言之間的交流,設(shè)計(jì)一種有效的在線翻譯系統(tǒng)迫在眉睫。在前人研究經(jīng)驗(yàn)的基礎(chǔ)上,本文以B/S三層架構(gòu)為系統(tǒng)框架,設(shè)計(jì)了一種交互式在線翻譯系統(tǒng)。
系統(tǒng)框架是系統(tǒng)設(shè)計(jì)的基本組成結(jié)構(gòu),在系統(tǒng)設(shè)計(jì)中起到指導(dǎo)思路的作用。本次設(shè)計(jì)的交互式在線翻譯系統(tǒng)框架是基于B/S架構(gòu)設(shè)計(jì)的。B/S架構(gòu)是一種三層架構(gòu),由數(shù)據(jù)邏輯層、業(yè)務(wù)邏輯層和顯示邏輯層組成,如圖1所示[6]。
圖1 B/S三層架構(gòu)圖
數(shù)據(jù)邏輯層:整個系統(tǒng)的最下層,主要用于儲存數(shù)據(jù)和各種業(yè)務(wù)程序[7]。在本系統(tǒng)中,主要存儲各個語言信息和各種翻譯程序。
業(yè)務(wù)邏輯層:整個系統(tǒng)的中間層也是核心層,主要作用是處理用戶請求,對數(shù)據(jù)層進(jìn)行操作、運(yùn)行各種業(yè)務(wù)流程,得出翻譯結(jié)果。
顯示邏輯層:整個架構(gòu)的最上層,主要作用是實(shí)現(xiàn)人機(jī)交互,也就是將翻譯成果反饋給用戶,或者是用戶輸入操作指令,控制系統(tǒng)運(yùn)行等[8]。
本系統(tǒng)硬件大致可以分為三部分,即源語言采集處理部分、語言翻譯部分以及目標(biāo)語言輸出部分。
1.2.1 源語言采集處理硬件
源語言采集處理部分的關(guān)鍵硬件有兩個,即話筒、語音信號處理器。
1)話筒主要作用是采集用戶發(fā)出的源語言。話筒直接關(guān)系到采集的語音信號質(zhì)量,進(jìn)而影響翻譯是否準(zhǔn)確,為此本系統(tǒng)選擇一個具有高錄入性且便于隨身攜帶的SHUREMV7話筒[9]。其具體性能如下:
將拾音頭、拾音模式和減震架巧妙組合,讓語音始終干凈清晰,阻隔任何多余的噪聲干擾,即便在嘈雜的環(huán)境中,也能拾取干凈的聲音。
同時兼?zhèn)銾SB和XLR輸出接口,可配合電腦和專業(yè)音頻接口使用。
設(shè)置觸摸屏,可直觀觀察到話筒是否正在工作,并可快速滑動調(diào)整話筒增益、耳機(jī)音量、監(jiān)聽混音、話筒靜音、鎖定功能等。
2)語音信號處理器的作用是對采集到的源語音進(jìn)行處理和識別。該處理器集濾波、放大、轉(zhuǎn)換、識別等功能為一體。本系統(tǒng)中的語音信號處理器為WT7010,其內(nèi)建8 bit DSP核心,能提供高分辨率ADC模擬采樣和高質(zhì)量的差分音頻輸入[10]。
1.2.2 語言翻譯處理設(shè)備
用于語言翻譯處理的設(shè)備是一臺單片機(jī)。由運(yùn)算器、控制器、存儲器、輸入輸出設(shè)備等一系列硬件組件構(gòu)成,相當(dāng)于一個微型的計(jì)算機(jī)。本系統(tǒng)當(dāng)中的單片機(jī)為ATmega6490單片機(jī),該單片機(jī)實(shí)現(xiàn)了接近1 MIPS/MHz的吞吐量,平衡了功耗和處理速度,因此高性能、低功耗是其最大的優(yōu)勢[11]。ATmega6490單片機(jī)技術(shù)參數(shù)如表1所示。
1.2.3 目標(biāo)語言輸出設(shè)備
目標(biāo)語言輸出設(shè)備是系統(tǒng)末端硬件,主要作用是將翻譯結(jié)果反饋給用戶,其中包括語音合成芯片、功率放大芯片、驅(qū)動揚(yáng)聲器、液晶觸摸顯示器等四部分。下面進(jìn)行具體分析[12]。
1)語音合成芯片
語音合成芯片的作用是實(shí)現(xiàn)文本到語音的轉(zhuǎn)換,然后驅(qū)動揚(yáng)聲器發(fā)聲[13]。本系統(tǒng)當(dāng)中的語音合成芯片為SYN6658。
表1 ATmega6490單片機(jī)技術(shù)參數(shù)
SYN6658優(yōu)點(diǎn)如下:采用高效的壓縮編碼方式,合成音頻的音質(zhì)完美;采用智能的文本韻律處理方法,文本朗讀順暢;支持G82312、GBK、BIG5、UNICODE四種編碼方式的文本;支持多種文本控制標(biāo)記,具有智能文本分析處理算法。
2)功率放大芯片
功率放大芯片的作用是將輸入的較微弱信號進(jìn)行放大,提高后期揚(yáng)聲器聲音播放質(zhì)量。本系統(tǒng)當(dāng)中的功率放大芯片為LM1875,具有低失真、工作穩(wěn)定可靠、外圍電路元件少、電流負(fù)載能力大等特點(diǎn)[14]。
3)揚(yáng)聲器
揚(yáng)聲器的作用是播放翻譯出來的目標(biāo)語言。本系統(tǒng)當(dāng)中的揚(yáng)聲器為A500,其特點(diǎn)如下:內(nèi)置兩顆單獨(dú)通道功放減少底噪,使擴(kuò)音效果更加清晰,聲音還原真實(shí)、不刺耳;內(nèi)置1 500 mA·h大容量電池,可連續(xù)工作10 h;90°×60°(可旋轉(zhuǎn)號角)覆蓋角度,使得周圍的人都能接收到聲音。
4)液晶觸摸顯示器
液晶觸摸顯示器的作用是顯示翻譯處理結(jié)果。本系統(tǒng)當(dāng)中的液晶觸摸顯示器為M1502E,其特征如下:分辨率為4 096×4 096;反應(yīng)時間<5 ms;表面硬度為3 H;點(diǎn)擊壽命為250 g粒度,3 500萬次;筆劃壽命為250 g粒度,500萬次;透光率81以上;工作溫度為-20~70℃。
系統(tǒng)軟件是系統(tǒng)的邏輯運(yùn)行程序,包括系統(tǒng)處理事務(wù)的各種功能模塊。整個交互式在線翻譯運(yùn)行程序主要分為三部分,即源語言采集處理子程序、目標(biāo)語言翻譯子程序、目標(biāo)語言反饋?zhàn)映绦?。下面對上述三個子程序進(jìn)行具體分析[15]。
1.3.1 源語言采集處理子程序
源語言采集處理子程序是整個系統(tǒng)最開始運(yùn)行的子程序,主要包括采集、放大、濾波、轉(zhuǎn)換、特征參數(shù)提取、識別等環(huán)節(jié),具體過程如圖2所示。
圖2 源語言采集處理子程序
1.3.2 目標(biāo)語言翻譯子程序
目標(biāo)語言翻譯子程序是系統(tǒng)運(yùn)行的核心,其任務(wù)是將采集到的源語言翻譯成目標(biāo)語言,具體過程如圖3所示。
1.3.3 目標(biāo)語言反饋?zhàn)映绦?/p>
目標(biāo)語言反饋?zhàn)映绦蚴窍到y(tǒng)的最后一個運(yùn)行環(huán)節(jié),主要任務(wù)是將翻譯過來的目標(biāo)語言以語音的形式反饋給用戶。這一過程具體輸入目標(biāo)語言文本,其次按照從詞典中選擇的語言規(guī)則自動地將目標(biāo)語言文本轉(zhuǎn)換成連續(xù)的語音聲波,接著對合成語音中的韻律進(jìn)行調(diào)整,按照語序連接規(guī)則把這些波形拼接起來,使之成為連續(xù)語音,最后利用揚(yáng)聲器進(jìn)行播放,完成用戶之間的語言交互[16]。
為測試設(shè)計(jì)系統(tǒng)的翻譯性能,以引言中前人研究設(shè)計(jì)的三種翻譯系統(tǒng)進(jìn)行對比,并進(jìn)行仿真測試,以便在測試過程中發(fā)現(xiàn)系統(tǒng)設(shè)計(jì)中存在的漏洞,進(jìn)行改進(jìn)和優(yōu)化。
圖3 目標(biāo)語言翻譯子程序
所設(shè)計(jì)的基于B/S框架的交互式在線翻譯系統(tǒng)需要處理龐大的語料,故需要足夠的軟件環(huán)境和硬件配置提供運(yùn)算能力,本系統(tǒng)的環(huán)境配置如表2所示。
表2 系統(tǒng)運(yùn)行環(huán)境
實(shí)驗(yàn)采用的測試樣本共有三篇,分別為漢語、英語、法語對話,其樣本內(nèi)容如圖4~圖6所示。
圖4 中文樣本
將三種樣本語言相互翻譯為另外兩種語言,也就是翻譯成漢英、漢法、英漢、英法、法漢和法英等六種源語言——目標(biāo)語言測試樣本。
圖5 英文樣本
圖6 法語樣本
1)BLEU
通過BLEU(Bilingual Evaluation Understudy)能夠算出比較譯文和參考譯文之間n組詞相似的占比,取值范圍在[0.0,1.0]之間,如果兩個句子完美匹配,那么BLEU是1.0,反之,如果兩個句子不匹配,那么BLEU為0.0。由此可知,越接近1.0,翻譯質(zhì)量越高,交互越準(zhǔn)確。
2)在線翻譯速度
在線翻譯速度是用來評估系統(tǒng)翻譯一篇文章的快慢,速度越快,交互越及時。
系統(tǒng)翻譯性能測試結(jié)果見表3,表4。
表3 BLEU指標(biāo)測試結(jié)果
表4 在線翻譯速度指標(biāo)測試結(jié)果 b/s
從表3和表4中可以看出,利用不同系統(tǒng)對三種測試樣本進(jìn)行翻譯,得出本文系統(tǒng)的BLEU指標(biāo)值更大,翻譯速度更快,解決了當(dāng)前翻譯系統(tǒng)翻譯滯后性和錯誤性問題,提高了與用戶之間的交互性。
綜上所述,隨著世界各國之間的聯(lián)系不斷加強(qiáng),語言系統(tǒng)不同成為各國之間交流的主要障礙,為此,研究一種基于B/S框架的交互式在線翻譯系統(tǒng)?;贐/S框架的邏輯層完成硬件、軟件的設(shè)計(jì),通過實(shí)驗(yàn)證明該系統(tǒng)能夠?qū)崿F(xiàn)多種語言之間快速且準(zhǔn)確的翻譯,提高了交互性能。然而,本系統(tǒng)主要針對漢語、英語和法語之間的翻譯,適用性還有待進(jìn)一步擴(kuò)展。