周毛先,頭旦才讓,才讓加
(青海師范大學 藏文信息處理省部共建教育部重點實驗室青海省藏文信息研究中心, 青海 西寧 810008 )
從公元前7世紀亞述帝國編纂的蘇美爾—阿卡德語雙語難詞表開始,人們對詞語的含義、性質、用法等進行了詳盡的注釋,詞典逐漸成為人們學習生活中不可或缺的工具書,其中雙語(多語)詞典更為使用不同語言文字的國家和民族之間科技文化的交流發(fā)揮了巨大的作用。隨著計算機網(wǎng)絡技術的飛速發(fā)展,傳統(tǒng)意義上的詞典已經(jīng)不能滿足人們的需求,紙質詞典、電子詞典和網(wǎng)絡(在線)詞典已成為現(xiàn)代詞典的三種不同形式,三種形式的詞典相互促進、相互發(fā)展,紙質詞典成熟的編纂理論為電子詞典和網(wǎng)絡詞典提供了良好的數(shù)據(jù)資源和理論依據(jù),從而促進了電子詞典和網(wǎng)絡詞典的飛速發(fā)展,電子詞典和網(wǎng)絡詞典又憑借計算機技術和網(wǎng)絡技術推廣了詞典的應用。不同于紙質詞典和電子詞典,在線詞典又具有操作方便、快捷、動態(tài)性好及更新快等優(yōu)勢,已經(jīng)成為廣大網(wǎng)絡用戶在學習語言、翻譯語言和檢索信息等過程中查詢對譯詞匯的主要途徑[1]。
目前,雖與英文在線多語詞典相比,漢語在線多語詞典在質量和數(shù)量上都有較大差距,但是,漢語在線多語詞典通過十余年來的迅速發(fā)展,已經(jīng)初見規(guī)模,形成了各具特色的在線詞典資源,部分在線詞典已經(jīng)商品化[1]。相較之下,藏文單語及多語在線詞典仍處于起步階段,通過網(wǎng)絡能夠搜索到的藏文單語或多語在線詞典很少。近年來,隨著時代的發(fā)展和文化交流的深入,越來越多的國家、團體和個人對藏族文化產(chǎn)生了濃厚的興趣,藏語多語詞典已成為查閱資料和溝通交流的重要工具[2]。鑒于漢語是中國通用語言而英語又是最流行的國際交流語言,建立一個藏漢英三語詞典就能基本保證其他語言與藏語的互譯。由于紙質詞典存在查閱困難、便攜性低、更新周期長等困難,建立一個詞匯量豐富、翻譯準確的藏漢英在線詞典已成為必需。
為了方便用戶查詢詞典,藏漢英在線詞典采用B/S結構,即瀏覽器/服務器模式,該模式容易擴展系統(tǒng)并實現(xiàn)客戶端的零維護,在線詞典的開發(fā)平臺選用WAMP,用戶查詢流程如圖1所示。
圖1 查詢流程圖
WAMP即基于Windows、Apache、MySQL和PHP的開放資源網(wǎng)絡開發(fā)平臺[3],W代表Windows操作系統(tǒng);A代表Apache服務器,Apache作為世界使用排名第一的Web服務器軟件,幾乎可以運行在所有廣泛使用的計算機平臺上,由于Apache是免費開源軟件,所以不斷有人來為它開發(fā)新的功能和特性并修改原來的缺陷。Apache具有簡單、快速、性能穩(wěn)定等特征,可作為在線詞典的代理服務器。M代表MySQL,由瑞典MySQL AB公司開發(fā),是一個小型關系型數(shù)據(jù)庫管理系統(tǒng),目前MySQL被廣泛地應用在Internet上的中小型網(wǎng)站中,MySQL具有開源、體積小、快速、成本低等特征,為了降低網(wǎng)站總體成本,選擇了MySQL作為在線詞典的網(wǎng)站數(shù)據(jù)庫。P代表PHP,是一個在網(wǎng)絡程序開發(fā)方面應用范圍很廣的語言,一般來說PHP大多在服務器端運行,通過運行PHP的代碼來產(chǎn)生網(wǎng)頁提供給瀏覽器讀取,PHP可以在許多不同種的服務器、操作系統(tǒng)、平臺上運行,也可以和許多數(shù)據(jù)庫系統(tǒng)結合,使用PHP不需要任何費用,官方組織PHP Group提供了完整的程序源代碼,允許用戶修改、編譯、擴充。
本詞典使用phpMyAdmin管理詞典數(shù)據(jù)庫。phpMyAdmin是由php寫成的MySQL資料庫系統(tǒng)管理程式,方便管理員對詞典數(shù)據(jù)庫進行數(shù)據(jù)的添加、編輯和刪除等操作,使用phpMyAdmin可以導入已經(jīng)建立好的外部數(shù)據(jù)表。
藏漢英詞典數(shù)據(jù)表tbcna(表1)采用Unicode編碼,共有五個字段: C為漢文詞;T為藏文詞;E為英文詞;X為詞性;A為ID,由于用戶可能輸入藏文、漢文、英文三種語言的單詞來查詢,為加快對表中記錄的查找,建立了C、T、E三個字段的索引。
表1 藏漢英在線詞典詞條數(shù)據(jù)表結構
對應在phpMyAdmin中輸入的sql代碼:
CREATE TABLE ′tbcna′ (
′C′ char(70) collate utf8_unicode_ci default NULL,
′T′ char(120) collate utf8_unicode_ci default NULL,
′E′ char(80) collate utf8_unicode_ci default NULL,
′X′ char(4) collate utf8_unicode_ci default NULL,
′A′ decimal(10,0) default NULL,
KEY ′C′ (′C′),
KEY ′T′ (′T′),
KEY ′E′ (′E′)
) ENGINE=MyISAM DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci
將57 856條測試詞條導入MySQL數(shù)據(jù)庫,為數(shù)據(jù)安全考慮,通過phpMyAdmin對數(shù)據(jù)庫進行加密處理,瀏覽詞條示例如表2。
表2 詞條數(shù)據(jù)表示例
圖2 查詢頁面
查詢頁面php代碼:
建立下拉列表框:
請選擇查詢語言種類:
當選擇查詢語言為藏文時:
error_reporting(0);
$mac=isset($_POST[′mac′])?trim($_POST[′mac′]):′′;
$se=$_POST[′s1′];
$str=$_GET[″A″];
$res=mysql_query(″SELECT * FROM tbcna WHERE C=′″.$mac.″′″);
$rs=mysql_fetch_array($res);
if($rs[′T′]!=′′)
{
echo $rs[′X′];
echo ″
″;
echo ′漢文: ′.$mac ;
echo ″
″;
echo ″
″ ;
echo′English: ′.$rs[′E′] ;
}
else
{
echo ′沒有對應的翻譯!′;
}
?>
為了更好的方便用戶,豐富查詢結果,提高交互能力,還需做如下工作:
2) 新詞添加: 查詢單詞時,如果詞典數(shù)據(jù)庫中沒有該詞,系統(tǒng)允許添加新詞,點擊鏈接就可以創(chuàng)建這個單詞。由于現(xiàn)代藏文中出現(xiàn)越來越多的新詞,通過允許用戶添加新詞,可以及時更新詞典數(shù)據(jù)庫。
3) 編輯解釋: 當用戶對某個詞條的解釋不滿意,或者發(fā)現(xiàn)某個單詞的解釋信息或例句有錯誤時,系統(tǒng)允許用戶進行編輯并提交到數(shù)據(jù)庫,由管理員審核提交的內容,對數(shù)據(jù)庫進行必要的修改,優(yōu)化詞典庫、語料庫,為用戶提供更好的翻譯服務。
[1] 宋培彥,劉寧靜.中英文在線詞典淺析[J]. 青島酒店管理職業(yè)技術學院學報,2009,1(2):38-41.
[2] 才藏太,李毛措.網(wǎng)絡版班智達藏漢英電子詞典的設計[J].計算機工程與應用, 2005,41(17):126-128.
[3] 張瑞,高嶺,王承博.基于WAMP動態(tài)維基網(wǎng)站的建站方法[J].內江科技, 2008,29(4):139,174.
[4] 葉曉菡.基于.NET的網(wǎng)絡用語在線詞典軟件的設計與實現(xiàn)[J].計算機時代,2010,(9):27-29.
[5] 才智杰,藏漢英電子詞典的開發(fā)研究[J], 青海師范大學學報(自然科學版), 2005, (2):48-50.
[6] 張錦文.國外在線語料庫與在線詞典管窺[J].廣東廣播電視大學學報, 2002, 11(3):72-75.
[7] 司敬新.在線詞典的特點分析[J].中國電化教育, 2005, (2):84-85.