華燁 李亮
(華燁 廣東外語(yǔ)外貿(mào)大學(xué)外國(guó)語(yǔ)語(yǔ)言學(xué)及應(yīng)用語(yǔ)言學(xué)研究中心 廣州 510420)
(李亮 廣東外語(yǔ)外貿(mào)大學(xué)詞典學(xué)研究中心 廣州 510420)
計(jì)算機(jī)具有文字容量大、處理速度快和檢索方便等技術(shù)優(yōu)勢(shì),國(guó)內(nèi)外早已把它當(dāng)作詞典編纂不可或缺的工具。詞典編纂平臺(tái)或計(jì)算機(jī)輔助詞典編纂系統(tǒng)在國(guó)際上叫作“Dictionary Writing System”(詞典編寫系統(tǒng),簡(jiǎn)稱DWS),有時(shí)也叫“Dictionary Production/Publishing System”(詞典生成/出版系統(tǒng),簡(jiǎn)稱DPS)。它是專門用于詞典編纂的計(jì)算機(jī)軟件——編輯器,設(shè)置有詞典語(yǔ)料庫(kù)以及語(yǔ)料庫(kù)導(dǎo)入和詞典數(shù)據(jù)導(dǎo)出接口,可以實(shí)現(xiàn)詞典語(yǔ)料、詞典編纂、詞典編輯、數(shù)據(jù)存儲(chǔ)和成果輸出等一條龍服務(wù)功能。
在國(guó)內(nèi),20世紀(jì)90年代就開始了詞典編纂平臺(tái)的研究和開發(fā),有關(guān)該問(wèn)題的研究論文和開發(fā)成果也不少,比較有代表性的有:南京大學(xué)雙語(yǔ)詞典研究中心開發(fā)的“基于語(yǔ)料庫(kù)的雙語(yǔ)詞典編纂系統(tǒng)——CONULEXID”、廣東外語(yǔ)外貿(mào)大學(xué)詞典學(xué)研究中心開發(fā)的“基于語(yǔ)料庫(kù)的WEB詞典編纂&自動(dòng)生成系統(tǒng)”、外語(yǔ)教學(xué)與研究出版社與北京大學(xué)合作開發(fā)的“基于語(yǔ)料庫(kù)的雙語(yǔ)詞典編纂平臺(tái)”,以及北京大學(xué)的“詞典編纂的計(jì)算機(jī)輔助開發(fā)與管理系統(tǒng)”、教育部語(yǔ)言文字應(yīng)用研究所的“基于語(yǔ)料庫(kù)的數(shù)字化辭書編纂平臺(tái)”,商務(wù)印書館的“辭書編輯編纂系統(tǒng)”。這些系統(tǒng)大多以大規(guī)模語(yǔ)料庫(kù)為基礎(chǔ),利用語(yǔ)言信息處理計(jì)算機(jī)技術(shù)等,研究詞典信息的獲取、微觀數(shù)據(jù)項(xiàng)的標(biāo)注和生成、數(shù)據(jù)結(jié)構(gòu)關(guān)系和檢測(cè)、數(shù)據(jù)的獲取和詞典的生成等,以突破傳統(tǒng)的辭書編纂概念,建立一種新型的辭書編纂模式。商務(wù)印書館還進(jìn)一步探討數(shù)字辭書出版和百種精品工具書數(shù)據(jù)庫(kù),實(shí)現(xiàn)了詞典間的互文或整合,形成了以詞條為單元的詞匯知識(shí)系統(tǒng)。
此外,還有其他不少單位正在嘗試開發(fā)詞典編纂平臺(tái),但大多是科研機(jī)構(gòu)的一種科研嘗試或?yàn)榱四骋辉~典項(xiàng)目而開發(fā)的專用工具,只在內(nèi)部使用,至今還沒(méi)有一家能投入商業(yè)運(yùn)營(yíng)。而在西方,由于語(yǔ)料庫(kù)的建設(shè)和使用比較早,一些詞典出版機(jī)構(gòu)從20世紀(jì)七八十年代就有了詞典編纂、編輯的專用平臺(tái),如牛津、朗文、柯林斯系列詞典都是在專用平臺(tái)上編纂和編輯的。同時(shí),還有一些電子出版機(jī)構(gòu)或軟件公司開發(fā)了一些商業(yè)編纂平臺(tái),現(xiàn)在已經(jīng)廣泛應(yīng)用于詞典編纂領(lǐng)域。比較有代表性的有:法國(guó)IDM的 DPS、俄羅斯的ABBYY Lingvo Content、南非的TshwaneLex、SIL國(guó)際的 Lexique Pro和法日合作的彩蝶Papillion等。下面就對(duì)其中幾個(gè)做一簡(jiǎn)要介紹。
IDM詞典生成系統(tǒng)(Dictionary Production System,簡(jiǎn)稱DPS)是法國(guó)多媒體傳播工程公司(Ingénierie Diffusion Multimédia,簡(jiǎn)稱IDM)開發(fā)的。DPS可以使各類參編人員在主編的指令下協(xié)同一致、有條不紊地進(jìn)行詞典的編纂、信息檢索和審校工作。
IDM公司從1999年開始,先后與朗文和牛津出版機(jī)構(gòu)合作,開始了詞典生成系統(tǒng)的研發(fā),完成了詞典標(biāo)注文本從SGML向XML的轉(zhuǎn)換,大大提高了詞典編纂和出版的工作效率。該公司現(xiàn)有五款與辭書有關(guān)的產(chǎn)品,分布在500多家用戶中,主要涉及詞典編纂和詞典的出版與傳播(網(wǎng)絡(luò)形式與光盤形式),其中包括:“Dictionary Authoring XML Editor/XML詞典文本編輯器”和“extensible Dictionary Configuration Chain/詞典文本格式轉(zhuǎn)換鏈接器”等,構(gòu)成了系統(tǒng)的詞典編纂、編輯和出版工具。
該系統(tǒng)采用模塊化設(shè)計(jì),由“用戶編輯模塊(Authoring XML Editor)”、“搜索模塊(Search Engine)”、“工作分配和流程管理模塊(Work Allocation and Workflow Manager,簡(jiǎn)稱工作流模塊)”和“校對(duì)模塊(Proofing Tool)”等組成了一個(gè)系統(tǒng)的詞典工具框架。每個(gè)模塊具有特定的功能,又能相互補(bǔ)充和配合,可大大提高詞典編纂的工作效率。可見,該系統(tǒng)具有網(wǎng)絡(luò)化、協(xié)作性、可索性和可控性,因?yàn)樗袕?qiáng)大的搜索引擎和明確的工作流方式,強(qiáng)調(diào)通過(guò)“中央數(shù)據(jù)庫(kù)”來(lái)實(shí)現(xiàn)成員間的協(xié)作編纂。從詞典編纂的角度講,它具有多語(yǔ)種、多功能的特點(diǎn),可用于單語(yǔ)詞典、雙語(yǔ)詞典、義類詞典(thesaurus)、引文詞典或百科詞典等的編纂。系統(tǒng)全面支持Unicode編碼、XML格式和多種文檔類型定義(DTD)格式,可以方便詞典信息的導(dǎo)入、導(dǎo)出和傳播。目前,該系統(tǒng)在世界上擁有500多個(gè)客戶,并被朗文等專業(yè)詞典出版公司所采用(McNamara 2003)。
用戶編輯模塊可進(jìn)行雙屏雙文檔同步顯示、XML元素屬性的安全和快速修改、自動(dòng)保持元素間相互參照的更新與安全保障、段落的自動(dòng)編號(hào)和文本塊的拖放式移動(dòng)、批注和附加標(biāo)簽、XML模板的自定義等。
搜索模塊可以進(jìn)行簡(jiǎn)潔高效的語(yǔ)言查詢、多個(gè)詞典數(shù)據(jù)庫(kù)的同步搜索、XML格式的輸出;另外,它還支持多語(yǔ)種檢索、模糊查詢,能做到XML與關(guān)系型數(shù)據(jù)庫(kù)的完美整合。
工作流模塊是由進(jìn)程(process)、步驟(step)和任務(wù)(task)三個(gè)方面構(gòu)成的工作流,能夠進(jìn)行任務(wù)的分配控制、任務(wù)的進(jìn)展監(jiān)測(cè)、任務(wù)文檔的宏觀管理、日程事務(wù)的安排等。
校對(duì)模塊能夠幫助編纂人員從“用戶視角”進(jìn)行閱讀和理解,包括三個(gè)階段:編纂階段(composing)、關(guān)鍵審讀階段(critical reading)和付印前審讀階段(pass for press validation),能夠生成PDF文檔,并與Adobe公司的InDesign排版軟件進(jìn)行無(wú)縫銜接。
DPS系統(tǒng)的各大模塊都有相對(duì)獨(dú)立的操作界面,限于篇幅這里只對(duì)用戶編輯界面做簡(jiǎn)單介紹。編輯模塊是基于微軟的MSXML 4.0開發(fā)的,其界面是用XML格式構(gòu)建的。新安裝的編輯器由于沒(méi)有加載任何詞典文本,界面上各功能區(qū)沒(méi)有任何編輯對(duì)象。加載文本后,在四個(gè)功能區(qū),有三個(gè)區(qū)域顯示出編輯內(nèi)容(見圖1)。
從左到右的四個(gè)功能區(qū)分別是:1)詞目總覽區(qū),顯示編輯文檔內(nèi)所包含的全部詞條的詞目詞;2)詞條預(yù)覽區(qū),顯示編輯區(qū)域當(dāng)前詞條的編輯現(xiàn)狀和修改結(jié)果;3)XML樹形結(jié)構(gòu)信息編輯區(qū),是編輯主要操作區(qū)域,編輯可以直接增刪和修改詞條內(nèi)容;4)當(dāng)前被選中的樹形結(jié)構(gòu)節(jié)點(diǎn)的屬性顯示區(qū)。
圖1 DPS系統(tǒng)的界面功能分區(qū)
由于有些詞條的內(nèi)容比較多,一個(gè)頁(yè)面難以展示全部?jī)?nèi)容,因此四個(gè)區(qū)域都設(shè)有水平滾動(dòng)條和垂直滾動(dòng)條,方便操作者查看編輯內(nèi)容。第三區(qū)域?yàn)橹鞑僮鞴δ軈^(qū),其上方有三個(gè)按鈕,用于隱藏或顯示主功能區(qū)外的其他功能區(qū);由于有些詞條的內(nèi)容比較多,一個(gè)頁(yè)面難以展示全部?jī)?nèi)容,因此四個(gè)區(qū)域都設(shè)有水平滾動(dòng)條和垂直滾動(dòng)條,方便操作者查看編輯內(nèi)容。在第三功能區(qū)上方有三個(gè)按鈕,左邊按鈕可以隱藏或顯示詞目總覽區(qū),中間按鈕可以隱藏或顯示詞條預(yù)覽區(qū),右邊按鈕可以隱藏或顯示樹形結(jié)構(gòu)節(jié)點(diǎn)的屬性顯示區(qū)。這樣設(shè)計(jì)是為了方便使用者在編寫過(guò)程中擴(kuò)展主要編輯界面,并在需要時(shí)調(diào)出其他界面。此外,用戶把鼠標(biāo)放在四個(gè)區(qū)之間的“間隔條”上的時(shí)候,鼠標(biāo)會(huì)變成“水平雙向箭頭”,按下左鍵便可以任意調(diào)節(jié)當(dāng)前區(qū)域的寬度,十分方便。
在默認(rèn)情況下,“詞目總覽區(qū)”將會(huì)加載在編的全部詞條的詞目,用鼠標(biāo)左鍵單擊“詞目總覽區(qū)”的任一詞,第二和第三功能區(qū)會(huì)即刻顯示出該詞條的信息內(nèi)容,編者便可以進(jìn)行閱覽或編輯。
在編輯器中央的最上方,并行排列有五個(gè)工具按鈕,分別是:NEW、PRINT、PROTECT、TEMPLATE和FIND,鼠標(biāo)移至這些按鈕上方可顯示快捷鍵提示;其下方是五個(gè)主菜單項(xiàng)目,分別是:FILE、EDIT、CONFIG、STATS和HELP,這些都是為詞典編纂和編輯設(shè)置的文本操作功能。
1)“NEW”按鈕是新建XML的節(jié)點(diǎn),用于“新建詞條”,即增加“詞目總覽區(qū)”所沒(méi)有的詞條。點(diǎn)擊該按鈕,會(huì)彈出一個(gè)小窗口,按照窗口內(nèi)容提示操作即可完成詞條的增添。
2)“PRINT”按鈕是用來(lái)進(jìn)行打印輸出的,點(diǎn)擊該按鈕會(huì)彈出一個(gè)對(duì)話框,詢問(wèn)是“Print tree/打印樹”還是“Print preview/打印詞條預(yù)覽”,選擇其中之一,點(diǎn)擊打印按鈕就能調(diào)用系統(tǒng)的打印機(jī)輸出所選內(nèi)容。
3)“PROTECT”的功能是“保護(hù)詞條”,是對(duì)某些詞條在某些時(shí)刻進(jìn)行內(nèi)容鎖定,避免編者在某些情況下因誤操作而導(dǎo)致編纂數(shù)據(jù)改動(dòng)或丟失。
4)“TEMPLATE”用于模版調(diào)整,即對(duì)整個(gè)詞條編纂模板設(shè)置進(jìn)行修改,以調(diào)整詞典的微觀結(jié)構(gòu)及其內(nèi)容分布,使其詞匯知識(shí)的組織結(jié)構(gòu)不斷完善。
5)“FIND”的功能是對(duì)現(xiàn)有編纂內(nèi)容進(jìn)行多種檢索,可以向上向下檢索,也可以指定大小寫敏感性,還可以對(duì)每個(gè)詞條的“釋義”或“例證”之類的局部結(jié)構(gòu)進(jìn)行檢索。
在主菜單中,“File”只有一個(gè)子項(xiàng)目“Save”,是對(duì)當(dāng)前文檔進(jìn)行“另存為”操作;“Edit”按鈕有11個(gè)子項(xiàng),可以對(duì)當(dāng)前文本進(jìn)行“復(fù)制”、“粘貼”、“撤銷上一步操作”、“剪切”、“刪除”等常規(guī)編輯操作;“Config”是對(duì)編輯器的啟動(dòng)和運(yùn)行參數(shù)進(jìn)行調(diào)整,包括幾個(gè)功能區(qū)的顯示形式;“Stats”是對(duì)所有詞條信息的統(tǒng)計(jì);“Help”提供對(duì)一些重要操作方法和常用快捷鍵的描述,這樣有利于操作者提高編纂效率。此外,在主菜單和五個(gè)功能按鈕的左側(cè)有一個(gè)“+”按鈕(見圖2),它的功能是提供所有詞條的“語(yǔ)體信息統(tǒng)計(jì)”,如有多少個(gè)醫(yī)學(xué)、生物學(xué)、數(shù)學(xué)、通訊等詞目的信息,以及顯示當(dāng)前編寫操作是處于整個(gè)工作流中的哪一個(gè)步驟。
通過(guò)分析可以看出,該詞典生成系統(tǒng)過(guò)分強(qiáng)調(diào)網(wǎng)絡(luò)化和中央數(shù)據(jù)庫(kù),可能導(dǎo)致較小的詞典或較小的詞典編纂團(tuán)隊(duì)在集約式的環(huán)境下無(wú)法便捷地操作;在編輯界面方面,主菜單和工具按鈕顯得過(guò)于單薄,一些常用的工具按鈕沒(méi)有凸顯出來(lái)。建議適當(dāng)增加在單機(jī)和小團(tuán)隊(duì)情形下的編纂需求,如設(shè)計(jì)出“離線版”或“迷你單機(jī)版”等;增加常用按鈕如“剪切”、“復(fù)制”、“粘貼”等,提供不同風(fēng)格和顏色的界面(“皮膚”)供編者選擇,這樣既能滿足個(gè)性化需求,又能避免長(zhǎng)時(shí)間操作可能產(chǎn)生的視覺(jué)疲勞。
泰比詞典編寫系統(tǒng)的英文全稱為ABBYY Lingvo Content,是一款專為詞典編纂、修訂和管理而設(shè)計(jì)的詞典編寫系統(tǒng),詞典數(shù)據(jù)可以導(dǎo)出為不同的格式出版,無(wú)論是紙質(zhì)詞典還是電子詞典(含光盤、網(wǎng)絡(luò)和掌上詞典)。其用戶面向出版機(jī)構(gòu)和個(gè)人,主要功能有:分析、處理和存儲(chǔ)語(yǔ)言數(shù)據(jù)、詞典編纂任務(wù)的分工、詞典的審校(拼寫和參考文獻(xiàn)等)、詞典編纂各階段的支持、各種版本辭書的出版。其詞典數(shù)據(jù)能以各種格式導(dǎo)出,用于紙質(zhì)詞典、電子詞典(含手機(jī)詞典)和網(wǎng)絡(luò)詞典的出版。
“ABBYY”(泰比)有“敏銳的眼光”的含義,該公司的重點(diǎn)發(fā)展領(lǐng)域是文檔識(shí)別和語(yǔ)言技術(shù)。2003年,泰比開發(fā)出詞典編纂系統(tǒng),開始應(yīng)用于自己公司的詞典項(xiàng)目,后來(lái)便投入商業(yè)運(yùn)營(yíng)。截至2011年1月,泰比已經(jīng)是一家擁有1000名員工的國(guó)際化公司,產(chǎn)品銷往全球130多個(gè)國(guó)家,在9個(gè)國(guó)家設(shè)有辦事處。迄今,泰比已經(jīng)出版了40部詞典,包括普通詞典、專業(yè)詞典、詞匯手冊(cè)等,其中《當(dāng)代英俄詞典》收詞超過(guò)10萬(wàn)條,并提供了大量生活中常用的例句。
該系統(tǒng)采用客戶機(jī)/服務(wù)器架構(gòu),能進(jìn)行分布式運(yùn)算。系統(tǒng)的界面友好、功能較強(qiáng),能夠編輯、更新、補(bǔ)充詞典內(nèi)容,并能輸出不同格式的文件,如DSL和LSD格式(這種格式運(yùn)用于泰比電子詞典軟件)。主要功能特點(diǎn)有:
1)基于XML技術(shù),采用DTD格式定義,容許用戶設(shè)定詞典編纂結(jié)構(gòu),能保證詞典文本結(jié)構(gòu)的可調(diào)性和一致性;支持多語(yǔ)種編纂和多部詞典同時(shí)管理。
2)實(shí)行工作流管理模式,能保障存儲(chǔ)數(shù)據(jù)的安全性,并能跟蹤詞條的版本變化情況,如哪一個(gè)人編哪些詞典或詞條,詞典編纂的進(jìn)度和質(zhì)量如何等,還可以跟蹤和監(jiān)控詞條的相互參照關(guān)系。
3)詞條編輯功能可使編輯人員在校對(duì)詞典稿或修訂詞典時(shí),根據(jù)需要利用拖動(dòng)的方法直接調(diào)整詞條內(nèi)的義項(xiàng)次序。
4)有詞條編纂工作的歷史記錄,主編或編輯人員能查看文本的修改、補(bǔ)充、刪除的內(nèi)容;如果有必要還可以進(jìn)行數(shù)據(jù)還原。
5)有詞條信息過(guò)濾功能,可利用日志——過(guò)濾工具和一些必要參數(shù),如語(yǔ)詞的拼寫、意義、標(biāo)簽和處理狀態(tài)等,找出特定的內(nèi)容,并對(duì)它們進(jìn)行處理或分配給其他編寫人員處理。
6)能對(duì)詞典數(shù)據(jù),包括詞目詞、例證、復(fù)合詞、習(xí)語(yǔ)、同義詞、反義詞、參見、標(biāo)簽、有聲句子、有聲文件等數(shù)據(jù),進(jìn)行多角度、多層面的統(tǒng)計(jì)。
系統(tǒng)既可以用來(lái)編纂全新的詞典,也可以從多部現(xiàn)有詞典中提取所需信息,然后再按新的設(shè)計(jì)方案補(bǔ)充新的內(nèi)容,從而合并成一部新的詞典。舊信息的提取是通過(guò)一個(gè)精密搜索和過(guò)濾引擎實(shí)現(xiàn)的,用戶若想編一部經(jīng)濟(jì)學(xué)詞典,就可以根據(jù)文本類型來(lái)提取現(xiàn)有詞典的經(jīng)濟(jì)類詞匯或義項(xiàng),然后加入到新編的詞典中;當(dāng)然,也可以把多部??圃~典合并成綜合科技詞典。(提取界面見圖2)
圖2 新舊詞典對(duì)比和信息提取窗口
圖2左邊窗口是新編詞典的內(nèi)容,右邊窗口是幾部舊詞典,通過(guò)選擇功能可以把A組中的營(yíng)銷(詞典)和政治(詞典)、B組中的法律(詞典)移入左邊的窗口;然后,按下創(chuàng)建(Create)按鈕,便把相關(guān)信息提取出來(lái),合并到新詞典中去。
泰比系統(tǒng)的界面與IDM公司的編輯模塊有些類似,也分為詞目總覽區(qū)、詞條預(yù)覽區(qū)、XML詞條樹形結(jié)構(gòu)編輯區(qū)和標(biāo)注編輯區(qū)(見圖3)。所不同的是,右下角的“特殊符號(hào)插入面板”,這是一個(gè)很貼心的人性化設(shè)計(jì)。泰比系統(tǒng)的四個(gè)工作區(qū)也有水平滾動(dòng)條和垂直滾動(dòng)條,可以進(jìn)行各個(gè)區(qū)的寬度和高度的手工調(diào)節(jié);這樣,編者在面對(duì)大量信息項(xiàng)時(shí)能根據(jù)需要進(jìn)行臨時(shí)性界面調(diào)節(jié)。
在界面窗口的上部是主菜單和一列工具按鈕。菜單從左至右是:文件、詞條、編輯、詞典組、工具、用戶管理、選擇項(xiàng)、幫助??梢钥闯?a)該系統(tǒng)設(shè)置了更多的菜單和工具按鈕,表明其功能更多、更細(xì);b)工具按鈕不僅有文字,還有圖形按鈕,這體現(xiàn)了人性化和用戶友好的一面;c)詞典組(Dictionary Group)的設(shè)置表明該軟件確實(shí)能進(jìn)行“多部詞典的同時(shí)編纂”和管理;d)標(biāo)題欄上依稀可見的“server”字樣和工具欄上的“Assign to”(帶有頭像圖示),表明該軟件是“具有高權(quán)限的控制端”或者“已經(jīng)登錄為高權(quán)限的客戶端”,并且在高權(quán)限的情況下可以進(jìn)行“詞條分配”之類的“群組操作”,體現(xiàn)了分布式編纂的工作方式,這與產(chǎn)品說(shuō)明中的“可以進(jìn)行用戶組的創(chuàng)建與協(xié)調(diào)”是一致的。
詞目總覽區(qū)顯示出詞典的總詞表及其編輯狀態(tài),點(diǎn)擊其中任何一個(gè)詞項(xiàng)便可激活編輯功能,并查看其信息內(nèi)容;詞條預(yù)覽區(qū)顯示當(dāng)前詞條在詞典中的版面格式,對(duì)詞條內(nèi)容的增刪或修改都會(huì)在這里得到反映;詞條樹形結(jié)構(gòu)編輯區(qū)顯示詞目詞及其主義項(xiàng)和次義項(xiàng)的相對(duì)位置,如果有必要,可以用鼠標(biāo)拖曳的方法調(diào)整義項(xiàng)次序;標(biāo)注編輯區(qū)是主要的文字編輯平臺(tái),可以在這里進(jìn)行詞條內(nèi)容的編寫,義項(xiàng)、例證和同義詞等的增減,參見其他詞條,用專用符號(hào)注音等。
圖3 泰比詞典編纂系統(tǒng)的界面結(jié)構(gòu)
在已經(jīng)加載詞條的情況下,編者可以進(jìn)行以下的文字操作:a)在詞目總覽區(qū)進(jìn)行詞目的選擇和跳轉(zhuǎn);b)在跳轉(zhuǎn)到相應(yīng)的詞目之后,就能看到“詞條預(yù)覽區(qū)”和“樹形結(jié)構(gòu)區(qū)域”已經(jīng)同時(shí)發(fā)生了變化;c)如果需要對(duì)某一詞條的某個(gè)微觀結(jié)構(gòu)項(xiàng)進(jìn)行編輯或具體修改,則直接用鼠標(biāo)單擊樹形結(jié)構(gòu)區(qū)的相應(yīng)節(jié)點(diǎn);d)在節(jié)點(diǎn)被激活并處于等待編輯狀態(tài)之后,編者便可在標(biāo)注編輯區(qū)輸入或修改詞條信息了;同時(shí),如果編者希望看到更加詳細(xì)的XML的結(jié)構(gòu)信息代碼的話,則可以用鼠標(biāo)點(diǎn)擊“XML節(jié)點(diǎn)編輯區(qū)”,在這里編輯相關(guān)信息即可。一般來(lái)說(shuō),由于泰比的結(jié)構(gòu)與IDM編輯器類似,它應(yīng)該也有豐富的右鍵功能,如對(duì)樹形結(jié)構(gòu)節(jié)點(diǎn)的合并、新增、刪除、對(duì)調(diào)、刷新等。同一詞條的微觀結(jié)構(gòu)中的各種信息項(xiàng),可以用鼠標(biāo)進(jìn)行拖動(dòng)來(lái)實(shí)現(xiàn)相對(duì)位置的調(diào)整,十分方便。(參見圖3中的樹形結(jié)構(gòu)編輯區(qū))
此外,服務(wù)器端也具有類似“考勤系統(tǒng)”的功能,即記錄各個(gè)編纂者的系統(tǒng)登錄時(shí)間與注冊(cè)時(shí)間,且形成歷史記錄。詞條編纂、編輯版本的歷史也有“記錄”,便于出現(xiàn)問(wèn)題時(shí)進(jìn)行必要的回溯追蹤。
目前,該公司主頁(yè)上的產(chǎn)品介紹已不再包括這款軟件,我們懷疑是該公司放棄了詞典編纂系統(tǒng)的商業(yè)開發(fā),因?yàn)锳BBYY公司的產(chǎn)品線很廣,員工的數(shù)量有千余人,其ABBYYLingvo系列電子詞典和OCR識(shí)別軟件都十分暢銷,導(dǎo)致了“詞典編纂軟件”的開發(fā)力量不斷向“電子詞典”的開發(fā)轉(zhuǎn)移。希望他們能重視詞典編纂平臺(tái)的改進(jìn),開發(fā)出有特色的詞典編纂系統(tǒng)。
TshwaneLex(簡(jiǎn)稱TLex)是由南非TshwaneDJe公司研制的一款基于XML的詞典編纂系統(tǒng)。該公司專門從事語(yǔ)言技術(shù)研究和開發(fā),包括翻譯記憶軟件、語(yǔ)料庫(kù)及索引軟件、數(shù)據(jù)庫(kù)編輯器、詞典編寫系統(tǒng)、詞典出版系統(tǒng)、數(shù)據(jù)轉(zhuǎn)換和術(shù)語(yǔ)管理軟件等。特別是其詞典編纂與詞典出版系統(tǒng),有許多替代人工操作的專業(yè)性能,能縮短詞典編纂時(shí)間、節(jié)省費(fèi)用、提高辭書質(zhì)量。主要性能包括:內(nèi)置語(yǔ)料查詢系統(tǒng)、實(shí)時(shí)預(yù)覽、用戶設(shè)置、智能互參、自動(dòng)跟蹤升級(jí)、自動(dòng)詞目逆序排列、自動(dòng)排序統(tǒng)計(jì)、導(dǎo)入Word文檔或排版系統(tǒng)、多用戶支撐管理等。該軟件似乎有成為國(guó)際專業(yè)詞典編纂行業(yè)標(biāo)準(zhǔn)的可能,它幾乎能支持世界上大多數(shù)語(yǔ)言,已經(jīng)與牛津大學(xué)出版社、朗文公司、麥克米倫公司、培生公司、西班牙皇家醫(yī)學(xué)院、加拿大司法部等眾多出版機(jī)構(gòu)和政府部門建立起了業(yè)務(wù)關(guān)系,編纂出各種類型的詞典。
TLex詞典系統(tǒng)由三大部分構(gòu)成:詞典編纂系統(tǒng)(TLex Dictionary Production System)、電子詞典出版系統(tǒng)(Electronic Dictionary Publishing System)和在線詞典發(fā)布系統(tǒng)(Online Dictionary Publishing System)。詞典編纂系統(tǒng)具有強(qiáng)大、友好、實(shí)用的特征;在線詞典出版系統(tǒng)能夠?qū)ΜF(xiàn)有的詞典進(jìn)行靜態(tài)頁(yè)面和動(dòng)態(tài)頁(yè)面兩種方式的發(fā)布,也能提供專門收集用戶反饋的頁(yè)面功能;電子詞典出版系統(tǒng)是一個(gè)相對(duì)獨(dú)立而靈活的模塊,可以把現(xiàn)有詞典制作成光盤或發(fā)布在網(wǎng)絡(luò)上供用戶下載,而且實(shí)現(xiàn)了與微軟的Office產(chǎn)品的良好整合,也可以駐留在Windows的系統(tǒng)托盤區(qū)隨時(shí)彈出。
詞典編纂系統(tǒng)的詳細(xì)功能包括:語(yǔ)料查詢功能和提取、實(shí)時(shí)詞條預(yù)覽、多種界面風(fēng)格和可自定義界面、智能的“參見系統(tǒng)”跟蹤、自動(dòng)編號(hào)與排序等,還能夠以多種格式將特定部分或全部詞條導(dǎo)出為微軟的Word文檔或主流排版軟件,如InDesign、Quark、XPP等。多用戶和多語(yǔ)言的支持,音標(biāo)輸入便捷,獨(dú)特的Ruler Tool功能可以進(jìn)行各方面的編纂平衡性的監(jiān)測(cè),內(nèi)建的腳本語(yǔ)言可以進(jìn)行各種批量操作。
TLex系統(tǒng)界面結(jié)構(gòu)比較復(fù)雜,其文字說(shuō)明是英語(yǔ)和法語(yǔ)兩種。編輯界面有四大功能區(qū)(見圖4):1)詞條總覽區(qū)(左側(cè)),提供詞目詞列表,供編者瀏覽和選擇;2)樹形結(jié)構(gòu)編纂?yún)^(qū)(中上),編者可以在下拉菜單上選定預(yù)先定義的值,然后按樹形結(jié)構(gòu)上的微觀信息項(xiàng)進(jìn)行編纂;3)節(jié)點(diǎn)屬性編輯區(qū)(中下),可以編輯和調(diào)整相關(guān)信息項(xiàng);4)詞條預(yù)覽區(qū)(右側(cè)),查看當(dāng)前編纂詞條的真實(shí)效果。這些設(shè)置與上述兩個(gè)編纂系統(tǒng)大同小異,只是具體操作項(xiàng)目多一些。
在界面窗口的上部是主菜單和一列工具按鈕。菜單從左至右是:文件、編輯、視圖、詞目、詞典、格式、工具、窗口、幫助。工具按鈕主要是文本編輯所必須的一些功能,包括多媒體圖片、藝術(shù)字體等,甚至可以直接轉(zhuǎn)換到Word文檔??梢哉f(shuō),詞典編輯平臺(tái)的文字處理功能是十分強(qiáng)大的;另外,“詞典”(Dictionaire)下拉菜單表明該系統(tǒng)也可以同時(shí)管理和操控多部詞典。
圖4 TLex詞典編纂系統(tǒng)的界面結(jié)構(gòu)
根據(jù)我們下載的試用版本的測(cè)試情況來(lái)看,TLex的編纂操作是從“新建工程”開始的。編者首先要選擇是“單語(yǔ)詞典”還是“雙語(yǔ)詞典”,以及“詞典的名稱與描述”、“詞典的DTD文件路徑”、“詞典的聲音和圖像的存放位置”等。然后,就要選擇用“單語(yǔ)編纂”還是“雙語(yǔ)編纂”模式。如果是雙語(yǔ)模式,則調(diào)出“左右兩個(gè)區(qū)域”的窗口布局;如果是單語(yǔ)模式,則只是傳統(tǒng)的四大窗口的布局。
其次,TLex還可以讓編纂者選擇界面的“橫向模式”或是“縱向模式”;前者顯示范圍寬,一個(gè)詞條的信息可以一覽無(wú)余,對(duì)于專注于單個(gè)詞目或較少相關(guān)詞目而言比較有利;后者顯示面窄(只有橫向的一半),但詞條數(shù)目多,需要借助滾動(dòng)條查看,對(duì)于關(guān)注一系列詞條的對(duì)比分析比較有利。
一旦進(jìn)入編纂狀態(tài),TLex則與其他的詞典編纂軟件極其相似,即在“詞目總覽區(qū)”進(jìn)行詞目的瀏覽和選擇,在“樹形結(jié)構(gòu)區(qū)”或“節(jié)點(diǎn)屬性編輯區(qū)”進(jìn)行編纂,同時(shí)在“詞條預(yù)覽區(qū)”實(shí)時(shí)查看編纂或修改的效果。不同的節(jié)點(diǎn)之間的關(guān)系可以用鼠標(biāo)拖動(dòng)來(lái)進(jìn)行調(diào)整,也可以點(diǎn)擊右鍵來(lái)選擇“刪除”或“刷新”等選項(xiàng)。值得一提的是,該系統(tǒng)有一“相互參見對(duì)照”功能,編者能把“cross-reference/參見”窗口調(diào)出來(lái),查看參見和被參見的信息內(nèi)容,可以對(duì)所有參見關(guān)系進(jìn)行系統(tǒng)查閱、管理和校改。
Tlex的詞典編纂、電子詞典出版和在線發(fā)布系統(tǒng)三個(gè)模塊的功能之間有些重疊,可能是出于將三個(gè)模塊進(jìn)行獨(dú)立銷售的考慮所致,但是也會(huì)給購(gòu)買一套完整系統(tǒng)的用戶帶來(lái)麻煩。另外,缺乏對(duì)在線語(yǔ)料庫(kù)和豐富的網(wǎng)絡(luò)資源的利用功能,而龐大的互聯(lián)網(wǎng)語(yǔ)言資源也是詞典語(yǔ)料和數(shù)據(jù)的主要來(lái)源。要解決這些問(wèn)題其實(shí)也不難,如在三個(gè)模塊內(nèi)部設(shè)計(jì)出“自動(dòng)屏蔽重疊功能”的子模塊,就能解決功能重復(fù)的問(wèn)題;提供一些諸如直接查詢?cè)诰€BNC、ANC或COCA語(yǔ)料檢索功能,也可以設(shè)置選擇必要的網(wǎng)上參考詞典和詞庫(kù)(如Moby Thesaurus和Wordnet等)的功能,能方便地跳轉(zhuǎn)到這些網(wǎng)站進(jìn)行必要的信息提取,以解決網(wǎng)絡(luò)資源利用的問(wèn)題。
上述幾個(gè)詞典輔助編纂和出版系統(tǒng)作為商業(yè)軟件已經(jīng)有10~20年的歷史了,這些軟件現(xiàn)已廣泛用于世界各大辭書出版社的詞典編纂與出版過(guò)程中,并取得令人矚目的成果。目前在我國(guó)市場(chǎng)上的國(guó)外英語(yǔ)詞典大多是利用這類軟件加工或編輯的。有了這些輔助平臺(tái),詞典編纂語(yǔ)料的搜集、加工處理和提取,詞典信息的編寫和編輯過(guò)程中的文字處理、統(tǒng)計(jì)和校改,以及建立詞典數(shù)據(jù)庫(kù)等都變得輕松和容易了。在提高詞典編纂效率和質(zhì)量的同時(shí),還能節(jié)省大量的人力、物力和時(shí)間。可以說(shuō),在辭書出版界,誰(shuí)擁有了這些現(xiàn)代化數(shù)字平臺(tái)和基于這些平臺(tái)的詞典語(yǔ)料庫(kù)和數(shù)據(jù)庫(kù),誰(shuí)就掌握了辭書編纂和出版的主動(dòng),就能編纂出版高質(zhì)量的辭書,在市場(chǎng)競(jìng)爭(zhēng)中立于不敗之地。
附 注
[1]由于版權(quán)問(wèn)題,無(wú)法獲得ABBYY公司編纂系統(tǒng)的樣本或免費(fèi)試用的機(jī)會(huì),只能從其網(wǎng)上公布的產(chǎn)品說(shuō)明和相關(guān)文章中找到一些截圖,并據(jù)此對(duì)其功能和結(jié)構(gòu)進(jìn)行描寫,內(nèi)容有很大的局限性,僅供參考。
1.De Schryver G M,Prinsloo D J.Dictionary-Making Process with“Simultaneous Feedback”from the Target Users to the Compilers.∥ Heid U.et al(eds.)Proceedings of the Ninth EURALEX International Congress.Stuttgart:Institut für Maschinelle Sprachverarbeitung,Universit?t Stuttgart,2000.
2.McNamara M.Dictionaries for All:XML to Final Product.∥XML Conference,Philadelphia,USA,2003.
3.ABBYY ? LingvoTMContent Dictionary Production System:An Instruction(Russia:ABBYY).
4. IDM's Dictionary Publishing System: Dictionary Editor Tutorial(France: Ingénierie Diffusion Multimédia).
5.IDM's Dictionary Publishing System:Technical Overview(France:Ingénierie Diffusion Multimédia).
6.IDM's Dictionary Publishing System:A Demo(France:Ingénierie Diffusion Multimédia).
7.TshwaneLex 4.0:A Demo(South Africa:TshwaneDJe).