孫文龍++鄒曉玲
摘要在《計(jì)算詞典學(xué)與新型詞典》的基礎(chǔ)上,《計(jì)算詞典學(xué)》對(duì)近十年來(lái)國(guó)內(nèi)外計(jì)算詞典學(xué)領(lǐng)域中的學(xué)術(shù)研究進(jìn)行系統(tǒng)梳理,展示了現(xiàn)代計(jì)算機(jī)技術(shù)應(yīng)用于詞典學(xué)研究、辭書(shū)編纂和電子詞典出版的新發(fā)展、新理論和新成果?!队?jì)算詞典學(xué)》可讀性強(qiáng),在豐富和完善計(jì)算詞典學(xué)理論框架上取得了進(jìn)步,對(duì)我國(guó)辭書(shū)現(xiàn)代化有著重要的引領(lǐng)作用。雖然還有疏漏不足之處,但白璧微瑕,仍不失為一部為時(shí)代而唱的力作。
關(guān)鍵詞計(jì)算詞典學(xué)新型詞典電子詞典辭書(shū)現(xiàn)代化啟示
一、引言
二十世紀(jì)六七十年代,計(jì)算詞典學(xué)研究在西方國(guó)家嶄露頭角,之后經(jīng)過(guò)約二十年的發(fā)展,其學(xué)科理論體系的構(gòu)建日趨明朗。20世紀(jì)90年代初,電子詞典猶如雨后春筍般發(fā)展起來(lái),國(guó)內(nèi)外市場(chǎng)出現(xiàn)了一波電子詞典出版的高峰。在這種國(guó)際學(xué)術(shù)背景下,以章宜華教授為學(xué)術(shù)帶頭人的項(xiàng)目組,以廣東省“‘九五重點(diǎn)理論規(guī)劃項(xiàng)目——90年代新型詞典研究”為契機(jī),以現(xiàn)代詞典學(xué)理論為基礎(chǔ),進(jìn)行新型電子詞典種類(lèi)、功能特點(diǎn)和構(gòu)造單元,及其對(duì)詞典學(xué)編纂理論和實(shí)踐影響的研究,取得了以《計(jì)算詞典學(xué)與新型詞典》(2004)為代表的標(biāo)志性成果。黃建華教授(2004)贊譽(yù)“他敏銳地把這場(chǎng)‘計(jì)算機(jī)給詞典學(xué)帶來(lái)的革命(Svensén 1993)的脈搏摸準(zhǔn)了”,為建立計(jì)算詞典學(xué)理論框架、促進(jìn)我國(guó)詞典學(xué)研究和詞典編纂實(shí)踐與現(xiàn)代數(shù)字技術(shù)盡快接軌做出了貢獻(xiàn)。
時(shí)至2010年夏秋之交,恰逢上海辭書(shū)出版社策劃出版“辭書(shū)研究文庫(kù)”系列叢書(shū),章宜華教授對(duì)《計(jì)算詞典學(xué)與新型詞典》(以下簡(jiǎn)稱“舊版”)進(jìn)行了全面修訂,于2013年推出了一部學(xué)術(shù)性和前瞻性兼具的新作——《計(jì)算詞典學(xué)》(以下簡(jiǎn)稱“新版”)。作者以深厚的語(yǔ)言學(xué)和詞典學(xué)理論素養(yǎng),使新版真正成為一部具有縱深度、富于立體感、理論與實(shí)踐水乳交融的時(shí)代力作。因此,舊版到新版絕非書(shū)名的簡(jiǎn)單更換,其在理論和實(shí)踐上的貢獻(xiàn)值得我國(guó)辭書(shū)界和廣大辭書(shū)研究者關(guān)注,同時(shí)也對(duì)我國(guó)計(jì)算詞典學(xué)的發(fā)展具有重要的意義。
二、新版變化特點(diǎn)
較之于舊版,新版最突出的特點(diǎn)之一是寫(xiě)作資料新,具體體現(xiàn)在文獻(xiàn)新、案例新和數(shù)據(jù)新三個(gè)方面;其次是語(yǔ)言精確,進(jìn)一步提高了其可讀性。
1.資料新
首先,以英文文獻(xiàn)為例,舊版中最新英文參考文獻(xiàn)截至2002年,而新版中新增了2003年以來(lái)的重要英文文獻(xiàn)18篇,其中包括2010年到2012年的文獻(xiàn)8篇,占新增文獻(xiàn)的44%。這些新文獻(xiàn)反映了近十年來(lái)國(guó)外計(jì)算詞典學(xué)領(lǐng)域理論研究的最新發(fā)展動(dòng)態(tài),如與計(jì)算詞匯學(xué)緊密聯(lián)系的電子詞庫(kù)理論、與詞典語(yǔ)料深加工有關(guān)的語(yǔ)料庫(kù)模式分析和常態(tài)與拓展理論、框架網(wǎng)標(biāo)注的注釋分層技術(shù)、電子詞典知識(shí)信息詞匯層次的詞匯共核理論等。有了這些學(xué)術(shù)前沿文獻(xiàn)的支撐,新版在構(gòu)筑計(jì)算詞典學(xué)的理論框架方面更能以“理”服人。
其次,新版對(duì)介紹現(xiàn)代計(jì)算機(jī)技術(shù)在詞典編纂實(shí)踐中的應(yīng)用的內(nèi)容幾乎全部進(jìn)行了置換或重寫(xiě),并輔以較新的案例。例如,新版第九章在介紹光盤(pán)和芯片詞典時(shí),全部選用有代表性的新案例,分別介紹了《牛津高階英語(yǔ)詞典》光盤(pán)版第7版(2005)、《朗文當(dāng)代英語(yǔ)詞典》光盤(pán)版第5版(2009)、好易通牛津詞典王CD810、諾亞舟考試王416和卡西歐EW5000L。而舊版中所介紹內(nèi)容多為20世紀(jì)90年代的光盤(pán)詞典,內(nèi)容也稍顯龐雜。
最后,計(jì)算機(jī)技術(shù)經(jīng)過(guò)近十年的發(fā)展,舊版中提供的一些數(shù)據(jù)在今天看來(lái)只具有參考價(jià)值和歷史意義。新版對(duì)數(shù)據(jù)信息的更新非常及時(shí),見(jiàn)表1:
表1
新舊兩版數(shù)據(jù)信息變化示例
舊版新版
例1
語(yǔ)料庫(kù)迅速?gòu)摹笆f(wàn)級(jí)”向“百萬(wàn)級(jí)”、“千萬(wàn)級(jí)”和“億級(jí)”發(fā)展,目前COBUILD語(yǔ)料庫(kù)的容量已超過(guò)5億詞。如果沒(méi)有運(yùn)算速度達(dá)到每秒幾億次、幾十億次的芯片和超大容量的存儲(chǔ)介質(zhì),大規(guī)模語(yǔ)料庫(kù)的建立和運(yùn)行是不可想象的。(p.9)
語(yǔ)料庫(kù)迅速?gòu)摹鞍偃f(wàn)級(jí)”向“千萬(wàn)級(jí)”和“億級(jí)”發(fā)展,目前COBUILD語(yǔ)料庫(kù)的容量已超過(guò)5億多詞,其中包括一個(gè)用于教學(xué)的5600萬(wàn)詞的子語(yǔ)料庫(kù)。美國(guó)近年新建立的“當(dāng)代美國(guó)英語(yǔ)語(yǔ)料庫(kù)”也達(dá)到了4.25億詞,而2010年11月發(fā)布的基于網(wǎng)絡(luò)的英語(yǔ)語(yǔ)料庫(kù)達(dá)到了33億詞(1.0版)。(p.15)
例2目前運(yùn)行于網(wǎng)絡(luò)上的詞典很多,很難精確統(tǒng)計(jì)。筆者于2003年4月26日利用“google”搜索引擎對(duì)“dictionary”進(jìn)行檢索,得到的結(jié)果是1320萬(wàn)項(xiàng)。(p.319)
目前運(yùn)行于網(wǎng)絡(luò)上的詞典很多,很難精確統(tǒng)計(jì)。筆者于2011年9月10日利用“谷歌”搜索引擎對(duì)“dictionary”進(jìn)行檢索,得到的匹配數(shù)字是6.77億條。(p.359)
2.語(yǔ)言精準(zhǔn)
新版中,作者在語(yǔ)言上字斟句酌,下足了功夫。試看從書(shū)中摘取的幾個(gè)例子,見(jiàn)表2:
表2
新舊兩版語(yǔ)言變化示例
舊版新版
例1
人類(lèi)有著五千多年悠長(zhǎng)的文明史,而詞典編纂史若從詞集開(kāi)始算起也有四千多年了。(p.1)
人類(lèi)有史可考的文明有五千多年了,詞典編纂史若從詞集開(kāi)始算起已有四千多年。(p.1—2)
例2多媒體詞典的誕生是當(dāng)代詞典學(xué)的重要標(biāo)志之一。(p.2)
集音頻、視頻和文本材料于一體的多媒體詞典的誕生是當(dāng)代詞典學(xué)的重要標(biāo)志之一。(p.4)
例3計(jì)算語(yǔ)言學(xué)實(shí)際上就是語(yǔ)言學(xué)的一種研究方法,即以數(shù)理的方法……對(duì)語(yǔ)言的各個(gè)層面進(jìn)行統(tǒng)計(jì)分析和處理。(p.6)
計(jì)算語(yǔ)言學(xué)實(shí)際上就是凸顯語(yǔ)言學(xué)的一種研究方法,即以數(shù)理模型的方法……對(duì)自然語(yǔ)言的各個(gè)層面進(jìn)行統(tǒng)計(jì)分析和處理。(p.8)
例4
世界上最早的芯片詞典誕生于1983年。(p.356)
世界上最早的芯片詞典誕生于1981年10月,是卡西歐公司在小型計(jì)算器和數(shù)碼技術(shù)的基礎(chǔ)上開(kāi)發(fā)出來(lái)的。(p.325)
從表2可以看出:新版中例1的表述更科學(xué),避免了主觀臆斷;例2經(jīng)過(guò)重新擴(kuò)充,命題內(nèi)容更有助于讀者加深對(duì)“多媒體詞典”的理解;例3通過(guò)新增三個(gè)詞語(yǔ),使計(jì)算詞典學(xué)的本質(zhì)特征更加明晰;例4通過(guò)重新考證,更正了舊版中的事實(shí)錯(cuò)誤,反映出作者一絲不茍的治學(xué)態(tài)度。上述例子在新版中俯拾即是,不勝枚舉。簡(jiǎn)言之,同舊版相比,新版的語(yǔ)句用詞更加準(zhǔn)確,意義描述更加清晰,語(yǔ)言表達(dá)也更有說(shuō)服力。
三、新版在理論上的貢獻(xiàn)
從計(jì)算詞典學(xué)形成的理論背景和社會(huì)基礎(chǔ)出發(fā),舊版較為系統(tǒng)地闡述了計(jì)算詞典學(xué)的研究特色、任務(wù)、目標(biāo)、研究范圍及內(nèi)容,探討了計(jì)算詞典學(xué)與計(jì)算語(yǔ)言學(xué)、計(jì)算詞匯學(xué)和語(yǔ)料庫(kù)語(yǔ)言學(xué)等相關(guān)學(xué)科的聯(lián)系,“首次建立了計(jì)算詞典學(xué)的理論框架,填補(bǔ)了國(guó)內(nèi)相關(guān)研究的空白”(夏立新 2005:154)。在舊版的基礎(chǔ)上,新版從計(jì)算詞典學(xué)的定義、產(chǎn)生的內(nèi)外因及研究背景入手,首次明確地論述了計(jì)算詞典學(xué)的性質(zhì)特征,提出了計(jì)算詞典學(xué)的理論基礎(chǔ)和研究方法,重新評(píng)估了計(jì)算詞典學(xué)的主要研究任務(wù),從而使計(jì)算詞典學(xué)的理論框架更加明晰和系統(tǒng)。
1.明確計(jì)算詞典學(xué)的性質(zhì)特征
計(jì)算詞典學(xué)作為一門(mén)不斷發(fā)展的新興學(xué)科,其理論框架的構(gòu)建和完善離不開(kāi)對(duì)其學(xué)科性質(zhì)特征的明確定位。新舊兩版均在第一章第二節(jié)中從三個(gè)方面分別描述了計(jì)算詞典學(xué)的學(xué)科性質(zhì)特征,但在結(jié)構(gòu)安排和內(nèi)容側(cè)重上有所不同,如表3所示。
表3新舊兩版對(duì)計(jì)算詞典學(xué)性質(zhì)特征的論述
舊版新版
第二節(jié)計(jì)算詞典學(xué)的研究特色
一、計(jì)算詞典學(xué)的特色
二、語(yǔ)料庫(kù)詞典學(xué)的特色
三、計(jì)算詞典學(xué)與相關(guān)學(xué)科
第二節(jié)計(jì)算詞典學(xué)的性質(zhì)特征
一、計(jì)算詞典學(xué)的理論特征
二、計(jì)算詞典學(xué)的實(shí)踐特征
三、計(jì)算詞典學(xué)的學(xué)科交叉融合
從表3可以看出,通過(guò)對(duì)舊版的調(diào)整,新版在結(jié)構(gòu)上更具系統(tǒng)性,內(nèi)容上更有條理性。首先,新版從兩個(gè)已被廣泛認(rèn)可的論斷出發(fā),對(duì)計(jì)算詞典學(xué)的性質(zhì)特征進(jìn)行了較為全面的闡述:其一,依據(jù)“詞典學(xué)是研究詞典編纂理論和實(shí)踐的學(xué)科”(章宜華 2013:16)的論斷,新版區(qū)分了計(jì)算詞典學(xué)的理論特征和實(shí)踐特征;其二,根據(jù)“計(jì)算詞典學(xué)是一個(gè)綜合性的、跨學(xué)科的、嶄新的研究領(lǐng)域”(章宜華 2004:19)的論斷,新版進(jìn)一步強(qiáng)調(diào)了計(jì)算詞典學(xué)的交叉學(xué)科性質(zhì)。
其次,從研究?jī)?nèi)容的角度來(lái)看,計(jì)算詞典學(xué)、計(jì)算語(yǔ)言學(xué)、計(jì)算詞匯學(xué)與語(yǔ)料庫(kù)語(yǔ)言學(xué)有著密切的關(guān)系,彼此相互交織,難以明確分隔,比如它們研究的主要對(duì)象——詞匯及其語(yǔ)言屬性相同,只是研究的角度、方法、重點(diǎn)和目的略有不同,現(xiàn)在沒(méi)有可能也沒(méi)有必要將它們分開(kāi)來(lái)對(duì)待。(章宜華 2013:19;Ooi & Vincent 1998:37—38)由此,新版明確了計(jì)算詞典學(xué)的理論特征和實(shí)踐特征,前者是基于計(jì)算機(jī)技術(shù)的詞典研究和編纂的一種新型研究范式,呈現(xiàn)出不同學(xué)科理論交叉的特點(diǎn);后者則主要體現(xiàn)在三個(gè)方面:即詞典語(yǔ)料庫(kù)和數(shù)據(jù)庫(kù)、計(jì)算機(jī)輔助詞典編纂和電子詞典,它們“分別代表了目前計(jì)算詞典學(xué)的三個(gè)主要研究方向”(章宜華 2007:4—8),其中,“語(yǔ)料庫(kù)是計(jì)算詞典學(xué)發(fā)展的原動(dòng)力”(章宜華 2013:20)。
第三,新版沒(méi)有過(guò)多地糾纏于“計(jì)算詞典學(xué)是否已發(fā)展為一門(mén)獨(dú)立的學(xué)科”“計(jì)算詞典學(xué)作為一門(mén)交叉學(xué)科與其他學(xué)科的分野是什么”等理論問(wèn)題,而是在分析計(jì)算詞典學(xué)產(chǎn)生的內(nèi)外因的基礎(chǔ)上,用更多的筆墨凸顯了計(jì)算詞典學(xué)的交叉學(xué)科性質(zhì)。在21世紀(jì)的信息社會(huì),傳統(tǒng)詞典等工具書(shū)提供信息的方法、手段、內(nèi)容等已經(jīng)滿足不了人們學(xué)習(xí)的需要,這個(gè)主要矛盾促使傳統(tǒng)詞典學(xué)必須進(jìn)行研究范式的變革,拓展新的研究領(lǐng)域,這是計(jì)算詞典學(xué)產(chǎn)生的內(nèi)在原因;計(jì)算機(jī)技術(shù)的不斷發(fā)展,特別是自然語(yǔ)言處理中對(duì)擁有超強(qiáng)數(shù)據(jù)處理能力的大型詞庫(kù)或電子詞典的迫切需求,是計(jì)算詞典學(xué)產(chǎn)生的一個(gè)重要外因。正是這些復(fù)雜的內(nèi)外因交織在一起,才使詞庫(kù)和語(yǔ)料成為計(jì)算機(jī)科學(xué)、語(yǔ)料庫(kù)語(yǔ)言學(xué)、詞匯學(xué)、詞典學(xué)、自然語(yǔ)言處理等學(xué)科研究的共同焦點(diǎn),“計(jì)算機(jī)正好是不同學(xué)科融合的一個(gè)交叉點(diǎn)”(章宜華 2013:23)。
總之,經(jīng)過(guò)幾十年的發(fā)展和完善,計(jì)算詞典學(xué)已成長(zhǎng)為一個(gè)系統(tǒng)的學(xué)科(章宜華 2013:22),計(jì)算詞典學(xué)的理論框架在新版中更加明晰。
2.提出計(jì)算詞典學(xué)的理論基礎(chǔ)和研究方法
舊版中,作者從與計(jì)算詞典學(xué)緊密相連的兩個(gè)學(xué)科——計(jì)算語(yǔ)言學(xué)和計(jì)算詞匯學(xué)入手,較為具體地論述了計(jì)算詞典學(xué)產(chǎn)生的理論背景,但沒(méi)有明確指出該學(xué)科的理論基礎(chǔ)和研究方法。幾年后,章宜華教授(2007:3)才首次提出計(jì)算詞典學(xué)的技術(shù)基礎(chǔ)是計(jì)算語(yǔ)言學(xué),理論基礎(chǔ)為計(jì)算詞匯學(xué)。新版在此基礎(chǔ)上更進(jìn)一步,將計(jì)算語(yǔ)言學(xué)也納入到計(jì)算詞典學(xué)的理論基礎(chǔ)中,并辯證地指出“計(jì)算詞典學(xué)與計(jì)算語(yǔ)言學(xué)密切相關(guān),后者是前者的理論基礎(chǔ),前者是后者的具體實(shí)踐”(章宜華 2013:5—6)。新版對(duì)計(jì)算詞典學(xué)理論基礎(chǔ)的論斷是有充分依據(jù)的:首先,計(jì)算詞典學(xué)作為一個(gè)交叉學(xué)科,計(jì)算語(yǔ)言學(xué)是其與其他學(xué)科聯(lián)系的橋梁,計(jì)算語(yǔ)言學(xué)學(xué)科理論的建設(shè)和發(fā)展將會(huì)直接帶動(dòng)計(jì)算詞典學(xué)的發(fā)展;其次,出于自然語(yǔ)言處理形式化的需要,20世紀(jì)80年代中期以來(lái)詞匯論悄然興起,在語(yǔ)言事實(shí)解釋的焦點(diǎn)從“以句法規(guī)則為中心”向“以詞匯描寫(xiě)為中心”轉(zhuǎn)移的大背景下,詞庫(kù)研究由于與計(jì)算語(yǔ)言學(xué)的結(jié)合,成為現(xiàn)代詞匯學(xué)的主要研究?jī)?nèi)容,它側(cè)重于“詞庫(kù)語(yǔ)法功能和語(yǔ)義結(jié)構(gòu)的分析,與著重于語(yǔ)法功能和語(yǔ)義結(jié)構(gòu)描寫(xiě)的計(jì)算詞典學(xué)相輔相成”(章宜華 2007:3)。因此,計(jì)算詞匯學(xué)成為計(jì)算詞典學(xué)汲取理論營(yíng)養(yǎng)的另一個(gè)重要來(lái)源。
此外,有關(guān)計(jì)算詞典學(xué)的研究方法在舊版中也付闕如。新版中則明確指出“計(jì)算詞典學(xué)研究的方法有詞典語(yǔ)料庫(kù)、數(shù)據(jù)庫(kù)、計(jì)算機(jī)輔助詞典編纂和電子詞典等”(章宜華 2013:13),它們是實(shí)現(xiàn)辭書(shū)編纂、出版、發(fā)行和修訂自動(dòng)化這一計(jì)算詞典學(xué)終極研究目標(biāo)的重要保證。其中值得一提的是,新版中作者新增了四個(gè)與此相關(guān)的重要內(nèi)容:其一是有關(guān)詞典語(yǔ)料的精加工與數(shù)據(jù)化,主要包括詞匯屬性速描、英語(yǔ)詞匯數(shù)據(jù)庫(kù)、語(yǔ)料庫(kù)模式分析和框架網(wǎng)詞匯數(shù)據(jù)庫(kù)四個(gè)方面,提出了國(guó)際辭書(shū)現(xiàn)代化技術(shù)的新理念;其二,在論述計(jì)算機(jī)技術(shù)與詞典編纂創(chuàng)新之間的關(guān)系時(shí),作者介紹了國(guó)際上三個(gè)比較有代表性的詞典編纂平臺(tái):法國(guó)IDM的詞典生成系統(tǒng)DPS、俄羅斯泰比詞典編寫(xiě)系統(tǒng)和南非TshwaneLex詞典編纂系統(tǒng),為我國(guó)計(jì)算機(jī)輔助詞典編纂工具及商業(yè)編纂平臺(tái)的開(kāi)發(fā)提供了借鑒;其三,就目前技術(shù)水平而言,作為詞典的主要生成方式——基于數(shù)據(jù)庫(kù)的詞典生成,作者從詞典數(shù)據(jù)庫(kù)的性質(zhì)特征、理論基礎(chǔ)和數(shù)據(jù)定義三個(gè)方面,首次詳盡論述了電子詞典數(shù)據(jù)庫(kù)的特點(diǎn);其四,在開(kāi)發(fā)供“人機(jī)兩用”電子詞典的原則指導(dǎo)下,作者首次嘗試提出了電子詞典編纂與制作的標(biāo)準(zhǔn)化原則,與傳統(tǒng)詞典編纂原則互相補(bǔ)充,充實(shí)和完善了詞典學(xué)理論框架。
3.重估計(jì)算詞典學(xué)的研究任務(wù)
從形成歷史的角度出發(fā),新版重新對(duì)計(jì)算詞典學(xué)的研究任務(wù)進(jìn)行了評(píng)估,表4是新舊兩版在此方面的對(duì)比。
表4新舊兩版“計(jì)算詞典學(xué)研究任務(wù)”對(duì)比
舊版新版
研究任務(wù)
計(jì)算詞典學(xué)的首要任務(wù)是解決詞典知識(shí)內(nèi)容的“電子化”和“機(jī)讀性”問(wèn)題;其二是研究如何實(shí)現(xiàn)詞典編纂自動(dòng)化;其三是研究如何實(shí)現(xiàn)大型詞典的發(fā)行無(wú)紙化。(p.14)
計(jì)算詞典學(xué)的首要任務(wù)是解決自然語(yǔ)言處理所需的機(jī)讀詞典問(wèn)題;其二是紙質(zhì)詞典內(nèi)容的“電子化”和“機(jī)讀性”問(wèn)題;其三是研究如何利用詞典數(shù)據(jù)庫(kù)生成詞典;其四是研究如何實(shí)現(xiàn)詞典編纂自動(dòng)化;其五,研究如何實(shí)現(xiàn)大型詞典的發(fā)行無(wú)紙化。(p.19)
首先,從表4可以看出,從計(jì)算詞典學(xué)的發(fā)展歷史來(lái)看,將其研究的首要任務(wù)定位為“解決自然語(yǔ)言處理所需的機(jī)讀詞典問(wèn)題”是符合客觀事實(shí)的。因?yàn)樵~典與計(jì)算機(jī)結(jié)合的最初構(gòu)想始于自然語(yǔ)言處理領(lǐng)域?qū)C(jī)器翻譯的研究,而對(duì)機(jī)器翻譯系統(tǒng)的開(kāi)發(fā)直接推動(dòng)了機(jī)器詞典的發(fā)展。近年來(lái),機(jī)器詞典的研制已成為一種專(zhuān)門(mén)學(xué)問(wèn),在語(yǔ)言信息的處理中變得越來(lái)越重要?!霸谟?jì)算語(yǔ)言學(xué)界,越來(lái)越多的專(zhuān)家把機(jī)器詞典的規(guī)模和質(zhì)量看作是自然語(yǔ)言處理系統(tǒng)的‘瓶頸。”(林杏光 1999:156)因此計(jì)算詞典學(xué)視角下的用戶不再僅僅是人,編者還要為機(jī)器著想,開(kāi)發(fā)可以直接或間接地服務(wù)于自然語(yǔ)言處理的機(jī)器詞典,這也是編纂機(jī)讀人用詞典的技術(shù)基礎(chǔ)和前提。
其次,新版中及時(shí)補(bǔ)充了目前計(jì)算詞典學(xué)的另一個(gè)主要研究任務(wù):研究詞典數(shù)據(jù)庫(kù)的建設(shè),以及數(shù)據(jù)的統(tǒng)計(jì)分析、自動(dòng)存取、自動(dòng)識(shí)別、自動(dòng)轉(zhuǎn)換成各類(lèi)詞典的問(wèn)題??梢灶A(yù)見(jiàn)的詞典生成有兩種方法——基于語(yǔ)料庫(kù)的詞典生成和基于數(shù)據(jù)庫(kù)的詞典生成。前者是指利用語(yǔ)料庫(kù)直接生成各類(lèi)詞典,可以說(shuō)是計(jì)算詞典學(xué)研究的最高境界,也是詞典學(xué)家最美好的夢(mèng)想,但目前的研究水平還不能讓詞典學(xué)家這個(gè)“最美好的夢(mèng)想”得以實(shí)現(xiàn);后者是借助詞典輔助編纂系統(tǒng),按詞典的微觀結(jié)構(gòu)框架構(gòu)建詞典數(shù)據(jù)庫(kù),在數(shù)據(jù)庫(kù)的基礎(chǔ)上生成詞典,是目前詞典生成的一個(gè)主要手段。(章宜華 2007:10—11)
總的來(lái)說(shuō),隨著計(jì)算機(jī)技術(shù)發(fā)展的日新月異,詞典學(xué)中新理論和新技術(shù)應(yīng)用的不斷深化,除部分基礎(chǔ)理論外,舊版中原來(lái)介紹的技術(shù)和描寫(xiě)的事實(shí)已經(jīng)發(fā)生巨大變化或不復(fù)存在了,新版對(duì)計(jì)算詞典學(xué)的整個(gè)框架內(nèi)容進(jìn)行重新評(píng)估、研究和重構(gòu),為學(xué)科的發(fā)展奠定了堅(jiān)實(shí)的理論基礎(chǔ)。
四、新版對(duì)我國(guó)計(jì)算詞典學(xué)發(fā)展的啟示
我國(guó)從20世紀(jì)70年代末才開(kāi)始接觸計(jì)算詞典學(xué)的相關(guān)研究,起步較晚,在理論研究方面主要以介紹國(guó)外理論為主,這種情況在90年代之前尤為明顯,其研究?jī)?nèi)容駁雜,研究成果不成系統(tǒng),散見(jiàn)于各個(gè)刊物或論文集中。目前國(guó)內(nèi)在計(jì)算詞典學(xué)方面的系統(tǒng)研究還處在初級(jí)階段,與國(guó)外相比還存在很大差距,這一現(xiàn)象值得我國(guó)辭書(shū)界思考。章宜華教授的新版著作對(duì)推動(dòng)我國(guó)辭書(shū)現(xiàn)代化進(jìn)程有著重要的啟示。
1.轉(zhuǎn)變研究思路,進(jìn)行理論創(chuàng)新
受語(yǔ)言本體主義研究方法的影響,我國(guó)大多數(shù)研究仍將詞典編纂看成是純粹的語(yǔ)言活動(dòng),視詞典研究為一個(gè)封閉的系統(tǒng),就詞典而論詞典,囿于詞典本體研究范圍內(nèi)。具體表現(xiàn)在:個(gè)案孤立分析多,系統(tǒng)研究成果少;隨感經(jīng)驗(yàn)總結(jié)多,宏觀理論概括少;編纂工藝研究多,學(xué)科理論構(gòu)建少。此外,國(guó)內(nèi)辭書(shū)研究者對(duì)與自然語(yǔ)言處理和計(jì)算語(yǔ)言學(xué)相關(guān)的前沿理論研究不多,如廣域短語(yǔ)結(jié)構(gòu)語(yǔ)法、中心詞驅(qū)動(dòng)短語(yǔ)語(yǔ)法、邏輯數(shù)理語(yǔ)義學(xué)、蒙泰格語(yǔ)義學(xué)、篇章—語(yǔ)義理論、框架語(yǔ)義學(xué)等,這些理論在國(guó)外詞典學(xué)界已引起廣泛的討論和研究。(章宜華 2005:6)我國(guó)計(jì)算詞典學(xué)的發(fā)展離不開(kāi)現(xiàn)代辭書(shū)理論,結(jié)合中國(guó)實(shí)際,吸收國(guó)外先進(jìn)理論并進(jìn)行創(chuàng)新,是加快我國(guó)辭書(shū)現(xiàn)代化進(jìn)程的必由之路。
2.瞄準(zhǔn)國(guó)際辭書(shū)現(xiàn)代化技術(shù)的新理念——辭書(shū)語(yǔ)料數(shù)據(jù)化
在信息化時(shí)代,辭書(shū)現(xiàn)代化的關(guān)鍵是計(jì)算機(jī)技術(shù)和數(shù)字化技術(shù)的應(yīng)用,其實(shí)質(zhì)就是文字處理與傳輸?shù)闹悄芑托畔⒒?。在辭書(shū)現(xiàn)代化技術(shù)方面,國(guó)內(nèi)辭書(shū)界的主要精力仍放在語(yǔ)料庫(kù)的建設(shè)和使用上。而實(shí)際情況是,由于語(yǔ)料搜集的方便和國(guó)際上免費(fèi)大型語(yǔ)料庫(kù)的出現(xiàn),語(yǔ)料庫(kù)的建立和使用已經(jīng)不存在技術(shù)和資源問(wèn)題。國(guó)際研究重點(diǎn)已轉(zhuǎn)向語(yǔ)料的深加工和數(shù)據(jù)庫(kù)建設(shè),因?yàn)樗麄冋J(rèn)識(shí)到,編者要想梳理海量語(yǔ)料并從中找到有用的東西絕對(duì)是一件既耗時(shí)又費(fèi)力的事情。(章宜華 2012:1—9)因此,我國(guó)辭書(shū)工作者應(yīng)看清國(guó)際學(xué)術(shù)發(fā)展潮流,利用語(yǔ)言學(xué)研究的新成果和數(shù)據(jù)挖掘技術(shù),將研究重心從語(yǔ)料庫(kù)建設(shè)逐步轉(zhuǎn)移到詞典數(shù)據(jù)庫(kù)建設(shè)上來(lái),從而大大提高語(yǔ)料的精加工能力和詞典編纂的效率。
3.加強(qiáng)電子詞典的開(kāi)發(fā)
電子詞典是辭書(shū)現(xiàn)代化技術(shù)的具體體現(xiàn)。從表面上看,我國(guó)電子詞典市場(chǎng)呈現(xiàn)出一片繁榮的景象,各種類(lèi)型、各種價(jià)位的詞典應(yīng)有盡有,但看似繁榮的電子詞典市場(chǎng)背后卻危機(jī)四伏。這與我國(guó)電子詞典發(fā)展的策略問(wèn)題不無(wú)關(guān)系。歐美電子詞典的發(fā)展策略定位準(zhǔn)確——以辭書(shū)而不是電子為本體來(lái)開(kāi)發(fā)電子詞典,因此他們的電子詞典大多是由著名辭書(shū)出版機(jī)構(gòu)在原版紙質(zhì)詞典數(shù)據(jù)的基礎(chǔ)上開(kāi)發(fā)出來(lái)的。我國(guó)的情況正好相反:電子詞典的出版是商業(yè)行為占主導(dǎo)地位,很少有專(zhuān)業(yè)辭書(shū)出版機(jī)構(gòu)參與。(章宜華 2013:417—420)其結(jié)果是,歐美國(guó)家基于現(xiàn)代化技術(shù)和編纂理念開(kāi)發(fā)出的電子詞典,占據(jù)了世界英語(yǔ)和與英語(yǔ)相關(guān)的雙語(yǔ)詞典的大部分市場(chǎng)(包括我國(guó)的辭書(shū)市場(chǎng))。(章宜華 2005:8)為此,國(guó)內(nèi)辭書(shū)界應(yīng)及時(shí)總結(jié)經(jīng)驗(yàn)教訓(xùn),分析辭書(shū)市場(chǎng)和中國(guó)英語(yǔ)學(xué)習(xí)者的需求,立足當(dāng)前,著眼未來(lái),為我國(guó)電子詞典的長(zhǎng)遠(yuǎn)發(fā)展制定出切實(shí)可行的規(guī)劃。
五、新版的不足
首先,由于主客觀等多方面的原因,書(shū)中出現(xiàn)了一些疏漏之處,見(jiàn)表5:
表5新版中“疏漏之處”示例
例證疏漏之處
例1
人類(lèi)有史可考的文明有五千多年了,詞典編纂史若從詞集開(kāi)始算起已有四千多年[1]。(p.1—2)上標(biāo)符號(hào)“[1]”所指注釋在文中缺失。
例2正如劉根輝(2005:2)所說(shuō)……(p.11)新增引文在參考文獻(xiàn)中疏漏未列
例3本章(第九章)主要對(duì)歐美國(guó)家以及我國(guó)臺(tái)灣地區(qū)和內(nèi)地的光盤(pán)電子詞典做一些探討……(p.327)內(nèi)容概要和下文具體章節(jié)內(nèi)容安排不相符
表5中例1和例2主要是疏忽所致,再版時(shí)增補(bǔ)釋文和參考文獻(xiàn)即可;例3和舊版257頁(yè)第八章“光盤(pán)電子詞典”的內(nèi)容概要完全相同,但新舊兩章的結(jié)構(gòu)及內(nèi)容安排已全然不同,因此新版中第九章的內(nèi)容提要需要置換。
此外,新版第八章雖然明確了電子詞典編纂的一般原則和標(biāo)準(zhǔn)化原則,但并沒(méi)有進(jìn)一步就“如何建立起一套電子詞典評(píng)估體系”這個(gè)問(wèn)題進(jìn)行探討。計(jì)算詞典學(xué)評(píng)價(jià)和批評(píng)理論體系的構(gòu)建也是整個(gè)計(jì)算詞典學(xué)理論框架的重要組成部分。新版第九章在介紹光盤(pán)與芯片電子詞典時(shí),主要以常識(shí)描述和知識(shí)性介紹為主,缺少對(duì)各類(lèi)詞典的對(duì)比分析和優(yōu)劣評(píng)判,如可以對(duì)《牛津高階英語(yǔ)詞典》《朗文當(dāng)代英語(yǔ)詞典》等英語(yǔ)學(xué)習(xí)詞典的光盤(pán)版進(jìn)行橫向或縱向的對(duì)比分析,指出其變化發(fā)展特點(diǎn)和優(yōu)缺點(diǎn)及其對(duì)我國(guó)英漢學(xué)習(xí)詞典光盤(pán)版開(kāi)發(fā)的啟示等。
六、結(jié)語(yǔ)
一部好的學(xué)術(shù)著作必須傾聽(tīng)時(shí)代的足音,把握時(shí)代的脈搏,真正做到為時(shí)代而唱。章宜華教授以其深厚的學(xué)術(shù)功底、精益求精的治學(xué)態(tài)度和“為時(shí)而著”的歷史使命感,把近十年來(lái)我國(guó)和西方主要國(guó)家對(duì)現(xiàn)代計(jì)算機(jī)技術(shù)在詞典學(xué)理論和實(shí)踐中的應(yīng)用進(jìn)行系統(tǒng)的調(diào)查和梳理,為我們描繪了一幅令人向往的圖景。盡管新著中仍存在一些不足,但瑕不掩瑜。正如黃建華教授(2004)所指出的那樣:“當(dāng)然,寫(xiě)進(jìn)書(shū)中的某些內(nèi)容不久也會(huì)過(guò)時(shí)而歸于無(wú)用,但始終力求站在當(dāng)代學(xué)科前沿的精神,那是永存的?!?/p>
參考文獻(xiàn)
1.黃建華. 《計(jì)算詞典學(xué)與新型詞典》序.∥章宜華. 計(jì)算詞典學(xué)與新型詞典. 上海: 上海辭書(shū)出版社,2004.
2.林杏光. 詞匯語(yǔ)義與計(jì)算語(yǔ)言學(xué). 北京: 語(yǔ)文出版社,1999.
3.夏立新. 一部學(xué)術(shù)性與實(shí)用性俱佳的詞典學(xué)力作——《計(jì)算詞典學(xué)與新型詞典》評(píng)介. 辭書(shū)研究,2005 (1).
4.章宜華. 計(jì)算詞典學(xué)與新型詞典. 上海: 上海辭書(shū)出版社,2004.
5.章宜華. 我國(guó)計(jì)算詞典學(xué)發(fā)展的問(wèn)題及對(duì)策.∥張紹麒. 辭書(shū)與數(shù)字化研究. 上海: 上海辭書(shū)出版社,2005.
6.章宜華. 關(guān)于計(jì)算詞典學(xué)理論框架的探討. 辭書(shū)研究,2007 (6).
7.章宜華. 國(guó)際辭書(shū)現(xiàn)代化技術(shù)的新理念:辭書(shū)語(yǔ)料數(shù)據(jù)化. 辭書(shū)研究,2012 (2).
8.章宜華. 計(jì)算詞典學(xué). 上海: 上海辭書(shū)出版社,2013.
9.Ooi V B Y. Computer Corpus Lexicography. Edinburgh: Edinburgh University Press, 1998.
10.Svensén B. Practical Lexicography: Principles and Methods of DictionaryMaking. Oxford: Oxford University Press, 1993.
(青島理工大學(xué)基礎(chǔ)教學(xué)部臨沂273400)
(責(zé)任編輯李瀟瀟)