張 暉
(全國科學(xué)技術(shù)名詞審定委員會(huì),北京 100717)
科技新詞工作是科技名詞審定工作的重要補(bǔ)充??萍济~審定工作是全國科技名詞委的核心業(yè)務(wù)內(nèi)容。常態(tài)的名詞審定工作以各學(xué)科委員會(huì)專家委員為主體,遵照全國科技名詞委制定的《科學(xué)技術(shù)名詞審定原則與方法》(以下簡稱《原則》)進(jìn)行,最終的成果以出版《××學(xué)科名詞》的形式向社會(huì)公布。每部學(xué)科名詞在一定周期內(nèi)啟動(dòng)修訂,并以再版形式向社會(huì)公布。科技新詞工作的最初設(shè)想源于希望解決學(xué)科名詞書修訂周期長,不能達(dá)到及時(shí)規(guī)范新出現(xiàn)的、重要的科技名詞的目的。針對(duì)科學(xué)技術(shù)界新出現(xiàn)的新理論、新方法等開展的靈活多樣的新詞收集工作,可以在一定程度上解決上述問題。
科技新詞工作是與社會(huì)形成良性互動(dòng)的重要渠道??萍夹略~的出現(xiàn)源于科技的發(fā)展,這符合詞語產(chǎn)生的自然規(guī)律。科技名詞與科技概念一一對(duì)應(yīng),也符合語言規(guī)范性的特點(diǎn)。但有些刻意制造的、張冠李戴的科技名詞出現(xiàn)在某些領(lǐng)域,尤其是市場經(jīng)濟(jì)領(lǐng)域,就嚴(yán)重偏離了詞語產(chǎn)生的自然規(guī)律。諸如,有廠商把一只質(zhì)量低劣的杯子冠以“納米”二字,冒充高科技的納米杯;服務(wù)商宣稱的“高速網(wǎng)絡(luò)”慢似蝸牛,只因宣傳時(shí)偷換了“byte”(字節(jié))和“bit”(位)的概念;有點(diǎn)維生素成分就言必稱“富含營養(yǎng)因子、維他命”等,用不規(guī)范詞語偷換科技概念,誤導(dǎo)消費(fèi)者。如果說語言工作者肩負(fù)一定的社會(huì)責(zé)任,那么倡導(dǎo)使用科學(xué)規(guī)范的科技語言無疑是其中重要的一部分。及時(shí)開展科技新詞的定名和普及,有利于規(guī)范科技交流,喚醒公眾的科技意識(shí),維護(hù)自身利益。
科技新詞工作可以成為科技名詞審定新理論和新方法的試驗(yàn)田??萍济~審定工作正探索運(yùn)用語料庫等自然語言處理技術(shù),實(shí)現(xiàn)自動(dòng)抽取和專家推薦相結(jié)合的工作形式。一方面,參考語料庫(reference corpus)對(duì)自然語言處理技術(shù)起到支撐性作用。全國科技名詞委已經(jīng)公布的幾十萬條規(guī)范科技名詞數(shù)據(jù)可以成為可靠的參考語料庫核心資源。另一方面,從目前來看,傳統(tǒng)的科技名詞審定工作方式對(duì)維護(hù)詞條的權(quán)威性和規(guī)范性具有不可替代的作用,大規(guī)模運(yùn)用新技術(shù)去完全替代原有方式,需要比較長時(shí)間的探索和積累,才能確保效果。因此,從工作基礎(chǔ)和技術(shù)可行性兩個(gè)角度來考慮,科技新詞工作可以達(dá)到先試先行的效果。
全國科技名詞委歷來很重視科技新詞的收集和定名。各學(xué)科名詞審定分委員會(huì)每間隔一定周期所進(jìn)行的學(xué)科名詞修訂再版,是實(shí)現(xiàn)新詞收集的主要途徑。此外,還注意創(chuàng)新收詞手段與發(fā)布機(jī)制,收效顯著。
從收詞手段來看,除了大部分學(xué)科采用的專家人工收集方式以外,天文學(xué)名詞委還綜合利用了包括數(shù)據(jù)庫、郵件列表、維基技術(shù)在內(nèi)的一系列技術(shù)手段開展科技新詞工作[1],信息科技、管理科技等學(xué)科還運(yùn)用了語料庫等技術(shù)手段,收集整理新詞。
從發(fā)布機(jī)制來看,除了常態(tài)的名詞書出版公布方式以外,各學(xué)科也探索了更多途徑的新詞發(fā)布機(jī)制。全國科技名詞委主辦的《中國科技術(shù)語》期刊是各學(xué)科發(fā)布試用新名詞的重要陣地,其先后發(fā)布了10余批天文學(xué)新詞[1]、3批信息科技新詞①、3批地球物理學(xué)新詞②、2批生命科學(xué)新詞③、1批物理學(xué)新詞④等,還公布了101~112、114、116號(hào)元素的中文正式定名⑤。除此以外,《物理》《天文學(xué)進(jìn)展》等雜志、“天文學(xué)名詞”等網(wǎng)站,也發(fā)布了大量經(jīng)相關(guān)學(xué)科名詞委審定的新詞。以上絕大部分工作成果都已陸續(xù)被相關(guān)學(xué)科名詞書最終收錄。
2009年,全國科技名詞委成立了新詞工作委員會(huì),發(fā)布了《關(guān)于開展科技新詞工作的意見》(以下簡稱《意見》)?!兑庖姟访鞔_了科技新詞工作委員會(huì)的組織形式和工作任務(wù)、基本原則與工作程序[2]。根據(jù)設(shè)想,科技新詞工作委員會(huì)委員每年向全國科技名詞委提交擬發(fā)布試用的各學(xué)科科技新詞。全國科技名詞委負(fù)責(zé)建立科技新詞數(shù)據(jù)庫,按年度出版《××年科學(xué)技術(shù)新詞》,或通過網(wǎng)站向社會(huì)發(fā)布試用。2009年、2010年,全國科技名詞委先后向各學(xué)科新詞工作專家征集新詞,計(jì)劃整理后對(duì)外發(fā)布試用。從實(shí)際效果來看,除全國科技名詞委網(wǎng)站“新詞征集”欄目收到少量詞條以外,絕大多數(shù)學(xué)科的專家收詞工作未能取得進(jìn)展,與初期規(guī)劃差距較大。
依靠新詞工作委員會(huì)專家收詞的方式為何會(huì)遭遇瓶頸?究其原因,有專家認(rèn)為,科技新詞工作委員會(huì)“一個(gè)專家聯(lián)系一個(gè)分委員會(huì)”的組織形式很難確保新詞工作深入到各學(xué)科專家的日常審定工作業(yè)務(wù)中,各學(xué)科的新詞委員受限于其自身專長而無法代表一級(jí)學(xué)科專家推薦科技新詞;也有專家提出,學(xué)科基本詞、基礎(chǔ)詞并不會(huì)大量出現(xiàn),3~5年一次的學(xué)科名詞修訂工作實(shí)質(zhì)上就收選了不少新名詞;還有專家提出,應(yīng)該加強(qiáng)對(duì)專家委員的激勵(lì)和要求,設(shè)立秘書機(jī)構(gòu),確保按計(jì)劃進(jìn)行。目前,雖然這種收詞形式效果不佳,但仍一直在堅(jiān)持進(jìn)行。
2011年,為了繼續(xù)推動(dòng)科技新詞工作取得進(jìn)展,全國科技名詞委決定嘗試運(yùn)用自動(dòng)抽取與專家推薦相結(jié)合的機(jī)制開展新詞工作,分自動(dòng)抽取、人工干預(yù)、專家推薦三個(gè)階段進(jìn)行。自動(dòng)抽取是指運(yùn)用自然語言處理技術(shù),從科技語料中根據(jù)規(guī)則、統(tǒng)計(jì)等方法抽取備選的新詞語;人工干預(yù)是指通過多輪人工干預(yù),減少備選新詞語的數(shù)量,提高質(zhì)量;專家推薦是指由相關(guān)學(xué)科專家以推薦的形式選出候選新詞。
2012年開始的試點(diǎn)工作以部分基礎(chǔ)學(xué)科為對(duì)象,在自動(dòng)抽取階段,與中國知網(wǎng)展開技術(shù)合作,通過技術(shù)手段,從中國知網(wǎng)數(shù)據(jù)庫抽取相關(guān)學(xué)科備選詞。在人工干預(yù)階段,主要淘汰學(xué)科屬性有誤的名詞、簡單復(fù)合詞、來源不可靠的名詞。在專家推薦階段,分預(yù)審、函審、會(huì)商、確定等階段進(jìn)行。
在自動(dòng)抽取與專家推薦相結(jié)合開展的新詞工作試點(diǎn)中,有兩次會(huì)議的研討成果值得關(guān)注。在2012年底召開的全國科技名詞委新詞試點(diǎn)學(xué)科編輯座談會(huì)上,結(jié)合部分學(xué)科預(yù)審的實(shí)際情況,經(jīng)過會(huì)議討論,決定將工作目標(biāo)由收集傳統(tǒng)意義上的“新詞”調(diào)整為“有價(jià)值的詞條”,包括“有發(fā)布試用價(jià)值的新詞”和“其他有審定公布價(jià)值的科技名詞”兩部分。“有發(fā)布試用價(jià)值的科技新詞”,即代表新概念的名詞,包括新理論、新物質(zhì)、新材料、新技術(shù)、新工藝、新方法、新儀器和裝置等。這類詞出現(xiàn)于21世紀(jì),是傳統(tǒng)意義上的“新詞”,反映了當(dāng)代科技前沿及進(jìn)展,有必要盡早加以規(guī)范,及時(shí)發(fā)布試用?!捌渌袑彾ü純r(jià)值的科技名詞”,即原有審定工作中遺漏的基本名詞。包括本學(xué)科概念體系中較基礎(chǔ)的詞,特有的常用詞、重要詞等。這類詞可能不是傳統(tǒng)意義上的新詞,但在構(gòu)成學(xué)科體系時(shí)不可或缺,可留供學(xué)科名詞修訂再版時(shí)參考。
在2013年召開的新詞試點(diǎn)工作專家研討會(huì)上,參與新詞推薦的部分專家、負(fù)責(zé)新詞自動(dòng)抽取的工作人員,以及語言文字專家、各學(xué)科審定編輯共同對(duì)試點(diǎn)工作,尤其是在審稿過程中發(fā)現(xiàn)的全局性問題進(jìn)行了研討。大多數(shù)專家對(duì)這種嘗試感興趣,但是對(duì)新詞的產(chǎn)出率不太滿意。專家提出的問題主要包括:第一類意見,認(rèn)為語料的選擇存在問題。有專家認(rèn)為,從關(guān)鍵詞、標(biāo)題選詞范圍過窄,很難產(chǎn)出新詞;也有專家認(rèn)為中國知網(wǎng)收選的文獻(xiàn)以中文文獻(xiàn)為主,而科技前沿往往在國外,應(yīng)嘗試以英文文獻(xiàn)為資源。第二類意見,認(rèn)為專家審稿過程中對(duì)新詞的界定不統(tǒng)一。有的專家按照“未審定公布且有價(jià)值”為標(biāo)準(zhǔn),有專家按照“新出現(xiàn)且有價(jià)值”的標(biāo)準(zhǔn),以至于不同專家推薦標(biāo)準(zhǔn)參差不齊,部分學(xué)科還存在評(píng)判標(biāo)準(zhǔn)的交叉和混淆。第三類意見,認(rèn)為現(xiàn)有的一級(jí)學(xué)科跨度較大,審稿專家往往在更加細(xì)化的專業(yè)領(lǐng)域內(nèi)才能發(fā)表意見,不同的分支學(xué)科之間都很難明確詞條價(jià)值,應(yīng)該按照不同的二三級(jí)分支學(xué)科單獨(dú)審稿。第四類意見,認(rèn)為應(yīng)該嘗試新的抽取機(jī)制,如特征標(biāo)引等,以增強(qiáng)自動(dòng)抽取工作的質(zhì)量。第五類意見,提出審稿專家的選擇應(yīng)該更有針對(duì)性,比如考慮年齡、外文水平、對(duì)新詞的敏感性等諸多方面,部分學(xué)科還存在專家參與度不高,積極性不足的問題。
綜合上述意見,從試點(diǎn)工作的實(shí)際成效來看,可以總結(jié)以下幾點(diǎn)經(jīng)驗(yàn)教訓(xùn):
新詞的標(biāo)準(zhǔn)問題是在開展新詞工作時(shí)最常被討論的問題。實(shí)踐中,一般有兩種觀點(diǎn):一種認(rèn)為,新詞就是剛出現(xiàn)的詞;另一種認(rèn)為,新詞是現(xiàn)有審定公布的名詞庫中沒有的詞。從理論上來講,兩者實(shí)際都在強(qiáng)調(diào)詞條在某一時(shí)點(diǎn)所表現(xiàn)的價(jià)值,即時(shí)點(diǎn)價(jià)值,要么某個(gè)詞條在某一時(shí)點(diǎn)后才出現(xiàn),要么在某一時(shí)點(diǎn)才被納入審定工作視野。顯然,科技新詞如果僅僅以時(shí)點(diǎn)價(jià)值作為衡量科技新詞工作的唯一價(jià)值支撐,恐怕遠(yuǎn)遠(yuǎn)不夠,更需要重視詞條的“時(shí)段價(jià)值”。時(shí)段價(jià)值展示了一個(gè)詞條在出現(xiàn)后呈現(xiàn)什么樣的發(fā)展趨勢,是越來越多地被繼續(xù)使用,還是明顯具有社會(huì)關(guān)注效應(yīng),抑或是逐漸退出了歷史舞臺(tái)。經(jīng)過對(duì)詞條時(shí)點(diǎn)價(jià)值和時(shí)段價(jià)值的共同考察,才有可能形成相對(duì)全面的詞條定位。在科技新詞試點(diǎn)實(shí)踐中,新詞標(biāo)準(zhǔn)也的確經(jīng)歷了從初期籠而統(tǒng)之地強(qiáng)調(diào)“新”,到試點(diǎn)過程中同時(shí)強(qiáng)調(diào)詞條本身的“價(jià)值”,也恰恰印證了這一點(diǎn)。
與此同時(shí),科技新詞工作作為科技名詞規(guī)范化工作的一部分,其最終目的還在于“規(guī)范”,即為同一個(gè)科學(xué)概念確定一個(gè)科學(xué)的中文定名,避免因一物多名造成科技交流不暢。因此,在科技名詞規(guī)范視野下來討論科技新詞的標(biāo)準(zhǔn),有必要引入“規(guī)范價(jià)值”標(biāo)準(zhǔn)。通俗來講,應(yīng)重點(diǎn)關(guān)注新概念定名混亂、直接使用字母詞、對(duì)相同概念采用多個(gè)不規(guī)范表達(dá)等現(xiàn)象,對(duì)有關(guān)新詞及時(shí)定名。這樣的工作具有良好的示范作用,如2013年全國科技名詞委組織的PM2.5定名工作。
在實(shí)踐中,某個(gè)詞條往往難以全部滿足“時(shí)點(diǎn)價(jià)值”“時(shí)段價(jià)值”和“規(guī)范價(jià)值”三個(gè)標(biāo)準(zhǔn),因而在選詞實(shí)踐中存在幾個(gè)標(biāo)準(zhǔn)的優(yōu)先級(jí)問題。在常態(tài)的科技名詞審定工作中,首先是強(qiáng)調(diào)規(guī)范價(jià)值,對(duì)應(yīng)《原則》中的“一個(gè)科學(xué)概念,確定一個(gè)中文名”;其次是時(shí)段價(jià)值,對(duì)應(yīng)《原則》中“收選學(xué)科的基本詞、重要詞”的規(guī)定;再次是時(shí)點(diǎn)價(jià)值,如在修訂過程中,往往新增的詞條是近來出現(xiàn)的重要詞,刪減的是被淘汰的詞條,修訂的是那些被證實(shí)定名有誤的詞條。而就科技新詞工作而言,筆者認(rèn)為三個(gè)標(biāo)準(zhǔn)的優(yōu)先級(jí)有所不同,從高到低應(yīng)該是:時(shí)點(diǎn)價(jià)值、規(guī)范價(jià)值、時(shí)段價(jià)值。即首先是從新出現(xiàn)的術(shù)語中進(jìn)行初選,然后考察其使用情況,對(duì)于使用混亂的,特別是已經(jīng)進(jìn)入大眾生活領(lǐng)域的術(shù)語要優(yōu)先規(guī)范,而對(duì)可能兼具時(shí)段價(jià)值的術(shù)語重點(diǎn)規(guī)范。雖然這三個(gè)標(biāo)準(zhǔn)并非缺一不可,但是明確這樣的標(biāo)準(zhǔn),對(duì)于在實(shí)踐層面把握科技新詞的取舍具有指導(dǎo)意義。
新詞語料的選擇直接決定了新詞的來源。新詞語料一般是各類正式科技出版物,這是由于科技新詞從科技領(lǐng)域進(jìn)入語言研究領(lǐng)域,呈現(xiàn)于固定的載體。通常,載體的權(quán)威性越突出,其可信度越高。首先,按載體劃分,可分為專著語料、期刊語料、報(bào)紙語料等。以專著、期刊、報(bào)紙三者為例,不同的語料載體受出版周期的影響,所關(guān)注的科技新詞的時(shí)點(diǎn)價(jià)值逐步升高,而時(shí)段價(jià)值依次降低。其次,按語種劃分,可分為母語語料和外文語料。決定可信度的指標(biāo),是在研究中占據(jù)主導(dǎo)的語言種類。通俗的說,一國的科技實(shí)力決定科技語言的話語權(quán)。目前在大多數(shù)領(lǐng)域,英文語料仍然是主體。再次,按性質(zhì)劃分,可分為確定語料和非確定語料。前者,如新詞詞典、關(guān)鍵詞表、文后術(shù)語表等;后者,如標(biāo)題、正文、參考文獻(xiàn)等。不同性質(zhì)的語料對(duì)新詞抽取工作量的影響較大,但是毋庸諱言,確定語料時(shí)點(diǎn)價(jià)值偏弱,可能無法滿足新詞工作的具體需求。
科技新詞的收詞方式可分為人工收詞與自動(dòng)抽取兩種。人工收詞的優(yōu)點(diǎn)在于準(zhǔn)確性高,二次加工簡單,缺點(diǎn)在于人工成本投入大,時(shí)效性不強(qiáng),對(duì)實(shí)施者自身科技素養(yǎng)的要求比較高。而自動(dòng)抽取則恰恰相反。目前比較可行的辦法是兩者并舉。自動(dòng)抽取的程度直接決定了人工審核的難易程度,實(shí)踐中往往需要通過不斷改進(jìn)自動(dòng)抽取技術(shù)來降低人工審核的工作量??萍夹略~試點(diǎn)工作的實(shí)踐,讓筆者體會(huì)最深的就是切忌理論研究和實(shí)踐需要兩張皮。成功的實(shí)踐要以良好的理論作為指導(dǎo),而有效的實(shí)踐才能發(fā)現(xiàn)理論的漏洞和不足。因此,最有效的做法是規(guī)劃者全程指導(dǎo)和參與自動(dòng)抽取工作,邊研究邊實(shí)踐,注重普遍性和特殊性相結(jié)合,及時(shí)發(fā)現(xiàn)問題,優(yōu)化方法。
目前,囿于自動(dòng)抽取技術(shù)在語義判別上的局限,往往從自動(dòng)抽取環(huán)節(jié)進(jìn)入人工干預(yù)環(huán)節(jié)的詞條數(shù)量可觀,為了減小專家審詞量,人工干預(yù)顯得必不可少。從科技新詞試點(diǎn)工作實(shí)踐來看,教育背景不同的人員往往對(duì)科技新詞的敏感程度有很大的不同,所以對(duì)自動(dòng)抽取的詞條采取分級(jí)篩選,是比較有效的方式。
從科技新詞試點(diǎn)來看,進(jìn)入專家審詞的詞條數(shù)量不能太大,大學(xué)科門類、詞條版(不含釋義)的詞條數(shù)不宜超過2000條。小學(xué)科門類、詞條版不應(yīng)超過200條。如果是釋義版,100條以內(nèi)為佳。如果條件允許,團(tuán)隊(duì)式的人工干預(yù)模式是最有效的。
審詞專家的選擇對(duì)確保詞條質(zhì)量的重要性不言而喻。在選擇審詞專家時(shí),專家的時(shí)間、精力、學(xué)術(shù)水平、英文水平、年齡和對(duì)新詞的敏感度都是重要的考慮因素。與此同時(shí),還要考慮專家的背景,注重吸收部分中青年專家、海外留學(xué)歸國人員、科研院所一線工作人員等。此外,因?yàn)閷W(xué)科劃分越來越細(xì),且彼此交叉,所以必要時(shí)甚至需要針對(duì)個(gè)別詞條有針對(duì)性尋找合適的審詞專家。
分批次發(fā)布新詞是目前比較常見的發(fā)布形式。有定期的,如語委組織發(fā)布的年度新詞語;也有不定期的,如天文學(xué)名詞審定委員會(huì)在《中國科技術(shù)語》期刊陸續(xù)發(fā)布的十多批天文學(xué)新名詞。公布周期的選擇直接決定了新詞工作周期的選擇,需要綜合考慮實(shí)際需要和可操作性兩個(gè)方面。實(shí)際需要是指有沒有迫切需要向社會(huì)公布的名詞,可操作性是指新詞工作的人、財(cái)、物保障??傮w而言,無論采用多長周期,都應(yīng)該保持適當(dāng)?shù)倪B續(xù)性。多年的堅(jiān)持和積累才能把新詞工作引向深入。
最后,筆者認(rèn)為,科技新詞工作實(shí)踐證明,有必要進(jìn)一步強(qiáng)化新詞的理論研究和操作層面的研究。從宏觀層面,研究內(nèi)容應(yīng)該包括:及時(shí)規(guī)范新詞的可行性研究、規(guī)范視角下的新詞選詞標(biāo)準(zhǔn)研究、分學(xué)科語料的權(quán)威性研究、新詞自動(dòng)選詞規(guī)則的共性研究、新詞抽取統(tǒng)計(jì)路徑的共性研究、創(chuàng)新科技新詞發(fā)布機(jī)制研究。從微觀層面,新詞生命力研究、字母詞的研究、新詞特征標(biāo)引的研究都是實(shí)踐所迫切需要的。
新詞工作開展不易,筆者呼吁在不同行業(yè)或領(lǐng)域從事新詞相關(guān)工作的學(xué)者,能在語料、技術(shù)、經(jīng)驗(yàn)等方面相互借鑒、有效溝通、共同培育,減少重復(fù)勞動(dòng)和資源浪費(fèi),讓新詞理論工作深深扎根實(shí)踐的土壤。
注 釋
①分別刊載于《科技術(shù)語研究》1998年第1期、1999年第1期和2001年第3期。
②分別刊載于《科技術(shù)語研究》2000年第2期、2001年第2期和2001年第4期。
③分別刊載于《科技術(shù)語研究》1998年第1期、1999年第1期。
④刊載于《科技術(shù)語研究》1999年第4期。
⑤101~109號(hào)元素定名刊載于《科技術(shù)語研究》1998年第1期;110號(hào)元素定名刊載于《科技術(shù)語研究》2003年第3期;111號(hào)元素定名刊載于《科技術(shù)語研究》2006年第1期;112號(hào)元素定名刊載于《中國科技術(shù)語》2011年第5期;114號(hào)、116號(hào)元素定名刊載于《中國科技術(shù)語》2013年第5期。
參 考 文 獻(xiàn)
[1]崔辰州. 充分利用現(xiàn)代信息技術(shù)開展科技名詞工作[J]. 中國科技術(shù)語,2010(3):19-21.
[2]才磊. 科技新詞工作初探[J]. 中國科技術(shù)語,2008(2):49-51.