上海外國(guó)語(yǔ)大學(xué) 項(xiàng)奇軍 蔣世玉
《面向自然語(yǔ)言處理的100個(gè)語(yǔ)言學(xué)要點(diǎn)II:語(yǔ)義、語(yǔ)用篇》(LinguisticFundamentalsforNaturalLanguageProcessingII:100EssentialsfromSemanticsandPragmatics)是華盛頓大學(xué)Emily M. Bender教授和愛丁堡大學(xué)Alex Lescardes教授的合力新作。這兩位教授投身自然語(yǔ)言處理(NLP)和語(yǔ)言學(xué)的跨學(xué)科研究,有著豐富的教學(xué)和科研經(jīng)驗(yàn)。其中Bender教授是中心驅(qū)動(dòng)短語(yǔ)結(jié)構(gòu)語(yǔ)法的領(lǐng)頭人,也是該書系中一部廣受好評(píng)的《形態(tài)句法篇》(Bender 2013)的唯一負(fù)責(zé)人;而Lescardes教授則專攻計(jì)算語(yǔ)義學(xué)/語(yǔ)用學(xué),是分段式語(yǔ)篇表述理論的核心創(chuàng)始人。
李穎、馮志偉(2015)認(rèn)為目前主流的基于統(tǒng)計(jì)的NLP系統(tǒng)存在不足,必須引入語(yǔ)言學(xué)知識(shí)來(lái)彌補(bǔ)。基于統(tǒng)計(jì)的方法雖然在字、句的分析上取得了明顯的成果,然而面對(duì)篇章處理則明顯存在困難。提升NLP系統(tǒng)對(duì)篇章的理解和生成效果需要增加語(yǔ)義、語(yǔ)用的考量。該書作為一本手冊(cè)類書籍,正是為了填補(bǔ)NLP研究者對(duì)語(yǔ)義和語(yǔ)用學(xué)知識(shí)點(diǎn)的缺位,以求提升現(xiàn)行算法的準(zhǔn)確率。就該書的主要觀點(diǎn)而言,兩位作者也都認(rèn)為語(yǔ)言學(xué)知識(shí)在NLP中起到不可忽視的基礎(chǔ)性作用,理解相關(guān)的語(yǔ)言學(xué)知識(shí)有助于建立新一代的NLP系統(tǒng)。
該書共14個(gè)章節(jié),涵蓋100個(gè)語(yǔ)言學(xué)要點(diǎn),由引介、語(yǔ)義篇、語(yǔ)用篇和資源4個(gè)部分組成。其中,第一部分包括第1章,第二部分包括2—8章,第三部分包括9—13章,最后一部分包括第14章。
在第1章“引言”中,作者指出當(dāng)今語(yǔ)義學(xué)的研究流派眾多,雖然認(rèn)知語(yǔ)義學(xué)、框架語(yǔ)義學(xué)等語(yǔ)義學(xué)分支近年來(lái)風(fēng)頭正盛,但NLP研究應(yīng)對(duì)其保持謹(jǐn)慎的態(tài)度,認(rèn)為以形式化的語(yǔ)義學(xué)和語(yǔ)用學(xué)為中介是向NLP研究者介紹語(yǔ)言學(xué)的正確路徑,也是向語(yǔ)言學(xué)研究者介紹NLP的不二之選。接著作者簡(jiǎn)單介紹了語(yǔ)義學(xué)和語(yǔ)用學(xué)的概念,并在此基礎(chǔ)上引導(dǎo)讀者了解語(yǔ)義學(xué)和語(yǔ)用學(xué)與NLP是如何互動(dòng)的,并說(shuō)明了形式化的語(yǔ)義和語(yǔ)用是如何幫助構(gòu)建更好的自然語(yǔ)言理解和自然語(yǔ)言生成系統(tǒng)的。
第2章“什么是意義”是語(yǔ)義學(xué)部分的開篇。該章所提及的概念貫穿全書的語(yǔ)義學(xué)部分,是理解NLP與語(yǔ)義學(xué)關(guān)系的基礎(chǔ)。作者首先介紹了如何用形式語(yǔ)義學(xué)的基本工具對(duì) “意義”進(jìn)行形式化。接著,作者剖析了“意義”的3個(gè)層次,并從形式語(yǔ)義學(xué)的角度,闡釋了“意義”的3個(gè)層次,而且提醒NLP研究者,認(rèn)識(shí)到“意義”的多層次性是能夠正確處理它的前提。之后,作者進(jìn)而運(yùn)用言語(yǔ)行為理論對(duì)“意義”進(jìn)行闡釋,并對(duì)言語(yǔ)行為理論的3個(gè)階段與“意義”的3個(gè)層次的異同做了回答。在該章的后半部分,作者認(rèn)為,對(duì)于NLP研究而言,前面提到的三層“意義”的理解和生成并不是NLP最難克服的一關(guān),語(yǔ)言的“意義”還包括情感和社會(huì)意義,譬如姿態(tài)、語(yǔ)氣等非言語(yǔ)的認(rèn)知與語(yǔ)言意義之間的復(fù)雜互動(dòng)將會(huì)是NLP勢(shì)必要攻破的最后一道門檻。另外,在社會(huì)意義方面,作者指出NLP在禮貌和敬語(yǔ)方面仍有很大的進(jìn)步空間。倘若NLP在識(shí)別社會(huì)意義上取得突破,會(huì)對(duì)追溯品牌評(píng)價(jià)、偵察仇恨言論等有著廣闊的用武之地。
第3章“詞匯語(yǔ)義概覽”涉及的是有關(guān)NLP的詞匯語(yǔ)義學(xué)領(lǐng)域。作為4、5、6章的統(tǒng)領(lǐng)部分,作者簡(jiǎn)要梳理了詞匯語(yǔ)義學(xué)的子領(lǐng)域——詞義、語(yǔ)義角色以及搭配等。作者特別指出,在形式化語(yǔ)義中,單詞通常被表示為不透明的謂語(yǔ)符號(hào),這導(dǎo)致了有關(guān)單詞意義的重要信息會(huì)被丟失。另外,作者也談到詞嵌入的問(wèn)題,認(rèn)為基于語(yǔ)境的詞嵌入的一個(gè)缺點(diǎn)是不能夠?qū)⒊WR(shí)推理納入其中。
第4章“詞義”對(duì)詞義及其相互作用的各種方式進(jìn)行了整體描述,除了討論如多義詞、近義詞、同義詞等傳統(tǒng)語(yǔ)言學(xué)的話題之外,該章也展示了詞義研究面臨的一系列挑戰(zhàn),如歷時(shí)的詞義變化、隱喻造成的詞義延伸、高頻詞對(duì)可預(yù)測(cè)變化的阻斷等。該章還進(jìn)一步介紹了兩個(gè)對(duì)NLP研究可能起到啟發(fā)作用的語(yǔ)言現(xiàn)象:一是論元關(guān)系導(dǎo)致的詞義轉(zhuǎn)移;二是論元詞義的初始化問(wèn)題。前者如“Ringo squeezed himself into a narrow space.”中squeeze的非標(biāo)準(zhǔn)用法,后者如“I drank all night.”中drank的另一個(gè)論元被初始化為alcohol。這些現(xiàn)象可以應(yīng)用于自然語(yǔ)言理解中的錯(cuò)誤分析。
第5章“語(yǔ)義角色”比較簡(jiǎn)短,主要介紹了語(yǔ)義角色及其相關(guān)內(nèi)容。首先作者對(duì)比了以不同細(xì)粒度定義語(yǔ)義角色的方案,如VerbNet、FrameNet和PropBank,然后討論了語(yǔ)義角色的實(shí)現(xiàn),如軟約束(soft constraints)和隱性實(shí)現(xiàn)(implicit realization)等。最后作者點(diǎn)明NLP需要“語(yǔ)義角色”這一概念,區(qū)分句子中的語(yǔ)義角色能有效幫助計(jì)算機(jī)理解自然語(yǔ)言。
第6章“搭配和多詞表達(dá)”。該章介紹了搭配和多詞表達(dá)(multiword expressions,MWEs)的定義及其屬性。作者認(rèn)為MWEs的語(yǔ)義是單詞語(yǔ)義與組合語(yǔ)義的橋梁。MWEs繼承了單詞語(yǔ)義的許多屬性,MWEs如同單詞語(yǔ)義一樣,主要屬性有:多重意義、語(yǔ)義模糊、意義轉(zhuǎn)移等。而使MWEs區(qū)別于單詞的重要特性是,依附于MWEs的詞形比單個(gè)詞形更少歧義。最后,作者也提到,在MWEs中,慣用語(yǔ)是其重要組成部分,并且認(rèn)為,表達(dá)一個(gè)慣用語(yǔ)的語(yǔ)義與其各部分語(yǔ)義之間的關(guān)系是NLP研究很有挑戰(zhàn)性的任務(wù)。
第7章“組合語(yǔ)義學(xué)”。該章的前半部分圍繞謂語(yǔ)論元結(jié)構(gòu)及其派生機(jī)制給出了“組合語(yǔ)義”的定義,并且例證了形式化的語(yǔ)義能夠幫助解決一些句法上的歧義現(xiàn)象。然后作者在簡(jiǎn)要介紹了比較表達(dá)、復(fù)數(shù)表達(dá)之后,較為詳細(xì)地探討了量詞和其他運(yùn)算符(如否定或副詞)帶來(lái)的挑戰(zhàn),其中一個(gè)難題是如何解決它們?cè)诓煌Z(yǔ)言中的各種編碼方式。最后一小節(jié)作者專門介紹了基于分布的詞向量研究,作者重申,形式語(yǔ)義表示是根據(jù)真值和指稱定義的,它們被設(shè)計(jì)用來(lái)預(yù)測(cè)邏輯關(guān)系;但語(yǔ)義表示中的離散符號(hào)及其集合論解釋并不特別適合定量地進(jìn)行語(yǔ)義相似度的推理。因此作者預(yù)測(cè)詞嵌入提供的不同視角在今后的NLP研究中會(huì)大有可為。
第8章“組合語(yǔ)義學(xué):超越謂詞-論元結(jié)構(gòu)”進(jìn)一步向讀者呈現(xiàn)時(shí)、體、言據(jù)性(evidentiality)以及禮貌等語(yǔ)言概念。該章中作者引用了豐富的語(yǔ)料,充分地將自然語(yǔ)言中有關(guān)上述概念的紛繁復(fù)雜的語(yǔ)法化方式展示給讀者,例如,英語(yǔ)中過(guò)去/非過(guò)去時(shí)有語(yǔ)法化表現(xiàn),而其他很多語(yǔ)言卻沒有;英語(yǔ)中體和言據(jù)性的語(yǔ)法標(biāo)記不明顯,但萬(wàn)巴亞語(yǔ)(Wambaya)、雅基語(yǔ)(Yaqui)卻有豐富的言據(jù)性語(yǔ)法標(biāo)記。而在要點(diǎn)的設(shè)置上,作者著重強(qiáng)調(diào)了禮貌標(biāo)記在不同語(yǔ)言層次中的體現(xiàn)和其在指代消解上的作用。例如,日語(yǔ)中的敬詞通常用來(lái)指代他人而非言者自己。
第9章“超越句子”將對(duì)意義的討論提升到了語(yǔ)篇層面,介紹了計(jì)算機(jī)理解語(yǔ)篇意義的基礎(chǔ)方法(如語(yǔ)篇更新函數(shù)、構(gòu)建語(yǔ)篇的模型)以及改善語(yǔ)篇理解的方法。作者重點(diǎn)闡釋了語(yǔ)篇意義的構(gòu)建需要建立在語(yǔ)篇組成部分之間的連貫關(guān)系上,并列、從屬兩種連貫關(guān)系將組成部分連接起來(lái),從而構(gòu)建語(yǔ)篇表達(dá)結(jié)構(gòu);作者還強(qiáng)調(diào)語(yǔ)篇的釋義必須在動(dòng)態(tài)之中進(jìn)行,例如在兩個(gè)句子中,第一句話中的語(yǔ)義轄域(如量詞轄域)必須發(fā)生動(dòng)態(tài)改變以將下一句的內(nèi)容囊括在內(nèi)。
第10章“指代消解”的主題是NLP中信息抽取的核心概念之一。作者首先介紹了指代消解的定義及其面臨的挑戰(zhàn),隨后詳細(xì)解釋了4個(gè)決定消解的語(yǔ)言學(xué)因素,即語(yǔ)法因素、邏輯表達(dá)式、模態(tài)邏輯、語(yǔ)篇結(jié)構(gòu)。作者重點(diǎn)討論了連貫關(guān)系對(duì)于消解起到的作用,比如:改變語(yǔ)篇片段間的連貫關(guān)系,一般也會(huì)引起指代(通常是代詞)意義的改變;作者進(jìn)一步指出目前的統(tǒng)計(jì)模型普遍忽視連貫關(guān)系的作用,引導(dǎo)讀者思考如何能在計(jì)算模型中應(yīng)用連貫以提高消解效果。
第11章“預(yù)設(shè)”以介紹預(yù)設(shè)與蘊(yùn)含的區(qū)別為基礎(chǔ),依次探討了預(yù)設(shè)觸發(fā)項(xiàng)以及預(yù)設(shè)投射等問(wèn)題。例如,作者引用Karttunen (1973)內(nèi)嵌謂詞的分類,指出并非所有的內(nèi)嵌小句都能夠發(fā)生預(yù)設(shè)投射。該章中最為核心的部分是預(yù)設(shè)順應(yīng)的介紹以及其限制條件的提出。作者總結(jié)認(rèn)為,預(yù)設(shè)順應(yīng)的發(fā)生主要取決于預(yù)設(shè)轄域與語(yǔ)篇中其他內(nèi)容之間的關(guān)系,并用豐富的例子詳細(xì)闡釋預(yù)設(shè)順應(yīng)的這些限制條件。該章對(duì)預(yù)設(shè)的介紹頗具理論深度,不過(guò)缺乏對(duì)于NLP與預(yù)設(shè),特別是與預(yù)設(shè)順應(yīng)之間聯(lián)系的說(shuō)明。
第12章 “信息狀態(tài)與信息結(jié)構(gòu)” 首先討論了信息狀態(tài)(主要是有定性這一特性)以及不同語(yǔ)言中對(duì)其的形態(tài)句法標(biāo)記。例如,一些語(yǔ)言(如英語(yǔ)、日語(yǔ)等)可以通過(guò)名詞詞組的形式來(lái)標(biāo)記信息狀態(tài),另一些語(yǔ)言(如土耳其語(yǔ))則可以利用格來(lái)標(biāo)記。作為該章的重點(diǎn),作者討論了信息結(jié)構(gòu)的概念及其語(yǔ)言標(biāo)記,例如重音和聲調(diào)能夠反映信息的新與舊和語(yǔ)句的話題與焦點(diǎn)。此外,作者還討論了信息結(jié)構(gòu)對(duì)于消歧所能起到的作用。自然語(yǔ)言中充滿了歧義,由韻律所表現(xiàn)的語(yǔ)句信息結(jié)構(gòu)能對(duì)意義選擇提供幫助。
第13章“含義與對(duì)話”圍繞含義這個(gè)核心,從含義類別、NLP技術(shù)以及會(huì)話策略3個(gè)方面進(jìn)行了討論。首先,作者區(qū)分了會(huì)話含義和規(guī)約含義,并指出對(duì)含義的模擬必須兼顧這兩種含義。作者接著著重探討了含義與NLP的接口,例如,目前基于格萊斯會(huì)話原則、關(guān)聯(lián)理論的NLP計(jì)算系統(tǒng)都會(huì)關(guān)注言者和聽者的認(rèn)知狀態(tài),這些系統(tǒng)能夠很好地表達(dá)出句子的語(yǔ)義,卻很難判斷出其真值等等。最后,作者還舉例說(shuō)明了一些會(huì)話策略,如部分肯定、沉默、音調(diào)變化,提出要讓會(huì)話系統(tǒng)捕捉這些細(xì)節(jié),今后還需要做很多工作。
第14章“資源”推介了4種實(shí)用的語(yǔ)義、話語(yǔ)處理分析資源(詞匯語(yǔ)義關(guān)系的檢索工具、標(biāo)有句子語(yǔ)義信息的各類語(yǔ)義銀行、可呈現(xiàn)語(yǔ)義信息的句法分析器和標(biāo)有話語(yǔ)信息的語(yǔ)料庫(kù))及其獲取的方法和途徑。
該書對(duì)語(yǔ)義學(xué)和語(yǔ)用學(xué)研究領(lǐng)域的基本情況、相關(guān)問(wèn)題進(jìn)行了較為全面的介紹和分析,不僅突出地體現(xiàn)了手冊(cè)類著作承擔(dān)的語(yǔ)言凝練、舉例易懂、便于查閱等特點(diǎn),也展示了作者獨(dú)特的見解。具體特點(diǎn)呈現(xiàn)如下:
該書語(yǔ)言凝練,信息密度極大,主題明確且層次分明。每個(gè)要點(diǎn)的介紹基本都在兩頁(yè)之內(nèi)完成,在每個(gè)章節(jié)中的安排也都經(jīng)過(guò)深思熟慮。在第二部分語(yǔ)義篇中,作者選擇話題詳略得當(dāng),提出的問(wèn)題也極具代表性。作者盡可能地只選取與NLP有關(guān)或是可能為解決NLP難題提供思路、方法和路徑的語(yǔ)言學(xué)現(xiàn)象和理論,可以說(shuō)對(duì)NLP研究者而言,文中提到的每個(gè)話題都值得仔細(xì)揣摩。而且,文章中不僅只是簡(jiǎn)單介紹理論,更為研究者拋出了許多有價(jià)值的問(wèn)題,其中不僅有NLP一直在研究的經(jīng)典問(wèn)題,也包括NLP將來(lái)可能涉及的新挑戰(zhàn)。第三部分語(yǔ)用篇中作者對(duì)要點(diǎn)各章節(jié)中的分布比較均勻,章節(jié)與章節(jié)相互平行,這些章節(jié)的內(nèi)容均不可小覷。細(xì)讀文章可以發(fā)現(xiàn),篇章的連貫關(guān)系這一知識(shí)點(diǎn)貫穿了該部分始終,是整個(gè)部分的核心。這與Jurafsky & Martin(2008)著作的語(yǔ)用部分對(duì)語(yǔ)篇連貫的強(qiáng)調(diào)不謀而合。
該書的另一個(gè)特色是語(yǔ)種豐富,且舉例易懂;知識(shí)點(diǎn)的講解,特別是難點(diǎn),均以典型的語(yǔ)言例子來(lái)做具體說(shuō)明。文中所選語(yǔ)言例子本身,克服了英語(yǔ)為主的傳統(tǒng)模式,共用了45種語(yǔ)言的例子。在講到語(yǔ)言意義的社會(huì)層面時(shí),作者選用日語(yǔ)舉例,只用4個(gè)句子就讓讀者感受到了日語(yǔ)里的敬語(yǔ)體系的繁雜。在詞義部分,作者更是同時(shí)選用多種語(yǔ)言的例子來(lái)證明詞義的歷時(shí)變化和模糊性的特點(diǎn)。例句的選取上,作者也力求簡(jiǎn)短,翻閱全書,幾乎找不出長(zhǎng)度超過(guò)一行的句子。并且非英語(yǔ)例句的英語(yǔ)標(biāo)注詳盡,盡可能地還原了語(yǔ)言原貌。
作為一本手冊(cè)類書籍,該書還具有編排精美、索引方便、資源豐富的特點(diǎn)。在書的最后,作者貼心地羅列了介紹過(guò)的語(yǔ)言學(xué)知識(shí)點(diǎn)及其在文中出現(xiàn)的具體位置。這樣的安排一方面能夠讓讀者在整體上測(cè)試知識(shí)掌握的程度,一方面便于讀者復(fù)習(xí)遺忘部分的內(nèi)容。雖說(shuō)該書主要面向的是NLP研究者,但這絕不是說(shuō)語(yǔ)言學(xué)家就不值得一讀了。書中提供豐富的語(yǔ)義、語(yǔ)用計(jì)算分析處理資源,能為語(yǔ)言學(xué)家提供語(yǔ)言研究的新工具和新視角。而且,如若相關(guān)領(lǐng)域的語(yǔ)言學(xué)家要做跨學(xué)科的研究,也能從這該書中受到啟發(fā)。
該書的另一特點(diǎn)是作者基于對(duì)該領(lǐng)域的敏銳觀察,提出了許多獨(dú)創(chuàng)的見解,對(duì)讀者頗具啟發(fā)意義。作者全局審視了當(dāng)前面向指代消解的統(tǒng)計(jì)系統(tǒng),指出這些系統(tǒng)只利用了論元結(jié)構(gòu)和分布詞匯語(yǔ)義而忽視了連貫關(guān)系所引起的語(yǔ)篇結(jié)構(gòu)。而連貫關(guān)系在跨句的篇章層面,有著至關(guān)重要的作用。這就引發(fā)讀者思考如何能夠在先行算法中加入這個(gè)元素,從而提高消解正確率。作者還指出當(dāng)前對(duì)于沉默意義的研究非常缺乏。一言不發(fā)并非不能傳情達(dá)意,相反可能蘊(yùn)含了豐富的意義。那么如何來(lái)判斷哪些沉默有意義,哪些沒有意義,有意義的沉默究竟反映的是何種意義,都是值得讀者進(jìn)行進(jìn)一步探討的話題。這里只是列舉了兩個(gè)比較典型的啟發(fā)之處,而書中還有眾多啟發(fā)點(diǎn)。
任何一本書都可能有其局限性,該書也不例外,主要存在兩個(gè)問(wèn)題。書中有幾處并沒有具體闡明NLP與語(yǔ)言學(xué)要點(diǎn)如何銜接。例如,作者對(duì)預(yù)設(shè)順應(yīng)花了許多筆墨,但是未能將其與NLP聯(lián)系起來(lái),可能對(duì)讀者產(chǎn)生一些困擾。此外,對(duì)于一些頗具深度的語(yǔ)言理論的介紹,囿于篇幅限制,不可能面面俱到,如果在每個(gè)主題的篇末提供一些基礎(chǔ)性的參考書目或者章節(jié),那么會(huì)有助于NLP研究者,特別是非母語(yǔ)為英語(yǔ)的研究者,得到更深入的理解和拓展。
總而言之,該書是一本不可多得的語(yǔ)言學(xué)知識(shí)手冊(cè)。作者以精致的筆觸,介紹了語(yǔ)義學(xué)、語(yǔ)用學(xué)中與NLP密切關(guān)聯(lián)的要點(diǎn),在語(yǔ)言學(xué)知識(shí)與NLP之間架起了一座橋梁。更可貴的是,該書秉持的是語(yǔ)言學(xué)知識(shí)和統(tǒng)計(jì)方法并重的理念,認(rèn)為語(yǔ)言學(xué)在NLP中扮演了不可或缺的角色,這為將來(lái)的NLP發(fā)展指明了道路。