• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于圖式的文本蘊(yùn)涵識別初探

    2015-04-21 08:43:36倪盛儉姬東鴻
    中文信息學(xué)報(bào) 2015年3期
    關(guān)鍵詞:蘊(yùn)涵語義學(xué)規(guī)約

    倪盛儉,姬東鴻

    (1. 安慶師范學(xué)院 外國語學(xué)院,安徽 安慶 246000; 2. 武漢大學(xué) 計(jì)算機(jī)學(xué)院,湖北 武漢 430070)

    ?

    基于圖式的文本蘊(yùn)涵識別初探

    倪盛儉1,姬東鴻2

    (1. 安慶師范學(xué)院 外國語學(xué)院,安徽 安慶 246000; 2. 武漢大學(xué) 計(jì)算機(jī)學(xué)院,湖北 武漢 430070)

    文本蘊(yùn)涵識別是大部分自然語言信息處理應(yīng)用的核心。該文嘗試探討文本蘊(yùn)涵識別中涉及的(意象)圖式理據(jù)。通過對選自語料例子的分析,顯示各類圖式是如何成為文本蘊(yùn)涵識別的理據(jù)的。圖式包括物性結(jié)構(gòu)、理想認(rèn)知模型、框架、腳本等。這些圖式都是表示語義信息的結(jié)構(gòu)。從廣義上講它們都可以納入語義特征的范疇,都可能成為蘊(yùn)涵關(guān)系成立的理據(jù)。基于圖式的文本蘊(yùn)涵識別研究結(jié)合有關(guān)圖式庫的構(gòu)建,有望為突破文本蘊(yùn)涵識別瓶頸作出重要貢獻(xiàn)。

    文本蘊(yùn)涵識別;圖式;物性結(jié)構(gòu);理想認(rèn)知模型;框架;腳本

    1 前言

    文本推理過程的關(guān)鍵是文本蘊(yùn)涵(textual entailment, TE)的識別?,F(xiàn)有文本蘊(yùn)涵識別(recognition of textual entailment, RTE)成果,幾乎都來自自然語言處理(NLP)領(lǐng)域,且研究對象基本上都是英語。有學(xué)者指出RTE是大部分NLP應(yīng)用研究的核心[1],但現(xiàn)有RTE系統(tǒng)針對PASCAL的RTE競賽所提供的TE測試集,獲得的召回率、正確率一般都只有60%~70%左右,綜合評價(jià)(F-score)在0.6到0.7之間。面對大量真實(shí)文本, RTE效果應(yīng)該比這些數(shù)值體現(xiàn)的效果差些。RTE效果還不令人滿意且遇到了瓶頸,其重要原因是對蘊(yùn)涵成立的語言理據(jù)挖掘嚴(yán)重不足?,F(xiàn)有RTE研究一般只能處理簡單的詞語(語義)關(guān)系、表層句法關(guān)系或語義特征(semantic features,SF),對TE成立的其他條件如意象圖式(簡稱圖式)理據(jù)等并不是很明確。

    本文嘗試從廣義和認(rèn)知的角度理解SF,把圖式納入SF范疇。本文所說圖式包括QS、ICM、框架、腳本。QS是生成詞庫理論(the Generative Lexicon, GL)的重要內(nèi)容。GL在廣泛的認(rèn)知語境中對意義進(jìn)行分解分析,其QS具有普通認(rèn)知圖式的特征,是用來分解、表示詞語意義的工具;認(rèn)知語義學(xué)中,ICM、框架、腳本*可以把腳本理解為事件的序列,但腳本仍然可以表示詞語信息,因?yàn)閱蝹€詞語可以觸發(fā)腳本,這個腳本都可以成為理解該詞語的語境。也是用來表示詞語信息的,因而,這些圖式都可以納入SF范疇。馮志偉先生指出: 語義表征,既需要配價(jià)的描述,也需要認(rèn)知圖式的描述[2]。所以,SF不僅包括傳統(tǒng)成分分析法所獲得的語義信息,還可包括各種圖式內(nèi)容。

    本文主要探討圖式作為SF是如何成為RTE理據(jù)的。本文安排如下: 先簡單介紹各類圖式,然后說明它們怎樣成為RTE的理據(jù),最后是總結(jié),進(jìn)一步明確本研究的意義。

    2 圖式

    所有圖式都具有特定結(jié)構(gòu)和內(nèi)容,有理想性、整體性、不易變動性,同時具有開放性、選擇性、關(guān)聯(lián)性、普遍性等特點(diǎn)[3]。圖式相對穩(wěn)定,但從長時間看,其內(nèi)容和結(jié)構(gòu)會發(fā)生變化,以適應(yīng)變動的社會和文化。圖式在不變性和開放性方面(這兩方面不是本文的重點(diǎn))與文化類似。

    2.1 QS

    新結(jié)構(gòu)主義語義學(xué)理論中,Pustejovsky所創(chuàng)立的GL是最精密、最富有成效的后生成主義形式分解語義學(xué),它提供了當(dāng)代語義學(xué)中最詳盡的形式化分解方法模式。GL聚焦于語境中語義確定和調(diào)節(jié)機(jī)制,注重一詞多義現(xiàn)象和創(chuàng)造性語言用法的描述,試圖通過超越“義項(xiàng)枚舉詞庫(方法)”(SEL)趕超Katz語義學(xué)。GL將詞庫作為基礎(chǔ)來描述語言動態(tài)、創(chuàng)造性的用法,它超越Katz詞匯語義學(xué)的地方主要包括: 明顯與語義邏輯表示產(chǎn)生聯(lián)系,對表示進(jìn)行分層,內(nèi)容更豐富細(xì)致;表示模式面向計(jì)算語言學(xué),提出可操作的語義生成機(jī)制[4-5]。

    QS是結(jié)構(gòu)化的、用來表示詞條(義項(xiàng)-詞形對)所指的實(shí)體特別是人工物與有關(guān)內(nèi)容間的關(guān)系[4],包括四部分內(nèi)容。

    ? 構(gòu)成角色: 實(shí)體與其組成成分或構(gòu)成部分等之間的關(guān)系,如材料、重量、成分和構(gòu)成元素等。

    ? 形式角色: 將實(shí)體從一個更大的領(lǐng)域中區(qū)分出來,包括方向、大小、形狀、維度、顏色、位置等。

    ? 目的角色: 表示實(shí)體的目的或功能。

    ? 施成角色: 即導(dǎo)致實(shí)體產(chǎn)生或出現(xiàn)的因素,如創(chuàng)造者、天然物或人造物(作為工具導(dǎo)致實(shí)體的產(chǎn)生)、因果鏈(因果關(guān)系)。

    QS所表示的關(guān)系,是對傳統(tǒng)語義關(guān)系的補(bǔ)充,也是對傳統(tǒng)所表示詞語語義的補(bǔ)充*當(dāng)然這種補(bǔ)充也不是圓滿的,如語義-文本理論(Meaning-Text Theory)的詞匯函數(shù)(Lexical function)所表示的各類詞語關(guān)系就基本上不能為QS所表示。詞匯函數(shù)和QS適用表示的詞語關(guān)系范圍不同。。QS是GL最成功的內(nèi)容之一,已經(jīng)被許多語言理論框架吸收[4,6]。QS是GL語義生成性的來源之一。QS的構(gòu)成角色和形式角色實(shí)現(xiàn)為言語后,在語句中與表示被描述實(shí)體詞語間的關(guān)系為非論元性語義依存關(guān)系,而其功用角色和施成角色在語句中與被描述實(shí)體能指之間的關(guān)系是論元性的語義依存關(guān)系。QS是橋接詞匯、句法和常識的有效手段之一,這種特性使得它可以對蘊(yùn)涵識別作出貢獻(xiàn)。

    2.2 ICM

    認(rèn)知語義學(xué)中比較系統(tǒng)、權(quán)威的理論是ICM理論和框架理論。ICM在Lakoff的著作中首次得到全面、系統(tǒng)描述,該書核心思想是: ICM是組織知識的手段,范疇結(jié)構(gòu)和原型效應(yīng)是這種組織的副產(chǎn)品。Lakoff對ICM的描述較為復(fù)雜,這里僅引用王寅(2005)對ICM的有關(guān)論述以便理解[7]。

    王寅認(rèn)為,認(rèn)知模型就是人們在認(rèn)識事體、理解世界過程中所形成的一種相對定型的心智結(jié)構(gòu),是組織和表征知識的模式,由概念及其間相對固定的聯(lián)系構(gòu)成[8]。王寅對ICM的概念總結(jié)如下:

    所謂ICM,就是指在特定的文化背景中說話人對某領(lǐng)域中的經(jīng)驗(yàn)和知識所作出的抽象的、較為完整的、理想化的理解,這是建立在許多認(rèn)知模型之上的一種復(fù)雜的、整合的完形結(jié)構(gòu),是一種具有格式塔性質(zhì)的復(fù)雜認(rèn)知模型。ICM是由很多認(rèn)知模型組成的,具有體驗(yàn)性(在人類與外界互動的基礎(chǔ)上形成)、完形性(不僅僅是由各構(gòu)成部分組合而成,而且也是一個整體結(jié)構(gòu))、內(nèi)在性(是心智中認(rèn)識事體的方式)[9]。

    本研究中,ICM用于表達(dá)抽象詞語的概念結(jié)構(gòu),為抽象詞語的理解提供語境,進(jìn)而為RTE服務(wù)。

    2.3 框架

    框架和腳本概念源自人工智能領(lǐng)域研究[10]??蚣鼙籉illmore引入語言學(xué)而得到充分發(fā)展[11],框架語義學(xué)在認(rèn)知語義學(xué)中獨(dú)樹一幟,它基于真實(shí)語料研究語言,以其為理論基礎(chǔ)構(gòu)建的框架網(wǎng)(FrameNet)[12]在NLP等領(lǐng)域得到了廣泛應(yīng)用。

    Fillmore把“框架”定位為涵蓋多種其他圖式的概念,本文繼承傳統(tǒng)人工智能研究關(guān)于框架和腳本的認(rèn)識,認(rèn)為多個框架構(gòu)成腳本,腳本是框架的序列。

    框架語義學(xué)與ICM理論的不同之處在于: 前者切入點(diǎn)是社會語境中事件結(jié)構(gòu)的描述和理解,重點(diǎn)在世界知識,后者切入點(diǎn)是概念結(jié)構(gòu)描述,重點(diǎn)在于心智及其操作過程??蚣苷Z義學(xué)把格語法中針對語言的“格框架”映射到對世界知識的處理,對情景進(jìn)行描述。每一個格框架刻畫一個抽象、具有圖式化特征的小“情景”或“語境”。格框架映射到現(xiàn)實(shí)世界,體現(xiàn)為各種事件框架??蚣苤械膶?shí)體(詞語、范疇或概念等)是激發(fā)理解語境的索引,對框架的全面理解,需要許多為一個言語社團(tuán)所共享、默認(rèn)的知識。

    框架內(nèi)容和框架間的關(guān)系都可能成為RTE的理據(jù)。FrameNet1.5提供了八種框架關(guān)系,其中的視角關(guān)系可以理解如下[12]:

    同一事件或框架,因視角不同,使用不同的詞語、實(shí)現(xiàn)為不同的句法[13]。認(rèn)知語言學(xué)中,視角是語義識解(construal)的一個重要方面。如商業(yè)事件框架中,如果聚焦于買方,則買方成為前景,被突顯而成為射體,買方成為主語,用動詞buy,spend,pay做句子核心;如果聚焦于賣方,則賣方成為主語,句子核心是sell或charge;如果商品成為主語,則cost成為句子核心。

    框架語義學(xué)和FrameNet除了用于解釋一詞多義、歧義區(qū)分等外,還可幫助RTE。

    2.4 腳本

    關(guān)于腳本,沒有統(tǒng)一的定義,以下僅舉兩個定義來幫助理解。

    Schank和Abelson給出的腳本定義如下:

    腳本是特定語境中事件的合適序列結(jié)構(gòu),它由一些槽(slots)和關(guān)于什么樣的內(nèi)容可以填充這些槽的要求構(gòu)成。腳本是一個互相連接的整體,一個槽的內(nèi)容會影響另外一個槽內(nèi)可以出現(xiàn)什么內(nèi)容。腳本處理程式化日常情景,它們通常不易變化,不提供處理新情景的手段[10]。

    腳本不易變化,不意味著其絕對不能變動。Schank和Abelson在其下文中指出了腳本的可變化性,即腳本偏離。腳本偏離和以腳本為骨架實(shí)現(xiàn)的語句(文本)都可以提供新信,體現(xiàn)語言使用的動態(tài)性,這不是本文重點(diǎn),不詳述。本文要利用的是腳本靜態(tài)、不易變的特點(diǎn)。

    后來Abelson進(jìn)一步將腳本定義并解釋如下。

    總之,腳本是假設(shè)的認(rèn)知結(jié)構(gòu),激發(fā)的腳本能夠組織基于事件情景的理解。弱式意義上,腳本是一系列關(guān)于事件集出現(xiàn)的潛在性(可能性)的推理,它可能與其他不處理事件的圖式在結(jié)構(gòu)上有相似性。強(qiáng)式意義上,腳本同時涉及事件的發(fā)生和對事件順序的預(yù)期。最強(qiáng)式意義上,腳本中事件完全按照儀式化程序排列(如日本茶道),這時對腳本的預(yù)測絕對可靠,不過這類腳本相對少見[14]。

    根據(jù)上述腳本定義和其他學(xué)者的論述,腳本具有以下為TE的獲得提供線索和方便的特點(diǎn): 1)腳本的內(nèi)容和結(jié)構(gòu)相對穩(wěn)定;2)默認(rèn)狀態(tài)下,腳本中有關(guān)要素和內(nèi)容是一個整體,不可分割;3)強(qiáng)式腳本中,前后事件之間可具有因果關(guān)系,前面事件的實(shí)現(xiàn),是后續(xù)事件發(fā)生的必要條件。

    3 RTE中的圖式理據(jù)

    蘊(yùn)涵通常研究句子或命題之間的關(guān)系,而TE則研究文本(片段)間的關(guān)系。文本可以是單句、復(fù)句或者句群、語段、篇章。如果一個文本(片段)(被蘊(yùn)涵文本,稱為假設(shè),記為H)的真實(shí)性來自另一個文本(片段)(蘊(yùn)涵文本,記為T)的真實(shí)性,那么,這兩個文本(片段)間存在TE關(guān)系。如:

    (1) 媽媽: 寶寶,別躺地上,剛下過雨呢。(T)

    (1a) 媽媽告訴寶寶不要躺地上,因?yàn)榈厣鲜菨竦摹?H)

    容易判定,文本(1)蘊(yùn)涵文本(1a),因?yàn)槿鐭o特殊說明(典型或理想狀態(tài)下),“下雨”的默認(rèn)結(jié)果是“地濕”,“下雨”是原因。

    語言理解涉及的推理,需要獲取因果關(guān)系、語義蘊(yùn)涵和會話含義等。因果關(guān)系有多因多果、多因一果、一因一果、一因多果等情況。從因推出果,可以稱為結(jié)果蘊(yùn)涵,從果推測因,則是預(yù)設(shè)。因而,廣義上的TE包括文本預(yù)設(shè)、文本結(jié)果蘊(yùn)涵、文本語義蘊(yùn)涵、文本會話含義。預(yù)設(shè)又可分為語義預(yù)設(shè)和語用預(yù)設(shè),會話含義分為規(guī)約會話含義和非規(guī)約會話含義。由于語用預(yù)設(shè)具有主觀性、隱蔽性、可取消性等特征[15],而非規(guī)約會話含義又涉及很廣的語境,包括社會文化歷史價(jià)值觀念、心理認(rèn)知狀態(tài)等,具有很強(qiáng)的動態(tài)性和不確定性,本文暫不研究語用預(yù)設(shè)和非規(guī)約會話含義。

    筆者將由詞語間直接的語義關(guān)系(如WordNet所表示的詞語關(guān)系)和句法轉(zhuǎn)換導(dǎo)致的TE歸入文本語義蘊(yùn)涵。這類蘊(yùn)涵的研究現(xiàn)在已經(jīng)很多,這里不再論述。這樣本文研究對象就只有文本語義預(yù)設(shè)、文本規(guī)約會話含義和文本結(jié)果蘊(yùn)涵。預(yù)設(shè)(H)在時間上先于語句(T)的言語行為或其描述的事件、命題,會話含義則具有伴隨性、共時性,結(jié)果蘊(yùn)涵則在時間上具有滯后性。

    3.1 RTE的QS理據(jù)

    QS主要對文本語義預(yù)設(shè)、文本規(guī)約會話含義有貢獻(xiàn)。先看語義預(yù)設(shè)的例子:

    (2) 邦邦,別把自行車腳架拆下來。(T)

    (2a) (這輛)自行車有腳架。(H)

    自行車QS的“構(gòu)成角色”包括材料、重量和部件等。根據(jù)生活經(jīng)驗(yàn),“腳架”是自行車重要部件,應(yīng)該成為自行車所激發(fā)QS的內(nèi)容之一,即從自行車的QS可知,“自行車”和“腳架”之間有整體-部分的語義依存關(guān)系,借助該QS可知“自行車腳架”包含H,也即T蘊(yùn)涵H。

    事實(shí)上,一旦圖式被觸發(fā),關(guān)于其所有內(nèi)容的存在性和事實(shí)性描述都可以成為語義預(yù)設(shè),體現(xiàn)圖式的整體性。語義預(yù)設(shè)是語言理解的語境之一,對其利用需要根據(jù)具體情況加以選擇(圖式的選擇性)。

    如果在“自行車”的QS中包括“騎”這樣的“功能”,就可以為機(jī)器識別以下T和H之間蘊(yùn)涵關(guān)系做出貢獻(xiàn):

    (3) 去超市有點(diǎn)遠(yuǎn),借我的自行車去吧。(T)

    (3a) 說話人建議聽話人騎自行車去超市。(H)

    這是一個由T獲得規(guī)約會話含義H的例子。T蘊(yùn)涵H主要源于: 1)“吧”有勸誘義,具有“建議”等言語效果(當(dāng)然,這點(diǎn)不是QS的貢獻(xiàn));2)“自行車”自然地觸發(fā)其功能“騎”。這實(shí)際上是語義預(yù)設(shè)內(nèi)容之一。事實(shí)上,規(guī)約會話含義的產(chǎn)生,通常以語義預(yù)設(shè)為基礎(chǔ)。

    3.2 RTE的ICM理據(jù)

    ICM主要對文本語義預(yù)設(shè)、文本規(guī)約會話含義有作用。此處以“母親”的ICM為例來說明。Lakoff認(rèn)為“母親”的ICM至少應(yīng)當(dāng)包括以下子模型:

    生殖模型——生孩子

    遺傳模型——提供基因

    養(yǎng)育模型——養(yǎng)育孩子

    婚姻模型——父親的妻子

    宗譜模型——孩子最親近的女性長輩[7]

    因ICM作為圖式具有整體性,理想狀態(tài)下,“A是B的媽媽”至少包含以下這些語義預(yù)設(shè):

    H1: A生了B。

    H2: B身上有A的基因。(或“B繼承了A的基因”)

    H3: A養(yǎng)育了B。(或“A對B有養(yǎng)育之恩”)

    類似地,ICM可以觸發(fā)文本規(guī)約會話含義。試看:

    (4) 地球是人類的母親,人類生活在地球的懷抱中。(T)

    (4a) 地球養(yǎng)育著人類。(H1)

    (4b) 地球?yàn)槿祟愄峁┝松钏璧臈l件。(H2)

    (4c) 地球?yàn)槿祟愄峁┝耸孢m的生存環(huán)境。(H3)

    (4)中“母親”是隱喻用法。隱喻基于圖式,是從源域(如母親)到目標(biāo)域(如地球)基于相似性的映射。隱喻理論認(rèn)為“映射是系統(tǒng)性的,隱喻圖式具有能產(chǎn)性和創(chuàng)造性。一旦隱喻映射發(fā)生了,源域的用法可以系統(tǒng)地被目標(biāo)域所接收,一些新的隱喻用法可能被創(chuàng)造,目標(biāo)域可能被賦予新的解讀[16]”。

    逐個把“母親”各個子模型與“地球”可以觸發(fā)的聯(lián)想(不同維度的意義,可以規(guī)約化為子模型,但本文沒有提供)匹配,發(fā)現(xiàn)“母親”的“養(yǎng)育”模型在意義上與地球所具有的能力(作用)具有許多相似之處: 母親為子女提供衣食住行和無微不至的照顧,地球也無私地為人類提供各類生活資源和良好的生存環(huán)境。基于相似性,“母親”和“地球”之間借助“母親”的“養(yǎng)育”子模型確立了隱喻映射,映射確定后,“養(yǎng)育”子模型所有內(nèi)容及其結(jié)構(gòu)都可能成為“地球”ICM的內(nèi)容、結(jié)構(gòu),進(jìn)而賦予“地球”新的解讀,其結(jié)果包括: H1、H2和H3等都可以成為T的規(guī)范會話含義。這體現(xiàn)了隱喻的能產(chǎn)性和創(chuàng)造性??梢?,隱喻映射可以發(fā)生于不同ICM的子模型之間,這是局部的映射,隱喻映射具有選擇性。上述推理過程中,只突顯“母親”ICM的“養(yǎng)育”這個子模型,體現(xiàn)了認(rèn)知的轉(zhuǎn)喻性。可見,本例又是“轉(zhuǎn)喻、隱喻是基于圖式的,認(rèn)知模式主要是意象圖式形式,而不是命題形式”這個論斷的一個例示。

    3.3 RTE的框架理據(jù)

    國外有學(xué)者專門談?wù)摿丝蚣苷Z言學(xué)對RTE的影響[17]。并出現(xiàn)了利用框架[18]及其關(guān)系[19]做NLP的RTE識別研究,取得不錯的效果。但語言學(xué)方面的研究還有待深入。

    框架和框架關(guān)系都可以觸發(fā)蘊(yùn)涵,它們主要對語義預(yù)設(shè)和規(guī)約會話含義的識別有貢獻(xiàn)。框架觸發(fā)蘊(yùn)涵的過程與ICM類似,這里不再舉例說明。以下僅從幾個框架關(guān)系看蘊(yùn)涵的獲取。

    FrameNet 1.5提供了繼承、利用、分框架和視角等框架關(guān)系??蚣荛g繼承關(guān)系與詞語間繼承關(guān)系性質(zhì)類似,詞語繼承關(guān)系觸發(fā)語義蘊(yùn)涵,框架繼承關(guān)系因其間接性所觸發(fā)的蘊(yùn)涵被納入規(guī)約會話含義。根據(jù)利用的定義[12],它能觸發(fā)語義預(yù)設(shè),如:

    (5) 由于速度太快,在轉(zhuǎn)彎時撞墻起火,車上兩名歹徒當(dāng)場斃命。

    (5a) 車以很快的速度行駛。

    “速度”是“速度”框架的觸發(fā)語之一,該框架預(yù)設(shè)主體的“運(yùn)動框架”。針對主體“車”而言,用于描述其運(yùn)動的動詞包括“行駛”,因而(5)語義預(yù)設(shè)(5a)。

    分框架關(guān)系中,如果分框架之間具有嚴(yán)格的時間先后或因果關(guān)系,則也可產(chǎn)生語義預(yù)設(shè)。如犯罪框架包括逮捕、傳訊、審判和宣判四個分框架,后面的分框架預(yù)設(shè)前面所有分框架。

    同一事件因視角不同而有不同語句實(shí)現(xiàn),這些語句相互蘊(yùn)涵。如“雇傭”框架包括從雇主角度看的“聘用”框架和從求職人員角度的“找工作”框架。試看:

    (6) 他于是就退學(xué)了,以示抗議,但至今沒有找到工作。(T)

    (6a) 至今沒有人聘用他。(H)

    (6)的“(他)至今沒有找到工作”借助求職者“找工作”框架觸發(fā)“雇傭”框架,(6a)則借助雇主“聘用”框架觸發(fā)“雇傭”框架,在具體框架元素相同或沒有沖突的情況下,這兩個角度的框架互相依賴、互相蘊(yùn)涵,而且(6a)與(6)都沒有蘊(yùn)涵阻塞語*蘊(yùn)涵中阻塞語的研究是個有一定復(fù)雜性的問題,現(xiàn)有研究不少,這里不詳述。。根據(jù)這些條件可以判斷,(6)蘊(yùn)涵(6a)。從(6)得到(6a)借助于間接的框架關(guān)系,因而(6a)是(6)的文本規(guī)約會話含義。

    3.4 RTE的腳本理據(jù)

    國外已經(jīng)有人嘗試在RTE中加入腳本內(nèi)容[20]。腳本是由框架構(gòu)成的,因而兩者區(qū)分不是界限分明的。但腳本因自身特點(diǎn),在作為RTE理據(jù)時有別于框架。腳本可以為文本語義預(yù)設(shè)、規(guī)約會話含義和結(jié)果蘊(yùn)涵的識別做出貢獻(xiàn)。以下借助“飯店”腳本舉例說明。

    根據(jù)Schank & Abelson[10],從顧客的視角,飯店腳本的草圖包括以下內(nèi)容:

    腳本: 飯店

    角色: 顧客,服務(wù)員,廚師,出納員(cashier)

    理由: 取得并享受食物,充饑。

    場景1: 進(jìn)入(飯店)

    顧客進(jìn)入飯店,尋找空位,就坐。

    場景2: 點(diǎn)菜

    接受菜單,看菜單,決定吃什么,點(diǎn)菜。

    場景3: 吃

    收到食物,吃食物。

    場景4: 從飯店出來

    要求結(jié)賬,拿到賬單,給女服務(wù)員小費(fèi),走到出納處,把錢給出納,從飯店出來。

    這個腳本在英語文化中是典型的。漢語文化中的飯店腳本也大致如此,但通常顧客不會給服務(wù)員小費(fèi)。這個腳本屬于強(qiáng)腳本,前后場景和事件按照時間順序構(gòu)成具有因果關(guān)系的序列,前面重要的事件,構(gòu)成后續(xù)必要事件發(fā)生的必要條件。

    借助“飯店”腳本,可以識別以下(7)和(7a)之間的語義預(yù)設(shè)蘊(yùn)涵關(guān)系:

    (7) A: 要不,一起去吃飯吧。B: 我剛從小觀園回來呢。

    (7a) B已經(jīng)吃過飯。

    類似(7)這樣的話,估計(jì)在武漢大學(xué)經(jīng)常發(fā)生,通常說話人和聽話人都明白“小觀園”是一個吃飯地方(飯店或酒店)。“小觀園”容易觸發(fā)“飯店”腳本,腳本與其他圖式一樣,都具有理想性,如無特別說明,既然已經(jīng)“從小觀園回來”(蘊(yùn)涵“從飯店出來”),意味著腳本中時間上先于“從飯店出來”的其他事件都已發(fā)生過,因而(7)語義預(yù)設(shè)(7a)。

    根據(jù)“飯店”腳本,也可觸發(fā)文本規(guī)約會話含義,試看:

    (8) 多帶點(diǎn)錢來,我要吃飯。(T)

    (8a) 說話人要去飯店吃飯。(H)

    “錢”是飯店腳本的必要元素,“吃飯”+“(帶)錢”就能激活飯店腳本,(8)中帶錢的目的是去飯店吃飯,因而T蘊(yùn)涵H。事實(shí)上,在吃飯這個大背景下,飯店腳本中任何特有的事件(如點(diǎn)菜、結(jié)賬)(不同于在家吃飯的事件)或?qū)嶓w(如女服務(wù)員、賬單),都可以激發(fā)飯店腳本。

    由于強(qiáng)腳本的各個事件之間往往具有因果關(guān)系,因而可以為文本結(jié)果蘊(yùn)涵識別服務(wù)。從因果角度看,上面(7)中B說的內(nèi)容是(7a)的“果”,(7a)則是(7)中B說的內(nèi)容的因。盡管從邏輯角度看(7)和(7a)未必具有因果關(guān)系,但語言學(xué)上可以說得通,試看:

    (9) 你為什么從飯店出來呢?

    (9a) 因?yàn)槲乙呀?jīng)吃過飯了。

    (9b) 因?yàn)槲乙呀?jīng)付過錢了。

    (9)和(9a)、(9b)作為問和答是自然的,可見借助腳本,可以識別某些文本結(jié)果蘊(yùn)涵。

    4 結(jié)語

    認(rèn)知語義學(xué)認(rèn)為認(rèn)知模式主要是(意象)圖式形式(而不是命題形式),語言中無處不在的隱喻、換喻的運(yùn)作是基于圖式之上的。本研究顯示,不僅隱喻、轉(zhuǎn)喻推理基于圖式,語言(詞語)很多字面用法也涉及圖式。要使NLP的RTE獲得更好效果,需全面深入研究,明確圖式在RTE中的作用,并建立相應(yīng)資源。這樣有望同時為語言字面用法和隱喻、轉(zhuǎn)喻性用法理解提供更為有效的手段,提高RTE效果。

    目前,基于框架語義學(xué)的框架網(wǎng)已經(jīng)構(gòu)建,而且在多個領(lǐng)域得到了應(yīng)用。腳本庫雖未建立,也已經(jīng)有人利用腳本做RTE,但效果還不理想。參考馮志偉先生的觀點(diǎn),物性結(jié)構(gòu)、理想認(rèn)知模型、腳本與框架一樣,都有形式化的特點(diǎn),應(yīng)該可以構(gòu)建機(jī)器可讀的相關(guān)資源[21]。面向NLP的QS庫、腳本庫、ICM庫的構(gòu)建,必可提高RTE的效果。但是,這些圖式資源庫的構(gòu)建,將是一項(xiàng)難度不亞于文本蘊(yùn)含的艱巨的任務(wù),因此這成為了應(yīng)用圖式方法的一個瓶頸,是未來基于圖式RTE需要解決的主要問題。

    [1] Pazienza Pennacchiotti, M Zanzotto. A linguistic inspection of textual entailment. Advances in Artificial Intelligence[C]//Proceedings in Lecture Notes in Artificial Intelligence, 2005, (3673): 315-326.

    [2] 馮志偉. 計(jì)算語言學(xué)的歷史回顧與現(xiàn)狀分析[J]. 外國語,2011(1): 9-17.

    [3] Ungerer F, Schmid H J. An Introduction to Cognitive Linguistics[M]. Beijing: Foreign Language Teaching and Research Press, 2001: F27.

    [4] Pustejovsky J. The Generative Lexicon[J]. Massachusetts: Massachusetts Institute of Technology, 1996: 60-140.

    [5] 宋作艷. 生成詞庫理論的最新發(fā)展[J]. 語言學(xué)論叢,2001,43(6): 202-221.

    [6] Pustejovsky J. Type Theory and Lexical Decomposition[J]. Journal of Cognitive Science, 2006,(6): 39-76.

    [7] Lakoff G. Women, Fire, and Dangerous Things: What Categories Reveal about the Mind[M]. Chicago and London: The University of Chicago Press, 1987: 68-71, 74, 106, 133-134, 154, 159-376, 487.

    [8] 王寅. 語義理論與語言教學(xué)[M]. 上海: 上海外語教育出版社,2001: 192.

    [9] 王寅. 認(rèn)知語言學(xué)探索[M]. 重慶: 重慶出版社, 2005: 140.

    [10] Schank R C, Abelson R P. Scripts, Plans, and Knowledge[M].Yale University, New Haven, Connecticut, 1975:152.

    [11] Fillmore Charles J. Frame Semantics in Linguistics[C]//Proceedings of In the Morning Calm. Seoul: Hanshin Publishing Co., 1982: 111-137.

    [12] FrameNet [OL],http://www.icsi.berkeley.edu/~framenet/, accessed 10/20/2011.

    [13] Langacker R W. Cognitive Grammar: A Basic Introduction[M]. New York: Oxford University Press, 2008: 73-76.

    [14] Abelson R P. Psychological status of the script concept[J]. American Psychologisl, 1981, 36: 715-729.

    [15] 計(jì)道宏. 預(yù)設(shè)的語用功能研究[J]. 東北師大學(xué)報(bào)(哲學(xué)社會科學(xué)版),2011,(5): 101-103.

    [16] Lakoff G, Johnson M. Metaphors we live by[M]. London: The university of Chicago press, 2003: 246, 253.

    [17] Burchardt A, et al. Assessing the impact of frame semantics on textual entailment[J]. Nat. Lang. Engineering, 2009, 15(4): 527-550.

    [18] Ion A, Prodromos M. A Survey of Paraphrasing and Textual Entailment Methods[J]. Journal of Artificial Intelligence Research, 2010, 38: 135-187.

    [19] 張鵬,等. 基于FrameNet框架關(guān)系的文本蘊(yùn)含識別[J]. 中文信息學(xué)報(bào),2012,26(2): 46-50.

    [20] Murray W R. Conceptual Metaphor and Scripts in Recognizing Textual Entailment. Natural Language Processing and Cognitive Science[C]//Proceedings, 2008:127-136.

    [21] 馮志偉. 自然語言處理中的一些宏觀問題之我見[J]. 中國外語,2009,(5): 36-41.

    [22] 束定芳. 認(rèn)知語義學(xué)的基本原理 、研究目標(biāo)與方法[J]. 山東外語教學(xué),2005,(5): 3-11.

    A Tentative Study on Schemata Based Textual Entailment Recognition

    NI Shengjian1, JI Donghong2

    (1. School of Foreign Languages, Anqing Teachers’ College, Anqing, Anhui 246000, China; 2. School of Computer, Wuhan University, Wuhan, Hubei 430070, China)

    Recognition of Textual Entailment (RTE) is of substantial significance to most natural language processing. This paper explores the schematic explanations to TE, revealing how (image) schemata can justify the TE results by case studies. Schemata include qualia structure, idealized cognitive model, and frame, script, etc., all of which are structures that can be used for representing word meaning. In a broad sense, all these kinds of schemata belong to the category of semantic feature and thus have the potential to become evidences for TE. Exploration into RTE based on schemata and the construction of corresponding corpora of schemata may contribute to solving the bottleneck issues in RTE.

    RTE; schema; qualia structure (QS); idealized cognitive model (ICM); frame; script

    倪盛儉(1969—),博士,主要研究領(lǐng)域?yàn)樵~匯語義學(xué)。E?mail:723853360@qq.com姬東鴻(1966—),教授,博士生導(dǎo)師,主要研究領(lǐng)域?yàn)樽匀徽Z言處理,詞匯語義學(xué)。E?mail:Donghong_ji2000@yahoo.com.cn

    1003-0077(2015)03-0082-06

    2013-04-08 定稿日期: 2013-07-26

    安徽省2014年質(zhì)量工程教學(xué)研究重點(diǎn)項(xiàng)目(2014JYXM236);國家自然科學(xué)基金(61173062,61202193)。

    TP391

    A

    猜你喜歡
    蘊(yùn)涵語義學(xué)規(guī)約
    偉大建黨精神蘊(yùn)涵的哲學(xué)思想
    條約演化解釋:合法性、語義學(xué)分析及近似概念
    法律方法(2021年3期)2021-03-16 05:57:16
    我的超級老爸
    電力系統(tǒng)通信規(guī)約庫抽象設(shè)計(jì)與實(shí)現(xiàn)
    一種在復(fù)雜環(huán)境中支持容錯的高性能規(guī)約框架
    一種改進(jìn)的LLL模糊度規(guī)約算法
    哈特的語義學(xué)
    多重模糊蘊(yùn)涵與生成模糊蘊(yùn)涵的新方法
    關(guān)于Fuzzy蘊(yùn)涵代數(shù)的模糊MP濾子
    修辭的敞開與遮蔽*——對公共話語規(guī)約意義的批判性解讀
    嘉善县| 合水县| 临湘市| 宁陕县| 高碑店市| 攀枝花市| 宁国市| 浏阳市| 巴林右旗| 白朗县| 育儿| 自治县| 灵川县| 台北市| 共和县| 遂昌县| 浪卡子县| 内黄县| 恩施市| 察隅县| 石棉县| 新昌县| 大安市| 肃南| 葵青区| 皋兰县| 金坛市| 麻城市| 额敏县| 玉门市| 霍城县| 开远市| 白山市| 海城市| 桓仁| 监利县| 绵竹市| 台北县| 普格县| 汤阴县| 离岛区|