鄭麗娟,邵艷秋
(北京語言大學信息科學學院,北京100083)
句子語義分析是語言研究深入發(fā)展的客觀要求,也是當前制約語言信息技術(shù)大規(guī)模深度應用的主要瓶頸。尤其是對漢語這種意合性語言而言,句子形式靈活多變,句子形式不同,表達的語義就會存在細微差別,同一種句法結(jié)構(gòu)可以表達多種語法意義,同一種意義也可以由多種形式表達。雖然關(guān)于句子的語義分析研究存在很多困難,但也不是毫無規(guī)律可言,只要找出這些規(guī)律,就可以進行更深入的研究。
任何一個句子都是句法、語義和語用的共同體,不存在一個沒有語義語用只有句法的句子,表達句法結(jié)構(gòu)的句型和表達語義結(jié)構(gòu)的句模之間必然存在著某種對應關(guān)系,但這種對應關(guān)系必然不是一對一的簡單對應關(guān)系,而是一個一對多、多對一或者多對多的映射關(guān)系,并且這種對應關(guān)系中必然有一個或幾個是很常用的,而其余的則是低頻使用[1]。目前,關(guān)于句法的計算研究已經(jīng)比較成熟,在句法的基礎上,研究句法和語義的映射關(guān)系,可以幫助句子語義分析,將語義分析的研究進一步深化。
兼語句是漢語的一種特殊句型。目前為止,關(guān)于兼語句的語義研究或是只注重句中極個別詞語的語言關(guān)系描寫[2],或是只重視分析兼語成分前面和后面的V1、V2之間隱藏的深層事件語義關(guān)系[3]。本文以漢語中的一個特殊句型——兼語句為研究起點,研究兼語句句子所對應的句子語義結(jié)構(gòu),并對每一類兼語句句模進行了詳細刻畫,試圖描寫出兼語句句型和句模的對應關(guān)系,以期為更大規(guī)模的句模研究提供新的研究視角,因為好的句模研究不僅有助于機器自動理解句子、生成符合規(guī)范的句子,同時也有助于提高機器翻譯和機器自動問答的準確率,促進人工智能的發(fā)展。
關(guān)于語義的研究很多,建立起來的相應的語義資源也不少。英文中比較著名的語義資源有加州大學伯克利分校的FrameNet[4]、賓夕法尼亞大學的Prop-Bank[5]以及紐約大學的NomBank[6]。中文比較有代表性的語義資源主要包括Chinese PropBank(CPB)[7],Chinese FrameNet[8]和Chinese NomBank[9]。
就研究方法而言,句子語義分析方法主要有兩種:淺層語義分析和深層語義分析。面對復雜的語言學現(xiàn)象,深層、全面的語義分析往往需要大量知識的支撐,為了避免深層語義分析研究的困難,許多研究者對語義分析的研究是從淺層語義分析開始的。語義角色標注[10-11]是目前淺層語義分析的一種主要實現(xiàn)方式,其并不對整個句子做詳細、深入的分析,只分析句子中主要謂詞與其論元之間的語義關(guān)系,并沒有對論元內(nèi)部的各成分之間的語義關(guān)系進行分析。此外,語義角色標注通常都是在句法分析的基礎上進行的。依據(jù)不同的句法分析方法,語義角色標注可以分為基于短語結(jié)構(gòu)分析[12]、基于依存關(guān)系分析[13]和基于語塊的分析[14-15]。還有部分學者避開轉(zhuǎn)換方法,直接從研究句子語義入手,建立一套語義分析體系,重新標注語料,從而展現(xiàn)句子語義結(jié)構(gòu)的真實狀況。例如,清華大學李涓子的語義依存分析理論[16]、武漢大學姬東鴻的基于特征結(jié)構(gòu)理論的語義依存圖理論[17]等。
到目前為止,關(guān)于句子的語義分析研究成果很多,也取得了很大的成績,但仍存在一些問題,例如,關(guān)于語義角色的數(shù)量各家都有不同,語義角色數(shù)量難以確定;句子的部分語義信息缺失等。
句模是句子在語義平面上的結(jié)構(gòu)類型[18]。如句子“黃曼昨天在教室里告訴我一個秘密”,其句模為“[施事]+[時間]+[地點]+【告訴】/【傳播】+[對象]+[內(nèi)容]”。句??煞譃楹唵尉淠:蛷碗s句模兩大類[17],簡單句模只包含一個動核結(jié)構(gòu),上個例句的句模就是一個簡單句模;復雜句模則包含一個以上的動核結(jié)構(gòu),如本文討論的兼語句。簡單句模又根據(jù)帶不帶狀元分為基干句模和擴展句模,基干句模只包括謂詞和其必有論元?;删淠V懈鱾€語義角色位置是相對固定的,位置不同就會形成不同的句模。
隨著范曉和胡附先生的三個平面理論的提出,句模研究受到越來越多的重視。對句模研究做過突出貢獻的有范曉[19]、朱曉亞[20]、徐昌火[21]和魯川[22]等。范曉對句模做出了嚴格的定義,并認為句模的研究對象是動核結(jié)構(gòu),動核結(jié)構(gòu)是形成句子語義結(jié)構(gòu)的基礎,句模是動核結(jié)構(gòu)生成句子時與句型結(jié)合在一起的語義成分的配置模式[19]。朱曉亞[20]先將動詞分為動作、經(jīng)驗、性狀和關(guān)系四個大類,然后根據(jù)動詞在語義平面上所帶必有論元數(shù)目的不同,建立了一個分類層級系統(tǒng)和語義角色系統(tǒng),進而進行句模分類和描寫。徐昌火[21]認為:“句模研究的是句子在語義平面上的關(guān)系語義,并且強調(diào)配價研究不應該作為句模研究的起點,而應該是句模研究的歸宿?!濒敶ǎ?2]提出了謂詞格框架分析系統(tǒng),他認為句模的語義單位由小到大可以分為概念、事元、事件三個部分,句模的成分包括“中樞事元”和“周邊事元”,它們擔任的語義角色分別是“中樞角色”和“周邊角色”,而一個“事件”由一個“中樞事元”以及若干個“周邊事元”組成。在此基礎上,再根據(jù)動核的特征把現(xiàn)代漢語句模分為26類并研究每一類別下可以形成的基本句模,共計128個,在研究過程中還討論了能夠進入每一類句模的代表性謂詞。
亢世勇、田珍都等在標注了大規(guī)模語料的基礎上,對句模的研究也做出突出貢獻。田珍都[23]著重討論了漢語句模體系和句模的使用頻度兩個問題,把句模分成單句形式和復句形式的句模,并從語料庫中提取句模327種,其中單句形式的句模311種,復句形式的16種。在此基礎上又將單句形式句模分為簡單句模和復雜句模,單句形式的復雜句模又分為一系、二系、三系、四系、多系五種類型,而復句形式的句模又分為相離、相接、融合三種類型。據(jù)此建立了現(xiàn)代漢語的句模體系??菏烙拢?4]等人在大規(guī)模標注語料庫的基礎上,建立了漢語的句系系統(tǒng),從句型角度考察了句模和句型對應關(guān)系并統(tǒng)計出句模的頻度及分布情況。
現(xiàn)有對句模的研究,有的過于細化,將語義的細微差別也一起反映到了語義結(jié)構(gòu)的系統(tǒng)分析之中,有的則過于概括,未能完全覆蓋漢語復雜多變的句子語義結(jié)構(gòu);但是過于概括或具體都會失去句模研究在語法研究上的意義。對特殊句式的句模研究、句模與其句法結(jié)構(gòu)對應規(guī)律的研究不是太過零散就直接回避。總體來看,對特殊句式的語義分析還不夠完善,對其語義成分和句法成分間的對應關(guān)系缺乏深入的分析研究。
兼語句是指由兼語短語充當謂語或獨立成句的句子[25]。所謂兼語短語是指由動賓短語和主謂短語部分重合在一起,其中動賓短語的賓語兼做主謂短語的主語這樣一種短語。例如,“請他來”,“他”是請的“賓語”,又是“來”的主語,叫做兼語。在語言學界,兼語句語形可以表示為“N1+V1+N2+V2”。N1指句子主語,V1是句子中的第一個謂詞,也即兼語動詞,N2指兼語,V2是兼語句中的第二個動詞。
從兼語句的定義可以看出,兼語句構(gòu)成的句模一定是一個復雜句模,兼語句句模是一個由單句形式表示的復雜句模。實際上,已經(jīng)有學者做過關(guān)于兼語句語義結(jié)構(gòu)的研究,如孫道功、許小星、黃曉冬等。孫道功[2]和許小星[26]等以語塊為基點,按兼語動詞的不同把其分為五大類兼語句句模,但卻忽略了對兼語句中兩個動詞之間語義關(guān)系的描寫。而黃曉冬[3]從本體研究出發(fā),僅研究了兼語句中兩個動詞組成的動核結(jié)構(gòu)之間的語義關(guān)系,并把這種語義關(guān)系按照深層語義的不同,分為四類:表目的或結(jié)果、表原因、表領有或存在和表稱呼、認定。只是他們的研究都停留在兼語句中某個詞語所承擔的語義角色或者詞語之間的語義關(guān)系上,均未對這些兼語句句模進行整體刻畫。從嚴格意義上來,還不能算是句模描寫。
漢語語言表達形式靈活,語言現(xiàn)象豐富,實際的句子中經(jīng)常會出現(xiàn)某個詞語和句中其他多個詞語發(fā)生語義關(guān)聯(lián)的現(xiàn)象,即依存詞不唯一;另外,不同的依存詞對之間也會出現(xiàn)依存弧交叉的情況。這些情況都是傳統(tǒng)的依存樹結(jié)構(gòu)無法處理卻真實存在的現(xiàn)象,并且這些依存樹結(jié)構(gòu)無法表達的語義關(guān)系,如果不能正確地表示出來,可能會影響對句子意義的理解。
句子“我有個妹妹很能干。”用依存樹分析的結(jié)果如圖1所示。從圖1中可以看出,依存樹結(jié)構(gòu)[27]必須滿足四個形式化的條件:1)單一父節(jié)點;2)連通;3)無環(huán);4)投射,也即弧線之間不交叉。在這個句子中,“有”是句子的核心,它在語義上直接或者間接支配句子中的其他語義成分,如“有”直接支配“妹妹”,并且他們之間的語義關(guān)系是領有關(guān)系,這種語義關(guān)系已在弧線上標注出來;“有”間接支配“個”,它是通過支配“妹妹”而支配量詞“個”;“個”受“有”的屬事角色“妹妹”直接支配。
圖1 語義依存樹
用語義依存樹分析漢語句子清晰,簡潔,美觀,但有時卻會丟失或者錯誤理解句子的語義信息。例如,針對這個句子,機器自動問答想知道“誰”很“能干”,從依存樹的標注結(jié)果來看,機器得到結(jié)果“我”,然而,這個答案是錯誤的。實際上是“妹妹”很“能干”,機器會得出這個錯誤的答案,因為用依存樹理論分析漢語這種意合性語言還存在一定的缺陷,所以我們對這種理論進行了改造,提出語義依存圖理論。
我們的語義分析以句子為單位,以提取句子中所有的修飾詞與核心詞對(構(gòu)建一條從核心詞指向修飾詞的?。┎俗⑺鼈冎g的語義關(guān)系(在弧上標注詞對間的語義關(guān)系)為目標,并且通過標注語義依存圖的形式體現(xiàn)出來。
實際上,依存圖放寬了依存樹的四個限制條件,依存圖與依存樹的不同主要表現(xiàn)在兩個方面:1)允許多父親節(jié)點的出現(xiàn);2)允許非投射現(xiàn)象出現(xiàn),即允許依存弧之間存在交叉[28]。
正如前文提到的依存樹結(jié)構(gòu)的不足,為了避免這種缺陷,在依存圖結(jié)構(gòu)中,只要詞語之間存在真實的語義關(guān)系,就允許一個語義成分有多個父節(jié)點。這種多父節(jié)點的外在表現(xiàn)就是:在依存圖中,一個詞語可以有多條入弧,如圖2中的“妹妹”?!懊妹谩庇袃蓚€父節(jié)點“有”和“能干”,相對于兩個父節(jié)點,“妹妹”承擔的語義角色不同:一個是屬事角色,另一個是當事角色。這些角色都已在弧線中間表示出來。
圖2 依存圖中的多父節(jié)點現(xiàn)象
依存圖的另一個特點就是允許出現(xiàn)弧線之間的交叉。如圖3所示,詞對(打,他)、(破,杯子)之間的依存弧出現(xiàn)了交叉。而且這樣的交叉是必須的,因為如果“破”與“杯子”之間不存在依存弧,就無法明確“破”的當事角色。
圖3 依存圖中的非投射現(xiàn)象
除了滿足形式化的條件外,語義分析還有其自己對語義角色的定義。對漢語語義關(guān)系的定義,不同的語言學家給出了不同的劃分。董振東在知網(wǎng)中提出事件內(nèi)部語義關(guān)系總計83類[29],馮志偉提出了30種論元關(guān)系[30],袁毓林提出40種語義關(guān)系標記[31],魯川提出了26種語義關(guān)系[22]。但是,各個學者的語義關(guān)系體系中所定義的語義關(guān)系有交集,有不同,綜合考慮以上各種體系的復雜性、可區(qū)分性、覆蓋性、以及在工程實踐標注時的可操作性,以董振東[29]和魯川[22]的體系為基礎,我們也定義了一套全面、簡單、實用,同時能適應自然語言處理高層應用要求的語義關(guān)系體系。該語義關(guān)系體系包含五類語義標簽:周邊角色集(45個)、嵌套關(guān)系集、反關(guān)系集、事件關(guān)系集(19個)和語義依附標記集(17個)。嵌套關(guān)系是指由小句或者謂詞性短語充當語義角色的現(xiàn)象,此謂詞性短語實際上是降級了的事件。反關(guān)系指那些充當論元定語的動詞或動詞性短語,這種顛倒了的語義關(guān)系實際上和正常的動賓搭配語義是一樣的,只是動詞位置不同,為了區(qū)分這種差別,我們又定義了反關(guān)系集。這里在表達反關(guān)系集和嵌套關(guān)系集時,繼承了周邊角色集中的45個語義標簽,只是在標簽前再額外用標記r-來表達此關(guān)系,用d-來表示嵌套關(guān)系。由于篇幅關(guān)系,這里對標簽集不再贅述。
依據(jù)已經(jīng)建立的語義關(guān)系體系,我們已經(jīng)建立了一個包含30 000個句子的語義依存圖語料庫,其中已完成對10 038個句子的校對工作。這些語料都來自于不同的領域,包括新聞語料(10 068)、中小學語文課本(10 038)、新浪微博語料(5 000)和用于機器翻譯的語料(4 900)。下文對兼語句句模的描寫就是以這個已標注的語料庫為基礎。
兼語句作為漢語中一種常用的特殊句式,也常常與其他句式連用,從而使得研究更加困難。為了簡化研究,本文以單純的兼語句(不包括兼語連動連用句)為研究對象。其次,雖然已經(jīng)標注了30 000個句子,但是仍然有20 000句等待校對,所以,文章兼語句句模的研究是以10 038個來自中小學語文課本的校正語料為基礎。
我們的語料庫標注結(jié)果采用CoNLL數(shù)據(jù)格式存儲,共有十列,如表1所示。其中,第一列數(shù)字表示詞語在句中的位置;第二列是當前詞語或標點,第三列為詞語原型,中文語料的第二列和第三列相同;第四列和第五列分別為粗粒度和細粒度詞性;第六列為句法特征,此處未被使用,以下劃線標識;第七列為該詞語的父節(jié)點即其核心詞的序號;第八列為該節(jié)點和父節(jié)點之間的語義關(guān)系;第九和第十列本語料庫不予標記。
表1 標注結(jié)果存儲形式
兼語句的句法結(jié)構(gòu)要求有兩個謂詞性詞語,兩個謂詞性詞語之間有一個名詞性短語,并且這個名詞性詞語(即兼語)一定有兩個父節(jié)點。因此,按照結(jié)構(gòu)存儲規(guī)則和兼語句的句式特點,我們設置了圖4所示的兼語句自動抽取算法。
依據(jù)此抽取算法,我們在10 038個句子中共抽取了真正兼語句297條,偽兼語句141條。其中偽兼語句是指程序自動抽出的符合兼語句形式標準,卻不是兼語句的句子和兼語連動連用的句子。
圖4 兼語句自動抽取算法
句模描寫具有層級性。層級性的原則是由上到下數(shù)目逐漸增多。其中數(shù)目最少的當屬兼語句中兩個動詞表示的事件之間的邏輯關(guān)系了,所以兼語句中兩個動詞表達的事件之間的語義關(guān)系為第一個層級;第二個層級以兼語句中兼語N2所承擔的語義角色組合的不同為核心,輔以主語的語義角色和兼語動詞V1,將兼語句中可以充當V1的動詞分為:使令、命令、勸令、委托、提供、推舉、協(xié)同、協(xié)助、跟隨、喜惡和有無類[32],此外,這里描寫的句模直接忽略了具體句子中出現(xiàn)的時間、空間和方式等表示附加意義的周邊語義角色,因為多數(shù)動詞都可以任意添加這些語義角色表達相同的語義,只是在句中的位置不同;第三個層級是對典型V1的舉例。
兼語動詞V1是“有無類”的兼語句是兼語句中比較特殊的一類,這類兼語句在很多情況下,可以通過句式轉(zhuǎn)換,變成一個普通的句式,并且句子表達的語義不會有很大差別。這種可以轉(zhuǎn)換與不可以轉(zhuǎn)換的“有無類”兼語句之間不存在明顯差別;另一方面,“有無類”兼語句表達的兩個事件之間的語義關(guān)系也不是很明確,只能細細體會到事件主體自然而然變了。因此,我們在這里就將所有的“有無類”兼語句表達的事件關(guān)系定義為順承關(guān)系。
根據(jù)對兼語句中兩個動詞之間語義關(guān)系的考察,這兩個動詞的語義關(guān)系可以用四種語義關(guān)系來概括:結(jié)果、順承、目的和原因。但是這四種事件語義關(guān)系卻不是同等重要,即其使用頻率存在很大差別。順承和結(jié)果相對而言,使用的更為頻繁,原因的使用是最少的。在兼語句中,每個兼語都承擔著兩種語義角色,從理論角度看,兼語承擔的語義角色會形成成百上千種不同的組合關(guān)系,但事實卻不是這樣的。根據(jù)真實語料,我們發(fā)現(xiàn)在四種事件關(guān)系中,兼語承擔的語義角色總共形成了23種不同的組合關(guān)系。在表示結(jié)果、目的、順承和原因關(guān)系的兼語句中,兼語承擔的語義角色組合關(guān)系分別有11種、9種、15種和3種。其中一些組合關(guān)系是至少兩種事件關(guān)系當中共有的(10種),還有一些則是某種事件關(guān)系當中所獨有的(13種)。部分兼語句句模的具體情況如下表2所示。
表2 兼語句句模
以表2中第一個例句為例,V1為使令類動詞“使得”,V2為普通動詞“啞口無言”,兼語N2“他”既是V1的“與事”角色同時又是V2的“當事”角色,句子主語N1“論點”是V1的“當事”角色,V1“使得”和V2“啞口無言”之間構(gòu)成原因—結(jié)果關(guān)系,但是在這種情況下,原因不是十分突出。在這種表示結(jié)果關(guān)系的兼語句中,那些以沒有實在意義的詞“使”“讓”做兼語動詞的兼語句中,都可以把句子主語當做后一事件的緣故成分去解釋,完全不會影響句子語義的表達和理解。如句子“一條新修的公路,使我家失去了四季翠綠的菜園”,表達這個意義的普通句式為“因為一條新修的公路,我家失去了四季翠綠的菜園”。所以在這里就會出現(xiàn)一定的問題,漢語中是否真的存在兼語句,是否能把這種兼語動詞處理為虛詞還有待進一步的研究。
“使令類”動詞既可以出現(xiàn)在表示結(jié)果關(guān)系的兼語句中,也可以出現(xiàn)在表示目的關(guān)系的兼語句中。這樣一來,可能會造成結(jié)果關(guān)系和目的關(guān)系難以區(qū)分,但是這樣的表示目的關(guān)系的“使令類”動詞確實與表示結(jié)果關(guān)系的“使令類”動詞有很大差別。一方面,出現(xiàn)在兩種表示不同的事件關(guān)系的兼語句中的“使令類”還是存在一些意義上的差別,這種差別可以在句模中反映出來。在表示目的關(guān)系的兼語句中,“使令類”動詞是具有實在意義的詞語,其意義類似于“命令、要求”等,且兼語句的主語通常是它們的施事;而在表示結(jié)果關(guān)系的兼語句中,“使令類”詞語意義比較虛,且句子主語通常是其當事或者省略;另一方面,表示結(jié)果關(guān)系的“使令類”動詞周圍通常會出現(xiàn)一些時體標記“了”、“昨天”等。
在表示順承關(guān)系的兼語句句模中,“有無類”兼語句占相當高的比重。一方面,因為“有無類”兼語句并不存在明顯的事件關(guān)系,只是單純的順其自然地轉(zhuǎn)換話題,如在句子“早上六點鐘起,就有群眾的隊伍入場了?!敝校诙€事件的話題自然而然轉(zhuǎn)移到“隊伍”;并且這種兼語句通??梢赞D(zhuǎn)換成普通的存在句,即把這類兼語句中的V2代表的整個事件提前到兼語之前,充當兼語的定語。如“村里有一個離奇的故事一直在流傳著”可以轉(zhuǎn)換成“村里有一個一直在流傳著的離奇的故事”;另一方面,在那些不能替換和能替換成普通存在句的“有無類”兼語句之間還未能找到合理的科學的解釋。如句子“這一夜,沒有什么人睡覺,”和“陸地上幾乎沒有什么東西覆蓋它們。”,兼語都是“什么”,一個可以轉(zhuǎn)換,一個卻不能轉(zhuǎn)換。
相對于其他三種句模,表示原因的兼語句句模的種類和數(shù)量是最少的,但也是最具有區(qū)別度的。因為在這種句模中,兼語動詞常常是喜惡類動詞,并且喜惡類動詞不會進入其他三種兼語句句模結(jié)構(gòu)。表示原因的兼語句可以通過轉(zhuǎn)換變成一個表示原因—結(jié)果關(guān)系的復句。如句子“妻子埋怨他不務正業(yè)”,可以轉(zhuǎn)換成“妻子埋怨他,因為他不務正業(yè)”,這個單句和復句在意義上沒有任何差別,只是語言形式不同。
除了上述例舉的12種兼語句句模,本文共總結(jié)了38種兼語句句模,其中結(jié)果關(guān)系句模11種,目的關(guān)系九種,順承關(guān)系15種和原因關(guān)系三種。但是由于文章長度限制,在這里,不能展示所有的具體句模,只能在有限的空間內(nèi)展示盡可能多的具體句模。同時,由于語料規(guī)模較小,在大規(guī)模語料中可能會出現(xiàn)這38種兼語句句模無法覆蓋的情況。但即使是這樣,這些句模的總結(jié)也將更好地幫助構(gòu)建語義依存關(guān)系自動分析模型。
鑒于依存分析的優(yōu)點和漢語語言的特點,本文提出了一種新的句子語義分析理論——語義依存圖理論。語義依存圖結(jié)構(gòu)有兩個不同于語義依存樹的特點:1)多父節(jié)點;2)非投射。此外,兩者對語義角色的定義也不同,語義依存圖理論定義了一套有系統(tǒng)、分層級的語義關(guān)系體系。根據(jù)這套理論,我們建立了一個包含30 000個句子的語義依存圖庫。在10 000個來自該語料庫的句子的基礎上,對其中的兼語句(不包括兼語連動連用句)的語義結(jié)構(gòu)進行了總結(jié)。這種語義結(jié)構(gòu)的描寫是分層次、有結(jié)構(gòu)的描寫。第一層是兼語句中兩個謂詞代表的事件之間的語義關(guān)系:1)結(jié)果;2)目的;3)順承;4)原因;第二層以兼語承擔的語義角色組合關(guān)系為核心,輔以主語的語義角色和兼語動詞V1的動詞類,共總結(jié)23種不同的組合關(guān)系、11種V1所屬語義類和38種具體的兼語句句模;第三層是對典型V1的舉例。這樣對兼語句句模進行描寫可以幫助建立句型與句模的映射關(guān)系,從而促進句法-語義界面研究和語義研究的發(fā)展,同時,也能幫助機器自動生成符合規(guī)范的句子,促進人工智能的發(fā)展。
由于語料規(guī)模有限,可能還存在以上兼語句句模不能覆蓋的兼語句現(xiàn)象,這一點,還有待于語料規(guī)模的擴大。此外,兼語句中第二個謂詞表示的事件框架往往與第二個謂詞的謂詞意義和特點有很大的關(guān)系,因此,對第二個謂詞的分類研究和進行更加完善全面的兼語句句模描寫和結(jié)構(gòu)設計將是下一步工作。再者,研究其他特殊句式的句模和建立漢語句子的句模系統(tǒng)也將是我們未來的研究工作。
[1] 孫道功,亢世勇,孫茂松.基于標注語料庫的現(xiàn)代漢語單句句型句模的對應關(guān)系研究[C].全國第八屆計算語言學聯(lián)合學術(shù)會議論文集,2005:234-240.
[2] 孫道功,亢世勇,孫茂松.面向語言處理的單句句型句模對應關(guān)系研究——基于標注語料庫的定量考察[J].計算機工程與應用,2006,33:170-173.
[3] 黃曉冬.試論兼語短語的語義結(jié)構(gòu)[J].四川師范大學學報,2009,36(6):38-43.
[4] Fillmore Charles J,Collin F Baker.FrameNet:Frame Semantics Meets the Corpus[D].Poster presentation,74th Annual Meeting of the Linguistics Society of A-merica,2000.
[5] Palmer M,Gildea D,Kingsbury P.The Proposition Bank:A Corpus Annotated with Semantic Roles[J].Computational Linguistics,2005,31(1):71-105.
[6] Chang Liu,HweeTou Ng.Learning Predictive Structures for Semantic Role Labeling of NomBank[C]//Proceedings of the ACL 2007:208-215.
[7] N Xue,M Palmer.Annotating the Propositions in the Penn Chinese Treebank.Q Ma,F(xiàn) Xia,(Editors)[C]//Proceedings of the Second SIGHAN Workshop on Chinese Language Processing,2003:47-54.
[8] Liping You,Kaiying Liu.Building Chinese FrameNet Database[C]//Proceedings of the 2005IEEE International Conference on Natural Language Processing and Knowledge Engineering,2005:301-306.
[9] Nianwen Xue.Annotating the predicate-argument structure of Chinese nominalizations[C]//Proceedings of the fifth international conference on Language Resources and Evaluation,Genoa,Italy,2006.
[10] Min Zhang,Wanxiang Che,Guodong Zhou,et al.Semantic Role Labeling Using a Grammar-Driven Convolution Tree Kemel[C]//Proceedings of the IEEE Transactions on Audio Speech and Language Processing 2008,16(7):1315-1329.
[11] Wanxiang Che,Min Zhang,Ai Ti Aw,et al.Using a Hybrid Convolution Tree Kernel for Semantic Role Labeling[C]//Proceedings of the ACMTransactions on Asian Language Information Processing 2008,7(4):1-23.
[12] Xue NW.Labeling Chinese Predicates with Semantic Roles[J].Computational Linguistics,2008,34(2):225-255.
[13] Hacioglu K.Semantic Role Labeling using Dependency trees[C]//Proceedings of the COLING04Proceedings of the 20th international conference on Computational Linguistics.2004:1273-1281.
[14] 丁偉偉,常寶寶.基于語義組塊分析的漢語語義角色標注[J].中文信息學報,2009,23(5):53-61,74.
[15] Carreras X,Mrques L.Introduction to the conll2005 shared task:semantic role labeling[C]//Proceedings of the CONLL 05Proceedings of the 9th Conference on Computational Natural Language Learning.Stroudsburg:Association for Computational Linguistics.2005:152-164.
[16] 尤昉,李涓子,王作英.基于語義依存關(guān)系的漢語語料庫的構(gòu)建[J].中文信息學報,2003,17(1):46-53.
[17] B Chen,D Ji.Chinese Semantic parsing Based on de-pendency Graph[C]//Proceedings of the First International Conference on Electronic &Mechanical Engineering and Information Technology,2011:1730-1734.
[18] 范曉.三個平面的語法觀[M].北京:北京語言學院出版社,1996.
[19] 范曉,朱曉亞.論句模研究的方法[J].徐州師范大學學報,1999,25(4):18-23.
[20] 朱曉亞.現(xiàn)代漢語句模研究[M].北京:北京大學出版社,2001.
[21] 徐昌火.試論句模研究的對象、起點和基本原則[J].南京師范大學學報,1999,4:101-108.
[22] 魯川.漢語語法的意合網(wǎng)絡[M].北京:商務印書館,2001.
[23] 田珍都.基于標注語料庫的現(xiàn)代漢語句模研究[D].煙臺師范學院碩士學位論文,2002.
[24] 亢世勇,許小星.現(xiàn)代漢語句系系統(tǒng)的構(gòu)建和研究[J].中文信息學報,2010,24(1):103-109.
[25] 黃伯榮,廖旭東.現(xiàn)代漢語(第四版)[M].北京:高等教育出版社,2007.
[26] 許小星.基于標注語料庫的現(xiàn)代漢語特殊句式語義分析[D].煙臺:魯東大學碩士學位論文,2007.
[27] Robinson J J.Dependency Structures and Transformation Rules[J].Language,1970,46(2):259-285.
[28] 鄭麗娟,邵艷秋,楊爾弘.中文非投射語義依存現(xiàn)象分析研究[J].中文信息學報,2014,28(6):41-47.
[29] Qiang Dong,ZhendongDong.Hownet and Computation of Meaning[M].World Scientific Publishing Company,2006.
[30] 馮志偉.中文信息處理與漢語研究[M].北京:商務出版社,1992.
[31] 袁毓林.基于認知的漢語計算語言學研究[M].北京大學出版社,2008.
[32] 游汝杰.現(xiàn)代漢語兼語句的句法和語義特征[J].漢語學習,2002,6:1-6.