詹衛(wèi)東
(北京大學(xué)中文系、中國(guó)語(yǔ)言學(xué)研究中心 北京大學(xué)計(jì)算語(yǔ)言學(xué)教育部重點(diǎn)實(shí)驗(yàn)室,北京 100871)
從短語(yǔ)到構(gòu)式:構(gòu)式知識(shí)庫(kù)建設(shè)的若干理論問(wèn)題探析
詹衛(wèi)東
(北京大學(xué)中文系、中國(guó)語(yǔ)言學(xué)研究中心 北京大學(xué)計(jì)算語(yǔ)言學(xué)教育部重點(diǎn)實(shí)驗(yàn)室,北京 100871)
構(gòu)式語(yǔ)法(construction grammar)在漢語(yǔ)語(yǔ)法學(xué)界已引起持續(xù)關(guān)注,但在自然語(yǔ)言處理領(lǐng)域,將構(gòu)式語(yǔ)法理論應(yīng)用到計(jì)算機(jī)自動(dòng)句法語(yǔ)義分析中的研究還很少見(jiàn)。該文提出構(gòu)建現(xiàn)代漢語(yǔ)構(gòu)式知識(shí)庫(kù)的語(yǔ)言工程任務(wù),討論了構(gòu)式與傳統(tǒng)語(yǔ)法單位的關(guān)系、構(gòu)式的形式表示、構(gòu)式的內(nèi)部小類(lèi)及主要特征等。
構(gòu)式;知識(shí)庫(kù);組合性;非遞歸性
從注重描寫(xiě)語(yǔ)言事實(shí)的結(jié)構(gòu)主義語(yǔ)言學(xué)到注重解釋語(yǔ)言機(jī)制的轉(zhuǎn)換生成語(yǔ)法,20世紀(jì)的主流語(yǔ)言學(xué)理論對(duì)于語(yǔ)言系統(tǒng)中組合的結(jié)構(gòu)規(guī)則做了大量富有成效的研究,無(wú)論是在具體語(yǔ)言的句法語(yǔ)義規(guī)則體系方面,還是在規(guī)則知識(shí)的形式化表示方面,都取得了可觀的成果。而隨著研究的深入,也有不少語(yǔ)言學(xué)者認(rèn)識(shí)到,已有的理論和方法對(duì)于分析語(yǔ)言系統(tǒng)中的“不規(guī)則”現(xiàn)象(或稱(chēng)“邊緣”現(xiàn)象),常常顯得力有不逮。在這一背景下,自20世紀(jì)80年代認(rèn)知功能語(yǔ)法學(xué)派興起以來(lái),語(yǔ)言使用中的種種超乎一般規(guī)則的現(xiàn)象,受到了語(yǔ)法學(xué)界越來(lái)越多的重視,從初期對(duì)習(xí)語(yǔ)的個(gè)案研究,如Fillmore等對(duì)英語(yǔ)中習(xí)語(yǔ)“l(fā)et alone”的分析[1],到后來(lái)對(duì)大量的特殊句法結(jié)構(gòu)的更為系統(tǒng)的研究,如Paul等對(duì)“What’s X doing Y”的分析[2],Goldberg對(duì)英語(yǔ)雙及物構(gòu)式、致使-移動(dòng)構(gòu)式、動(dòng)結(jié)構(gòu)式、非及物移動(dòng)構(gòu)式、移動(dòng)構(gòu)式等所做的系統(tǒng)的論元結(jié)構(gòu)分析[3],逐漸形成了語(yǔ)言學(xué)中的“構(gòu)式主義視角”,發(fā)展出跟基于短語(yǔ)結(jié)構(gòu)的生成語(yǔ)法體系大不相同的基于構(gòu)式(construction)的整體語(yǔ)法觀。這種語(yǔ)法學(xué)研究視角很快在國(guó)際語(yǔ)言學(xué)界產(chǎn)生比較廣泛的影響,2013年出版的《牛津構(gòu)式語(yǔ)法手冊(cè)》分五大部分、27章對(duì)構(gòu)式語(yǔ)法各方面的研究做了全面的介紹[4]。
鑒于上述發(fā)展態(tài)勢(shì),為推進(jìn)構(gòu)式語(yǔ)法理論在漢語(yǔ)語(yǔ)法領(lǐng)域的研究,并使構(gòu)式語(yǔ)法理論在對(duì)外漢語(yǔ)教學(xué)、中文信息處理等領(lǐng)域發(fā)揮實(shí)際效用,本文提出,應(yīng)建設(shè)一個(gè)有一定規(guī)模的能覆蓋大量現(xiàn)代漢語(yǔ)真實(shí)語(yǔ)料的現(xiàn)代漢語(yǔ)構(gòu)式知識(shí)描述數(shù)據(jù)庫(kù)(以下簡(jiǎn)稱(chēng)“構(gòu)式知識(shí)庫(kù)”),即采用類(lèi)似詞庫(kù)的方式,將真實(shí)語(yǔ)料中實(shí)際運(yùn)用的構(gòu)式形式逐條收錄,并詳細(xì)描寫(xiě)每個(gè)構(gòu)式的屬性。這一語(yǔ)言工程實(shí)踐的目的,是從外延上初步確定現(xiàn)代漢語(yǔ)構(gòu)式的大體范圍,一方面為漢語(yǔ)構(gòu)式語(yǔ)法的理論研究提供豐富實(shí)例,另一方面也希望通過(guò)積累豐富的對(duì)漢語(yǔ)構(gòu)式特征的描述,為計(jì)算機(jī)自動(dòng)句法和語(yǔ)義分析,對(duì)外漢語(yǔ)語(yǔ)法教學(xué)等提供數(shù)據(jù)支持。
構(gòu)建現(xiàn)代漢語(yǔ)構(gòu)式知識(shí)庫(kù),需要制訂詳細(xì)具體的知識(shí)庫(kù)編寫(xiě)技術(shù)規(guī)范,為此,首先就要在理論層面,結(jié)合計(jì)算機(jī)分析的需要,對(duì)構(gòu)式的相關(guān)基本概念做深入討論。下文第二節(jié)對(duì)構(gòu)式的內(nèi)涵及外延做學(xué)理上的仔細(xì)分析,對(duì)構(gòu)式知識(shí)庫(kù)收錄的對(duì)象加以界定;第三節(jié)厘清構(gòu)式與傳統(tǒng)語(yǔ)法單位(特別是短語(yǔ))之間的關(guān)系;第四節(jié)討論知識(shí)庫(kù)中構(gòu)式的形式表示;第五節(jié)討論構(gòu)式的內(nèi)部分類(lèi)和主要特征;第六節(jié)說(shuō)明構(gòu)式與修辭之間的關(guān)系,交代構(gòu)式知識(shí)庫(kù)暫時(shí)無(wú)法處理的語(yǔ)言現(xiàn)象。最后第七節(jié)是結(jié)語(yǔ),簡(jiǎn)要說(shuō)明構(gòu)式知識(shí)庫(kù)目前的實(shí)施情況。
漢語(yǔ)語(yǔ)法學(xué)界對(duì)構(gòu)式的定義,一般沿用Goldberg的說(shuō)法:“C是一個(gè)構(gòu)式,當(dāng)且僅當(dāng)C是一個(gè)形式(Fi)和意義(Si)的對(duì)應(yīng)體
構(gòu)式最主要的性質(zhì)在于其形式和意義無(wú)法從其構(gòu)成成分的形式和意義推知。要比較準(zhǔn)確地理解這一內(nèi)涵,不妨從對(duì)立的一面來(lái)加以認(rèn)識(shí),從傳統(tǒng)的語(yǔ)法研究來(lái)說(shuō),詞組(短語(yǔ))由詞構(gòu)成,許多詞組的形式和意義都可以由其構(gòu)成成分的形式和意義推知,其特點(diǎn)可以歸納為:(1)內(nèi)部構(gòu)造可以而且適合分析為二分支層級(jí)樹(shù)結(jié)構(gòu); (2)內(nèi)部成分的功能范疇明確; (3)內(nèi)部成分的可替換性(可擴(kuò)展性)強(qiáng); (4)整個(gè)結(jié)構(gòu)的語(yǔ)法功能由中心成分的語(yǔ)法功能決定; (5)整個(gè)結(jié)構(gòu)的語(yǔ)義由其組成成分的語(yǔ)義組合得到。
下面是現(xiàn)代漢語(yǔ)中常見(jiàn)的主謂短語(yǔ)結(jié)構(gòu)的構(gòu)造示例:
例1
在例1所示的短語(yǔ)結(jié)構(gòu)樹(shù)中,dj代表小句(內(nèi)部一般為主謂結(jié)構(gòu)關(guān)系),np代表名詞性短語(yǔ),vp代表動(dòng)詞性短語(yǔ),dp代表副詞性短語(yǔ),n、d、v分別代表名詞、副詞、動(dòng)詞。np,vp這些語(yǔ)言單位都具有遞歸性(recursive),即np和vp中都還可以再包含np和vp,從而使得整個(gè)結(jié)構(gòu)具有很強(qiáng)的擴(kuò)展能力,即生成更長(zhǎng)的同型結(jié)構(gòu)的能力*例1中的“孩子們?cè)诔蕴O(píng)果”就很容易擴(kuò)展為更長(zhǎng)的同型結(jié)構(gòu):“那些調(diào)皮的孩子們 已經(jīng) 在 大口大口地 吃 偷來(lái)的蘋(píng)果”。。
跟例1所示的作為語(yǔ)言中常規(guī)組合的短語(yǔ)結(jié)構(gòu)相對(duì),構(gòu)式作為超常規(guī)的組合,其特點(diǎn)則可以歸納為:(1)構(gòu)式不適合分析為二分支層級(jí)樹(shù)結(jié)構(gòu); (2)內(nèi)部成分的功能范疇不明確; (3)內(nèi)部成分的可替換性(可擴(kuò)展性)弱; (4)結(jié)構(gòu)或者無(wú)中心成分,或者整體的功能不由中心成分的語(yǔ)法功能決定; (5)整體的語(yǔ)義不能由組成成分的語(yǔ)義組合得到。(6)除上述特點(diǎn)外,典型的構(gòu)式往往具有獨(dú)特的交際功能(價(jià)值),是比較有特色的表達(dá)方式。
一個(gè)形式和意義結(jié)合體,如果具有上述六項(xiàng)特征中的任何一條,就可以看作是構(gòu)式,符合的特征越多,則其作為構(gòu)式的典型程度就越高。下面看兩個(gè)簡(jiǎn)單的例子,例中加粗的部分不適合按照傳統(tǒng)的短語(yǔ)結(jié)構(gòu)組合來(lái)分析,而適合看作構(gòu)式。
例2 (眼看)梨樹(shù)長(zhǎng)得有兩個(gè)人高了(,卻總是只開(kāi)花不結(jié)果)。
例3 天底下長(zhǎng)得像的人多了去了。
例2中的“有兩個(gè)人高”,例3中的“多了去了”都不大容易按照一般短語(yǔ)結(jié)構(gòu)的組合模式分析,用類(lèi)似例1那樣的二叉樹(shù)的結(jié)構(gòu)來(lái)描述例2、例3的內(nèi)部層次構(gòu)造有困難。用目前比較主流的自動(dòng)句法分析工具(無(wú)論是短語(yǔ)結(jié)構(gòu)分析器還是依存句法分析器)來(lái)分析這樣的句子,得到的結(jié)果往往都不如人意*讀者可以用依存句法分析器(比如http://www.ltp-cloud.com/demo/) 和短語(yǔ)結(jié)構(gòu)句法分析器(比如http://nlp.stanford.edu:8080/parser/ )來(lái)測(cè)試這類(lèi)含有構(gòu)式表達(dá)的分析結(jié)果。。顯然,要處理這類(lèi)含有構(gòu)式表達(dá)的句子,需要專(zhuān)門(mén)針對(duì)構(gòu)式的特殊性,研究其知識(shí)表示和用法規(guī)律。
在“現(xiàn)代漢語(yǔ)構(gòu)式知識(shí)庫(kù)”語(yǔ)言工程的工作框架中,我們把典型的構(gòu)式看作是無(wú)遞歸性的非平凡的(non-trivial)短語(yǔ)結(jié)構(gòu)。典型的構(gòu)式作為既含常項(xiàng)又含變項(xiàng)的語(yǔ)言單位,是對(duì)常規(guī)短語(yǔ)結(jié)構(gòu)語(yǔ)法組合的必要補(bǔ)充。下面進(jìn)一步分析構(gòu)式與短語(yǔ)之間的關(guān)系。
一般來(lái)說(shuō),漢語(yǔ)學(xué)界通常把語(yǔ)法單位分為語(yǔ)素、詞、詞組、句子等四個(gè)層級(jí)。這些單位都是所謂的“音義結(jié)合體”,即同時(shí)具有語(yǔ)音(物理)形式和語(yǔ)義(心理)內(nèi)容的語(yǔ)言單位*相比之下,音素、音節(jié)這樣的語(yǔ)言單位就是只有語(yǔ)音形式而無(wú)意義內(nèi)容的純語(yǔ)音單位(而非語(yǔ)法單位)。。其中語(yǔ)素和詞作為基本單位一般認(rèn)為其長(zhǎng)度和數(shù)量都是有限的,而詞組則是長(zhǎng)度無(wú)限的(至少是潛在無(wú)限),總的數(shù)量更是無(wú)限的,不適合窮盡性的羅列,需要研究其組合的類(lèi)型和規(guī)則。一般假定,詞組的組合類(lèi)型可能是有限的,組合的規(guī)則(制約條件)也是相對(duì)有限的。根據(jù)有關(guān)漢語(yǔ)詞組本位語(yǔ)法體系的思想,漢語(yǔ)句子和詞組的構(gòu)造大體相同[5-7]。因此,把詞組的組合規(guī)則搞清楚,句子的主要組合規(guī)則也就清楚了。
作為漢語(yǔ)傳統(tǒng)的語(yǔ)法單位中最重要、覆蓋面最廣的單位,詞組(短語(yǔ))的主要特點(diǎn)在上文中已做了概要說(shuō)明,這里通過(guò)一些例子的分析進(jìn)一步來(lái)討論詞組內(nèi)部成分之間(語(yǔ)義)關(guān)系的多樣性,以及成分的高可擴(kuò)展性(即構(gòu)成成分的遞歸性)。在這兩點(diǎn)上,典型的構(gòu)式都具有跟詞組(短語(yǔ))不同的性質(zhì)。此外,下文的分析同時(shí)還想說(shuō)明,盡管構(gòu)式跟詞組(短語(yǔ))構(gòu)造有顯著的不同,但二者之間并無(wú)截然可分的明確界限。
例4 N1+N2 (定中結(jié)構(gòu)名詞性詞組)
A B
北大 教師 細(xì)胞 詞庫(kù)
體操 明星 輸入法 皮膚
花園 洋房 網(wǎng)絡(luò) 水手
上面例中A、B兩組都是名詞+名詞形成的定中結(jié)構(gòu)關(guān)系的詞組,但是,A、B具體的實(shí)例中n1和n2的語(yǔ)義關(guān)系存在明顯的多樣性,即很難找到一個(gè)共同的釋義模板(替換表達(dá)形式),來(lái)對(duì)這些實(shí)例做統(tǒng)一的釋義。而就A、B兩組實(shí)例比較來(lái)說(shuō),A組的例子是容易理解的常見(jiàn)組合。B組的例子則是出現(xiàn)時(shí)間不長(zhǎng),比較新的詞組,代表的是新的事物(現(xiàn)象)。它們也符合1.1節(jié)對(duì)構(gòu)式的界定標(biāo)準(zhǔn),即結(jié)構(gòu)整體的語(yǔ)義很難從其構(gòu)成成分推導(dǎo)出來(lái)。那么,它們所代表的模式“n1+n2”是不是構(gòu)式呢?因?yàn)閚1和n2之間語(yǔ)義關(guān)系的多樣性,我們很難給出一個(gè)“形式——意義”配對(duì),以構(gòu)式的方式來(lái)描述n1+n2組合。從這個(gè)角度說(shuō),n1+n2組合不適合看作為一個(gè)抽象的構(gòu)式類(lèi)型(type),而只能作為一般的詞組(短語(yǔ))來(lái)處理。不過(guò),n1+n2組合中的某些具體實(shí)例(token),特別是例4中B組的例子,則可以作為構(gòu)式實(shí)例來(lái)看待,相當(dāng)于詞一級(jí)的語(yǔ)法單位(可參見(jiàn)下文有關(guān)凝固型構(gòu)式的說(shuō)明)。
例5 np1+中+的+np2(定中結(jié)構(gòu)名詞性詞組)
A B
生命中的瞬間 男人中的男人
阿Q生命中的六個(gè)瞬間 天才中的天才
阿Q短暫生命中的六個(gè) 奇跡中的奇跡
驚心動(dòng)魄的瞬間
例5A組的實(shí)例np1和np2都可以做比較自由的擴(kuò)展,這些實(shí)例體現(xiàn)的是常規(guī)短語(yǔ)組合的性質(zhì),即高可擴(kuò)展性。例5B組的例子中np1和np2由同形的單個(gè)名詞(n)充任,基本不具有擴(kuò)展性*例5B中有的實(shí)例可能存在非常有限的擴(kuò)展形式,例如:“男人中的頂級(jí)男人,天才中的超級(jí)天才,超級(jí)天才中的超級(jí)天才,……”,擴(kuò)展形式將原式中的隱含義顯式地表達(dá)出來(lái)了。。整體表達(dá)一個(gè)共同的語(yǔ)義,即n所表示的事物集合中最突出、最典型的元素。從例5A和例5B組實(shí)例的對(duì)比來(lái)看,盡管二者都可以用“np1+中+的+np2”來(lái)模式化,但5A是常規(guī)的詞組;5B是構(gòu)式。5B可以更精確地模式化為“n+中+的+n”(前后兩個(gè)n同形)。如果要對(duì)例5B的實(shí)例進(jìn)行擴(kuò)展,生成的例子或者可接受度較差,或者難以接受。如例6所示:
下面再看一個(gè)介乎短語(yǔ)和構(gòu)式之間的語(yǔ)法形式的例子。
例7 X 對(duì) Y
A B
中國(guó) 對(duì) 丹麥 天 對(duì) 地
林丹 對(duì) 陶菲克 大陸 對(duì) 長(zhǎng)空
中國(guó)隊(duì)的林丹 對(duì) 印尼隊(duì)的陶菲克 梨兒腹內(nèi)酸 對(duì) 蓮子心中苦
例7A組中的“對(duì)”是“對(duì)陣、對(duì)抗”的意思;例7B組中的“對(duì)”是“對(duì)仗”的意思。例7A組實(shí)例的X和Y都是np(名詞性短語(yǔ)),X和Y的長(zhǎng)度(音節(jié)數(shù))可以不同,但語(yǔ)義都是指人或團(tuán)體;例7B組實(shí)例的X和Y可以是任意的語(yǔ)言成分,X和Y的長(zhǎng)度相同,語(yǔ)法范疇、語(yǔ)義范疇、聲調(diào)特征等也要求對(duì)應(yīng)(即符合對(duì)聯(lián)的形、音、義約束條件)。如果把例7格式看作短語(yǔ)(詞組),例7A和B兩組實(shí)例都只能看作是主謂結(jié)構(gòu)或并列結(jié)構(gòu),其中的“對(duì)”、X和Y等成分都受到比較強(qiáng)的約束限制。如果把例7格式看作構(gòu)式,從形式上說(shuō),跟X、Y的可擴(kuò)展性相悖;從語(yǔ)義上說(shuō),“X 對(duì) Y”的整體語(yǔ)義主要由其中的“對(duì)”決定,例7A和7B中的“對(duì)”可以處理為兩個(gè)義項(xiàng),使得整體語(yǔ)義大致上可以由其組成成分推導(dǎo)得到。我們認(rèn)為,例7反映的現(xiàn)象就是介于短語(yǔ)(詞組)和構(gòu)式之間的一種情況。既有短語(yǔ)的性質(zhì),也有構(gòu)式的性質(zhì),或者反過(guò)來(lái)說(shuō),既不是典型的短語(yǔ),也不是典型的構(gòu)式。
通過(guò)上面例4-例7的分析,大致可以歸納出有關(guān)構(gòu)式特性的以下三個(gè)要點(diǎn),用于指導(dǎo)構(gòu)式庫(kù)操作層面的具體工作,特別是哪些語(yǔ)法形式應(yīng)收入構(gòu)式庫(kù)。
(1) 構(gòu)式有組合性,構(gòu)式應(yīng)看作是大于傳統(tǒng)語(yǔ)法單位中的詞的單位,構(gòu)式與傳統(tǒng)語(yǔ)法單位中的詞的區(qū)別,主要在于組合性。收入詞典(詞庫(kù))中的詞作為最基本的語(yǔ)法單位,可以不關(guān)心其內(nèi)部構(gòu)成。而構(gòu)式庫(kù)的定位是介于詞庫(kù)和短語(yǔ)規(guī)則庫(kù)之間的語(yǔ)言知識(shí)資源。收入構(gòu)式庫(kù)中的構(gòu)式,可以向內(nèi)透視到其更為基本的構(gòu)成成分——詞項(xiàng)。而其“特殊之處”在于,這些詞項(xiàng)不是按照一般常規(guī)的組合方式組合到一起,而是滋生出了原詞項(xiàng)沒(méi)有的意義。例如,“用數(shù)據(jù)說(shuō)話(huà)、用事實(shí)說(shuō)話(huà)、用拳頭說(shuō)話(huà)、哪兒的話(huà)”等組合,這些語(yǔ)言單位,一般不會(huì)收入傳統(tǒng)的詞典,又不是常規(guī)的短語(yǔ)(詞組),就適合收入構(gòu)式庫(kù)中。
(2) 構(gòu)式無(wú)遞歸性(或無(wú)擴(kuò)展性、少擴(kuò)展性),這一點(diǎn)主要是把構(gòu)式跟一般的短語(yǔ)(詞組)對(duì)比來(lái)看。因?yàn)闊o(wú)(或少)遞歸性,帶來(lái)的后果就是,構(gòu)式的長(zhǎng)度一般較為有限,不大能像普通詞組那樣擴(kuò)展得很長(zhǎng)。構(gòu)式內(nèi)部成分的可替換性一般不高。
(3) 構(gòu)式是從傳統(tǒng)語(yǔ)法單位中因其“形式——意義”配對(duì)的特殊性而抽離出來(lái)的語(yǔ)法單位。也正因?yàn)槿绱?,?gòu)式跟傳統(tǒng)的語(yǔ)法單位保持著一定程度上的交疊關(guān)系,無(wú)法截然分開(kāi)。從語(yǔ)義角度看,構(gòu)式的語(yǔ)義往往無(wú)法著重落實(shí)在其構(gòu)成成分中的某一個(gè)(或幾個(gè))上,即沒(méi)有中心成分和從屬成分之分,而是由全部構(gòu)成成分共同決定的(參見(jiàn)上文關(guān)于例5B的討論)。這個(gè)特點(diǎn)或許可以進(jìn)一步概括為“構(gòu)式中的成分,一個(gè)也不能少”。當(dāng)然,這是就句法組合層面來(lái)說(shuō)的。構(gòu)式在實(shí)際使用中受到語(yǔ)用因素的影響,也可能出現(xiàn)省略其中某項(xiàng)成分的情況,比如“村口有一株老槐樹(shù)”可以省略“有”成為“村口一株老槐樹(shù)”;“一鍋飯吃十個(gè)人”可以省略“吃”成為“一鍋飯十個(gè)人”等等。不過(guò),從理論上說(shuō),省略后的構(gòu)式跟省略前相比,其“形式——意義”配對(duì)必然有所差別(比如省略形式有更多歧義的可能性,“一鍋飯十個(gè)人”可能理解為并列式名詞性短語(yǔ),因而實(shí)際上也對(duì)應(yīng)著另外一個(gè)構(gòu)式。
上文將構(gòu)式與短語(yǔ)結(jié)構(gòu)的性質(zhì)做了對(duì)比。短語(yǔ)結(jié)構(gòu)的內(nèi)部構(gòu)成一般以np、vp等短語(yǔ)功能分類(lèi)范疇為基礎(chǔ),表示為層層二分的嵌套樹(shù)狀結(jié)構(gòu)。而構(gòu)式則應(yīng)該表示為線(xiàn)性的序列結(jié)構(gòu)。但具體如何表達(dá)構(gòu)式的線(xiàn)性序列結(jié)構(gòu),仍有不同的選擇。比如有的學(xué)者就建議構(gòu)式可以由語(yǔ)塊(chunk)構(gòu)成[8-10]。不過(guò),關(guān)于“語(yǔ)塊”的理解,語(yǔ)言學(xué)界在不同發(fā)展階段也有過(guò)不同的看法,相對(duì)多數(shù)的意見(jiàn)是把“語(yǔ)塊”看作介于詞和短語(yǔ)之間的語(yǔ)言單位,或稱(chēng)為“詞匯性短語(yǔ)”(lexical phrase)。薛小芳、施春宏把語(yǔ)塊看作是“比較特殊的構(gòu)式”。構(gòu)式的外延更廣,既包括由具體的語(yǔ)言成分形成的具有預(yù)制性的“實(shí)體塊”,也包括相對(duì)抽象的結(jié)構(gòu)構(gòu)式(比如雙及物構(gòu)式“np1+v+np2+np3”)。前者既是構(gòu)式,又是語(yǔ)塊,而后者則只看作是構(gòu)式,而不看作是語(yǔ)塊[11]。
男女是有性格差異存在的,但是過(guò)去社會(huì)對(duì)女性的性別刻板印象造成了女性對(duì)男性的愛(ài)僅著眼于協(xié)助男性處理內(nèi)務(wù),料理日?,嵥?。愛(ài)的范圍不是淺薄的日常起居,而是與男性同等的承擔(dān)風(fēng)霜、享受美好,更是對(duì)男性品格的欣賞、人生位置堅(jiān)守的肯定及對(duì)其整體成長(zhǎng)環(huán)境的理解與接納。這些都應(yīng)當(dāng)是兩性之愛(ài)的外延,應(yīng)當(dāng)成為愛(ài)一個(gè)人的高度與深度。
本文認(rèn)為,構(gòu)式的內(nèi)部成分并不適合用“語(yǔ)塊”來(lái)描述。如果要用語(yǔ)塊去作為描述構(gòu)式內(nèi)部成分的基本單位時(shí),實(shí)際上會(huì)很自然地把“語(yǔ)塊”看作是一個(gè)“語(yǔ)義組塊”。比如,把漢語(yǔ)中表存在義的結(jié)構(gòu)表示為“存在處所—存在方式—存在物”(桌上 放著 一個(gè)花瓶),由三個(gè)語(yǔ)塊構(gòu)成,其中每個(gè)語(yǔ)塊的名稱(chēng)很顯然都是指語(yǔ)義范疇。用語(yǔ)義組塊表達(dá)構(gòu)式內(nèi)部成分有利于廓清構(gòu)式的基本格局,便于人來(lái)認(rèn)識(shí)該構(gòu)式,但從計(jì)算機(jī)形式處理的角度來(lái)說(shuō),這些語(yǔ)義塊對(duì)應(yīng)的語(yǔ)法形式單位,卻不能一以貫之地用語(yǔ)義范疇加以描述,仍然要求助于句法范疇。這有點(diǎn)類(lèi)似于在表達(dá)短語(yǔ)結(jié)構(gòu)的內(nèi)部構(gòu)成時(shí),如果采用“主語(yǔ)+謂語(yǔ)”這種模式來(lái)描述,就不如采用“np+vp”這樣的可遞歸嵌套至詞一級(jí)語(yǔ)法單位的描述模式[12]。另外,也是更重要的問(wèn)題是,如果仔細(xì)考慮構(gòu)式的整體性,以及語(yǔ)塊的“形式——意義”整合性,一個(gè)構(gòu)式內(nèi)部通常應(yīng)該是一個(gè)“整體塊”,而并不總是可以拆解為承擔(dān)不同功能的語(yǔ)塊。上面的存在義構(gòu)式似乎容易拆解一些,但是像“天才中的天才”(n+中+的+n)“多了去了”(a+了+去+了)“漂亮什么漂亮”(a+什么+a)“你唱你的”(r+v+r+的)等等許多構(gòu)式,其內(nèi)部成分都很難拆解為不同的功能語(yǔ)塊。
基于上面的認(rèn)識(shí),對(duì)于構(gòu)式的內(nèi)部成分的描述,本文主張不以語(yǔ)塊(組塊)作為基本單位來(lái)表示構(gòu)式的組成,而是以常項(xiàng)(constant)和變項(xiàng)(variable)為基本單位,來(lái)記錄構(gòu)式的組成。圖1以“你唱你的戲”為例,展示了不同的內(nèi)部結(jié)構(gòu)表示方式。
圖1
圖1(a)把構(gòu)式內(nèi)部成分看作是線(xiàn)性序列組合,由五項(xiàng)成分一次組合成型,不需中間結(jié)構(gòu)單位;圖1(b)把“你唱你的戲”看作是先由兩個(gè)組塊構(gòu)成,其中vp組塊再由“v+r+de+n”這四項(xiàng)組成;圖1(c)是短語(yǔ)結(jié)構(gòu)的層次嵌套組合模式,其中vp、np都具有遞歸性(即組成成分中包含了自身)。本文認(rèn)為構(gòu)式適合采用圖1(a)的形式表示方式。
上面從跟傳統(tǒng)語(yǔ)法單位的對(duì)比角度闡釋了我們對(duì)構(gòu)式內(nèi)涵的認(rèn)識(shí),這一節(jié)再進(jìn)一步來(lái)看構(gòu)式包括哪些具體的類(lèi)型,或者說(shuō)從外延的角度來(lái)認(rèn)識(shí)構(gòu)式。
國(guó)外一些構(gòu)式語(yǔ)法學(xué)者對(duì)構(gòu)式的分類(lèi)基本上涵蓋了傳統(tǒng)語(yǔ)法的大多數(shù)語(yǔ)法單位,是對(duì)語(yǔ)法單位整體的性質(zhì)持一種比較寬泛的構(gòu)式觀[13-15]。相對(duì)而言,本文則持一種相對(duì)狹義的構(gòu)式觀,從跟傳統(tǒng)語(yǔ)法單位的對(duì)應(yīng)來(lái)看,本文把漢語(yǔ)中的構(gòu)式分為四類(lèi):(1)凝固型構(gòu)式,(2)半凝固型構(gòu)式,(3)短語(yǔ)型構(gòu)式,(4)復(fù)句型構(gòu)式。它們之間的差異可以通過(guò)下表來(lái)呈現(xiàn)。概括而言,從(1)到(4),也是反映了成分復(fù)雜度和抽象度的增加,具體體現(xiàn)在組塊數(shù)量、變項(xiàng)數(shù)量、構(gòu)式長(zhǎng)度的增加,以及成分類(lèi)型多樣性程度、可替換性程度的增加。
表1 構(gòu)式的分類(lèi)及特性
表2給出各類(lèi)構(gòu)式的一些具體實(shí)例。
表2 構(gòu)式類(lèi)型及示例
續(xù)表
凝固型構(gòu)式大致相當(dāng)于傳統(tǒng)語(yǔ)法單位中的詞。不過(guò),跟詞不同的是,凝固型構(gòu)式有組合性,即凝固型構(gòu)式由多個(gè)詞組合而成,比如“用腳投票”就是由三個(gè)詞“用、腳、投票”組合而成的一個(gè)凝固型構(gòu)式。一般詞匯中的詞語(yǔ),特別是像純粹的單純?cè)~,即由一個(gè)語(yǔ)素構(gòu)成的詞,仍應(yīng)按傳統(tǒng)觀念,看作詞級(jí)語(yǔ)法單位,不作為構(gòu)式處理,比如像“仁波切”(指活佛、上師、智者,德高望重的人……)這樣的詞。
半凝固型構(gòu)式介于傳統(tǒng)語(yǔ)法單位的詞和短語(yǔ)之間。跟凝固型構(gòu)式不同的是,它一般包含一個(gè)或兩個(gè)變項(xiàng),一旦變項(xiàng)被具體的詞語(yǔ)替代,形成的單位就跟凝固型構(gòu)式很相似。半凝固型構(gòu)式跟短語(yǔ)型構(gòu)式的界限比較模糊,相當(dāng)多的半凝固型構(gòu)式一般為四音節(jié)(傳統(tǒng)上也稱(chēng)為“四字格”固定短語(yǔ)),而且內(nèi)部成分之間往往有對(duì)舉并列的關(guān)系。短語(yǔ)型構(gòu)式在音節(jié)長(zhǎng)度、內(nèi)部成分的關(guān)系等方面更多樣一些。
復(fù)句型構(gòu)式對(duì)應(yīng)傳統(tǒng)語(yǔ)法單位的復(fù)句,一般由兩部分組成。有的復(fù)句型構(gòu)式中的一部分可以獨(dú)用。像上文舉過(guò)的“你唱你的,他寫(xiě)他的”,前后兩個(gè)組塊就相對(duì)獨(dú)立,可以單用。
對(duì)于知識(shí)庫(kù)中一個(gè)具體的構(gòu)式條目,除了標(biāo)記其所屬類(lèi)型外,還要描述其主要的形式特征和語(yǔ)義特征。表3、表4是目前知識(shí)庫(kù)中構(gòu)式特征的設(shè)置及其示例。
表3 構(gòu)式語(yǔ)法特征及其示例
①異序特征假定了構(gòu)式在短語(yǔ)結(jié)構(gòu)(常規(guī))組合中有一個(gè)對(duì)應(yīng)的常規(guī)的語(yǔ)序。比如對(duì)于“是他說(shuō)漏嘴的”,就是假定原始語(yǔ)序是“說(shuō)漏嘴的是他”,按照一般短語(yǔ)組合規(guī)則分析為np(說(shuō)漏嘴的)vp(是他),主謂結(jié)構(gòu)。謂語(yǔ)部分“是他”前移到主語(yǔ)np“說(shuō)漏嘴的”前面,形成“是他說(shuō)漏嘴的”(強(qiáng)調(diào)句)。
表4 構(gòu)式語(yǔ)義特征及其示例
續(xù)表
一個(gè)構(gòu)式的“構(gòu)式特征”取值允許多選,比如“他是豬肉餡兒”構(gòu)式既有“語(yǔ)義錯(cuò)配”特征,也有“省略”特征。
典型的構(gòu)式在“形式——意義”配對(duì)時(shí)往往有很強(qiáng)的超常錯(cuò)配特點(diǎn),包括語(yǔ)法范疇、語(yǔ)義范疇、語(yǔ)用范疇等多個(gè)層面的錯(cuò)配。而這樣的語(yǔ)言現(xiàn)象,正是傳統(tǒng)上修辭關(guān)注的對(duì)象,即字面意義(由形式直接推導(dǎo)的意義)與實(shí)際表達(dá)意義(形式上無(wú)法直接推導(dǎo)的意義)之間的超常聯(lián)系。從這個(gè)角度說(shuō),修辭(尋求非常規(guī)的表達(dá)方式)大概是形成構(gòu)式的主要驅(qū)動(dòng)力。在語(yǔ)言實(shí)際使用中,最新的修辭表達(dá)方式都是臨時(shí)偶發(fā)的,而一旦某種修辭表達(dá)方式因許多人的跟隨模仿而反復(fù)出現(xiàn),成為一種模式,進(jìn)而固定下來(lái),就成為語(yǔ)言系統(tǒng)中一種穩(wěn)定的表達(dá)方式,即構(gòu)式。這樣的構(gòu)式使用時(shí)間長(zhǎng)了,其修辭意味就很有可能會(huì)大大降低,可能不再被人們視為一種“新奇”的表達(dá),又成為“常規(guī)”表達(dá)方式中的一員了。從動(dòng)態(tài)的觀點(diǎn)看某個(gè)時(shí)間段內(nèi)語(yǔ)言中的構(gòu)式,比較突出的,有很強(qiáng)構(gòu)式感的表達(dá)形式,往往就是這段時(shí)間內(nèi)流行的一種修辭表達(dá)方式。在當(dāng)今的互聯(lián)網(wǎng)媒體時(shí)代,因?yàn)樾畔⒔涣鞯谋憷?,傳播速度非???,一種新奇的表達(dá)方式,從出現(xiàn)到普及,從小范圍使用到全社會(huì)通用,往往可以在很短時(shí)間內(nèi)完成,從一種偶發(fā)的修辭語(yǔ)言現(xiàn)象,迅速成為一個(gè)語(yǔ)言社團(tuán)中大家都比較熟悉也比較樂(lè)于使用的新興構(gòu)式。表5是一些網(wǎng)絡(luò)語(yǔ)言中常見(jiàn)的帶有鮮明修辭色彩的構(gòu)式例子。
表5 修辭型構(gòu)式示例
需要注意的是,有的修辭表達(dá)方式著重在兩個(gè)具體詞語(yǔ)之間的搭配超出常規(guī),或者某個(gè)具體的詞語(yǔ)的語(yǔ)義發(fā)生轉(zhuǎn)指,例如,
例8 看見(jiàn)你的聲音 (“聲音”跟“看見(jiàn)”搭配,從聽(tīng)覺(jué)現(xiàn)象轉(zhuǎn)為視覺(jué)現(xiàn)象)
例9 農(nóng)民工的聲音 (“聲音”轉(zhuǎn)指其所承載的“看法、觀點(diǎn)、訴求”等內(nèi)容)
像上面這樣的修辭表達(dá)形式,如果要看作構(gòu)式,則只能處理為“凝固型構(gòu)式”。因?yàn)檫@類(lèi)表達(dá)形式只用實(shí)例化的形式,沒(méi)有進(jìn)一步模式化。
還有不少具有鮮明的修辭色彩的表達(dá)形式,盡管其形式和意義之間的配對(duì)也符合構(gòu)式的特征要求,但從形式化表達(dá)的角度看,很難表述為常項(xiàng)加變項(xiàng)的模板。例如,
例10 基層干部……工作是 5+2,白加黑,禮拜六保證不休息,禮拜天休息不保證。
例11 袁君是大連一名電視臺(tái)記者,過(guò)著有選題忙死,沒(méi)有選題死忙的高壓鍋生活。
例12 重慶老漢一根扁擔(dān)“挑出”3個(gè)大學(xué)生
例13 中學(xué)生踢球“踢”進(jìn)北大 全國(guó)僅兩人
例14 讀書(shū)有兩個(gè)過(guò)程,先要把書(shū)讀厚,這是消化的過(guò)程,然后再把書(shū)讀薄,這才是理解的象征。
像上面例10-例14,只能看做純粹的修辭現(xiàn)象,很難作為構(gòu)式來(lái)加以形式化描寫(xiě)。
近年來(lái)國(guó)外構(gòu)式語(yǔ)法的研究有一個(gè)鮮明的共性,無(wú)論是在形式化表示體系的理論建構(gòu)方面,還是在基于構(gòu)式語(yǔ)法的計(jì)算框架設(shè)計(jì)方面,研究者的目標(biāo)都是從“構(gòu)式主義”視角出發(fā)來(lái)搭建新的語(yǔ)法分析框架,視圖替代(或“收編”)原有的語(yǔ)法分析模式。比如SBCG(基于符號(hào)的構(gòu)式語(yǔ)法)就是以HPSG(中心詞驅(qū)動(dòng)短語(yǔ)結(jié)構(gòu)語(yǔ)法)的形式化方法為底本,以構(gòu)式來(lái)整合傳統(tǒng)的短語(yǔ)結(jié)構(gòu)語(yǔ)法體系中的各類(lèi)語(yǔ)法單位,將以往對(duì)短語(yǔ)組合規(guī)則的描述全盤(pán)移植并擴(kuò)充升級(jí)為對(duì)各類(lèi)構(gòu)式*在SBCG的框架中,構(gòu)式涵蓋了以往的常規(guī)語(yǔ)法單位,如詞和短語(yǔ)結(jié)構(gòu)(核心語(yǔ)法現(xiàn)象)和大量的非常規(guī)特殊結(jié)構(gòu),即狹義的構(gòu)式(邊緣語(yǔ)法現(xiàn)象)。的知識(shí)描述[16]。跟這種“以新代舊”的思路不同,本文對(duì)漢語(yǔ)構(gòu)式的研究更傾向于走“融合”之路,特別是在面向計(jì)算的漢語(yǔ)句子自動(dòng)句法分析中,本文認(rèn)為,探索如何把構(gòu)式的分析融合到傳統(tǒng)的短語(yǔ)結(jié)構(gòu)語(yǔ)法體系中,是更為務(wù)實(shí)的策略。正如著名的認(rèn)知語(yǔ)言學(xué)家Ronald Langacker所指出的那樣:“語(yǔ)言是規(guī)則與不規(guī)則的混合體”[17],本文的基本認(rèn)識(shí)是,傳統(tǒng)的短語(yǔ)結(jié)構(gòu)語(yǔ)法可以處理大量的語(yǔ)言常規(guī)組合現(xiàn)象,而構(gòu)式則適用于描述非常規(guī)的組合。二者可以結(jié)合。尤其是在目前階段,對(duì)漢語(yǔ)具體構(gòu)式的個(gè)案研究較多,且研究興趣大多集中在構(gòu)式的語(yǔ)義描寫(xiě)、構(gòu)式的語(yǔ)用功能特色、構(gòu)式的認(rèn)知機(jī)制等等方面,對(duì)于漢語(yǔ)構(gòu)式知識(shí)的形式化表示,以及在計(jì)算機(jī)自動(dòng)分析中的應(yīng)用等,都還很少涉及,更談不上深入系統(tǒng)的研究。如果完全照搬英語(yǔ)構(gòu)式語(yǔ)法的形式化體系(如BCG,SBCG等)來(lái)描寫(xiě)漢語(yǔ)的構(gòu)式,替代傳統(tǒng)的短語(yǔ)結(jié)構(gòu)語(yǔ)法形式化體系,這種自頂向下(top-down)的設(shè)計(jì)理念遭遇“水土不服”的可能性很大。相反,如果以相對(duì)穩(wěn)定且比較成熟的短語(yǔ)結(jié)構(gòu)語(yǔ)法形式化(范疇)體系為基礎(chǔ)框架,將漢語(yǔ)構(gòu)式知識(shí)的新發(fā)現(xiàn)結(jié)合進(jìn)來(lái),在缺乏“形合”(hypotactic mechanism)約束的漢語(yǔ)大環(huán)境中,注重更多地發(fā)掘“意合”(paratactic mechanism)約束的條件,則穩(wěn)妥得多。
在上述思想指導(dǎo)下,我們已經(jīng)在現(xiàn)代漢語(yǔ)構(gòu)式知識(shí)庫(kù)中收錄了800余條構(gòu)式,其中短語(yǔ)型構(gòu)式407條(50.62%)、半凝固性構(gòu)式265條(32.96%)、復(fù)句型構(gòu)式114條(14.18%)、凝固型構(gòu)式18條(2.24%)。關(guān)于構(gòu)式常項(xiàng)、變項(xiàng)數(shù)目的分布統(tǒng)計(jì),構(gòu)式不同特征的比例等信息,可訪(fǎng)問(wèn)http://ccl.pku.edu.cn/ccgd/ 查詢(xún)?cè)斍?。?duì)這些構(gòu)式,如何進(jìn)行釋義,如何描寫(xiě)其常項(xiàng)、變項(xiàng)成分的約束條件,以及構(gòu)式在使用中的整體約束條件,為自動(dòng)句法語(yǔ)義分析提供幫助,是我們下一步工作的重點(diǎn)。
致謝:本文寫(xiě)作中得到北大中文系陸儉明教授、沈陽(yáng)師范大學(xué)文學(xué)院夏軍副教授提出許多寶貴意見(jiàn)和修改建議。北大中文系研究生馬騰、劉洪超、侯人渝、黃思思、田駿、苗宇晶、李安然、夏雪、趙賢參加了課題大量工作,特此致謝!
[1] Fillmore C J,Kay P,M C O’Connor,Regularity and Idiomaticity in Grammatical Constructions:The Case of Let Alone[J].Language1988,64,(3):501-538.
[2] Kay,Paul,Fillmore,Charles J.Grammatical Constructions and Linguistic Generalizations:the What’s X doing Y? Construction[J],Language1999,25(1):1-33.
[3] Goldberg A E.A Construction Grammar Approach to Argument Structure[M],The University of Chicago Press.1995.
[4] Hoffmann T.,Trousdale G,(eds.),The Oxford Handbook of Construction Grammar,Oxford University Press.2013.
[5] 郭紹虞,漢語(yǔ)詞組對(duì)漢語(yǔ)語(yǔ)法研究的重要性[J],復(fù)旦大學(xué)學(xué)報(bào),1978,1.
[6] 朱德熙,語(yǔ)法講義[M],商務(wù)印書(shū)館,1982.
[7] 朱德熙,語(yǔ)法答問(wèn)[M],商務(wù)印書(shū)館,1985.
[8] 陸儉明,多維視野下的漢語(yǔ)教學(xué)——第七屆國(guó)際漢語(yǔ)教學(xué)學(xué)術(shù)研討會(huì)論文集[R],廣西師范大學(xué)出版社,2009:3-8.
[9] 蘇丹潔,試析“構(gòu)式-語(yǔ)塊”教學(xué)法——以存現(xiàn)句教學(xué)實(shí)驗(yàn)為例[J],漢語(yǔ)學(xué)習(xí),2010:2,83-90.
[10] 蘇丹潔,陸儉明.“構(gòu)式-語(yǔ)塊”句法分析法和教學(xué)法,世界漢語(yǔ)教學(xué)[J].2010:4,557-567.
[11] 薛小芳,施春宏.語(yǔ)塊的性質(zhì)及漢語(yǔ)語(yǔ)塊系統(tǒng)的層級(jí)關(guān)系[J],當(dāng)代修辭學(xué),2013:3,32-46.
[12] 詹衛(wèi)東,以“計(jì)算”的眼光看漢語(yǔ)語(yǔ)法研究的“本位”問(wèn)題[J],漢語(yǔ)學(xué)報(bào),2005:1,64-73.
[13] Croft W.,Cruse D A.Cognitive linguistics.Cambridge[M].Cambridge University Press.2004.
[14] Goldberg A E.Construction at work:The Nature of generalization in language[M].Oxford University Press.2006.
[15] Goldberg A E.,The Oxford Handbook of Construction Grammar[M],Oxford University Press,2013.
[16] Boas H C,Sag I A.Sign-based Construction Grammar[M],CLSI Publications,Stanford University.2012.
[17] Langacker,Ronald W,Foundations of Cognitive Grammar:Theoretical Prerequisites[M].Stanford University Press.1987.
On Theoretical Issues in Building A Knowledge Database of Chinese Constructions
ZHAN Weidong
(Chinese Linguisitic Research Center,Department of Chinese,Peking University MOE Key Lab of Computational Linguistics,Peking University,Beijing 100871,China)
Although the construction grammar has already drawn much attention in the field of Chinese linguistics,scholars in the field of natural language processing are rarely concerned with this approach to syntactic and semantic parsing of Chinese.This paper proposes a linguistic engineering project of building a knowledge database of Chinese constructions.Some key issues in this task are discussed,including the differences between the construction and the classical grammar units,the formalism of the construction,the types and features of the construction and so on..
construction; knowledge database; compositionality; non-recursive
詹衛(wèi)東(1972—),教授,主要研究領(lǐng)域?yàn)楝F(xiàn)代漢語(yǔ)形式語(yǔ)法,中文信息處理,漢語(yǔ)語(yǔ)言知識(shí)工程。E-mail:zwd@pku.edu.cn
1003-0077(2017)01-0230-09
2016-09-20 定稿日期:2016-10-16
國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(2014CB340504);教育部人文社科重點(diǎn)研究基地重大項(xiàng)目(13JJD740001,15JJD740002);國(guó)家社科基金(12&ZD175)
TP391
A