• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向計算的現(xiàn)代漢語雙音詞分離及其語法意義與特性研究

    2015-04-21 08:43:34薛宏武
    中文信息學報 2015年3期
    關鍵詞:雙音詞分離式句法

    薛宏武

    (重慶師范大學文學院,重慶 401331)

    ?

    面向計算的現(xiàn)代漢語雙音詞分離及其語法意義與特性研究

    薛宏武

    (重慶師范大學文學院,重慶 401331)

    漢語缺乏嚴格的形態(tài)束縛,在句子里雙音詞經常由于嵌入相關句法成分而呈現(xiàn)出分離。為了提高自然語言處理中語段分詞、詞性標注及基于規(guī)則的句子語義計算的準確性與有效度等,文章系統(tǒng)考察了現(xiàn)代漢語里典型詞與離合詞的分離現(xiàn)象,挖掘并刻畫出它們各自形成的語法動因、條件、意義以及分離而成的成分的語法特性等,從而對現(xiàn)代漢語中雙音詞的分離做出了系統(tǒng)多層級的理論思考。文章指出典型詞的分離是語用作用的結果,分離結構的意義是主觀的;而離合詞分離是句法語義作用的產物,意義是客觀的。

    面向計算;雙音詞;分離;語法意義與特性;現(xiàn)代漢語

    1 引言

    漢語缺乏印歐語那樣的嚴格形態(tài)束縛,數(shù)量占優(yōu)勢的雙音詞(形式簡稱為m1m2,m表示語素)經常在句子里由于嵌入相關句法成分而被動態(tài)分離,從而呈現(xiàn)出復雜多樣的形式變化(變形)與語法單位級別的變化(變性)。這是本體研究與應用研究都必須面對的重要課題。其中有兩個密切相關的根本問題表現(xiàn)得更為突出: 一是定性與定量,前者是確定分離后m1與m2的語法身份,包括是否為語法單位、有何語法性質及其句法身份;后者指m1與m2若是作為句法成分的語法單位,那么在句中還涉及到對其計數(shù)——即算幾個。二是指雙音詞分離前后,其語法意義或功能有何不同。

    目前雙音詞分離的本體研究,可概括為事實上的不周延及止于外延上的“例”“類”刻畫(token & type),表現(xiàn)為將可分離的雙音詞局限于離合詞上(Separable word,下文簡稱SW),然后分類刻畫其組配模式、嵌入成分的類特征、m的類特征及其語法活動的特征等。事實上離合詞僅是詞與短語之間的一個連續(xù)范疇(continuous category)。離合詞是不典型的詞,因此,離開了對典型雙音詞(Prototype word,下文簡稱PW)的分離考察,研究是有缺失的。

    計算機語義識別的起點是能對語段做出連續(xù)一致的詞語切分與詞性標注。目前這兩方面在效度與準確度上是有問題的。典型的事實表現(xiàn)之一,就是對自由文體(free style)中雙音詞分離后的m1與m2的處理。由于對雙音詞分離缺乏一個系統(tǒng)的理論認識,因此在對雙音詞分離的語段進行詞語切分與詞性標注時,現(xiàn)有的各種操作是不相一致的。而這又會直接影響到基于規(guī)則的句子語義理解。

    本文擬從動、靜兩個語法層級,通過真實文本語料去系統(tǒng)考察PW與SW因嵌入詞語而出現(xiàn)分離的動因、條件、m1與m2的語法特征及意義等。以期為中文信息處理中的詞語切分、標注及基于規(guī)則的句子語義理解作出應有的理論支持。為表達方便與集中,把嵌入成分碼化為(x)、y,小括號是選擇性(optional)符號,下文亦如此。三音節(jié)之上的PW與SW分離,可以根據本文的思路類推。

    2 PW的分離形式與意義

    在語言活動中不同性質與不同組配模式的PW,常常被嵌入相關句法成分產生動態(tài)分離。下面將其語法表達式形式化為式(1)。

    D{λ[x、y](m1m2)}→(x)m1ym2

    (1)

    含義是(x)m1ym2形成的充分條件是λ[x、y]代入m1m2要得到D準允(licensing)。D指動態(tài)性(dynamic)語用因素。這種在D作用下,m1m2由于嵌入相關詞語而在句子里出現(xiàn)的變形或變性及其所產生的語法意義,是語用組形[1]。在此稱之為語用構形(pragmatical configuration)。

    2.1 合成詞分離

    2.1.1 名詞分離

    請觀察:

    例1 老葛頭說,一塊兒當兵的,和我有點表親關系。(《荒草青青》)

    “老葛頭”可分析為“葛”嵌入“老頭”中形成的定中結構,“葛”是定語,“老頭”是中心語;也可分析為“老”前加于“葛頭”上,“老”是定語,“葛頭”是中心語。著眼于漢語句法系統(tǒng),只能作前者分析,因為“葛頭”在普通話中是不成單位的。*漢語有“葛頭”等“姓+頭”說法,但語義指姓葛的小頭目或小領導,與本文討論對象不是嚴格的同一。請觀察:

    例2 a.北京南路 b.演兩個小時戲 c.這么大點兒 d.教他英語

    例2的四短語分別由“南”“兩個小時”“大”“他”嵌入m1m2形成。其中a是“南”嵌入“北京路”形成的定中短語,“老葛頭”與之同一。盡管b、c、d的m1m2與“老頭”性質不同,語法級別也不同——是短語與詞的差異,但都是通過嵌入手段形成的。b是“演戲”嵌入“兩個小時”的擴展式,d是“教英語”嵌入“他”形成的動賓短語擴展式;而c是中心語“大”嵌入其狀語“這么點兒”形成的[2]。

    例1“老葛頭”較之“葛老頭”,表達了人際感情上的可愛與親切等意義。例2a的意義主要是韻律,“北京南路”比“南北京路”要順口。至于例2b、c與d,是句法語義表達的需求。這方面可參考3.1節(jié)的論述。再如:

    例3 他的開蒙老師常說: “藝術”“藝術”,有藝還得有術。(《當代野人》)

    例3做賓語的小句主語“藝術”是反復強調式,為了保持句子前輕后重的信息分布規(guī)則,謂語對其進行了分離,形成并列動詞結構“有藝還得有術”,不僅實現(xiàn)了對主語“藝術”的語義強調與評注,而且也維系了句子平衡。

    2.1.2 形容詞分離

    例4 現(xiàn)在看來你不但認了真了,而且認真得一塌又糊涂。(《笑傲江湖》)

    形容詞“認真”中嵌入“了”變?yōu)閯淤e短語,強調“認”之對象“真”。其形式標記是不能像“認真”一樣再帶補足語(complement)說成“認了真了得一塌糊涂”而只可說“認真得一塌糊涂”。同樣“一塌又糊涂”是強調“一塌糊涂”的消極狀態(tài)的,句法上“一塌”與“糊涂”做“認真”的合成補足語,語義與語法功能相當于兩個“一塌糊涂”。

    2.1.3 動詞的分離

    例5 出路還在改革,非改革不可……真正依靠工人階級來改,來革。(《人間正道》)

    例6 從這二人轉開始,他這個小女婿就當上了,后老悔了。(《父親情深母親意濃》)

    例5的“來改,來革”是“改革”中嵌入停頓(書面逗號)與“來”形成的分離式。句法上分離式構成的句子是個并列復句,語義功能上兩個小句都相當于“改革”。分離式的意義是強調說話人對“改革”的意向與信念。例6的“后悔”分離為“后老悔”,已由狀中結構的詞變成了述賓短語,方位名詞“后”在現(xiàn)代漢語里也只能被重新理解(reinterpretate)為動詞,如可帶體成分“了”“過”(aspectual constituents)說成“后了/過悔”。分離的目的也是強調“悔”的程度之深。

    2.2 單純詞分離

    雙音節(jié)的單純詞也可分離,像例3~6一樣,分離也必得在句中進行。分離而成的兩音節(jié)是句子的兩個句法成分,意義同樣還是表達強調。例如:

    例7 誤解是: 以為把人逗笑的東西就是幽默,而其實它既不幽也不默。(《人生圓桌》)

    “既不幽也不默”做“它”的合成謂語,強調“幽默”(humor)的性質量。“幽”與“默”均是其不可或缺的音節(jié),二者語義語法上都相當于形容詞“幽默”。

    2.3 派生詞分離

    一位難眠的妻子聽到一點響動,推醒了酣睡的丈夫后有這樣一個對話:

    例8 a. 好像有老鼠,你看看去。

    b. 老什么鼠!快睡吧。

    派生詞“老鼠”中嵌入責問否定等功能的“什么”被分離為“老什么鼠”,表達了丈夫強烈的不耐煩情緒等,將b與其變換式b1做一比較就會看到這一點:

    例8 b1.老鼠什么!快睡吧。

    顯然b1與b的真值(truth-condition)相等,但沒b的情感色彩強。需指出的是b的“老”已不是詞綴,而是“老鼠”的自反性提及用法(mention of reflexivity)。即已經變性且升級為動詞了,因為例8b句義相當于“別說或提什么老鼠”。即“老”的功能是提及對象“老鼠”;“鼠”則是“使用”(use),是“老”的賓語。因此例8b的句義形式應是或者說深層句義(deep-structure)是:

    例8 b2.[老鼠什么老鼠]

    不過b2在表征(represent & project)為b時,將前一個“老鼠”之“老”保留而刪去了“鼠”,后一個相反。這種表征方式是“老鼠”雙音節(jié)性造成的,這可從單音詞“提及”用法得到說明。如例9b:

    例9 a. 爸爸,我的書呢? b. 書什么書?就像你是個學習的。

    “書”是單音詞,在例9b不管是作為提及用法的第一個“書”還是作為用法的第二個“書”,都只能采取一個形式??梢姡?b在提及上用“老”而用法上用“鼠”,這是為了表達簡要經濟而按照二者在詞中的語素序位次第缺省(ellipse & omit)音節(jié)形成的。綜合起來看,例8b的“老什么鼠”是述賓性結構,“老”與“鼠”相當于兩個詞。

    總之PW由m1m2分離為(x)m1ym2,造成的變形與變性可概括為扭曲(screw),包括長度、內部的結構或性質等,動因是D。λ[x、y]使得m1m2由概念表達變?yōu)?x)m1ym2上的人際表達(interpersonal expression),即表達語用意義。這是像似原則(iconic coding principles)的生動體現(xiàn): 語言實體若代表的是不尋常獨特的事物,那么其語法形式的編碼相應的就要復雜與多維度(complex and multidimensional)[3]。

    3 SW分離及其與PW分離的不同

    3.1 SW分離的動因、條件、意義與句法特征

    例10 洗澡→a.洗一次澡∣b.洗十分鐘澡∣c.洗熱水澡

    在靜態(tài)語法環(huán)境“洗澡”就可分離,不僅前后性質不變,而且“洗”與“澡”的結構關系也不變,只是由詞升級為短語。嵌入成分語義或指向“洗”,如a與b;或修飾“澡”,如c。真值義上“洗一次/十分鐘/熱水澡≠洗澡”,即“洗澡”的三個分離體都表達概念??偟目矗跋丛琛钡那度敕蛛x成分在句法語義上是必有的(obligatory)。換言之,SW分離動因有兩種情況: 一是語義表達需要,如“洗熱水澡”較“洗澡”的外延小。二是句法機制調控,理論上“洗澡”在與“一次/十分鐘/熱水”的組配時存在嵌合與拼合兩種句法模式,例如,

    例10′ a. 洗一次澡 ∣*洗澡一次 b. 洗十分鐘澡 ∣*洗澡十分鐘 c. 洗熱水澡 ∣*洗澡熱水

    語義上“一次”“十分鐘”是計算動作或行為的“量”的,本身又有陳述性(可直接做謂語),與“洗”的概念聯(lián)系是天然的,且性質相近,所以它們自然緊鄰而且成為一個句法組塊兒,是個有效(well-formed)組配。靜態(tài)環(huán)境中帶星號的拼合式是不可受的,是違反了共同命運原則(proximity iconicity)[3]??梢姟跋丛琛狈蛛x動因就是句法語義表達的需要。在句子里進一步觀察,會看到“澡”還能進行句法活動。不僅可話題化(topicalization),甚至在語境充分下可以把“澡”缺省掉。例如,

    例11 一個月他也不洗一次澡。 →a.澡,他一個月也不洗一次。 →b.一個月,他連一次澡也不洗。 →c.他一個月也不洗一次。 →d.一個月,他連一次也不洗。

    基于本節(jié)分析,把SW分離動因與條件的表達式形式化為如下式(2)。G/S表示句法與語義箭頭方向表示話題化或移位,括號內的m2表示可缺省。

    ↓ |

    G/S{λ[x、y](m1m2)} →____(x)m1y(m2)

    (2)

    3.2 PW分離條件、動因、語法表現(xiàn)及其意義

    PW與SW分離上存在著諸多不同,主要表現(xiàn)有以下四點。

    1. PW分離必須得在句子里(sentence)進行,靜態(tài)層級上不能成立。例如,

    例12 a.*認了真 |b.*一塌又糊涂 |c.*來改來革 d.*既不幽也不默|e.*老什么鼠 |f.*后老悔

    短語a能說,不過已經是個支配性的動詞結構,語義語法功能不同于“認真”。而b—e靜態(tài)層面都不成立。f可說,但其結構、性質及語義已經也不同于“后悔”。順及指出,2.1.1節(jié)“老葛頭”能說,是它在現(xiàn)代漢語已經詞匯化了(lexicalized)。例3的“有藝還得有術”也可說,但“藝”與“術”所指之和是不等于“藝術”的。而SW在詞與句之上都可以分離,如例10、11所示。

    2. PW分離后m1與m2在句子里的位置固著(bound),沒有語法活動能力。如且不管例4的“認了真”相對于“認真”所發(fā)生的結構與性質變化,就“真”而言,是絕不能話題化的,只能固著在“認”后。而SW分離后沒有這樣的限制,如例10、11所示。

    例4′ *現(xiàn)在看來,真你不但認了,而且認真得一塌又糊涂。

    3. PW的分離結構(x)m1ym2中,各成分的語法特性也與SW的不同,主要體現(xiàn)為:

    (1) x與y的句法特性。與SW((x)m1ym2)比,PW的x或y羨余(redundancy)。把2.1節(jié)各例句的x與y刪去,典型PW的分離式所在的句子的真值義及其結構都不變。比較例5及其變換式例5′。

    例5′出路還在改革,非改革不可……真正依靠工人階級改革。

    它與例5的真值相同。結構上例5的謂語中心是聯(lián)合動詞短語[真正[依靠工人階級[來改,來革]]];而例5′的是詞[真正[依靠工人階級[改革]]]。二者都是狀中式謂語。當然有的嵌入成分羨余性不強,如例6的“老”,是“后悔”傾向SW。

    (2) PW分離式的m1與m2的語法特性極不勻質(homogen eous)。靜態(tài)地看,有的是無義的音節(jié),如“一塌”“幽”“默”等;有的是詞綴,如“老鼠”之“老”;有的是不成詞語素,如“革”“術”。它們都不能做句法成分。有的是自由成詞語素,能做句法成分,但所指或功能都要產生一定的變化: 如“藝”所指與“藝術”不等值,“后老悔”之“后”“悔”的功能不同于“后悔”之中的。它們都可視作動態(tài)言語成分,具有超語法單位(super-grammar units)的特性。意義上或m1=m1m2或m2=m1m2,或m1與m2同時等于m1m2句;句法上m1∧m2。即PW動態(tài)分離出的m1與m2,語義或語法功能增殖、變性了。

    (3) PW的分離成分m1與m2在作為動態(tài)句法成分使用時,得同時滿足下列兩個方面的句法條件,而SW分離成分則不受此條件約束(bind)。

    首先,一般有先行句做鋪墊且先行句有m1m2,否則,孤立的“(x)m1ym2”可受性都有問題。把例7與例7′做一比較就會看到,如:

    例7′*逗笑人的東西既不幽也不默。

    語感上例7′ 突兀不自然。例7有先行句“誤解是: 以為把人逗笑的東西就是幽默”做鋪墊,且“幽默”分布其中,所以“既不幽也不默”小句不僅可受而且還有“幽默”不具有的強調效果。再如把例8的“老什么鼠”句孤立出來,簡直是不知所云。值得指出的是例4與例6,“認真”分離為“認了真”時,是沒有含有“認真”的先行句做鋪墊,這是由“認真”的特征決定的。PW與SW是連續(xù)的(continuous),“認真”就處在連續(xù)環(huán)節(jié)上,傾向SW。例6的“后悔”雖不及它傾向SW,但也具有SW的特征。

    其次,m1與m2在句中必須彼此照應,且其位序要與它們在PW中的語素位平行。“照應”是指m1與m2必須是彼此緊鄰且呼應。如例4′的“真”被置于句首,離“認”太遠,缺乏緊鄰呼應,故不可受。同樣m1離開了m2或者是m2離開了m1,句子可受性都會有問題的,即是二者缺一不可的。例如,

    例6′*從這二人轉開始,他這個小女婿就當上了,老悔了。

    例8′ a. 好像有老鼠,你看看去。 b.*什么鼠!睡吧。

    例6′的“老悔”語義上與“后老悔”相當,但二者畢竟不是等值的: 前者的語法中心是“悔”,后者的中心是“后”。例8′的“什么鼠”語義表示“鼠”的類別,不同于“老什么鼠”。

    分離形成的m1、m2的“位序要與PW的語素位平行”,是指m1與m2作為句法成分時是不能易位的,一般得與它們在詞內時的序位平行一致,如例4的“一塌又糊涂”語感上不宜說成“糊涂又一塌”。

    4. PW分離式是主觀化的,而SW是真值性的。這體現(xiàn)在PW分離式的形成必需得到句法環(huán)境中D的準允。D具體說就是情態(tài)(modality),包括認識(epistemic)、道義(denotic)與動力(dynamic)三類。

    認識情態(tài)是說話人對行為(action)、事件(event)或事態(tài)(affair-state)等的確定性所持的信念狀況(status attitude)。比如例4的“看來”,例5的“真正”,例6的“了”(即“了2”)*蕭國政(1999)從靜態(tài)句法出發(fā)將“了”析離為八種意義,其“強調、偏離、委婉”本質上就是“了2”的認識情態(tài)的三方面表現(xiàn)。薛宏武(2012)也認為“了2”有語用軟化功能,是認識情態(tài)詞。,例7的“以為……就是”與“其實”,例8的“什么”。道義情態(tài)是說話人按照某種道義責任,實施或制止某種行為;或者就某事件、行為與事態(tài)提出自己道義或責任等方面的看法,如例3的“得”,例5的“非……不可”。動力情態(tài)是體現(xiàn)與說話人能力、意愿等相關的行為、事態(tài)。行為與事態(tài)一般是在說話人主觀干預與動力施加基礎上進行的,如例5的“要”與“來”,分別是體現(xiàn)說話人意愿與指向說話人行為去向的;例8的語氣詞“吧”的作用是緩解祈愿口氣的等,而“什么”則是否定說話人提及的“老鼠”這一行為本身的,語法功能相對于意愿否定詞“別”“不”“甭”。

    說話人的情緒、意向、態(tài)度等情感是體現(xiàn)語句主觀性的重要方面[4]。若說話人說出一段話的同時,表明自己立場、態(tài)度和感情便是主觀性表達,而為了表達主觀性而采取的相應結構形式便是主觀化(subjectivization)[5]。由此看來,PW分離式“(x)m1ym2”是主觀化結構,體現(xiàn)在: 一是它與情態(tài)成分是互動的,不僅“(x)m1ym2”的形成要有情態(tài)成分,并且它的出現(xiàn)也一定要有情態(tài)成分;二是“(x)m1ym2”及其主觀意義在漢語表現(xiàn)得相當廣泛與突出,如例3的“有藝還得有術”就是對“藝術”的評注與態(tài)度;例4的“認了真”就是說話人對“你”的“認真”的看法及對之給予的委婉的定性評論。

    那么,PW分離式的主觀義形成機制是什么呢?請觀察并比較例5的四個小句。

    例5出路還在改革i,非改革i不可……真正依靠工人階級來改ji,來革ki。

    第一個小句(clause)對“改革”的強調是通過自然重音與詞匯標記實現(xiàn)的: 一方面“改革”是自然焦點,具有[+突出];另一方面又通過“在”的時空定向功能對其焦點身份進行了標記。即該小句的強調義是通過“改革”的雙重焦點身份獲得的。第二句的強調義是由“改革”的自然焦點身份與道義情態(tài)詞語“非……不可”的詞匯義加合產生的。第三、四小句則并列起來強調“改革”。這兩個小句的謂語中心正是由“改革”的兩個分離成分充當?shù)模斎贿@種表達方式是極其依賴兩個先行句里“改革”的提示(index),表示為i=ij+ik。唯此,才能明確識解(construe)這兩個并列小句的語義與語法功能?;诖?,再加上指向說話人行為取向的“來”所具有的意向義、“改”與“革”自然焦點的[+突出]特征以及二者并列帶來的語義增殖,才可得出“來改,來革”的完整意義。由此推理,例5的“信息峰”(information peak)就是由“改革”分離而成的兩個并列小句“來改,來革”。

    “來改,來革”是說話人為了強調對“改革”行為持有的堅定意向而有意將之分離的,其主觀義的形成不僅包括如上所述的句法運算,還有一定的語用推理,因為該意義的形成離不開兩個先行小句的提示,即有語境因素在內。正因為如此,它才具有兩個先行小句所不具有的表達力——主觀性。再如例7,“幽”與“默”原本不能在句子里成形與成活的,但它是構成先行句焦點的兩個音節(jié),在其提示下,受話人(addressee)才能夠把“幽”與“默”同時識解為“幽默”。也正是以此為前提,受話人才能推導出它的意義。這也就解釋了PW分離式作為動態(tài)言語單位的m1與m2在做句法成分時,必須具有兩個條件的內在因素。

    4 雙音詞分離的規(guī)則、詞切分與標注

    基于第2、3節(jié)的系統(tǒng)考察,可把PW分離的表達式及其規(guī)則系統(tǒng)刻畫如下:

    Sa.__PW__,……,S。__(x)m1(,)__ym2……

    下標Sa是先行句(antecedent clause),S是PW分離形成的句子。空白線表示其上可分布的句法成分,省略符表示可出現(xiàn)的小句。

    (1) PW分離一般得有先行句做信息鋪墊,且先行句通常要有PW。它是PW分離的語境提示;

    (2) PW分離后的音節(jié)都是獨立的句法成分,且都是動態(tài)言語詞;性質上,得結合PW及其m1、m2特性進行辨析;

    (3) 分離式所在的句子得有情態(tài)成分D。D是封閉的系統(tǒng),包括有認識、物力與道義類詞語,祈使及否定句類;

    (4) m1與m2做句法成分,序位要跟其詞內序位平行一致,并且它們在句內不能移位與缺省。它們是動態(tài)言語成分,語義語法功能都等值于PW;

    (5) 嵌入成分x與y在真值上是羨余的。

    基于這個規(guī)則系統(tǒng),就可對含有PW分離式的語段進行分詞并給予其定量、定性標注。當然這跟對規(guī)范文本中的規(guī)范句子在技術處理上有點不同。例如(只標注討論對象),

    例4現(xiàn)在看來你不但認v了真n了,而且認真得一塌a又糊涂a。

    例5非改革(i+j)不可……真正依靠工人階級來改(i+j)/v,來革(i+j)/v。

    例6從這二人轉開始,他這個小女婿就當上了,后v老悔n了。

    例7以為把人逗笑的東西就是幽默(i+j),而其實它既不幽(i+j)/a也不默(i+j)/a。

    例8a.好像有老鼠(i+j),你看看去。 b.老(i+j)/v什么鼠(i+j)/n!快睡吧。

    例9a. 爸爸,我的書呢? b. 書v什么書n,就像你是個學習的。

    以例4為例,“認真”分離后是兩個詞,“一塌糊涂”分離后也是兩個詞。“認”與“真”分別是動詞(v)、名詞(n);“一塌”在現(xiàn)代漢語只能依據“糊涂”“一塌糊涂”確定為形容詞(a)。

    SW分離無需PW的五方面規(guī)則。只要句法語義上需要,就可進行分離為短語。因此對其進行切分、標注跟對規(guī)范句子的處理一致,例如,

    例11 一個月他也不洗v一次澡n。 a. 澡n,他一個月也不洗v一次。 b.一個月,他連一次澡n也不洗v。

    不管SW還是PW,分離后都短語,只不過PW分離成的短語是動態(tài)言語性的。因此對SW、PW進行詞語切分是可統(tǒng)一起來的。當然在標注m1、m2性質的依據上不同,SW的m1、m2與其語素性質一致;而PW標注得遵循規(guī)則(2)。

    5 結語

    詞語分離不僅是本體語法研究關注的重要現(xiàn)象,更是中文信息處理中詞語切分、詞性標注以及基于規(guī)則的句義計算等無法回避的加工對象。本文結論是,任何音節(jié)上≥2的實詞語都可在句子里分離,根據動因、條件與意義的不同可分為SW與PW兩個類。二者的不同,表現(xiàn)為(x)y、m1、m2的語法特性、句法活動及分離語法意義等方面。采取標記理論概括,SW分離是無標記的句法現(xiàn)象,語義是客觀的;PW分離是有標記的語用現(xiàn)象,它在一定程度上是體現(xiàn)漢語語法特性的主觀化結構,語義是主觀的。本文說明,根植于印歐語的理論與方法至少在處理漢語詞語分離的事實上存在著不足,如表達主觀義,印歐語在句法上一般按照合乎語法的硬規(guī)則去表征,類似漢語的PW分離是不可思議的。究其原因,是印歐語語法單位及其句法活動受著嚴格的形態(tài)束縛,可分離的對象與句位表達極其有限。漢語沒有印歐語那樣僵死的形態(tài)束縛,易于對語法單位發(fā)揮作用而使之分離,從而造成其靈活多變的句法表現(xiàn)以及不同“層”“級”上的語法意義。

    從本文推論開來,m1m2式的虛詞也可做PW分離。如語感上最起碼可以提取出“m1什么m2”式,如“所什么以,隨什么著,憑什么借”等。當然x與y在類聚個體上有限。

    [1] 薛宏武.現(xiàn)代漢語語用組形研究[R].上海: 復旦大學中文系,2009.

    [2] 蕭國政.漢語語法研究論[M].武漢:華中師范大學出版社, 2001:160-161.

    [3] Givón T. Syntax: A Functional typological Introduction [M](vol. II ). Amsterdam/Philadelphia: John Benjamin Publishing Company,1990:968-970.

    [4] Finegan E. Subjectivity and Subjectivisation: an Introduction[A]. Subjectivity and Subjectivisation[C], Edited by Dieter Stein and Susan Wright. Cambridge:Cambridge University Press, 1995.

    [5] Lyons J. Semantic[M]. Cambridge: Cambridge University Press, 1977:739.

    [6] 蕭國政.現(xiàn)代漢語句末“了”的意義的析離[C],陸儉明.面臨新世紀挑戰(zhàn)的現(xiàn)代漢語語法研究. 濟南: 山東教育出版社,1999.

    [7] 薛宏武.“有著”語義語法功能的形成及其“著”的問題[J].漢語學習,2012,(5):62-72.

    A Grammatical Analysis of Disyllable Word Split in Modern Mandarin: A Computational Linguistic Perspective

    XUE Hongwu

    (College of Arts, Chongqing Normal University, Chongqing 401331, China)

    With flexible morphological rules, Chinese is common to be observed for the disyllable word split by intserting some syntactical constituents of a sentence. To facilitate the word segmentation, part-of-speech tagging and semantic computing, the paper systematically discusses two types of the disyllable word split in Mandarin: one for the the Separable word, and the other is for the Prototype word. It examines describes the grammatical movitation of their formation, properties. and meanings, indicating that 1) the Prototype word split is caused by pragmatic factors, with subjective structures and grammatical meanings; yet 2) the Separable word split is caused by the syntactic and semantic expression, with objective structures and meanings.

    oriented to computation; disyllable word; clefting; grammatical meanings and properties; Mandarin

    薛宏武(1970—),博士,教授,主要研究領域為漢語句法學。E?mail:xuehongwu386@sina.com

    1003-0077(2015)03-0021-06

    2013-04-08 定稿日期: 2013-07-31

    國家自然科學基金(61202193);中央專項配套資金青年人才培訓與研究支持計劃(WXY201F032);重慶師范大學基金(14XYY032)。

    TP

    A

    猜你喜歡
    雙音詞分離式句法
    來源復雜的“復雜”
    辭書研究(2025年1期)2025-01-26 00:00:00
    句法與句意(外一篇)
    中華詩詞(2021年3期)2021-12-31 08:07:22
    述謂結構與英語句法配置
    句法二題
    中華詩詞(2018年3期)2018-08-01 06:40:40
    詩詞聯(lián)句句法梳理
    中華詩詞(2018年11期)2018-03-26 06:41:32
    關于漢語雙音詞的偏旁類化
    源自《莊子》的雙音詞的形成方式與詞義演變例釋
    “相親”成詞及詞義演變考
    可分離式凍干機自動進出料系統(tǒng)
    機電信息(2014年14期)2014-02-27 15:52:37
    可分離式凍干機自動進出料系統(tǒng)
    機電信息(2014年11期)2014-02-27 15:52:04
    洛南县| 都江堰市| 盱眙县| 吐鲁番市| 云林县| 黔东| 区。| 中阳县| 厦门市| 景德镇市| 广东省| 潮安县| 赫章县| 晋城| 大邑县| 永兴县| 棋牌| 昌乐县| 汤原县| 宜章县| 宜川县| 冕宁县| 习水县| 夏河县| 灵丘县| 通江县| 新余市| 略阳县| 浮山县| 凌源市| 长武县| 吴川市| 咸宁市| 桂阳县| 济宁市| 镇巴县| 东台市| 奉新县| 乳山市| 襄汾县| 且末县|