• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    副詞語義指向自動識別的路徑探討和個案分析

    2009-09-05 09:56:18
    關(guān)鍵詞:副詞

    赫 琳 吳 迪

    [摘要]研究現(xiàn)代漢語副詞語義指向的計算機(jī)識別,是從語義入手探索句處理的一個嘗試。我們提出的基本思路是:充分地利用海量語料,詳盡考察現(xiàn)代漢語副詞語義指向的不同情況,探尋不同語義指向的約束條件和機(jī)制,并對其進(jìn)行形式化的描述,然后構(gòu)建計算機(jī)自動處理策略和流程模型,編寫程序,使之在計算機(jī)上得以實現(xiàn)。據(jù)此,我們以否定副詞“不”為樣本,全面探討了其語義指向的各種情況,構(gòu)建了計算機(jī)自動識別的流程圖。

    [關(guān)鍵詞]副詞;語義指向;計算機(jī)識別;不

    [中圖分類號]H08[文獻(xiàn)標(biāo)識碼]A[文章編號]1671—881X(2009)04—0459—05

    一、要研究的問題

    在自然語言信息處理中,當(dāng)前遇到的瓶頸是句處理的問題。所謂“句處理”,就是怎么讓計算機(jī)處理、理解自然語言中一個句子的意義-怎么讓計算機(jī)生成一個符合自然語言規(guī)則的句子。制約句處理的最大難題就是要解決語義問題,這也是自然語言處理的關(guān)鍵。句子的語義問題涉及兩個層面:一是句子各成分本身的意義,另一個是句子各成分組合所產(chǎn)生的意義。句處理必須對句子的語義問題進(jìn)行分層處理。既要弄清各成分本身的意義,又要弄清成分與成分組合所產(chǎn)生的種種意義。一般來說,成分本身的意義相對簡單、明確,成分的組合意義十分復(fù)雜,而且成分組合意義的復(fù)雜性更導(dǎo)致了句處理的復(fù)雜性和艱難性。本文擬探討的語義指向問題就是句子成分組合中的復(fù)雜問題,是句處理不可回避的重要問題。

    語義指向是指句中某個成分在語義上跟哪個成分直接相關(guān)。某成分語義指向的不同,直接影響句子的意義。例如:

    飯我們都吃了。

    例子中的“都”在意義上既可能指向“飯”,也可能指向“我們”。如果指向“飯”,句義是:飯被我們吃光了;如果指向“我們”,句義是:我們都吃了飯了。顯然,同一成分的語義指向不同,句義完全不同。如果不能正確判斷語義指向,就會誤解句義。而語義指向在句法上往往沒有明顯的形式標(biāo)記,這就給語言理解帶來一定的困難,尤其是給計算機(jī)的自動識別帶來障礙。要解決自然語言的句處理問題,必須突破語義指向的自動識別問題。

    自從20世紀(jì)80年代語義指向分析進(jìn)入語言研究領(lǐng)域以來,我國語法學(xué)者從不同角度對語義指向進(jìn)行了研究??偟膩碚f,主要包括兩個方面:其一,運(yùn)用語義指向分析法對語言事實做具體的分析,探尋其句法和語義上的對應(yīng)規(guī)律。有的著眼于句子成分,考察了補(bǔ)語、狀語、定語等句法成分的語義指向問題,有的從詞類出發(fā),考察了副詞、形容詞、代詞、名詞、動詞以及介詞結(jié)構(gòu)等的語義指向問題。其二,從理論上對語義指向本身進(jìn)行探討,說明其產(chǎn)生的背景、性質(zhì)、內(nèi)涵、范圍、表現(xiàn)形式以及在語法分析中的作用等??偟膩砜?,語義指向研究雖然涉及的內(nèi)容較為廣泛,但較多的是現(xiàn)象分析,較少歸納規(guī)律;較多的是個別分析,較少系統(tǒng)考察;面向應(yīng)用的更少,幾乎還沒有見到針對自然語言計算機(jī)處理的語義指向研究??傊覀儗φZ義指向問題的認(rèn)識還十分有限,尤其是對語義指向的規(guī)律缺乏把握,對語義指向的形式標(biāo)記捕捉不多,加上已有的研究立足點大都不在應(yīng)用,沒有為計算機(jī)處理語義指向儲備好充足的知識,所取得的成果與語言信息處理的要求之間存在著很大的距離。因此,要想實現(xiàn)計算機(jī)對語義指向的自動識別,還有大量工作要做。

    我們擬在語義指向研究既有成果的基礎(chǔ)上,緊緊圍繞“為語言信息處理所用”這一目標(biāo),進(jìn)一步深化、細(xì)化語義指向研究,以現(xiàn)代漢語副詞語義指向為樣本來解剖麻雀,具體探討現(xiàn)代漢語副詞不同語義指向出現(xiàn)的條件和可以捕捉的形式標(biāo)記,描繪現(xiàn)代漢語副詞語義指向網(wǎng),建構(gòu)副詞語義指向的流程圖,從而為副詞語義指向計算機(jī)自動識別策略的制定和程序編寫,提供依據(jù)甚至藍(lán)本。這無疑對于實現(xiàn)語義指向的計算機(jī)自動處理乃至整個基于語義的自然語言處理都具有重要意義。

    二、研究思路

    要實現(xiàn)現(xiàn)代漢語副詞語義指向的計算機(jī)自動識別,必須摸清現(xiàn)代漢語副詞不同語義指向出現(xiàn)的條件和可以捕捉的形式標(biāo)記,并把它們形式化。因此,我們首先要做的工作,就是最充分地利用海量語料,詳盡考察現(xiàn)代漢語副詞語義指向的不同情況,探尋現(xiàn)代漢語副詞不同語義指向的約束條件和機(jī)制,并對其進(jìn)行形式化的描述,然后構(gòu)建計算機(jī)自動處理策略和流程模型。

    我們知道,現(xiàn)代漢語中副詞主要做狀語,在語義上可能前指,也可能后指;既可以指向相鄰成分,也可以指向間隔成分,在不同的情況下具體指向不同。本研究就是要找出不同指向出現(xiàn)的條件,并在此基礎(chǔ)上編制流程圖,使計算機(jī)根據(jù)有關(guān)的條件執(zhí)行相應(yīng)的命令,做出相應(yīng)的判斷,從而使整個系統(tǒng)成為一個可以自動運(yùn)作的過程。

    現(xiàn)代漢語副詞可分為程度副詞、時間副詞、范圍副詞、否定副詞、語氣副詞、頻率副詞等。其中,時間副詞語義指向單一,流程簡單;范圍副詞、否定副詞、程度副詞、頻率副詞情況較復(fù)雜,編制流程圖需要具體詳盡的條件限制。即使是同類副詞,不同的詞具體運(yùn)行情況也不相同,所以我們擬對副詞進(jìn)行分類討論,對同類中的特殊副詞進(jìn)行個別討論。具體包括程度副詞和時間副詞語義指向的計算機(jī)識別,范圍副詞“都”、“只”語義指向的計算機(jī)識別,否定副詞“不”、“沒(有)”、“別”語義指向的計算機(jī)識別和頻率副詞“又”、“也”語義指向的計算機(jī)識別,等等。

    確定了副詞的類別之后,我們將從具體的副詞入手,以具體副詞為關(guān)鍵詞,利用大型語料庫和巨量生語料查找全部用例,考察其上下文,確定其語義指向,探索其語義指向的條件和標(biāo)記,然后將這些條件和標(biāo)記系統(tǒng)化,抽象其規(guī)律,找出其相互制約的因素,根據(jù)這些因素起作用的程度和先后順序編制流程圖。

    三、個案分析

    下面我們以否定副詞“不”為樣本,全面探討其語義指向的各種情況,構(gòu)建計算機(jī)自動識別的流程圖。

    現(xiàn)代漢語研究中,關(guān)于否定的成果頗豐。有的是從否定轄域的角度進(jìn)行,有的是從否定焦點的方面著手。但不管是否定轄域還是否定焦點,研究的都是否定詞到底否定的是什么成分,其實也就是否定副詞的語義指向問題。

    在否定副詞“不”指向的方向性這一問題上,學(xué)者們的研究結(jié)論基本一致,即指后。但是,“不”否定的究竟是其后哪一個或哪幾個成分,各家看法不一,歸納起來有三種觀點。

    第一種,指向“不”后的全部成分。持此種觀點的是呂叔湘先生。

    第二種,指向焦點。持此種觀點的有徐杰、李英哲、沈家煊、劉順等。

    第三種,指向毗鄰成分,即緊鄰的成分。持此種觀點的有錢敏汝、李寶倫、潘海華等。

    由上述可知,關(guān)于副詞“不”的語義指向還有一些問題需要進(jìn)一步研究。為了弄清副詞“不,,的語義指向的全面情況,我們利用北京大學(xué)現(xiàn)代漢語語料庫,詳盡考察了“不”的語義指向狀況。根據(jù)我們的考察和研究,含有否定副詞“不”的句子分為兩種情況:一種是“不”后出現(xiàn)帶有“的,或“地,,的修飾語,另一種是“不”后沒有出現(xiàn)帶“的”或“地”的修飾語。我們發(fā)現(xiàn),“不的語義指向與“的”、“地,,的有不具有明顯

    的相關(guān)性。這條規(guī)律為我們解決副詞“不”語義指向的計算機(jī)自動識別問題提供了重要線索。為此,我們對“不”的語義指向與“的”、“地”的具體相關(guān)性進(jìn)行了詳細(xì)的考察,現(xiàn)分述于下。

    (一)“不”后有帶“的”或“地”的修飾語

    據(jù)我們考察,“不”后有帶“的”或“地”的修飾語時,“不”就否定緊隨其后的修飾語。究其原因,主要是因為定語帶“的”、狀語帶“地”就表明定語和狀語與被修飾語之間結(jié)合不甚緊密,‘‘的”、“地”起到了間隔修飾語與被修飾語的作用,所以“不”只能否定緊隨其后的成分,而不能否定被“的”、“地”隔開的成分。

    1、“不”后出現(xiàn)帶“的”的修飾語,也就是“不”出現(xiàn)在定語中,這時“不”指向緊鄰其后的成分。例如:他喝了不新鮮的牛奶。不”否定的是“新鮮”。誠如錢敏汝所說,定中結(jié)構(gòu)中否定載體的否定范圍不會超過定語。

    2、“不”后出現(xiàn)帶“地”的修飾語,這時“不”指向緊鄰其后的成分。例如:她不高興地瞪了他一眼。

    這一類修飾語往往是對施動者的情態(tài)進(jìn)行描寫。其后的動詞一般不是單純形式,而是“動+了”、動結(jié)式、動趨式、動詞重疊式(“VV”和“V了V”)、“動+著”等。例如:鮑里斯@別爾曼在與她談話時,不高興地提到了格利戈里·阿爾庫斯。(動+了+賓)我很不高興地走開了。(動結(jié)式)

    不高興地走了出去。(動趨式)

    不高興地故意清清喉嚨。(vV)

    騎兵們不高興地抿了抿嘴。(V了V)

    他不高興地嘀咕著。(動+著)

    這些動詞代表的動作往往都是有終結(jié)點的,也就是說,意義上是有界的。在“不,和“沒,,的否定分工上,“不”否定的是無界成分,“沒”否定的是有界成分。因此,上述各動詞是無法用“不來否定的,所以“不”在這里否定的只能是修飾語。

    (二)“不”后沒有帶“的”或“地”的修飾語

    “不”可以出現(xiàn)在狀語、補(bǔ)語、主謂謂語句的謂語中,“不”后面可以是一個成分,也可以有多個成分。根據(jù)我們的考察,只要“不”后未出現(xiàn)帶“的”或“地”的修飾語,“不就能否定其后所有的成分。究其原因,主要是因為在這類格式中,“不”后的所有成分結(jié)合緊密,構(gòu)成一個整體,所以“不只能否定其整體,而不能只否定其部分成分。

    1、“不”后只有一個成分。

    這咖啡不香。

    小明跑得不快。

    2、“不”后有兩個成分。

    (1)“不”+狀語+動/形

    這句話不太懂。

    小明跑得不很快。

    (2)“不”+動+賓

    爺爺不吃面食。

    張老師不是我們的數(shù)學(xué)老師。

    3、“不”后有三個成分。

    (1)“不”+狀語+動+賓

    我不在學(xué)校讀小說。

    她不天天吃食堂。

    (2)“不”+動+賓1+賓2

    張老師不教我們數(shù)學(xué)。我就不告訴你那件事。

    (3)“不”+動1+兼語+動2

    大家不選老王當(dāng)組長。

    4.“不”后有四個成分。

    “不”十狀語+動+賓1+賓2

    張老師不只教我們數(shù)學(xué)。

    上面討論的例子的謂語一般只有一個動詞或形容詞。連動句中能用“不”否定的有三種情況:

    (1)后一個動詞/短語表示的動作行為是前一動詞/短語表示的動作的目的。例如:

    她不去開門。

    (2)前一個動詞/短語表示后一個動詞/短語所表示的動作的方式(或手段、工具)。例如:

    他不騎車上班。

    (3)前一個部分表示肯定的意思,后一個部分表示否定的意思,但前后兩個部分表示的意思一樣,其中后一個部分用“不”來構(gòu)成否定。

    孩子緊緊抓著她的手不放。

    顯然,當(dāng)“不”后沒有帶“的”或“地”的修飾語時,“不”指向其后所有的成分。

    綜上所述,當(dāng)“不”后有帶“的”或“地”的修飾語時,“不”指向修飾語,也就是其后毗鄰成分;“不”后沒有帶“的”或“地”的修飾語時,“不”指向其后全部成分?!暗摹焙汀暗亍背蔀閰^(qū)分“不”語義指向的標(biāo)志詞。計算機(jī)識別就可以以“的”和“地”為切入點,首先看“不”后是否有助詞“的”,如果有,“不”指向其后毗鄰成分;如果沒有,再看“不”后是否有助詞“地”,如果有,“不”同樣指向毗鄰成分;如果沒有,“不”指向其后所有成分。依據(jù)這個順序,我們可以畫出否定副詞“不”的語義指向流程圖(如圖1)。

    本文探討了現(xiàn)代漢語副詞語義指向的計算機(jī)識別問題,重點討論了副詞“不”的語義指向。語義指向的計算機(jī)識別研究,為我們提供了一個新的視角來反觀現(xiàn)代漢語中的一些語言現(xiàn)象。所以卒文的研究成果可以直接用于語言學(xué)領(lǐng)域,以利用副詞語義指向的研究思路和方法來研究其他詞類,從計算機(jī)識別這一新的角度重新探討各種詞類的語義指向,從而對語義指向的性質(zhì)、內(nèi)涵、對象和范圍等有一個全新的思考和定位。同時,我們的研究成果也可以直接用于語言信息處理領(lǐng)域,計算語言學(xué)家們可以將我們已經(jīng)形式化的條件表示為算法,使之在計算上形式化,根據(jù)流程圖編寫程序,使我們的研究成果最終在計算機(jī)上得以實現(xiàn)。

    注釋:

    ①我們在北京大學(xué)現(xiàn)代漢語語料庫中輸入關(guān)鍵詞“不”,得到語料約10萬條,人工刪除不合格語料,獲得可用語料約1萬條。

    ②我們在北京大學(xué)語料庫中搜到的帶“不高興地”和“不滿意地”的語料共301條,我們對其后出現(xiàn)的動詞及動詞詞組進(jìn)行了,窮盡性考察,尚未發(fā)現(xiàn)例外。

    [參考文獻(xiàn)]

    [1]陸儉明:《關(guān)于句處理中所要考慮的語義問題》,載《語言研究}2001年第1期。

    [2]稅昌錫;《語義指向分析的發(fā)展歷程與研究展望》,載《語言教學(xué)與研究}2004年第1期。

    [3]呂叔湘:《疑問否定肯定》,載《中國語文}1985年第4期。

    [4]徐杰、李英哲:《焦點和兩個非線性語法范疇:“否定”“疑問”》,載《中國語文>)1993年第2期。

    [5]沈家煊:《不對稱和標(biāo)記論》,南昌:江西教育出版社1999年版。

    [6]劉順:《現(xiàn)代漢語的否定焦點和疑問焦點》,載《齊齊哈爾大學(xué)學(xué)報(哲社版)))2003年第2期。

    [7]錢敏汝:《否定載體“不”的語義——語法考察》,載《中國語文))1990年第1期。

    [8]胡建華:《否定、焦點與轄域》,載《中國語文》200F年第2期。

    [9]石毓智:《肯定和否定的對稱與不對稱》,北京:北京語言文化大學(xué)出版社2001年版。

    (責(zé)任編輯何坤翁)

    猜你喜歡
    副詞
    The Wheels on the Bus
    副詞“好容易”及其詞匯化成因
    韓國語副詞“?”與漢語副詞“更”“再”的對應(yīng)
    不可“望文生義“的英語副詞
    短句—副詞+謂語
    娃娃畫報(2019年8期)2019-08-05 18:21:56
    西夏語的副詞子句
    西夏學(xué)(2018年2期)2018-05-15 11:24:42
    資陽話中的程度副詞“蠻是”初探
    謙敬副詞“伏”“竊”的語法化過程及對比
    副詞和副詞詞組
    談英語的副詞在句中的位置
    陈巴尔虎旗| 紫金县| 克东县| 锡林浩特市| 西华县| 泗阳县| 黑水县| 西峡县| 双牌县| 基隆市| 庄浪县| 景宁| 栾城县| 故城县| 乌拉特后旗| 鄯善县| 若羌县| 合水县| 木兰县| 定远县| 句容市| 河西区| 迁安市| 天全县| 峡江县| 莲花县| 紫云| 罗平县| 华容县| 洪江市| 高台县| 延津县| 内乡县| 富源县| 印江| 吕梁市| 芒康县| 岳西县| 察雅县| 宜兴市| 南康市|