• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    論語料庫在語法研究中的作用及局限

    2013-12-12 17:28:19許素輝
    安徽文學·下半月 2013年10期
    關(guān)鍵詞:分詞語料麻雀

    許素輝

    收集真實語言環(huán)境中的語言材料,并將它們作為素材來解釋和例證現(xiàn)存的語言現(xiàn)象,或者發(fā)現(xiàn)新的語言規(guī)律,這是語言研究的基本方法,也可以說是語法研究的基本方法。語言材料不豐富,語言現(xiàn)象和語言規(guī)律就很難得到充分例證和解釋,因此包含大量語言實際使用信息的語料庫就成為了語法研究中不可或缺的幫手。結(jié)合語料庫在語法研究中的實際應(yīng)用情況,筆者認為,語料庫在語法研究中的作用主要有以下幾個方面。

    一、為語法研究提供客觀的語言事實

    英國語言學家Quirk曾批評說:“從這些自己編寫的例證出發(fā)”,“把材料僅僅當做‘例證’來使用,用來證明先驗的、或者是語法學傳統(tǒng)規(guī)定的、甚至是憑直覺認定的某些語法上的區(qū)別和結(jié)構(gòu),而不是從大量自然語言材料中歸納這些語法上的差別,這只能是一種很不令人滿意的權(quán)宜之計?!焙翢o疑問,語法研究需要語言事實提供佐證,如果這些所謂的語言事實僅是研究者依靠經(jīng)驗、憑借語感或者按照語法規(guī)則演繹編造出來的,那么其中有些例子就可能與實際的言語事實有差距而不具備充分的說服力。

    語法研究講求科學性和理據(jù)性。如果語言事實不客觀,依賴其分析出來的語言規(guī)律也很難為他人所接受。而語料庫的存在就能為語法研究提供大量客觀的語言事實。以我們熟悉的國家語委現(xiàn)代漢語語料庫為例,它由人文與社會科學、自然科學及綜合三個大類約40個小類組成。語料抽樣合理、分布均勻、比例適當,能夠比較科學地反映現(xiàn)代漢語全貌,能為語法研究提供大量客觀可靠的語言事實。

    二、通過詞頻統(tǒng)計可以發(fā)現(xiàn)語言事實的典型規(guī)則與特征

    如果要對某個語言事實進行研究,那么最好的方法究竟是對它進行窮盡式的網(wǎng)羅研究還是只選取部分語言事實做典型研究?舉個例子來說,如果要調(diào)查麻雀心臟的重量,那么是把全世界所有麻雀的心臟都取出來稱一稱,還是只選取部分成年麻雀作為研究對象再取其平均值?不言而喻,后一種方法顯然可行性更高。當然,這里并非認為做窮盡式的研究有什么不好。事實上,只要研究者精力充沛、時間充裕,窮盡式研究得出的結(jié)論遠比典型性研究得出的結(jié)論精確度要高,但不可否認的是,語言事實復(fù)雜多變難以窮盡,很少有人會采用這樣的思路進行語法研究。這樣一來,對典型語言事實的選取就顯得很有必要了。而語料庫所提供的詞頻統(tǒng)計的功能就能很好滿足我們對于典型語言事實選取的需求。

    還是以麻雀的例子來說,我們可以在北京選取10只麻雀作為研究對象,但不會想說去南極選10只麻雀作為研究對象。原因很簡單,北京的麻雀比南極的麻雀(就算那里真的有)更具有典型性。就詞匯而言,也存在著高頻詞匯和低頻詞匯,高頻詞匯就可以理解成我們說的典型詞匯。如果我們連高頻詞匯都沒有掌握,掌握低頻詞匯意義又能有多大呢?某一類語法結(jié)構(gòu)中,高頻詞匯出現(xiàn)的句法位置是怎樣的,高頻詞匯具備的語義特征是哪些,高頻詞匯與其他詞語的搭配組合受到什么限制……對這些問題的研究,都需要我們通過典型語言事實來尋求它們背后的語法規(guī)則。

    三、有助于從語言事實的實際使用情況中發(fā)現(xiàn)和修正語言規(guī)律

    西方語言學家利用語料庫研究語言,特別是語法的經(jīng)驗和成果表明,對語料庫提供的大量語料進行分析,有時可以發(fā)現(xiàn)一些過去被忽略的語言規(guī)律,比如語法書上沒有或者沒有詳細描述過的語言規(guī)律。筆者在研究復(fù)合趨向結(jié)構(gòu)“V下去”時發(fā)現(xiàn),有些我們僅僅憑借語感或是前人歸納的語法規(guī)則覺得并不可行的語例,在語料庫中卻能找到相關(guān)語言事實。如表延續(xù)義的“V 下去”中的“V”的語義特征為[+持續(xù)],也就是說,表持續(xù)義的動詞與“下去”搭配才具有延續(xù)義??墒俏覀冇职l(fā)現(xiàn)了這樣的語言事實:“養(yǎng)雞場的雞不知道得了什么病,每天死三、四只,如不趕緊想辦法,每天這樣死下去,雞場就完了。”這里的“死下去”表達的是延續(xù)義,但是“下去”前的動詞“死”卻不具有[+持續(xù)]的語義特征?!八馈笔且粋€瞬間動詞,但用在這里表延續(xù)義卻依然行得通。再如我們憑借語感很容易否決“上下去”、“下下去”這樣的說法,這是因為我們先入為主地將“上”和“下”看做了趨向動詞,趨向動詞自然是不能和復(fù)合趨向動詞“下去”搭配的。但是在語料庫中,我們可以找到這樣的語例:“課是不能上下去了”,“雨再這樣下下去,又得出現(xiàn)天災(zāi)”。

    由此可見,以語料庫的大量語料為基礎(chǔ)所進行的語言研究,更有可能使語言研究者發(fā)現(xiàn)原有對某些語法現(xiàn)象的解釋與自然語言中的實際情況不相符合的情況,這就使得他們有機會去修正或補充前人的結(jié)論,促進語言研究不斷發(fā)展。因此,語料庫不但有助于漢語語言的應(yīng)用研究,而且為高效、全面、科學地進行現(xiàn)代漢語的語法研究提供了強大的現(xiàn)代化技術(shù)保證,特別是在發(fā)現(xiàn)和修正語言規(guī)律方面大有可為。

    語料庫雖然為語法研究提供了很大幫助,但它依然存在著一定的局限性。歸納起來,筆者認為有以下幾個方面:

    (一)語料檢索軟件有待改進

    我們在上文提到,語料庫能夠滿足我們對于典型語言事實選取的需求。要選取典型語言事實,語料檢索軟件就必不可少。以我們常用的北大語料庫為例,北大語料庫在使用說明中為我們提供了多種詳備的語料檢索方法,但在筆者的實際使用中,依然有感覺到吃力的地方。例如,筆者要查詢與復(fù)合趨向動詞“下去”搭配的動詞和形容詞情況,出現(xiàn)的語料有三、四萬條,這三、四萬條中,就包括許多無效語料。就算只選取其中的五千條,也需要人工一條一條去排除確認。因此,筆者認為在這一方面,還需要提高現(xiàn)有語料庫的運行速度,引進國外的或者改進現(xiàn)有的標注和檢索程序,開發(fā)新的工具軟件,使語料檢索更加方便快捷,功能更加強大。

    (二)語料加工的廣度和準確度還不夠

    有些語料庫,會對部分語料進行分詞標注(語料加工還沒有達到很普遍的層面。)分詞標注可以依靠相關(guān)軟件高效率地完成,但是由于漢語語言事實復(fù)雜,軟件分詞的準確度并非百分之百,還需要人工逐一校對。在筆者校對過的分詞標注語料中,很多相同的詞出現(xiàn)在不同地方標有不同的詞性,這就出現(xiàn)了不一致的問題。再者,像專有名詞、人名、地名之類,運用軟件分詞標注也大有出錯的地方。另外,不同機構(gòu)分詞標注的標準也不盡相同,這也對語料加工的準確度造成一定影響。

    (三)語料庫的規(guī)模和類型有待進一步完善

    鄭艷群(2013)雖然提到“數(shù)據(jù)規(guī)模是無法決定數(shù)據(jù)結(jié)果的可靠性的”,但不可否認,就同一個數(shù)據(jù)庫而言,數(shù)據(jù)規(guī)模越大,得出的結(jié)論更為可靠。兩個同樣類型的數(shù)據(jù)庫擺在眼前,一個數(shù)據(jù)庫包含的數(shù)據(jù)不過兩千萬字,另一個數(shù)據(jù)庫包含的語料有上億字,很顯然我們會去選擇規(guī)模更大的那一個。這樣我們得到的語言事實可能會更全面。另外,當前的語料庫多為書面語語料,類型較為單一,為研究需要,有關(guān)部門可以組織力量研制普通話口語語料庫、“專用型(specialized)”語料庫、雙語“平行對照型(parallel)”語料庫等,以利于普通話口語語法研究、漢語與外語的雙語語法比較研究。

    最后,筆者熱切期望,具有檢索方便快捷、語料加工精準、規(guī)模完善類型多樣的語料庫能夠不斷涌現(xiàn),并在此基礎(chǔ)上開展更多跨學科、跨語言、多層面、多視角的面向漢語語法研究的語料庫應(yīng)用項目,為漢語語法研究提供強有力的支撐。

    [1]盧偉.語料庫在對外漢語教學中的應(yīng)用[J].廈門大學學報(哲學社會科學版),1999(4).

    [2]盧英順.“下去”句法、語義特點探析[A]//語法研究和探索[C].北京:商務(wù)印書館,2002.

    [3]鄭艷群.語料庫技術(shù)在漢語教學中的應(yīng)用透視[J].語言文字應(yīng)用,2013(1).

    猜你喜歡
    分詞語料麻雀
    拯救受傷的小麻雀
    結(jié)巴分詞在詞云中的應(yīng)用
    智富時代(2019年6期)2019-07-24 10:33:16
    1958年的麻雀
    麻雀
    趣味(語文)(2018年2期)2018-05-26 09:17:55
    基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
    值得重視的分詞的特殊用法
    緊盯著窗外的麻雀
    山東青年(2016年1期)2016-02-28 14:25:22
    華語電影作為真實語料在翻譯教學中的應(yīng)用
    《苗防備覽》中的湘西語料
    國內(nèi)外語用學實證研究比較:語料類型與收集方法
    山东省| 嘉禾县| 呼图壁县| 永和县| 密山市| 如东县| 涟源市| 买车| 深州市| 宜君县| 农安县| 霞浦县| 茌平县| 布拖县| 湾仔区| 灵台县| 聂拉木县| 凤庆县| 若尔盖县| 文昌市| 肥城市| 濉溪县| 万荣县| 金秀| 勐海县| 长葛市| 靖宇县| 和静县| 玉门市| 蒲江县| 上虞市| 乌鲁木齐市| 应城市| 镇江市| 竹北市| 华蓥市| 锡林郭勒盟| 吴堡县| 溧阳市| 聂拉木县| 昔阳县|