• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      語料庫語言學(xué)研究現(xiàn)狀分析

      2017-04-05 00:53:40石志亮
      關(guān)鍵詞:研究現(xiàn)狀語料庫

      石志亮

      摘要:文章回顧了語料庫和語料庫語言學(xué)的由來,分析了語料庫的應(yīng)用與研究現(xiàn)狀,肯定了語料庫語言學(xué)在語言描述、語言理論發(fā)展和語言學(xué)研究方法等方面的貢獻。特別就語料庫語言學(xué)研究在語料庫標注技術(shù)、研究層次、與其它學(xué)科的交叉研究和語料庫建庫等方面出現(xiàn)了平臺期這一現(xiàn)狀做了闡述。

      關(guān)鍵詞:語料庫;語料庫語言學(xué);研究現(xiàn)狀;理論發(fā)展

      中圖分類號:H0 文獻標識碼:A 文章編號:1671-1580(2017)01-0098-03

      一、語料庫語言學(xué)的由來

      不同的語言研究專家對語料庫的定義不盡相同。Atkins和Clear(1992)認為“語料庫是按照明確的設(shè)計標準,為某一具體目的而建立的大型語言文本庫”。John

      Sinclair(1996)認為:“語料庫就是根據(jù)明確的語言標準選擇和排序的語言的匯集,以作為語言的樣本?!盇.Renouf認為“語料庫是由大量收集的書面語或口語構(gòu)成并由計算機存儲和處理用于語言學(xué)研究的文本庫”。Tony

      McEnery(2006)認為:以機器可讀的形式儲存的,帶有各種語言信息標注的書面或口頭的樣本文本集合。

      不論如何定義,有幾個關(guān)鍵點是一致的,就是語料庫必須是語言的電子文本集合、必須按照一定的標準采集、采集后的文本最好經(jīng)過加工(比如,標注、賦碼)、文本的量應(yīng)該達到一定的規(guī)模、能夠被計算機處理等。語料庫研究就是:研究者借助于各種計算機分析工具,以大量精心采集到的真實文本為研究素材,以經(jīng)驗主義為哲學(xué)基礎(chǔ),進行相關(guān)的語言現(xiàn)象觀察、語言理論驗證以及其它的實證性研究。

      近些年,人們在語料庫的建設(shè)和開發(fā)過程中,在觀察和經(jīng)驗的基礎(chǔ)上逐漸創(chuàng)造了一些新方法,提出了一些新規(guī)則,并且對這些方法和規(guī)則在理論上進行了一些探索和總結(jié),逐漸形成了“語料庫語言學(xué)”。因此,語料庫語言學(xué)是一門基于大量真實的語言數(shù)據(jù),以經(jīng)驗主義為哲學(xué)基礎(chǔ),以獨到的理論體系結(jié)合計算機科學(xué)來研究語言的一門邊緣學(xué)科。

      二、語料庫語言學(xué)的應(yīng)用

      (一)在語言教學(xué)方面

      語料庫語言學(xué)的重要應(yīng)用領(lǐng)域之一就是語言教學(xué),可以利用檢索工具對語料庫進行詞頻、詞塊、句型、語態(tài)、搭配等的觀察和統(tǒng)計,進行數(shù)據(jù)驅(qū)動式的學(xué)習(xí)。詞頻統(tǒng)計也能讓我們準確確定高頻詞,檢索出的詞塊、句型、語態(tài)、搭配等的情況,有助于教師更合理高效地開展詞匯、語法、閱讀、翻譯等各種語言教學(xué)活動;學(xué)生們通過觀察和實踐,既能掌握詞語的用法,也能了解語言變化的規(guī)律。這些檢索結(jié)果(特別是詞頻統(tǒng)計的結(jié)果)也可以應(yīng)用于語言教材的編寫、教學(xué)大綱的設(shè)計,甚至詞典的編撰等。

      (二)在應(yīng)用語言學(xué)方面

      利用相關(guān)的計算機軟件結(jié)合語料庫可以進行詞匯、句法、語義、口語、語言變異、二語習(xí)得、機器翻譯、語用、話語分析等研究。此外,還可以利用語料庫技術(shù)進行語音識別和語音合成等。

      利用語料庫進行詞匯研究,主要包括詞頻、詞塊、詞語搭配、類連接、語義韻、新詞語的提取以及詞典編纂等。結(jié)合語料庫進行句法研究,主要是進行語法的定量分析和句型的頻率統(tǒng)計。結(jié)合語料庫進行語義研究,可以為詞項賦義提供客觀的標準,有助于建立語義模糊范疇的梯度概念。語料庫與口語這方面的研究主要是建立口語詞語提取的模型,目前集中在韻律層面的研究。語料庫與語言變異的研究,是通過對比不同時期、不同地域、不同民族、不同性別的口語語料庫來推斷語言的變異和變化,從而進行語域變體、地域變體以及語言變化的研究。語料庫與二語習(xí)得研究,主要是通過觀察語料庫中語言現(xiàn)象的分布和頻率以及學(xué)習(xí)者語言應(yīng)用和使用的失誤,研究語言形式在語境中的意義和用法。語料庫與機器翻譯,利用過去已經(jīng)翻譯過的語料,采用模擬的方法來翻譯句子。此外,利用語料庫還可以進行語音識別和語音合成等研究。

      (三)在社會語言學(xué)、文學(xué)、翻譯學(xué)等方面

      依據(jù)大規(guī)模真實語料庫進行社會語言學(xué)現(xiàn)象、語言變異等調(diào)查,可以得出更加真實客觀的數(shù)據(jù)和結(jié)論;通過建設(shè)文學(xué)作品或文學(xué)評論語料庫,對其進行標注和檢索,分別對其中的人物形象、意象、情節(jié)、主題、母題、作品風(fēng)格等進行研究,可以為觀點提供更為客觀的數(shù)據(jù)支撐,開拓文學(xué)研究和語料庫相結(jié)合的新型研究模式;在翻譯學(xué)方面,利用建成的雙語平行語料庫,可以為翻譯研究與實踐提供實證材料,也能極大提高翻譯的效率和準確性。

      (四)在語言定量分析方面

      利用大規(guī)模的真實語料,設(shè)計出要進行定量分析的知識點和所使用的各類題型,可以提高定量分析結(jié)果的信度和效度。

      除以上幾方面,語料庫還可用于語法、多語言跨文化研究、法律(軍事)語言學(xué)、文體學(xué)、意識形態(tài)和文化、作者的立場研究,甚至認知語言學(xué)研究等等。它所帶給我們的也絕不只是一種研究方法的革命,隨著語料庫技術(shù)的迅速發(fā)展其應(yīng)用范圍也必將更為廣泛。

      三、語料庫語言學(xué)的貢獻

      (一)對語言描述的貢獻

      語料庫語言學(xué)這門交叉學(xué)科是在20世紀80年代前后隨著Brown和Lob兩大語料庫的建立才逐步形成的。語料庫最早和最普遍的應(yīng)用就是其在語言描述方面,比如上文提到的語料庫在語言教學(xué)、詞典編撰、應(yīng)用語言學(xué)、社會語言學(xué)、文學(xué)、翻譯學(xué)、定量分析等等方面的運用,主要是語言描述層面。

      以往進行的一些研究,比如對現(xiàn)代英語特征的分析:詞匯的使用頻率、語用特征及其在某段時間內(nèi)的變化,男女使用某些詞匯的多寡、偏好,口語與書面語的異同,不同地區(qū)使用英語情況的比較(特別是學(xué)習(xí)者與本族語者語言之間的差異),某些詞匯空缺的成因,兒童詞匯及句式習(xí)得的過程,甚至考察某些種族使用語法轉(zhuǎn)換背后的動機等都是進行語言描述的具體研究事例。

      可以說語料庫語言學(xué)通過對大量客觀詳實的語言數(shù)據(jù)進行系統(tǒng)分析為語言研究提供了全新的思路和方法,人們可以憑借語料庫提供的語言證據(jù)來進行語言學(xué)研究。

      (二)對語言理論發(fā)展的貢獻

      Sinclair認為只有用巨量的語料來驅(qū)動的研究才能揭示那些單憑語言直覺無法預(yù)測的語言現(xiàn)象和發(fā)現(xiàn)新的語言使用規(guī)律,更新現(xiàn)有的理論乃至構(gòu)建新的語言理論模式。Leech也認為語料庫語言學(xué)絕不是僅僅收集和描述語料,它包括三個層次:語言收集、語言描述和理論構(gòu)建。Halliday提出建立一套完善的口語語料轉(zhuǎn)寫系統(tǒng)以便更好地解決傳統(tǒng)語言理論將詞匯和語法分離的問題,因為口語語料是任何語言的原型語義單位始發(fā)和延伸的基礎(chǔ),這些語義單位已經(jīng)高度語法化且靈活多變,所以加強大型口語語料庫的研究能夠帶動語法研究的發(fā)展。

      (三)對語言學(xué)研究方法的貢獻

      語料庫語言學(xué)深受西方語言哲學(xué)中經(jīng)驗論的影響,經(jīng)驗論認為感性經(jīng)驗是知識的唯一源泉,主張一切知識都通過經(jīng)驗而獲得。西方語言學(xué)界的經(jīng)驗論注重語言事實,強調(diào)直觀的感性,也就是要對真實的語言材料進行采集、描述和實證研究,借助于真實語料是語料庫語言學(xué)開展研究的基礎(chǔ)。

      語料庫的各種處理工具,如語料轉(zhuǎn)寫、文本整理、詞性附碼、句法標注、檢索和統(tǒng)計等,這些計算機程序的出現(xiàn)使得語料庫語言學(xué)定性與定量相結(jié)合的方法成為可能。利用語料庫工具的標注手段和檢索功能,研究者可以很容易地檢索出某些語言現(xiàn)象,內(nèi)省出一些語言規(guī)律,并進而對以往的理論假設(shè)進行驗證,大大提高了證偽能力。

      四、語料庫語言學(xué)研究的平臺期

      (一)語料庫標注技術(shù)發(fā)展緩慢

      語料語言學(xué)從上世紀60年代開始發(fā)展,起初人們只用語料庫進行一些簡單的分析,如詞頻統(tǒng)計等,后來又增加了詞的語法屬性的標注,即詞性標注。但時至今日,語料標注沒有實質(zhì)性突破,實際有使用價值的標注還只能是詞性標注。目前語料庫已經(jīng)發(fā)展到了基于瀏覽器檢索的第四代,在標注和檢索能力等方面也增強不少,但其基本功能仍與第三代相似。除詞性標注外,對語料庫其它層次的標注,如,語音、句法、語義、語用和多模態(tài)語料庫等的標注仍不成熟,因而要想利用語料庫中的熟語料進行更深層次的研究就會遇到難以克服的障礙。

      (二)語料庫研究層次單一

      語料庫標注層次發(fā)展的緩慢制約著語料庫研究方法的進一步發(fā)展。語言研究者利用語料庫進行研究的目的就是為了更深入地挖掘語言的結(jié)構(gòu)與演化規(guī)律,而語料庫中語音、句法、語義和語用等層次標注的不成熟、不完善,就會使得相關(guān)研究停滯不前。目前絕大多數(shù)的語料庫研究主要停留在詞匯、句法層次,對語義等方面的研究尚不夠深入。

      (三)與其它學(xué)科的交叉研究尚不成規(guī)模

      結(jié)合語料庫進行社會語言學(xué)、文學(xué)和翻譯學(xué)等方面的研究數(shù)量少、規(guī)模小、影響力也較弱。這可能與各個學(xué)科屬性的表現(xiàn)形式不同有關(guān),比如,文學(xué)更注重語言的內(nèi)容,而語料庫語言學(xué)多側(cè)重語言的形式,用語料庫研究文學(xué)就會有一定的難度。

      (四)語料庫建庫方面的問題

      語料庫的標注和賦碼系統(tǒng)缺乏統(tǒng)一性,沒有統(tǒng)一的規(guī)范和標準,適用性較差。語料庫工具軟件(賦碼工具、標注工具、文本分析工具等)開發(fā)滯后與語料庫的迅猛發(fā)展不相協(xié)調(diào)。口筆語語料庫發(fā)展不均衡,書面語語料庫和口語語料庫發(fā)展不均衡,相對于豐富的書面語語料庫,口語語料庫的發(fā)展落后很多。大多數(shù)的語料庫資源難以共享,重復(fù)建設(shè)造成了各種資源的巨大浪費。

      (五)對語料庫語言學(xué)理論的期待

      語料庫研究以量化描述見長,但若僅僅滿足于量化和描述,就只能成為其它學(xué)科研究的輔助工具,很難有長遠的發(fā)展,也不能形成一門獨立的學(xué)科。另外,雖然不少人主張語料庫研究應(yīng)結(jié)合現(xiàn)有的語言學(xué)理論來闡釋量化數(shù)據(jù),但結(jié)合語料庫數(shù)據(jù)和現(xiàn)有語言學(xué)理論的成功案例也不多見。

      目前,比較遺憾的仍然是語料庫語言學(xué)研究主要還是應(yīng)用性研究,尚未形成成熟的理論和理論體系,語料庫對語言學(xué)理論幾乎沒有實質(zhì)性的貢獻,語料庫語言學(xué)理論很值得期待。

      五、結(jié)束語

      經(jīng)過幾十年的發(fā)展,語料庫語言學(xué)的研究豐滿了許多,在相關(guān)領(lǐng)域也已取得了廣泛的應(yīng)用,對語言的描述和對語言理論的發(fā)展也有了很大的貢獻。但我們也應(yīng)該看到,語料庫語言學(xué)研究也出現(xiàn)了一個平臺期,在語料標注、研究層面、交叉研究、語料庫資源共享等方面逐漸顯露了一些不足,更為關(guān)鍵的是語料庫語言學(xué)要有自己的理論建樹,人們對此也充滿了期待。

      [責任編輯:韓璐]

      猜你喜歡
      研究現(xiàn)狀語料庫
      《語料庫翻譯文體學(xué)》評介
      基于語料庫“隱秘”的詞類標注初步探究
      把課文的優(yōu)美表達存進語料庫
      試井法分析井間注采關(guān)系的研究現(xiàn)狀
      科技資訊(2016年19期)2016-11-15 08:33:06
      人民檢察院量刑建議制度構(gòu)建與完善
      法制博覽(2016年11期)2016-11-14 10:43:03
      我國環(huán)境會計研究回顧與展望
      新形勢下公立醫(yī)院成本管理研究現(xiàn)狀與展望
      淺析電力系統(tǒng)諧波及其研究現(xiàn)狀
      創(chuàng)新人才培養(yǎng)理論研究現(xiàn)狀及未來研究方向
      成才之路(2016年25期)2016-10-08 09:46:28
      基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
      語言與翻譯(2015年4期)2015-07-18 11:07:45
      北海市| 福建省| 霍城县| 扬州市| 廉江市| 土默特右旗| 栾城县| 阳新县| 钦州市| 大连市| 津南区| 方城县| 汪清县| 西乌珠穆沁旗| 疏附县| 清涧县| 于都县| 德州市| 高密市| 濉溪县| 营口市| 宁南县| 澄迈县| 曲水县| 栾川县| 龙口市| 洪洞县| 梁平县| 同心县| 鄄城县| 湘西| 武夷山市| 鄂伦春自治旗| 凤台县| 永和县| 巫山县| 蕉岭县| 唐山市| 宜兰市| 尖扎县| 鄱阳县|