• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于語料庫的應(yīng)用語言學詞塊及詞塊表的構(gòu)建研究

      2019-01-24 07:27:50
      關(guān)鍵詞:詞塊語料語言學

      (齊齊哈爾工程學院 黑龍江 齊齊哈爾 161000)

      詞塊是語言應(yīng)用的重要單位,在理解語言、產(chǎn)生語言中發(fā)揮重要的作用。語料庫則為詞塊的使用提供了存儲的條件與環(huán)境,使詞塊使用者無需依據(jù)語法規(guī)則對語言進行生成,從而,有效提升語言表達的準確性與連貫性。以英語為例,英語中有很多兼有詞匯、兼有語法雙重語言結(jié)構(gòu),這些結(jié)構(gòu)可作為一個總體內(nèi)容在人類大腦中進行儲存。在人們應(yīng)用詞匯時,可通過詞塊的擴大使其有效掌握詞匯語言結(jié)構(gòu),從而實現(xiàn)語言知識的拓展以及交際水平的提升。因此,針對語料庫的應(yīng)用語言學詞塊進行研究,并對詞塊表進行構(gòu)建,對語言發(fā)展來說具有重要的意義。

      1.基于語料庫的應(yīng)用語言學詞塊使用現(xiàn)狀

      針對詞塊的研究已有多年的歷史,詞塊理論也得到廣大語言研究者的認可,但在詞塊實際應(yīng)用中卻存在不足之處。各類詞匯表都未曾展現(xiàn)出詞塊的理念,也沒有將詞塊納入語言學習計劃中,導(dǎo)致很多語言應(yīng)用者對詞塊的認知過于薄弱。同時,在進行語言教學時,也沒有將詞塊學習作為教學重點,對詞塊的應(yīng)用與發(fā)展缺乏積極性。結(jié)合語料庫來看,可知語料庫對部分語言的翻譯存在較為明顯的問題,甚至會對語言使用者帶來直接的誤導(dǎo),導(dǎo)致其在翻譯、交際過程中存在語言應(yīng)用不嚴謹?shù)默F(xiàn)象。以英語為例,常有部分需要單數(shù)的詞語被拼寫成復(fù)數(shù)(例:infrastructure-infrastructures),雖然錯誤較為簡單,但還是要對其加以重視,減輕語用誤解,同時,語料庫還存在標點符號、語法性錯誤等現(xiàn)象。以英語為例,中英文標點符號混淆,易對翻譯過程帶來影響,也易導(dǎo)致部分單詞錯誤的排列,影響語言的理解過程。而詞塊中冠詞與主謂不一致、名詞單復(fù)數(shù)等錯誤,則易導(dǎo)致語用過程存在混淆現(xiàn)象,翻譯文本也易被理解的支離破碎。此外,也有部分語料庫編撰人員沒有對資料進行仔細審核,導(dǎo)致語用者在對語言進行翻譯、應(yīng)用發(fā)展的時候,會出現(xiàn)不足之處。

      2.基于語料庫的應(yīng)用語言學詞塊表構(gòu)建原則

      在利用語料庫進行應(yīng)用語言學詞塊表構(gòu)建時,需要遵循視覺設(shè)計合理、詞塊分類明確、語料庫檢索內(nèi)容豐富、詞塊語用信息完善等原則。因此,在進行詞塊表構(gòu)建時首先要對視覺設(shè)計加以重視,對語用詞塊內(nèi)容進行優(yōu)化,重視視覺效果,使其充分符合語用人員的思維與習慣。在視覺設(shè)計上則需突出詞塊表的特色與重點,還需突出學術(shù)語言特色,對影響力較大的學術(shù)文獻進行深入介紹,引導(dǎo)語用人員對學術(shù)的全面了解。其次,還需對詞塊進行分類,對詞塊應(yīng)用排序有所側(cè)重。主要由于不同國家具有不同文化,所以詞塊表在構(gòu)建時需要設(shè)置合理的檢索欄目,并以正確的目的語語序、習慣為主,找尋母語與目的語之間的契合點,從而提高詞塊表的實用性。再次,在針對語料庫詞塊表在線檢索設(shè)計時,需要結(jié)合傳統(tǒng)檢索方法,了解其不足之處,從而進行創(chuàng)新,使語用人員在檢索時能得到不同詞塊所擁有的豐富語義,并呈現(xiàn)出詞塊的語用實例,為語用人員帶來詳細的參考資料。

      3.基于語料庫的應(yīng)用語言學詞塊表的構(gòu)建過程

      3.1 語料收集及分析

      本次研究所利用的目的語語料皆是2005年至今語言學應(yīng)用專業(yè)人員參與的實證研究結(jié)果,包含國際九種SSCI語言學雜志中學術(shù)論文,例如:Applied Linguistics、Language for specific purposes 等,語料較為權(quán)威且準確,經(jīng)過核查,共計語料約為300000詞。涉及目的語教學、二語教學等多樣化話題。并采取隨機挑選策略,將文章正文納入語料庫中,為詞塊表的構(gòu)建奠定基礎(chǔ)。本次研究的首要問題時應(yīng)用語言學詞塊表的構(gòu)建,為解決這一問題,首先需要設(shè)定頻率域值域標準,從而安排應(yīng)用語言學詞塊。詞塊頻率域值域的設(shè)置與選擇參考Ellis編制詞塊表的提取標準,大致設(shè)為20次/百萬字,值域標準大致設(shè)為十分之一文本中出現(xiàn)的詞塊,利用Antconc多功能檢索工具進行設(shè)計。其次,還需將語料庫內(nèi)輸入檢索工具,設(shè)定檢索長度、最低頻數(shù),得到總類符及總字符的數(shù)量。并利用Excel工具針對語料庫內(nèi)文章進行隨機抽取,選取高頻應(yīng)用類符詞塊,并對其中占位符進行篩選,去除非語言單位、語法不合內(nèi)容等,得到涵蓋使用頻率較高的應(yīng)用語言學詞塊表。此外,本次研究還需設(shè)定詞塊頻率排序,并豐富高頻詞塊的語用功能與結(jié)構(gòu)特點內(nèi)容。為此,可將詞塊分為指示性、態(tài)度性、話語組織性三類,結(jié)合不同類別進行劃分。

      3.2 詞塊提取及詞頻分析

      在構(gòu)建應(yīng)用語言學詞塊表時還需對詞塊進行提取,針對詞塊的提取可利用多方印證法進行,將文獻集中,利用語料庫及人工識別工具等對詞塊進行提取。保障詞塊的提取可按照lemma(詞條)進行,與參考文獻與目的語語料充分結(jié)合,從而設(shè)計出詞條列表(lemma matches list,以下簡稱 LML),例如 Be 動詞(am、is、are/was、were)等。利用詞條功能,去除屈折形式,且不設(shè)頻點,提取詞塊,加載列表,從而將其合并,做標準化處理,保障檢索結(jié)果的準確性。同時,詞塊出現(xiàn)頻率是詞塊表構(gòu)建的決定性特點,當提取率達到40次/百萬詞時,此提取頻點為較高頻點。而提取率達到20次/百萬詞時,此提取頻點為標準頻點。因此,可將詞塊提取頻點設(shè)定為10到40次/百萬詞,本次研究設(shè)定為10次/百萬詞。保障200個提取頻率最高的詞塊中有163個及以上的較高頻點詞塊,而此200個詞塊則是本次研究的重中之重。

      語料庫中出現(xiàn)最高頻率的詞塊中,每200個中有百分之二十的詞塊被包含入應(yīng)用語言學詞塊表的構(gòu)建中,但需要注意這些詞塊中須有百分之十的詞塊出現(xiàn)40次以上,實驗表明,語料庫詞塊對學術(shù)語言教學、寫作、翻譯中具有重要的作用。這也代表研究人員在構(gòu)建詞塊表以及語用人員在檢索詞塊表時還需充分了解這些詞塊的必要性及應(yīng)用價值,因此,需要將語料庫與應(yīng)用語言學詞塊表的構(gòu)建緊密相連,從而編制具有語言應(yīng)用特色的詞塊表。

      3.3 應(yīng)用語言學詞塊功能分類

      依照詞塊語用功能分類方法,可將詞塊表中詞塊分為指示性、態(tài)度性、話語組織性詞塊三類。在設(shè)計應(yīng)用語言學詞塊表時,需保證指示性詞塊可占詞塊表的69.7%,充分展示出指示性詞塊的重點語用功能。同時,指示性詞塊是語用范圍內(nèi)使用頻率最高的詞塊,因此需對其加以重視。而態(tài)度性詞塊與話語組織性詞塊二者在語用范圍內(nèi)使用頻率相似,與指示性詞塊共同構(gòu)成語用范圍最長應(yīng)用的詞塊內(nèi)容。因此,在進行應(yīng)用語言學詞塊語用功能分類時,可將指示性詞塊作為基礎(chǔ)。指示性、態(tài)度性、話語組織性詞塊功能劃分見表1。

      表1 應(yīng)用語言學詞塊(三類)功能劃分

      指示性詞塊在語料庫與詞塊表的分布規(guī)律相似,但在詞塊表中,指示性詞塊的應(yīng)用頻率明顯較高,主要針對語用篇目、語用情景中的時間與空間的指代。此塊表中則需主要展示指示性詞塊所應(yīng)用的內(nèi)容與主題。 例如 teacher and student(師生)、teach and learn(教與學)等。其在詞塊表中的結(jié)構(gòu)多以介詞短語及名詞短語為主,例如:at the end、the same words等。此外,語料庫將對彼此快納入指示性詞塊的劃分,而詞塊表中也將其實用性充分展現(xiàn)。態(tài)度性詞塊與話語組織性詞塊大多針對語料庫中語篇指示、話題介紹等進行設(shè)計,在構(gòu)建詞塊表時需要結(jié)合學術(shù)論文中常出現(xiàn)的詞塊內(nèi)容進行編撰,保障詞塊使用頻率與真實頻率相符。最后,還需針對應(yīng)用語言學詞塊的結(jié)構(gòu)繼續(xù)擰分析,從而確定其在詞塊表中語用功能。有語用學者會利用大量的名詞詞組來確定學術(shù)語用意義的廣泛內(nèi)涵,例如數(shù)量詞(number)、地點詞(end of the...)、質(zhì)量詞(nature of)等,最終保障詞塊表中詞塊的主題可充分闡釋語用功能。

      4.結(jié)語

      結(jié)合大量應(yīng)用語言學SSCI學術(shù)論文,編制應(yīng)用語言學詞塊表,同時針對詞塊進行分析與研究,探索語言應(yīng)用中詞塊的使用,充分重視語用條件,將語料庫作為詞塊應(yīng)用一大措施,以提高語用水平,減少語用偏誤現(xiàn)象的出現(xiàn),有效避免語用交際、翻譯、閱讀等出現(xiàn)的誤解,并為語言學的研究提供更多參考資料。

      猜你喜歡
      詞塊語料語言學
      高中英語詞塊教學現(xiàn)狀調(diào)查研究及應(yīng)用策略分析
      基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
      認知語言學與對外漢語教學
      大學英語教學中的詞塊教學
      華語電影作為真實語料在翻譯教學中的應(yīng)用
      詞塊在初中英語寫作教學中的應(yīng)用研究
      《苗防備覽》中的湘西語料
      國內(nèi)外語用學實證研究比較:語料類型與收集方法
      美國總統(tǒng)就職演說詞中的詞塊研究
      語言學與修辭學:關(guān)聯(lián)與互動
      當代修辭學(2011年2期)2011-01-23 06:39:12
      宝清县| 乐昌市| 略阳县| 农安县| 仪征市| 布拖县| 乌兰县| 涿州市| 兴文县| 雷州市| 江陵县| 丰台区| 都匀市| 长兴县| 宜城市| 湖北省| 阿合奇县| 湘阴县| 呼伦贝尔市| 杭锦后旗| 湖州市| 南澳县| 湾仔区| 南郑县| 介休市| 思茅市| 东阿县| 阜新市| 福安市| 信阳市| 昭通市| 乐陵市| 门源| 玛纳斯县| 蓬安县| 白水县| 洞头县| 额尔古纳市| 封丘县| 西盟| 浦城县|