劉夢晨
內(nèi)容摘要:目前,人類在研究語言學(xué)相關(guān)內(nèi)容時,大多青睞于使用語料庫。這是因為語料庫應(yīng)用范圍比較廣泛,它普遍應(yīng)用于傳統(tǒng)語言、語言教學(xué)等的研究,也是在人類研究語言學(xué)時總結(jié)出的經(jīng)驗的基礎(chǔ)上誕生而來的,研究結(jié)果比較可靠。因此,文章通過人工方式創(chuàng)建一個俄語語料庫,并將該語料庫應(yīng)用于俄語教學(xué)實踐,旨在驗證自建語料庫在俄語教學(xué)應(yīng)用中的成效。
關(guān)鍵詞:語料庫 俄語 教學(xué)
一、創(chuàng)建語料庫
1.結(jié)合教學(xué)實際需求針對性的選擇語料
2014年,秦嘉等學(xué)者指出,外語教學(xué)中的語料來自于教科書,如教科書中的某些文章、某類詞語。通過分析這些文章和詞語,還能知道教科書編排的內(nèi)容是否符合教學(xué)大綱要求。他們首先針對這些網(wǎng)站設(shè)計好爬蟲代碼,然后從這些網(wǎng)站的源網(wǎng)頁把文章下載至本機電腦,文章格式另存為記事本(.txt)文檔。
2.語料庫分析工具的選取
本文使用的語料庫分析軟件為wordsmith5.0。該軟件具有以下功能:第一,查找指定語料。第二,以表格形式呈現(xiàn)詞匯表。第三,分類統(tǒng)計關(guān)鍵詞。第四,批理處理純文本文檔、網(wǎng)頁文件。通過實踐發(fā)現(xiàn),wordsmith軟件能夠很好的實現(xiàn)對選定語料的分析,是目前應(yīng)用最普遍的語料分析軟件。
二、自建語料庫應(yīng)用于俄語教學(xué)
1.辨別指定領(lǐng)域的關(guān)鍵詞語
如果語料庫包含龐大的詞匯量,則可將語料庫劃分成若干個子語料庫,每個子語料庫里存放指定領(lǐng)域的文章,與總語料庫的詞語相比,這些文章中詞語出現(xiàn)的機率更高。通過使用wordsmith軟件中的keywords工具能夠快速找到指定領(lǐng)域的詞語,然后依據(jù)該詞語在總語料庫及子語料庫里出現(xiàn)的機率確定其重要程度,最后生成指定領(lǐng)域的關(guān)鍵詞列表。
2.檢索與搭配
在生成了軍事領(lǐng)域的關(guān)鍵詞列表后,接下來需要進一步分析該列表中經(jīng)常使用的詞語和比較重要的詞語,為俄語教學(xué)提供便利。首先調(diào)用wordsmith軟件的concord工具,設(shè)定查詢關(guān)鍵字分別為:“учени^、учени^^、учениями。
三、自建語料庫應(yīng)用于俄語研究
為提高研究結(jié)果的可信度,本文選擇的文章來自于俄國比較有公信力的網(wǎng)站,新聞發(fā)生時間為2014-2016年,文章涉及的詞匯量達6000萬。
1.俄語高頻詞匯
本文創(chuàng)建的語料庫出現(xiàn)機率最高的詞匯類型主要為虛詞,如前置詞、連接詞,數(shù)量大約為30個,這30個詞形主要包括он,от,России,его,РФ,но,года,в,и,на,по、c、до,то,мы,сказал等。從出現(xiàn)的機率來看,在6000萬個詞匯中,в,и,等詞出現(xiàn)的機率為2%,其中。в出現(xiàn)的機率達到了近5%,и出現(xiàn)的機率緊隨其后,排在第二位。
從上面闡述的內(nèi)容可以得出以下結(jié)論:本文創(chuàng)建的基于指定三個領(lǐng)域的語料庫,詞匯出現(xiàn)頻率最高的主要為虛詞,如前置詞、連接詞等,排在第二位的主要為實詞,如名詞及代詞等。常見的詞匯有в,и,на,по等詞,它們在語料庫中出現(xiàn)的機率至少為1%。
2.語法范疇概率
在分析了詞語的各種呈現(xiàn)形式后發(fā)現(xiàn),語法分布機率呈不規(guī)則狀態(tài)。因此,需要重新找尋統(tǒng)計語法分布機率的方法。本文在統(tǒng)計詞匯語法分布機率時,主要選取某個特定詞語進行分析統(tǒng)計。例如,本文在統(tǒng)計動詞говорить、сказать的各種語法形式在語料庫中出現(xiàn)的次數(shù)時,首先在語料庫中的詞匯列表中找到這兩個詞語的過去時、將來時出現(xiàn)的次數(shù),發(fā)現(xiàn)將來時出現(xiàn)的次數(shù)近5000次,過去時出現(xiàn)的次數(shù)高達10萬次,也就是說,這兩個詞語的過去時在語料庫中出現(xiàn)的機率是將來時的25倍。
四、結(jié)論
文章創(chuàng)建的語料庫中涉及的詞匯主要指詞形,無論是在分析詞匯出現(xiàn)的頻率還是分析同一詞語以不同語法形式出現(xiàn)的機率時,研究的對象均為詞形。文章接下來的工作是深層次的加工與標示語料庫中的單詞,以便能夠統(tǒng)計出所有單詞及其變化形式在語料庫中出現(xiàn)的機率。結(jié)合當前已有的研究技術(shù)來看,下一步的主要工作是解決詞形與單詞匹配精確度的問題。
參考文獻
[1]王金花.“一帶一路”背景下大學(xué)俄語教學(xué)改革探析[J].內(nèi)蒙古財經(jīng)大學(xué)學(xué)報,2016,(06):124-126.
[2]劉鑫.混合式教學(xué)模式在俄語教學(xué)中的應(yīng)用[J].黑龍江科學(xué),2016,(24):112-113.
[3]許波.淺談互聯(lián)網(wǎng)資源在俄語教學(xué)中的應(yīng)用[J].民營科技,2016,(12):221.
[4]李明宇.中俄合作辦學(xué)鐵路專業(yè)俄語教學(xué)的特點及教學(xué)模式初探[J].鄭州鐵路職業(yè)技術(shù)學(xué)院學(xué)報,2016,(04):86-88+91.
(作者單位:四川省都江堰市川外成都學(xué)院)endprint