楊春會 張曉菲 姜洋 徐雪婕 趙果巍
摘 要:大數據時代為體育英語詞頻數據庫的建設和使用提供了更有力的條件。在合理地劃分體育英語詞頻數據層次的基礎上,利用大數據的優(yōu)勢,廣泛采集體育英語詞頻數據、科學建設體育英語詞頻線上和線下數據庫、及時維護體育英語詞頻數據庫,體育英語詞頻數據庫就能夠有效地發(fā)揮其功能,為體育專業(yè)從業(yè)者和體育愛好者清除語言上的障礙,使其能夠輕松地生活和工作。
關鍵詞:體育英語 詞頻數據庫 大數據
中圖分類號:G80 文獻標識碼:A 文章編號:2095-2813(2018)07(c)-0226-02
人們因專業(yè)需求或興趣愛好不同對英語詞匯的需求也不盡相同。語言是滿足人們交流的工具,不同的需求意味著人們在學習英語時不必面面俱到,有所側重會使學習效率變得更高。體育英語詞頻數據庫的研究和建設能夠幫助體育從業(yè)者和體育愛好者更快速、更輕松地掃清語言方面的障礙。大數據時代為體育英語詞頻數據的采集和研究提供了便捷的方法和途徑,使體育英語詞頻數據庫的研究更科學準確、更新速度更快。
1 體育英語詞頻層次的劃分
要建設體育英語詞頻數據庫,首先要對體育英語詞匯進行整理和歸類??茖W的歸類方法既是建設數據庫的良好基礎又是提高人們使用數據庫時的效率的有力保障。為了滿足不同群體在體育英語詞匯方面的需求,數據的歸類標準是多重的。首先,可以按照專項進行分類。在分類過程中,將通識性體育英語詞匯和體育項目英語詞匯分開,便于人們查找和使用。通識性體育英語詞匯包括體育組織和賽事名稱等體育綜合詞匯、裁判員和解說員常見用語、賽事報道(書面、口頭)用語等。體育項目英語詞匯包括各種項目的技術動作用語、器材和場地用語、運動員和教練員用語等[1]。普通體育愛好者了解前者即可滿足語言需求,想深入了解某一項目的人可以參照后者。其次,可以按照大型賽事對體育項目進行分類。奧運會是最受人們關注的世界性的賽事,可以按照奧運會項目和非奧運會項目對體育項目進行歸類,其中,奧運會項目又可分為夏季奧運會項目和冬季奧運會項目,滿足大眾在奧運會等大型賽事期間對體育英語語言的需求。再次,可以按照應用頻率對體育英語詞匯進行分類。區(qū)分詞匯的應用頻率是短期內提高人們學習效率的有效途徑。高頻詞匯是指通過多批次、多層面地收集語言交際素材并統(tǒng)計其中的詞頻數據,篩選出的在某些領域語言交流中應用較為普遍的詞匯[2]。反之,則是低頻詞匯。將通識性體育英語詞匯和各個項目體育英語詞匯中的高頻詞匯和低頻詞匯單獨統(tǒng)計出來可以使人們聚焦于廣泛應用的詞匯,摒棄應用頻率過低的詞匯,節(jié)省了使用者的時間,提高了使用者的學習效率。此外,按照素材形式進行分類。體育英語詞頻數據庫不應僅局限于詞匯的收集,應該把能夠有效地呈現各種詞匯信息的文本、音頻、視頻等資源都囊括在內[3]。多樣的形式有助于加深人們的印象,也促進了人們對體育英語文化的了解。
2 體育英語詞頻數據的采集
隨著體育項目的不斷發(fā)展,體育英語詞匯層出不窮。體育項目中技術動作、器材、場地等的更新必然會淘汰新的詞匯,衍生新的詞匯。因此,不同時期,熱點詞匯也不盡相同,詞頻數據是動態(tài)的。在這種情況下,詞頻數據采集的及時性就尤為重要。在大數據時代,線上和線下的數據采集應該同步進行。
線上數據采集的特點是及時、便捷,其主要對象是網絡文本資源、網絡視頻新聞和賽事轉播。數據庫的主體形式是文字,網絡文本資源不僅為數據采集提供了海量的資源,而且為數據庫的建設提供了便利條件,是數據庫建設的基礎。然而,網絡文本資源的劣勢是誤差較大、更新不及時,要靠視頻資源來彌補。網絡視頻新聞和賽事轉播能夠使人們突破時間和空間的限制,以最快的速度獲取詞頻數據。
線下?lián)杉奶攸c是準確、實用性強,其主要對象是體育類報紙、雜志和書籍、訓練和比賽現場等。數據庫是供人們查找和學習的工具,準確性是重中之重。紙質書刊都是經過嚴格的審查程序才出版的,準確性相對較高,是數據庫參照的首要標準[4]。在訓練和比賽現場,詞頻數據采集者可以獲取更豐富、更鮮活的詞匯信息,是其他采集手段無法替代的。
線上和線下的數據采集的同步開展彌補了線上數據采集的誤差和線下?lián)杉乃俣龋呛侠碛行У臄祿杉绞健?/p>
3 體育英語詞頻數據庫的建設
體育英語詞頻數據庫的建設以體育英語詞匯使用頻率的統(tǒng)計和分析為基礎。為了確保詞頻數據的準確性,應該運用數據分析程序進行詞頻數據的統(tǒng)計和分析以規(guī)避主觀因素對結果造成的誤導,確保數據庫的科學性。數據分析程序的應用需要專業(yè)人士的指導和協(xié)助,彌補體育英語研究者在技術方面的不足,是體育英語詞頻數據庫建設的基礎。
體育英語詞頻數據庫的建設要通過線上數據庫和線下數據庫相結合的方式來完成,以線上數據庫為主,線下數據庫為輔。線上數據庫主要包括基于電腦端的在線網站和基于移動端的應用軟件。基于電腦端的在線網站的優(yōu)勢在于同一網頁內容顯示豐富、層次清晰,適用于某一群體某一時期內的集中學習?;谝苿佣说膽密浖膬?yōu)勢在于操作靈活、便捷,適用于個體的長期學習。在線學習的最大優(yōu)勢就是能夠通過網絡把具有相同需求的人聚集在一起,因此,線上數據庫的建設應該設計互動和問題反饋界面,便于人們探討問題或提出對數據庫的要求。線下數據庫主要包括紙質書籍和電子書。紙質書籍適用于對電子產品不熟悉的群體,尤其是年長者更愿意閱讀紙質書籍。電子書適用于習慣使用移動電子產品但網絡不便的群體。
體育英語詞頻數據庫的建設需要進行定期的維護。詞頻數據的收集應該是不間斷的,每隔3~6個月應對網站和應用軟件進行維護,每年應對紙質書籍和電子書中的內容進行更新。
4 體育英語詞頻數據庫的應用與維護
體育英語詞頻數據庫的服務對象主要是體育從業(yè)者和體育愛好者,受眾群體比較年輕,以尚處于學習階段的大學生居多。因此,數據庫的網站應該推廣到各個高等院校中,在高校校園網站中可以顯示相關鏈接以便于學生了解和使用,同時,年輕人對移動端的使用較為普遍,數據庫的應用軟件應該適用于各種不同的手機應用系統(tǒng)。
語言的發(fā)展是不間斷的,新生詞匯不斷出現,體育英語詞頻數據庫的更新與維護是數據庫能否持續(xù)發(fā)揮作用的關鍵。因此,體育英語詞頻數據庫的建設是沒有截止點的。數據庫的更新與維護需要體育人才、英語人才和信息技術人才的通力合作,以半年為周期進行數據調研與更新。時時關注體育項目的技術動作、規(guī)則、賽事信息等方面的變化是必要的,但會花費大量的人力和物力。大數據為人們在數據庫的更新與維護方面節(jié)省了時間和精力,為數據庫能夠持續(xù)地發(fā)揮作用提供了保障。
5 結語
大數據能夠幫助人們更輕松地辨別出體育英語中的高頻詞匯和低頻詞匯,為人們在短時間內高效地習得體育英語詞匯提供了便捷的渠道。當人們在體育英語方面遇到障礙時,基于大數據的體育英語詞頻數據庫可以使人們及時地通過網絡查找到所需要的體育英語詞匯,成為實用價值很高的工具。大數據時代對于體育英語詞頻數據庫的更新與維護提供了廣闊的資源,對體育英語的持續(xù)研究是非常有益的。
參考文獻
[1] 陳梅.體育英語詞匯構成及使用特點分析[J].哈爾濱體育學院學報, 2015,33(1):74-77.
[2] 鄭春丹.體育英語高頻詞匯研究及其在體育院校英語教學中的運用[J].校園英語, 2014(32):47.
[3] 李雪花.英語高頻詞匯習得水平與閱讀水平相關性研究[J].常州工學院學報:社科版,2014,32(3):117-120.
[4] 李夢圓.英語高頻詞匯的采集方法[J].考試周刊, 2018(27):110.