吳國偉 劉宇熙
摘 ?要:本文通過對《新實(shí)用漢語》第一冊進(jìn)行軟件統(tǒng)計(jì),對該叢書第一冊的生詞重現(xiàn)情況做出整體評估。以此嘗試探討生詞重現(xiàn)研究如何更好與軟件相結(jié)合,從而大幅度提高統(tǒng)計(jì)效率和準(zhǔn)確性。
關(guān)鍵詞:生詞 ?重現(xiàn) ?調(diào)查
引言
針對目前國內(nèi)學(xué)者較少關(guān)注生詞重現(xiàn)軟件統(tǒng)計(jì)和研究,本文主要通過該手段對《新實(shí)用漢語》第一冊的生詞重現(xiàn)問題進(jìn)行研究,利用電子統(tǒng)計(jì)工具完成對《新實(shí)用漢語》第一冊的生詞等級選取情況、重現(xiàn)率、總詞頻、平均詞頻和詞匯分布情況的統(tǒng)計(jì)?;诖?,對《新實(shí)用漢語》第一冊的生詞重現(xiàn)情況做出整體評價(jià),嘗試對這方面的研究提出若干建設(shè)性意見。
一、相關(guān)研究綜述
隨著對外漢語研究的不斷深入,對外漢語教材生詞重現(xiàn)研究問題受到越來越多學(xué)者的關(guān)注。當(dāng)前對于生詞重現(xiàn)的研究主要體現(xiàn)在生詞等級情況、重現(xiàn)頻率、重現(xiàn)分布情況等方面。下面我們對相關(guān)文獻(xiàn)作大致的梳理。
國內(nèi)對于詞匯重現(xiàn)方面的研究起步較早。例如,張維(1979)指出,生詞重現(xiàn)對于學(xué)生而言是很重要的;劉珣(1982)認(rèn)為,生詞重現(xiàn)的情況是評價(jià)一本語言教材好壞的標(biāo)準(zhǔn);趙金銘(1998)指出:“我們的對外漢語教材在編寫方面尚普遍存在的問題之一:詞匯量大,復(fù)現(xiàn)率低?!边M(jìn)入21世紀(jì),針對生詞在教材中重現(xiàn)情況,柳艷梅(2002)對歐美學(xué)生學(xué)習(xí)效果的影響進(jìn)行了真實(shí)實(shí)驗(yàn),并提出相應(yīng)意見。不過,上述研究均使用傳統(tǒng)的統(tǒng)計(jì)手段和研究方法(直至池中華(2012)。根據(jù)我們的調(diào)查,熊熙瑤(2013)碩士論文首次提到了軟件統(tǒng)計(jì)方式和研究方法,但并沒有做出具體的闡釋,也沒有給出研究的具體方法。就學(xué)界現(xiàn)狀而言,國內(nèi)目前在生詞重現(xiàn)問題上,并沒有形成統(tǒng)一的統(tǒng)計(jì)模式,對軟件統(tǒng)計(jì)也沒有做出更深入的研究。
二、調(diào)查方法及其結(jié)果
(一)調(diào)查方法
首先將書本掃描成pdf文件,然后用轉(zhuǎn)換軟件轉(zhuǎn)換成word格式。接著對word文本進(jìn)行整理,依據(jù)教材組成部分和認(rèn)知層次理論將課本分為三個(gè)部分:主課文、閱讀課文、課后練習(xí)。整理生詞庫表,與《漢語水平詞匯和漢字文化等級大綱》進(jìn)行比照,完善詞性分類、等級分類。而后通過已經(jīng)制定好的生詞表進(jìn)行重現(xiàn)檢索,從第一詞一直檢索至最后一詞。
檢索方法:a.利用檢索軟件,進(jìn)行生詞定位。然后逐個(gè)位置篩查,排除同音同形但意義不同的詞,用檢索到的總詞數(shù)減去同音同形不同意的詞(統(tǒng)計(jì)說明作解)的個(gè)數(shù)再減一,就是該生詞的重現(xiàn)率。b.在主課文部分、閱讀課文部分、練習(xí)部分(練習(xí)答案)依次進(jìn)行a部分的檢索操作,直至把所有的生詞都檢定完畢。c.統(tǒng)計(jì)每一詞在各個(gè)部分(三個(gè)層次)的重現(xiàn)率,然后綜合每一詞在全書的重現(xiàn)率,得出總詞頻、平均詞頻、重現(xiàn)頻率、重現(xiàn)分布情況,最后將所有數(shù)據(jù)錄入并分析得出調(diào)查結(jié)論。
(二)統(tǒng)計(jì)說明
在研究過程中,由于軟件問題,會遇到同字統(tǒng)計(jì)(即單音節(jié)詞詞義不同或出現(xiàn)在復(fù)合詞中但仍統(tǒng)計(jì)次數(shù))的問題。所以每一個(gè)生詞在重現(xiàn)率統(tǒng)計(jì)時(shí),必須要逐詞查對,保證生詞重現(xiàn)的準(zhǔn)確性。在逐詞查對時(shí)遵循以下原則:1.單字成詞時(shí)在復(fù)合詞中又會檢定一次,如甲級詞“吃”與甲級詞“吃飯”中吃字會被檢索到兩次,只能算一次。2.檢詞過程中要區(qū)分同詞不同音,主要體現(xiàn)在單音節(jié)詞上,如“都”有“dou”和 “du”兩個(gè)讀音。3.檢詞過程中要區(qū)分多義詞的不同義項(xiàng),如“好”這個(gè)詞在該書中的英文翻譯包括了所有“好”的義項(xiàng),但是在中文中“你好”和“好東西”的義項(xiàng)差距大,在這種情況下算兩個(gè)不同的生詞來統(tǒng)計(jì)。4.復(fù)合詞如“星期一”“星期二”等要看《漢語水平詞匯及等級大綱》中有沒有將該詞列為一個(gè)詞語。如列為一個(gè)詞語,按照該詞語統(tǒng)計(jì)次數(shù)。如沒有該詞,按照其前綴或后綴的詞統(tǒng)計(jì)次數(shù)。如“星期”作為前綴時(shí)可以組成“星期一”等,但《漢語水平詞匯及等級大綱》中只將“星期日”單獨(dú)列出,所以其余“星期一”“星期二”等詞出現(xiàn)的“星期”一詞計(jì)入生詞“星期”的統(tǒng)計(jì)次數(shù),“星期日”單獨(dú)統(tǒng)計(jì)。5.書本中介紹生字書寫方法存在以某字為部首組成的情況,比如“三”的書寫順序中會出現(xiàn)“一”“二”,要將這些也排除在統(tǒng)計(jì)次數(shù)以外。6.其他看課本情況依據(jù)《現(xiàn)代漢語八百詞》和《漢語水平詞匯及等級大綱》來確定。如該課本將“男朋友”一詞中的“朋友”和“朋友”一詞意義相等,所以檢索中就不需要排除“男朋友”中的出現(xiàn)的“朋友”的次數(shù)。
(三)統(tǒng)計(jì)結(jié)果
《新實(shí)用漢語》全書257個(gè)詞,依照《漢語水平詞匯及等級大綱》得到全部生詞的等級情況:
表1:《新實(shí)用漢語》詞匯等級表
甲級 乙級 丙級 丁級 不在大綱
詞匯等級 216 21 2 2 16
根據(jù)表1,可以發(fā)現(xiàn),本教材生詞92%以上是甲級詞匯。詞匯基本依據(jù)大綱選擇,符合大綱要求,所以本教材的生詞選擇是合理的。
需要指出的是,本教材257個(gè)生詞在課本中一共出現(xiàn)8817次,即該課本的總詞頻為8817,平均詞頻為34.3。從平均詞頻來說,遠(yuǎn)遠(yuǎn)大于Saragi,Nantion & Meister(1978)關(guān)于詞匯重現(xiàn)次數(shù)最低必須大于6次的記憶標(biāo)準(zhǔn)。但是,在研究過程中我們發(fā)現(xiàn),生詞中絕對高頻詞對由總詞頻得到的平均詞頻產(chǎn)生了巨大影響,這對于其他重現(xiàn)頻率較低的詞匯的重現(xiàn)統(tǒng)計(jì)造成了嚴(yán)重影響。例如,絕對高頻詞匯占詞匯總數(shù)不到10%,其總詞頻卻占所有詞匯的總詞頻的40%以上。所以,在通過將生詞表與《漢語詞匯高頻詞匯表》交叉對比后,列出本書的絕對高頻詞匯和相對高頻詞匯,通過圖表探討他們的總體影響:
圖1:平均詞頻折線圖
從這張平均詞頻折線圖可以看出,絕對高頻詞匯和相對高頻詞匯的平均詞頻遠(yuǎn)大于一般詞匯的平均詞頻。所以,直接以總詞頻和整體生詞的平均詞頻來判斷重現(xiàn)情況是不科學(xué)的,必須分成三個(gè)部分加以分析。
通過前文對絕對高頻詞匯和相對高頻詞匯的整理與分析,該書在這兩部分的重現(xiàn)是相當(dāng)充分的。所以主要分析第三部分,即一般詞匯的重現(xiàn)情況。該書中一般詞匯一共212個(gè),總詞頻3640、平均詞頻17.16,符合最小重現(xiàn)次數(shù)不得小于6次的記憶規(guī)律。同時(shí),該書中沒有出現(xiàn)生詞重現(xiàn)率為0的情況。重現(xiàn)率小于6的生詞共40個(gè),與《現(xiàn)代漢語高頻詞匯表》比較后發(fā)現(xiàn),“拜拜”“哪里”“水”“沒關(guān)系”等都屬于漢語中出現(xiàn)次數(shù)比較高的詞匯。所以,本書作為一本初級教材,在這一方面還需要加強(qiáng)。
另外,除了重現(xiàn)率以外,生詞在各個(gè)部分的重現(xiàn)分布和多久出現(xiàn)一次的重現(xiàn)頻率也是衡量一本教材生詞重現(xiàn)情況的重要依據(jù)。由于本書的詞匯過多,無法將所有詞匯的重現(xiàn)分布和重現(xiàn)頻率在此列出。所以針對絕對高頻詞匯、相對高頻詞匯和一般詞匯隨機(jī)選取一個(gè)詞來展示這本書生詞的重現(xiàn)情況和重現(xiàn)頻率,如下圖所示:
圖2:絕對高頻詞匯“他”重現(xiàn)分布圖
圖3:相對高頻詞匯“吃”重現(xiàn)分布圖
圖4:一般詞匯“大”重現(xiàn)分布圖
從上述詞匯分布情況可以看出,幾乎所有頻段的詞都是練習(xí)部分重現(xiàn)率大于閱讀部分重現(xiàn)率和課文部分重現(xiàn)率。一般情況下,閱讀部分的重現(xiàn)率大于課文部分的重現(xiàn)率。這符合課文學(xué)習(xí)、課后鞏固的教學(xué)方法,也符合認(rèn)知規(guī)律,即通過閱讀,再結(jié)合具體語境理解和大量練習(xí),從而掌握課文中學(xué)到的生詞。
除了結(jié)構(gòu)性分布以外,詞匯重現(xiàn)也需要考查其呈現(xiàn)頻率,即詞匯的“左鄰右舍”和“前村后店”,從而保證重現(xiàn)分布將集中性與廣泛性相結(jié)合。本書的詞匯集中出現(xiàn)非常充分,如前文提到的“大”字,在學(xué)完該課后練習(xí)部分重現(xiàn)14次。對于廣泛性,我們通過抽樣調(diào)查的方法調(diào)查了60個(gè)詞匯的呈現(xiàn)頻率,這里以相對高頻詞匯“買”為例:
圖5:“買”重現(xiàn)分布圖
“買”在課文部分一共出現(xiàn)11次,分別分布在第八課、第九課和第十二課。同時(shí),大部分被調(diào)查的生詞多個(gè)課時(shí)同時(shí)出現(xiàn)。只有部分總詞頻低于10的生詞在這一方面做的不夠??梢钥闯觯谏~分布情況上,該教材總體情況較好,但仍有需要改進(jìn)的地方。
三、總結(jié)和建議
通過對本書的生詞重現(xiàn)率、生詞分布情況等加以調(diào)查分析,我們認(rèn)為,《新實(shí)用漢語》第一冊的生詞重現(xiàn)狀況符合一本優(yōu)秀教材對于生詞重現(xiàn)的要求。但是,對部分重現(xiàn)率較低的詞匯,還需要做出進(jìn)一步的努力。同時(shí),通過本次的軟件研究,我們發(fā)現(xiàn):通過計(jì)算機(jī)軟件,全過程完成共花費(fèi)18個(gè)小時(shí),大大減少了人工檢索帶來的時(shí)間問題,也降低了人工統(tǒng)計(jì)所不可避免的誤差。所以,通過軟件進(jìn)行對外漢語教材生詞重現(xiàn)研究,有利于相關(guān)研究的深入開展。通過本文的探討,我們希望有更多的學(xué)者關(guān)注這一議題,從而使該領(lǐng)域的相關(guān)研究得到進(jìn)一步的發(fā)展。
參考文獻(xiàn):
[1]張維.漢語詞匯教學(xué)瑣談[J].語言教學(xué)與研究,1979,(1).
[2]劉珣.試談基礎(chǔ)漢語教科書的編寫原則[J].語言教學(xué)與研究,1982,(4).
[3]趙金銘.論對外漢語教材評估[J].語言教學(xué)與研究,1998,(3).
[4]柳艷梅.生詞重現(xiàn)率對歐美學(xué)生漢語詞匯學(xué)習(xí)的影響[J].語言教學(xué)與研究,2002,(5).
[5]康艷紅,董明.初級對外漢語教材的詞匯重現(xiàn)率研究[J].語言文字應(yīng)用,2005,(11).
[6]池中華.初、中級對外漢語教材生詞重現(xiàn)率研究——以三組對外漢語初、中級教材為例[D].烏魯木齊:新疆師范大學(xué)碩士學(xué)位論文,2012.
[7]熊熙瑤.《新實(shí)用漢語課本》(初級1-4冊)生詞重現(xiàn)調(diào)查報(bào)告[D].重慶:重慶師范大學(xué)碩士學(xué)位論文,2013.
[8]吳日娜.對外漢語中級口語教材詞匯問題的分析研究——以《發(fā)展?jié)h語·中級口語》為例[D].北京:北京外國語大學(xué)碩士學(xué)位論文,2014.
[9]郝中婧.《成功之路》(初)教材的詞匯研究[D].長沙:湖南師范大學(xué)碩士學(xué)位論文,2014.
(吳國偉 ?劉宇熙 ?江蘇大學(xué)文法學(xué)院 ?212013)
現(xiàn)代語文(學(xué)術(shù)綜合) 2016年2期