英語詞匯自適應測試系統(tǒng)中詞匯難度的判定*

2016-05-05 04:00:04胡一平高佳佳山東師范大學傳媒學院山東濟南250014

現(xiàn)代教育技術 2016年3期

胡一平　高佳佳　陸　宏（山東師范大學傳媒學院，山東濟南 250014）

胡一平高佳佳陸宏[通訊作者]
（山東師范大學傳媒學院，山東濟南 250014）

摘要：針對英語詞匯自適應測試系統(tǒng)中詞匯難度如何量化的現(xiàn)實需求，文章提出了從詞頻、長度、語音書寫和諧程度這三個維度來量化英語詞匯難度的具體方法，并以普通高中英語詞匯為例展示了其量化過程。經(jīng)過對各個難度子區(qū)間的詞匯頻次進行統(tǒng)計后發(fā)現(xiàn)，其結果近似呈現(xiàn)正態(tài)分布。

關鍵詞：英語詞匯；自適應測試；詞匯難度；項目反應理論

一　問題提出的背景

任何一門語言的掌握和應用都離不開詞匯。詞匯學習是英語學習的一個重要組成部分，是進行語言交際的前提和核心。并且，詞匯能力對語言能力有很強的預測性，因為詞匯能力的發(fā)展與語言能力的發(fā)展是緊密相關的[1]。基于此，對詞匯能力的測試成為了語言學研究的重點。

隨著計算機技術和網(wǎng)絡技術的飛速發(fā)展，以及項目反應理論（IRT）在測試領域受到的廣泛關注，英語詞匯能力測試可借助基于IRT的計算機自適應測試（CAT）得以高效、便捷地實現(xiàn)。基于IRT的英語詞匯自適應測試系統(tǒng)最重要的部分就是題庫建設，而一個優(yōu)質的題庫系統(tǒng)是CAT系統(tǒng)得以成功實施的前提。但題庫系統(tǒng)是否優(yōu)質，在很大程度上取決于對英語詞匯難度的量化是否合理，這關系到整個CAT系統(tǒng)的性能。在自適應測試的過程中，CAT系統(tǒng)作為測試的“決策者”，不論它采用何種選題策略（如最大信息量選題法、a分層選題法等），其最終目的都是從題庫系統(tǒng)中選出與被試能力相匹配的試題，因為只有這樣的試題對于被試來說才有價值，而對最終選題結果起決定性作用的正是詞匯難度值。此外，詞匯難度值對后續(xù)估計被試的詞匯能力也起到了至關重要的作用，它會對被試最終能力水平的判定產(chǎn)生直接影響，而這關系到測試的可靠性。因此，如何合理地量化英語詞匯難度值，就成為了研究者們關注的焦點。

二　相關研究綜述

基于IRT的英語詞匯自適應測試具有廣闊的前景，這一點毋庸置疑。然而，由于采用的新型教育測量理論涉及相對繁雜的數(shù)學運算，且其測驗理念并未完全深入人心，故目前相關的自適應測試系統(tǒng)仍處于一種相對匱乏的狀態(tài)。但通過分析有限的案例，可以幫助研究者理清研究脈絡，從中發(fā)現(xiàn)問題以便改進。

趙傳海等[2]設計了一個基于IRT的大學英語詞匯在線自適應測試系統(tǒng)，并依據(jù)相關理論研究成果，提出英語詞匯自適應測試應在廣度測試的基礎上進行深度測試——然而在廣度測試中，起決定性作用的詞匯難度值卻未得到充分重視。臺灣學者Chen等[3]基于IRT和學習記憶周期理論，設計了個性化英語詞匯移動學習系統(tǒng)，并在系統(tǒng)建設中對每個單詞的難度系數(shù)進行標度時，對影響詞匯難度的長度因子和發(fā)音因子的權重指定為0.7和0.3——但文中對這種標度的科學性和理論依據(jù)，卻未加解釋。此外，陸宏等[4]開發(fā)的高中英語詞匯自適應學習系統(tǒng)對詞匯難度的量化進行了改進——然而在對具體的難度影響因子參數(shù)的計算上過于簡單，如在統(tǒng)計單詞字母與音節(jié)的不和諧程度時，簡單地將其劃分為三個不同的等級，不能較好地體現(xiàn)不同詞匯間不和諧程度的差異，進而直接影響到詞匯最終難度值的合理性。

在詞匯難度定義方面的缺陷，必然會導致整個詞匯自適應測試系統(tǒng)在為用戶選詞、對用戶能力進行評價時不夠精確和科學，其實用價值也會大打折扣?；诖耍狙芯吭谖墨I查閱的基礎上，提出了一個量化英語詞匯難度的具體方法，使其更具科學性和實用性，并以普通高中英語詞匯為例展示了其量化過程。

三　詞匯難度的判定

本研究選用普通高中英語詞匯作為題庫目標詞。《全日制高級中學英語教學大綱》和《普通高中英語課程標準（實驗）》中規(guī)定了高中階段學生應該學習和掌握的詞匯，經(jīng)統(tǒng)計共3823個，去除129個暫不予以考慮的詞匯（包括body-building等合成詞51個、AIDS等縮寫詞12個、table manners等短語66個），共得題庫目標詞3694個。

1詞匯難度影響因子

一般來說，一個詞匯的難度取決于它是否易于被學習者記憶或認出。對于將英語作為第二外語（ESL）的學習者來說，詞匯的難度受很多因素的影響，如詞頻、單詞的長度、語音與書寫的和諧程度、學習者心理特質、文化影響以及母語的負遷移等。這些因素可歸納為兩大類：詞內因素和詞外因素。由于本研究關注的僅僅是詞匯自身的一些特征對詞匯難度產(chǎn)生的作用，而詞外因素具有難把握性、個體差異性和不可操作性，故本研究將重點放在了影響詞匯難度的客觀詞內因素上。本研究試圖通過文獻查閱的方式，抽取出對詞匯難度影響較大的因子，從而為量化英語詞匯難度奠定理論基礎。

詞匯難度一直是語言學研究者們關注的重點。研究表明，對于ESL學習者來說，難詞在很大程度上是指詞形上難的詞，即容易造成拼寫錯誤的詞[5]。而引起拼寫困難的主要原因，是字母或字母組合與其發(fā)音間的不一致、誤讀以及單詞過長[6]。呂文澎[7]針對我國英語學習者的特征，指出一些固有的長詞以及那些至少包含一個不發(fā)音字母的單詞都可被視為難詞。Carroll[8]早在2000年就通過音素監(jiān)察法，驗證了詞頻對于詞匯掌握和理解的重要作用。此外，李永康[9]在對詞匯難度因素的分級研究中指出，詞匯的難易可以用詞匯頻率、雙語語義共享、上下文限制、語音/書寫特征和諧等四種因素來表征。縱觀國內外學者的觀點，同時考慮到最終的詞匯難度值需要依據(jù)各個影響因子進行具體量化，故本研究最終提取出最具代表性且同時具有可操作性的三大影響因子：詞頻、單詞的長度、語音與書寫的和諧程度。

（1）詞頻

詞頻可以被看作是詞匯難度的統(tǒng)計學特征，即在一定數(shù)量的真實語料中詞匯重復出現(xiàn)的次數(shù)。它決定了詞匯的常用程度和學習者對詞匯的熟悉程度，因此是量化詞匯難度的重要影響因子。一般來說，單詞的使用頻率越高，對學習者來說就越常見，在記憶時的難度就會減??；相反，單詞的使用頻率越低，學習者對它的熟悉程度就會越低，在記憶時的難度就會增加。早在20世紀40年代中期，桑代克等語言學家就開始評估詞頻和詞匯難度之間的關系，在計算機技術成熟之前經(jīng)過人工分析，他們于1944年首次提供了大規(guī)模的詞匯頻次表。自那時起，許多詞匯表都是基于單詞的詞頻來設計的，用來指導第二語言詞匯及課程的編纂。目前，以大規(guī)模語料庫為基礎的詞頻表已如雨后春筍般出現(xiàn)，并且借助于人工智能技術日漸繁榮。如西方的American Heritage Word Frequency Book、COBUILD Wordlist等詞頻表在國外應用十分廣泛，國內的《新世紀大學英語四、六級詞典》也同樣基于詞頻編纂；我國臺灣地區(qū)著名的General English Proficiency Test（GEPT）共分為初級、中級、中高級、高級、優(yōu)級等五級測驗，且每一級測驗都規(guī)定了詞匯考察范圍，而這五個等級的詞匯劃分也參考了詞匯的使用頻率。由此可見，詞頻對詞匯難度的影響不容忽視。

（2）單詞的長度

單詞的長度是單詞的主要內部特征之一，對單詞的認知與記憶影響很大——認知與拼寫單詞時，單詞越長，初學者越容易犯錯誤，母語為非拼音文字者尤其如此。量化英語詞匯的長度可從組成詞匯的字母的個數(shù)、音節(jié)的數(shù)量、詞素的數(shù)量等三個角度進行，其中字母個數(shù)產(chǎn)生的影響較大[10]?；诖?，本研究選用單詞中所含字母的個數(shù)來表征單詞的長度。一般而言，單詞越長，音節(jié)的結構和拼寫變化就越多、越復雜，學習者的記憶負擔就會相應加重，出錯的可能性也較大，出錯的次數(shù)也會增多——這也就是我們通常所說的“詞長效應”。如果將詞長與其它影響詞匯難度的因素妥當分離，那么詞長效應將會更加明顯。

（3）語音與書寫的和諧程度

語音與書寫的和諧程度是指單詞的發(fā)音與拼寫之間的一致程度，而單詞發(fā)音的正確程度與學習者對單詞的理解、記憶和表述直接相關。呂文澎[7]在對詞匯難度進行研究時指出，至少包含一個不發(fā)音字母、易引起吞音現(xiàn)象是難詞的重要特征，這樣的單詞語音與書寫的和諧程度較低。如單詞“accident”和“straight”，兩者均含8個字母，前者讀作/'?ks?d?nt/，后者讀作/stre?t/，而“straight”中的“gh”是不發(fā)音的，這對于利用發(fā)音記憶單詞的學習者來說無疑增加了難度。相對而言，語音與書寫和諧程度較高的“accident”更容易記憶。

2詞匯難度判定公式

本研究確定了影響詞匯難度的三大因子為詞頻、詞匯長度、語音與書寫的和諧程度，就可借助數(shù)學的方法來定義詞匯難度判定公式（見公式1），進而可定量計算出每一個詞匯的難度值。

其中，b是詞匯難度值，F(xiàn)是詞頻參數(shù)，L是詞匯的長度參數(shù)，H是詞匯的語音書寫和諧程度參數(shù)；W1、W2、W3分別是這三個參數(shù)的權重，其計算運用了層次分析法——這種用于決策的新方法由美國運籌學家Saaty提出[11]，該方法在處理復雜決策問題時所具有的優(yōu)越性使得它的應用遍及教育、管理等眾多領域。本研究邀請了20位從事英語教學和研究的專家參與其中，他們根據(jù)自身的專業(yè)知識和經(jīng)驗，按照這三大影響因子兩兩之間的相對重要程度，并依循1—9標度法在權重評議表上打分。研究者對評議表回收、審核后進行匯總，計算出三大影響因子中某一因子相對于其它因子的相對重要性權重值，得出詞頻、長度、語音書寫和諧程度這三個因子的權重分別為0.44、0.30、0.26。為確保最終權重結果的可靠性，還需進行一致性檢驗，求得隨機一致性比例CR=CI/RI=0.093<0.1（CI代表判斷矩陣一致性指標，RI代表隨機一致性指標），說明權重結果可靠且合理有效。因此，本研究得出的詞匯難度判定公式見公式2：

3 各因子參數(shù)的計算方法

（1）英語詞匯詞頻參數(shù)F的計算

本研究中詞頻參數(shù)的計算與英國國家語料庫（BNC）常用15000詞詞頻排序表（以下簡稱詞頻表）中相應單詞的詞頻密切相關。BNC由牛津大學出版社、大英圖書館等合作開發(fā)建立，是迄今為止最具代表性的現(xiàn)代語料庫之一。BNC取樣的文章類型十分廣泛，對文本的來源、語言的難易層次均有明確的規(guī)定與比例限制，其詞頻排序頗具代表性和科學性。詞頻表按照單詞的使用頻率高低對單詞進行排序，它所收錄的每一個單詞都有一個詞頻序號，使用頻率最高的單詞詞頻序號為1；隨著使用頻率的降低，單詞的詞頻序號不斷增大。

如前文所述，本研究的題庫目標詞有3694個，然而在詞頻表中檢索后發(fā)現(xiàn)gruel等328個單詞并沒有收錄在詞頻表中，故應去除這328個詞，而將剩余的3366個單詞作為最終的題庫目標詞。為了計算詞頻參數(shù)，需要在詞頻表中檢索所有目標詞的詞頻序號。根據(jù)詞頻序號的查詢結果，將詞頻序號最小的單詞的詞頻參數(shù)定義為0，將詞頻序號處于中間水平的單詞的詞頻參數(shù)定義為50，而將詞頻序號最大的單詞的詞頻參數(shù)定義為100。然后按照一定的映射關系，就可計算出所有單詞的詞頻參數(shù)，具體的計算公式見公式3：

其中，F(xiàn)是詞頻參數(shù)，VF是詞頻序號，VFmin代表目標詞中詞頻序號最小的值，VFmid是指目標詞中處于中間水平的詞頻序號值，VFmax是指目標詞中詞頻序號最大的值。

（2）英語詞匯長度參數(shù)L的計算

在進行長度參數(shù)計算之前，首先要做的準備工作是將目標詞的長度分別統(tǒng)計出來。定義長度參數(shù)的方法與之前定義詞頻參數(shù)的方法類似，即將所含字母個數(shù)最少的單詞的長度參數(shù)定義為0，將所含字母個數(shù)處于中間水平的單詞的長度參數(shù)定義為50，將所含字母個數(shù)最多的單詞的長度參數(shù)定義為100。同樣經(jīng)過一定的轉換，每一個目標詞的長度參數(shù)就可通過公式4得到：

其中，L是詞匯的長度參數(shù)，VL是單詞所含的字母個數(shù)，VLmin、VLmid、VLmax分別代表目標詞中最短、長度居中、最長的單詞所包含的字母個數(shù)。

（3）英語詞匯語音書寫和諧程度參數(shù)H的計算

語音書寫和諧程度參數(shù)可顯示一個單詞讀音與形態(tài)的一致性程度，這里用H來表示。為了計算H的值，需首先定義一個單詞的長度與該單詞音標長度的比，表達式見公式5：

其中，PR是單詞的字母個數(shù)與音標個數(shù)的比，VL是單詞包含的字母個數(shù)，PN代表單詞包含的音標個數(shù)。根據(jù)PR的定義，可以計算出所有目標詞的PR值。顯然，當PR=1時，該單詞讀音與形態(tài)的一致性程度最高；不論是PR>1還是PR<1，都表明該單詞的字母與音標不能一一對應，這樣勢必會造成拼寫困難。在所有目標詞中將PR值與1差值的絕對值最小的單詞H值定義為0，差值的絕對值處于中間水平的單詞H值定義為50，差值的絕對值最大的單詞H值定義為100，每一個目標詞的語音書寫和諧程度參數(shù)就可通過公式6計算得出：

其中，H是單詞的語音書寫和諧程度參數(shù)，PR是單詞的字母個數(shù)與音標符號個數(shù)的比，|PR-1|代表PR與1差值的絕對值，|PR-1|min、|PR-1|mid、|PR-1|max分別是所有目標詞中PR與1差值的絕對值的最小值、中間值、最大值。

需要說明的一點是，由于各因子參數(shù)的定義范圍均為[0,100]，因此按照難度判定公式直接計算出的詞匯難度取值范圍同樣是[0,100]。而在IRT中，一般情況下詞匯難度取值范圍是[-3,3]，所以為了獲得相應范圍的難度值，就需做進一步轉換，即將詞匯難度從[0,100]映射到[-3,3]的范圍中。具體的轉換方式見公式7：

其中，b’是指取值范圍在[-3,3]上的詞匯難度，即最終難度值；b是指利用難度公式直接計算出來的詞匯難度，即初始難度值；bmin、bmax分別是指初始難度值的最小值、最大值。

四　詞匯難度值計算過程舉例

前文已經(jīng)定義了詞匯難度的判定公式以及各因子參數(shù)的計算方法，下文將通過舉例使計算過程更加清晰明了——以單詞climb/kla?m/為例，來說明其詞頻參數(shù)F、長度參數(shù)L、語音書寫和諧程度參數(shù)H、初始難度值b以及最終難度值b’的計算過程。

1詞頻參數(shù)的計算

通過對本研究中3366個高中英語詞匯在詞頻表中的詞頻信息進行統(tǒng)計后可知：VFmin=1，VFmid=3000，VFmax=14958。單詞climb的詞頻序號VF=3882>VFmid，那么它的詞頻參數(shù)F的計算過程如下：

2長度參數(shù)的計算

通過對目標詞的長度信息進行統(tǒng)計后可知：VLmin=1，VLmid=8，VLmax=15。單詞climb的長度VL=5

3語音書寫和諧程度參數(shù)的計算

4初始難度值的計算

計算出單詞climb的詞頻參數(shù)F、長度參數(shù)L、語音書寫和諧程度參數(shù)H后，就可以根據(jù)詞匯難度判定公式來計算climb的初始難度值b：

5最終難度值的計算

對climb的初始難度值b進行一定轉換后，就可以獲得難度范圍在[-3,3]間的最終難度值b’。統(tǒng)計完所有目標詞的初始難度值后可知：初始難度值的最小值為bmin=0.029343114、最大值為bmax=78.23107603，那么最終難度值b’的計算過程如下：

根據(jù)以上詞匯難度計算公式和計算過程，就可得出本研究所涉及的3366個詞匯的詞頻參數(shù)、長度參數(shù)、語音書寫和諧程度參數(shù)以及每個詞匯的難度值。將詞匯難度取值范圍[-3,3]平均劃分為12個子區(qū)間，分別統(tǒng)計在各個難度子區(qū)間上目標詞出現(xiàn)的頻次，結果如圖1所示。從圖1可以看出，詞匯難度頻次近似呈現(xiàn)正態(tài)分布，這就驗證了本研究提出的詞匯難度計算方法的科學性。

圖1　詞匯難度頻次分布

基于IRT的CAT系統(tǒng)為英語詞匯測試注入了新鮮血液，其優(yōu)勢突出。系統(tǒng)的科學性、高效性是CAT得以大規(guī)模推廣的前提之一，而在英語詞匯CAT系統(tǒng)中，對系統(tǒng)科學性起決定作用的正是詞匯難度值。本研究結合文獻梳理結果及我國英語詞匯的教學實際，提出了從詞頻、長度、語音書寫和諧程度這三個維度來量化英語詞匯難度的具體方法，其量化過程不涉及繁雜的數(shù)學運算，具有實用價值。

參考文獻

[1]段士平.二語詞匯能力及其測試[J].解放軍外國語學院學報,2009,(2):51-54.

[2]趙傳海,吳敏,葉艷.基于IRT的大學英語詞匯在線自適應測試系統(tǒng)的設計[J].現(xiàn)代教育技術,2008,(12):87-90.

[3]Chen C M,Chung C J.Personalized mobile English vocabulary learning system based on item response theory and learning memory cycle[J].Computers & Education,2008,(2):624-645.

[4]陸宏,趙艷萍.高中英語詞匯自適應學習系統(tǒng)的研制[J].現(xiàn)代教育技術,2014,(11):47-52.

[5]Nation I S P.Beginning to learn foreign language vocabulary: A review of the research[J].RELC Journal,1982,(1):14-36.

[6]侯寧海.?？家谆煊⒄Z疑難對詞手冊[M].南京:河海大學出版社,1994:15-17.

[7]呂文澎.英語難詞記憶法:調查與分析[J].外語教學,2001,(3):75-80.

[8]Carroll D W.Psychology of language[M].Beijing: The Foreign Language Teaching and Research Press,2000:34-36.

[9]李永康.第二語言詞匯難度定義的整合研究[J].安徽工業(yè)大學學報(社會科學版),2003,(5):122-123.

[10]陳士法,彭建武,楊洪娟,等.英漢心理詞典中英語單詞存儲的詞長效應研究[J].外語教學,2011,(5):45-51.

[11]郭金玉,張忠彬,孫慶云.層次分析法的研究與應用[J].中國安全科學學報,2008,(5):148-153.

編輯：小米

Assessing Lexical Difficulty in English Vocabulary Adaptive Testing System

HU Yi-pingGAO Jia-jiaLU Hong[Corresponding Author]
(School of Communication,Shandong Normal University,Jinan,Shandong,China 250014)

Abstract:Focusing on realistic demand how to quantify lexical difficulty in English vocabulary adaptive testing system,the paper put forward a new approach to assess lexical difficulty in terms of word frequency,word length as well as harmony degree of phonetic and orthographic features and displayed the quantization process of high school English vocabularies.According to the statistically analysis of the vocabulary frequency at each difficulty subinterval,the result shown a normal distribution.

Keywords:English vocabulary; adaptive testing; lexical difficulty; item response theory

收稿日期：2015年9月29日

作者簡介：胡一平，在讀碩士，研究方向為計算機教育應用，郵箱為hypfamily@163.com。

*基金項目：本文為2013年山東省高等學?？萍加媱濏椖俊盎陧椖糠磻碚摰挠⒄Z詞匯自適應學習系統(tǒng)的研制”（課題編號：J13LN12）的階段性研究成果。

【中圖分類號】G40-057

【文獻標識碼】A 【論文編號】1009—8097（2016）03—0100—07 【DOI】10.3969/j.issn.1009-8097.2016.03.015

英語詞匯自適應測試系統(tǒng)中詞匯難度的判定*

一 問題提出的背景

二 相關研究綜述

三 詞匯難度的判定

四 詞匯難度值計算過程舉例

一　問題提出的背景

二　相關研究綜述

三　詞匯難度的判定

四　詞匯難度值計算過程舉例