陸妙琴
計算機輔助PSC(以下簡稱“機測”)是PSC手段的革命與創(chuàng)新,從2007年在安徽、上海等地開展試點以來,迅速在全國各地推廣開來,其優(yōu)越性被越來越多的人所認同,是PSC進一步科學化、規(guī)范化的必然趨勢。機測作為一種全新的測試模式,不僅在測試手段、測試環(huán)境、測試程序、測試管理等方面體現(xiàn)出與人工測試不同的特點,而且在受測形式、評測形式上也發(fā)生了重大改變。在這種測試模式下,以前人工測試并不突出或未曾出現(xiàn)的一些情況相繼顯現(xiàn)出來,主要集中體現(xiàn)在“命題說話”上,如背稿、離題、內(nèi)容雷同,無效話語等。為此,國家語委普通話培訓測試中心在充分調(diào)研、收集、梳理、總結各地評分實踐成功經(jīng)驗的基礎上,研究制定了對全國各試點區(qū)機測具有普遍指導意義的《計算機輔助普通話水平測試評分試行辦法》(教語用司函[2009]5號)(以下簡稱《評分試行辦法》)。為幫助測試員準確理解和掌握《評分試行辦法》的評分標準,明確機測具體的實施操作規(guī)則,保證機測的質(zhì)量,盡快制定出各省機測的評分細則迫在眉睫。筆者曾參與陜西省機測評分細則的研討制定,本文想就此談點個人看法。
機測評分細則是對PSC評分標準體系的完善和發(fā)展,是對《評分試行辦法》的進一步闡釋和描述,是《評分試行辦法》的細化和補充,是《評分試行辦法》不可缺少的組成部分。機測評分細則是機測的內(nèi)在需要,它使得《評分試行辦法》的評分標準更易于理解和操作,是提高機測測試信度、保證機測測試質(zhì)量的基本要件,是PSC標準化、規(guī)范化的重要內(nèi)容,對《評分試行辦法》的實施具有輔助作用。
《評分試行辦法》是國家以部門規(guī)章形式在PSC領域發(fā)布的一個通用標準,是國家標準,機測評分細則是各地的地方標準。
《評分試行辦法》在機測中起著宏觀導向作用,具有原則性、概括性、框架性的特點。各地機測評分細則在機測中起著微觀指導作用,具有復雜性、差異性、針對性的特點。
《評分試行辦法》是對機測評分操作的總體闡述,各地機測評分細則是對機測評分標準的具體說明,兩者相輔相成。
二者的制定都以語言本體的標準——普通話的語音、詞匯和語法規(guī)范為依據(jù),將普通話理論與實踐研究的成果轉(zhuǎn)化為測試領域中可操作性的標準,是科學性和操作性的統(tǒng)一。
《普通話水平測試大綱》(以下簡稱“《大綱》”)是普通話水平測試的指導性文件,是普通話水平測試的基本依據(jù),也是PSC理論體系的基石?!对u分試行辦法》規(guī)定:“根據(jù)《普通話水平測試大綱》(教語用[2003]2號),結合計算機輔助普通話水平測試實際,制定試行辦法”。作為《評分試行辦法》闡釋的機測評分細則也必須以《大綱》為根本依據(jù),維護大綱的權威性?!安辉试S出現(xiàn)偏離《大綱》原則的評判標準,更不允許為了操作方便或尊重他人的主觀意愿而對《大綱》確定的原則進行隨意修改”。①
《評分試行辦法》是制定機測評分細則的藍本,在制定機測評分細則時,評分要素、評分視點、評分方式、評分標準必須與《評分試行辦法》保持一致,不能自作主張,另搞一套;也不能與《評分試行辦法》的原則相抵觸。如筆者看到有的省機測評分細則中有這樣的表述,“‘說話’項直接讀朗讀作品或稿件者,按考試作弊處理,成績記為零分”。這不只使評分要素比《評分試行辦法》多出來一個,且與國家《評分試行辦法》的標準不相吻合。
機測評分細則的制定不是閉門造車,不是幾個人的主觀臆想,必須從測試實踐中來,再到測試實踐中去。我省研討制定機測評分細則歷時近兩年,多次召集一線資深測試員和復審員,結合本省測試實際提出方案,反復研討,多次實踐,不斷驗證,根據(jù)反饋情況多次調(diào)整,最終制定出我省的機測評分細則(試行)。在機測評分細則制訂中切忌幾個人說了算,切忌把尚未得到公認的個人觀點寫進評分細則。
測試的量化評定較為清楚,易于把握,也便于操作,但單純使用量化評定是不科學的,難以測出應試人的實際語言水平。筆者看到的幾個省的機測評分細則,大都偏重于定量,有的評分要素中甚至忽略了定性評定,數(shù)量決定一切。筆者認為,一種科學的,成熟的語言測試,應該注意定性與定量的度的把握,把定性與定量結合起來,使定量避免定性時的隨意性,定性以定量為基礎,在定性與定量間找到平衡。如說話時語音錯誤次數(shù)為10次,扣7分還是8分(采用四項測試),就要在量化的基礎上進行定性分析,是音質(zhì)性的失誤還是超音質(zhì)性的失誤,錯誤的類型多還是少,程度輕還是重;然后結合錯誤量、錯誤性質(zhì)確定扣分的多少。
評分標準是粗略一些還是細致一些,這也是制定機測評分細則要處理好的一個問題。語言測試就是依據(jù)評分標準對應試者實際語言水平的“測量”。既然是測量,當然是越精確越好。從理論上來說,評分標準越是細致,測量越是準確。但是,從實際測試情形來看,評分標準太過細致、繁瑣,檢測點過多,會加重測試員負擔,使測試員“注意分配”的難度大大增加,難以操作;反之評分標準太過粗略,會給測試員理解、操作帶來困惑,影響測試的信度。筆者認為,應當在粗略和細致間找到一個平衡點,既能最大限度降低測量的誤差,又易于操作,做到寬嚴適度,精確與模糊的辯證統(tǒng)一。
制定評分細則的根本目的是增強評分標準的可操作性。各地在制定機測評分細則時應充分考慮評分標準的可操作性。機測評分細則的表述語言要盡可能準確、具體,避免理解上的困惑或歧義,對《評分試行辦法》中一些定性的分析應盡可能詳細地表述,統(tǒng)一測試員的認識,也便于測評操作;盡可能減少主觀評判幅度較大的一些評分要素,增加一些操作性較強的、較為剛性的評分要素,使主觀評分客觀化,以保證測試質(zhì)量。
如陜西省在制定機測評分細則時,對《評分試行辦法》以下概念作了明確解釋(一些解釋也是語言學界公認的學術成果):
(1)方音程度
“方音程度包含音質(zhì)性失誤和超音質(zhì)性失誤兩個方面。音質(zhì)性失誤是指聲韻缺陷、錯誤的類型的多少、程度的輕重。超音質(zhì)性失誤是指輕聲、音的變調(diào)、字調(diào)、輕重音格式、語調(diào)等失誤類型的多少和程度的輕重”。
(2)詞匯、語法不規(guī)范
“詞匯、語法不規(guī)范指存在典型的方言詞匯(含語氣詞)、語法以及錯誤詞匯、語法兩種情況”。
(3)語言不連貫,語調(diào)生硬
“指停連、節(jié)律、重音、輕聲有偏差,相對音高不一致,語句重復、冗余”。
(4)缺時
“缺時有兩種情況:一是說話最終時間不夠3分鐘;二是3分鐘說話過程中時斷時續(xù),每次中斷6秒以上即可累計”。
(5)離題
“是指應試人所說內(nèi)容不符合規(guī)定的話題”。
(6)雷同
“包括:變相使用《普通話水平測試綱要》中的60篇朗讀短文;使用報刊、書籍、網(wǎng)絡等現(xiàn)成文章;多人使用同一篇文章;讀稿;同一應試人所說內(nèi)容前后相同”。
(7)無效話語
“指應試人的話語與要測查的語言特征無關,無評判效度。如語句不斷重復、反復糾錯、讀秒、唱歌、念詩、數(shù)數(shù)字等,可視之為缺時”。
(1)“命題說話”語音標準程度
這一測試要素中出現(xiàn)的“方音不明顯”、“方音比較明顯”、“方音明顯”、“方音重”等定性的描述,正是測試員評判時容易困惑,產(chǎn)生理解上的分歧,導致評分差異的地方。我們從音質(zhì)性失誤和超音質(zhì)性失誤、錯誤數(shù)量、失誤類型的多少、程度的輕重等多方面對其作了細致說明,力求使測試員評定時能夠有較為明確的依據(jù)。如對語音標準程度二檔的評定,我們作了如下說明,“語音錯誤在10次以下,有1類不明顯語音缺陷,扣3分;語音錯誤在10次以下,有2類以上不明顯語音缺陷,扣4分”。
(2)詞匯語法規(guī)范程度
首先我們明確地指出了詞匯語法不規(guī)范的含義(如前所述);其次對其如何歸檔,又從量的角度給予說明,“方言性質(zhì)的失誤每出現(xiàn)一次扣0.5分”。
《評分試行辦法》其他定性部分的處理采用了與以上各項類似的方法。
(1)說話缺時扣分
《評分試行辦法》中這樣表述:“說話不足3分鐘,酌情扣分:缺時1分鐘以內(nèi)(含1分鐘),扣1分、2分、3分;缺時1分鐘以上,扣4分、5分、6分;說話不滿30秒(含30秒),本測試項成績計為0分”。我們在陜西省機測細則中細化為“缺時6至20秒,扣1分;缺時20至40秒,扣2分;缺時40至60秒,扣3分;缺時1分01秒至1分29秒,扣4分;缺時1分30秒至1分59秒,扣5分;缺時2分至2分29秒,扣6分;缺時2分30秒至3分鐘之間,此項成績?yōu)?分。缺時6秒開始扣分”。
(2)離題、內(nèi)容雷同
《評分試行辦法》中這樣表述:“離題、內(nèi)容雷同,視程序扣4分、5分、6分”。我們細化為“基本離題或離題,扣5分、6分;部分離題,扣4分;離題20秒以上即可扣分”。
(3)無效話語
《評分試行辦法》中這樣表述:“無效話語,累計占時酌情扣分:累計占時1分鐘以內(nèi)(含1分鐘),扣1分、2分、3分;累計占時1分鐘以上,扣4分、5分、6分;有效話語不滿30秒(含30秒),本測試項成績計為0”。對此我們也作了細化,具體標準與缺時項大體一致。
評分是影響測試信度的關鍵因素,評分細則是保證測試質(zhì)量的基本要件。制定機測評分細則是一項嚴謹而又復雜的工作,要求我們在吃透《大綱》精神,準確理解把握《評分試行辦法》的基礎上,根據(jù)測試實踐,運用語言學、語音學、方言學、語言測試理論等知識,依據(jù)測試手段、測試方式、測試對象的特點,進行明確具體的論述,制定出既標準、規(guī)范,又便于操作的機測評分細則,使機測評分達到我們所期望的科學性、操作性和公平性。
注釋:
①屠國平.制定“PSC 評分細則”的原則與方法[A].國家語委測試中心.首屆全國普通話水平測試學術研討會論文集[C].北京:語文出版社,2003.
[1]姚喜雙,韓玉華,聶丹,黃霆瑋,孟暉.普通話水平測試概論[M].北京:高等教育出版社,2011.
[2]教育部,國家語委.普通話水平測試大綱[Z].教語用[2003]2 號文件.
[3]教語用司.計算機輔助普通話水平測試評分試行辦法[Z].教語用司函[2009]5 號.
[4]王暉.普通話水平評分細則論析[J].語言文字應用,2007,(4).
[5]廣東、廣西、河北、山東、江蘇、陜西?。ㄗ灾螀^(qū))機測《評分細則》[Z].