尹本雄
專用自動閱卷系統(tǒng)已經(jīng)普及使用多年,但由于專用設(shè)備具有價格較高、不便攜帶等缺點(diǎn),一般多用在較大型的規(guī)范化考試中。近年來,隨著智能手機(jī)的廣泛普及,利用智能手機(jī)構(gòu)建低成本的自動閱卷系統(tǒng)也隨之發(fā)展起來,這類自動閱卷系統(tǒng)能夠有效地幫助廣大中小學(xué)教師快速地完成繁重的閱卷工作。同時,后臺管理數(shù)據(jù)庫還支持平均分統(tǒng)計、優(yōu)秀率及格率統(tǒng)計、最高分最低分統(tǒng)計、排序、個人成績單生成、對指定學(xué)生進(jìn)行某時間段內(nèi)成績追蹤分析等功能。
● 當(dāng)前自動閱卷系統(tǒng)的分析
當(dāng)前常見的自動閱卷系統(tǒng)根據(jù)答題卡讀取方式的不同,一般有攝像頭閱卷系統(tǒng)、掃描儀閱卷系統(tǒng)、數(shù)碼相機(jī)閱卷系統(tǒng)及光電閱卷系統(tǒng)。由于攝像頭的普及性、便攜性及低成本特性,在這幾類閱卷系統(tǒng)中,攝像頭閱卷系統(tǒng)無疑具有很大的優(yōu)勢。
1.客觀題自動閱卷系統(tǒng)的分析
在客觀題自動閱卷系統(tǒng)里,出現(xiàn)過一些較為智能的系統(tǒng)。例如,西南交通大學(xué)研究的閱卷系統(tǒng),通過模式識別等方法,可以允許考生對選擇題用“A、B、C、D”作答。但該系統(tǒng)的識別準(zhǔn)確率沒有填涂方式的識別率高,特別是對以下兩種情況的識別準(zhǔn)確率較低:一是考生書寫比較潦草的答案;二是擦除重新修改過的答案。
2.主觀題自動閱卷系統(tǒng)的分析
對答題卡評價的準(zhǔn)確性是閱卷系統(tǒng)最關(guān)鍵的參數(shù)。目前的自動閱卷系統(tǒng)多是針對客觀題的評閱,雖然有一些主觀題自動閱卷系統(tǒng)出現(xiàn),但這些系統(tǒng)在準(zhǔn)確性方面還達(dá)不到使用要求。例如,主觀題自動閱卷的系統(tǒng)評價長句優(yōu)于短句、無法判斷事物的真?zhèn)涡缘?。如果考生事先?jīng)過針對該閱卷系統(tǒng)的適應(yīng)性培訓(xùn),“投其所好”,則比較容易“欺騙”閱卷系統(tǒng),取得高分。因而,該系統(tǒng)只能在一定層面對文章的語義進(jìn)行歸納,而不能用于主觀題閱卷。它更適合用在類似于搜索引擎中的語義搜索,可以提高對檢索關(guān)鍵字的檢全率和檢準(zhǔn)率。
● 智能手機(jī)攝像頭自動閱卷系統(tǒng)的研究
1.答題卡的圖像處理
基于智能手機(jī)攝像頭的自動閱卷系統(tǒng)構(gòu)成如圖1所示。
對于該系統(tǒng)而言,閱卷程序中答題卡圖像的預(yù)處理最關(guān)鍵,直接影響到最終的閱卷準(zhǔn)確率。其包括如下幾個步驟。
(1)灰度化處理與二值化處理
為了節(jié)省手機(jī)CPU的運(yùn)算資源,我們首先應(yīng)對攝像頭采集到的彩色圖像進(jìn)行灰度化處理,即去掉顏色特征。原始圖像中各像素點(diǎn)可以分解為RGB顏色分量,通過亮度計算公式B=0.299Red+0.587Green+0.114Blue計算像素點(diǎn)的亮度值,再用亮度值B代替RGB的顏色分量值并寫回到圖像中,即可完成彩色圖像到灰度圖像的變換。
二值化處理是將上一步得到的灰度圖變換為只有黑、白兩種顏色的模式圖像。處理的方法是,設(shè)定一個灰度閾值,大于閾值的像素用白色點(diǎn)顯示,小于閾值的像素用黑色點(diǎn)顯示。對于這個閾值,一般的做法是選擇最大灰度等級的一半,即128。但我們在實際測試中發(fā)現(xiàn),如果采用固定閾值128的做法,效果不理想。為此,本系統(tǒng)中采用局部平均閾值方法,具有自適應(yīng)特性,雖然消耗較多的計算資源,但是對于改善不同答題卡二值化的效果有較好的作用。
(2)光照引起的噪聲點(diǎn)處理
由于每次拍攝時環(huán)境光強(qiáng)差異較大,如果我們在一些環(huán)境光強(qiáng)不夠的條件下拍攝,得到的圖像會有較多的噪聲點(diǎn)。為了減少圖像的噪聲點(diǎn),可以對圖像進(jìn)行平滑濾波處理。常見的處理方法有領(lǐng)域平均法、選擇平均法、低通濾波法等。為了防止領(lǐng)域平均法對目標(biāo)邊緣造成模糊影響,這里采用了選擇平均法,僅對灰度值相近的像素點(diǎn)進(jìn)行加權(quán)平均處理。
(3)圖像定位與傾斜校正
為了簡化算法和提高閱卷準(zhǔn)確性,答題卡設(shè)計有固定的分隔符與對齊符(如圖2)。由于拍攝角度和距離的原因,得到的圖像一般都會有一定程度的傾斜和旋轉(zhuǎn)。通過答題卡上設(shè)置的分隔符和對齊符,進(jìn)行圖像定位于傾斜校正。
(4)歸一化處理
歸一化處理是指對每一幅圖像在進(jìn)行判別之前,先進(jìn)行圖像統(tǒng)一大小的縮放處理。根據(jù)所得到的圖像大小的邊界尺寸,計算出一個縮放因子,進(jìn)行縮放處理。
(5)答案的差分處理
對答題卡每一題答案的匹配,即是判斷答案正確與否的過程??梢圆扇〔罘痔幚淼姆椒ǎ瑢⒋痤}卡答案位置的像素與答案模板的相應(yīng)位置像素進(jìn)行相減運(yùn)算,相減的差值大小體現(xiàn)了答題卡答案和參考答案的相近程度。具體可以采用以下公式計算:
式中是答題卡像素點(diǎn)分量值,是參考答案模板像素點(diǎn)分量值。每一個答案的匹配度S是一個介于0~1的數(shù),越接近1則表示考生答案越趨近于參考答案。設(shè)置一個匹配閾值,匹配度大于閾值的為正確,反之為錯誤。因每個考生的填涂習(xí)慣不一樣,閾值的設(shè)置可以針對每一份答題卡自動動態(tài)分析。例如,以科目和準(zhǔn)考證號的填涂位置為參考來確定該份答題卡的匹配閾值,因為這兩個地方一般不會填錯。
2.后臺成績管理軟件的設(shè)計
為了更好地管理考生的成績,應(yīng)提高自動閱卷系統(tǒng)的效用。這樣在中小學(xué)里便于教師了解各學(xué)生的學(xué)習(xí)進(jìn)步情況,也方便了期末成績單的打印。如果能在PC端利用數(shù)據(jù)庫管理方便地開發(fā)出各種統(tǒng)計分析功能就更好了。