李東升
摘要:基于神經(jīng)網(wǎng)路方法實(shí)現(xiàn)高考英語(yǔ)口語(yǔ)成績(jī)的采集,實(shí)現(xiàn)口語(yǔ)成績(jī)等級(jí)手寫體的識(shí)別,提高在英語(yǔ)口語(yǔ)成績(jī)處理的效率,實(shí)現(xiàn)口語(yǔ)成績(jī)的自動(dòng)采集。目前該方案應(yīng)用于蘇州市高考英語(yǔ)口語(yǔ)成績(jī)采集。
關(guān)鍵詞:成績(jī)采集;模式識(shí)別;神經(jīng)網(wǎng)絡(luò);特征提取
中圖分類號(hào):G80 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2017)03-0069-01
對(duì)于未實(shí)行高考口語(yǔ)人機(jī)對(duì)話的省市,高考口語(yǔ)還是采用打分模式。然后人工采集,為解決這一問(wèn)題,通過(guò)識(shí)別手寫評(píng)分和OCR識(shí)別結(jié)果比對(duì)確保成績(jī)采集的準(zhǔn)確。而神經(jīng)網(wǎng)絡(luò)很適合用于解決字符識(shí)別問(wèn)題。
1 BP神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是在人類對(duì)其大腦神經(jīng)網(wǎng)絡(luò)認(rèn)識(shí)理解的基礎(chǔ)上人工構(gòu)造的能實(shí)現(xiàn)某種功能的神經(jīng)網(wǎng)絡(luò),是一種典型的前饋神經(jīng)網(wǎng)絡(luò),包含輸入層、隱層及輸出層。
BP網(wǎng)絡(luò)是典型的多層網(wǎng)絡(luò),分輸入層、隱含層和輸出層,算法由數(shù)據(jù)流的前向計(jì)算和誤差信號(hào)的反向傳播兩個(gè)過(guò)程構(gòu)成。通過(guò)這兩個(gè)過(guò)程的交替進(jìn)行,在權(quán)向量空間執(zhí)行誤差函數(shù)梯度下降策略,動(dòng)態(tài)迭代搜索一組權(quán)向量,使網(wǎng)絡(luò)誤差函數(shù)達(dá)到最小值,從而完成信息提取和記憶過(guò)程[1]。
2 基于神經(jīng)網(wǎng)絡(luò)的英語(yǔ)口語(yǔ)成績(jī)采集的實(shí)現(xiàn)
為實(shí)現(xiàn)更好的采集,需要設(shè)計(jì)適應(yīng)識(shí)別的評(píng)分表,其中定位點(diǎn)、考生條碼用于定位到考生并采集成績(jī),等級(jí)手寫的分區(qū)需要通過(guò)神經(jīng)網(wǎng)絡(luò)識(shí)別等級(jí),OCR等級(jí)識(shí)別區(qū)用采集等級(jí)并通過(guò)神經(jīng)網(wǎng)絡(luò)采集的等級(jí)進(jìn)行比較。
2.1 采集過(guò)程
首先預(yù)處理圖像獲取樣本進(jìn)行訓(xùn)練,輸入神經(jīng)網(wǎng)絡(luò)訓(xùn)練后輸出看誤差并調(diào)整各階層的權(quán)值讓輸出同OCR值一致,正式識(shí)別兩種模式結(jié)果不一致需要人工干預(yù),有可能等級(jí)打錯(cuò)也有可能等級(jí)涂錯(cuò),然后修正結(jié)果,確保等級(jí)信息準(zhǔn)確無(wú)誤。
2.2 圖像預(yù)處理
原始評(píng)分表的輸入有可能產(chǎn)生污點(diǎn)等噪音。所以在識(shí)別之前必須對(duì)圖像進(jìn)行預(yù)處理。預(yù)處理一般包括圖像分割、灰度、二值化、平滑、去噪音、歸一化和細(xì)化等。不同識(shí)別方法對(duì)于處理要求不一樣預(yù)處理后離散和噪聲和歸一化和細(xì)化處理,將圖片形成一個(gè)40 ×40 像素點(diǎn)陣(圖1得分區(qū)圖像預(yù)處理后圖像)。
2.3 神經(jīng)網(wǎng)絡(luò)的特征提取
在手寫等級(jí)識(shí)別中,特征的選擇是非常關(guān)鍵問(wèn)題。將經(jīng)過(guò)預(yù)處理后的等級(jí)數(shù)字圖像中提取最能體現(xiàn)這個(gè)字符特點(diǎn)的特征向量,然后提取出訓(xùn)練樣本中的特征向量代入BP網(wǎng)絡(luò)之中就可以對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,提取出待識(shí)別的等級(jí)樣本中的特征向量代入訓(xùn)練好的BP網(wǎng)絡(luò)中,就可以對(duì)等級(jí)得分字符進(jìn)行識(shí)別。
2.3.1 英語(yǔ)口語(yǔ)成績(jī)采集中BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
將A、B、C、D等級(jí)圖像的特征向量作為神經(jīng)網(wǎng)路的輸入,確定輸入神經(jīng)元。經(jīng)過(guò)預(yù)處理的為40×40的矩陣,共1600各輸入神經(jīng)元。輸出較為簡(jiǎn)單,只要識(shí)別A、B、C、D4個(gè)等級(jí),輸出節(jié)點(diǎn)數(shù)為4。為加快神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速度,3層BP網(wǎng)絡(luò)最為恰當(dāng)效率高。同時(shí)根據(jù)網(wǎng)絡(luò)收斂性能的好壞來(lái)確定隱含層神經(jīng)元個(gè)數(shù)。根據(jù)經(jīng)驗(yàn)公式:
s=
其中,n為輸入層神經(jīng)元個(gè)數(shù),m為輸出層神經(jīng)元個(gè)數(shù)[2]。計(jì)算可得隱含層神經(jīng)元個(gè)數(shù)為79。
2.3.2 BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練
手寫字符歸一化和細(xì)化后的圖像為40 ×40 的布爾矩陣,1600個(gè)元素組成一個(gè)手寫字符的列矩陣,即字符的特征向量。由A、B、C、D這4個(gè)字符的特征列向量組成一個(gè)1600×4的輸入矢量,訓(xùn)練次數(shù)達(dá)到最大值神經(jīng)網(wǎng)絡(luò)訓(xùn)練就結(jié)束。
2.3.3 口語(yǔ)等級(jí)識(shí)別等分結(jié)果
字符識(shí)別的正確率和拒識(shí)率與字符識(shí)別的判斷值有關(guān),判斷值越高,識(shí)別的正確率就高。為確保成績(jī)錄取100%正確,通過(guò)識(shí)別和OCR識(shí)別比較,不同再通過(guò)人工識(shí)別錄入確保準(zhǔn)確(圖2成績(jī)自動(dòng)識(shí)別等分)。
神經(jīng)網(wǎng)絡(luò)在口語(yǔ)成績(jī)登分中的應(yīng)用過(guò)程中大大減輕勞動(dòng)強(qiáng)度,提高準(zhǔn)確率,通過(guò)多重比對(duì)確保成績(jī)錄入準(zhǔn)確,經(jīng)過(guò)實(shí)踐應(yīng)用和比對(duì)成績(jī)登分準(zhǔn)確率100%,完全可以滿足實(shí)際需要。
參考文獻(xiàn)
[1]蔣宗禮.人工神經(jīng)網(wǎng)絡(luò)導(dǎo)論.高等教育出版社出版,2001(5):26-88.
[2]杜選,高明峰.人工神經(jīng)網(wǎng)絡(luò)在數(shù)字識(shí)別中的應(yīng)用.計(jì)算機(jī)系統(tǒng)應(yīng)用,2007(2):21-22+27.