郭晨潔 石蘊(yùn)玉 黃澤鈺 徐錦浩
摘要:隨著國家素質(zhì)教育的改革,上海市開展了寫字等級(jí)考試,有助于檢測(cè)學(xué)生的書寫水平。隨著參與考試的中小學(xué)生人數(shù)逐漸增多,為更好地解決人力資源消耗較大,花費(fèi)時(shí)間較長等一系列問題,設(shè)計(jì)和開發(fā)了寫字等級(jí)考試自動(dòng)評(píng)閱軟件。該軟件基于python環(huán)境開發(fā),并運(yùn)用了TensorFlow等技術(shù),用戶可進(jìn)行注冊(cè)或登錄個(gè)人信息,上傳試卷圖片,軟件自動(dòng)進(jìn)行評(píng)閱并打分,隨后產(chǎn)生分?jǐn)?shù)記錄和建議,可以方便教師對(duì)寫字考試的閱卷工作,也可用于學(xué)生對(duì)寫字水平的自測(cè)。
關(guān)鍵詞:OCR;自動(dòng)閱卷;成績查詢;MySQL;TensorFlow;pyqt5
中圖分類號(hào):TP311? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)10-0081-02
1 引言
當(dāng)今社會(huì),越來越注重學(xué)生素質(zhì)能力的培養(yǎng),國家也對(duì)此投入改革,對(duì)九年義務(wù)教育的中小學(xué)生的書寫能力有了新要求,上海市規(guī)定義務(wù)教育階段在籍的五年級(jí)和九年級(jí)學(xué)生(不含民辦隨遷子女小學(xué)、珠峰中學(xué)、成佳學(xué)校)均需參加寫字等級(jí)考試。該考試性質(zhì)為學(xué)業(yè)水平考試,成績將計(jì)入《上海市學(xué)生成長記錄冊(cè)》,非常重要。隨著參與學(xué)生的人數(shù)增多,考試越來越受學(xué)生家長的重視,對(duì)于教師評(píng)閱打分的要求逐步攀升,但閱卷的工作效率并不夠高效,人力花費(fèi)較大,教師工作壓力大導(dǎo)致易出現(xiàn)評(píng)閱錯(cuò)誤等各類問題也隨之出現(xiàn)。導(dǎo)致出現(xiàn)問題的原因在于評(píng)閱過程的相對(duì)煩瑣和對(duì)高效的要求提升。因此,如果把整個(gè)過程信息化、流程化、規(guī)范化地轉(zhuǎn)移到計(jì)算機(jī)軟件上,適應(yīng)互聯(lián)網(wǎng)時(shí)代的潮流趨勢(shì),使用軟件進(jìn)行自動(dòng)評(píng)閱以此輔助教師閱卷,將會(huì)大大提高評(píng)分閱卷的工作效率,節(jié)省不少人力和時(shí)間。
2 軟件分析
通過需求調(diào)研與分析,對(duì)軟件的實(shí)際需求有更進(jìn)一步的了解,可以得出軟件實(shí)際使用的用戶角色主要為教師與學(xué)生,軟件所需要的主要為用戶管理、作品圖片評(píng)閱打分、錯(cuò)誤指導(dǎo)以及成績查詢四個(gè)功能。
3 軟件設(shè)計(jì)
3.1 軟件功能分析及設(shè)計(jì)原則
根據(jù)調(diào)研階段對(duì)軟件的分析,可初步確定軟件的功能設(shè)計(jì)。再進(jìn)一步結(jié)合自己的設(shè)計(jì)原則,即可明確軟件的重點(diǎn)研發(fā)方向與主要設(shè)計(jì)目標(biāo),分析與設(shè)計(jì)原則在此一一說明。
3.1.1 評(píng)分模型正確率足夠高
只有單個(gè)文字圖片的評(píng)分正確率足夠高,才可以保障軟件最后的評(píng)分效果。因此使用TensorFlow2.0訓(xùn)練評(píng)分模型,另一方面,搜集了考試范圍內(nèi)所有可能出現(xiàn)文字的標(biāo)準(zhǔn)范例圖片作為數(shù)據(jù)集中的訓(xùn)練集部分。
3.1.2 錯(cuò)誤指導(dǎo)報(bào)表清晰明確
為了錯(cuò)誤顯示足夠清晰明確,采用EXCEL表格的形式進(jìn)行可視化展示。
3.1.3 成績的快速精確查詢
用戶的歷史成績均存儲(chǔ)在軟件內(nèi)部的數(shù)據(jù)庫中,成績的查詢即是對(duì)數(shù)據(jù)庫的查詢[2]。查詢快速精確的關(guān)鍵在于數(shù)據(jù)庫索引的創(chuàng)建,創(chuàng)建高效的索引是數(shù)據(jù)庫的設(shè)計(jì)原則。
3.2 軟件架構(gòu)設(shè)計(jì)
軟件架構(gòu)[3]分為數(shù)據(jù)讀取、數(shù)據(jù)處理以及數(shù)據(jù)顯示三個(gè)層面。數(shù)據(jù)讀取:用戶登錄賬號(hào)后上傳作品圖片到一個(gè)由軟件指定的文件夾暫存。數(shù)據(jù)處理:對(duì)文件夾中暫存的圖片使用OCR識(shí)別[4]進(jìn)行提取文字,導(dǎo)出到指定文本文檔里,作為第一道檢測(cè)并打分。實(shí)現(xiàn)對(duì)圖片的處理及分割,并將分割后的圖片導(dǎo)入到指定文件夾。收集標(biāo)準(zhǔn)樣本并整合出一個(gè)數(shù)據(jù)集,用機(jī)器學(xué)習(xí)[5]的方式從義務(wù)教育課本搜集數(shù)據(jù)集作為標(biāo)準(zhǔn)進(jìn)行訓(xùn)練。通過TensorFlow訓(xùn)練模型對(duì)單個(gè)文字作品打分。根據(jù)詳細(xì)的占分權(quán)重進(jìn)行最終的評(píng)分,導(dǎo)出分?jǐn)?shù)到EXCEL表格并給出錯(cuò)誤提示。軟件架構(gòu)如圖1所示。
3.3 軟件功能模塊設(shè)計(jì)
寫字考試自動(dòng)評(píng)閱軟件使用PYTHON作為開發(fā)平臺(tái),根據(jù)功能的不同將系統(tǒng)分為用戶管理、數(shù)據(jù)導(dǎo)入、評(píng)閱打分以及數(shù)據(jù)顯示四個(gè)模塊。軟件功能模塊結(jié)構(gòu)圖如圖2所示。
3.3.1 用戶管理模塊
學(xué)生教師登錄或注冊(cè)賬號(hào)。實(shí)現(xiàn)用戶登錄注冊(cè),運(yùn)行環(huán)境:Python:3.6.5、MySQL[6]:5.7、PyMySQL:0.9.3。數(shù)據(jù)庫表:user表,存放用戶名和密碼、user _locked表:存放被鎖定的用戶名。
3.3.2 數(shù)據(jù)導(dǎo)入模塊
方式:本地選擇圖片路徑上傳。
3.3.3 評(píng)閱打分模塊
結(jié)合傳統(tǒng)技術(shù)與深度學(xué)習(xí)技術(shù),以字和篇章作為評(píng)分維度。OCR識(shí)別的為第一道檢測(cè),與數(shù)據(jù)集匹配對(duì)單個(gè)字的圖片評(píng)分為第二道檢測(cè),以此為基礎(chǔ)進(jìn)行評(píng)分。
3.3.4 數(shù)據(jù)顯示模塊
顯示并記錄分?jǐn)?shù)歷史數(shù)據(jù),提供糾錯(cuò)建議。
4 軟件功能實(shí)現(xiàn)
4.1 用戶管理模塊的實(shí)現(xiàn)
首次使用此軟件,可點(diǎn)擊注冊(cè)鍵,進(jìn)入注冊(cè)界面后即可填寫注冊(cè)賬號(hào)(推薦使用手機(jī)號(hào))與注冊(cè)密碼,點(diǎn)擊確定鍵即注冊(cè)完成。注冊(cè)完成后的用戶在登錄界面使用賬號(hào)密碼進(jìn)行登錄。
4.2 數(shù)據(jù)導(dǎo)入模塊的功能實(shí)現(xiàn)
軟件登錄成功后進(jìn)入到數(shù)據(jù)導(dǎo)入界面,點(diǎn)擊“上傳作品”鍵瀏覽并添加電腦任意文件,選擇要添加的圖片。
4.3 評(píng)閱打分模塊的實(shí)現(xiàn)
前面兩個(gè)模塊已為評(píng)閱打分模塊做好了前期準(zhǔn)備,只需點(diǎn)擊“開始評(píng)分”鍵軟件即可按照“登錄->選擇毛筆/硬筆->上傳圖片->灰度化處理->OCR識(shí)別->文字匹配->第一次扣分->圖片分割->TensorFlow評(píng)分->二次扣分->導(dǎo)出結(jié)果”這一流程自動(dòng)進(jìn)行評(píng)分,評(píng)分完成前無需與用戶進(jìn)行交互。
4.4 數(shù)據(jù)顯示模塊的實(shí)現(xiàn)
軟件記錄各個(gè)用戶的歷史評(píng)分成績并存儲(chǔ)在數(shù)據(jù)庫中,方便后續(xù)滿足用戶查詢歷史成績這一功能需求。在每次評(píng)分完成后也會(huì)顯示詳細(xì)的失分情況。成績展示如圖3所示。
5 結(jié)束語
此軟件開發(fā)[7]完成后,一方面有效地改善由于人工評(píng)閱工作效率較低,主觀因素影響較大等因素對(duì)寫字等級(jí)考試學(xué)生成績的干擾。自動(dòng)閱卷[8]大大減少了教師的工作量,可以使教師有效的利用時(shí)間,提高教師的工作效率。另一方面使學(xué)生日常練習(xí)寫字時(shí)有一個(gè)良好的成績?cè)u(píng)測(cè)軟件,有利于發(fā)現(xiàn)錯(cuò)誤,有效地進(jìn)步。軟件記錄歷史寫字作品成績這一功能,更是使學(xué)生的成績變化更加的可視化。加強(qiáng)數(shù)據(jù)庫檢索功能及配置的優(yōu)化是后續(xù)開發(fā)維護(hù)過程中主要對(duì)象,以此來實(shí)現(xiàn)軟件更完備的檢索功能。本軟件實(shí)際應(yīng)用價(jià)值高,切實(shí)解決一系列問題,因此推廣的必要性較高。
參考文獻(xiàn):
[1] 陳芳.義務(wù)教育階段寫字等級(jí)考試的上海實(shí)踐與思考[J].上海課程教學(xué)研究,2020(6):36-41.
[2] 馮麗敏,楊艷,鐘穎莉.基于相關(guān)查詢的關(guān)鍵字搜索優(yōu)化技術(shù)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(S1):272-280.
[3] 呂向東,姜國華,王懷江.一種列控運(yùn)行數(shù)據(jù)智能診斷系統(tǒng)的軟件架構(gòu)設(shè)計(jì)[J].鐵路通信信號(hào)工程技術(shù),2020,17(10):7-10,18.
[4] 唐子清,姚儉.基于深度學(xué)習(xí)的數(shù)字識(shí)別方法研究[J].軟件導(dǎo)刊,2020,19(9):228-232.
[5] 解京璐,馬媛,吳家鑫,等.基于深度學(xué)習(xí)的腐壞蘋果圖像識(shí)別系統(tǒng)的設(shè)計(jì)[J].南陽理工學(xué)院學(xué)報(bào),2020,12(4):66-70.
[6] 劉倩倩.基于PHP和MySQL的網(wǎng)站設(shè)計(jì)與實(shí)現(xiàn)[J].中小企業(yè)管理與科技(下旬刊),2020(10):162-163.
[7] 周維,嚴(yán)小峰,鄒波.基于模型的BMS應(yīng)用層軟件開發(fā)與測(cè)試[J].汽車零部件,2020(10):65-72.
[8] 彭上觀,鹿洪峰.可以積極穩(wěn)妥地推進(jìn)高考電腦閱卷——兼談對(duì)電腦閱卷的若干認(rèn)識(shí)[J].教學(xué)與管理,2006(22):76-78.
【通聯(lián)編輯:代影】