陳藝
(四川文理學(xué)院 教務(wù)處, 四川 達(dá)州635000)
基于高效關(guān)聯(lián)規(guī)則挖掘算法的智能評(píng)卷模型研究
陳藝
(四川文理學(xué)院 教務(wù)處, 四川 達(dá)州635000)
考試評(píng)分標(biāo)準(zhǔn)的公平性和公正性一直深受關(guān)注,其能否保證閱卷人員在閱卷過程中所運(yùn)用的評(píng)分標(biāo)準(zhǔn)達(dá)到一致性和穩(wěn)定性,并有效控制閱卷過程中的誤差,是一個(gè)迫切需要解決的問題.本文根據(jù)網(wǎng)上閱卷系統(tǒng)環(huán)境,將一種高效的關(guān)聯(lián)規(guī)則 挖掘算法,即Hopfield神 經(jīng)網(wǎng)絡(luò)技術(shù) 運(yùn)用到該系 統(tǒng)中,并采用 柯爾莫戈洛 夫—斯米 爾懦夫檢驗(yàn) 方法來檢驗(yàn) 輸 出 結(jié) 果 ,從 而及時(shí)發(fā)現(xiàn)并調(diào)整閱卷人員的工作和休息狀態(tài),提升了閱卷過程的質(zhì)量和效率,進(jìn)而保證閱卷過程的公平公正性.
網(wǎng)上閱卷;閱卷誤差;Hopfield網(wǎng)絡(luò)模型;柯爾莫戈洛夫—斯米爾懦夫檢驗(yàn)
在學(xué)習(xí)的過程中,學(xué)生們面臨著各種類型的考試,通過考試可以反映學(xué)生對(duì)所學(xué)知識(shí)的熟練程度及靈活運(yùn)用能力.為了保證考試過程的公正和公平,必然需要一套標(biāo)準(zhǔn)的評(píng)分標(biāo)準(zhǔn).現(xiàn)有的考試主要分為三個(gè)階段:考前階段、考試階段和閱卷階段.考前階段主要是要保證考試題目的保密性,避免泄題現(xiàn)象的產(chǎn)生,在目前的考試系統(tǒng)中,這一點(diǎn)基本已經(jīng)實(shí)現(xiàn).考試階段主要是保證考場(chǎng)秩序,防止作弊現(xiàn)象的產(chǎn)生,通過現(xiàn)有的電子屏蔽技術(shù)和考官監(jiān)考等手段基本可以保證考試階段的順利進(jìn)行.然而在閱卷階段,由于主觀題目的存在,需要通過人工閱卷方式進(jìn)行,閱卷人員的主觀判斷因素會(huì)影響評(píng)卷的統(tǒng)一性和標(biāo)準(zhǔn)性,難以避免誤差的出現(xiàn),因此還不能保證評(píng)卷過程是完全公平的.閱卷過程中所產(chǎn)生的誤差是由于閱卷人員的評(píng)分標(biāo)準(zhǔn)與他人的標(biāo)準(zhǔn)不一樣或者其他原因而導(dǎo)致,誤差產(chǎn)生的原因很多而且難以消除,因此,只能采取措施加以控制,盡量將誤差縮減到最小.但是,對(duì)于誤差控制的課題研究,始終未能找到絕對(duì)有效的措施.因此,本文提出一種基于高效的關(guān)聯(lián)規(guī)則挖掘算法的智能評(píng)卷模型,可以減少評(píng)卷誤差,提高評(píng)卷效率,保證評(píng)卷過程的公平性.
網(wǎng)上閱卷是指閱卷人員通過計(jì)算機(jī)閱讀方式來進(jìn)行試卷評(píng)分的過程.首先要把需要評(píng)分的答卷通過電子掃描,變成電子答卷,輸入到計(jì)算機(jī)中,將答卷分配給各指定閱卷人員,然后由各閱卷人員在指定的計(jì)算機(jī)上進(jìn)行答卷評(píng)閱.閱卷人員根據(jù)給定的評(píng)分標(biāo)準(zhǔn)獨(dú)立完成閱卷過程,給出分?jǐn)?shù),閱卷過程不會(huì)受到其他人員的影響.
從網(wǎng)上閱卷的過程可以看出,網(wǎng)上閱卷是在計(jì)算機(jī)技術(shù)的基礎(chǔ)上,將人工閱卷經(jīng)驗(yàn)和高新技術(shù)結(jié)合起來,以實(shí)現(xiàn)考試公平和公正為目的的現(xiàn)代閱卷方式.網(wǎng)上閱卷不是否定人的重要作用,而是要提升人工閱卷的閱卷效率,實(shí)現(xiàn)閱卷的公平性和公正性.通過網(wǎng)上閱卷可以避免傳統(tǒng)閱卷過程中的很多不便因素,使閱卷環(huán)境更加適合閱卷人員進(jìn)行高效率的閱卷,提高了閱卷質(zhì)量,從源頭上對(duì)閱卷過程進(jìn)行誤差控制.[1]
然而,相對(duì)于傳統(tǒng)的閱卷方式,如果只是通過網(wǎng)上閱卷方式來進(jìn)行變革,還不能達(dá)到有效控制閱卷誤差的目的,也無法保證閱卷的穩(wěn)定性和統(tǒng)一性.因此,有必要建立智能評(píng)卷模型,將人工智能神經(jīng)網(wǎng)絡(luò)應(yīng)用到網(wǎng)上閱卷過程中.
在這個(gè)網(wǎng)絡(luò)發(fā)展迅速的時(shí)代,神經(jīng)網(wǎng)絡(luò)的應(yīng)用模型目前已有十多種.其中Hopfield網(wǎng)絡(luò)是其中最具代表性的反饋型網(wǎng)絡(luò)模型,應(yīng)用最為廣泛,效果最好.根據(jù)網(wǎng)上閱卷的實(shí)際需要,本文中選取Hopfield網(wǎng)絡(luò)模型來建立智能評(píng)卷模型.
在Hopfield神經(jīng)網(wǎng)絡(luò)中,從網(wǎng)絡(luò)輸入至網(wǎng)絡(luò)輸出需要進(jìn)行對(duì)稱反饋連接,構(gòu)成一種循環(huán)型的神經(jīng)網(wǎng)絡(luò),它具有聯(lián)想記憶和限制優(yōu)化的功能.在反饋型神經(jīng)網(wǎng)絡(luò)中,輸出端的信息會(huì)被反饋到輸入端,因此,在輸入信息的刺激下,Hopfield網(wǎng)絡(luò)的狀態(tài)會(huì)不斷地發(fā)生變化.[2]有效信息首先被輸入到網(wǎng)絡(luò)中,然后能夠得出Hopfield的輸出結(jié)果,在反饋?zhàn)饔孟?,輸出結(jié)果會(huì)被反饋到輸入過程中,因而會(huì)得到新的輸出結(jié)果,循環(huán)往復(fù),直到得到一個(gè)穩(wěn)定的數(shù)值.
Hopfield網(wǎng)絡(luò)是一種二值神經(jīng)離散網(wǎng)絡(luò),采用的是二值神經(jīng)元,而二值神經(jīng)元只輸出0和1,因此,Hopfield網(wǎng)絡(luò)所輸出的離散值為0和1,1表示神經(jīng)元為激活狀態(tài),0表示神經(jīng)元為抑制狀態(tài).圖1中的神經(jīng)網(wǎng)絡(luò)是一個(gè)由三個(gè)神經(jīng)元構(gòu)成的Hopfield神經(jīng)網(wǎng)絡(luò).如圖1所示,第0層不是實(shí)際的神經(jīng)元,只是神經(jīng)網(wǎng)絡(luò)的輸入,因此不具有計(jì)算作用;[3]第1層為實(shí)際的神經(jīng)元,可以對(duì)輸入的信息進(jìn)行初步計(jì)算,然后通過非線性函數(shù)f計(jì)算生成輸出信息.計(jì)算公式為,且有,其中Xj表示輸入信息.
圖1 三神經(jīng)元組成的Hopfield神經(jīng)網(wǎng)絡(luò)
圖2 離散Hopfield神經(jīng)網(wǎng)絡(luò)的另一種表示
將圖1中的三元Hopfield神經(jīng)網(wǎng)絡(luò)用圖2的圖形進(jìn)行表示,它們表示著相同的意義.根據(jù)Hopfield神經(jīng)網(wǎng)絡(luò)中存在的節(jié)點(diǎn)情況,可以用Yj(t)表示第j個(gè)網(wǎng)絡(luò)神經(jīng)元節(jié)點(diǎn)在t時(shí)刻的狀態(tài).下一個(gè)時(shí)刻的神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)的狀態(tài)可以表示為:
當(dāng)i=j時(shí),Wij=0,則表明從一個(gè)神經(jīng)元輸出的信息,不會(huì)被反饋到該神經(jīng)元的輸入中,此時(shí)的Hopfield神經(jīng)網(wǎng)絡(luò)為無自反饋神經(jīng)網(wǎng)絡(luò);如果i=j時(shí),Wij≠0,則表明一個(gè)神經(jīng)元輸出的信息會(huì)被反饋到該神經(jīng)元的輸入中,此時(shí)的Hopfield神經(jīng)網(wǎng)絡(luò)則為有自反饋神經(jīng)網(wǎng)絡(luò).
在閱卷的過程中,閱卷人員面臨著相同的網(wǎng)絡(luò)神經(jīng)元制約因素.閱卷人員的評(píng)分結(jié)果為輸入信息,經(jīng)過網(wǎng)絡(luò)神經(jīng)元的計(jì)算,形成輸出數(shù)值,此輸出數(shù)值則是該網(wǎng)絡(luò)的控制和評(píng)價(jià)參數(shù).考慮閱卷工作的實(shí)際需要,選用柯爾莫戈洛夫—斯米爾諾夫檢驗(yàn)方法來進(jìn)行網(wǎng)絡(luò)神經(jīng)元的運(yùn)算.[4]
柯爾莫戈洛夫檢驗(yàn)主要用于對(duì)連續(xù)型母體進(jìn)行分布檢驗(yàn),又被稱為Dn-檢驗(yàn).柯爾莫戈洛夫檢驗(yàn)中,首先假設(shè)母體為連續(xù)型分布,然后對(duì)子樣經(jīng)驗(yàn)分布函數(shù)Fn(x)和母體分布函數(shù)F(x)進(jìn)行比較,求出原假設(shè)中的分布函數(shù)和Fn(x)之間的偏差.
柯爾莫戈洛夫檢驗(yàn)中假設(shè)母體為連續(xù)分布函數(shù)F(x)的假設(shè)步驟為:
(1)從母體中抽取容量為n的子樣,n大于等于50,按照觀察值的大小將子樣由小到大進(jìn)行排列.
(2)計(jì)算經(jīng)驗(yàn)分布函數(shù):
根據(jù)假設(shè)H0計(jì)算觀察值x處的理論分布函數(shù)F(x).
(3)計(jì)算xi處的經(jīng)驗(yàn)分布函數(shù)和理論分布函數(shù)之間差值的絕對(duì)值,即Fn(x(i))-F(x(i))和Fn(x(i+1))-F(x(i+1))的值,由此計(jì)算出相關(guān)統(tǒng)計(jì)量Dn的值:
(4)如果有Dn≥Dn,α,則拒絕假設(shè)H0;如果Dn 斯米爾懦夫檢驗(yàn)方法延續(xù)柯爾莫戈洛夫檢驗(yàn)的方法思想,對(duì)兩個(gè)子樣的分布函數(shù)進(jìn)行比較檢驗(yàn),檢驗(yàn)兩個(gè)子樣是否是源自相同的母體檢驗(yàn),并對(duì)這一定理進(jìn)行了證明,將此檢驗(yàn)成為柯爾莫戈洛夫—斯米爾懦夫檢驗(yàn).該方法非常適合高考等考試的閱卷過程.高考等試卷的閱卷過程中,閱卷人員只負(fù)責(zé)某一道題的評(píng)閱,[5]每一題的得分都在0和滿分之間.依據(jù)每個(gè)閱卷人員的打分,分別用柯爾莫戈洛夫檢驗(yàn)的方法和柯爾莫戈洛夫—斯米爾懦夫檢驗(yàn)方法進(jìn)行檢驗(yàn). (1)柯爾莫戈洛夫檢驗(yàn)的方法.首先對(duì)閱卷人員和試卷分?jǐn)?shù)分布之間的一致性進(jìn)行檢驗(yàn),然后考慮閱卷人員的無效打分?jǐn)?shù)量,檢驗(yàn)結(jié)果是否在允許的范圍之內(nèi).計(jì)算方法如下: 假設(shè)某一題的滿分為S.隨機(jī)抽取某一閱卷人員的閱卷子樣n個(gè),n為足夠多.顯著性水平 α 取值0.05.運(yùn)用點(diǎn)估計(jì)值方法計(jì)算 當(dāng)n足夠大時(shí),通??梢詫⑦@兩個(gè)點(diǎn)估計(jì)值當(dāng)做實(shí)際理論分布中的 μ 和 σ.因此,計(jì)劃進(jìn)行檢驗(yàn)的假設(shè)H0:F(x)為N(μ,α2)的分布函數(shù).[6]采用對(duì)子樣進(jìn)行觀察的方法,將必要的計(jì)算過程放在表1中: 從表1中可以看出,最后兩列可以計(jì)算出Dn的值,通過查看柯爾莫戈洛夫的臨界值表,可以得出臨界值Dn,α的值.如 果Dn (2)柯爾莫戈洛夫—斯米爾懦夫檢驗(yàn)方法.首先對(duì)某閱卷人員和其他閱卷人員閱卷的打分情況分布之間的一致性進(jìn)行檢驗(yàn),檢驗(yàn)結(jié)果是否在允許的范圍之內(nèi).假設(shè)某題的滿分為S,計(jì)算方法如下: 表1 某閱卷人員的觀察樣本和相關(guān)計(jì)算值 取D等于表2中的最后一列“累計(jì)比重差的絕對(duì)值”中的最大值,然后令Z為: 表2 某閱卷人員和其他人員的觀察樣本和計(jì)算值 顯著水平取0<α<1,一般取 α=0.05.依據(jù)柯爾莫戈洛夫—斯米爾懦夫分布表,取臨界值為 λα,Q(λα)=1-α. 因此得出結(jié)論為:當(dāng)Z>λα 時(shí),認(rèn)為某閱卷人同其他閱卷人的打分分布之間存在顯著偏差;當(dāng)Z<λα 時(shí),認(rèn)為某閱卷人同其他閱卷人的打分分布之間不存在顯著偏差. (3)運(yùn)用柯爾莫戈洛夫—斯米爾懦夫檢驗(yàn)方法,對(duì)閱卷人員的閱卷過程進(jìn)行控制,對(duì)于發(fā)生的偏差進(jìn)行及時(shí)反饋.然后根據(jù)反饋信息對(duì)閱卷人員的工作和休息時(shí)間進(jìn)行調(diào)整,從而保證閱卷效果達(dá)到最佳.[7] 通過上述步驟的檢驗(yàn),可以使得每一位閱卷人員都在網(wǎng)上評(píng)分系統(tǒng)的監(jiān)控范圍中,從而保證閱卷人員都能夠發(fā)揮出最高的閱卷狀態(tài),進(jìn)而有利于閱卷效率的提高和誤差的控制. 綜上所述,神經(jīng)網(wǎng)絡(luò)技術(shù)對(duì)于網(wǎng)上閱卷評(píng)分標(biāo)準(zhǔn)的把握和閱卷穩(wěn)定性等方面起著至關(guān)重要的作用.在實(shí)際的閱卷評(píng)分過程中,可根據(jù)實(shí)際需要,建立相關(guān)數(shù)學(xué)模型(如本文中的Hopfield反饋型神經(jīng)網(wǎng)絡(luò)模型),然后運(yùn)用合理的檢驗(yàn)方法(如本文中的柯爾莫戈洛夫檢驗(yàn)方法和柯爾莫戈洛夫—斯米爾懦夫檢驗(yàn)方法),就能夠有效地控閱卷誤差,保證閱卷過程的高效率以及閱卷過程的公平性和公正性. 〔1〕陳志國(guó),芮南.高考作文網(wǎng)上閱卷雙評(píng)過程中的質(zhì)量監(jiān)控[J].中學(xué)語(yǔ)文教學(xué),2009(06):32-24. 〔2〕于濤.考試改革視野下的網(wǎng)上評(píng)卷研究[J].現(xiàn)代教育管理, 2010(04):33-35. 〔3〕羅友花,劉鐵明.網(wǎng)上閱卷研究述評(píng)[J].中國(guó)考試(研究版), 2009(11):34-37. 〔4〕熊水金.計(jì)算機(jī)技術(shù)在考試管理中的應(yīng)用[J].科協(xié)論壇, 2007(08):109-110. 〔5〕曹建莉,張強(qiáng).評(píng)卷 質(zhì)量監(jiān)控模 型及其統(tǒng)計(jì) 分析[J].統(tǒng)計(jì) 與決策,2012(18):29-31. 〔6〕Buyya R,Ranjan R.Special Section:Federated Resource Management in Grid and Cloud ComputingSystems[J].Future Generation Computer Systems.2010;26(8): 1189-1191. 〔7〕RF Sun,ZW Zhao.Resource Scheduling Strategy Based on Cloud Computing[J].AeronauticalComputing Technique.2010;40(3):103–105. TP18 A 1673-260X(2014)06-0050-03 四川文理學(xué)院面上項(xiàng)目《智能閱卷在教務(wù)綜合管理平臺(tái)的應(yīng)用研究》(2013Z001Y)資助4 結(jié)論
赤峰學(xué)院學(xué)報(bào)·自然科學(xué)版2014年12期
——湖南文理學(xué)院與常德職業(yè)技術(shù)學(xué)院普通話測(cè)試課程化培訓(xùn)模式創(chuàng)建實(shí)踐報(bào)告
——以市場(chǎng)調(diào)查與預(yù)測(cè)課程為例
——基于工作過程的課程開發(fā)實(shí)踐