張德洪
(集美大學(xué) 教師教育學(xué)院,福建 廈門 361021)
遠(yuǎn)程教育系統(tǒng)設(shè)計中的自動組卷算法研究
張德洪
(集美大學(xué) 教師教育學(xué)院,福建 廈門 361021)
由于計算機(jī)網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)的不斷發(fā)展,遠(yuǎn)程教育已成為改革傳統(tǒng)教育模式的動力和有效的手段,一個強(qiáng)大的力量.在本文中,研究了自動組卷算法在遠(yuǎn)程教育系統(tǒng)中的應(yīng)用,分析一部分組卷策略,并提出了在組卷中應(yīng)用遺傳算法,測試結(jié)果表明,遺傳算法的組卷速度較快.
遠(yuǎn)程學(xué)習(xí);自動組卷;系統(tǒng)設(shè)計
遠(yuǎn)程教育系統(tǒng)突破了傳統(tǒng)的學(xué)校教育模式的在時間和空間上的限制,它和課堂教育,廣播教育,電視教育一起形成了多元化的教育制度,一個人用計算機(jī)便可以和網(wǎng)絡(luò)連接,可以隨時隨地開展學(xué)習(xí)和培訓(xùn).相對于其他教育模式,遠(yuǎn)程教育有著傳統(tǒng)教育部可替代的優(yōu)點,它在時間和空間上不受限制,可以資源共享,系統(tǒng)的開放性,促進(jìn)協(xié)作等.
一般情況下,教師在自動組卷時,針對試卷的質(zhì)量會提出很多方面的要求,這便是試卷的約束條件.根據(jù)實際情況,組卷的具體要求可以分為以下幾個方面:①章節(jié).它指的是在試卷中各個章節(jié)所占分?jǐn)?shù)的比例.②題型,它指的是在試卷中要包含各種類型的試題.③題量.它指的是在試卷中題目數(shù)量的多少.具體到每個類型的題目,指的是這類題型中包含的題目數(shù)量.④難易程度.它指的是試題的難易程度,問題分為簡單,容易,中等,困難,很難5個等級.⑤區(qū)分度.試題在考生之間的區(qū)分程度,分為差,中,優(yōu)三個等級.⑥認(rèn)識程度.學(xué)生對試題要求掌握的知識點的掌握程度,掌握程度可以劃分為了解,理解,掌握和熟練四個等級.⑦答復(fù)時間.它指的是學(xué)生要多少時間答完試卷.⑧分?jǐn)?shù).它主要指的是試卷的分?jǐn)?shù).具體到每個類型題目,指的是每個題型所占的分?jǐn)?shù).⑨曝光度.它指的是試題的平均曝光度.試題考過的次數(shù)越多那么曝光度就越大.在組卷時要抽取較小曝光度的試題.
基于對約束條件的分析,在組卷過程中建立與控制指標(biāo)相呼應(yīng)的狀態(tài)空間S,試題的控制指標(biāo)構(gòu)成S的每行,同時還要進(jìn)行編碼,并且每列是題庫中的指標(biāo)的所有取值.在建立題庫時,每到試題都輸入了相應(yīng)的屬性指標(biāo),①問題編號,②試題類型,③所屬章節(jié),④難度,⑤區(qū)分度,⑥認(rèn)知程度,⑦估算答題時間,⑧分?jǐn)?shù),⑨曝光度,⑩試卷的內(nèi)容,11標(biāo)準(zhǔn)答案,12考試要求,13出題人,14出題時間,15關(guān)鍵字,16關(guān)鍵字的分值比例.依據(jù)組卷的約束條件還要考慮八維向量 (a 1,a 2,a 3,a 4,a 5,a 6,a 7,a 8),和試題屬性指標(biāo)②,③,④,⑤,⑥,⑦,⑧相對應(yīng).為了減少組卷算法的復(fù)雜性和提高效率,簡化處理八維向量.在組卷時按照題型將試題分類,同一題型中的試題可以不必考慮試題的題型,在組卷開始時就可以滿足題量和題型所占的分?jǐn)?shù).最后試卷減掉兩個維度變量,形成一個六維空間 (al,a 2,a 3,a 4,a 5,a 6).由最初的確定一份試卷轉(zhuǎn)變成要確定一個n*k(這里k=6)的矩陣.這里n是試卷中的題目數(shù)量,K表示控制指標(biāo)的數(shù)量.asw(s=l...n,w=1...6)表示第s道試題的w項指標(biāo).
采用遺傳算法解決問題,首要是把問題的解空間映射為一組代碼串.題庫中的試題數(shù)量決定基本遺傳算法的編碼長度.假如題庫內(nèi)共有n道題,問題解可以用一個n位的二進(jìn)制串來表示,具體形式是F 1,F(xiàn) 2...Fn.如果相應(yīng)位是1這表明試題被選中,如果是0則表明試題沒有被選中.這種編碼的優(yōu)點是簡單,一但題庫內(nèi)的試題數(shù)量多,編碼太長,操作就會不方便.在這里使用實數(shù)編碼的方法,獲得的可行解是試卷.一個試卷映射到一個染色體,構(gòu)成試卷的試題可以映射成基因,試題題號可以直接表示基因的值,此代碼可以表示成:(G1G 2,G 3,...,Gn),其中Gi(i=1,...,n),是試題的總量.在編碼時要把相同題型的題目放在一起,還必須在每條染色體上的章節(jié)編碼也不能相同.根據(jù)選定章節(jié)和考試題目的數(shù)量,初始種群可以使用andom()函數(shù)隨機(jī)生成.
在遺傳算法中,要區(qū)分群體中個體的優(yōu)劣可以使用適應(yīng)度的大小來實現(xiàn).一般來說,越大的適用度那么個體越好,越小的適應(yīng)值的個體越差.首先,根據(jù)G 1,G 2,...,Gn的值,就可知道試卷中含有的試題題號,之后再組卷參數(shù)矩陣S中寫入試題的屬性.每個個體的適應(yīng)度可以調(diào)用適應(yīng)度函數(shù)來實施,在實際的應(yīng)用中,我們使用下面的方法把目標(biāo)函數(shù)f轉(zhuǎn)換成適應(yīng)度函數(shù)F'.
指數(shù)比列可以優(yōu)良的個體有更多的復(fù)制機(jī)會,它還可以控制復(fù)制的數(shù)量,避免它過快的控制全部群體,增加了個體之間的競爭,因此對上面的適應(yīng)度函數(shù)F'可以采用指數(shù)比例變化成適應(yīng)度函數(shù)F=exp(-βF'),p取值為 -0.03.
在遺傳算法中,個體交叉后產(chǎn)生的子代代替了兩個父代個體,導(dǎo)致父代信息迅速丟失,交叉生成新的個體不一定比父代個體好,它是不利于算法快速收斂.此外,由于初始種群形成之時,題型和分?jǐn)?shù)都滿足了要求條件,為了不破壞這些約束條件,我們改進(jìn)了選擇,交叉,變異的操作方式.①交叉操作在同種題型中進(jìn)行,變異操作也在同種題型內(nèi)部進(jìn)行,各個題型實行獨立的交叉和變異.②實行最優(yōu)保存策略.交叉變異操作之后,將新生成的個體的適應(yīng)度和上一代個體的適應(yīng)度進(jìn)行比較,如果適應(yīng)度下降,那么上一代中的最佳個體要取代新一代的最差個體.此時,不變的是種群中個體的數(shù)量.這一戰(zhàn)略可以確保最佳的個體不會被交叉變異破壞.
交叉操作和變異操作不會發(fā)生在所有的個體上,而是通過Pc和Pm的值來確定交叉操作和變異操作.Pc和Pm的選擇會給算法的收斂性帶來直接的影響,Pc和Pm越大,該算法的生成新個體的能力就越強(qiáng),個體之間的適應(yīng)度就更不穩(wěn)定,生成新的超平面的能力就越強(qiáng);若Pc和Pm越小,該算法促使個體的收斂能力就會越強(qiáng),個體的平均適應(yīng)度也會相對穩(wěn)定,有可能成熟過早.為此我們利用自適應(yīng)的理論,在運行過程中,調(diào)整Pc和Pm,使它們作為個體的適應(yīng)值增加而變小,個體的適應(yīng)值下降而增大.改進(jìn)之后的染色體的交叉和變異在同一題型中實行單點交叉變異,這也就是說所有題型在各自獨立的編碼組內(nèi)實行交叉和變異,在第三和第六列之間隨機(jī)選取交叉點和變異點的位置,以便能夠不改變所屬章節(jié)和題型屬性.任意選取兩個染色體的交叉計算概率,并生成一個0勺隨機(jī)數(shù),比較隨機(jī)數(shù)和交叉概率來確定是否實行交叉操作.如果隨機(jī)數(shù)低于交叉概率,那么實行交叉,產(chǎn)生兩個新個體.在實行變異操作時,要計算變異概率Pm比較隨機(jī)數(shù)和Pm,如果小于Pm,則進(jìn)行變異操作.
由于遺傳算法是不會自動終止的,所以沒有辦法知道是否已收斂到極點值.為此在產(chǎn)生性一代個體時都要計算每個個體的適應(yīng)度.要滿足兩個終止條件,一是適應(yīng)度值,二是是否達(dá)到已設(shè)定的次數(shù).如果某個個體達(dá)到了適應(yīng)度的要求和迭代次數(shù),那么就可以終止循環(huán).
為了驗證采用遺傳算法來自動組卷的的可行性和有效性,《計算機(jī)基礎(chǔ)》作為實例,對編制程序?qū)嵭薪M卷實驗.在600道試題保存在題庫內(nèi),單選題和多選題各200道,問答題100道,以便作出合理的試題分布的,存在各種屬性值.遺傳算法參數(shù):Max Generation=300,PoSize=50,Pc 1=0.9,Pc 2=0.6,Pm 1=0.1,Pm 2=0.001,要求允許誤差士3分.考試時間120分鐘,滿分100分.在較為復(fù)雜的組卷條件下,均出現(xiàn)了組卷效率低,增加使用的時間.總體而言,遺傳算法的組卷有較高的成功率,而隨機(jī)抽取的組卷成功率顯著下降,遺傳算法組卷速度較快.
〔1〕謝平.基于框架模式的試題庫智能組卷系統(tǒng)[J].華東交通大學(xué)學(xué)報,1998,15(4):58-63.
〔2〕劉軍輝,景寧,陸勤,陳宏盛.基于Internet/Intranet的多媒體遠(yuǎn)程教學(xué)系統(tǒng)的設(shè)計與實現(xiàn)[J].微型電腦應(yīng)用,2001,17(4):10-13.
TP 319
A
1673-260X(2010)12-0045-02