胡帥,顧艷,姜華(渤海大學(xué) 大學(xué)外語(yǔ)教研部,遼寧 錦州 121013)
GRNN在學(xué)生寫(xiě)作成績(jī)預(yù)測(cè)中的應(yīng)用研究
胡帥,顧艷,姜華
(渤海大學(xué) 大學(xué)外語(yǔ)教研部,遼寧 錦州121013)
由于學(xué)生英語(yǔ)寫(xiě)作成績(jī)預(yù)測(cè)受諸多因素影響,具有高維、非線性特點(diǎn),本文基于廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)算法原理,構(gòu)建了GRNN學(xué)生英語(yǔ)寫(xiě)作成績(jī)預(yù)測(cè)模型,并與彈性BP算法改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析。仿真結(jié)果表明:改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)最大相對(duì)誤差為3.23%,GRNN模型的預(yù)測(cè)最大相對(duì)誤差僅為-0.72%,表明所建立的GRNN模型的預(yù)測(cè)精度高、泛化能力強(qiáng)、收斂速度快、調(diào)整參數(shù)少,驗(yàn)證了將GRNN應(yīng)用于英語(yǔ)寫(xiě)作成績(jī)預(yù)測(cè)方案的可行性。
廣義回歸神經(jīng)網(wǎng)絡(luò);BP神經(jīng)網(wǎng)絡(luò);成績(jī)預(yù)測(cè);模型
對(duì)學(xué)生英語(yǔ)寫(xiě)作成績(jī)的準(zhǔn)確預(yù)測(cè)可為教師調(diào)整寫(xiě)作教學(xué)方法和學(xué)生自主學(xué)習(xí)提供有益參考。傳統(tǒng)的預(yù)測(cè)方法采用簡(jiǎn)單的線性模型來(lái)預(yù)測(cè)。由于影響學(xué)生英語(yǔ)寫(xiě)作成績(jī)的因素很多,使學(xué)生英語(yǔ)寫(xiě)作成績(jī)預(yù)測(cè)呈現(xiàn)高維、非線性特性,所以,傳統(tǒng)方法的預(yù)測(cè)結(jié)果誤差較大,難以滿足實(shí)際需要。隨著人工神經(jīng)網(wǎng)絡(luò)技術(shù)的快速發(fā)展,基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法為學(xué)生英語(yǔ)寫(xiě)作成績(jī)預(yù)測(cè)提供了新的解決途徑。廣義回歸神經(jīng)網(wǎng)絡(luò)(General Regression Neural Network,GRNN)算法簡(jiǎn)單、逼近精度高、具有良好的非線性收斂性能[1]。文中嘗試構(gòu)建基于GRNN[2-4]的大學(xué)生英語(yǔ)寫(xiě)作成績(jī)預(yù)測(cè)模型,以期解決傳統(tǒng)方法預(yù)測(cè)精度不高的問(wèn)題,并與彈性BP算法改進(jìn)的BP網(wǎng)絡(luò)模型作對(duì)比,驗(yàn)證GRNN預(yù)測(cè)模型的有效性。
GRNN由輸入層、模式層、求和層、輸出層4部分構(gòu)成[5]。令隨機(jī)向量X和隨機(jī)變量Y的概率密度函數(shù)為f(X,Y),當(dāng)X= X0時(shí),則Y對(duì)X0的回歸值的計(jì)算方法如式(1)所示,樣本集(Xi,Yi),(i=1,2,3,…,n)非參數(shù)估計(jì)如式(2)所示。
式(2)中n為訓(xùn)練樣本容量,w為樣本向量維數(shù),SPREAD為徑向基函數(shù)的分布密度,d表示樣本向量之間的歐式距離,計(jì)算方法如式(3)和式(4)所示。將式(3)和式(4)代入式(2)并經(jīng)過(guò)化簡(jiǎn)最終可得式(5),由式(5)可知,徑向基函數(shù)的分布密度SPREAD是唯一人為可調(diào)參數(shù)[6-7],只要取值適中,即可將所有訓(xùn)練樣本的因變量綜合進(jìn)行考慮,且此時(shí)不同訓(xùn)練樣本點(diǎn)與測(cè)試樣本點(diǎn)之間的距離也一并進(jìn)行計(jì)算,離測(cè)試樣本點(diǎn)接近的訓(xùn)練樣本點(diǎn)將會(huì)獲得更大的權(quán)值[8]。
2.1寫(xiě)作成績(jī)?cè)u(píng)價(jià)的指標(biāo)體系構(gòu)建
以往研究表明學(xué)生英語(yǔ)寫(xiě)作成績(jī)受多種因素影響,如漢語(yǔ)寫(xiě)作能力、口語(yǔ)能力、詞匯水平、,語(yǔ)法、文化因素等。本文基于已有研究發(fā)現(xiàn)并進(jìn)一步細(xì)化,最終確定用于學(xué)生寫(xiě)作成績(jī)預(yù)測(cè)的評(píng)價(jià)指標(biāo)體系共包括12項(xiàng)評(píng)價(jià)指標(biāo)。分別為:口語(yǔ)(X1)、聽(tīng)力(X2)、詞匯(X3)、語(yǔ)法(X4)、閱讀(X5)、翻譯(X6)、學(xué)習(xí)動(dòng)機(jī)(X7)、學(xué)習(xí)興趣(X8)、跨文化交際能力(X9)、寫(xiě)作策略(X10)、語(yǔ)篇知識(shí)(X11)和英美文化知識(shí)(X12)。
2.2原始數(shù)據(jù)獲取
學(xué)生英語(yǔ)寫(xiě)作評(píng)價(jià)體系中的X2、X5和X6三項(xiàng)得分依據(jù)學(xué)生大二第一學(xué)期英語(yǔ)四級(jí)考試分項(xiàng)成績(jī)(均折合成滿分為10分);X1由口語(yǔ)測(cè)試獲得;X3、X4、X11和 X12分別由測(cè)試獲得;X7、X8、X9和X10分別由問(wèn)卷調(diào)查獲得。為了提高預(yù)測(cè)模型的準(zhǔn)確性、和保證樣本數(shù)據(jù)的科學(xué)性,將采集到數(shù)據(jù)中的傾向性數(shù)據(jù)(評(píng)分全部為滿分或全部為零分的數(shù)據(jù))剔除,保留有效數(shù)據(jù)后,計(jì)算60位學(xué)生的各指標(biāo)的平均得分,獲得用于學(xué)生寫(xiě)作成績(jī)預(yù)測(cè)的原始數(shù)據(jù)如表1所示。
表1 預(yù)測(cè)原始數(shù)據(jù)
2.3分布密度參數(shù)的確定
在建立GRNN時(shí),分布密度SPREAD的取值直接影響GRNN的逼近性能,SPREAD的值越小,GRNN的逼近精度越高,但取值過(guò)小將會(huì)產(chǎn)生過(guò)擬合現(xiàn)象;SPREAD的值越大,GRNN的逼近精度越低,但擬合曲線相對(duì)較為平滑[8]。文中采用循環(huán)訓(xùn)練算法,在SPREAD=0.3,0.4,0.5,0.7,1.0情況下,利用GRNN對(duì)1-40號(hào)訓(xùn)練樣本進(jìn)行逼近實(shí)驗(yàn),不同SPREAD值條件下的GRNN逼近結(jié)果對(duì)比如圖1所示。從圖1可以看出,當(dāng)SPREAD=0.3時(shí),GRNN相對(duì)誤差最小,幾乎為0,此時(shí)逼近性能最佳,所以,文中在建立GRNN預(yù)測(cè)模型時(shí),最終確定SPREAD的值為0.3。
圖1 不同SPREAD值條件下的GRNN逼近結(jié)果對(duì)比
2.4BPNN模型參數(shù)的確定
本文采用GRNN模型對(duì)寫(xiě)作成績(jī)進(jìn)行預(yù)測(cè),并用彈性BP算法改進(jìn)的BPNN模型作為對(duì)比預(yù)測(cè)模型。對(duì)于標(biāo)準(zhǔn)BPNN模型,經(jīng)反復(fù)試驗(yàn),最終確定其網(wǎng)絡(luò)拓補(bǔ)結(jié)構(gòu)為12-15-1;隱含層傳遞函數(shù)采用tansig函數(shù);輸出層傳遞函數(shù)采用purelin函數(shù),采用基于彈性BP算法的訓(xùn)練函數(shù)trainrp;學(xué)習(xí)函數(shù)采用learngdm;誤差性能函數(shù)采用均方誤差函數(shù)mse;學(xué)習(xí)速率設(shè)為0.1。
3.1預(yù)測(cè)模型的訓(xùn)練
目標(biāo)精度設(shè)為0.001、最大迭代次數(shù)設(shè)為10 000,將表1 中1-40號(hào)樣本作為訓(xùn)練樣本集,分別對(duì)GRNN與BPNN預(yù)測(cè)模型進(jìn)行訓(xùn)練。GRNN與BPNN對(duì)于訓(xùn)練樣本集的相對(duì)誤差曲線如圖2所示??梢钥闯?,所建立的2種預(yù)測(cè)模型均具有較高的逼近能力,GRNN預(yù)測(cè)的相對(duì)誤差幾乎為0,與實(shí)際值幾乎完全一致;BPNN預(yù)測(cè)的最大相對(duì)誤差達(dá)到-1.71%,并且在訓(xùn)練樣本區(qū)間內(nèi)相對(duì)誤差波動(dòng)較大。這表明,與BPNN預(yù)測(cè)模型相比,GRNN預(yù)測(cè)模型在逼近能力、學(xué)習(xí)速度上都具有明顯優(yōu)勢(shì)。
3.2預(yù)測(cè)模型的泛化能力測(cè)試
將表1中41-60號(hào)樣本作為測(cè)試樣本集,對(duì)GRNN與BPNN預(yù)測(cè)模型進(jìn)行泛化能力測(cè)試。GRNN與BPNN的預(yù)測(cè)結(jié)果如圖3所示。GRNN與BPNN對(duì)于測(cè)試樣本集的相對(duì)誤差曲線如圖4所示。從圖3和圖4可以看出,GRNN與BPNN都達(dá)到了較高的預(yù)測(cè)精度,GRNN對(duì)測(cè)試樣本集預(yù)測(cè)的最大相對(duì)誤差僅為-0.72%,但是,BPNN預(yù)測(cè)的最大相對(duì)誤差已經(jīng)達(dá)到3.23%,并且在測(cè)試樣本區(qū)間內(nèi)誤差波動(dòng)范圍較大。這說(shuō)明GRNN在逼近能力和學(xué)習(xí)速度上較BPNN有更大優(yōu)勢(shì),仿真實(shí)驗(yàn)發(fā)現(xiàn),所建立的GRNN模型即使樣本數(shù)據(jù)較少,但是預(yù)測(cè)效果依然很好,而B(niǎo)PNN模型則需大量樣本才能進(jìn)一步提高其預(yù)測(cè)精度,但這勢(shì)必增大網(wǎng)絡(luò)模型的復(fù)雜程度,并且如何確定BPNN的拓補(bǔ)結(jié)構(gòu)、如何選取傳遞函數(shù)、如何避免局部極小值以及網(wǎng)絡(luò)收斂速度過(guò)慢都使其在應(yīng)用時(shí)存在很大局限性。
圖2 GRNN與BPNN對(duì)于訓(xùn)練樣本集的相對(duì)誤差
圖3 GRNN與BPNN的預(yù)測(cè)結(jié)果
圖4 GRNN與BPNN對(duì)于測(cè)試樣本集的相對(duì)誤差
本文應(yīng)用GRNN對(duì)在校大學(xué)生英語(yǔ)寫(xiě)作成績(jī)進(jìn)行預(yù)測(cè)分析,仿真結(jié)果表明,盡管學(xué)生英語(yǔ)寫(xiě)作成績(jī)的影響因素很多,呈現(xiàn)較大的非線性,但是,因?yàn)镚RNN的人為調(diào)節(jié)參數(shù)很少,具有很強(qiáng)的非線性映射能力,故所建立的GRNN預(yù)測(cè)模型的運(yùn)行速度、預(yù)測(cè)準(zhǔn)確性都明顯優(yōu)于BP網(wǎng)絡(luò),可以較好地完成寫(xiě)作成績(jī)預(yù)測(cè)任務(wù),具有較強(qiáng)的實(shí)際操作性。
[1]丁碩,常曉恒,巫慶輝,等.基于GRNN與BPNN的二維向量模式分類對(duì)比研究[J].國(guó)外電子測(cè)量技術(shù),2014,33(5):56-58.
[2]王曉光,周慧,張有君.應(yīng)用GRNN模型對(duì)給水管網(wǎng)水質(zhì)的綜合評(píng)價(jià)[J].沈陽(yáng)理工大學(xué)學(xué)報(bào),2011,30(4):63-66.
[3]DING Shuo,CHANG Xiao-heng,WU Qing-hui.A Study on Approximation Performances of General Regression Neural Network[J].Applied Mechanics and Materials,2014(441): 713-716.
[4]DING Shuo,CHANG Xiao-heng,WU Qing-hui.Application of General Regression Neural Network in Characteristic Curve Fitting of Optical Fiber Micro-bend Sensor[J].Applied Mechanics and Materials,2014(441):116-119.
[5]丁碩,常曉恒,巫慶輝.GRNN與BPNN的函數(shù)逼近性能對(duì)比研究[J].現(xiàn)代電子技術(shù),2014,37(7):114-117.
[6]賈花萍.GRNN神經(jīng)網(wǎng)絡(luò)在電力系統(tǒng)負(fù)荷預(yù)報(bào)中的應(yīng)用[J].電子設(shè)計(jì)工程,2012,20(3):14-16.
[7]郭婉娥.Elman與GRNN神經(jīng)網(wǎng)絡(luò)模型在水環(huán)境承載力評(píng)價(jià)中的應(yīng)用——以文山州區(qū)域水環(huán)境承載力評(píng)價(jià)為例[J].水資源與水工程學(xué)報(bào),2013,24(4):184-188.
[8]何漢林,孟愛(ài)華,祝甲明,等.基于優(yōu)化的GRNN和BP神經(jīng)網(wǎng)絡(luò)的磁滯曲線擬合對(duì)比分析[J].機(jī)電工程,2013,30(1): 116-120.
【相關(guān)參考文獻(xiàn)鏈接】
楊藝,虎恩典.基于S函數(shù)的BP神經(jīng)網(wǎng)絡(luò)PID控制器及Simulink仿真[J].2014,22(4):29-31.
任偉建,陳奕君.基于神經(jīng)網(wǎng)絡(luò)的移動(dòng)機(jī)器人多傳感器數(shù)據(jù)融合研究.2014,22(12):5-8.
李鋼,呂國(guó)芳.基于正則化RBF神經(jīng)網(wǎng)絡(luò)的混凝土強(qiáng)度預(yù)測(cè)[J]. 2014,22(13):52-54.
閆妍,張?jiān)迄i,張一弛,等.基于BP神經(jīng)網(wǎng)絡(luò)的食品價(jià)格的預(yù)測(cè)[J].2014,22(15):47-49.
劉朝云,翟春燕,李書(shū)臣,等.神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)在電機(jī)故障診斷中的應(yīng)用[J].2014,22(15):159-161.
費(fèi)晶,李趙興.基于BP和RBF神經(jīng)網(wǎng)絡(luò)的新型融合技術(shù)研究[J]. 2014,22(17):96-98.
管艷娜,李孝安.基于神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)的推理研究[J].2014,22(20):20-22.
鄒云.基于神經(jīng)網(wǎng)絡(luò)的海面溢油圖像分類算法[J].2014,22 (20):168-170.
樊潤(rùn)潔,朱亞男.基于神經(jīng)網(wǎng)絡(luò)的傳感器非線性誤差校正方法[J].2014,22(23):56-59.
Study of application of GRNN in student writing score prediction
HU Shuai,GU Yan,JIANG Hua
(Teaching and Research Institute of Foreign Languages,Bohai University,Jinzhou 121013,China)
Prediction of student English writing scores is influenced by various factors.It has high dimensional and nonlinear features.A prediction model of students’English writing scores was established in this paper.The model was based on the algorithm principle of generalized regression neural networks(GRNN).Its prediction result was analyzed and compared with that of a BP neural network model improved by resilient back-propagation.The simulation results indicate that:the largest relative error of prediction produced by improved BP neural network model is 3.23%,while the one produced by GRNN model isonly-0.72%.This implies that the GRNN model has higher prediction accuracy,better generalization ability,faster convergence speed and less adjusting parameters.Thus the feasibility of applying GRNN to English writing score prediction is verified.
general regression neural network;BP neural network;score prediction model
TN609
A
1674-6236(2016)11-0015-03
2015-07-14稿件編號(hào):201507105
遼寧省教育廳科學(xué)研究一般項(xiàng)目(W2015015);遼寧省社會(huì)科學(xué)基金資助項(xiàng)目(L14CYY022)
胡 帥(1980—),女,黑龍江雙鴨山人,碩士,講師。研究方向:語(yǔ)料庫(kù)語(yǔ)言學(xué)、神經(jīng)網(wǎng)絡(luò)理論及其應(yīng)用研究。