郝小靜
摘要:現(xiàn)今的教育領(lǐng)域中應(yīng)用先進(jìn)的技術(shù)對學(xué)生學(xué)習(xí)成績進(jìn)行評價和分析,能節(jié)省教師更多的時間,并能提高對學(xué)生成績的準(zhǔn)確的評價?;谶@樣的原因,在此次的研究中,對數(shù)據(jù)挖掘技術(shù)的英語成績評價進(jìn)行分析和研究,主要從數(shù)據(jù)挖掘的方法、數(shù)據(jù)準(zhǔn)備和數(shù)據(jù)模型進(jìn)行分析和探討。望此次的論述能為現(xiàn)今英語教學(xué)效果評價體系的建立,提供可行性的建議,進(jìn)而提升對學(xué)生英語成績評價結(jié)果的準(zhǔn)確性。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù) 英語成績評價 數(shù)據(jù)庫
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2016)12-0246-01
目前,在現(xiàn)今的高校教育體系中,教學(xué)管理方面涉及到眾多的地?cái)?shù)據(jù),但是現(xiàn)今在對教學(xué)數(shù)據(jù)進(jìn)行管理的技術(shù)仍舊停留在查詢、備份和統(tǒng)計(jì)的階段,對學(xué)生學(xué)習(xí)狀況予以該種的管理方式,未能真實(shí)的反應(yīng)出學(xué)生實(shí)際的學(xué)習(xí)狀況。因此,本文從以下幾個方面進(jìn)行具體論述。
1 數(shù)據(jù)挖掘技術(shù)使用分析
1.1 項(xiàng)目簡介
在現(xiàn)今的高校中,教師積累了大量學(xué)生英語考試成績的數(shù)據(jù),對學(xué)生英語成績評價的分析和評價的標(biāo)準(zhǔn)為優(yōu)、良、中、及格、不及格等,對于學(xué)生取得成績的影響因素的了解不深。在此次研究中,主要對A高校財(cái)會管理專業(yè)986名學(xué)生的英語成績作為研究數(shù)據(jù),通過對英語考試成績學(xué)生分?jǐn)?shù)的情況分析出影響學(xué)生成績主要因素,進(jìn)而輔助教師制定針對性教學(xué)改進(jìn)方法,提升學(xué)生的英語成績。
1.2 數(shù)據(jù)挖掘方法的使用
在此次研究中,數(shù)據(jù)挖掘的方法主要采用ID3的運(yùn)算方法,在對該課題進(jìn)行研究的過程中,主要采用決策樹當(dāng)中的ID3的計(jì)算方法對學(xué)生英語考試成績進(jìn)行系統(tǒng)的分析和研究,由于該種算法的理論較為清晰,對數(shù)據(jù)和信息處理的能力較強(qiáng),適合對海量學(xué)習(xí)方面的數(shù)據(jù)進(jìn)行管理[1]。
2 數(shù)據(jù)挖掘技術(shù)在英語評價中的實(shí)施探究
2.1 數(shù)據(jù)準(zhǔn)備
由于數(shù)據(jù)準(zhǔn)備屬于整個研究過程中較為重要的環(huán)節(jié),要對研究的數(shù)據(jù)進(jìn)行處理,首先,對研究數(shù)據(jù)進(jìn)行清理,在該高校的專業(yè)中,由于存在缺考和取消考試成績的現(xiàn)象存在,對該部分的數(shù)據(jù)進(jìn)行清理,得到最終有效數(shù)據(jù)為980條。其次,要對數(shù)據(jù)進(jìn)行的總結(jié)和歸納,對英語考試成績中各種題型及其屬性生成決策樹的模型,并構(gòu)建學(xué)生英語考試成績的數(shù)據(jù)分析圖表。最后,要對數(shù)據(jù)進(jìn)行轉(zhuǎn)換,在完成決策樹的過程中需要應(yīng)用離散值,學(xué)生英語考試成績是呈連續(xù)值出現(xiàn)的,在研究的過程中,應(yīng)轉(zhuǎn)化成離散值,在此次研究中,主要將考試成績劃分為兩種:一種是成績合格,其分?jǐn)?shù)段為60~100分;另一種是不合格,分?jǐn)?shù)為0~60分。
2.2 數(shù)據(jù)模型系統(tǒng)構(gòu)建
通過基礎(chǔ)數(shù)據(jù)集的編輯,各個題型分?jǐn)?shù)等級為:A(優(yōu))、B(良)、C(不合格),四種題型(語法結(jié)構(gòu)、完形填空、閱讀理解、翻譯)中,得到兩個C等級的分?jǐn)?shù),則視為學(xué)生英語總成績?yōu)椴缓细?。根?jù)這樣的計(jì)算方法來建立決策樹,首先,對研究對象的所有數(shù)據(jù)進(jìn)行計(jì)算,將成績合格來分類即合格與不合格。其次,對所有數(shù)據(jù)的信息量進(jìn)行計(jì)算,通過使用ID3的算法對研究數(shù)據(jù)進(jìn)行計(jì)算得知,各個題型的信息量分別為:
E=(語法結(jié)構(gòu))=0.9478
E=(閱讀理解)=0.9482
E=(完形填空)=0.9324
E=(翻譯)=0.9381
再者,對四種題型得分?jǐn)?shù)據(jù)繼續(xù)進(jìn)行細(xì)化,計(jì)算出英語測試屬性中信息的增益率,得到的計(jì)算結(jié)果為:
Gain(語法結(jié)構(gòu))=0.0121
Gain(閱讀理解)=0.0122
Gain(完形填空)=0.0254
Gain(翻譯)=0.0217
最后,通過對每項(xiàng)英語測試的結(jié)果進(jìn)行分析得知,在四項(xiàng)英語考試成績中,增益率較高的考試類型是完形填空,其對學(xué)生英語考試成績的影響較大,由于該項(xiàng)研究內(nèi)容的信息增益率同其他項(xiàng)目相比較高,選擇將其作為測試的屬性[2]。創(chuàng)建出研究和測試的節(jié)點(diǎn),將完形填空作為標(biāo)記,然后將其他三項(xiàng)考試類型的屬性值最為分支,進(jìn)而生成評價學(xué)生英語成績是否合格的決策樹模型。
在學(xué)生學(xué)習(xí)英語課程的過程中,影響學(xué)生英語水平和考試成績的因素一直未能確定,通過ID3的計(jì)算方式,能將影響學(xué)生英語考試成績的因素分析出來。基于這樣的狀況,以分類為合格的方式為此次研究中最應(yīng)遵守的原則,從上圖的分析中得到學(xué)生英語成績評價和分析的計(jì)算方法:
If:完形填空=A and翻譯=A and語法結(jié)構(gòu)=A,Then:總成績=合格
If:完形填空=A and翻譯=C and閱讀理解=A,Then:總成績=合格
If:完形填空=A and翻譯=B and閱讀理解=A,Then:總成績=合格
If:完形填空=A and翻譯=C and語法結(jié)構(gòu)=A,閱讀理解=B,Then:總成績=合格
If:完形填空=A and翻譯=A and閱讀理解=A and語法結(jié)構(gòu)=B,Then:總成績=合格
……
通過對學(xué)生考試成績的分析得知,影響高校學(xué)生英語考試成績的主要的因素是完形填空題型解題方面,由于其包含了眾多的英語知識,即語法、翻譯和閱讀理解等方面的英語知識。
3 結(jié)語
在本文的論述中,主要針對高校學(xué)生英語考試評價方面,利用數(shù)據(jù)挖掘技術(shù)的相應(yīng)處理和計(jì)算,來掌握影響學(xué)生英語考試成績的重要因素。在此次研究中,從介紹研究對象和數(shù)據(jù)處理方式方法開始,對英語考試中數(shù)據(jù)的屬性進(jìn)行細(xì)化,從四項(xiàng)英語題型合格的信息量和增益率的角度對題型進(jìn)行劃分,從而探索出影響學(xué)生英語考試成績的主要因素,并在文中對學(xué)生英語考試成績合格評價決策樹進(jìn)行構(gòu)建,進(jìn)而得到評價學(xué)生英語考試合格的準(zhǔn)確方法。通過本文的論述得知,ID3的計(jì)算方法,對數(shù)據(jù)處理的能力較強(qiáng),適用于對學(xué)生英語成績評價和分析,望此次的研究結(jié)果能為高校教師和學(xué)生提供教學(xué)和學(xué)習(xí)的輔助方法,提升學(xué)生的學(xué)習(xí)成績。
參考文獻(xiàn)
[1]王士虎,呂紀(jì)榮,馮波 等.基于數(shù)據(jù)挖掘的英語四級成績分析與預(yù)測[J].電腦知識與技術(shù),2014,03:452-454.
[2]吳燕萍,樓彩虹,沈清 等.數(shù)據(jù)挖掘技術(shù)在高職高專醫(yī)學(xué)生綜合學(xué)業(yè)成績評價中的應(yīng)用[J].中國高等醫(yī)學(xué)教育,2014,05:40-41.