王峻
摘要:決策樹是數(shù)據(jù)挖掘技術(shù)中一種有指導(dǎo)的分類方法,它可以通過構(gòu)建決策樹對(duì)數(shù)據(jù)進(jìn)行分類預(yù)測(cè)。課堂教學(xué)評(píng)價(jià)是目前高校普遍采用的一種課堂教學(xué)評(píng)價(jià)方法,運(yùn)用決策樹算法對(duì)課堂教學(xué)評(píng)價(jià)數(shù)據(jù)進(jìn)行分析,構(gòu)建課堂教學(xué)效果的決策樹模型,挖掘出影響課堂教學(xué)效果的關(guān)鍵因素為教師有針對(duì)性地改進(jìn)課堂教學(xué)方法、提高課堂教學(xué)質(zhì)量提供科學(xué)有效的參考依據(jù)。
關(guān)鍵詞:數(shù)據(jù)挖掘;決策樹;課堂教學(xué);評(píng)價(jià)
中圖分類號(hào): TP301.6? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)36-0104-02
Abstract: Decision tree is a kind of guided classification method in data mining technology. It can classify and forecast data by constructing decision tree.Classroom teaching evaluation is a kind of classroom teaching evaluation method widely used in colleges and universities at present. The decision tree algorithm is used to analyze the data of classroom teaching evaluation and to construct the decision tree model of classroom teaching effect, on the one hand, we can find out the key factors that affect the classroom teaching effect, and on the other hand, we can predict the teacher's classroom teaching effect, it provides a scientific and effective reference for teachers to improve classroom teaching methods and improve the quality of classroom teaching.
Key words: Data Mining; Association Rules; Classroom teaching; Evaluation
隨著高等院校教學(xué)管理工作逐步信息化,在教學(xué)和管理過程中聚集了大量的、原始的教學(xué)信息,需要運(yùn)用數(shù)據(jù)挖掘技術(shù)進(jìn)行更深入的數(shù)據(jù)分析。數(shù)據(jù)挖掘是從大量數(shù)據(jù)中挖掘出隱含的、人們之前未知的信息和知識(shí)的過程[1][2]。決策樹是數(shù)據(jù)挖掘技術(shù)中一種分類方法,通過構(gòu)建決策樹發(fā)現(xiàn)一些對(duì)決策有價(jià)值的信息。目前各高校每學(xué)期都要進(jìn)行課堂教學(xué)測(cè)評(píng),本文運(yùn)用決策樹算法對(duì)課堂教學(xué)評(píng)價(jià)數(shù)據(jù)進(jìn)行分析,探討課堂教學(xué)效果與教學(xué)環(huán)節(jié)之間的必然聯(lián)系,為教學(xué)部門提供決策支持信息, 促使教師更好地開展教學(xué)工作, 提高教學(xué)質(zhì)量。
1 決策樹分類方法
1.1 決策樹分類算法
決策樹分類方法是從大量數(shù)據(jù)中推理出對(duì)決策有價(jià)值的分類規(guī)則[3]。決策樹分類算法[4]通過信息增益值在屬性中合理地選擇根節(jié)點(diǎn)和內(nèi)部節(jié)點(diǎn),采用自上而下的遞歸算法構(gòu)造一顆決策樹。目前決策樹分類算法中最著名的算法是Quldan提出的ID3算法、C4.5算法[5]。
1.2 ID3算法
ID3算法是選擇信息增益值最大的屬性作為測(cè)試屬性,構(gòu)建一棵易于分類的決策樹。
信息增益的計(jì)算方法[4]:
ID3算法是選擇具有最大信息增益值的屬性作為當(dāng)前的測(cè)試屬性,由此形成相對(duì)應(yīng)的分支節(jié)點(diǎn)。
2 決策樹在課堂教學(xué)評(píng)價(jià)中的應(yīng)用
2.1 數(shù)據(jù)來(lái)源
實(shí)驗(yàn)數(shù)據(jù)選擇淮南師范學(xué)院計(jì)算機(jī)專業(yè)學(xué)生的課堂教學(xué)評(píng)價(jià),共有410條評(píng)價(jià)信息。
2.2 數(shù)據(jù)預(yù)處理
課堂評(píng)價(jià)指標(biāo)[6]共有14項(xiàng),為了便于數(shù)據(jù)的統(tǒng)計(jì)分析,將14項(xiàng)指標(biāo)歸納為教學(xué)態(tài)度、教學(xué)組織、教學(xué)方法、專業(yè)水平四大類,課堂教學(xué)的總體評(píng)價(jià)按照總分大于等于90分為優(yōu),小于90分為非優(yōu)。部分課堂教學(xué)評(píng)價(jià)數(shù)據(jù)如表1所示:
2.3 實(shí)驗(yàn)過程及實(shí)驗(yàn)結(jié)果分析
2.3.1 屬性信息增益值,以職稱為例
屬性“職稱”的信息增益值最大,將該屬性作為決策樹的根節(jié)點(diǎn)。依此方法分支,再依次分別計(jì)算下一層節(jié)點(diǎn)的信息增益值。
2.3.2 構(gòu)建以總體評(píng)價(jià)為葉子節(jié)點(diǎn)的決策樹
職稱的信息增益值最大,作為根節(jié)點(diǎn)的測(cè)試屬性,以此依次構(gòu)建決策樹,決策樹圖例如圖1所示:
2.3.3 實(shí)驗(yàn)結(jié)果分析
1)職稱是決策樹分類的重要屬性,職稱是教師教學(xué)能力的綜合體現(xiàn)。
2)影響課堂教學(xué)效果的因素各不相同。對(duì)于副教授,教學(xué)方法是影響教學(xué)效果的重要因素;對(duì)于講師,專業(yè)水平是影響教學(xué)效果的重要因素;對(duì)于助教,教學(xué)組織是影響教學(xué)效果的重要因素。
3)由決策樹圖例可以清晰地得到if-then規(guī)則,例如if(職稱=副教授)and(教學(xué)方法=優(yōu))and(教學(xué)組織=優(yōu))then(總體評(píng)價(jià)優(yōu)秀)等。
3 總結(jié)
本文運(yùn)用決策算法對(duì)課堂教學(xué)測(cè)評(píng)數(shù)據(jù)進(jìn)行分析,通過構(gòu)建課堂教學(xué)效果的決策樹模型,挖掘出影響課堂教學(xué)效果的重要因素為教師有針對(duì)性地改進(jìn)課堂教學(xué)方法、提高課堂教學(xué)質(zhì)量提供科學(xué)有效的參考依據(jù)。
參考文獻(xiàn):
[1] (加)Jiawei Han;Micheline Kamber,范明,孟小峰.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2007.
[2] 王振武,徐慧.數(shù)據(jù)挖掘算法原理與實(shí)現(xiàn)[M].北京:清華大學(xué)出版社,2015.
[3] 袁燕.決策樹算法在高校教學(xué)評(píng)價(jià)系統(tǒng)中的應(yīng)用[J].浙江海洋學(xué)院學(xué)報(bào)(自然科學(xué)版),2006,25(4):440-444.
[4] 毛國(guó)君,段立娟.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2009.
[5] 李如平.數(shù)據(jù)挖掘中決策樹分類算法的研究[J].東華理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,33(2):192-196.
[6] 蔣秀英.關(guān)聯(lián)規(guī)則在課堂教學(xué)評(píng)價(jià)中的應(yīng)用[J].山東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2003,18(3):25-28.
【通聯(lián)編輯:梁書】