• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)據(jù)挖掘在高校學生成績預警中的應用研究

      2017-04-10 07:37:37陳苗馬燕
      電腦知識與技術(shù) 2017年4期
      關(guān)鍵詞:學生成績Apriori算法關(guān)聯(lián)規(guī)則

      陳苗++馬燕

      摘要:隨著高校教務系統(tǒng)數(shù)據(jù)庫中大量數(shù)據(jù)的積累,教師卻難以從中獲取有價值的信息。針對此現(xiàn)狀,利用數(shù)據(jù)挖掘中的Apriori算法,挖掘出頻繁項集的特點,通過Apriori算法對學生成績進行分析處理,預設支持度與置信度找出數(shù)據(jù)庫中具有聯(lián)系和不同可信度的課程成績作為關(guān)聯(lián)規(guī)則,將關(guān)聯(lián)規(guī)則用于學生成績預警,對處于危險區(qū)的學生提前作出預警通知。

      關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則 ;Apriori算法;學生成績;預警

      中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2017)04-0204-03

      伴隨著信息時代的飛速發(fā)展,數(shù)據(jù)大量積累,數(shù)據(jù)挖掘應運而生,并得到了廣泛關(guān)注。數(shù)據(jù)挖掘技術(shù)之所以能取得極大的關(guān)注,主要是可以處理的大量數(shù)據(jù),將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識。隨著高校的不斷擴招,各校的生源量明顯增多,但就特別容易出現(xiàn)學生層次不均、成績參差不齊的現(xiàn)象。目前大部分高校教務處都是利用教務管理系統(tǒng)對學生的信息及成績進行管理,但都存在沒有對學生的數(shù)據(jù)進行統(tǒng)計和分析的問題。本文將通過導出學生的專業(yè)主干課程的成績,并對其進行統(tǒng)計和分析,對部分不及格課程門數(shù)較多,即將面臨畢不了業(yè)或拿不到學位證的學生提出預警,對他們的學習過程進行監(jiān)督。眾所周知,同一專業(yè)不同的課程之間必然存在著一定的聯(lián)系,本文通過利用數(shù)據(jù)挖掘技術(shù)對學生成績進行統(tǒng)計、處理和全面的分析,挖掘出學生在各個課程成績之間存在的內(nèi)在聯(lián)系,找出其中的關(guān)系,全面掌握學生的學習情況,從而對這些成績不及格門數(shù)較多的學生提出預警,在今后的學習中,輔導員可根據(jù)分析結(jié)果加強對這些學生的學習過程的監(jiān)督和管理,提升學生的及格率,更進一步的保證學校的畢業(yè)率。

      1關(guān)聯(lián)規(guī)則算法:Apriori算法

      1.1關(guān)聯(lián)規(guī)則

      設[II1,I2,…Im]為項的集合,與任務相關(guān)的數(shù)據(jù)[D]是數(shù)據(jù)庫事務的集合,其中每個任務T是項的集合,其中每個任務T是項的集合,使得[T?TID]為每個事務的標識符。設[A]是一個項集,事務T包含[A]當且僅當[A?T]。關(guān)聯(lián)規(guī)則形如[如A?B的蘊涵式],其中[A?I,B?I],并且滿足[A?B=?]。規(guī)則[A?B]在事務集[D]中成立,具有支持度[s],其中[s]是[D]中事務包含[A?B](即集合[A和B]的并或者[A和B]二者)的百分比,即是概率[P(A?B)],規(guī)則[A?B]在事務集[D]中具有置信度,其中[c是D]中包含[A]的事務,同時也包含[B]的百分比。這是條件概率。即[supportA?B=P(A∪B)]

      [confidenceA?B=P(B|A)]

      同時滿足最小支持度閾值([min_sup])和最小置信閾值[(min_conf)]的規(guī)則稱作強規(guī)則【5】。

      1.2 Apriori算法

      Apriori算法發(fā)現(xiàn)關(guān)聯(lián)規(guī)則挖掘過程分解步驟:

      1)通過采用迭代的方法檢索出事務數(shù)據(jù)庫中所有頻繁項集。即找出事務數(shù)據(jù)庫D中所有大于等于指定最小支持度閾值的項目集。

      2)利用頻繁項目集挖掘出滿足用戶需要的強關(guān)聯(lián)規(guī)則。即找出支持度和置信度大于等用戶給定的支持度和置信度閾值的關(guān)聯(lián)規(guī)則。

      尋找頻繁項集是挖掘關(guān)聯(lián)的最核心的一步,對挖掘關(guān)聯(lián)規(guī)則的總體性能起到了決定性的作用。第二步是在第一步找到的頻繁項集的基礎(chǔ)上列出所有可能的關(guān)聯(lián)規(guī)則,同時,找出滿足支持度和置信度要求的強關(guān)聯(lián)規(guī)則即可【5】。

      2 Apriori算法在學生成績分析中的應用

      2.1數(shù)據(jù)預處理

      以某大學2013級計算機科學與技術(shù)專業(yè)學生的專業(yè)課程成績?yōu)槔绫?所示,從教務管理系統(tǒng)中導出該班級的成績,利用關(guān)聯(lián)規(guī)則算法挖掘課程和學生成績之間關(guān)系。原始數(shù)據(jù)表分學年進行存儲,其中包括本學年的班級所有學生的專業(yè)必修課和專業(yè)選修課的成績。

      2.1.1課程選擇

      相比而言,學生公選課程范圍比較廣,甚至會出現(xiàn)一個班級只有一名學生選擇同一門課程的現(xiàn)象,即僅有一個事務包含此項目,不滿足關(guān)聯(lián)規(guī)則的最小支持度的要求。根據(jù)2013級計算機專業(yè)的成績單顯示,同班學生選擇同一門公選課的較少,所以公選課的成績不作為數(shù)據(jù)來源,不對此進行分析。因此,數(shù)據(jù)庫的數(shù)據(jù)包含學生的專業(yè)必修課成績和專業(yè)選修課成績。

      2.1.2成績離散化處理

      學生的原始成績由百分制或等級制表現(xiàn)出來的,我們需要將這些成績進行統(tǒng)一化處理,將成績分為4個類別。百分制成績劃分如下:成績大于或等于90分,等級為1;成績大于等于80且小于90分,等級為2;成績大于等于60且小于80分的等級為3;成績小于60,成績等級為4。根據(jù)本專業(yè)的人才培養(yǎng)方案,選取15門課程進行研究,分別對這些課程用字母A~O進行標識。

      2.2數(shù)據(jù)處理

      2.2.1數(shù)據(jù)轉(zhuǎn)化

      根據(jù)成績等級劃分規(guī)則和課程標識碼,將該班級學生的課程成績做成事務表,轉(zhuǎn)化后的數(shù)據(jù)如表2所示。

      2.2.2數(shù)據(jù)統(tǒng)計

      從教務處系統(tǒng)中導出來的成績可能出現(xiàn)重復或者學生缺考導致成績空缺的現(xiàn)象。對于重復的數(shù)據(jù),選擇學生初修成績,將缺考的成績修改為0。統(tǒng)計離散化后全部成績,得到的部分統(tǒng)計結(jié)果如下:

      [等級 課程\&高等數(shù)學1\&電工技術(shù)基礎(chǔ)\&計算機導論\&C語言程序設計\&高等數(shù)學2\&線性代數(shù)\&數(shù)字邏輯電路\&數(shù)據(jù)結(jié)構(gòu)\&離散數(shù)學\&匯編語言程序設計\&網(wǎng)站建設與

      網(wǎng)頁制作\&…\&等級1\&1\&2\&1\&1\&1\&2\&3\&4\&2\&3\&1\&…\&等級2\&2\&6\&6\&7\&4\&8\&4\&7\&3\&3\&15\&…\&等級3\&16\&13\&15\&15\&14\&12\&16\&10\&14\&14\&7\&…\&等級4\&4\&2\&0\&0\&4\&1\&0\&2\&4\&3\&0\&…\&]

      由表3可以看出,部分課程集中于某一個等級,如”高等數(shù)學”課程,16人等級為4,其他等級人數(shù)7人,該班級的人數(shù)為23,其余7名同學所占比例7/23,即關(guān)聯(lián)規(guī)則的最小支持度不到1/3。設定關(guān)聯(lián)規(guī)則的最小支持度為1/3,當某門課程等級學生不足7名時,將其排除在待數(shù)據(jù)挖掘數(shù)據(jù)庫中。通過統(tǒng)計,得到如下以0.33作為最小支持度篩選的數(shù)據(jù)。

      [等級 課程\&高等數(shù)學1\&電工技術(shù)基礎(chǔ)\&計算機導論\&C語言程序設計\&高等數(shù)學2\&線性代數(shù)\&數(shù)字邏輯電路\&數(shù)據(jù)結(jié)構(gòu)\&離散數(shù)學\&匯編語言程序設計\&網(wǎng)站建設與

      網(wǎng)頁制作\&…\&等級1\&1\&2\&1\&1\&1\&2\&3\&4\&2\&3\&1\&…\&等級2\&2\&6\&6\&7\&4\&8\&4\&7\&3\&3\&15\&…\&等級3\&16\&13\&15\&15\&14\&12\&16\&10\&14\&14\&7\&…\&等級4\&4\&2\&0\&0\&4\&1\&0\&2\&4\&3\&0\&…\&]

      2.3算法實現(xiàn)

      通過對數(shù)據(jù)的預處理,我們采用關(guān)聯(lián)規(guī)則Apriori算法對數(shù)據(jù)進行挖掘。本文的實現(xiàn)環(huán)境為Window 7 系統(tǒng),MATLAB2014a下進行編程。設置最小支持度為0.33,最小置信度為0.5。得到了352個頻繁項集,540條關(guān)聯(lián)規(guī)則。對部分結(jié)果進行分析可知課程A、課程E、課程F存在著兩兩相關(guān)、相互制約的關(guān)系,學生的成績普遍較低,課程C與課程G、課程D與課程H也存在著兩兩相關(guān)、互相影響的關(guān)系。通過對數(shù)據(jù)表的檢索,可找出符合此關(guān)聯(lián)規(guī)則的學生,由輔導員對這些學生發(fā)出預警通知。本文通過對學生實際成績數(shù)據(jù)進行檢驗,對以上規(guī)則進行驗證。通過提出預警,加強對學生的學習過程的監(jiān)督和管理,有效避免學生出現(xiàn)不能畢業(yè)或拿不到學位證的情況。

      3 結(jié)束語

      總之,以關(guān)聯(lián)規(guī)則算法為基礎(chǔ),通過對學生成績的處理、統(tǒng)計、分析和挖掘,,得到了關(guān)聯(lián)規(guī)則作為學生成績的預警因子,對成績不理想的學生提出預警通知,一方面加強了對學生成績的管理,另一方面也有效的提升教學管理水平和學生的畢業(yè)率。但Apriori算法過于繁雜,可通過改進Apriori算法來提高檢索效率,從而不斷完善成績預警,更好地為教育事業(yè)服務。

      參考文獻:

      [1] 李紅林,孔德劍.基于Apriori算法的高教教學評價數(shù)據(jù)挖掘[J].中國科技信息,2010,22(21):241-242.

      [2] 袁漢寧,王樹良.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].北京:人民郵電出版社,2015:126-127.

      [3] 張皓.數(shù)據(jù)挖掘技術(shù)在構(gòu)建學生成績預警系統(tǒng)的應用[J].電腦知識與技術(shù),2011,19(7):4529-4530

      [4] 張瑋.基于數(shù)據(jù)挖掘的高校學生成績預警系統(tǒng)設計[J].科技資訊,2013(6):23.

      [5] Jiawei Han, Micheline Kamber.Data Mining Concepts and Techniques[M].北京:機械工業(yè)出版社,2011.

      [6] 梁嘯.基于數(shù)據(jù)挖掘的高校學生成績預警技術(shù)的研究[D].武漢:武漢理工大學,2014:33-35.

      猜你喜歡
      學生成績Apriori算法關(guān)聯(lián)規(guī)則
      淺析數(shù)據(jù)挖掘技術(shù)在學生管理系統(tǒng)中的應用
      東方教育(2016年20期)2017-01-17 20:57:58
      基于Hadoop平臺的并行DHP數(shù)據(jù)分析方法
      基于Apriori算法的高校學生成績數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析
      基于云平臺MapReduce的Apriori算法研究
      關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
      數(shù)據(jù)挖掘在高校課堂教學質(zhì)量評價體系中的應用
      高職數(shù)學分層教學學生成績評價的數(shù)學模型
      關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進
      中國市場(2016年36期)2016-10-19 04:10:44
      基于關(guān)聯(lián)規(guī)則的計算機入侵檢測方法
      Excel+VBA開發(fā)之《學生成績管理系統(tǒng)》的設計與實現(xiàn)
      富川| 通江县| 凌云县| 浦江县| 东丰县| 德惠市| 盐津县| 彩票| 杭州市| 龙山县| 芦山县| 伊通| 鞍山市| 上杭县| 安化县| 昭觉县| 定结县| 宜兰市| 武乡县| 英超| 南京市| 瓦房店市| 大田县| 商河县| 平阴县| 依安县| 红桥区| 甘肃省| 常宁市| 松潘县| 南漳县| 韩城市| 临沧市| 铁力市| 富平县| 麻江县| 德清县| 滦平县| 桑植县| 会东县| 安仁县|