袁煒文
摘要:中職學(xué)校的信息化建設(shè)是提高教學(xué)質(zhì)量的手段,本文通過數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)的結(jié)合為學(xué)生成績分析提供了必要的技術(shù)手段。通過數(shù)據(jù)倉庫和有關(guān)的數(shù)據(jù)挖掘的技術(shù),探討了中職學(xué)校基于數(shù)據(jù)挖掘的方法在學(xué)生成績中的應(yīng)用,根據(jù)成績分析可以為學(xué)校積累大量關(guān)于教務(wù)的管理,通過采用數(shù)據(jù)挖掘技術(shù)可以提高學(xué)校教學(xué)質(zhì)量和課程開設(shè)的信息。為我校利用挖掘結(jié)果來指導(dǎo)教學(xué)管理和決策,為學(xué)校實(shí)現(xiàn)教學(xué)信息化管理。
關(guān)鍵詞:數(shù)據(jù)挖掘;數(shù)據(jù)倉庫;成績管理
中圖分類號: TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)11-0021-02
1 前言
隨著職業(yè)教育飛速發(fā)展,提高中職學(xué)校學(xué)生教學(xué)質(zhì)量的手段多種多樣,但是信息技術(shù)的已被大家認(rèn)同,中職學(xué)校近幾年信息化建設(shè)投入較大,為了實(shí)現(xiàn)我校信息化管理水平,我校開發(fā)了八大管理系統(tǒng)和十四個(gè)模塊,其中教學(xué)管理系統(tǒng)是較重要的一個(gè)管理系統(tǒng)之一,教務(wù)教學(xué)管理是中職學(xué)校靈魂,在教務(wù)和教學(xué)管理中從事教學(xué)計(jì)劃編排、老師課表的安排、學(xué)生成績管理、學(xué)生學(xué)籍管理和教師的教學(xué)評教管理等工作。教學(xué)管理中的成績管理是必不可少的一個(gè)重要模塊。當(dāng)前,多數(shù)管理系統(tǒng)都沒有提供學(xué)校所需的決策能力,沒有對中職學(xué)校學(xué)生成績做良好分析和歸類,影響教務(wù)教學(xué)管理人員對學(xué)校辦學(xué)發(fā)展決策功能。我們拫據(jù)目前先進(jìn)的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)的結(jié)合用到中職學(xué)校的成績分析上,用先進(jìn)的技術(shù)手段,為管理者提供大量有用的數(shù)據(jù),通過數(shù)據(jù)可指導(dǎo)教務(wù)部門對教學(xué)做教學(xué)整改和教學(xué)診斷。本文是運(yùn)用先進(jìn)的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的技術(shù),并深入探討了數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的原理和方法,結(jié)合學(xué)校的教學(xué)管理,對大量的成績管理數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘和細(xì)詳分析和研究,可實(shí)現(xiàn)中職學(xué)校學(xué)生成績信息的分析和歸類,對指導(dǎo)學(xué)校對開設(shè)專業(yè)和課程進(jìn)行教學(xué)決策。
文章運(yùn)用的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的相關(guān)技術(shù),采用數(shù)據(jù)倉庫(Data Warehouse,簡稱DW)理論及方法,把數(shù)據(jù)挖掘(Data Mining,簡稱DM)當(dāng)做開發(fā)工具,可為中職學(xué)校學(xué)生教學(xué)和教務(wù)管理系統(tǒng)的學(xué)生成績決策。我們開發(fā)的管理系統(tǒng),用DW作為存放和管理中職學(xué)校學(xué)生信息及成績的數(shù)據(jù),而DM則運(yùn)用這些數(shù)據(jù),通過一定先進(jìn)的挖掘技術(shù),尋找到學(xué)校所需要的數(shù)據(jù)信息,通過數(shù)據(jù)預(yù)測出教務(wù)部門所需要的各種信息資源,對資源數(shù)據(jù)分析和歸類達(dá)到的管理層起到?jīng)Q策作用,使學(xué)校競爭中把握中職學(xué)校的發(fā)展方向。
2 中職學(xué)校學(xué)生成績管理數(shù)據(jù)挖掘技術(shù)
根據(jù)當(dāng)前我校管理所需信息系統(tǒng)的要求,首先要對數(shù)據(jù)進(jìn)行分析、綜合、歸類,并進(jìn)行數(shù)據(jù)抽象,建立數(shù)據(jù)倉庫,對數(shù)據(jù)倉庫的進(jìn)行數(shù)據(jù)整理和分析處理,為中職學(xué)校決策(管理)層提供決策數(shù)據(jù)。DM采用主要方法是大量的從不完全的應(yīng)用數(shù)據(jù)中,抽取我們所需要的有用的信息及數(shù)據(jù)的一系列的過程。DM是在一些存在的數(shù)據(jù)信息中找到一定有規(guī)則模式的決策過程。因?yàn)檫@種先進(jìn)技術(shù)利用目前數(shù)據(jù)庫中的數(shù)值型的結(jié)構(gòu)化數(shù)據(jù)外,它可以對一些非結(jié)構(gòu)化數(shù)據(jù)如:圖形、文本、WWW等資源的數(shù)據(jù)實(shí)行一定意義挖掘。
我們采用DM數(shù)據(jù)來尋找有一定的決策支持模式,不僅用在數(shù)據(jù)庫中,也可是集合了非結(jié)構(gòu)式文件系統(tǒng)和數(shù)據(jù)。對于決策者要得到的信息,自己運(yùn)用查詢工具直接可以獲取所需要信息,而部分隱藏在大量數(shù)據(jù)中所需信息就通過DM技術(shù)來得到。DM技術(shù)和DW都是為了從大量數(shù)據(jù)中得到對工作有價(jià)值的數(shù)據(jù),真正做到為中職學(xué)校所需要的、對學(xué)校發(fā)展有幫助的決策信息。這樣可以大大提高學(xué)校的質(zhì)量,加強(qiáng)中職學(xué)校教務(wù)教學(xué)管理的水平。
我們采用大型關(guān)系數(shù)據(jù)庫發(fā)現(xiàn)有價(jià)值模式,同樣對非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行一定的數(shù)據(jù)挖掘。用if--then規(guī)則進(jìn)行歸納、提取所要的數(shù)據(jù),中職學(xué)?,F(xiàn)在采用的管理信息系統(tǒng)一般是分類特性,所以中職學(xué)校的數(shù)據(jù)挖掘方法運(yùn)用分類模式分析和歸類的方法進(jìn)行。
3 學(xué)生成績數(shù)據(jù)挖掘模型
我們采用先進(jìn)的數(shù)據(jù)挖掘技術(shù)理論和方法,首先設(shè)計(jì)數(shù)據(jù)挖掘?qū)W生成績分析過程模型是必須要做的。
根據(jù)中職學(xué)校學(xué)生學(xué)習(xí)情況,我們建立成績數(shù)據(jù)挖掘主要參考圖1是所需過程模型,參考模型采用CRISP-DM(cross-industrystandard process for data mining)是 “跨行業(yè)數(shù)據(jù)挖掘過程標(biāo)準(zhǔn)”,過程模型KDD是在1999 年歐盟機(jī)構(gòu)聯(lián)合運(yùn)用,而CRISP-DM 模型比KDD 過程模型領(lǐng)先,而運(yùn)用量達(dá)到 60%以上。如圖1所示: CRISP-DM 模型已經(jīng)結(jié)合中職學(xué)校的發(fā)展情況,對中職學(xué)校學(xué)生成績數(shù)據(jù)挖掘,本身是中職學(xué)校為適應(yīng)社會發(fā)展的需求和中職學(xué)校全面推行信息化管理,近幾年,由于政府給中職學(xué)校的大力投入,許多中職學(xué)校開發(fā)了教務(wù)教學(xué)成績管理系統(tǒng),系統(tǒng)的采用可以提高了學(xué)校的管理水平,也為學(xué)校提供了大量的所需的成績。根據(jù)目前的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的原理,采用數(shù)據(jù)挖掘的相關(guān)技術(shù)(如關(guān)聯(lián)規(guī)則、決策樹等),結(jié)合學(xué)校的實(shí)際情況和大量成績數(shù)據(jù),采用先進(jìn)的數(shù)據(jù)倉庫并采用數(shù)據(jù)挖掘技術(shù),形成了學(xué)校所需要的學(xué)生成績數(shù)據(jù)挖掘規(guī)則,在這些規(guī)則數(shù)據(jù)基礎(chǔ)上,我們對成績數(shù)據(jù)實(shí)行多層次的分析和歸類,最終對其數(shù)據(jù)挖掘。數(shù)據(jù)挖掘流程采用六個(gè)方面內(nèi)容,整個(gè)過程參考圖2 流程。
4 數(shù)據(jù)挖掘成績管理系統(tǒng)設(shè)計(jì)
4.1數(shù)據(jù)挖掘成績管理系統(tǒng)的體系結(jié)構(gòu)
結(jié)合目前先進(jìn)的數(shù)據(jù)挖掘模型和數(shù)據(jù)挖掘技術(shù),根據(jù)中職學(xué)校學(xué)生成績要求,我們運(yùn)用該技術(shù)設(shè)計(jì)一個(gè)學(xué)生成績數(shù)據(jù)挖掘管理系統(tǒng),如圖 3 所示是系統(tǒng)的結(jié)構(gòu)。主要三個(gè)層次為:用戶層、功能模塊層和基礎(chǔ)數(shù)據(jù)庫層?;A(chǔ)數(shù)據(jù)庫層是最為關(guān)鍵的數(shù)據(jù)源庫、數(shù)據(jù)挖掘的方法模型及需用數(shù)據(jù)字典等知識。
圖示的數(shù)據(jù)源庫由教務(wù)管理人員對所需數(shù)據(jù)集成的學(xué)生成績數(shù)據(jù)庫。功能模塊層是數(shù)據(jù)挖掘流程及需求管理,需求描述、數(shù)據(jù)處理、方法及結(jié)果顯示。是最為重要的系統(tǒng)挖掘方法模型和規(guī)則分析結(jié)果等組成。
用戶層是全校教職工的信息。是不同管理層進(jìn)入系統(tǒng)的權(quán)限設(shè)置以及系統(tǒng)運(yùn)行所需的各種錄入?yún)?shù)等由系統(tǒng)通過用戶界面進(jìn)入數(shù)據(jù)庫服務(wù)器進(jìn)行設(shè)置。
4.2 系統(tǒng)的實(shí)現(xiàn)及挖掘結(jié)果
管理系統(tǒng)運(yùn)行后,所需學(xué)生成績典型分析如圖 4所示。其中是相關(guān)屬性之間的置信度和支持度。并獲得需要的有效評價(jià)體系。根據(jù)系統(tǒng)得到的結(jié)果可以提供給教務(wù)管理層提供有價(jià)值的成績數(shù)據(jù)。并對教學(xué)整改有很大的幫助。
5 結(jié)論
1)對數(shù)據(jù)挖掘方法進(jìn)行分析,采用關(guān)聯(lián)規(guī)則算法進(jìn)行了研究,并利用算法實(shí)現(xiàn)了學(xué)生成績分析中的應(yīng)用。
2)對中職學(xué)校教務(wù)管理提取了教師基本信息表、學(xué)生基本信息表、課程表以及學(xué)生選修表等部分?jǐn)?shù)據(jù),并對這些數(shù)據(jù)進(jìn)行了抽取和歸納,使之符合數(shù)據(jù)挖掘的要求,并消除了數(shù)據(jù)維數(shù)。
3)利用相應(yīng)數(shù)據(jù)挖掘軟件對上述數(shù)據(jù)進(jìn)行了數(shù)據(jù)挖掘,并展示挖掘結(jié)果。
參考文獻(xiàn):
[1] [ChinaKDD,2009a] chinaKDD,都有哪些數(shù)據(jù)挖掘軟件[EB/OL],2009-11-17.
[2] [chinaKDD,2009b] chinaKDD,KXEN 介紹.[EB/OL].2009-9-4.
[3] [CNKI,2008] CNKI.ScopeMiner—面向先進(jìn)制造企業(yè)的綜合數(shù)據(jù)挖掘系統(tǒng)[EB/OL],2008-5-25
[4] 楊靜,張楠男,李建,等.決策樹算法的研究與應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2010,20(2):114-116.