【摘 要】數(shù)據(jù)挖掘技術(shù)是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的有用信息和知識(shí)的過程.高校中學(xué)生管理工作是很繁瑣,采用數(shù)據(jù)挖掘技術(shù)能夠有效解決學(xué)生工作的繁瑣問題,高效有序?qū)崿F(xiàn)高效學(xué)生管理。
【關(guān)鍵詞】高校;學(xué)生;管理;數(shù)據(jù)挖掘
一、數(shù)據(jù)挖掘簡介
數(shù)據(jù)挖掘(DataMninig,簡稱DM)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又有潛在的有用信息和知識(shí)的過程,是數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)(簡稱KDD)的核心。知識(shí)發(fā)現(xiàn)(KDD)被認(rèn)為是從數(shù)據(jù)中發(fā)現(xiàn)有用知識(shí)的整個(gè)過程。數(shù)據(jù)挖掘只是數(shù)據(jù)庫中知識(shí)發(fā)現(xiàn)的一個(gè)步驟,但又是最重要的一步,它用專門算法從數(shù)據(jù)中抽取模式。人們把原始數(shù)據(jù)看作是形成知識(shí)的源泉,就像從礦石中采礦一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù),也可以是半結(jié)構(gòu)化的,如文本、圖形、圖像數(shù)據(jù),甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識(shí)的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)了的知識(shí)可以被用于信息管理、查詢優(yōu)化、決策支持、過程控制等,還可以用于數(shù)據(jù)自身的維護(hù)。因此,數(shù)據(jù)挖掘是一門廣義的交叉學(xué)科,它匯聚了不同領(lǐng)域的研究者,尤其是數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計(jì)、可視化、并行計(jì)算等方面的學(xué)者和工程技術(shù)人員。因?yàn)閿?shù)據(jù)挖掘算法的好壞將直接影響到KDD所發(fā)現(xiàn)知識(shí)的準(zhǔn)確性,而且目前KDD研究大部分集中在數(shù)據(jù)挖掘算法和應(yīng)用的技術(shù)上,因此人們往往不嚴(yán)格區(qū)分?jǐn)?shù)據(jù)挖掘和數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn),兩者互為使用。一般在科研領(lǐng)域中稱為KDD,而在工程領(lǐng)域則稱為數(shù)據(jù)挖掘。
二、數(shù)據(jù)挖掘過程
KDD過程如圖1所示。KDD過程可以概括為三部分:數(shù)據(jù)預(yù)處理(Data preproeessing),數(shù)據(jù)挖掘(DataMining)及結(jié)果的解釋和評估(Interpretation ?&Evaluation)。
三、數(shù)據(jù)挖掘在高校學(xué)生管理工作中的應(yīng)用
(一)學(xué)生行為預(yù)測
往往在高校學(xué)生管理過程中, 通常會(huì)建立起存儲(chǔ)學(xué)生各種信息的數(shù)據(jù)庫。 我們可以通過數(shù)據(jù)庫的優(yōu)化和整合而得到一個(gè)學(xué)生管理工作的數(shù)據(jù)倉庫。 在庫中記錄著各屆學(xué)生的學(xué)習(xí)、工作、社會(huì)活動(dòng)、獎(jiǎng)勵(lì)、處罰等情況,利用數(shù)據(jù)挖掘的關(guān)聯(lián)分析,尋找學(xué)生各種行為活動(dòng)之間的內(nèi)在聯(lián)系。如“當(dāng)存在 A,B 時(shí)可以推出 C”這樣的規(guī)則,即當(dāng)有 A 行為和 B 行為發(fā)生時(shí),還會(huì)有 C 行為。在實(shí)際情境中,如果發(fā)現(xiàn)學(xué)生已有 A,B 行為時(shí),馬上可以分析其產(chǎn)生 C 行為的可能性, 及時(shí)制定策略促進(jìn)或制止 C 行為的發(fā)生。 這樣的行為預(yù)測如果能很好的運(yùn)用到學(xué)生心理健康教育、 危機(jī)干預(yù)、 素質(zhì)拓展等方面, 那么將可以給學(xué)生工作者提供非常有參考價(jià)值的信息。
(二)招生就業(yè)管理
在招生方面:利用數(shù)據(jù)挖掘技術(shù), 通過對學(xué)生的高考成績個(gè)人資料,在校成績等信息進(jìn)行分析,建立科學(xué)、高效的校園招生管理系統(tǒng), 不僅能夠提高生源素質(zhì)、 縮短工作流程,同時(shí)能夠?yàn)檎猩?jì)劃的擬訂提供科學(xué)的依據(jù), 為整個(gè)招生工作提供決策支持。在就業(yè)方面:利用數(shù)據(jù)挖掘技術(shù), 分析畢業(yè)生的就業(yè)情況和他們的畢業(yè)學(xué)校、 所學(xué)專業(yè)、 學(xué)歷、 學(xué)制、 學(xué)生性別、 是否黨員、 生源地等有著什么關(guān)聯(lián)。 這對學(xué)生就業(yè)指導(dǎo)部門的工作提供了有益的參考, 而且可以指導(dǎo)科學(xué)合理的人才培養(yǎng)方案的制定, 提高大學(xué)生的競爭實(shí)力。
(三)學(xué)生工作評估體系的研究
學(xué)生工作評估體系是用來衡量學(xué)生工作部門工作能力、方法水平、 辦事效率等的標(biāo)準(zhǔn)。 學(xué)生工作評估值是人們對平時(shí)學(xué)生工作管理過程的量化評價(jià), 影響到學(xué)校的政策、 投資的傾向。目前在全國大多數(shù)高校中, 針對學(xué)生工作的考核辦法多種多樣, 但更多的是取決于經(jīng)驗(yàn)上的判斷, 再加上少數(shù)的量化指標(biāo)。 學(xué)校對學(xué)生工作所制定的政策和進(jìn)行的投入在很大程度上取決于學(xué)生工作評估值, 把評估值作為全面衡量學(xué)生工作的系列指標(biāo)。 學(xué)生工作評估體系應(yīng)該是高校學(xué)生工作管理者根據(jù)多年的管理經(jīng)驗(yàn)并在征求各基層工作人員意見的基礎(chǔ)上制定出來的。 它的合理性也同樣取決于經(jīng)驗(yàn), 由于多方面的原因很少有人用科學(xué)的方法評價(jià)過它的合理性, 而它的不合理會(huì)影響學(xué)生工作考核的結(jié)果, 對未來工作的開展帶來阻礙。 利用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則就學(xué)生工作評估體系中權(quán)重設(shè)置的合理性問題進(jìn)行分析, 可以建立合理性評價(jià)系統(tǒng)。
四、結(jié)束語
通過上述應(yīng)用的討論, 可見數(shù)據(jù)挖掘技術(shù)在高校學(xué)生管理工作中能夠?yàn)楣芾碚咛峁┲匾摹?富有價(jià)值的信息或知識(shí),從而產(chǎn)生不可估量的作用。 在高校學(xué)生管理工作中推廣應(yīng)用是有現(xiàn)實(shí)意義的。
作者簡介:秦良斌,講師,陜西渭南人,就職于長江大學(xué)動(dòng)物科學(xué)學(xué)院,主要從事高校學(xué)生管理工作。
參考文獻(xiàn):
[1]王偉鳴.教育信息的關(guān)聯(lián)規(guī)則挖掘.上海海運(yùn)學(xué)院碩士研究生學(xué)位論文.2003.10.
[2]于承敏.數(shù)據(jù)挖掘(Data Mining)技術(shù)運(yùn)用于教育領(lǐng)域之探討.聊城大學(xué)學(xué)報(bào)(自然科學(xué))