李松濤
摘 要:隨著高職生教育不斷地發(fā)展擴(kuò)大,如何提高職學(xué)生能力發(fā)展定位已經(jīng)成為社會(huì)的一個(gè)熱點(diǎn)話題。學(xué)生的能力定位和規(guī)劃決定著學(xué)生的未來和發(fā)展,但現(xiàn)如今學(xué)生能力分析不能很完全的提供有效信息,本文通過總結(jié)歸納數(shù)據(jù)挖掘的相關(guān)技術(shù),探索數(shù)據(jù)挖掘技術(shù)如何應(yīng)用于高職生能力發(fā)展定位與預(yù)測(cè)。
關(guān)鍵詞:數(shù)據(jù)挖掘 高職生 能力發(fā)展定位
中圖分類號(hào):G641 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2014)02(c)-0183-01
1 數(shù)據(jù)挖掘的內(nèi)涵
廣義上說的數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的原始數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用、可信新穎的信息和知識(shí)的過程。即數(shù)據(jù)挖掘從數(shù)據(jù)庫的相關(guān)數(shù)據(jù)集合中抽取有價(jià)值的知識(shí)、規(guī)則或深層次的信息。狹義上的數(shù)據(jù)挖掘是一個(gè)利用各種分析工具在海量數(shù)據(jù)中發(fā)現(xiàn)模型和數(shù)據(jù)之間關(guān)系的過程,是知識(shí)發(fā)現(xiàn)過程中的一個(gè)關(guān)鍵步驟。數(shù)據(jù)挖掘是一門廣義的交叉學(xué)科,它的發(fā)展和應(yīng)用涉及到不同的領(lǐng)域,尤其是數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計(jì)、可視化、并行計(jì)算等。數(shù)據(jù)挖掘的使用極大地提高了信息的利用率,使用有效信息更高效,為社會(huì)與人類的發(fā)展提供了方便的實(shí)用工具。
2 應(yīng)用于學(xué)生能力信息的數(shù)據(jù)挖掘技術(shù)方法
根據(jù)不同的問題及數(shù)據(jù)類型,存在相對(duì)應(yīng)的數(shù)據(jù)挖掘技術(shù)方法,方法如下。
第一,分類與預(yù)測(cè):分類是根據(jù)問題情況事先分好類別,利用某個(gè)分類器一一劃分?jǐn)?shù)據(jù)庫中的數(shù)據(jù)對(duì)象,并分配到相對(duì)應(yīng)的類別中。分類方法在學(xué)習(xí)過程中提供了指導(dǎo)性作用。預(yù)測(cè)是為了預(yù)測(cè)未知類別的數(shù)據(jù)對(duì)象,通過之前學(xué)習(xí)歸納的方法模型預(yù)測(cè)未知數(shù)據(jù)對(duì)象。其中分類模型可應(yīng)用于預(yù)測(cè)。
操作步驟為:(1)構(gòu)造對(duì)數(shù)據(jù)進(jìn)行分類的分類器。例如運(yùn)動(dòng)員體能數(shù)據(jù)庫中,根據(jù)學(xué)體能測(cè)試成績,將運(yùn)動(dòng)員的成績分類為:優(yōu)、良、可、差四個(gè)等級(jí)。(2)精確分析分類規(guī)則,即是通過總結(jié)分析運(yùn)動(dòng)員成績數(shù)據(jù),對(duì)成績分類等級(jí)做出更加具體的分類規(guī)則描述,如“體能測(cè)試科目總分高于85分的運(yùn)動(dòng)員分為等級(jí)優(yōu)”。(3)最后是利用制定完備的分類規(guī)則來分析數(shù)據(jù)庫中的相應(yīng)數(shù)據(jù)。
第二,聚類:聚類是將數(shù)據(jù)全部輸入數(shù)據(jù)庫中,然后對(duì)數(shù)據(jù)進(jìn)行分析,其方法步驟正好與分類是相反的。其內(nèi)容是根據(jù)數(shù)據(jù)的相似性,相似度高的劃分到同一組。聚類是一種無指導(dǎo)性的學(xué)習(xí)過程,也可以說聚類與分類是一個(gè)互逆的過程。
第三,決策樹:主要應(yīng)用原理是利用概率論分析事例的概率數(shù),在此基礎(chǔ)上劃分?jǐn)?shù)據(jù)到不同的類別,并以樹的分支形式表示。根據(jù)數(shù)據(jù)的分類情況也可以預(yù)測(cè)數(shù)據(jù)的發(fā)展趨勢(shì),這是這種方法的一個(gè)優(yōu)點(diǎn),優(yōu)點(diǎn)還有數(shù)據(jù)表達(dá)直觀,并且應(yīng)用便捷快速,易于理解,但是不適合于復(fù)雜量大的數(shù)據(jù),由于分支太多會(huì)埋沒了優(yōu)點(diǎn),不利于使用。
第四,遺傳算法:這種方法適用于結(jié)算最優(yōu)數(shù)據(jù),其內(nèi)容是利用概率計(jì)算,直接計(jì)算出最有數(shù)據(jù)結(jié)果的方法。遺傳算法模擬了自然界優(yōu)勝劣汰、適者生存的自然進(jìn)化規(guī)則,生成的用于數(shù)據(jù)選擇的隨機(jī)搜索算法。其優(yōu)點(diǎn)是在對(duì)數(shù)據(jù)進(jìn)行操作過程中,不需要制定規(guī)則,直接用于數(shù)據(jù)對(duì)象,直接快捷的得倒最優(yōu)化搜索。缺點(diǎn)是應(yīng)用比較單一化,可以配合其他方法使用。
3 數(shù)據(jù)挖掘技術(shù)應(yīng)用于高職學(xué)生職業(yè)能力發(fā)展定位
如何開發(fā)優(yōu)質(zhì)課程,提高課程對(duì)就業(yè)和能力這兩個(gè)要素的針對(duì)性;如何提出以“提高學(xué)生能力”為教學(xué)本位的教育方案,是目前各大職業(yè)院校所面對(duì)的重要問題。要想歸納出教育教學(xué)方案中所必不可少的、課程中應(yīng)該重點(diǎn)傳授的知識(shí)點(diǎn)和能力培養(yǎng)方向,就需要對(duì)學(xué)生們的招生信息、在校表現(xiàn)情況和就業(yè)信息等等的相關(guān)信息進(jìn)行挖掘,從而獲得對(duì)校方來說了解學(xué)生的有用信息,并把這些信息同企業(yè)對(duì)學(xué)生需求的信息結(jié)合起來。
高校儲(chǔ)存著大量學(xué)生數(shù)據(jù),包括教育信息和就業(yè)信息。教育信息同樣分為兩部分,一部分是教學(xué)直接相關(guān)的,如學(xué)業(yè)成績、學(xué)績點(diǎn)、獲獎(jiǎng)情況等等;一另部分則是與非智力因素有關(guān),包括學(xué)生的性別、身體狀況、心理健康情況等等。就業(yè)信息、顧名思義,可能包括學(xué)生就業(yè)所在的企業(yè)地域、企業(yè)性質(zhì)、所處職位、行業(yè)、薪資待遇等。近年來,信息化應(yīng)用與存儲(chǔ)規(guī)范化的推進(jìn)使得高校的學(xué)生個(gè)人信息庫越來越豐富。但與信息高度豐富不同的是,這些數(shù)據(jù)和信息都沒有被充分利用。高校在制定學(xué)生們的培養(yǎng)計(jì)劃時(shí)很少注意到這類信息,這些寶貴并且具有指導(dǎo)性的信息被遺忘了。但培養(yǎng)計(jì)劃的制定者如果整合學(xué)生信息并從中總結(jié)出規(guī)律,那么這種規(guī)律能很好的啟發(fā)教育者應(yīng)該重視培養(yǎng)學(xué)生的哪種方面素養(yǎng)。本課題就是從這個(gè)角度出發(fā),總和并研究學(xué)生信息和最終就業(yè)的信息,挖掘出其中包含的規(guī)律,為培養(yǎng)計(jì)劃的制定和設(shè)計(jì)提供相關(guān)的理論支持。數(shù)年以來,高職院校在其教學(xué)和管理工作,積累了大量的學(xué)生信息數(shù)據(jù),這些信息已具備了形成一個(gè)信息庫的基本條件。而目前需要做的,是將這些數(shù)據(jù)庫進(jìn)行開發(fā),通過對(duì)這些教學(xué)信息進(jìn)行有針對(duì)性和關(guān)聯(lián)性的分析和挖掘,總結(jié)出課程的效果與其他因素的關(guān)聯(lián),為培養(yǎng)計(jì)劃的決策者支持信息,以便教學(xué)工作能更有計(jì)劃和效果的進(jìn)行,課程安排能更加合理的開展,教學(xué)質(zhì)量進(jìn)一步提高,學(xué)生相關(guān)能力也進(jìn)一步提升。
4 結(jié)語
將學(xué)生的個(gè)人信息,包括教育信息和就業(yè)信息等挖掘出來,整合成對(duì)校方設(shè)計(jì)培養(yǎng)學(xué)生、了解學(xué)生的有用信息,并把這些信息用于在分析企業(yè)對(duì)學(xué)生能力的需求上,從而進(jìn)一步歸納出課程設(shè)計(jì)和能力培養(yǎng)的側(cè)重點(diǎn)。把新興的數(shù)據(jù)挖掘技術(shù)應(yīng)用到學(xué)生管理工作中,這在大力提倡科教興國的今天,對(duì)于提高教學(xué)質(zhì)量,培養(yǎng)全方位人才無疑具有十分重大的現(xiàn)實(shí)意義。
參考文獻(xiàn)
[1] 安淑芝.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].清華大學(xué)出版社,2005.
[2] 于立紅,張建偉.基于數(shù)據(jù)挖掘的高職生成績分析與預(yù)測(cè)[J].鄭州輕工業(yè)學(xué)院學(xué)報(bào):自然科學(xué)版,2006(3):77-79.
[3] 慕春棣,戴劍彬,葉俊,等.用于數(shù)據(jù)挖掘的貝葉斯網(wǎng)絡(luò)[J].軟件學(xué)報(bào),2000(11):660-666.endprint