陳婷婷
目前高等職業(yè)院校畢業(yè)生的技能要求越來越高,而在數(shù)據(jù)統(tǒng)計過程中,因為數(shù)據(jù)信息龐大和復(fù)雜,使得傳統(tǒng)方法無法對這些數(shù)據(jù)進(jìn)行有效的分析。本文主要分析了現(xiàn)在數(shù)據(jù)挖掘算法的現(xiàn)狀,其中存在的不足,以及數(shù)據(jù)挖掘技術(shù)的改進(jìn)方法,以高職院校學(xué)生技能證管理數(shù)據(jù)為例,對這項技術(shù)進(jìn)行了深入的研究。
對于高職院校來說,學(xué)生就業(yè)管理部門主要的工作就是對學(xué)生信息進(jìn)行管理。通過對學(xué)生信息準(zhǔn)確的收集和把握,可以為學(xué)生將來的就業(yè)指導(dǎo)提供非常好的依據(jù)。所以本文研究了卜面系統(tǒng),對數(shù)據(jù)挖掘技術(shù)在高職院校學(xué)生技能考證方面進(jìn)行實踐探索,從而使高職院校對學(xué)生信息能做到更好的管理。
1 數(shù)據(jù)挖掘技術(shù)
面對海量的學(xué)生技能、考證、就業(yè)等信息,如果沒有很好的管理技術(shù)和方法,那么這勢必將成為一件耗時、耗力的苦差事。因為這項工作,需要相關(guān)的工作人員對學(xué)生的信息進(jìn)行收集、整理、分類歸納等。在大部分的信息當(dāng)中,一般都是些不同類型的數(shù)據(jù),而且在這些數(shù)據(jù)信息的管理過程中,相關(guān)工作人員沒有對這些數(shù)據(jù)信息做到有效的處理。因為,隨著學(xué)??焖俚陌l(fā)展,學(xué)生信息的不斷增多,而且向著更加復(fù)雜化的方向發(fā)展,這就造成了傳統(tǒng)的數(shù)據(jù)處理技術(shù)已經(jīng)完全無法滿足現(xiàn)代數(shù)據(jù)信息的管理需求。從這方面也可以看出,利用現(xiàn)代先進(jìn)的技術(shù)對數(shù)據(jù)挖掘技術(shù)進(jìn)行有效的優(yōu)化和完善,提高其對數(shù)據(jù)信息的處理效果,便成為了現(xiàn)代非常重要的工作。
數(shù)據(jù)挖掘簡單的解釋就是高速、有效的對數(shù)據(jù)信息進(jìn)行處理的一種技術(shù)。數(shù)據(jù)挖掘,英文為Data Mining,簡稱為DM。這項技術(shù)、結(jié)合了數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計學(xué)、模糊數(shù)學(xué)等多個領(lǐng)域的前沿理論與技術(shù)。通過采用這項技術(shù),可以讓人們在紛雜的數(shù)據(jù)信息中快速的提煉出自己想要知道的信息和知識。因為這項技術(shù)有著如此的優(yōu)勢,所以在許多數(shù)據(jù)處理過程中,都采用了這項技術(shù),最終都取得了不錯的處理效果。但是,我國現(xiàn)在在這方面的技術(shù)還比較落后,只是處在一個初步的發(fā)展階段,對數(shù)據(jù)挖掘的核心技術(shù)的研究還不夠深入和透徹。
2 數(shù)據(jù)挖掘技術(shù)在職業(yè)技能考證信息應(yīng)用結(jié)果分析
2.1 數(shù)據(jù)挖掘技術(shù)開發(fā)步驟
數(shù)據(jù)挖掘是一項非常系統(tǒng)的工作,所以在對其進(jìn)行開發(fā)時,一定要按照步驟進(jìn)行:
①對需要處理的數(shù)據(jù)信息進(jìn)行有效的分析,并且從中獲得符合要求的相關(guān)數(shù)據(jù)和信息。②對經(jīng)過分析的數(shù)據(jù)和信息進(jìn)行再次的篩選和提煉,確保自己所獲得的信息是全面的,沒有出現(xiàn)遺漏的情況,同時,這些數(shù)據(jù)信息還是相互兼容的。而對于那些不滿足自己要求的數(shù)據(jù)信息進(jìn)行有效的清理,然后再選出新的數(shù)據(jù)來進(jìn)行選擇和提取。③選定數(shù)據(jù)挖掘算法。在對數(shù)據(jù)處理過程中,主要就是通過采用這樣的數(shù)據(jù)挖掘算法來對相關(guān)的數(shù)據(jù)信息進(jìn)行提取。④對數(shù)據(jù)庫中的所有數(shù)據(jù)都進(jìn)行處理之后,再在這個基礎(chǔ)上建立起一個新的數(shù)據(jù)集。⑤對處理之后的數(shù)據(jù)做到清晰的說明,以便區(qū)分和辨識。⑥驗證挖掘效果。通過進(jìn)行具體的數(shù)據(jù)分析對數(shù)據(jù)挖掘的整個結(jié)果進(jìn)行驗證,確保挖掘信息的正確性和真實性,最終好達(dá)到預(yù)期效果。在對數(shù)據(jù)挖掘進(jìn)行驗證的時候,要對其中不符合要求的信息進(jìn)行進(jìn)一步的排除。
2.2 學(xué)生技能考證培訓(xùn)信息挖掘結(jié)果分析
2.2.1 統(tǒng)計分析方法
統(tǒng)計分析方法是數(shù)據(jù)信息處理中常用的一種方法,數(shù)據(jù)挖掘過程主要需要對數(shù)據(jù)信息進(jìn)行統(tǒng)計的方面有這些:
(1)常用統(tǒng)計,就是人們在日常高職院校學(xué)生信息統(tǒng)計時常用的統(tǒng)計方法和信息處理方法。
(2)相關(guān)分析,根據(jù)一定的標(biāo)準(zhǔn),對高職院校學(xué)生信息進(jìn)行具體的分析和處理。
(3)回歸分析,通過運用回歸方程對高職院校學(xué)生信息中的變量進(jìn)行有效的處理和分析。
高職院校在對學(xué)生技能考證方面的數(shù)據(jù)管理過程中,在數(shù)據(jù)統(tǒng)計分析期間,經(jīng)常容易出現(xiàn)數(shù)據(jù)雜亂的現(xiàn)象,這種情況嚴(yán)重的影響到了數(shù)據(jù)信息處理,更加不利于采用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)進(jìn)行處理,所以才造成了統(tǒng)計過程中,出現(xiàn)了許多亂象。另外,設(shè)備本身存在問題也會嚴(yán)重的影響到數(shù)據(jù)挖掘的效果,所以在數(shù)據(jù)管理過程中,確保設(shè)備的正常運行也是非常重要的。
2.2.2 數(shù)據(jù)預(yù)處理分析
在對高職院校學(xué)生的信息進(jìn)行處理時,如果直接采用數(shù)據(jù)挖掘技術(shù)對這些信息進(jìn)行處理,勢必會造成處理的數(shù)據(jù)過于大且集中,很難達(dá)到理想的處理效果。所以在對這些數(shù)據(jù)信息進(jìn)行處理時,相關(guān)的工作人員可以先對數(shù)據(jù)信息進(jìn)行預(yù)處理,這樣便可以保證后面數(shù)據(jù)信息處理工作更好的開展。
綜上所述,隨著現(xiàn)代高職院校的快速發(fā)展,對學(xué)生信息管理的要求也更高,這就要求相關(guān)的部門不斷提升學(xué)生信息管理的技術(shù)。相關(guān)的工作人員要加強(qiáng)對數(shù)據(jù)挖掘這一技術(shù)的研究,并且建起屬于自己學(xué)校學(xué)生信息的數(shù)據(jù)庫,從而推動高職院校學(xué)生信息管理技術(shù)的不斷發(fā)展,為學(xué)生專業(yè)技能的培養(yǎng)和將來的就業(yè)指導(dǎo)做到有效的管理和幫助。
(作者單位:南京機(jī)電職業(yè)技術(shù)學(xué)院)