張迪
摘要:隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)被應(yīng)用于高校招生工作中,極大地節(jié)省了物力人力,提升了招生效率?;诖耍魑涣⒆阌跀?shù)據(jù)挖掘相關(guān)內(nèi)容分析高校招生中應(yīng)用數(shù)據(jù)挖掘的先進(jìn)意義,該文重點(diǎn)探討高校招生中數(shù)據(jù)挖掘的應(yīng)用路徑,以供參考。
關(guān)鍵詞:數(shù)據(jù)挖掘;高校招生;關(guān)聯(lián)規(guī)則算法
中圖分類號(hào):G202? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)17-0024-02
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
1 背景
招生工作是高校一切活動(dòng)的重要前提,高質(zhì)量的招生工作能夠?yàn)槿瞬排囵B(yǎng)目標(biāo)的實(shí)現(xiàn)奠定良好基礎(chǔ)。在當(dāng)前大數(shù)據(jù)時(shí)代下,通過(guò)在高校招生中應(yīng)用數(shù)據(jù)挖掘技術(shù),能夠準(zhǔn)確掌握學(xué)生信息,為錄取通知書的打印等后續(xù)工作提供便利。
2 數(shù)據(jù)挖掘概述
所謂數(shù)據(jù)挖掘,其屬于計(jì)算機(jī)科學(xué)的一種,主要指的是通過(guò)使用算法在大量數(shù)據(jù)中尋找隱藏信息的過(guò)程,主要涉及的方法有在線分析處理、統(tǒng)計(jì)、專家系統(tǒng)、模式識(shí)別以及機(jī)器學(xué)習(xí)等。在使用數(shù)據(jù)挖掘技術(shù)獲得目標(biāo)數(shù)據(jù)時(shí),共分為七個(gè)步驟,分別是對(duì)問(wèn)題進(jìn)行定義、構(gòu)建數(shù)據(jù)挖掘庫(kù)、對(duì)數(shù)據(jù)進(jìn)行分析、準(zhǔn)備數(shù)據(jù)、建立模式、對(duì)模型進(jìn)行評(píng)價(jià)以及應(yīng)用模型。目前,數(shù)據(jù)挖掘的應(yīng)用十分廣泛,例如Credilogros Cia Financiera S.A.中客戶信用評(píng)分的改善以及電信行業(yè)的應(yīng)用等。
3 分析高校招生中應(yīng)用數(shù)據(jù)挖掘的先進(jìn)意義
隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展和大數(shù)據(jù)分析技術(shù)的普及應(yīng)用,挖掘技術(shù)被廣泛應(yīng)用于各個(gè)分析領(lǐng)域,并發(fā)揮了不可替代的作用。對(duì)于高校招生工作而言,招生數(shù)量、質(zhì)量是高校各項(xiàng)工作高質(zhì)量開展、人才培養(yǎng)計(jì)劃得以實(shí)現(xiàn)的重要基礎(chǔ),但在學(xué)生高考結(jié)束后,高校無(wú)法獲取考生信息、報(bào)考信息,這給高校招生工作中的宣傳與咨詢工作、人才選拔工作以及招生決策的制定提出了極高的要求。因此,需要采取一定方法對(duì)學(xué)生素質(zhì)進(jìn)行分析,預(yù)測(cè)學(xué)生對(duì)各個(gè)專業(yè)的報(bào)考情況等,而這些需求通過(guò)應(yīng)用數(shù)據(jù)挖掘技術(shù)均能夠得到滿足。通過(guò)在高校招生中應(yīng)用數(shù)據(jù)挖掘技術(shù),能夠充分發(fā)揮高考注冊(cè)數(shù)據(jù)庫(kù)、畢業(yè)生就業(yè)數(shù)據(jù)庫(kù)、大學(xué)招生數(shù)據(jù)庫(kù)等數(shù)據(jù)庫(kù)的作用,通過(guò)使用關(guān)聯(lián)規(guī)則算法掌握學(xué)生近幾年的活動(dòng)數(shù)據(jù)和考試成績(jī),進(jìn)而對(duì)學(xué)生考試成績(jī)進(jìn)行估算,進(jìn)而為招生工作的開展奠定良好基礎(chǔ)。同時(shí),由于高校間具有一定競(jìng)爭(zhēng)性,提前掌握學(xué)生成績(jī)和素質(zhì)能夠提前提供電話宣傳和咨詢工作,進(jìn)而吸引考生報(bào)考本校,提高考生報(bào)考質(zhì)量[1]。
4 探討高校招生中數(shù)據(jù)挖掘的應(yīng)用路徑
4.1 做好數(shù)據(jù)挖掘的前期準(zhǔn)備工作
在高校招生中應(yīng)用數(shù)據(jù)挖掘技術(shù)時(shí),應(yīng)做好數(shù)據(jù)準(zhǔn)備工作,構(gòu)建高校招生數(shù)據(jù)倉(cāng)庫(kù)模型,并選擇合適的關(guān)聯(lián)規(guī)則算法,從而為后續(xù)招生工作中的應(yīng)用奠定良好基礎(chǔ)。首先,在數(shù)據(jù)準(zhǔn)備階段主要分為兩方面,分別是數(shù)據(jù)選擇和數(shù)據(jù)預(yù)處理。對(duì)于數(shù)據(jù)選擇,在我國(guó)教育事業(yè)不斷發(fā)展的背景下,高校招生工作量越發(fā)龐大,涉及眾多數(shù)據(jù),數(shù)據(jù)中難免夾雜著無(wú)效數(shù)據(jù),為此,需要對(duì)其進(jìn)行篩選,即數(shù)據(jù)選擇,從而為數(shù)據(jù)挖掘準(zhǔn)確性提供保障。通過(guò)數(shù)據(jù)篩選后,剩下的數(shù)據(jù)滿足可定義要求,但仍具備零散性,所以,需要對(duì)其進(jìn)行數(shù)據(jù)轉(zhuǎn)換、聚集以及集成處理,刪除無(wú)關(guān)特征,合并數(shù)據(jù)對(duì)象,建立新的數(shù)據(jù)特征,提高數(shù)據(jù)挖掘效率。其次,根據(jù)自身需求綜合運(yùn)用數(shù)據(jù)挖掘技術(shù)和功能對(duì)招生數(shù)據(jù)倉(cāng)庫(kù)模型進(jìn)行構(gòu)建,使其能夠在后續(xù)工作中發(fā)揮出招生決策的分析優(yōu)化作用。其中,所應(yīng)用的構(gòu)建方法是數(shù)據(jù)驅(qū)動(dòng)法,通過(guò)在高校學(xué)生管理體系、招生系統(tǒng)中對(duì)數(shù)據(jù)進(jìn)行整合,從而根據(jù)自身需求構(gòu)建概念模型、物理模型以及邏輯模型。最后,由于高校招生工作不僅涉及學(xué)生相關(guān)數(shù)據(jù),還包括考生家長(zhǎng)、就業(yè)前景等數(shù)據(jù),為此,在對(duì)數(shù)據(jù)進(jìn)行管理時(shí)應(yīng)對(duì)關(guān)聯(lián)規(guī)則算法進(jìn)行合理選擇,實(shí)現(xiàn)對(duì)相關(guān)數(shù)據(jù)庫(kù)數(shù)據(jù)的有效處理和挖掘,達(dá)到高校招生目的,提高學(xué)生到校報(bào)到率。
所謂關(guān)聯(lián)規(guī)則算法,主要指的是對(duì)數(shù)據(jù)間的關(guān)聯(lián)點(diǎn)進(jìn)行尋找,并以此為基礎(chǔ)建立圖形,進(jìn)而滿足后續(xù)數(shù)據(jù)處理需求。挖掘過(guò)程可分為兩個(gè)步驟,一是對(duì)所有頻繁項(xiàng)集進(jìn)行搜索,二是以頻繁項(xiàng)集為基礎(chǔ)產(chǎn)生強(qiáng)規(guī)則。在高校招生工作使用關(guān)聯(lián)規(guī)則時(shí),主要運(yùn)用Apriori算法,該算法整體關(guān)聯(lián)形式較為簡(jiǎn)單,通過(guò)將頻集理論為基礎(chǔ)開展逐層搜索迭代,進(jìn)而得到候選集Ck,再根據(jù)任何非頻繁的(k-1)項(xiàng)集都不是頻繁k項(xiàng)集子集的頻集理論進(jìn)行剪枝。目前,大部分關(guān)聯(lián)規(guī)則挖掘算法均是在Apriori算法的基礎(chǔ)上延伸而言,例如劃分技術(shù)、動(dòng)態(tài)項(xiàng)集計(jì)數(shù)技術(shù)等,從而提高考生數(shù)據(jù)的收集效率。例如,將考生ID作為聯(lián)系點(diǎn),在其進(jìn)行志愿填報(bào)工作時(shí),就可以對(duì)適合填報(bào)的專業(yè)名稱進(jìn)行統(tǒng)計(jì),將統(tǒng)計(jì)結(jié)果作為預(yù)測(cè)基礎(chǔ)[2]?;蚴抢脤W(xué)校高考統(tǒng)招以及學(xué)生成績(jī)等數(shù)據(jù),按錄取方式以及學(xué)生素質(zhì)等指標(biāo)對(duì)學(xué)生信息進(jìn)行相對(duì)性分析,從而掌握各項(xiàng)數(shù)據(jù)的隱藏信息,該過(guò)程就是定義挖掘問(wèn)題環(huán)節(jié)。之后,整合多個(gè)源數(shù)據(jù)庫(kù),開展數(shù)據(jù)準(zhǔn)備工作,主要包括考生基本情況、學(xué)生公開的各項(xiàng)成績(jī)等,之后從中選擇用于數(shù)據(jù)挖掘的有效數(shù)據(jù),進(jìn)而幫助招生辦工作人員掌握能夠切實(shí)反映生源真實(shí)信息的數(shù)據(jù),為生源質(zhì)量、院校報(bào)考情況等內(nèi)容進(jìn)行合理預(yù)測(cè)。最后,對(duì)學(xué)生在校期間進(jìn)行測(cè)評(píng)成績(jī)綜合量化,其中,智育成績(jī)和德育成績(jī)占比分別為70%和30%,通過(guò)合計(jì)成績(jī)對(duì)學(xué)生實(shí)際情況進(jìn)行準(zhǔn)確預(yù)測(cè)。
4.2 招生宣傳和咨詢工作方面的應(yīng)用
數(shù)據(jù)挖掘技術(shù)的應(yīng)用能夠幫助高校招生辦工作人員從大量數(shù)據(jù)中尋找目標(biāo)數(shù)據(jù),并對(duì)此類數(shù)據(jù)進(jìn)行分析,將分析結(jié)果作為工作開展基礎(chǔ)。一般情況下,在學(xué)生報(bào)考前或是錄取前,高校往往無(wú)法得知哪些學(xué)生能夠報(bào)考該學(xué)校,只有報(bào)考者能夠單方面地知道誰(shuí)能夠錄取。在該情況下,既不利于學(xué)生選擇學(xué)校和專業(yè),也不利于高校高品質(zhì)學(xué)生的選擇。因此,高校往往會(huì)在學(xué)生成績(jī)出來(lái)后、報(bào)考前就運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)該屆考生數(shù)據(jù)進(jìn)行挖掘,尋找符合學(xué)校要求的高品質(zhì)學(xué)生。在其進(jìn)行挖掘過(guò)程中,主要對(duì)考生的歷史信息進(jìn)行分析,并以目標(biāo)標(biāo)準(zhǔn)庫(kù)為基礎(chǔ)對(duì)哪些學(xué)生能夠錄取本校進(jìn)行分析,之后通過(guò)對(duì)比相對(duì)應(yīng)的信息與結(jié)果判斷是否與預(yù)期相同,進(jìn)而從大量數(shù)據(jù)中心挑選出咨詢關(guān)注范圍的考生。最后,對(duì)其進(jìn)行數(shù)據(jù)進(jìn)行歸類,以此為基礎(chǔ)推斷學(xué)生信息,以主動(dòng)的方式聯(lián)系學(xué)生,開展招生宣傳和咨詢工作。例如,通過(guò)電話宣傳和線上宣傳,吸引符合要求的學(xué)生前往本校進(jìn)行參觀,進(jìn)而達(dá)到招生宣傳和咨詢工作的目的,提高招生質(zhì)量。
以華北工業(yè)大學(xué)為例,在省招辦投檔前,華北工業(yè)大學(xué)無(wú)法獲得有哪些學(xué)生想要報(bào)考這所大學(xué),在該情況下,華北工業(yè)大學(xué)利用多年來(lái)積累的學(xué)生錄取數(shù)據(jù),通過(guò)對(duì)沒有分類的中學(xué)歷史數(shù)據(jù)庫(kù)、某省歷年歷史數(shù)據(jù)庫(kù)進(jìn)行查詢,能夠使用數(shù)據(jù)挖掘技術(shù)找到符合本校錄取要求的學(xué)生,進(jìn)而對(duì)學(xué)生信息進(jìn)行推斷,根據(jù)推斷結(jié)果開展招生宣傳和咨詢工作。在該工作中,主要面向目標(biāo)考生講解優(yōu)惠政策,讓目標(biāo)考生更愿意報(bào)考華北工業(yè)大學(xué),進(jìn)而通過(guò)數(shù)據(jù)挖掘、服務(wù)招聘、高校宣傳等工作為招生質(zhì)量奠定良好基礎(chǔ)[3]。
4.3 高校人才選拔方面的應(yīng)用
對(duì)于高校招生工作而言,其主要目標(biāo)是盡量選擇優(yōu)質(zhì)考生,提高報(bào)考工作的質(zhì)量和效率,為此,數(shù)據(jù)挖掘技術(shù)在高校人才選拔方面也發(fā)揮著不可替代的作用,尤其在錄取和登記工作中。由于我國(guó)人口數(shù)量較多,且教育水平較高,接受高等教育的學(xué)生人數(shù)不斷增加,導(dǎo)致考生信息具有極大的工程量,而數(shù)據(jù)挖掘技術(shù)的應(yīng)用能夠有效減輕工作人員的工作量和工作壓力,并實(shí)現(xiàn)考生信息的良好定位。除此之外,數(shù)據(jù)挖掘的使用還能夠幫助高校招生辦工作人員進(jìn)行考生的挑選,在一定程度上促進(jìn)教育事業(yè)的發(fā)展。因此,在數(shù)據(jù)挖掘過(guò)程中,能夠?yàn)楦咝L峁┐罅坑行?shù)據(jù),使其掌握學(xué)生的相關(guān)信息,讓招生辦工作人員推測(cè)出學(xué)生的綜合素質(zhì)及不足之處。通過(guò)數(shù)據(jù)挖掘技術(shù)的分析,能夠從眾多考生中挖掘中滿足本校期待的考生,提高生源質(zhì)量。除此之外,通過(guò)在人才培養(yǎng)制定方面應(yīng)用數(shù)據(jù)挖掘技術(shù),能夠借助數(shù)據(jù)分析結(jié)構(gòu)提高方案可行性。例如,利用中學(xué)學(xué)籍庫(kù)分析學(xué)生素質(zhì),此類數(shù)據(jù)庫(kù)真實(shí)地記錄著考生的學(xué)習(xí)情況以及各方面的能力和品行,為此,通過(guò)應(yīng)用數(shù)據(jù)挖掘技術(shù),能夠通過(guò)其關(guān)聯(lián)算法掌握學(xué)生與各項(xiàng)活動(dòng)之間的聯(lián)系,并利用定性與定量相結(jié)合的分析方法和指標(biāo)對(duì)學(xué)生成績(jī)進(jìn)行計(jì)算,為高校人才選拔工作的順利展開提供保障。主要使用的方法有分析、演化相關(guān)數(shù)據(jù)庫(kù),以規(guī)則推導(dǎo)方法對(duì)學(xué)生素質(zhì)進(jìn)行評(píng)價(jià),并對(duì)其進(jìn)行模糊處理,再以加權(quán)平均法對(duì)數(shù)據(jù)分析結(jié)果進(jìn)行排序,最后使用動(dòng)態(tài)聚類法分析評(píng)價(jià)結(jié)果,進(jìn)而為人才選拔提供助力。值得注意的是,在使用數(shù)據(jù)挖掘技術(shù)對(duì)考生歷史數(shù)據(jù)進(jìn)行處理后,當(dāng)出現(xiàn)新的數(shù)據(jù)后,可以基于歷史數(shù)據(jù)處理結(jié)果對(duì)新數(shù)據(jù)進(jìn)行模擬、推算,進(jìn)而獲得相對(duì)準(zhǔn)確的結(jié)果。在給高校人才選拔工作提供幫助的同時(shí),還能夠?yàn)楦咝H瞬胚x拔機(jī)制的創(chuàng)新奠定良好基礎(chǔ),使其不斷優(yōu)化、更新。
4.4 科學(xué)制定招生決策方面的應(yīng)用
隨著教育事業(yè)的不斷發(fā)展,高校招生工作不僅是面向?qū)W生提供高校信息,還需要為高校招生決策提供幫助,而數(shù)據(jù)挖掘技術(shù)能夠通過(guò)學(xué)生綜合素質(zhì)的分析為招生決策的制定奠定良好基礎(chǔ),發(fā)揮輔助作用。具體而言,在高校開展招生工作時(shí),相關(guān)工作人員可以根據(jù)候選人分布情況以及考生對(duì)專業(yè)的報(bào)考需求對(duì)本校生源計(jì)劃進(jìn)行規(guī)劃,而這需要建立在數(shù)據(jù)挖掘分析結(jié)果上,提升高校分省分專業(yè)的科學(xué)合理性。對(duì)于高校省級(jí)次專業(yè)生源計(jì)劃和社會(huì)需求而言,二者在一定程度上具有一定的序列關(guān)系,可以說(shuō),二者構(gòu)成了一個(gè)鏈條系統(tǒng)[4]。在高校生源計(jì)劃制定不合理的情況下,會(huì)對(duì)學(xué)生未來(lái)就業(yè)的順利性造成影響;若是高校在對(duì)招生計(jì)劃進(jìn)行制定時(shí),沒有將就業(yè)形勢(shì)以及學(xué)生就業(yè)計(jì)劃很好地體現(xiàn)出來(lái),那么會(huì)導(dǎo)致學(xué)生在畢業(yè)時(shí)出現(xiàn)難以就業(yè)的問(wèn)題。因此,為有效避免此類問(wèn)題的出現(xiàn),提高招生質(zhì)量、為學(xué)生順利就業(yè)提供保障,應(yīng)在高考注冊(cè)數(shù)據(jù)庫(kù)、大學(xué)招生數(shù)據(jù)庫(kù)以及畢業(yè)生就業(yè)數(shù)據(jù)庫(kù)等相關(guān)數(shù)據(jù)庫(kù)中使用數(shù)據(jù)挖掘技術(shù),通過(guò)分析海量數(shù)據(jù)并使用挖掘關(guān)聯(lián)分析和序列分析功能,能夠有效利用C45決策樹生成算法對(duì)專業(yè)及就業(yè)情況進(jìn)行分析與總結(jié),從大量數(shù)據(jù)中尋找有價(jià)值的規(guī)則。進(jìn)而為各專業(yè)將來(lái)的職業(yè)需求和變化進(jìn)行預(yù)測(cè),根據(jù)預(yù)測(cè)結(jié)果制定高校招生決策,能夠保證專業(yè)設(shè)置數(shù)量的合理性、生源計(jì)劃規(guī)劃的科學(xué)性,實(shí)現(xiàn)人才的科學(xué)培養(yǎng),為社會(huì)提供所需人才[5]。
5 結(jié)束語(yǔ)
綜上所述,通過(guò)在高校招生工作中應(yīng)用數(shù)據(jù)挖掘技術(shù)能夠有效提高招生質(zhì)量和招生效率,為高校人才培養(yǎng)計(jì)劃的實(shí)施奠定良好基礎(chǔ)。因此,應(yīng)將數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校招生工作中的咨詢和宣傳、人才選拔以及招生決策制定等方面,從而為招生工作提供有效參考。
參考文獻(xiàn):
[1] 王炳堃.數(shù)據(jù)挖掘技術(shù)在高校招生數(shù)據(jù)管理中的研究和應(yīng)用[J].隴東學(xué)院學(xué)報(bào),2020,31(5):11-14.
[2] 許佳,林雨萱.高校招生中引入數(shù)據(jù)挖掘技術(shù)的應(yīng)用前景探索[J].計(jì)算機(jī)產(chǎn)品與流通,2019(8):265.
[3] 阿布力米提·卡依木.數(shù)據(jù)挖掘技術(shù)在高校招生數(shù)據(jù)管理中的應(yīng)用研究[J].大慶師范學(xué)院學(xué)報(bào),2018,38(3):33-36.
[4] 越縉.數(shù)據(jù)挖掘在民辦應(yīng)用型本科高校招生中的應(yīng)用研究[D].合肥:安徽大學(xué),2019.
[5] 王新偉.數(shù)據(jù)挖掘在高校招生工作中的應(yīng)用概述[J].才智,2018(27):166.
【通聯(lián)編輯:謝媛媛】