勝獻(xiàn)利
(河南大學(xué) 濮陽(yáng)工學(xué)院, 河南 濮陽(yáng) 457000)
高校學(xué)生資助具有公益性、選擇性、幫扶性,因此選拔資助對(duì)象時(shí)需要保證公平、公正和公開(kāi)。在現(xiàn)實(shí)工作實(shí)踐中,由于人的認(rèn)知能力有限,高校學(xué)生資助工作運(yùn)行得并非一帆風(fēng)順,時(shí)常遇到各類(lèi)型因素影響和阻礙學(xué)生資助工作,在學(xué)生家庭情況調(diào)研、貧困生等級(jí)認(rèn)定和過(guò)程性評(píng)價(jià)時(shí)均存在一定問(wèn)題[1]。由于學(xué)生家庭調(diào)研成本較高,因此尚無(wú)高校采用家庭訪談形式開(kāi)展貧困學(xué)生實(shí)際情況調(diào)查工作,籠統(tǒng)地要求貧困生填寫(xiě)家庭情況調(diào)查表,由生源地的鄉(xiāng)村街道辦事處或民政局加蓋公章。但以此種方式認(rèn)定的貧困生真實(shí)情況得不到確認(rèn)。即便有些學(xué)生通過(guò)抽樣調(diào)查方式,由于成本高、覆蓋面窄等情況也無(wú)法起到應(yīng)有的效果。隨著家庭調(diào)研方式的改革,一些學(xué)校認(rèn)定貧困生時(shí)開(kāi)始綜合考慮日常因素,比如學(xué)生的一卡通消費(fèi)、日常的穿著打扮、手機(jī)電腦品牌價(jià)格等,但是由于這些數(shù)據(jù)斷斷續(xù)續(xù),所以收效甚微。部分學(xué)校別出心裁地采取一些方法,比如讓學(xué)生自己拍攝家庭生活視頻照片資料、提供死亡證明、低保證、殘疾證等,公開(kāi)實(shí)施“比慘大賽”,既影響了學(xué)生的心理健康,又讓本是扶危救困的學(xué)生資助政策在大學(xué)生中產(chǎn)生不良影響。學(xué)生困難等級(jí)認(rèn)定也較為困難,由于學(xué)生家庭數(shù)據(jù)采集不準(zhǔn)確,生活水平不能準(zhǔn)確判定,因此無(wú)法準(zhǔn)確地認(rèn)定學(xué)生困難等級(jí),學(xué)生資助無(wú)法準(zhǔn)確實(shí)施[2]。學(xué)生生活狀況評(píng)定完成之后就固定不變,影響資助政策的有效實(shí)施。學(xué)生資助過(guò)程性管理弱,許多學(xué)校采用年度審核制度,每年的評(píng)價(jià)方式都一成不變,因此學(xué)生資助評(píng)價(jià)固化滯后,無(wú)法反映多變的貧困生活狀況,影響學(xué)生受資助的情況。大學(xué)生學(xué)習(xí)和成長(zhǎng)過(guò)程中,學(xué)生資助是一個(gè)剛性支出,需要給予足夠的關(guān)注,但是這些剛性支出已經(jīng)成為學(xué)生評(píng)價(jià)的生活瓶頸,如果不使用動(dòng)態(tài)的評(píng)估過(guò)程就無(wú)法適應(yīng)學(xué)生資助模式[3]。
目前,隨著人工智能、深度學(xué)習(xí)、云計(jì)算、互聯(lián)網(wǎng)等技術(shù)的發(fā)展,公安、民政、銀行、高校等機(jī)構(gòu)已經(jīng)開(kāi)發(fā)了自動(dòng)化軟件,積累了大量的數(shù)據(jù)資源,覆蓋了每一個(gè)家庭,因此可以利用深度學(xué)習(xí)構(gòu)建一個(gè)關(guān)聯(lián)分析模式,將多個(gè)部門(mén)的數(shù)據(jù)整合在一起,分析學(xué)生家庭經(jīng)濟(jì)生活狀態(tài),從而準(zhǔn)確判定大學(xué)生資助情況,動(dòng)態(tài)管理大學(xué)生資助過(guò)程。
深度學(xué)習(xí)算法是一種先進(jìn)的前饋型人工神經(jīng)網(wǎng)絡(luò),其包括兩個(gè)卷積層,分別是特征提取層和特征映射層[4]。特征提取層的輸入神經(jīng)元與前一層局部連接,可以提取局部特征,確定特征與特征位置關(guān)系。特征映射層將特征映射到一個(gè)平面上,每一個(gè)平面上的神經(jīng)元擁有相同的權(quán)值[5]。卷積神經(jīng)網(wǎng)絡(luò)利用Sigmoid函數(shù)作為激活函數(shù),使得特征及其映射具有位移不變性,從而大幅度減少設(shè)置的自有參數(shù)數(shù)量[6]。深度學(xué)習(xí)概念源于人工神經(jīng)網(wǎng)絡(luò),是一種包含多個(gè)隱藏層的深度學(xué)習(xí)結(jié)構(gòu),能夠通過(guò)組合底層特征形成更加抽象的高層類(lèi)別或特征,以便發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示[7]。深度指的是神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)得到的函數(shù)中非線性運(yùn)算組合水平的數(shù)量,當(dāng)前神經(jīng)網(wǎng)絡(luò)多是較低水平的網(wǎng)絡(luò)結(jié)構(gòu),比如1個(gè)輸入層、1個(gè)隱藏層和1個(gè)輸出層。深度學(xué)習(xí)則是非線性運(yùn)算組合水平較高的神經(jīng)網(wǎng)絡(luò),比如1個(gè)輸入層、3個(gè)隱藏層和1個(gè)輸出層[8]。深度學(xué)習(xí)可以表示高階抽象概念的復(fù)雜函數(shù),解決目標(biāo)識(shí)別、語(yǔ)音感知和語(yǔ)言理解等人工智能相關(guān)的任務(wù)。研發(fā)發(fā)現(xiàn):可以使用多種方式描述深度學(xué)習(xí)的觀測(cè)值,比如特征向量、輪廓區(qū)域等,更容易從海量數(shù)據(jù)中進(jìn)行實(shí)例學(xué)習(xí),生成一個(gè)準(zhǔn)確的網(wǎng)絡(luò)結(jié)構(gòu),提高機(jī)器學(xué)習(xí)的準(zhǔn)確度[9-10]。
深度學(xué)習(xí)經(jīng)過(guò)多年研究,已經(jīng)得到了極大的改進(jìn),引入了形狀建模[11]、模糊數(shù)學(xué)、因子分析、信息論等技術(shù),準(zhǔn)確度和魯棒性均有提升。深度學(xué)習(xí)利用形狀建模技術(shù),可以提高圖像識(shí)別、特征檢測(cè)的準(zhǔn)確度,進(jìn)一步提高圖像處理和識(shí)別的有效性。深度學(xué)習(xí)可以利用模糊數(shù)學(xué)和因子分析技術(shù),強(qiáng)化卷積神經(jīng)網(wǎng)絡(luò)求解空間的啟發(fā)式規(guī)則,提高深度學(xué)習(xí)的處理速度和效率。利用信息論等技術(shù),深度學(xué)習(xí)可提高數(shù)據(jù)度量的有效性,進(jìn)一步提高數(shù)據(jù)相似性度量準(zhǔn)確度。目前,深度學(xué)習(xí)已經(jīng)在很多領(lǐng)域取得了顯著的應(yīng)用成效,比如置信神經(jīng)網(wǎng)絡(luò)等,同時(shí)也廣泛應(yīng)用于圖像識(shí)別[12]、語(yǔ)音識(shí)別[13]、基因識(shí)別、視覺(jué)導(dǎo)航等領(lǐng)域,并吸引了谷歌、百度、騰訊、微軟、阿里巴巴、英特爾等公司的關(guān)注,獲得了越來(lái)越多的研究成果[14]。
大學(xué)生資助管理利用深度學(xué)習(xí)可以實(shí)現(xiàn)精準(zhǔn)化、動(dòng)態(tài)化、實(shí)時(shí)化、共享化和智能化管理模式,以適應(yīng)高等教育改革的發(fā)展需要,促進(jìn)各地區(qū)發(fā)展,滿(mǎn)足大學(xué)生成長(zhǎng)成才的需求。深度學(xué)習(xí)在大學(xué)生資助管理模式中的應(yīng)用架構(gòu)如圖1所示。
大學(xué)生資助管理模式采集的數(shù)據(jù)來(lái)源于公安、民政、銀行和高校。利用先進(jìn)的企業(yè)服務(wù)總線技術(shù),可從多個(gè)源頭獲取數(shù)據(jù)信息,這些數(shù)據(jù)包括家庭生活數(shù)據(jù)、民政生活數(shù)據(jù)、高校生活數(shù)據(jù)、銀行存貸數(shù)據(jù)等。利用先進(jìn)的深度學(xué)習(xí)技術(shù),針對(duì)抓取的數(shù)據(jù)進(jìn)行模式分析,實(shí)現(xiàn)學(xué)生家庭經(jīng)濟(jì)標(biāo)準(zhǔn)評(píng)估、學(xué)生貸款使用跟蹤、學(xué)生信用追蹤評(píng)估,這樣就可以動(dòng)態(tài)、靈活地增強(qiáng)大學(xué)生資助管理能力?;谏疃葘W(xué)習(xí)的大學(xué)生資助管理模式業(yè)務(wù)處理流程如下:
圖1 大學(xué)生資助管理模式
1) 數(shù)據(jù)采集。從公安、民政、銀行和高校等機(jī)構(gòu)的分布式管理系統(tǒng)采集數(shù)據(jù),這些數(shù)據(jù)覆蓋了學(xué)生家庭的經(jīng)濟(jì)收入、工作職業(yè)、存貸信用、資助記錄、學(xué)習(xí)成績(jī)等。然后針對(duì)這些數(shù)據(jù)進(jìn)行處理,實(shí)現(xiàn)數(shù)據(jù)的連接、融合,將其存儲(chǔ)到大學(xué)生資助管理數(shù)據(jù)庫(kù)中。
2) 信息數(shù)據(jù)整合。使用歸一化工具處理采集到的所有數(shù)據(jù),刪除稀疏數(shù)據(jù)和噪聲數(shù)據(jù),然后生成一個(gè)數(shù)據(jù)集。該數(shù)據(jù)集中包含600萬(wàn)條大學(xué)生數(shù)據(jù),數(shù)據(jù)的屬性包括個(gè)人信息、學(xué)習(xí)成績(jī)、家庭信息、金融銀行存貸信息等,然后形成一個(gè)數(shù)據(jù)矩陣。
3) 深度學(xué)習(xí)算法挖掘分析。在大學(xué)生資助管理模式構(gòu)建和分析時(shí),本文使用ReLU激活函數(shù)加快深度學(xué)習(xí)算法的收斂速度,減少卷積神經(jīng)網(wǎng)絡(luò)設(shè)置參數(shù)。卷積層Conv1由20個(gè)4×4的卷積核與輸入數(shù)據(jù)進(jìn)行卷積,卷積步長(zhǎng)為2,得到20個(gè)13×13的特征數(shù)據(jù);卷積層Conv2的卷積核大小為3×3,卷積步長(zhǎng)為2,卷積后得到50個(gè)6×6的特征數(shù)據(jù);卷積層Conv3的卷積核大小為3×3,卷積步長(zhǎng)為1,卷積后生成60個(gè)4×4的特征數(shù)據(jù);池化層步長(zhǎng)為2,采樣后可以獲取80個(gè)2×2的特征數(shù)據(jù);全連接層1神經(jīng)元個(gè)數(shù)為100;全連接層2的神經(jīng)元個(gè)數(shù)為10。Conv1、Conv2、Conv3、池化層1、全連接層1的激活函數(shù)均為ReLU函數(shù),全連接層2的激活函數(shù)為sigmoid激活函數(shù)。
大學(xué)生資助管理模式采用深度學(xué)習(xí)作為數(shù)據(jù)挖掘算法,這樣就可以利用大數(shù)據(jù)分析技術(shù),提高大學(xué)生經(jīng)濟(jì)生活狀況的評(píng)估準(zhǔn)確度。本文為了能夠更好地分析深度學(xué)習(xí)的應(yīng)用效果,對(duì)其進(jìn)行了實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)環(huán)境:實(shí)驗(yàn)平臺(tái)的軟件操作系統(tǒng)為Windows7,編譯軟件采用Matlab10.1軟件,編程使用的語(yǔ)音為Matlab語(yǔ)言,硬件采用Intel 第8代 酷睿 i5-8300H 2.3 GHz,內(nèi)存為4G。
采集了600萬(wàn)條大學(xué)生資助數(shù)據(jù),數(shù)據(jù)的類(lèi)別包括重點(diǎn)貧困、中度貧困和一般貧困,每一個(gè)類(lèi)別包括200萬(wàn)條數(shù)據(jù)。類(lèi)別是指具有相同貧困程度的學(xué)生信息集合,具有類(lèi)似的結(jié)構(gòu)。數(shù)據(jù)集合中單個(gè)對(duì)象之間的相似性非常高,但是類(lèi)別之間的非相似性很高。本文將這些數(shù)據(jù)混合在一起,構(gòu)建了低維度數(shù)據(jù)集和高維度數(shù)據(jù)集。
1) 低維度數(shù)據(jù)集。低維度數(shù)據(jù)集經(jīng)過(guò)預(yù)處理后,保護(hù)20個(gè)關(guān)鍵屬性,利用這些屬性的共享對(duì)數(shù)據(jù)進(jìn)行排序和篩選,分成3個(gè)子數(shù)據(jù)集?;谶@些數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),低維度數(shù)據(jù)集類(lèi)別如表1所示。
表1 低維度數(shù)據(jù)集類(lèi)別
2) 高維度數(shù)據(jù)集。高維度數(shù)據(jù)集經(jīng)過(guò)預(yù)處理后,包含100個(gè)關(guān)鍵屬性,利用這些屬性的共享對(duì)數(shù)據(jù)進(jìn)行排序和篩選,分成3個(gè)子數(shù)據(jù)集。基于這些數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),高維度數(shù)據(jù)集類(lèi)別如表2所示。
表2 高維度數(shù)據(jù)集類(lèi)別
為了驗(yàn)證深度學(xué)習(xí)算法的有效性,同時(shí)引入了關(guān)聯(lián)規(guī)則算法、K-means算法,在同樣的實(shí)驗(yàn)環(huán)境進(jìn)行操作和分析。本文指定每一個(gè)數(shù)據(jù)集的真實(shí)歸類(lèi),以便更好地驗(yàn)證算法運(yùn)行的準(zhǔn)確度[11]。算法實(shí)驗(yàn)過(guò)程中,本文針對(duì)算法實(shí)驗(yàn)效果進(jìn)行準(zhǔn)確評(píng)估,使用準(zhǔn)確度評(píng)估每一個(gè)算法執(zhí)行結(jié)果的可靠度。正確率標(biāo)準(zhǔn)規(guī)定第i個(gè)簇的類(lèi)標(biāo)是由該簇中最多數(shù)對(duì)象的類(lèi)標(biāo)決定,并統(tǒng)計(jì)這些對(duì)象的個(gè)數(shù)為n,共有k個(gè)簇。算法準(zhǔn)確度計(jì)算公式如式(1)所示。
(1)
其中:T描述劃分好的數(shù)據(jù)簇;C表示數(shù)據(jù)集中的真實(shí)的類(lèi)標(biāo)號(hào);A1(c,T)表示屬于真實(shí)類(lèi)別C的數(shù)據(jù)準(zhǔn)確地劃分到簇T中的數(shù)量;A2(c,T)表示屬于真實(shí)類(lèi)別C但是錯(cuò)誤地劃分到簇T中的數(shù)據(jù)對(duì)象數(shù)量。聚類(lèi)結(jié)果的正確率越高,代表聚類(lèi)質(zhì)量越佳。
1)低維度數(shù)據(jù)實(shí)驗(yàn)結(jié)果。關(guān)聯(lián)規(guī)則算法、K-means算法和深度學(xué)習(xí)算法的實(shí)驗(yàn)環(huán)境完全相同。在同樣的實(shí)驗(yàn)環(huán)境下進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果顯示深度學(xué)習(xí)算法的準(zhǔn)確度較高,能夠分析不同學(xué)生貧困的類(lèi)型,準(zhǔn)確定位這些學(xué)生的資助檔次。將深度學(xué)習(xí)算法接入大學(xué)生資助管理系統(tǒng)中,可準(zhǔn)確地根據(jù)學(xué)生的實(shí)際貧困需求進(jìn)行分析,準(zhǔn)確度達(dá)到了98.51%,提高了大學(xué)生資助管理的有效性。低維度數(shù)據(jù)實(shí)驗(yàn)結(jié)果準(zhǔn)確度對(duì)比如表3所示。
表3 低維度數(shù)據(jù)實(shí)驗(yàn)結(jié)果準(zhǔn)確度對(duì)比 %
在上述6個(gè)數(shù)據(jù)集上,當(dāng)數(shù)據(jù)集的類(lèi)別較少時(shí),低維數(shù)據(jù)實(shí)驗(yàn)結(jié)果的準(zhǔn)確度達(dá)到了98.51%,遠(yuǎn)高于傳統(tǒng)的關(guān)聯(lián)規(guī)則算法和K-Means推薦算法。因此可以獲知,如果高校的某個(gè)貧困類(lèi)別的學(xué)生較少時(shí),可以更加精準(zhǔn)地判定學(xué)生的資助檔次,提高低維數(shù)據(jù)分析準(zhǔn)確度,具有重要的作用和意義。
2) 高維數(shù)據(jù)實(shí)驗(yàn)結(jié)果。本文提出的基于深度學(xué)習(xí)算法在分析高維學(xué)生資助數(shù)據(jù)時(shí)也具有很大的優(yōu)勢(shì)。在高維數(shù)據(jù)集上進(jìn)行同樣的實(shí)驗(yàn),分析3種算法的實(shí)驗(yàn)結(jié)果,如表4所示。
表4 高維數(shù)據(jù)實(shí)驗(yàn)結(jié)果準(zhǔn)確度對(duì)比 %
在高維大學(xué)生資助數(shù)據(jù)分析中,深度學(xué)習(xí)算法準(zhǔn)確度雖然有所降低,但是與關(guān)聯(lián)規(guī)則算法和K-means算法相比,深度學(xué)習(xí)算法依然保持較高的準(zhǔn)確度,說(shuō)明利用深度學(xué)習(xí)算法可以更好地預(yù)估高維度貧困學(xué)生數(shù)據(jù)資源的內(nèi)部結(jié)構(gòu)。但是由于每一次數(shù)據(jù)簇心的選擇也是隨機(jī)的,因此難免存在一些問(wèn)題,導(dǎo)致算法的準(zhǔn)確度不穩(wěn)定或降低。比如算法的簇心越多,算法執(zhí)行的準(zhǔn)確度越低。對(duì)于兩類(lèi)數(shù)據(jù)集來(lái)講,深度學(xué)習(xí)算法的執(zhí)行準(zhǔn)確度為92.64%,但是在三類(lèi)數(shù)據(jù)集上算法執(zhí)行準(zhǔn)確度卻下降。這說(shuō)明深度學(xué)習(xí)算法面對(duì)較多的類(lèi)別時(shí)無(wú)法取得最優(yōu)化效果。
與人工判定模式進(jìn)行比較,可突出深度學(xué)習(xí)算法的自動(dòng)化、高性能、高效率、高準(zhǔn)確度。實(shí)驗(yàn)結(jié)果顯示:大學(xué)生資助管理模式采用深度學(xué)習(xí)的準(zhǔn)確度較高,能夠分析不同學(xué)生家庭經(jīng)濟(jì)生活的類(lèi)型,準(zhǔn)確地定位這些學(xué)生的貧困程度。將應(yīng)用效果進(jìn)行量化分析,大學(xué)生資助管理模式應(yīng)用準(zhǔn)確度對(duì)比如表5所示。
表5 大學(xué)生資助管理模式應(yīng)用準(zhǔn)確度對(duì)比 %
家庭經(jīng)濟(jì)標(biāo)準(zhǔn)評(píng)估準(zhǔn)確度采用人工管理模式時(shí)為69.17%,利用深度學(xué)習(xí)管理模式時(shí)則達(dá)到了98.14%,提高了28.97%;學(xué)生貸款使用跟蹤準(zhǔn)確度采用人工管理模式時(shí)為63.48%,利用深度學(xué)習(xí)管理模式時(shí)則達(dá)到了97.29%,提高了33.81%;學(xué)生信用追蹤評(píng)估準(zhǔn)確度采用人工管理模式時(shí)為64.56%,利用深度學(xué)習(xí)管理模式時(shí)則達(dá)到了98.51%,提高了33.95%。分析效率方面,人工分析1年1次,比較固定,而利用深度學(xué)習(xí)的結(jié)果則是實(shí)時(shí)的,可以根據(jù)需求隨時(shí)獲取大學(xué)生的資助數(shù)據(jù)。
深度學(xué)習(xí)是一種先進(jìn)的大數(shù)據(jù)分析算法,利用深度學(xué)習(xí)建立大學(xué)生資助管理平臺(tái),可從多個(gè)部門(mén)獲取大學(xué)生家庭狀況的數(shù)據(jù),并基于“互聯(lián)網(wǎng)+”創(chuàng)新大學(xué)生資助管理模式整合現(xiàn)有資源提高數(shù)據(jù)利用率,從而進(jìn)一步改進(jìn)大學(xué)生資助成效。