深度學(xué)習(xí)下大學(xué)生資助管理模式創(chuàng)新研究

2019-08-17 07:39:54勝獻(xiàn)利

重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)) 2019年7期

勝獻(xiàn)利

(河南大學(xué) 濮陽(yáng)工學(xué)院，河南濮陽(yáng) 457000)

高校學(xué)生資助具有公益性、選擇性、幫扶性，因此選拔資助對(duì)象時(shí)需要保證公平、公正和公開(kāi)。在現(xiàn)實(shí)工作實(shí)踐中，由于人的認(rèn)知能力有限，高校學(xué)生資助工作運(yùn)行得并非一帆風(fēng)順，時(shí)常遇到各類(lèi)型因素影響和阻礙學(xué)生資助工作，在學(xué)生家庭情況調(diào)研、貧困生等級(jí)認(rèn)定和過(guò)程性評(píng)價(jià)時(shí)均存在一定問(wèn)題[1]。由于學(xué)生家庭調(diào)研成本較高，因此尚無(wú)高校采用家庭訪談形式開(kāi)展貧困學(xué)生實(shí)際情況調(diào)查工作，籠統(tǒng)地要求貧困生填寫(xiě)家庭情況調(diào)查表，由生源地的鄉(xiāng)村街道辦事處或民政局加蓋公章。但以此種方式認(rèn)定的貧困生真實(shí)情況得不到確認(rèn)。即便有些學(xué)生通過(guò)抽樣調(diào)查方式，由于成本高、覆蓋面窄等情況也無(wú)法起到應(yīng)有的效果。隨著家庭調(diào)研方式的改革，一些學(xué)校認(rèn)定貧困生時(shí)開(kāi)始綜合考慮日常因素，比如學(xué)生的一卡通消費(fèi)、日常的穿著打扮、手機(jī)電腦品牌價(jià)格等，但是由于這些數(shù)據(jù)斷斷續(xù)續(xù)，所以收效甚微。部分學(xué)校別出心裁地采取一些方法，比如讓學(xué)生自己拍攝家庭生活視頻照片資料、提供死亡證明、低保證、殘疾證等，公開(kāi)實(shí)施“比慘大賽”，既影響了學(xué)生的心理健康，又讓本是扶危救困的學(xué)生資助政策在大學(xué)生中產(chǎn)生不良影響。學(xué)生困難等級(jí)認(rèn)定也較為困難，由于學(xué)生家庭數(shù)據(jù)采集不準(zhǔn)確，生活水平不能準(zhǔn)確判定，因此無(wú)法準(zhǔn)確地認(rèn)定學(xué)生困難等級(jí)，學(xué)生資助無(wú)法準(zhǔn)確實(shí)施[2]。學(xué)生生活狀況評(píng)定完成之后就固定不變，影響資助政策的有效實(shí)施。學(xué)生資助過(guò)程性管理弱，許多學(xué)校采用年度審核制度，每年的評(píng)價(jià)方式都一成不變，因此學(xué)生資助評(píng)價(jià)固化滯后，無(wú)法反映多變的貧困生活狀況，影響學(xué)生受資助的情況。大學(xué)生學(xué)習(xí)和成長(zhǎng)過(guò)程中，學(xué)生資助是一個(gè)剛性支出，需要給予足夠的關(guān)注，但是這些剛性支出已經(jīng)成為學(xué)生評(píng)價(jià)的生活瓶頸，如果不使用動(dòng)態(tài)的評(píng)估過(guò)程就無(wú)法適應(yīng)學(xué)生資助模式[3]。

目前，隨著人工智能、深度學(xué)習(xí)、云計(jì)算、互聯(lián)網(wǎng)等技術(shù)的發(fā)展，公安、民政、銀行、高校等機(jī)構(gòu)已經(jīng)開(kāi)發(fā)了自動(dòng)化軟件，積累了大量的數(shù)據(jù)資源，覆蓋了每一個(gè)家庭，因此可以利用深度學(xué)習(xí)構(gòu)建一個(gè)關(guān)聯(lián)分析模式，將多個(gè)部門(mén)的數(shù)據(jù)整合在一起，分析學(xué)生家庭經(jīng)濟(jì)生活狀態(tài)，從而準(zhǔn)確判定大學(xué)生資助情況，動(dòng)態(tài)管理大學(xué)生資助過(guò)程。

1 深度學(xué)習(xí)

深度學(xué)習(xí)算法是一種先進(jìn)的前饋型人工神經(jīng)網(wǎng)絡(luò)，其包括兩個(gè)卷積層，分別是特征提取層和特征映射層[4]。特征提取層的輸入神經(jīng)元與前一層局部連接，可以提取局部特征，確定特征與特征位置關(guān)系。特征映射層將特征映射到一個(gè)平面上，每一個(gè)平面上的神經(jīng)元擁有相同的權(quán)值[5]。卷積神經(jīng)網(wǎng)絡(luò)利用Sigmoid函數(shù)作為激活函數(shù)，使得特征及其映射具有位移不變性，從而大幅度減少設(shè)置的自有參數(shù)數(shù)量[6]。深度學(xué)習(xí)概念源于人工神經(jīng)網(wǎng)絡(luò)，是一種包含多個(gè)隱藏層的深度學(xué)習(xí)結(jié)構(gòu)，能夠通過(guò)組合底層特征形成更加抽象的高層類(lèi)別或特征，以便發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示[7]。深度指的是神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)得到的函數(shù)中非線性運(yùn)算組合水平的數(shù)量，當(dāng)前神經(jīng)網(wǎng)絡(luò)多是較低水平的網(wǎng)絡(luò)結(jié)構(gòu)，比如1個(gè)輸入層、1個(gè)隱藏層和1個(gè)輸出層。深度學(xué)習(xí)則是非線性運(yùn)算組合水平較高的神經(jīng)網(wǎng)絡(luò)，比如1個(gè)輸入層、3個(gè)隱藏層和1個(gè)輸出層[8]。深度學(xué)習(xí)可以表示高階抽象概念的復(fù)雜函數(shù)，解決目標(biāo)識(shí)別、語(yǔ)音感知和語(yǔ)言理解等人工智能相關(guān)的任務(wù)。研發(fā)發(fā)現(xiàn)：可以使用多種方式描述深度學(xué)習(xí)的觀測(cè)值，比如特征向量、輪廓區(qū)域等，更容易從海量數(shù)據(jù)中進(jìn)行實(shí)例學(xué)習(xí)，生成一個(gè)準(zhǔn)確的網(wǎng)絡(luò)結(jié)構(gòu)，提高機(jī)器學(xué)習(xí)的準(zhǔn)確度[9-10]。

深度學(xué)習(xí)經(jīng)過(guò)多年研究，已經(jīng)得到了極大的改進(jìn)，引入了形狀建模[11]、模糊數(shù)學(xué)、因子分析、信息論等技術(shù)，準(zhǔn)確度和魯棒性均有提升。深度學(xué)習(xí)利用形狀建模技術(shù)，可以提高圖像識(shí)別、特征檢測(cè)的準(zhǔn)確度，進(jìn)一步提高圖像處理和識(shí)別的有效性。深度學(xué)習(xí)可以利用模糊數(shù)學(xué)和因子分析技術(shù)，強(qiáng)化卷積神經(jīng)網(wǎng)絡(luò)求解空間的啟發(fā)式規(guī)則，提高深度學(xué)習(xí)的處理速度和效率。利用信息論等技術(shù)，深度學(xué)習(xí)可提高數(shù)據(jù)度量的有效性，進(jìn)一步提高數(shù)據(jù)相似性度量準(zhǔn)確度。目前，深度學(xué)習(xí)已經(jīng)在很多領(lǐng)域取得了顯著的應(yīng)用成效，比如置信神經(jīng)網(wǎng)絡(luò)等，同時(shí)也廣泛應(yīng)用于圖像識(shí)別[12]、語(yǔ)音識(shí)別[13]、基因識(shí)別、視覺(jué)導(dǎo)航等領(lǐng)域，并吸引了谷歌、百度、騰訊、微軟、阿里巴巴、英特爾等公司的關(guān)注，獲得了越來(lái)越多的研究成果[14]。

2 基于深度學(xué)習(xí)的大學(xué)生資助管理模式研究

大學(xué)生資助管理利用深度學(xué)習(xí)可以實(shí)現(xiàn)精準(zhǔn)化、動(dòng)態(tài)化、實(shí)時(shí)化、共享化和智能化管理模式，以適應(yīng)高等教育改革的發(fā)展需要，促進(jìn)各地區(qū)發(fā)展，滿(mǎn)足大學(xué)生成長(zhǎng)成才的需求。深度學(xué)習(xí)在大學(xué)生資助管理模式中的應(yīng)用架構(gòu)如圖1所示。

大學(xué)生資助管理模式采集的數(shù)據(jù)來(lái)源于公安、民政、銀行和高校。利用先進(jìn)的企業(yè)服務(wù)總線技術(shù)，可從多個(gè)源頭獲取數(shù)據(jù)信息，這些數(shù)據(jù)包括家庭生活數(shù)據(jù)、民政生活數(shù)據(jù)、高校生活數(shù)據(jù)、銀行存貸數(shù)據(jù)等。利用先進(jìn)的深度學(xué)習(xí)技術(shù)，針對(duì)抓取的數(shù)據(jù)進(jìn)行模式分析，實(shí)現(xiàn)學(xué)生家庭經(jīng)濟(jì)標(biāo)準(zhǔn)評(píng)估、學(xué)生貸款使用跟蹤、學(xué)生信用追蹤評(píng)估，這樣就可以動(dòng)態(tài)、靈活地增強(qiáng)大學(xué)生資助管理能力?；谏疃葘W(xué)習(xí)的大學(xué)生資助管理模式業(yè)務(wù)處理流程如下：

圖1 大學(xué)生資助管理模式

1) 數(shù)據(jù)采集。從公安、民政、銀行和高校等機(jī)構(gòu)的分布式管理系統(tǒng)采集數(shù)據(jù)，這些數(shù)據(jù)覆蓋了學(xué)生家庭的經(jīng)濟(jì)收入、工作職業(yè)、存貸信用、資助記錄、學(xué)習(xí)成績(jī)等。然后針對(duì)這些數(shù)據(jù)進(jìn)行處理，實(shí)現(xiàn)數(shù)據(jù)的連接、融合，將其存儲(chǔ)到大學(xué)生資助管理數(shù)據(jù)庫(kù)中。

2) 信息數(shù)據(jù)整合。使用歸一化工具處理采集到的所有數(shù)據(jù)，刪除稀疏數(shù)據(jù)和噪聲數(shù)據(jù)，然后生成一個(gè)數(shù)據(jù)集。該數(shù)據(jù)集中包含600萬(wàn)條大學(xué)生數(shù)據(jù)，數(shù)據(jù)的屬性包括個(gè)人信息、學(xué)習(xí)成績(jī)、家庭信息、金融銀行存貸信息等，然后形成一個(gè)數(shù)據(jù)矩陣。

3) 深度學(xué)習(xí)算法挖掘分析。在大學(xué)生資助管理模式構(gòu)建和分析時(shí)，本文使用ReLU激活函數(shù)加快深度學(xué)習(xí)算法的收斂速度，減少卷積神經(jīng)網(wǎng)絡(luò)設(shè)置參數(shù)。卷積層Conv1由20個(gè)4×4的卷積核與輸入數(shù)據(jù)進(jìn)行卷積，卷積步長(zhǎng)為2，得到20個(gè)13×13的特征數(shù)據(jù)；卷積層Conv2的卷積核大小為3×3，卷積步長(zhǎng)為2，卷積后得到50個(gè)6×6的特征數(shù)據(jù)；卷積層Conv3的卷積核大小為3×3，卷積步長(zhǎng)為1，卷積后生成60個(gè)4×4的特征數(shù)據(jù)；池化層步長(zhǎng)為2，采樣后可以獲取80個(gè)2×2的特征數(shù)據(jù)；全連接層1神經(jīng)元個(gè)數(shù)為100；全連接層2的神經(jīng)元個(gè)數(shù)為10。Conv1、Conv2、Conv3、池化層1、全連接層1的激活函數(shù)均為ReLU函數(shù)，全連接層2的激活函數(shù)為sigmoid激活函數(shù)。

3 深度學(xué)習(xí)應(yīng)用實(shí)驗(yàn)及結(jié)果分析

3.1 實(shí)驗(yàn)環(huán)境

大學(xué)生資助管理模式采用深度學(xué)習(xí)作為數(shù)據(jù)挖掘算法，這樣就可以利用大數(shù)據(jù)分析技術(shù)，提高大學(xué)生經(jīng)濟(jì)生活狀況的評(píng)估準(zhǔn)確度。本文為了能夠更好地分析深度學(xué)習(xí)的應(yīng)用效果，對(duì)其進(jìn)行了實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)環(huán)境：實(shí)驗(yàn)平臺(tái)的軟件操作系統(tǒng)為Windows7，編譯軟件采用Matlab10.1軟件，編程使用的語(yǔ)音為Matlab語(yǔ)言，硬件采用Intel 第8代酷睿 i5-8300H 2.3 GHz，內(nèi)存為4G。

3.2 實(shí)驗(yàn)數(shù)據(jù)

采集了600萬(wàn)條大學(xué)生資助數(shù)據(jù)，數(shù)據(jù)的類(lèi)別包括重點(diǎn)貧困、中度貧困和一般貧困，每一個(gè)類(lèi)別包括200萬(wàn)條數(shù)據(jù)。類(lèi)別是指具有相同貧困程度的學(xué)生信息集合，具有類(lèi)似的結(jié)構(gòu)。數(shù)據(jù)集合中單個(gè)對(duì)象之間的相似性非常高，但是類(lèi)別之間的非相似性很高。本文將這些數(shù)據(jù)混合在一起，構(gòu)建了低維度數(shù)據(jù)集和高維度數(shù)據(jù)集。

1) 低維度數(shù)據(jù)集。低維度數(shù)據(jù)集經(jīng)過(guò)預(yù)處理后，保護(hù)20個(gè)關(guān)鍵屬性，利用這些屬性的共享對(duì)數(shù)據(jù)進(jìn)行排序和篩選，分成3個(gè)子數(shù)據(jù)集?；谶@些數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)，低維度數(shù)據(jù)集類(lèi)別如表1所示。

表1 低維度數(shù)據(jù)集類(lèi)別

2) 高維度數(shù)據(jù)集。高維度數(shù)據(jù)集經(jīng)過(guò)預(yù)處理后，包含100個(gè)關(guān)鍵屬性，利用這些屬性的共享對(duì)數(shù)據(jù)進(jìn)行排序和篩選，分成3個(gè)子數(shù)據(jù)集。基于這些數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)，高維度數(shù)據(jù)集類(lèi)別如表2所示。

表2 高維度數(shù)據(jù)集類(lèi)別

3.3 算法實(shí)驗(yàn)評(píng)價(jià)標(biāo)準(zhǔn)

為了驗(yàn)證深度學(xué)習(xí)算法的有效性，同時(shí)引入了關(guān)聯(lián)規(guī)則算法、K-means算法，在同樣的實(shí)驗(yàn)環(huán)境進(jìn)行操作和分析。本文指定每一個(gè)數(shù)據(jù)集的真實(shí)歸類(lèi)，以便更好地驗(yàn)證算法運(yùn)行的準(zhǔn)確度[11]。算法實(shí)驗(yàn)過(guò)程中，本文針對(duì)算法實(shí)驗(yàn)效果進(jìn)行準(zhǔn)確評(píng)估，使用準(zhǔn)確度評(píng)估每一個(gè)算法執(zhí)行結(jié)果的可靠度。正確率標(biāo)準(zhǔn)規(guī)定第i個(gè)簇的類(lèi)標(biāo)是由該簇中最多數(shù)對(duì)象的類(lèi)標(biāo)決定，并統(tǒng)計(jì)這些對(duì)象的個(gè)數(shù)為n，共有k個(gè)簇。算法準(zhǔn)確度計(jì)算公式如式(1)所示。

(1)

其中：T描述劃分好的數(shù)據(jù)簇；C表示數(shù)據(jù)集中的真實(shí)的類(lèi)標(biāo)號(hào)；A1(c,T)表示屬于真實(shí)類(lèi)別C的數(shù)據(jù)準(zhǔn)確地劃分到簇T中的數(shù)量；A2(c,T)表示屬于真實(shí)類(lèi)別C但是錯(cuò)誤地劃分到簇T中的數(shù)據(jù)對(duì)象數(shù)量。聚類(lèi)結(jié)果的正確率越高，代表聚類(lèi)質(zhì)量越佳。

3.4 算法實(shí)驗(yàn)結(jié)果及分析

1)低維度數(shù)據(jù)實(shí)驗(yàn)結(jié)果。關(guān)聯(lián)規(guī)則算法、K-means算法和深度學(xué)習(xí)算法的實(shí)驗(yàn)環(huán)境完全相同。在同樣的實(shí)驗(yàn)環(huán)境下進(jìn)行實(shí)驗(yàn)，實(shí)驗(yàn)結(jié)果顯示深度學(xué)習(xí)算法的準(zhǔn)確度較高，能夠分析不同學(xué)生貧困的類(lèi)型，準(zhǔn)確定位這些學(xué)生的資助檔次。將深度學(xué)習(xí)算法接入大學(xué)生資助管理系統(tǒng)中，可準(zhǔn)確地根據(jù)學(xué)生的實(shí)際貧困需求進(jìn)行分析，準(zhǔn)確度達(dá)到了98.51%，提高了大學(xué)生資助管理的有效性。低維度數(shù)據(jù)實(shí)驗(yàn)結(jié)果準(zhǔn)確度對(duì)比如表3所示。

表3 低維度數(shù)據(jù)實(shí)驗(yàn)結(jié)果準(zhǔn)確度對(duì)比 %

在上述6個(gè)數(shù)據(jù)集上，當(dāng)數(shù)據(jù)集的類(lèi)別較少時(shí)，低維數(shù)據(jù)實(shí)驗(yàn)結(jié)果的準(zhǔn)確度達(dá)到了98.51%，遠(yuǎn)高于傳統(tǒng)的關(guān)聯(lián)規(guī)則算法和K-Means推薦算法。因此可以獲知，如果高校的某個(gè)貧困類(lèi)別的學(xué)生較少時(shí)，可以更加精準(zhǔn)地判定學(xué)生的資助檔次，提高低維數(shù)據(jù)分析準(zhǔn)確度，具有重要的作用和意義。

2) 高維數(shù)據(jù)實(shí)驗(yàn)結(jié)果。本文提出的基于深度學(xué)習(xí)算法在分析高維學(xué)生資助數(shù)據(jù)時(shí)也具有很大的優(yōu)勢(shì)。在高維數(shù)據(jù)集上進(jìn)行同樣的實(shí)驗(yàn)，分析3種算法的實(shí)驗(yàn)結(jié)果，如表4所示。

表4 高維數(shù)據(jù)實(shí)驗(yàn)結(jié)果準(zhǔn)確度對(duì)比 %

在高維大學(xué)生資助數(shù)據(jù)分析中，深度學(xué)習(xí)算法準(zhǔn)確度雖然有所降低，但是與關(guān)聯(lián)規(guī)則算法和K-means算法相比，深度學(xué)習(xí)算法依然保持較高的準(zhǔn)確度，說(shuō)明利用深度學(xué)習(xí)算法可以更好地預(yù)估高維度貧困學(xué)生數(shù)據(jù)資源的內(nèi)部結(jié)構(gòu)。但是由于每一次數(shù)據(jù)簇心的選擇也是隨機(jī)的，因此難免存在一些問(wèn)題，導(dǎo)致算法的準(zhǔn)確度不穩(wěn)定或降低。比如算法的簇心越多，算法執(zhí)行的準(zhǔn)確度越低。對(duì)于兩類(lèi)數(shù)據(jù)集來(lái)講，深度學(xué)習(xí)算法的執(zhí)行準(zhǔn)確度為92.64%，但是在三類(lèi)數(shù)據(jù)集上算法執(zhí)行準(zhǔn)確度卻下降。這說(shuō)明深度學(xué)習(xí)算法面對(duì)較多的類(lèi)別時(shí)無(wú)法取得最優(yōu)化效果。

4 大學(xué)生資助管理模式實(shí)際應(yīng)用效果分析

與人工判定模式進(jìn)行比較，可突出深度學(xué)習(xí)算法的自動(dòng)化、高性能、高效率、高準(zhǔn)確度。實(shí)驗(yàn)結(jié)果顯示：大學(xué)生資助管理模式采用深度學(xué)習(xí)的準(zhǔn)確度較高，能夠分析不同學(xué)生家庭經(jīng)濟(jì)生活的類(lèi)型，準(zhǔn)確地定位這些學(xué)生的貧困程度。將應(yīng)用效果進(jìn)行量化分析，大學(xué)生資助管理模式應(yīng)用準(zhǔn)確度對(duì)比如表5所示。

表5 大學(xué)生資助管理模式應(yīng)用準(zhǔn)確度對(duì)比 %

家庭經(jīng)濟(jì)標(biāo)準(zhǔn)評(píng)估準(zhǔn)確度采用人工管理模式時(shí)為69.17%，利用深度學(xué)習(xí)管理模式時(shí)則達(dá)到了98.14%，提高了28.97%；學(xué)生貸款使用跟蹤準(zhǔn)確度采用人工管理模式時(shí)為63.48%，利用深度學(xué)習(xí)管理模式時(shí)則達(dá)到了97.29%，提高了33.81%；學(xué)生信用追蹤評(píng)估準(zhǔn)確度采用人工管理模式時(shí)為64.56%，利用深度學(xué)習(xí)管理模式時(shí)則達(dá)到了98.51%，提高了33.95%。分析效率方面，人工分析1年1次，比較固定，而利用深度學(xué)習(xí)的結(jié)果則是實(shí)時(shí)的，可以根據(jù)需求隨時(shí)獲取大學(xué)生的資助數(shù)據(jù)。

5 結(jié)束語(yǔ)

深度學(xué)習(xí)是一種先進(jìn)的大數(shù)據(jù)分析算法，利用深度學(xué)習(xí)建立大學(xué)生資助管理平臺(tái)，可從多個(gè)部門(mén)獲取大學(xué)生家庭狀況的數(shù)據(jù)，并基于“互聯(lián)網(wǎng)+”創(chuàng)新大學(xué)生資助管理模式整合現(xiàn)有資源提高數(shù)據(jù)利用率，從而進(jìn)一步改進(jìn)大學(xué)生資助成效。