胡詩(shī)雅 謝義強(qiáng) 馮雅婧 熊鈺
摘 要:如何進(jìn)行貧困生補(bǔ)助評(píng)定高效準(zhǔn)確化是高校學(xué)生工作存在的普遍性難題,本文以山西財(cái)經(jīng)大學(xué)為研究對(duì)象,在初步構(gòu)建貧困分析指標(biāo)體系的基礎(chǔ)上,設(shè)計(jì)調(diào)查問(wèn)卷搜集數(shù)據(jù),運(yùn)用python軟件建立交叉熵模型,對(duì)所搜集的有效數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,得出重要性指標(biāo)。力爭(zhēng)將補(bǔ)助評(píng)定客觀化,以此來(lái)保證國(guó)家貧困生資助體系公平、公正、公開(kāi),具有現(xiàn)實(shí)性推廣意義。
關(guān)鍵詞:貧困生認(rèn)定指標(biāo)體系;交叉熵模型;數(shù)據(jù)挖掘
2011年11月29日,國(guó)務(wù)院總理溫家寶在中央扶貧開(kāi)發(fā)工作會(huì)議上宣布,將農(nóng)民人均年純收入2300元作為新的國(guó)家扶貧標(biāo)準(zhǔn)。此后以2300元為基準(zhǔn)不定期調(diào)整,2016年為3000元。但由于家庭收入難以調(diào)查并且存在學(xué)生虛報(bào)的情況,單純憑借該指標(biāo)進(jìn)行貧困生評(píng)定存在很大的缺陷。我國(guó)大多數(shù)高校目前的做法是在學(xué)生自主申請(qǐng)的基礎(chǔ)上,結(jié)合學(xué)生所在地鄉(xiāng)鎮(zhèn)、街道辦事處民政部門開(kāi)具的貧困證明來(lái)遴選貧困生。此辦法在過(guò)去行之有效,并在一定的歷史階段起到了重要作用。但是在新的環(huán)境下這種方式顯示出了很多的弊端,各類造假以及無(wú)法顧及貧困生尊嚴(yán)等問(wèn)題難以解決,特別是在缺乏剛性標(biāo)準(zhǔn)的情況下存在著貧困學(xué)生精準(zhǔn)識(shí)別難的問(wèn)題,學(xué)生是否貧困、以及家庭貧困的程度難以鑒定。
針對(duì)上述存在的問(wèn)題,我們利用大學(xué)生各類消費(fèi)信息,設(shè)計(jì)科學(xué)合理的調(diào)查問(wèn)卷,建立一套能客觀并有效反映其消費(fèi)觀和消費(fèi)能力的評(píng)價(jià)指標(biāo)體系,并通過(guò)交叉熵模型對(duì)各個(gè)指標(biāo)賦予權(quán)重,從而明確能夠全面反映大學(xué)生消費(fèi)行為的具體指標(biāo),最大程度減少人為干預(yù),為貧困生等級(jí)評(píng)定工作提供客觀的、具有參考性、針對(duì)性的指標(biāo)來(lái)源,并使客觀的數(shù)據(jù)分析起到國(guó)家及社會(huì)對(duì)貧困生有尊嚴(yán)地資助的作用,維護(hù)貧困學(xué)生的切身利益。
一、貧困生認(rèn)定指標(biāo)體系的確立
由于大學(xué)生的消費(fèi)領(lǐng)域和消費(fèi)行為非常明確,而且大學(xué)生在生活水平上的差距主要是通過(guò)消費(fèi)行為體現(xiàn)出來(lái)的,所以要界定貧困生資格,首要的方面是對(duì)大學(xué)生的消費(fèi)行為進(jìn)行調(diào)查。這個(gè)方法在操作上的難點(diǎn)是如何對(duì)大學(xué)生的消費(fèi)行為進(jìn)行測(cè)量。本文在借鑒大量相關(guān)資料的基礎(chǔ)上確定了多個(gè)測(cè)量變量,以此構(gòu)建貧困分析指標(biāo)體系。
(一)基本情況
基本情況主要包括該學(xué)生家庭人口、性別、年級(jí)、是否受過(guò)資助四方面情況。家庭人口數(shù)量是影響一個(gè)家庭經(jīng)濟(jì)情況的重要因素,直接關(guān)系到每個(gè)家庭的經(jīng)濟(jì)負(fù)擔(dān);此外,性別和年級(jí)不同,消費(fèi)方式和消費(fèi)觀念會(huì)有所區(qū)別;該同學(xué)是否受過(guò)資助在消費(fèi)上也會(huì)有差異,將其進(jìn)行分類處理會(huì)更加合理。
(二)家庭收入情況
家庭收入情況主要包括家庭收入及來(lái)源、醫(yī)療費(fèi)用、生活費(fèi)來(lái)源三方面情況。家庭收入及來(lái)源直接關(guān)系到每個(gè)家庭的經(jīng)濟(jì)狀況;醫(yī)療費(fèi)用是家庭的一項(xiàng)重大支出,巨額的醫(yī)療費(fèi)用會(huì)給部分家庭造成嚴(yán)重的經(jīng)濟(jì)負(fù)擔(dān);生活費(fèi)來(lái)源也是考察家庭經(jīng)濟(jì)狀況的一項(xiàng)參考指標(biāo),經(jīng)常勤工儉學(xué)的學(xué)生也能從側(cè)面反映家庭的艱辛。
(三)基礎(chǔ)性消費(fèi)
基礎(chǔ)性消費(fèi)主要包括日常消費(fèi)用途、餐費(fèi)零食費(fèi)、衣服及化妝品價(jià)位和購(gòu)買頻率等三個(gè)方面的內(nèi)容。日常消費(fèi)與家庭情況息息相關(guān),當(dāng)然其中也難免存在部分學(xué)生出現(xiàn)攀比的現(xiàn)象,從而導(dǎo)致預(yù)測(cè)結(jié)果出現(xiàn)偏差,但這也一定程度上糾正這些學(xué)生的攀比心理;餐費(fèi)零食費(fèi)是學(xué)生在學(xué)校最主要的一項(xiàng)支出,其費(fèi)用的多少以及是否經(jīng)常外出就餐是受家庭經(jīng)濟(jì)狀況影響;衣服及化妝品的花銷是貧困學(xué)生與其他學(xué)生形成消費(fèi)差距的一個(gè)重要指標(biāo),將其納入指標(biāo)體系也比較合理。
(四)電子產(chǎn)品消費(fèi)
電子產(chǎn)品消費(fèi)主要包括手機(jī)及電腦價(jià)位和購(gòu)買時(shí)間、其他電子設(shè)備等內(nèi)容。手機(jī)和電腦的價(jià)位是消費(fèi)差距的一個(gè)重要指標(biāo),當(dāng)然其中也存在攀比因素,但將其作為參考指標(biāo)很有實(shí)際意義;購(gòu)買時(shí)間主要作為輔助指標(biāo),購(gòu)買時(shí)間早的學(xué)生某種程度上也說(shuō)明家庭狀況良好,大部分學(xué)生還是進(jìn)入大學(xué)后才買的電腦;其他電子設(shè)備的購(gòu)買,大部分貧困學(xué)生有了手機(jī)和電腦之后便不再購(gòu)買其他電子設(shè)備。
(五)娛樂(lè)消費(fèi)
娛樂(lè)消費(fèi)情況主要包括電子游戲、戶外體育裝備等內(nèi)容。電子游戲是當(dāng)今大學(xué)生除日常消費(fèi)外的一項(xiàng)重要支出,作為一種可選擇消費(fèi),在一定程度上的確能反映家庭經(jīng)濟(jì)狀況;戶外體育裝備作為一種等級(jí)明晰、價(jià)格分層的商品,不同學(xué)生對(duì)其的消費(fèi)情況也能比較清楚地體現(xiàn)經(jīng)濟(jì)水平。
(六)消費(fèi)觀念
消費(fèi)觀念主要包括消費(fèi)方式和品牌偏執(zhí)兩個(gè)方面。這兩個(gè)方面主要與個(gè)人的消費(fèi)習(xí)慣和消費(fèi)思維相關(guān),家庭經(jīng)濟(jì)條件在此發(fā)揮很大的作用,一大部分條件優(yōu)越的同學(xué)都存在品牌偏執(zhí)等情況,因此,將其作為輔助判斷指標(biāo)納入指標(biāo)體系也是必要的。
基于上述分析得到的指標(biāo)體系結(jié)構(gòu)圖如下:
二、研究設(shè)計(jì)
(一)問(wèn)卷設(shè)計(jì)與數(shù)據(jù)搜集
在對(duì)問(wèn)卷的設(shè)計(jì)中,我們根據(jù)圖一的指標(biāo)體系設(shè)計(jì)了相應(yīng)的問(wèn)題。為了使調(diào)查效果更貼合大學(xué)生實(shí)際,我們?cè)谡秸{(diào)查之前采用自愿樣本法和深度訪談法進(jìn)行了預(yù)調(diào)查,根據(jù)預(yù)調(diào)查反饋的結(jié)果對(duì)個(gè)別項(xiàng)進(jìn)行了修改,確定了最終的調(diào)查問(wèn)卷。
問(wèn)卷發(fā)放形式采取線上、線下發(fā)放相結(jié)合,調(diào)查對(duì)象主要為山西財(cái)經(jīng)大學(xué)在校學(xué)生。最終,此次調(diào)查共回收問(wèn)卷512份,有效問(wèn)卷358份,有效率為69.9%。
在問(wèn)卷處理方面,我們對(duì)問(wèn)卷中的單選題采用二分變量進(jìn)行測(cè)量,即0代表未選中,1代表選中;對(duì)于問(wèn)卷中的多選題,采用分類變量進(jìn)行測(cè)量,則采用1,2,3,4分別表示不同的類別。
(二)研究方法與思維
在方法上,本文主要通過(guò)交叉熵模型對(duì)所搜集數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘。首先在分析過(guò)程中引入多重個(gè)體因素并不斷糾正與完善;再次,數(shù)據(jù)的提供方式由主動(dòng)采集變?yōu)楸粍?dòng)收集,由申請(qǐng)人提供一系列數(shù)據(jù)來(lái)進(jìn)行分析,當(dāng)然數(shù)據(jù)的可靠性需要其他機(jī)制來(lái)進(jìn)行保障。
在思維上,運(yùn)用大數(shù)據(jù)思維,把對(duì)于貧困生的認(rèn)定從傳統(tǒng)的認(rèn)定體系和方法中轉(zhuǎn)到充分利用學(xué)生家庭和個(gè)人的信用、消費(fèi)等信息進(jìn)行客觀的認(rèn)定上來(lái)。這既能體現(xiàn)貧困生的事實(shí),又能保護(hù)學(xué)生的個(gè)人隱私,實(shí)現(xiàn)資助真正的貧困學(xué)生。
三、模型分析與結(jié)果
(一)模型特點(diǎn)及其原理
交叉熵技術(shù)作為數(shù)據(jù)挖掘領(lǐng)域中深入分析分類問(wèn)題的一種方法,是根據(jù)數(shù)據(jù)樣本當(dāng)中跟目標(biāo)屬性相關(guān)的指標(biāo)將數(shù)據(jù)分類,形成一個(gè)交叉熵的結(jié)構(gòu),結(jié)點(diǎn)代表數(shù)據(jù)庫(kù)集中的一個(gè)屬性,根據(jù)不同的判斷結(jié)果選擇不同的子節(jié)點(diǎn),最終的葉結(jié)點(diǎn)表示分類的最終結(jié)果。此分類方法非常適合分析具有類別的數(shù)據(jù),因具有準(zhǔn)確率高、分類速度快、描述簡(jiǎn)單、易于理解等優(yōu)點(diǎn)而得到廣泛應(yīng)用。
模型原理:每一個(gè)節(jié)點(diǎn)通過(guò)計(jì)算當(dāng)前到達(dá)這個(gè)節(jié)點(diǎn)的數(shù)據(jù)集中各個(gè)特征的信息熵進(jìn)行判斷和分類,選擇分類后熵盡量小的特征在該節(jié)點(diǎn)再次分類,當(dāng)數(shù)據(jù)集縮小到一定規(guī)?;蛘邤?shù)據(jù)集中目標(biāo)特征是同一個(gè)值的時(shí)候,分類停止,據(jù)此構(gòu)建交叉熵模型。
(二)交叉熵模型的構(gòu)建
Step1:在Python中自帶的sklearn模塊中引入交叉熵函數(shù)。
Step2:把訓(xùn)練數(shù)據(jù)投入進(jìn)行訓(xùn)練交叉熵。
Step3:將測(cè)試數(shù)據(jù)投入檢驗(yàn)?zāi)P托Ч{(diào)整參數(shù)直到有一個(gè)滿意的效果。
(三)模型結(jié)果
根據(jù)整個(gè)項(xiàng)目的分析以及經(jīng)驗(yàn),我們得出幾個(gè)和資助情況相關(guān)度最高的指標(biāo)是:缺少資金時(shí)的解決方法和品牌偏執(zhí),以及手機(jī)、化妝品的價(jià)位。
由此我們可以看到雖然基礎(chǔ)性消費(fèi)是在校生最主要的一項(xiàng)支出,但作為必需消費(fèi)品,貧困生與其他學(xué)生很難形成消費(fèi)差距,因此有關(guān)該方面的指標(biāo)不宜大權(quán)重地納入指標(biāo)體系。相反,反倒是那些可選擇性消費(fèi)品以及久而久之形成的消費(fèi)方式和消費(fèi)觀念在指標(biāo)體系中發(fā)揮更大的作用,因?yàn)檫@是不同學(xué)生形成消費(fèi)差異的重要方面。
(四)模型檢驗(yàn)
擬合度是否合格的評(píng)判標(biāo)準(zhǔn),關(guān)系著算法的改進(jìn)和模型的優(yōu)化等重要方面。如圖上所示,數(shù)據(jù)劃分同上,藍(lán)線所代表的訓(xùn)練集上的效果值近似達(dá)到了100%,而且紅線所表示對(duì)新的數(shù)據(jù)的擬合隨著樣本數(shù)量的增大擬合分?jǐn)?shù)一超過(guò)了80%,故交叉熵模型隨著數(shù)據(jù)量的增長(zhǎng)顯示出較為優(yōu)化的結(jié)果。
四、結(jié)語(yǔ)
(一)總結(jié)評(píng)價(jià)
與研究該內(nèi)容的大部分文章相比,本文創(chuàng)新之處在于并不僅僅止步于建立貧困分析指標(biāo)體系,而是在此基礎(chǔ)上進(jìn)一步結(jié)合當(dāng)前時(shí)代發(fā)展利用大數(shù)據(jù)技術(shù)進(jìn)行數(shù)據(jù)挖掘,從而根據(jù)數(shù)據(jù)分析驅(qū)動(dòng)決策,達(dá)到補(bǔ)助評(píng)定客觀化的目的。
但本文僅通過(guò)外部感知的消費(fèi)情況對(duì)大學(xué)生貧困程度進(jìn)行界定,還應(yīng)結(jié)合學(xué)習(xí)成績(jī)因素、人際關(guān)系因素、生活作風(fēng)因素、遵守學(xué)校紀(jì)律因素以及社會(huì)公益因素等體現(xiàn)大學(xué)生綜合素質(zhì)的指標(biāo)進(jìn)行補(bǔ)助評(píng)選。此外,所建立的模型只得到了在指標(biāo)體系中發(fā)揮更大作用的維度,并沒(méi)有進(jìn)行得到各個(gè)指標(biāo)的具體權(quán)重,因此還可以進(jìn)一步優(yōu)化模型。
(二)啟示與建議
1.完善貧困生評(píng)價(jià)體系指標(biāo)
首先應(yīng)該將消費(fèi)指標(biāo)納入評(píng)價(jià)體系,并將數(shù)據(jù)分析方法所得的結(jié)果作為一個(gè)參考,不再單一地使用經(jīng)驗(yàn)性的方法來(lái)評(píng)價(jià)。其次根據(jù)交叉熵模型分析結(jié)果可以舍棄部分與評(píng)價(jià)貧困生無(wú)關(guān)的屬性,從而大大減輕貧困生評(píng)定工作量,使評(píng)價(jià)指標(biāo)更加明確和簡(jiǎn)潔。
2.改進(jìn)貧困生評(píng)價(jià)工作方法
高校學(xué)生工作部門在遴選貧困生時(shí),除了采取學(xué)生自述和地方民政部門開(kāi)貧困證明的辦法外,還應(yīng)該從外部感知的角度對(duì)學(xué)生的消費(fèi)行為進(jìn)行評(píng)價(jià),將模型所篩選出的重要指標(biāo)作為遴選貧困生工作的重要依據(jù),這樣有利于保證貧困生遴選的準(zhǔn)確性,進(jìn)而可保證助學(xué)金評(píng)定的公平性和公正性。
參考文獻(xiàn):
[1]楊知玲.數(shù)據(jù)挖掘在高校貧困生評(píng)價(jià)中的應(yīng)用研究[D].華南理工大學(xué),2015.
[2]常亞平,宗樹(shù)闊.中國(guó)高校學(xué)生貧困度測(cè)評(píng)體系和評(píng)價(jià)模型構(gòu)建研究[J].高教探索,2009(01):119-124.
[3]繆春梅,史吉峰,孫艷華.高校貧困生助學(xué)金評(píng)價(jià)體系的構(gòu)建[J].2010(02):210-212.
作者簡(jiǎn)介:胡詩(shī)雅(1997—),女,滿族,河北承德人,經(jīng)濟(jì)學(xué)學(xué)士,主要研究方向:金融風(fēng)險(xiǎn)。