向燕飛
(廣東東軟學(xué)院 廣東省佛山市 528225)
每個(gè)人是社會(huì)的組成部分,個(gè)人信用是社會(huì)信用的基礎(chǔ)。如果個(gè)人發(fā)生個(gè)人失信行為,容易引起集體失信。近年來,信用問題已成為社會(huì)關(guān)注的一個(gè)重要問題。如何建設(shè)個(gè)人信用評價(jià)體系,特別針對作為未來社會(huì)的棟梁的高校學(xué)生,是本文研究的工作。通過建立高校學(xué)生個(gè)人信用評價(jià)體系,引導(dǎo)和督促學(xué)生重視個(gè)人信用記錄、改善個(gè)人信用行為,是本文研究的意義所在。
關(guān)于個(gè)人信用評估的研究較多,如李嫻[1]基于GCV 準(zhǔn)則和Newton-Raphson 算法的正則化參數(shù)快速選擇方法,利用最小二乘支持向量機(jī)中建立個(gè)人信用風(fēng)險(xiǎn)預(yù)測模型;劉太安[2]在銀行個(gè)人信用特征數(shù)據(jù)基礎(chǔ)上,將LSVM 算法應(yīng)用于個(gè)人信用評估中;魏志靜[3]在對信用數(shù)據(jù)進(jìn)行多種數(shù)據(jù)操作的基礎(chǔ)上,其中,數(shù)據(jù)處理操作包括數(shù)據(jù)預(yù)處理、指標(biāo)優(yōu)化、格式轉(zhuǎn)換、歸一化等,利用網(wǎng)格搜索和交互檢驗(yàn)選擇最佳核函數(shù)與核參數(shù),同時(shí)使用SVM-KNN 方法進(jìn)行分類預(yù)測并應(yīng)用于個(gè)人信用評估中;張瀾覺[4]在P2P 信貸個(gè)人信用評價(jià)中引入BP 神經(jīng)網(wǎng)絡(luò),利用附加動(dòng)量法和彈性梯度下降法調(diào)整權(quán)值,提出了一個(gè)適用于P2P 信貸個(gè)人信用評價(jià)模型;肖文兵等[5]運(yùn)用網(wǎng)格5-折交叉確認(rèn)來尋找不同核函數(shù)的最優(yōu)參數(shù),以此建立了一個(gè)基于支持向量機(jī)的個(gè)人信用評估預(yù)測方法;史小伍[6]運(yùn)用組合代價(jià)敏感支持向量機(jī)模型,結(jié)合統(tǒng)計(jì)分析和神經(jīng)網(wǎng)絡(luò)技術(shù)構(gòu)建模型個(gè)人信用評價(jià)方法。
雖然個(gè)人信用評估研究較多,但針對高校學(xué)生群體的研究較少,且各類方法各有其優(yōu)缺點(diǎn)。為了解決高校學(xué)生群體的信用評估問題,本文采用最小二乘支持向量機(jī)算法(簡稱LSSVM)進(jìn)行信用評估,同時(shí)采用微粒群算法(簡稱PSO)優(yōu)選LSSVM 算法參數(shù)。
由于PSO 算法是一種利用群體智能的隨機(jī)全局優(yōu)化方法,它易實(shí)現(xiàn)、全局搜索能力較強(qiáng),但線性遞減的慣性權(quán)重進(jìn)化策略使算法存在初期局部搜索能力較弱、易錯(cuò)過全局最優(yōu)值及算法后期全局搜索能力較弱、易陷入局部極值等問題。因此,本文在普通PSO算法基礎(chǔ)上,定義了一種動(dòng)態(tài)自適應(yīng)的慣性權(quán)重方程,建立了一種自適應(yīng)PSO 算法,利用自適應(yīng)PSO 算法優(yōu)選LSSVM 參數(shù),克服了LSSVM 算法參數(shù)敏感性問題,提高了算法的全局搜索能力,并根據(jù)高校學(xué)生信用評估指標(biāo)建立了自適應(yīng)參數(shù)的LSSVM 信用評估模型,為高校學(xué)生信用評估提供了一種新的方法。
LSSVM 算法是SVM 算法的一種改進(jìn)算法,改進(jìn)之處在于:將結(jié)構(gòu)風(fēng)險(xiǎn)最小化式中容許誤差由一次方變?yōu)槠椒?,其不等式約束條件變?yōu)榈仁郊s束條件,從而將求解凸二次規(guī)劃問題轉(zhuǎn)化為求解線性方程組問題。
圖1:個(gè)人信用評估流程
LSSVM 法通過引入對偶理論建立Lagrange 方程求解優(yōu)化問題[7-10]:
上式中αi為Lagrange 乘子,C 為正則化參數(shù),按優(yōu)化條件可解得權(quán)向量w 的表達(dá)式,并利用核函數(shù)K(xk, xl)替換,將優(yōu)化問題轉(zhuǎn)化為求解線性方程組問題,并通過最小二乘法求解線性方程組,避免了SVM 算法中求解凸二次規(guī)劃問題,提高了求解問題的速度和收斂精度,LSSVM 客戶核函數(shù)一般選擇徑向基函數(shù),即,其δ 為核參數(shù)。
通過以上分析,LSSVM 算法受核參數(shù)δ 及正則化參數(shù)C 影響較大,存在參數(shù)敏感性問題 。因此本文擬采用PSO 算法優(yōu)選LSSVM 算法參數(shù)。
由于PSO 算法具有較好的全局搜索能力,但其慣性權(quán)重的線性遞減策略過于簡單,無法滿足實(shí)際問題的需要,同時(shí)它也無法協(xié)調(diào)好算法局部搜索能力與全局搜索能力之間的關(guān)系,因此,本文定義了一種動(dòng)態(tài)自適應(yīng)的慣性權(quán)重方程,建立了一種自適應(yīng)微粒群算法APSO,可根據(jù)實(shí)際問題動(dòng)態(tài)改變PSO 算法的全局搜索能力。
表1:信用評估結(jié)果對比表
在PSO 算法中,其慣性權(quán)重主要起到調(diào)節(jié)粒子局部搜索能力與全局搜索能力的作用,如果慣性權(quán)重較大則表示有較好的全局搜索能力,或者則具有較好的局部收斂能力??蓪T性權(quán)重方程定義為:
在式(2)中,wmax、wmin分別表示慣性權(quán)重的最大和最小值,t 表示迭代次數(shù),N 表示最大迭代代數(shù)。該式表示每慣性權(quán)重隨迭代代數(shù)線性減少,同一迭代代數(shù)下粒子之間的慣性權(quán)重是相同的。但在實(shí)際問題中,每一迭代代數(shù)下每個(gè)粒子所需要的全局搜索能力并不相同,所以必須根據(jù)粒子自身的性質(zhì)來動(dòng)態(tài)改其慣性權(quán)重值,從而將該粒子的全局搜索能力與局部搜索能力的有效地結(jié)合起來。
因此本文定義了一種自適應(yīng)微粒群算法APSO,其自適應(yīng)慣性權(quán)重進(jìn)化方程定義為:
在式(3)中,本文定義了一個(gè)函數(shù)Rij,表示信息自適應(yīng)函數(shù),其具體形式如式(4)所示。式(1+di)/(1+dmax)將慣性權(quán)重與微粒隸屬于全局最優(yōu)位置的距離聯(lián)系起來,越靠近全局最優(yōu)粒子,慣性權(quán)重應(yīng)越小,局部收斂能力應(yīng)越好。di表示該微粒與全局最優(yōu)粒子之間的距離,dmax表示該代微粒中離全局最優(yōu)粒子最遠(yuǎn)的距離,分子分母都加1 是為了避免分母為零。式(fi-fmin+1)/(fmax-fmin+1)將慣性權(quán)重與微粒的適應(yīng)值聯(lián)系起來,適應(yīng)值越小,慣性權(quán)重應(yīng)越小,局部收斂能力應(yīng)越好。fi表示該微粒的適應(yīng)值,fmin表示該代微粒中的最小適應(yīng)值,fmax表示該代微粒中的最大適應(yīng)值。通過APSO 算法慣性權(quán)重的動(dòng)態(tài)自適應(yīng)過程,從而影響該算法的全局搜索能力。
本文通過建立高校學(xué)生信用評估指標(biāo),根據(jù)歷史信用數(shù)據(jù)構(gòu)建學(xué)習(xí)樣本,利用本文提出的自適應(yīng)PSO 算法優(yōu)選LSSVM 參數(shù),同時(shí)構(gòu)建LSSVM 評估模型進(jìn)行個(gè)人信用評估,其構(gòu)建流程如圖1 所示。
本文根據(jù)高校學(xué)生個(gè)人信用特點(diǎn),所建立的高校學(xué)生信用評估指標(biāo)包括:
(1)個(gè)人基本信息:包含學(xué)生年齡,性別及生源地等;
(2)學(xué)?;拘畔ⅲ喊瑢W(xué)校類型(985 學(xué)校、211 學(xué)校及其他大學(xué)),學(xué)生所學(xué)專業(yè)情況等;
(3)學(xué)生在校表現(xiàn):包括學(xué)生學(xué)科成績、學(xué)科排名、借還圖書、獲獎(jiǎng)情況、人際交往等;
(4)學(xué)生經(jīng)濟(jì)情況:主要指學(xué)生經(jīng)濟(jì)來源,包括父母供給、助學(xué)貸款、兼職收入、獎(jiǎng)學(xué)金、研究經(jīng)費(fèi)等;
(5)學(xué)生日常表現(xiàn):包含考試作弊、誠實(shí)守信等方面;
(6)信用卡情況:包含信用卡張數(shù)、刷卡金額及還款情況等。
本文利用學(xué)校助學(xué)貸款個(gè)人數(shù)據(jù),構(gòu)建個(gè)人信用特征數(shù)據(jù)的學(xué)習(xí)樣本進(jìn)行驗(yàn)證,同時(shí)將本文算法與KNN 算法,LSSVM 算法預(yù)測結(jié)果進(jìn)行對比,對比結(jié)果如表1 所示。
通過評估結(jié)果對比,表明了本文所提出來的自適應(yīng)參數(shù)的LSSVM 高校學(xué)生信用評估系統(tǒng)是合理有效性的,為高校學(xué)生信用評估提供了一種新的方法。
本文針對LSSVM 算法參數(shù)敏感性問題,在PSO 算法基礎(chǔ)上,定義了一種動(dòng)態(tài)自適應(yīng)的慣性權(quán)重方程,建立了一種自適應(yīng)PSO算法,利用自適應(yīng)PSO 算法優(yōu)選LSSVM 參數(shù),克服了LSSVM 法對其參數(shù)的敏感性問題,提高了算法的全局搜索能力;并根據(jù)高校學(xué)生信用評估指標(biāo)建立了自適應(yīng)參數(shù)的LSSVM 信用評估模型,為高校學(xué)生信用評估提供了一種新的方法。