肖永良,朱韶平,劉文彬,李香寶
(1.湖南財(cái)政經(jīng)濟(jì)學(xué)院 信息管理系,湖南 長(zhǎng)沙 410205;2.中南大學(xué) 信息科學(xué)與工程學(xué)院,湖南 長(zhǎng)沙 410075)
基于優(yōu)化支持向量機(jī)的高校教師績(jī)效評(píng)價(jià)研究
肖永良1,2,朱韶平1,劉文彬1,李香寶1
(1.湖南財(cái)政經(jīng)濟(jì)學(xué)院 信息管理系,湖南 長(zhǎng)沙 410205;2.中南大學(xué) 信息科學(xué)與工程學(xué)院,湖南 長(zhǎng)沙 410075)
為了提高高校教師的績(jī)效評(píng)價(jià)效果,本文提出一種基于優(yōu)化支持向量機(jī)的高校教師績(jī)效分類(lèi)方法.采用支持向量機(jī)的非線性逼近能力描述績(jī)效等級(jí)與影響因子間的復(fù)雜關(guān)系,同時(shí)利用改進(jìn)的遺傳算法對(duì)支持向量機(jī)參數(shù)進(jìn)行優(yōu)化處理,進(jìn)而提高績(jī)效識(shí)別分類(lèi)精度.實(shí)驗(yàn)結(jié)果表明,與經(jīng)典支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)相比,該模型具有更好的泛化性能,能夠明顯提高高校教師績(jī)效的評(píng)價(jià)效果.
高校教師績(jī)效;支持向量機(jī);遺傳算法;參數(shù)優(yōu)化
目前,高校普遍實(shí)行了教師聘任制,學(xué)校管理部門(mén)需要對(duì)教師進(jìn)行全面、公正的績(jī)效評(píng)價(jià).然而,現(xiàn)有的高校教師績(jī)效評(píng)價(jià)成效并不令人滿意,其中,受批評(píng)最多的是評(píng)價(jià)過(guò)程存在過(guò)多的主觀因素[1-3].目前,傳統(tǒng)的高校教師績(jī)效評(píng)價(jià)方法主要有層次分析法[4],主成分分析法[5]和模糊綜合評(píng)價(jià)法[6]等,這些方法大都是基于線性規(guī)律進(jìn)行評(píng)價(jià),而高校教師績(jī)效與教學(xué)、科研、服務(wù)社會(huì)等多種因素有關(guān),且它們之間存在復(fù)雜的非線性關(guān)系,很難用這些傳統(tǒng)的評(píng)價(jià)方法進(jìn)行準(zhǔn)確而全面的描述.近年來(lái),有些學(xué)者采用非線性分析能力非常優(yōu)異的神經(jīng)網(wǎng)絡(luò)建立績(jī)效評(píng)價(jià)模型,取得了不錯(cuò)的評(píng)價(jià)效果[7],但也存在以下缺點(diǎn):不適合信息有限的小樣本,當(dāng)樣本數(shù)目較小時(shí),容易出現(xiàn)過(guò)擬合現(xiàn)象;同時(shí)迭代過(guò)程中也容易產(chǎn)生局部極小的問(wèn)題.為進(jìn)一步提高高校教師績(jī)效的評(píng)價(jià)效果,本文提出一種采用自適應(yīng)遺傳算法和支持向量機(jī)結(jié)合的高校教師績(jī)效評(píng)價(jià)方法.采用支持向量機(jī)的非線性逼近能力描述績(jī)效等級(jí)與影響因子間的復(fù)雜非線性關(guān)系.針對(duì)采用反復(fù)試驗(yàn)確定模型參數(shù)存在的主觀性較強(qiáng),且難以獲得最優(yōu)參數(shù)的問(wèn)題,提出利用改進(jìn)的遺傳算法對(duì)支持向量機(jī)參數(shù)進(jìn)行優(yōu)化處理.
支持向量機(jī)(SVM)是一種統(tǒng)計(jì)學(xué)理論下的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的學(xué)習(xí)算法[8].其核心思想就是建立一個(gè)最優(yōu)分類(lèi)面作為決策函數(shù),將已知樣本準(zhǔn)確劃分為兩類(lèi),同時(shí)滿足分類(lèi)間隔最大的約束條件.由于支持向量機(jī)相比于神經(jīng)網(wǎng)絡(luò)對(duì)已知樣本的數(shù)量要求不高,且求解的是一個(gè)凸優(yōu)化問(wèn)題,有效的解決了神經(jīng)網(wǎng)絡(luò)存在的過(guò)擬合問(wèn)題,更加適合于小樣本、非線性的分類(lèi)問(wèn)題[9].
給定一個(gè)獨(dú)立分布的樣本集X={(xi,yi),i=1,2,…,n},xi∈Rd,關(guān)于它的分類(lèi)問(wèn)題簡(jiǎn)單介紹如下:若樣本xi屬于第1類(lèi),則標(biāo)記為正(yi=+1),否則標(biāo)記為負(fù)(yi=-1).對(duì)于線性分類(lèi)問(wèn)題,為獲得最佳分類(lèi)效果,需要構(gòu)建以下優(yōu)化問(wèn)題:
其中ω為模型參數(shù),b為分類(lèi)閾值,參數(shù)C為樣本的懲罰系數(shù).利用Wolf對(duì)偶定律可以將上述優(yōu)化問(wèn)題轉(zhuǎn)化為求解其對(duì)偶問(wèn)題:
上述優(yōu)化問(wèn)題是一個(gè)關(guān)于Lagrange乘子a的二次規(guī)劃問(wèn)題,存在唯一解.若ai>0,則稱(chēng)其對(duì)應(yīng)的樣本為支持向量.求解上述對(duì)偶問(wèn)題后,可以得到最優(yōu)分類(lèi)函數(shù):
對(duì)應(yīng)非線性分類(lèi)情況,可以利用非線性函數(shù)將訓(xùn)練樣本從原始輸入空間投影至高維Hilbert空間,然后在該空間中構(gòu)造出最優(yōu)分類(lèi)超平面,能夠使訓(xùn)練樣本在該空間中進(jìn)行線性分類(lèi).根據(jù)泛函理論基礎(chǔ),利用一種滿足Mercer條件的內(nèi)積核函數(shù)k(xi,x)=?(xi)·?(x),就可以實(shí)現(xiàn)某一非線性變換后的線性分類(lèi)要求.此時(shí),分類(lèi)函數(shù)可表示為:
考慮到徑向基核函數(shù)在一般情況下,泛化能力要優(yōu)于其他的核函數(shù),如線性函數(shù)、多項(xiàng)式函數(shù)和Sismoid核函數(shù)等,因此本文選擇徑向基核函數(shù)k(xi,x)=exp(-||x-xi||2/2σ2)構(gòu)建分類(lèi)函數(shù),高校教師績(jī)效評(píng)價(jià)模型可表示為:
在運(yùn)用徑向基核函數(shù)SVM建立績(jī)效評(píng)價(jià)模型過(guò)程中,需要預(yù)先確定參數(shù)C和σ.選取恰當(dāng)?shù)腃可改善模型的抗噪聲能力,從而提高SVM的穩(wěn)定性;參數(shù)σ則在一定程度上決定了模型預(yù)測(cè)的精度和泛化能力.當(dāng)前常采用反復(fù)試驗(yàn)的方法確定模型參數(shù),主觀性較強(qiáng),且難以獲得最優(yōu)參數(shù)來(lái)保證模型的評(píng)價(jià)效果.為解決此問(wèn)題,本文對(duì)遺傳算法中的交叉和變異概率進(jìn)行改進(jìn),自適應(yīng)獲取SVM模型的最優(yōu)參數(shù).
2.1 采用遺傳算法自適應(yīng)優(yōu)化模型參數(shù)
遺傳算法在解空間中利用隨機(jī)方法產(chǎn)生多個(gè)起始點(diǎn)并同時(shí)進(jìn)行搜索,是一種能夠在復(fù)雜空間快速搜索全局最優(yōu)解的智能優(yōu)化方法[10,11].本文采用自適應(yīng)遺傳算法來(lái)優(yōu)化評(píng)價(jià)模型參數(shù)C和σ,參數(shù)優(yōu)化流程如圖1所示.
圖1 績(jī)效評(píng)價(jià)模型參數(shù)優(yōu)化流程
(1)種群初始化處理.采用隨機(jī)的方式對(duì)種群進(jìn)行初始化,種群中的每一個(gè)個(gè)體為一個(gè)參數(shù)C和σ的組合.
(2)參數(shù)編碼.考慮到參數(shù)C和σ的優(yōu)化是一個(gè)連續(xù)優(yōu)化的過(guò)程,為了防止二進(jìn)制需要反復(fù)譯碼和編碼操作,本文采用實(shí)數(shù)編碼的策略.
(3)適應(yīng)度函數(shù)設(shè)計(jì).在參數(shù)C和σ尋找最優(yōu)解的過(guò)程中,搜索方向由適應(yīng)度函數(shù)來(lái)引導(dǎo),本文采用樣本識(shí)別率(PR)作為自適應(yīng)度函數(shù):
(4)遺傳操作.遺傳操作是參數(shù)尋優(yōu)的關(guān)鍵步驟,包括選擇、交叉和變異等過(guò)程.為了保證適應(yīng)度比較大的個(gè)體進(jìn)入下一代的幾率也相應(yīng)增大,本文采用輪盤(pán)賭選擇法對(duì)個(gè)體進(jìn)行選擇.考慮到個(gè)體適應(yīng)度低于平均適應(yīng)度時(shí),表明該個(gè)體已經(jīng)嚴(yán)重退化,需要采用較大的概率進(jìn)行交叉和變異處理,才能夠產(chǎn)生新的種群.而適應(yīng)度較大的個(gè)體隨著種群的不斷進(jìn)化,其交叉和變異概率則應(yīng)適當(dāng)減少.本文中交叉概率(pc)和變異概率(pm)根據(jù)如下公式計(jì)算:
式中,pc1和pc2分別表示最大和最小交叉概率,pm1和pm2分別表示最大和最小變異概率,fmax和favg分別表示個(gè)體中最大和平均適應(yīng)度,f表示變異個(gè)體的適應(yīng)度,f'為交叉?zhèn)€體中較大的適應(yīng)度,k和km分別為第k次遺傳代數(shù)和最大遺傳代數(shù).
(5)最優(yōu)參數(shù)確定.當(dāng)算法的迭代次數(shù)達(dá)到預(yù)定次數(shù)時(shí),尋優(yōu)過(guò)程停止,并將得到的參數(shù)作為參數(shù)C和σ的最優(yōu)值.
從式(7)和式(8)可以看出,改進(jìn)的交叉和變異概率隨種群的不斷進(jìn)化而不斷自適應(yīng)調(diào)整.在種群進(jìn)化早期,采用較大的交叉和變異概率可以促使優(yōu)良個(gè)體不斷的生長(zhǎng).到進(jìn)化晚期,采用逐漸減小的交叉和變異概率可以確保種群穩(wěn)定,最大限度保留優(yōu)秀的個(gè)體.
2.2 建立教師績(jī)效多分類(lèi)器模型
本文利用支持向量機(jī)構(gòu)建高校教師績(jī)效評(píng)價(jià)模型.首先組織專(zhuān)家根據(jù)考核指標(biāo)對(duì)部分高校教師績(jī)效進(jìn)行綜合測(cè)評(píng),然后將評(píng)價(jià)特征作為評(píng)價(jià)模型的輸入,評(píng)價(jià)結(jié)果作為評(píng)價(jià)模型的輸出,通過(guò)自適應(yīng)學(xué)習(xí)算法不斷學(xué)習(xí)專(zhuān)家的經(jīng)驗(yàn)、知識(shí)及對(duì)指標(biāo)重要性的傾向,獲得具有最優(yōu)參數(shù)的高校教師績(jī)效評(píng)價(jià)模型.考慮到高校教師績(jī)效存在多個(gè)等級(jí),一般分為1級(jí)(優(yōu)秀)、2級(jí)(良好)、3級(jí)(合格)、4級(jí)(不合格),而支持向量機(jī)只適合于兩分類(lèi)問(wèn)題,因此必須對(duì)支持向量機(jī)的兩分類(lèi)情況進(jìn)行擴(kuò)展,構(gòu)造一個(gè)績(jī)效評(píng)價(jià)多分類(lèi)器,從而實(shí)現(xiàn)績(jī)效的自動(dòng)分類(lèi).本文采用一對(duì)一的策略構(gòu)造績(jī)效評(píng)價(jià)多分類(lèi)器,具體構(gòu)造過(guò)程如圖2所示.
具體而言,首先利用績(jī)效評(píng)價(jià)模型將教師劃分為優(yōu)秀和非優(yōu)秀兩類(lèi),然后將非優(yōu)秀教師劃分為良好和非良好兩類(lèi),其他依此類(lèi)推.考慮到師德指標(biāo)的重要性,如教師存在師德問(wèn)題,則直接將該教師的績(jī)效評(píng)價(jià)結(jié)果評(píng)定為不合格等級(jí).
圖2 績(jī)效多分類(lèi)器構(gòu)建過(guò)程
3.1 數(shù)據(jù)樣本及指標(biāo)選取
本文從職業(yè)道德、教學(xué)水平和科研能力三個(gè)大方面對(duì)高校教師績(jī)效進(jìn)行評(píng)價(jià),將其細(xì)化為以下具體指標(biāo):職業(yè)道德、教學(xué)態(tài)度、學(xué)術(shù)道德、學(xué)生滿意度、教學(xué)工作量、教學(xué)方法、教學(xué)效果、教學(xué)評(píng)價(jià),學(xué)術(shù)論文、學(xué)術(shù)專(zhuān)著、科研項(xiàng)目、發(fā)明專(zhuān)利、科研經(jīng)費(fèi)、成果獎(jiǎng)勵(lì)、學(xué)科建設(shè)、學(xué)術(shù)交流、學(xué)生獲獎(jiǎng)和團(tuán)隊(duì)精神等.考慮到?jīng)]有公開(kāi)的標(biāo)準(zhǔn)數(shù)據(jù)進(jìn)行分析,實(shí)驗(yàn)所用科研和教學(xué)部分?jǐn)?shù)據(jù)通過(guò)已公開(kāi)信息整理獲取,其余數(shù)據(jù)通過(guò)人工調(diào)研獲取.從教師績(jī)效數(shù)據(jù)庫(kù)中選擇100個(gè)樣本,其中55個(gè)樣本用來(lái)對(duì)支持向量機(jī)進(jìn)行訓(xùn)練,剩余的樣本用來(lái)進(jìn)行測(cè)試.
3.2 績(jī)效數(shù)據(jù)預(yù)處理
為了避免各個(gè)績(jī)效指標(biāo)之間的量級(jí)差別,同時(shí)消除各個(gè)指標(biāo)由于量綱和單位不一致產(chǎn)生的影響,在進(jìn)行建模之前,利用最小-最大準(zhǔn)則對(duì)績(jī)效指標(biāo)進(jìn)行歸一化處理,計(jì)算公式如下:
式中xi為第i個(gè)績(jī)效評(píng)價(jià)指標(biāo)原始值,xi'為歸一化后的值,xmax和xmin分別表示每個(gè)績(jī)效指標(biāo)的最大值和最小值.
3.3 績(jī)效評(píng)價(jià)結(jié)果
為了驗(yàn)證本文算法的有效性,采用經(jīng)典SVM和神經(jīng)網(wǎng)絡(luò)作為對(duì)比模型,建立高校教師績(jī)效評(píng)價(jià)模型.利用自適應(yīng)遺傳算法優(yōu)化評(píng)價(jià)模型參數(shù)時(shí),種群數(shù)目設(shè)為10,參數(shù)km=100,pc1=0.9,pc2=0.7,pm1=0.1,pm2=0.08,參數(shù)C的取值范圍為[1,100],σ的取值范圍為[0.0001,10].經(jīng)典SVM模型的參數(shù)設(shè)定為c=30,σ=2.00,神經(jīng)網(wǎng)絡(luò)采用Sigmoid激活函數(shù).利用自適應(yīng)遺傳算法對(duì)支持向量機(jī)模型參數(shù)進(jìn)行優(yōu)化得到c=11.76,σ=1.12.采用識(shí)別率對(duì)模型性能進(jìn)行評(píng)價(jià),3種模型評(píng)價(jià)結(jié)果如圖3所示.
圖3 3種績(jī)效評(píng)價(jià)模型的性能對(duì)比
對(duì)比圖中各種績(jī)效評(píng)價(jià)模型性能可知:
(1)在3種績(jī)效評(píng)價(jià)模型中,本文提出的優(yōu)化支持向量機(jī)模型具有最好的教師績(jī)效評(píng)價(jià)效果,其評(píng)價(jià)準(zhǔn)確率達(dá)到91.1%,分別超過(guò)經(jīng)典支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)4.4%和8.9%.這表明采用遺傳算法優(yōu)化支持向量機(jī)參數(shù)建立的評(píng)價(jià)模型比傳統(tǒng)的評(píng)價(jià)模型具有更好的性能.
(2)對(duì)比優(yōu)化支持向量機(jī)和經(jīng)典支持向量機(jī)評(píng)價(jià)結(jié)果可知,參數(shù)C和σ對(duì)模型評(píng)價(jià)效果影響很大,利用自適應(yīng)遺傳算法對(duì)評(píng)價(jià)模型參數(shù)進(jìn)行優(yōu)化處理,可獲得更好的績(jī)效評(píng)價(jià)效果.
(3)采用優(yōu)化SVM和經(jīng)典SVM模型的績(jī)效評(píng)價(jià)效果都明顯優(yōu)于神經(jīng)網(wǎng)絡(luò)模型,這是因?yàn)橹С窒蛄繖C(jī)可以有效解決神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過(guò)程中存在的過(guò)擬合和局部最優(yōu)問(wèn)題.同時(shí),支持向量機(jī)可以從有限的樣本信息中獲得更好的績(jī)效評(píng)價(jià)效果,比神經(jīng)網(wǎng)絡(luò)更加適合于小樣本問(wèn)題.
3.4 績(jī)效評(píng)價(jià)模型修正
如對(duì)所得到的評(píng)價(jià)結(jié)果有疑問(wèn),可將其與專(zhuān)家的評(píng)判結(jié)果進(jìn)行對(duì)比.如確屬誤判,則將該樣本重新加入訓(xùn)練集進(jìn)行訓(xùn)練,以獲得匹配率更高的評(píng)價(jià)模型.對(duì)高校教師績(jī)效進(jìn)行評(píng)定時(shí),考慮到評(píng)價(jià)模型的時(shí)間連續(xù)性,可利用本年度所有的測(cè)評(píng)結(jié)果訓(xùn)練評(píng)價(jià)模型后,對(duì)來(lái)年的教師績(jī)效進(jìn)行評(píng)價(jià).如來(lái)年的評(píng)價(jià)標(biāo)準(zhǔn)發(fā)生了變化,則必須根據(jù)專(zhuān)家的綜合評(píng)價(jià)結(jié)果重新確定模型參數(shù)再進(jìn)行績(jī)效評(píng)價(jià).
本文利用支持向量機(jī)的小樣本、非線性特點(diǎn),構(gòu)建了支持向量機(jī)績(jī)效評(píng)價(jià)模型,同時(shí)利用自適應(yīng)遺傳算法對(duì)支持向量機(jī)的參數(shù)進(jìn)行優(yōu)化處理,獲得了最優(yōu)績(jī)效評(píng)價(jià)模型.實(shí)驗(yàn)結(jié)果表明本文提出的優(yōu)化支持向量機(jī)績(jī)效評(píng)價(jià)方法比其他方法具有更好的評(píng)價(jià)效果,能夠最大程度再現(xiàn)專(zhuān)家對(duì)指標(biāo)重要性的傾向,實(shí)現(xiàn)定性與定量的有機(jī)結(jié)合,保證評(píng)價(jià)的客觀性和一致性.進(jìn)一步的研究工作是,與高校管理部門(mén)合作收集業(yè)績(jī)數(shù)據(jù)來(lái)驗(yàn)證績(jī)效評(píng)價(jià)模型的實(shí)際效果.
〔1〕王光彥,李元元,邱學(xué)青,等.高校教師績(jī)效評(píng)價(jià)指標(biāo)體系的實(shí)證研究與思考[J].中國(guó)高教研究,2008,18(2):46-49.
〔2〕王曉峰.高校教師績(jī)效考核的環(huán)境分析與路徑選擇[J].湖南科技大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2012,15(5):178-180.
〔3〕喬錦忠,韓莉莉,石興娣.高校教師績(jī)效與晉升[J].新疆師范大學(xué)學(xué)報(bào):哲學(xué)社會(huì)科學(xué)版,2012,33(5):87-93.
〔4〕王璟.基于層次分析法的高校教師績(jī)效評(píng)價(jià)實(shí)證研究[J].閩江學(xué)院學(xué)報(bào),2011,32(6):124-128.
〔5〕周雙喜,馮俊文.基于PCA的高校教師績(jī)效考核指標(biāo)體系構(gòu)建研究[J].南京理工大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2011,24(3):90-95.
〔6〕王宏,杜麗萍,張帥.基于模糊綜合評(píng)價(jià)法的高校教師績(jī)效評(píng)價(jià)模型[J].河北理工大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2011,11(1):56-58.
〔7〕王向,李媚,張坤.基于模糊神經(jīng)網(wǎng)絡(luò)的績(jī)效評(píng)價(jià)體系研究[J].河北省科學(xué)院學(xué)報(bào),2013,30(1):5-10.
〔8〕CortesC,VapnikV.Supportvectornetworks[J].Machine Learning,1995,20(8):273-293.
〔9〕ZhaoJW,ChenQS,HuangXY,etal.Qualitative identification of tea categories by near infrared spectroscopy and support vector machine [J]. Pharmaceuticaland BiomedicalAnalysis,2006,41(4):1198-1204.
〔10〕Deng G F,Huang X X,Gao Q H,etal. Developmentofan improved geneticalgorithm for resolvinginversekinematicsofvirtualhuman’supper limbkinematicschain[J].LectureNotesinControland InformationSciences,2014,452(1):189-211.
〔11〕田豐,邊婷婷.自適應(yīng)遺傳算法的交通信號(hào)配時(shí)優(yōu)化[J].計(jì)算機(jī)仿真,2010,27(6):305-308.
TP18;TP273
A
1673-260X(2014)12-0025-03
湖南省教育科學(xué)規(guī)劃課題《基于自適應(yīng)學(xué)習(xí)的高校教師績(jī)效評(píng)價(jià)方法研究》(XJK013CGD083)終結(jié)性成果;湖南省教學(xué)改革研究項(xiàng)目(湘教通【2014】247-612);湖南財(cái)政經(jīng)濟(jì)學(xué)院教學(xué)改革研究項(xiàng)目
赤峰學(xué)院學(xué)報(bào)·自然科學(xué)版2014年24期