馮小芹,何 宏,胡曉輝,孫晨旭,向朝參,喻賽萱
(1.中國(guó)人民解放軍后勤工程學(xué)院, 重慶 401331; 2.四川文軒職業(yè)學(xué)院, 成都 611330)
?
基于K-means聚類的大學(xué)生綜合素質(zhì)評(píng)定方法
馮小芹1,何 宏1,胡曉輝1,孫晨旭1,向朝參1,喻賽萱2
(1.中國(guó)人民解放軍后勤工程學(xué)院, 重慶 401331; 2.四川文軒職業(yè)學(xué)院, 成都 611330)
隨著教育改革呼聲的提高,科學(xué)評(píng)定高等院校學(xué)生的綜合能力素質(zhì)成為各大高校的焦點(diǎn)。民主測(cè)評(píng)常常被作為大學(xué)生綜合素質(zhì)能力的評(píng)定方法,然而由于民主測(cè)評(píng)的不確定性和不可控性以及學(xué)生實(shí)際綜合能力的復(fù)雜性,如何基于民主測(cè)評(píng)來(lái)客觀、可靠、準(zhǔn)確地評(píng)定學(xué)生綜合素質(zhì)能力是一大難題。針對(duì)該問(wèn)題,提出了基于K-均值聚類的大學(xué)生綜合素質(zhì)評(píng)定方法。首先將民主測(cè)評(píng)數(shù)據(jù)處理成數(shù)據(jù)矩陣,然后通過(guò)K-均值聚類進(jìn)行數(shù)據(jù)矩陣的預(yù)處理,剔除不準(zhǔn)確、不可靠的民主測(cè)評(píng)數(shù)據(jù),最后根據(jù)保留數(shù)據(jù)進(jìn)行學(xué)員綜合能力素質(zhì)評(píng)定。基于重慶某高校12個(gè)專業(yè)278名學(xué)生的實(shí)際民主測(cè)評(píng)數(shù)據(jù)的實(shí)驗(yàn)結(jié)果表明:所提方法能夠較為客觀、準(zhǔn)確地評(píng)定學(xué)生綜合素質(zhì)。同時(shí),理論分析表明算法復(fù)雜度較小。
民主測(cè)評(píng);K-均值聚類;學(xué)員綜合素質(zhì)能力
隨著時(shí)代的發(fā)展、科技的進(jìn)步,國(guó)力的競(jìng)爭(zhēng)越來(lái)越取決于勞動(dòng)者的素質(zhì)。高校作為國(guó)家高素質(zhì)人才培養(yǎng)的搖籃,為社會(huì)提供專業(yè)精、能力強(qiáng)、素質(zhì)高的新型綜合人才是時(shí)代賦予的一個(gè)新任務(wù)[1]。大學(xué)生綜合素質(zhì)評(píng)定是實(shí)現(xiàn)這個(gè)任務(wù)的關(guān)鍵一環(huán)[2]。一方面,評(píng)估結(jié)果可以作為反饋,檢驗(yàn)高等教育改革成果,指導(dǎo)高等教育進(jìn)一步地改革和完善;另一方面,大學(xué)生綜合素質(zhì)評(píng)估有利于大學(xué)生人才資源的合理分配,做到人盡其才[3]。在實(shí)際操作中,量化指標(biāo)數(shù)據(jù)是開(kāi)展學(xué)生綜合素質(zhì)評(píng)定的基礎(chǔ),而數(shù)據(jù)采集方法的科學(xué)性決定了所得數(shù)據(jù)的客觀性,也影響著評(píng)價(jià)結(jié)果的公平性與合理性[4]。
傳統(tǒng)的大學(xué)生綜合素質(zhì)評(píng)定大多數(shù)都是通過(guò)考試采集數(shù)據(jù)而后進(jìn)行評(píng)定的,可這并不能代表學(xué)生綜合素質(zhì)[2],因?yàn)榭荚囁玫臄?shù)據(jù)并不能綜合表現(xiàn)學(xué)員素質(zhì)。為打破目前大學(xué)生綜素質(zhì)評(píng)定數(shù)據(jù)采集不夠全面的現(xiàn)狀,本文提出了一個(gè)新的方法:先獲取民主測(cè)評(píng)數(shù)據(jù),針對(duì)民主測(cè)評(píng)數(shù)據(jù)進(jìn)行K-均值聚類,剔除相應(yīng)的不準(zhǔn)確數(shù)據(jù);然后將保留的數(shù)據(jù)重新整理,計(jì)算出每位學(xué)員的排名期望;最后根據(jù)排名期望進(jìn)行排序,得到學(xué)員排名情況。其中K-均值聚類較好地剔除了測(cè)評(píng)數(shù)據(jù)中的不準(zhǔn)確數(shù)據(jù),運(yùn)用平等原則,較好地得到了每位學(xué)員的排名期望。同時(shí),針對(duì)評(píng)定方案設(shè)計(jì)了相應(yīng)算法,并運(yùn)用模擬實(shí)驗(yàn)驗(yàn)證了方案的可行性。實(shí)驗(yàn)通過(guò)方差與考察進(jìn)行評(píng)估,發(fā)現(xiàn)實(shí)驗(yàn)結(jié)果具有很強(qiáng)的可靠性?;贙-均值聚類剔除數(shù)據(jù)的民主測(cè)評(píng)方法可以較準(zhǔn)確、可靠及客觀地解決問(wèn)題,而且方案的求解算法復(fù)雜度較低,較好地增強(qiáng)了方案求解的時(shí)間效益。
近年來(lái)國(guó)內(nèi)關(guān)于學(xué)生的綜合素質(zhì)評(píng)定已做了大量的研究,提供了很多的可行方案。文獻(xiàn)[5]采用數(shù)據(jù)挖掘的方法,通過(guò)分析,應(yīng)用薩蒂層次分析法對(duì)大學(xué)生綜合素質(zhì)進(jìn)行評(píng)定。文獻(xiàn)[6]基于模糊聚類算法,應(yīng)用組合賦權(quán)法對(duì)成績(jī)進(jìn)行賦權(quán),以此對(duì)學(xué)生綜合素質(zhì)進(jìn)行評(píng)定。文獻(xiàn)[7]利用層次分析法確定綜合素質(zhì)評(píng)價(jià)指標(biāo)權(quán)重,評(píng)價(jià)了復(fù)合型人才綜合素質(zhì)。文獻(xiàn)[8-9]設(shè)計(jì)了一種問(wèn)卷調(diào)查法來(lái)對(duì)大學(xué)生的素質(zhì)能力進(jìn)行評(píng)定,并根據(jù)調(diào)查問(wèn)卷數(shù)據(jù)對(duì)指標(biāo)因素進(jìn)行效度分析,主要包括內(nèi)容效度、效標(biāo)效度和結(jié)構(gòu)效度。文獻(xiàn)[10]為了構(gòu)建學(xué)生的綜合素質(zhì)評(píng)定平臺(tái),先根據(jù)相關(guān)規(guī)章制度擬定候選指標(biāo)體系,然后根據(jù)集體討論和分析篩選指標(biāo),最后請(qǐng)專家論證這個(gè)指標(biāo)體系。文獻(xiàn)[11]為了構(gòu)建學(xué)生素質(zhì)能力評(píng)定指標(biāo)體系,先根據(jù)學(xué)生核心職業(yè)素養(yǎng)的基本要素結(jié)構(gòu)模型和問(wèn)卷調(diào)查統(tǒng)計(jì)結(jié)果構(gòu)建指標(biāo)體系,然后運(yùn)用德?tīng)柗茖<易稍兎▽?duì)評(píng)定指標(biāo)進(jìn)行篩選、修正和確認(rèn)。這些研究都是關(guān)于大學(xué)生的綜合素質(zhì)能力評(píng)定,文獻(xiàn)[5-7]主要還是基于成績(jī)權(quán)重的評(píng)定,不能評(píng)定出學(xué)員綜合素質(zhì)的強(qiáng)弱。文獻(xiàn)[8-11]則是吸納眾意,制定評(píng)價(jià)指標(biāo)來(lái)進(jìn)行評(píng)定,這種評(píng)定主觀性較強(qiáng),科學(xué)性不高,而且方案實(shí)施起來(lái)也較復(fù)雜。
本文提出了一個(gè)新的方向,對(duì)同專業(yè)學(xué)員的排名進(jìn)行民主測(cè)評(píng)得到初始數(shù)據(jù),側(cè)重于學(xué)員的實(shí)際表現(xiàn)情況而非分?jǐn)?shù);然后應(yīng)用K-均值聚類算法剔除掉噪音數(shù)據(jù),解決了上述方案存在的問(wèn)題,既方便又可行。
民主測(cè)評(píng)是召集若干知情人對(duì)被考核人的表現(xiàn)進(jìn)行評(píng)定的一種考核方法,具有良好的群眾性和民主性,既可以互相促進(jìn)又可以互相監(jiān)督[12],在學(xué)生綜合素質(zhì)評(píng)定問(wèn)題上可以較為客觀、可靠地得到學(xué)生排名情況[13]。
針對(duì)學(xué)生綜合素質(zhì)的民主測(cè)評(píng),首先根據(jù)專業(yè)相關(guān)測(cè)評(píng)數(shù)據(jù)建立專業(yè)內(nèi)的評(píng)定矩陣Rm×n。評(píng)定矩陣設(shè)定如下:
其中:Rm×n表示第Rm×n個(gè)測(cè)評(píng)人;Sj表示專業(yè)內(nèi)j學(xué)號(hào)學(xué)生;xij表示第i個(gè)測(cè)評(píng)人為第j學(xué)號(hào)學(xué)生給定的排名,且i=1,2,…,m,j=1,2,…,n。
根據(jù)評(píng)定矩陣計(jì)算專業(yè)內(nèi)每位學(xué)生的排名期望。由第i個(gè)測(cè)評(píng)人給第j號(hào)學(xué)生的排名概率rij可得第j號(hào)學(xué)生排名期望Ej,計(jì)算公式為
(1)
基于民主測(cè)評(píng)的客觀性,可知該測(cè)評(píng)的實(shí)施是建立在互等原則上的,即對(duì)每一名測(cè)評(píng)人持有的信任度相同[14]。換句話說(shuō),就是每一名測(cè)評(píng)人給出的測(cè)評(píng)數(shù)據(jù)在總測(cè)評(píng)數(shù)據(jù)中所占的權(quán)重相等。由此可得
最后將學(xué)生的排名期望以從小至大進(jìn)行排序,按排序確定專業(yè)內(nèi)每名學(xué)生的排名。
上述方法可較為客觀、可靠地得到學(xué)生排名情況,同時(shí)很好地體現(xiàn)了民主測(cè)評(píng)的民主性和群眾性。但此方法存在一個(gè)主要問(wèn)題,即對(duì)針對(duì)相關(guān)測(cè)評(píng)數(shù)據(jù)建立的評(píng)定矩陣Rm×n如何做預(yù)處理。
民主測(cè)評(píng)的可靠性需要數(shù)據(jù)支撐[15],然而隨著數(shù)據(jù)量增多,不準(zhǔn)確數(shù)據(jù)量也會(huì)增多,對(duì)民主測(cè)評(píng)的可靠性影響隨之也會(huì)增加[16]。由此可見(jiàn),數(shù)據(jù)量的多少對(duì)民主測(cè)評(píng)可靠性具有雙重影響,導(dǎo)致民主測(cè)評(píng)適用性在很大程度上受到制約[17]。
針對(duì)該問(wèn)題,本文建立了基于K-均值聚類的不準(zhǔn)確數(shù)據(jù)剔除方法,對(duì)民主測(cè)評(píng)進(jìn)行預(yù)處理,大大提高了民主測(cè)評(píng)的適用性,較好地打破了這種制約。
K-均值聚類是一種經(jīng)典的聚類方法,主要作用是根據(jù)屬性將對(duì)象劃分成多個(gè)互斥的組或簇。劃分的主要思想為:定義簇內(nèi)點(diǎn)的均值為簇的形心,基于形心的劃分技術(shù)[18],以簇內(nèi)高相似性和簇間低相似性為目標(biāo)進(jìn)行最后劃分。此方法適用于多維度空間,同時(shí)運(yùn)用迭代方法求解可以大大降低計(jì)算復(fù)雜度,提高算法性能[19]。
在對(duì)評(píng)定矩陣Rm×n進(jìn)行分析時(shí),要將每一個(gè)測(cè)評(píng)人數(shù)據(jù)看做一個(gè)多維向量點(diǎn),即矩陣每一行看做一個(gè)向量?;贙-均值聚類處理多維空間的優(yōu)越性,在處理Rm×n基礎(chǔ)上使用K-均值聚類無(wú)疑是可行的。
3.1 方法
針對(duì)民主測(cè)評(píng),首先對(duì)評(píng)定矩陣Rm×n分析,矩陣每一行可看做一個(gè)樣本點(diǎn),每一列可看做樣本的一個(gè)屬性。對(duì)樣本點(diǎn)及樣本屬性進(jìn)行編號(hào),如下所示:
1)Pi給定的排名為數(shù)據(jù)中第i個(gè)樣本點(diǎn);
2)Sj表示的值為樣本點(diǎn)中第j個(gè)屬性的值。
對(duì)基于K-均值聚類做如下定義:
3.1.1 剔除原則的定義
3.1.2 簇?cái)?shù)k的定義
簇?cái)?shù)k不僅是K-均值聚類必設(shè)參數(shù)[20],而且是后續(xù)數(shù)據(jù)剔除的重要參考指標(biāo),如何設(shè)定k影響整個(gè)模型的效能,為此必須結(jié)合相應(yīng)問(wèn)題定義其值。
從K-均值算法自身出發(fā),可定義k=1,2,…,m。從問(wèn)題出發(fā),可知數(shù)據(jù)只需分為準(zhǔn)確數(shù)據(jù)與不準(zhǔn)確數(shù)據(jù)兩類,當(dāng)k取值越大時(shí),對(duì)數(shù)據(jù)產(chǎn)生的稀釋作用也就越大[21],即每個(gè)簇所表示的準(zhǔn)確與不準(zhǔn)確性的界線越模糊,這是問(wèn)題所不允許的。由此可知k的取值不能過(guò)大,定義k=1,2,3。
對(duì)于k=1,明顯違背剔除原則,即此種情況不加以考慮。
對(duì)于k=2,3,設(shè)定數(shù)據(jù)中存在好、中和差3種數(shù)據(jù),其中好與中都可看做準(zhǔn)確數(shù)據(jù),而差只能看做不準(zhǔn)確數(shù)據(jù)。當(dāng)數(shù)據(jù)集存在5個(gè)好數(shù)據(jù)、3個(gè)中數(shù)據(jù)和6個(gè)差數(shù)據(jù)時(shí),k=2與k=3則可能出現(xiàn)如圖1所示情況。
圖1 k=2與k=3的兩種情況
由圖1可知,依據(jù)剔除原則k=3得到的結(jié)果為6個(gè)差數(shù)據(jù),k=2得到的結(jié)果為5個(gè)好數(shù)據(jù)與3個(gè)中數(shù)據(jù),為提高方法的適用性,k=3顯然不具參考性。
綜合上述分析,基于民主測(cè)評(píng)問(wèn)題定義k的取值為2。
3.1.3 簇內(nèi)點(diǎn)均值的定義
(2)
3.1.4 點(diǎn)到均值點(diǎn)距離的定義
(3)
3.1.5 方法評(píng)價(jià)指標(biāo)的定義
則方差S的計(jì)算公式為
(4)
最后結(jié)合上述定義設(shè)定如下求解步驟:
步驟1 給定簇?cái)?shù)k=2。
步驟3 根據(jù)式(3)分別計(jì)算各樣本點(diǎn)與各簇均值點(diǎn)的距離,將各樣本點(diǎn)劃入最近均值點(diǎn)所屬的簇中。
步驟4 由式(2)重新計(jì)算各簇均值點(diǎn),判斷新均值點(diǎn)與原有均值點(diǎn)是否都相同。若相同則終止求解,以現(xiàn)有聚類情況作為最終結(jié)果,否則將新均值點(diǎn)替換原有均值點(diǎn)轉(zhuǎn)到步驟3繼續(xù)計(jì)算。
3.2 求解算法
由上述K-均值聚類的求解步驟得到了K-均值聚類的求解算法,如表1所示。
根據(jù)表1可知算法復(fù)雜度為O(mkt),其中:m是對(duì)象總數(shù);k為簇?cái)?shù);t是迭代次數(shù)。該算法復(fù)雜度適中。
由此可見(jiàn),基于K-均值聚類的剔除不準(zhǔn)確數(shù)據(jù)法適用性強(qiáng)、準(zhǔn)確性高,可以大大提高民主測(cè)評(píng)評(píng)定學(xué)生綜合素質(zhì)方法的實(shí)用性和可靠性。
表1 K-均值剔除算法
4.1 實(shí)驗(yàn)方法和設(shè)置
為驗(yàn)證基于K-均值聚類剔除不準(zhǔn)確數(shù)據(jù)方法的民主測(cè)評(píng)具有良好的適用性和可靠性,對(duì)重慶某高校12個(gè)專業(yè)278名學(xué)生進(jìn)行民主測(cè)評(píng),得到了民主測(cè)評(píng)數(shù)據(jù)。使用Matlab2012搭建實(shí)驗(yàn)環(huán)境,硬件配置為:處理器為Intel(R) Core(TM) i5-2430,CPU為2.40 GHz,RAM為4.00 GB(3.07 GB 可用)。
首先將12個(gè)專業(yè)的民主測(cè)評(píng)數(shù)據(jù)進(jìn)行處理,整理成相應(yīng)的評(píng)定矩陣,然后根據(jù)表1所示算法,運(yùn)用Matlab編寫程序剔除各專業(yè)不準(zhǔn)確數(shù)據(jù),得到評(píng)定矩陣的預(yù)處理結(jié)果,并根據(jù)本文所提方法計(jì)算各專業(yè)內(nèi)學(xué)生的期望排名,以期望排名進(jìn)行學(xué)生綜合素質(zhì)評(píng)定,最后以方差分析與現(xiàn)實(shí)考察評(píng)估基于K-均值聚類剔除不準(zhǔn)確數(shù)據(jù)方法的效能。
4.2 實(shí)驗(yàn)結(jié)果和分析
4.2.1 數(shù)據(jù)剔除結(jié)果和分析
初始簇均值點(diǎn)是隨機(jī)產(chǎn)生的[23],要得到較好實(shí)驗(yàn)結(jié)果必須在專業(yè)內(nèi)進(jìn)行多次實(shí)驗(yàn)。由于專業(yè)1~12中專業(yè)1與專業(yè)3的數(shù)據(jù)量相對(duì)較多且測(cè)評(píng)人也相對(duì)較廣泛,可知其相對(duì)具有代表性,所以下面以具有代表性的專業(yè)1與專業(yè)3為例進(jìn)行實(shí)驗(yàn)。
實(shí)驗(yàn)分別對(duì)專業(yè)內(nèi)各種可能情況進(jìn)行求解,得到專業(yè)內(nèi)每種情況下的方差色圖。專業(yè)1與專業(yè)3的方差色圖如圖2所示。
圖2 專業(yè)1與專業(yè)3方差色圖
圖2橫軸、縱軸表示樣本點(diǎn),樣本點(diǎn)組合不同代表初始簇均值點(diǎn)的情況不同,圖像顏色越深表示該種情況下得到的方差越小,反之越大。
通過(guò)觀察方差色圖,發(fā)現(xiàn)當(dāng)初始簇均值點(diǎn)不同時(shí),方差也存在不同且方差之間相差較大。為此,分別對(duì)專業(yè)1與專業(yè)3中不同情況取得的方差與專業(yè)內(nèi)最小方差的差值進(jìn)行分析,得到圖3所示的方差差值圖。
圖3 專業(yè)1與專業(yè)3方差差值圖
根據(jù)圖3可清楚地知道專業(yè)內(nèi)不同情況間的方差差值普遍較大,基本保持在幾百的基礎(chǔ)上,有些可達(dá)到上千。由此,對(duì)于專業(yè)內(nèi)初始簇均值點(diǎn)不同的情況不能一概而論,需從問(wèn)題實(shí)際出發(fā)尋找比較符合題意的結(jié)果。
綜上分析,實(shí)驗(yàn)采取最小原則,選取方差最小情況下的結(jié)果為該專業(yè)數(shù)據(jù)剔除的最終實(shí)驗(yàn)結(jié)果。如專業(yè)1最終結(jié)果的方差為230.9,初始簇均值點(diǎn)為第10個(gè)與第14個(gè)樣本點(diǎn);專業(yè)3最終結(jié)果的方差為356.1,初始簇均值點(diǎn)為第5個(gè)與第10個(gè)樣本點(diǎn)。
同理,對(duì)各專業(yè)進(jìn)行相應(yīng)實(shí)驗(yàn),得到了各專業(yè)方差最小時(shí)的數(shù)據(jù)保留情況,如表2所示。
根據(jù)原始民主測(cè)評(píng)數(shù)據(jù)了解到專業(yè)2中樣本點(diǎn)4、17、20、21,專業(yè)3中樣本點(diǎn)20,專業(yè)5中樣本點(diǎn)9、10、11、12、13都有明顯錯(cuò)誤。觀察表2可知上述樣本點(diǎn)都被很好地剔除了。以上結(jié)果說(shuō)明基于K-均值聚類剔除數(shù)據(jù)的方法具有良好效能。為進(jìn)一步評(píng)定該方法具有良好效能,結(jié)合本文的評(píng)定指標(biāo),將剔除前后各專業(yè)樣本點(diǎn)方差進(jìn)行比較,結(jié)果如圖4所示。
表2 各專業(yè)數(shù)據(jù)保留結(jié)果
圖4 數(shù)據(jù)剔除前后方差比較
由圖4可以清楚看出:K-均值聚類在數(shù)據(jù)剔除方面具效果非常好,即基于K-均值聚類剔除數(shù)據(jù)方法進(jìn)行評(píng)定矩陣的預(yù)處理是可行、有效的,且該方法可以大大提高民主測(cè)評(píng)的適用性和準(zhǔn)確性。
4.2.2 排名結(jié)果和分析
將表2中各專業(yè)的保留樣本點(diǎn)作為民主測(cè)評(píng)數(shù)據(jù),重新組建評(píng)定矩陣,結(jié)合式(1)計(jì)算得到專業(yè)內(nèi)每個(gè)學(xué)員的排名期望,根據(jù)排名期望展開(kāi)排序得到各專業(yè)學(xué)員的排名情況,如表3所示。表3中數(shù)字代表各專業(yè)學(xué)員學(xué)號(hào),按排名順序進(jìn)行排序,專業(yè)以編號(hào)表示。
表3 各專業(yè)排名情況
筆者走訪了各專業(yè)知情人士(知情人士主要包括專業(yè)內(nèi)部分學(xué)生、專業(yè)內(nèi)各科老師、學(xué)生導(dǎo)師、學(xué)校機(jī)關(guān)干部、學(xué)校部分領(lǐng)導(dǎo)等),具體走訪流程如下:首先讓知情人士說(shuō)出其對(duì)專業(yè)內(nèi)各人員的主體印象與看法;然后將實(shí)驗(yàn)得出的排名結(jié)果公示給知情人士議論并促其說(shuō)出自己的意見(jiàn);最后統(tǒng)籌知情人士對(duì)排名的意見(jiàn)。
從統(tǒng)籌結(jié)果可知:大部分知情人士比較認(rèn)可實(shí)驗(yàn)所得排名,即表3給出的各專業(yè)排名情況比較貼近與符合現(xiàn)實(shí)情況。由此可見(jiàn),基于K-均值聚類剔除數(shù)據(jù)的民主測(cè)評(píng)方法在處理學(xué)生綜合素質(zhì)評(píng)定方面具有較好的適用性、客觀性和可靠性,而且數(shù)據(jù)處理靈活、實(shí)用,具有很強(qiáng)的可操作性,算法復(fù)雜度較低,具有較可觀的時(shí)間效益。
本文在綜合素質(zhì)評(píng)定的大背景下,為了解決了“唯分?jǐn)?shù)至上”的問(wèn)題,提出了民主測(cè)評(píng)獲取初始數(shù)據(jù)的方法。為了保證數(shù)據(jù)的相對(duì)準(zhǔn)確、客觀,應(yīng)用K-均值聚類算法剔除了不準(zhǔn)確數(shù)據(jù)。評(píng)估實(shí)驗(yàn)的結(jié)果驗(yàn)證了本文所提出的基于K-均值聚類剔除數(shù)據(jù)的民主測(cè)評(píng)方法的科學(xué)性和可靠性。
K-均值聚類算法對(duì)于數(shù)據(jù)的剔除還有一定隨機(jī)性,即不同隨機(jī)初始中心值導(dǎo)致的最終結(jié)果不一樣,同時(shí)K-均值聚類在剔除數(shù)據(jù)方面還可能出現(xiàn)一些偶然性,即難以徹底剔除噪音數(shù)據(jù)。下一步將嘗試用層次聚類算法和密度聚類算法來(lái)管理數(shù)據(jù),增強(qiáng)民主測(cè)評(píng)評(píng)定學(xué)生綜合素質(zhì)方法的可靠性和適用性。期望通過(guò)層次聚類改善K-均值聚類隨機(jī)性強(qiáng)的問(wèn)題,運(yùn)用密度聚類改進(jìn)K-均值聚類難以徹底剔除噪音數(shù)據(jù)的問(wèn)題。
同時(shí)為做到對(duì)數(shù)據(jù)剔除好壞的整體把握,下一步將嘗試從各樣本點(diǎn)間的相關(guān)性入手,通過(guò)分析剔除前后各樣本點(diǎn)間的相關(guān)性判斷數(shù)據(jù)剔除的好壞程度。
[1] 溫家寶.百年大計(jì),教育為本[EB/OL].[2009-01-04].http://news.xinhuanet.com/newscenter/2009-01/04/content_10601461_1.htm.
[2] 鄭小麗.基于WEB的學(xué)生綜合素質(zhì)評(píng)估管理系統(tǒng)的分析與設(shè)計(jì)[D].昆明:云南大學(xué),2012.
[3] 李娜.大學(xué)生綜合素質(zhì)測(cè)評(píng)體系構(gòu)建與完善[J].教育教學(xué)論壇,2016(5):56-57.
[4] 魏茵.基于模糊綜合評(píng)判的大學(xué)生綜合素質(zhì)測(cè)評(píng)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].西安:西安建筑科技大學(xué),2015.
[5] 王坤.基于數(shù)據(jù)挖掘的大學(xué)生綜合素質(zhì)評(píng)定系統(tǒng)[J].河北軟件職業(yè)技術(shù)學(xué)院學(xué)報(bào),2008,10(4):57-59.
[6] 丁慶彬.模糊綜合評(píng)判法在大學(xué)生綜合素質(zhì)評(píng)判中的應(yīng)用[J].唐山師范學(xué)院學(xué)報(bào),2007,29(5):48-51.
[7] 張俊霞.基于組合賦權(quán)的地方本科大學(xué)生綜合素質(zhì)評(píng)價(jià)研究[J].科技廣場(chǎng),2014(6):20-24.
[8] 陸伊.基于勝任力的大學(xué)生綜合素質(zhì)評(píng)價(jià)指標(biāo)體系研究[D].蘇州:蘇州大學(xué),2007.
[9] 李曼麗.大學(xué)生通識(shí)教育課程實(shí)施效果評(píng)價(jià)研究[J].教育發(fā)展研究,2014(3):37-43.
[10]白玉珊.基于電子平臺(tái)的學(xué)生綜合素質(zhì)評(píng)價(jià)研究[D].石家莊:河北師范大學(xué),2009.
[11]林勇.基于模糊綜合評(píng)判的高校學(xué)生綜合素質(zhì)評(píng)價(jià)系統(tǒng)的研究和實(shí)現(xiàn)[D].成都: 電子科技大學(xué),2008.
[12]劉昕.當(dāng)前黨政領(lǐng)導(dǎo)干部民主測(cè)評(píng)的深層困境[J].人民論壇·學(xué)術(shù)前沿,2014(7):80-89..
[13]羅中樞.干部民主推薦、民主測(cè)評(píng)的科學(xué)性探析[J].新視野,2012(5):49-53.
[14]張紅霞.提升民主測(cè)評(píng)質(zhì)量要實(shí)現(xiàn)“三個(gè)轉(zhuǎn)變”[J].領(lǐng)導(dǎo)科學(xué),2016(4):46-47.
[15]曲向陽(yáng).警惕民主測(cè)評(píng)失真失實(shí)[J].中國(guó)黨政干部論壇,2013(11):88-88.
[16]劉昕.人才測(cè)評(píng)對(duì)優(yōu)化黨政領(lǐng)導(dǎo)干部民主測(cè)評(píng)的啟示[J].中共貴州省委黨校學(xué)報(bào),2015(6):83-89.
[17]王愛(ài)民.黨政領(lǐng)導(dǎo)干部選拔任用中民主測(cè)評(píng)問(wèn)題及對(duì)策研究[D].長(zhǎng)春: 吉林大學(xué),2009.
[18]蔣帥.K-均值聚類算法研究[D].西安: 陜西師范大學(xué),2010.
[19]左進(jìn),陳澤茂.基于改進(jìn)K均值聚類的異常檢測(cè)算法[J].計(jì)算機(jī)科學(xué),2016,43(8):258-261.
[20]高丑光,林都,鮮浩.基于K均值的軟件測(cè)試集用例約簡(jiǎn)算法研究[J].微電子學(xué)與計(jì)算機(jī),2016,33(5):133-136.
[21]單冬紅,李瑋瑤.基于約束性過(guò)濾的改進(jìn)K均值挖掘算法研究[J].科技通報(bào),2013,29(4):171-173.
[22]楊小勇.方差分析法淺析——單因素的方差分析[J].實(shí)驗(yàn)科學(xué)與技術(shù),2013,11(1):41-43.
[23]王秀和.利用K均值算法改進(jìn)后的蟻群優(yōu)化算法對(duì)高光譜圖像聚類研究[J].科技通報(bào),2015(3):202-206.
(責(zé)任編輯 楊黎麗)
K-Means Cluster Based Ability Evaluation Method for University Students
FENG Xiao-qin1, HE Hong1, HU Xiao-hui1, SUN Cheng-xu1, XIANG Chao-can1, YU Sai-xuan2
(1.Logistic Engineering University, Chongqing 401331, China; 2.Sichuan Winshare Vocational College, Chengdu 611330, China)
It is critical for the university to accurately evaluate the ability of students with the development of education reform. However, it is very difficult to evaluate the students’ ability reliably and objectively due to the extremely complex ability of students. As a result, this paper proposed a K-means cluster based ability evaluation method for university students. Firstly, we pre-process the data of democratic appraisal, followed by eliminating the inaccurate data using K-means cluster. At last, according to the remaining accurate data, we rate the students’ ability. The real experiments show that, our method can accurately evaluate the students’ ability based on the real democratic assessment data of 278 students of 12 majors in a university at Chongqing. Moreover, the theoretical analysis illustrates that the time complexity is low.
democratic appraisal; K-means cluster; student ability
2016-11-16 基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(61502520)
馮小芹(1984—),女,四川宣漢人,碩士研究生,講師,主要從事軍隊(duì)管理學(xué)研究,E-mail:45390285@qq.com。
馮小芹,何宏,胡曉輝,等.基于K-means聚類的大學(xué)生綜合素質(zhì)評(píng)定方法[J].重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)),2017(5):125-132.
format:FENG Xiao-qin, HE Hong, HU Xiao-hui,et al.K-Means Cluster Based Ability Evaluation Method for University Students[J].Journal of Chongqing University of Technology(Natural Science),2017(5):125-132.
10.3969/j.issn.1674-8425(z).2017.05.021
TP393
A
1674-8425(2017)05-0125-08