姜 云 飛
(福州大學 研究生院, 福建 福州 350116)
隨著我國經濟由高速增長階段向高質量發(fā)展階段轉變,創(chuàng)新成為第一動力, 而人才是創(chuàng)新的第一資源,作為學位與研究生教育最高學歷層級的博士研究生教育,應真正肩負起培養(yǎng)高層次人才的使命, 培養(yǎng)出高質量拔尖創(chuàng)新人才。 2017年1月,教育部、國務院學位委員會印發(fā)的《學位與研究生教育發(fā)展“十三五”規(guī)劃》再次強調, 我國學位與研究生教育改革發(fā)展要以“服務需求、提高質量”為主線。 博士研究生教育不能單純追求規(guī)模發(fā)展, 更應注重質量提升, 這是社會經濟發(fā)展之需。
研究生教育分為招生、培養(yǎng)、學位三個主要環(huán)節(jié),各環(huán)節(jié)相互影響,相互作用,其中招生是基礎,是提升研究生教育質量的首要環(huán)節(jié)。博士研究生招生環(huán)節(jié)的選拔方式、考生來源、指標分配等都更為復雜,如何科學合理地優(yōu)化選拔方式、提升生源質量,是博士研究生招生工作研究的重點,也是提升博士研究生教育質量的關鍵。
近年來,我國不斷深化博士研究生招生制度改革,賦予招生單位相對更大的自主權,在傳統(tǒng)的普通招考、碩博連讀、直接攻博三種方式的基礎上,積極推進完善“申請-考核”制招生選拔機制,四種方式具體的招收對象和選拔方法見表1。
根據招生方式的不同,招收對象和選拔方式也有所不同。招生方式、專業(yè)、對象和選拔方法,會直接影響招生單位招生的結構質量、生源質量和選拔質量,從而影響到宏觀的研究生招生質量。如果通過分析研究生招生的歷年數據,能夠發(fā)現優(yōu)質生源的特征,找到研究生招生的結構質量、生源質量和選拔質量的影響因素,就可以在研究生招生環(huán)節(jié)采取有效措施,科學優(yōu)化各種招生選拔方式方法,從而有效地提升研究生招生質量。
表1 博士研究生招生方式情況表
K-means聚類技術是一種經典的聚類算法,它將數據對象分成類或簇,最終使同一個簇中的對象之間具有很高的相似度,而不同簇中的對象高度相異[1]。K-means聚類過程具體概括為:從數據集D中任意選擇k個對象作為初始簇中心;重復上述過程;根據簇中對象的均值,將每個對象(再)指派到最相似的簇;更新簇均值,直到均值不再發(fā)生變化。
博士研究生招生是一項周期性工作,招生階段會產生大量的數據,借助K-means聚類技術,發(fā)掘數據背后蘊藏的規(guī)律,可以有效輔助招生工作。
各招生單位博士研究生招生的各個環(huán)節(jié),都必須采用教育部統(tǒng)一制定的全國博士研究生招生標準信息庫,統(tǒng)一的標準數據結構為有效地進行數據聚類分析提供了必要條件。全國標準信息庫結構是多維的,涉及67個字段,但并不是每個字段都是直接有效數據。通過查閱文獻[2]、反復實驗和借鑒以往工作經驗,更考慮到博士生畢業(yè)成績等相關數據的可得性,本實驗采用2012—2014年某高校博士研究生錄取數據庫數據,以便考察博士生在學期間的全部學習、科研等指標,以及畢業(yè)時的成績狀況,更有效地評價考生的整體素質,進而證明實驗的有效性。
實驗篩選了年齡、性別、學科、錄取信息、學歷信息、考試成績、考試方式、考生來源、就讀學校、就讀專業(yè)與錄取專業(yè)相近度等35個字段。具體實驗過程包括:數據預處理、通過測試確定K-means算法的K值、使用K-means算法聚類和聚合類簇的有效性分析等步驟。
聚類結果的評估指標主要有聚類準確率、同質度、分離度等[3],針對算法應用層面,博士研究生招生數據類別具有模糊性,無法用準確率指標判斷實驗有效性,只能采用同質度、分離度指標分析聚類結果。同質度通過計算屬于同一特征類中的各點與中心點的平均距離,反映同一類數據之間的緊密程度;分離度通過計算各個特征類的中心點之間的平均加權距離,反映不同特征類之間的分離程度。同質度越小,分離度越大,數據聚類的質量就越好。
實驗進行了29次迭代,最終聚合形成4個類簇,每個類簇的同質度、分離度都達到了穩(wěn)態(tài),具體情況見表2。其中,類簇內部對象分布相對緊湊,如圖1所示。最小同質度為5.903,最大同質度為27.880,大部分同質度都分布在0~30之間,分布相對集中;類簇間的類中心相距較遠,最小分離度為114.586 4,最大分離度為246.715 5,分布相對疏遠。每個類簇的分離度都遠大于同質度,分離度與同質度的最小差值為90.259 4,最大差值為240.812 5。同質度相對較小,分離度相對較大,實驗的聚類結果質量良好。
圖1 類內平均距離分布圖
從研究生招生的時間順序來看,研究生招生質量可解構為結構質量、生源質量、選拔質量三種重要的質量內涵[4]。K-means聚類算法應用于博士研究生招生質量分析,除了聚合的實驗結果有效之外,實驗結果必須是可解釋的、可理解的和可應用的。根據研究生招生質量內涵,解讀聚合形成的類簇質量情況如下。
(1) 結構質量。研究生教育結構是包含學位層次、學位類型、學科門類等在內的復雜多維結構模型,而招生專業(yè)目錄是開展招生工作的基礎,學科、專業(yè)、導師等關鍵要素是保障研究生結構質量的關鍵環(huán)節(jié)。在實驗形成的最終類簇中,如果某個類簇涵蓋的優(yōu)勢學科、強勢專業(yè)和高層次導師比例高,則體現了良好的結構質量。教育部發(fā)布的“一流學科”代表了各招生單位的強勢學科和發(fā)展方向。全國第四輪學科評估結果為B+以上學科也是各招生單位的優(yōu)勢學科,院士、長江學者、國家杰出青年科學基金獲得者等高層次人才是各招生單位的學科帶頭人。實驗結果從此三個指標分析招生的結構質量,具體見表3。類1在雙一流學科、學科評估B+以上學科、高層次學科帶頭人方面都表現最優(yōu)秀,其研究生結構質量優(yōu)異;類4在學科評估B+以上學科方面表現突出;類2和類3在三個指標方面都相對落后。
(2) 生源質量。研究生教育歸根結底是人的教育,衡量生源質量好壞也是評價人的綜合素質。權衡人才綜合素質的指標與博士研究生招生數據相結合,主要包括考生學歷背景、成績情況、考生性質、畢業(yè)時間、年齡等指標,具體見表4所示。類1的考生以碩博連讀為主體,均為在讀碩士研究生,且所學專業(yè)與錄取專業(yè)一致,學歷背景多畢業(yè)于“211”工程以上院校,平均年齡較小,從研究生培養(yǎng)經驗而言,該類生源最受歡迎,生源質量評價優(yōu)異;同為普通招考的類2和類4中,類4中成績、學歷背景、應屆生所占比例、在職考生生源情況、平均畢業(yè)時間、平均年齡均優(yōu)于類2;類3為同等學力考生,所占比例較小。
表3 聚類結果結構質量情況表
表4 聚類結果生源質量情況表
(3) 選拔質量。選拔質量指選拔結果的合格程度和選拔方式的合理程度。選拔錄取后學生的學習成績、科研情況、獲獎情況、畢業(yè)論文、按時畢業(yè)等指標是評估選拔質量高低的最佳指標。本實驗選擇2012—2014年間數據,也是為了更好地評估選拔質量,具體情況見表5。類1的考生發(fā)表論文、獲獎、論文送審、答辯成績、按學制準時畢業(yè)率等指標表現最為突出,選拔質量優(yōu)秀;普通招考為主的類2與4類形成對比,類4在學習成績方面最為突出,發(fā)表論文、論文送審、答辯情況、按學制準時畢業(yè)率也占優(yōu)勢,類4的選拔質量好于類2;類3的指標表現較差。
表5 各類考生攻博期間情況表
綜合考量結構質量、生源質量和選拔質量的情況,以碩博連讀生為主的類1招生質量最為優(yōu)異。以普通招考為主的類2、3、4中,類4的招生質量較好,其結構質量、生源質量、選拔質量均優(yōu)于類2、3。類3以同等學力考生為主,招生質量表現最差。
利用K-means聚類算法最終的實驗結果,結合我國博士研究生招生的四種選拔方法,針對博士研究生招生質量提出建議。
根據聚類結果分析,類1的碩博連讀生招生質量最為優(yōu)異,結構質量、生源質量和選拔質量,均表現最佳。該類考生入學后培養(yǎng)階段,在學習成績、論文情況、獲獎情況等均表現最為優(yōu)異,73.01%的碩博連讀生均可按時畢業(yè)。因此,在招生政策制定、資源分配過程中,應適當擴大碩博連讀生的招生比例。擴大的方向既應該考慮到以“一流學科”等為主的強勢學科的需求,又應該考慮到導師群體的實際需要,充分發(fā)揮導師發(fā)掘人才的主觀能動性。
近年來,隨著博士招生制度改革的不斷深化,以初試筆試為主的普通招考選拔考生的數量逐步降低,部分“雙一流”招生單位甚至取消傳統(tǒng)的筆試考試方式。但是,我國研究生招生單位眾多,各招生單位均有自身的校情,導師、學科等結構質量不同,生源質量不同,選拔方式也應該不同。從聚類結果來看,普通招考類選拔方式能招收到生源質量優(yōu)異的考生,但也存在著相當比例的無法按時畢業(yè)等不良考生,因此,各個招生單位應該逐步控制考試類考生比例。
科學合理地降低考試類考生的數量是各個招生單位待解的難題。近年來數據挖掘、大數據等技術手段發(fā)展迅速,各個招生單位可以根據多年的數據積累,篩選出適合普通招考類的優(yōu)質生源。例如,學歷背景好、專業(yè)相關性強、畢業(yè)時間短、平均年齡小等特征,在本次實驗中被驗證為優(yōu)質生源的重要指標,而同等學力考生、在職考生等出現不良考生的概率較大。因此,借助先進的數據分析技術,探索優(yōu)質生源的內在特征,可以科學合理地設定普通招考類考生的招生范圍,既降低了普通招考類考生的招生比例,又提升了該類考生的生源質量。
傳統(tǒng)的筆試選拔方式仍是目前我國博士招生的主流,但其擁有自身的局限性[5],需要建立多層次的博士招生選拔體系?!吧暾?考核”制是招生選拔考試發(fā)展的主要方向。清華大學、天津大學等世界一流學校逐步全面實施“申請-考核”制招生方式,其他更多的招生單位也開始探索。從聚類實驗結果分析,免筆試的碩博連讀選拔類別的類1,具有良好的招生質量,代表著該招生單位已經具備了開展“申請-考核”制招生的基本條件。招生單位的哪些專業(yè)、哪些導師、哪些考生適合“申請-考核”制選拔方式,是“申請-考核”制招生的一大難題,也是進一步實踐與研究的方向。