夏燕
(上海市教育評估院,上海 200031)
基于大數(shù)據(jù)的高??冃гu估管理平臺(tái)
夏燕
(上海市教育評估院,上海 200031)
實(shí)施高等教育績效評估是優(yōu)化資源配置和推動(dòng)高等教育可持續(xù)發(fā)展的必然要求??茖W(xué)有效的高等教育績效評估依賴于全面、可靠的評估數(shù)據(jù)。大數(shù)據(jù)能收集大量、多類型的數(shù)據(jù),并在深度挖掘和科學(xué)分析中,尋求數(shù)據(jù)背后的隱含關(guān)系和價(jià)值?;诖髷?shù)據(jù)的高校績效評估有助于評價(jià)從片段化信息的推測轉(zhuǎn)向基于全方位、全程化數(shù)據(jù)的科學(xué)決策。提出了一個(gè)基于大數(shù)據(jù)的高??冃гu估管理平臺(tái)的構(gòu)建方案,實(shí)現(xiàn)了績效評估相關(guān)業(yè)務(wù)的自動(dòng)化管理,為高等教育績效評估提供了基本依據(jù)。
大數(shù)據(jù); 數(shù)據(jù)倉庫; 數(shù)據(jù)挖掘; 績效評估; 多維分析
隨著公共管理體制改革、高等教育大眾化對教育資源需求的膨脹和教育財(cái)政性投入的持續(xù)增長,高等教育績效逐步成為政府、社會(huì)的關(guān)注問題。高等教育績效評估是績效管理體系中的核心環(huán)節(jié)[1]。評估結(jié)果作為政府分配教育資源等管理決策的依據(jù),可提高經(jīng)費(fèi)使用效益,完善資源配置,促進(jìn)高校內(nèi)涵建設(shè)和學(xué)科優(yōu)化布局[2]。如何對高校進(jìn)行系統(tǒng)、科學(xué)的績效評估,從而更好地提高資源利用促進(jìn)高校發(fā)展,是目前高等教育研究的重要研究課題。評估指標(biāo)體系的設(shè)計(jì)、基礎(chǔ)數(shù)據(jù)的采集和評估方法的構(gòu)建是高校績效評估的關(guān)鍵因素。目前,高??冃гu估指標(biāo)體系和評估方法的研究已比較成熟。隨著高校信息化建設(shè)的不斷發(fā)展,很多高校都建立和運(yùn)行著各類不同的數(shù)據(jù)庫系統(tǒng),包含績效評估所需的各類基礎(chǔ)數(shù)據(jù)。如何有效的集成基礎(chǔ)數(shù)據(jù),與指標(biāo)體系相結(jié)合進(jìn)行深入分析,已成為高??冃гu估進(jìn)一步深化所亟待解決的問題。
大數(shù)據(jù)技術(shù)可以對海量數(shù)據(jù)進(jìn)行挖掘分析,提取有用信息,從而指導(dǎo)輔助高??冃гu估。隨著大數(shù)據(jù)技術(shù)在績效評估中的引入,將其從基于小樣本數(shù)據(jù)的推測轉(zhuǎn)向基于全方位、全程化數(shù)據(jù)的科學(xué)決策[3]。
本文提出了一個(gè)基于大數(shù)據(jù)的績效評估解決方案,建立了一個(gè)高??冃гu估管理平臺(tái)。該平臺(tái)可運(yùn)用大數(shù)據(jù)技術(shù)挖掘績效評估數(shù)據(jù)中隱含著的內(nèi)在關(guān)系,從而促進(jìn)高校績效評估的發(fā)展,有助于教育資源的合理配置,為教育政策的制訂和改進(jìn)提供基本依據(jù)。
西方發(fā)達(dá)國家于20世紀(jì)80年代開始開展高校績效評估,并逐漸將績效評估的結(jié)果作為分配教育資源、加強(qiáng)學(xué)校管理的重要依據(jù)。由英格蘭高等教育撥款委員會(huì)(HEFCE)、蘇格蘭高等教育撥款委員會(huì)(SHEFC)等聯(lián)合組織的英國科技評價(jià)負(fù)責(zé)英國高等教育機(jī)構(gòu)的研究質(zhì)量[4]。荷蘭大學(xué)協(xié)會(huì)、高等教育學(xué)院聯(lián)合會(huì)等負(fù)責(zé)對高校進(jìn)行外部評估[5]。澳大利亞高等教育評估委員會(huì)、大學(xué)質(zhì)量署等從不同視角對高校進(jìn)行績效評估[6]。我國高等教育的績效評估工作從21世紀(jì)初正式開展,中央教育科學(xué)研究所發(fā)布的《中國高等學(xué)??冃гu價(jià)報(bào)告》,對72所教育部直屬高校開展了績效評價(jià)[7]。以上各類績效評估主要采用傳統(tǒng)的專家評估法和統(tǒng)計(jì)分析方法等相結(jié)合,結(jié)合投入產(chǎn)出模型進(jìn)行。但是在評估過程中存在數(shù)據(jù)支持不足、系統(tǒng)思維缺乏、動(dòng)態(tài)反饋不夠等缺陷。
目前,隨著高校信息化的不斷推進(jìn),高校運(yùn)行著各類系統(tǒng)及數(shù)據(jù)庫,如教務(wù)、人事、學(xué)生、科研、財(cái)務(wù)管理等。各系統(tǒng)提高了工作效率的同時(shí),積累了海量數(shù)據(jù)。如何將各類數(shù)據(jù)源與高??冃гu估指標(biāo)體系、評估方法有效結(jié)合,通過對大數(shù)據(jù)的多角度分析提供豐富有力的決策支持,使績效評估順利實(shí)施,已成為目前高等教育研究的熱點(diǎn)課題。
本文基于大數(shù)據(jù)技術(shù)建立了一個(gè)高校績效評估管理平臺(tái),為教育主管部門和高校進(jìn)行績效評價(jià)和制定發(fā)展戰(zhàn)略提供基本依據(jù)。
基于大數(shù)據(jù)的高??冃гu估管理平臺(tái)體系結(jié)構(gòu),如圖1所示。
圖1 高校績效評估管理平臺(tái)體系結(jié)構(gòu)
包含5層結(jié)構(gòu):高校數(shù)據(jù)集成層、評估指標(biāo)集成層、績效評估分析層、評估結(jié)果反饋層、系統(tǒng)管理服務(wù)層。
2.1.1 高校數(shù)據(jù)集成層
高校數(shù)據(jù)集成層是高??冃гu估的基礎(chǔ)數(shù)據(jù)來源,包含分布于各系統(tǒng)的異構(gòu)數(shù)據(jù)源。建立異構(gòu)數(shù)據(jù)源出發(fā)機(jī)制后,高??冃гu估所需的數(shù)據(jù)可增量式地集成到數(shù)據(jù)倉庫中,確保基礎(chǔ)數(shù)據(jù)的準(zhǔn)確性。該層包含數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)清洗、數(shù)據(jù)加載。將異構(gòu)數(shù)據(jù)盡可能集成為結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ),形成新模式便于與指標(biāo)體系集成層聯(lián)系。
2.1.2 評估指標(biāo)集成層
評估指標(biāo)集成層可拆分統(tǒng)一化的高??冃гu估指標(biāo)體系,以主題關(guān)聯(lián)、數(shù)據(jù)集市等方式重構(gòu)個(gè)性化評估指標(biāo)。由于高校評估對象結(jié)構(gòu)復(fù)雜,評估指標(biāo)往往由若干項(xiàng)指標(biāo)按照層次關(guān)系組成。每項(xiàng)指標(biāo)包括指標(biāo)內(nèi)涵、評估基準(zhǔn)、權(quán)重、關(guān)聯(lián)度四方面內(nèi)容,定量、定性模式等。經(jīng)績效評估分析后,在評估結(jié)果反饋層得到對個(gè)性化評估指標(biāo)的反饋,并依次迭代細(xì)化。
2.1.3 績效評估分析層
績效評估分析層通過應(yīng)用大數(shù)據(jù)挖掘算法對高校進(jìn)行績效評估,深入分析評價(jià)數(shù)據(jù)的內(nèi)在關(guān)系,挖掘優(yōu)勢高校、潛力高校、一般高校、特色高校等各類高校??冃гu估分析層可利用數(shù)據(jù)云存儲(chǔ)、分布式管理來進(jìn)行系統(tǒng)體系的融合。
2.1.4 評估結(jié)果反饋層
評估結(jié)果反饋層不僅包含對高??冃гu估結(jié)果的反饋,并且產(chǎn)生的評估結(jié)果又包含對前3層的反饋。反饋層通過可視化表現(xiàn)評估結(jié)果,識(shí)別分析優(yōu)勢高校,潛力高校,一般高校,特色高校等。對高校建設(shè)進(jìn)行長期跟蹤,觀察其發(fā)展情況和進(jìn)步程度。反饋層通過迭代修正,完善各層的應(yīng)用。
2.1.5 系統(tǒng)管理服務(wù)層
系統(tǒng)管理服務(wù)層由2部分組成,平臺(tái)管理和數(shù)據(jù)倉庫管理。平臺(tái)管理包含存儲(chǔ)管理、網(wǎng)絡(luò)管理、用戶管理和安全管理。該層相對獨(dú)立,為其余4層提供了信息的傳遞服務(wù)。
2.2.1 數(shù)據(jù)倉庫設(shè)計(jì)方案
由于高??冃гu估管理平臺(tái),涉及各高?;A(chǔ)數(shù)據(jù)庫,各公共數(shù)據(jù)庫等,數(shù)據(jù)內(nèi)容復(fù)雜,信息量巨大,采用自頂向下法建立數(shù)據(jù)倉庫。集成異構(gòu)數(shù)據(jù)源,創(chuàng)建辦學(xué)條件與資源、辦學(xué)質(zhì)量與水平、辦學(xué)聲譽(yù)等若干主題。每個(gè)主題可細(xì)化為若干子主題,如師資水平、生源質(zhì)量、國際交流、科學(xué)研究、人才培養(yǎng)質(zhì)量、辦學(xué)特色等高??冃гu估所關(guān)注問題。在此基礎(chǔ)上,建立數(shù)據(jù)集市。
2.2.2 基礎(chǔ)數(shù)據(jù)建模
管理平臺(tái)應(yīng)用星型模型建模,需識(shí)別基礎(chǔ)數(shù)據(jù)中與高??冃гu估相關(guān)的最細(xì)粒度屬性,根據(jù)各主題的需要,建立事實(shí)表和維度表,集成異構(gòu)數(shù)據(jù)源數(shù)據(jù)。各主題對應(yīng)不同事實(shí)表,事實(shí)表通過鍵與相應(yīng)的維度表一一對應(yīng)。
科學(xué)研究主題中部分?jǐn)?shù)據(jù)模型設(shè)計(jì)包含事實(shí)表,維度表等,如圖2所示。
圖2 科學(xué)研究主題中部分?jǐn)?shù)據(jù)模型
2.2.3 評估指標(biāo)建模
考慮到高等教育的多樣化,對不同層次、不同類型的高校進(jìn)行科學(xué)合理的分類,對不同的類別的高校采用不同的評估指標(biāo)進(jìn)行評估。設(shè)定基礎(chǔ)指標(biāo)和動(dòng)態(tài)指標(biāo),將高?;A(chǔ)數(shù)據(jù)對應(yīng)到具體的評估指標(biāo)。與科學(xué)研究主題相關(guān)的部分評估指標(biāo)模型,如圖3所示。
圖3 與科學(xué)研究主題相關(guān)的部分評估指標(biāo)模型
高??冃е笜?biāo)設(shè)計(jì)需滿足績效評估數(shù)據(jù)集市所需的最小粒度,指標(biāo)類型與所屬主題相關(guān)聯(lián),弱化區(qū)分度小的指標(biāo),歸并強(qiáng)相關(guān)性指標(biāo),正負(fù)指標(biāo)相結(jié)合等原則。
在完成基礎(chǔ)數(shù)據(jù)建模,評估指標(biāo)建模后,以事實(shí)表為核心,結(jié)合維度表和數(shù)據(jù)加載工具,向數(shù)據(jù)倉庫提供數(shù)據(jù)信息??冃гu估管理平臺(tái)通過大數(shù)據(jù)挖掘算法,通過不同的維度對各高??冃нM(jìn)行評估。
利用分類預(yù)測挖掘算法,建立分類函數(shù),將滿足函數(shù)條件的高校映射到某個(gè)給定的類別,達(dá)到預(yù)測目標(biāo)??蓱?yīng)用決策樹算法、樸素貝葉斯算法、貝葉斯網(wǎng)絡(luò)算法、神經(jīng)網(wǎng)絡(luò)算法等進(jìn)行分類預(yù)測。
采用聚類分析算法,將各高校進(jìn)行簇劃分,同一簇的高??冃嗨?,不同簇的高校績效差別較大??蓱?yīng)用基于劃分的K-means算法,基于層次的BIRCH算法,基于密度的DBSCAN算法,基于網(wǎng)格的STING算法等進(jìn)行聚類分析。
利用關(guān)聯(lián)規(guī)則挖掘可發(fā)現(xiàn)不同高校之間的聯(lián)系,推動(dòng)高校間的合作,提高高校績效。可應(yīng)用Apriori算法,F(xiàn)P-樹算法等進(jìn)行關(guān)聯(lián)規(guī)則挖掘。
應(yīng)用時(shí)間序列模式,根據(jù)基礎(chǔ)數(shù)據(jù)隨時(shí)間變化的趨勢預(yù)測高校績效的發(fā)展情況。
基于大數(shù)據(jù)的高校績效評估管理平臺(tái)具有以下特點(diǎn)。
1) 數(shù)據(jù)采集由靜態(tài)轉(zhuǎn)化為分布式動(dòng)態(tài)采集。評估管理平臺(tái)將高??冃嚓P(guān)數(shù)據(jù),由分布于互聯(lián)網(wǎng)的異構(gòu)數(shù)據(jù)源動(dòng)態(tài)抽取集成到數(shù)據(jù)倉庫。確保了評估數(shù)據(jù)來源的正確性和準(zhǔn)確性。
2) 靈活維護(hù)評估指標(biāo),支持多評估指標(biāo)體系。評估管理平臺(tái)重構(gòu)統(tǒng)一化的評估指標(biāo)體系,構(gòu)建個(gè)性化指標(biāo)。確保被評估對象的整體定位和個(gè)體的特性發(fā)展。
3) 通過大數(shù)據(jù)挖掘算法對高??冃нM(jìn)行多維評估分析。評估管理平臺(tái)應(yīng)用大數(shù)據(jù)挖掘算法,通過不同維度深入挖掘高校數(shù)據(jù)內(nèi)在聯(lián)系,對各高??冃нM(jìn)行評估。確保評估的客觀性和科學(xué)性。
4) 由單一數(shù)據(jù)反饋轉(zhuǎn)化為雙向互動(dòng)反饋。評估管理平臺(tái)中數(shù)據(jù)流向由單一模式轉(zhuǎn)化為雙向互動(dòng)模式。評估結(jié)果對數(shù)據(jù)流經(jīng)的各層面各模塊提供反饋。確??冃гu估過程的不斷優(yōu)化完善。
5) 由結(jié)果性評估轉(zhuǎn)化為過程性評估。評估管理平臺(tái)根據(jù)主題需求、數(shù)據(jù)集市,可將過程性數(shù)據(jù)作為評估主體。不僅關(guān)注高??冃КF(xiàn)狀,更注重發(fā)展趨勢。
在對現(xiàn)有的高??冃гu價(jià)方法進(jìn)行調(diào)研分析的基礎(chǔ)上,本文提出了一個(gè)基于大數(shù)據(jù)的高??冃гu估解決方案,構(gòu)建了一個(gè)高??冃гu估管理平臺(tái)。該平臺(tái)的運(yùn)用不僅解決了目前高??冃гu估實(shí)施過程中存在的不足,而且進(jìn)一步促進(jìn)了高??冃гu估的發(fā)展。為教育政策的制訂和改進(jìn)提供基本依據(jù),有助于提升高等教育質(zhì)量。
在未來工作中,希望根據(jù)不同類別高校的特點(diǎn),進(jìn)一步開展評估管理平臺(tái)中大數(shù)據(jù)挖掘技術(shù)與高等教育數(shù)據(jù)相結(jié)合的研究,對高校績效進(jìn)行更科學(xué)合理的評價(jià),并進(jìn)一步推動(dòng)高等教育管理決策平臺(tái)的建設(shè)。
[1] Sarrico C S, Rosa M J,Teixeira P N, et al. Assessing Quality and Evaluating Performance in Higher Education: Worlds Apart or Complementary Views [J]. Minerva,2010(48):35-53.
[2] 王奇,馮暉.高等教育績效評估研究[M].北京:高等教育出版社,2012:14-16.
[3] Crossley M. Global league tables, big data and the international transfer of educational research modalities [J]. Comparative Education, 2014,50(1):15-26.
[4] Kitagawa F, Lightowler C. Knowledge Exchange: A Comparison of Policies, Strategies, and Funding Incentives in English and Scottish Education [J]. Research Evaluation, 2013(22):69-74.
[5] H.van den Bosch, Christine Teelken. Organisation and Leadership in Higher Education: Learning from Experiences in the Netherlands [Z]. Higher Education Policy, 2000(13).
[6] Commonwealth of Australia. Our Universities: Backing our Future[R]. Canberra: DEST,2003:42-50.
[7] 中央教育科學(xué)研究所高等教育研究中心.中國高等學(xué)??冃гu價(jià)報(bào)告[J].大學(xué)(學(xué)術(shù)版),2009(11):10-29.
PerformanceEvaluationManagementPlatformofUniversitiesBasedonBigData
Xia Yan
(Shanghai Education Evaluation Institute, Shanghai 200031, China)
It is necessary to implement performance evaluation of higher education to optimize resource allocation and to promote sustainable development of higher education. Effective performance evaluation depends on comprehensive and reliable data. Big data technology focuses on deep data mining and scientific analysis based on a large number of multidimensional data, to discover implicit relationship and value among them. It helps performance evaluation of universities from speculation on fragment information to decision making on overall information. The paper proposes a solution of performance evaluation platform based on big data. It implements automatic management for business in performance evaluation. It provides advice and guidance for performance evaluation of higher education.
Big data; Data warehouse; Data mining; Performance evaluation; Multidimensional analysis
1007-757X(2017)12-0003-04
上海市教育委員會(huì)上海高校青年教師培養(yǎng)資助計(jì)劃(ZZPGY14002),中國科學(xué)技術(shù)信息研究所ISTIC-Thomson Reuters科學(xué)計(jì)量學(xué)聯(lián)合實(shí)驗(yàn)室開放基金項(xiàng)目
夏 燕(1981-) ,女,上海,工程師,博士研究生,研究方向:數(shù)據(jù)挖掘、高校學(xué)科評價(jià)、高等教育管理等。
TP181
A
2017.09.21)