王戰(zhàn)軍,藺跟榮
(北京理工大學(xué) 人文與社會(huì)科學(xué)學(xué)院,北京 100081)
研究生教育是國家教育體系的最高層次,肩負(fù)著高層次人才培養(yǎng)和創(chuàng)新創(chuàng)造的重要使命,是國家發(fā)展、社會(huì)進(jìn)步的重要基石,全面提高研究生教育質(zhì)量是新時(shí)期我國研究生教育的核心任務(wù)[3]。研究生教育質(zhì)量提升是一個(gè)系統(tǒng)工程,需要化解傳統(tǒng)研究生教育管理決策信息的碎片化、靜態(tài)化、簡(jiǎn)單化等不利因素,突破管理決策的局部性、線性化和靜態(tài)性等困境,用大數(shù)據(jù)驅(qū)動(dòng)的管理決策理念,實(shí)現(xiàn)研究生教育科學(xué)、理性的管理與決策[4]。大數(shù)據(jù)驅(qū)動(dòng)技術(shù)的快速發(fā)展和廣泛使用為管理改革注入了新活力[5],為研究生教育管理范式的創(chuàng)新提供了動(dòng)力源泉。
2000年以來,我國研究生教育規(guī)模迅速擴(kuò)大。根據(jù)教育部公布的《2020年全國教育事業(yè)發(fā)展統(tǒng)計(jì)公報(bào)》,2020年,全國共有研究生培養(yǎng)單位827個(gè),研究生招生110.66萬人,比上一年增加了19萬人,增長(zhǎng)20.74%。其中博士生招生11.6萬人,碩士生招生99.05萬人。此外,研究生教育在學(xué)的總規(guī)模達(dá)到313.96萬人[6]。研究生教育規(guī)模激增為中國研究生教育帶來了新的發(fā)展機(jī)遇,隨著研究生教育以規(guī)模擴(kuò)張為特征的外延式發(fā)展任務(wù)的基本完成,全面提高質(zhì)量、內(nèi)涵式、高質(zhì)量發(fā)展成為新時(shí)代中國研究生教育的核心議題。資源配置成為研究生教育管理面臨的復(fù)雜難題。
資源配置是研究生教育管理決策的核心問題。為保障和提升研究生教育質(zhì)量,國家不斷加大研究生教育資源投入,以“雙一流”建設(shè)為例,首輪“雙一流”建設(shè)中央引導(dǎo)專項(xiàng)資金、地方政府投入共計(jì)1800多億元。然而當(dāng)前的研究生教育資源配置管理還處于條塊分割的行政職能控制之下,主要采取“單位提交材料-領(lǐng)域?qū)<以u(píng)審-主管部門審核確定”的管理決策方式,管理決策過程主觀性較強(qiáng),單位的文字材料、評(píng)審專家的主觀判斷以及主管部門的經(jīng)驗(yàn)管理,對(duì)研究生教育資源的最終投向起著決定的影響。行政主導(dǎo)的資源配置方式雖然管理效率高,但存在剛性有余而靈活性不足的問題,導(dǎo)致忽視不同地區(qū)發(fā)展水平、不同學(xué)科發(fā)展特點(diǎn)、不同機(jī)構(gòu)發(fā)展優(yōu)勢(shì)。因此,由于管理決策依據(jù)的科學(xué)性不足,決策過程中的偏差較難控制,以經(jīng)驗(yàn)驅(qū)動(dòng)的研究生教育資源配置極易形成研究生教育管理過程中“上項(xiàng)目”“爭(zhēng)資源”現(xiàn)象,忽視學(xué)科建設(shè)、人才培養(yǎng)的客觀規(guī)律,導(dǎo)致重復(fù)建設(shè)和資源浪費(fèi),不能很好適應(yīng)研究生教育的改革發(fā)展與建設(shè)研究生教育強(qiáng)國的客觀需求。
研究生教育評(píng)價(jià)是研究生教育發(fā)展的指揮棒。習(xí)近平總書記在全國教育大會(huì)上強(qiáng)調(diào),要深化教育體制改革,健全立德樹人落實(shí)機(jī)制,扭轉(zhuǎn)不科學(xué)的教育評(píng)價(jià)導(dǎo)向,堅(jiān)決克服唯分?jǐn)?shù)、唯升學(xué)、唯文憑、唯論文、唯帽子的頑瘴痼疾,從根本上解決教育評(píng)價(jià)指揮棒問題[7]。隨著我國研究生教育步入內(nèi)涵式、高質(zhì)量發(fā)展階段,提高研究生教育管理決策效率,促進(jìn)研究生教育質(zhì)量提高成為新時(shí)代的主要目標(biāo)。
當(dāng)前我國研究生教育評(píng)價(jià)以總結(jié)性評(píng)價(jià)為主,常態(tài)和過程的動(dòng)態(tài)監(jiān)測(cè)不足。評(píng)價(jià)標(biāo)準(zhǔn)由于指標(biāo)一致性和數(shù)據(jù)可比性等的限制,多采用靜態(tài)固定指標(biāo),將不同類型院校、學(xué)科用相同或相近指標(biāo)進(jìn)行評(píng)價(jià)的現(xiàn)象較為普遍。不同類型的研究生教育評(píng)價(jià)雖然設(shè)置了不同的權(quán)重,但其數(shù)據(jù)指標(biāo)基本不變,極易導(dǎo)致對(duì)評(píng)價(jià)對(duì)象發(fā)展多樣性的忽視。
科學(xué)的評(píng)價(jià)方法是扭轉(zhuǎn)不科學(xué)的教育評(píng)價(jià)導(dǎo)向的基礎(chǔ)。以動(dòng)態(tài)監(jiān)測(cè)為基礎(chǔ)的監(jiān)測(cè)評(píng)估,利用現(xiàn)代信息技術(shù)持續(xù)收集和深入分析有關(guān)信息,通過直觀呈現(xiàn)研究生教育狀態(tài),為多元主體價(jià)值判斷和科學(xué)管理決策提供客觀依據(jù)[8]。動(dòng)態(tài)監(jiān)測(cè)體現(xiàn)了開放性、客觀性、寫實(shí)性、動(dòng)態(tài)性的理念。相比傳統(tǒng)研究生教育評(píng)價(jià),動(dòng)態(tài)監(jiān)測(cè)的指標(biāo)體系是開放的監(jiān)測(cè)指標(biāo)體系,可以根據(jù)反映研究生教育的特色和實(shí)際需要作出調(diào)整。動(dòng)態(tài)監(jiān)測(cè)指標(biāo)采用定量和定性結(jié)合的方式,定量指標(biāo)反映研究生教育客觀情況,定性指標(biāo)用事實(shí)說話,輔助呈現(xiàn)研究生教育管理過程。更重要的是,動(dòng)態(tài)監(jiān)測(cè)充分利用大數(shù)據(jù)驅(qū)動(dòng)的優(yōu)勢(shì),采用動(dòng)態(tài)采集信息,實(shí)時(shí)更新狀態(tài),及時(shí)反饋的機(jī)制實(shí)現(xiàn)了研究生教育的常態(tài)評(píng)價(jià),提高了評(píng)價(jià)的有效性。
傳統(tǒng)研究生教育管理決策通常建立在靜態(tài)的周期性統(tǒng)計(jì)報(bào)表的基礎(chǔ)之上。研究生教育的錯(cuò)綜復(fù)雜和管理信息數(shù)量急劇增加,為研究生教育決策者帶來了沉重的負(fù)荷。決策者處理信息的能力是有限的,因此迫使決策者不得不依靠更多的人協(xié)助分擔(dān)負(fù)荷[9]。同時(shí)由于方法的限制,數(shù)據(jù)分析能力不足,基于海量數(shù)據(jù)的模型研究滯后,限制了對(duì)數(shù)據(jù)隱含規(guī)律的挖掘與呈現(xiàn)??傊造o態(tài)周期報(bào)表數(shù)據(jù)為依據(jù)的研究生教育管理決策非常不利于及時(shí)采取糾偏措施和有效預(yù)防管理決策風(fēng)險(xiǎn),難以應(yīng)對(duì)日益復(fù)雜和發(fā)展節(jié)奏變快的研究生教育管理現(xiàn)實(shí),研究生教育管理決策亟待建立“用數(shù)據(jù)說話、用事實(shí)說話”的科學(xué)管理決策范式。
建立動(dòng)態(tài)監(jiān)測(cè)的研究生教育管理決策新范式,需要采用大數(shù)據(jù)驅(qū)動(dòng)的方式,將大數(shù)據(jù)作為管理決策的基礎(chǔ),充分利用研究生教育大數(shù)據(jù)海量增長(zhǎng)趨勢(shì),解決研究生教育數(shù)據(jù)的采集和存儲(chǔ)碎片化問題,打通研究生教育的“數(shù)據(jù)孤島”,有效融合內(nèi)部數(shù)據(jù)源與外部數(shù)據(jù)源,形成多源異構(gòu)研究生教育數(shù)據(jù)平臺(tái)。同時(shí)利用研究生教育大數(shù)據(jù)平臺(tái)建立研究生教育過程數(shù)據(jù)的動(dòng)態(tài)采集、挖掘分析處理和實(shí)時(shí)反饋的動(dòng)態(tài)監(jiān)測(cè)機(jī)制,為研究生教育動(dòng)態(tài)監(jiān)測(cè)的科學(xué)管理決策提供支撐。
范式是美國哲學(xué)家托馬斯·庫恩為了解釋科學(xué)革命是如何發(fā)生的而創(chuàng)造的一個(gè)概念。范式在不同的研究領(lǐng)域具有不同的認(rèn)識(shí),在科學(xué)哲學(xué)的范疇中,范式是對(duì)科學(xué)的總體觀點(diǎn),即聯(lián)結(jié)科學(xué)共同體并且允許常規(guī)科學(xué)發(fā)生的一系列共享的假設(shè)、信念和價(jià)值觀[10]。在社會(huì)學(xué)的范疇中,范式指公認(rèn)的科學(xué)成就、具體的科學(xué)成就、一套科學(xué)習(xí)慣[11]。管理學(xué)范疇中的范式強(qiáng)調(diào)了從規(guī)范管理向?qū)嵶C管理方向的轉(zhuǎn)變,為管理理論提供證實(shí)和證偽成為管理學(xué)范式發(fā)展的顯著特點(diǎn)[12]。從數(shù)據(jù)形態(tài)的角度,圖靈獎(jiǎng)得主Jim Gray將科學(xué)研究的范式分為實(shí)驗(yàn)范式、理論范式、仿真范式以及數(shù)據(jù)密集型范式[13]。因此范式從本質(zhì)上講是一種理論體系或框架,無論是在實(shí)際中還是在邏輯上都接近于科學(xué)共同體。
隨著新興技術(shù)的突破與創(chuàng)新,使人們對(duì)復(fù)雜的系統(tǒng)進(jìn)行直接管理和科學(xué)決策的渴望變成現(xiàn)實(shí)。大數(shù)據(jù)、人工智能、虛擬現(xiàn)實(shí)等信息技術(shù)的快速發(fā)展帶來管理思維和決策方式的轉(zhuǎn)變,研究生教育管理在管理數(shù)據(jù)密集化的基礎(chǔ)上實(shí)現(xiàn)了大數(shù)據(jù)驅(qū)動(dòng)的管理決策,引領(lǐng)研究生教育管理決策方向,形成了研究生教育管理動(dòng)態(tài)監(jiān)測(cè)范式。
動(dòng)態(tài)監(jiān)測(cè)利用現(xiàn)代信息技術(shù)持續(xù)收集、深度挖掘和系統(tǒng)分析有關(guān)數(shù)據(jù),客觀呈現(xiàn)研究生教育管理狀態(tài),為多元主體價(jià)值判斷和科學(xué)決策提供客觀依據(jù)[14]。教育管理系統(tǒng)要素相互作用,其結(jié)構(gòu)關(guān)系往往表現(xiàn)為某種模式和模型[15]。動(dòng)態(tài)監(jiān)測(cè)由“數(shù)據(jù)收集-系統(tǒng)分析-客觀呈現(xiàn)”所組成的緊密聯(lián)系的整體構(gòu)成。大數(shù)據(jù)驅(qū)動(dòng)的研究生教育管理需要教育專家和數(shù)據(jù)專家跨界融合,動(dòng)態(tài)監(jiān)測(cè)通過數(shù)據(jù)建立突破式的跨界關(guān)聯(lián)、大數(shù)據(jù)資源治理機(jī)制與管理、大數(shù)據(jù)管理與決策價(jià)值分析與發(fā)現(xiàn)、大數(shù)據(jù)分析方法與支撐技術(shù),形成一種新的管理決策范式[16],實(shí)現(xiàn)研究生教育管理證實(shí)寫實(shí)、多元判斷、持續(xù)改進(jìn)的科學(xué)管理決策,大數(shù)據(jù)驅(qū)動(dòng)的研究生教育管理動(dòng)態(tài)監(jiān)測(cè)模型如圖1所示。
圖1 大數(shù)據(jù)驅(qū)動(dòng)的研究生教育管理動(dòng)態(tài)監(jiān)測(cè)模型
大數(shù)據(jù)驅(qū)動(dòng)的研究生教育管理動(dòng)態(tài)監(jiān)測(cè)具有五方面的屬性。一是證實(shí)的屬性,動(dòng)態(tài)監(jiān)測(cè)使用核心監(jiān)測(cè)定量數(shù)據(jù)說話,客觀反映研究生教育管理的狀態(tài),所采用數(shù)據(jù)與管理狀態(tài)在一定條件下具有高度相關(guān)或者具有相同發(fā)展趨勢(shì),監(jiān)測(cè)數(shù)據(jù)能夠反映管理狀態(tài)的變化情況。二是寫實(shí)的屬性,研究生教育管理是一個(gè)復(fù)雜的系統(tǒng),對(duì)于難以用客觀數(shù)據(jù)量化的維度,需要使用定性的事實(shí)寫實(shí)描述。三是動(dòng)態(tài)的屬性,動(dòng)態(tài)監(jiān)測(cè)證實(shí)數(shù)據(jù)和寫實(shí)事實(shí)都基于研究生教育管理周期的實(shí)時(shí)數(shù)據(jù),對(duì)研究生教育管理狀態(tài)實(shí)時(shí)反饋,動(dòng)態(tài)的實(shí)現(xiàn)有賴于數(shù)據(jù)的實(shí)時(shí)采集和及時(shí)處理反饋。四是精準(zhǔn)的屬性,動(dòng)態(tài)監(jiān)測(cè)為多元管理主體服務(wù),滿足不同主體的訴求,大數(shù)據(jù)驅(qū)動(dòng)的研究生教育管理決策必須針對(duì)不同主體,在功能上實(shí)現(xiàn)個(gè)性化定制。五是改進(jìn)的屬性,基于定量數(shù)據(jù)和定性寫實(shí),動(dòng)態(tài)監(jiān)測(cè)為研究生教育管理決策提供支撐,實(shí)現(xiàn)多元主體價(jià)值判斷[16]。
研究生教育管理動(dòng)態(tài)監(jiān)測(cè)以大數(shù)據(jù)驅(qū)動(dòng)為基礎(chǔ)。信息技術(shù)的快速發(fā)展使得研究生教育管理能夠?qū)ρ芯可逃顒?dòng)“全樣本”進(jìn)行采集,獲得全樣本、全周期、全過程、全透明的數(shù)據(jù)[17]。在完整的數(shù)據(jù)基礎(chǔ)上,動(dòng)態(tài)監(jiān)測(cè)通過數(shù)據(jù)清洗,教育專家和數(shù)據(jù)專家跨界合作,進(jìn)行數(shù)據(jù)多變組合,融合其他新變量和潛在變量,生成有用的管理信息。然后利用統(tǒng)計(jì)推理、模型分析、數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)等方法提取隱含的信息、知識(shí)和過程,作出科學(xué)管理和決策,支持多元判斷、科學(xué)決策和持續(xù)改進(jìn)。如圖2。
圖2 動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)驅(qū)動(dòng)循環(huán)示意圖
研究生教育管理動(dòng)態(tài)監(jiān)測(cè)以多數(shù)據(jù)融合為關(guān)鍵。動(dòng)態(tài)監(jiān)測(cè)要求持續(xù)收集和深入分析有關(guān)信息,實(shí)時(shí)呈現(xiàn)研究生教育管理狀態(tài),實(shí)現(xiàn)過程管理和跟蹤評(píng)價(jià)。這就需要突破數(shù)據(jù)的線性化和靜態(tài)性,通過數(shù)據(jù)進(jìn)行多源異構(gòu)融合,將定性和定量結(jié)合、主觀和客觀結(jié)合,實(shí)現(xiàn)數(shù)據(jù)采集、清洗存儲(chǔ)、分析挖掘、決策和反饋等過程個(gè)性化、自主化、智能化,提高管理和決策水平,為研究生招生計(jì)劃制定、學(xué)位授權(quán)審核等研究生教育管理問題的管理決策提供支撐。
研究生教育管理動(dòng)態(tài)監(jiān)測(cè)以數(shù)據(jù)交互為目的。在大數(shù)據(jù)背景下,管理決策模式由以流程為主的線性模式轉(zhuǎn)向以數(shù)據(jù)為中心的扁平化模式[18],參與管理的多元主體和數(shù)據(jù)流向更趨于多元和交互。不同管理主體可以針對(duì)不同問題,基于大數(shù)據(jù)驅(qū)動(dòng)的動(dòng)態(tài)監(jiān)測(cè),客觀分析并做出科學(xué)管理決策,引導(dǎo)管理者自主改善管理方式,改進(jìn)管理行為,實(shí)現(xiàn)研究生教育管理決策的科學(xué)化。
研究生教育管理動(dòng)態(tài)監(jiān)測(cè)是大數(shù)據(jù)時(shí)代教育管理發(fā)展的產(chǎn)物。動(dòng)態(tài)監(jiān)測(cè)滿足了研究生教育體系高質(zhì)量發(fā)展的內(nèi)在需求,適應(yīng)了經(jīng)濟(jì)社會(huì)發(fā)展新常態(tài)的外在需要。使用動(dòng)態(tài)監(jiān)測(cè)范式管理決策,對(duì)推動(dòng)研究生教育高質(zhì)量發(fā)展,全面提高研究生教育管理水平、推進(jìn)研究生教育治理體系和治理能力現(xiàn)代化具有重要意義。
動(dòng)態(tài)監(jiān)測(cè)是研究生教育質(zhì)量保障體系的有機(jī)組成?;谘芯可逃芾泶髷?shù)據(jù)的動(dòng)態(tài)監(jiān)測(cè),從研究生教育管理的角度出發(fā),可以直觀了解研究生教育師資隊(duì)伍、辦學(xué)條件、培養(yǎng)過程、德育工作、教學(xué)管理、質(zhì)量監(jiān)控與改進(jìn)等環(huán)節(jié)的狀態(tài)。根據(jù)研究生教育環(huán)節(jié)動(dòng)態(tài)監(jiān)測(cè)結(jié)果,對(duì)可能存在的問題進(jìn)行及時(shí)預(yù)警,提醒高校和各級(jí)教育主管部門及時(shí)啟動(dòng)針對(duì)異常波動(dòng)的應(yīng)急預(yù)案,查找和分析原因,并采取有效的干預(yù)措施[19]。同時(shí),深入挖掘研究生教育管理數(shù)據(jù),開展多維度、多層次、系統(tǒng)性的關(guān)聯(lián)和因果分析,發(fā)現(xiàn)存在的問題,探究研究生教育育人規(guī)律、發(fā)展規(guī)律和管理規(guī)律,提高研究生教育培養(yǎng)質(zhì)量和辦學(xué)效益。
研究生教育管理動(dòng)態(tài)監(jiān)測(cè)為各級(jí)參與主體服務(wù)。大數(shù)據(jù)時(shí)代下,主要發(fā)達(dá)國家都從學(xué)校、區(qū)域、國家與國際四個(gè)層面構(gòu)建研究生教育管理大數(shù)據(jù),并積極對(duì)管理進(jìn)行變革[20]。研究生教育管理參與主體既包括研究生教育主管部門和高校,也包括教師、學(xué)生和社會(huì)公眾等[21]。動(dòng)態(tài)監(jiān)測(cè)充分發(fā)揮研究生教育管理大數(shù)據(jù)的規(guī)模性、多樣性、高速性和價(jià)值性等特點(diǎn),利用數(shù)據(jù)平臺(tái)強(qiáng)大的統(tǒng)計(jì)、分析、管理決策和預(yù)測(cè)預(yù)警等功能,為各級(jí)參與主體管理決策提供支撐。研究生教育主管部門和高??梢愿鶕?jù)工作需求,利用平臺(tái)統(tǒng)計(jì)模型等數(shù)據(jù)管理與分析工具進(jìn)行橫向與縱向?qū)Ρ确治觯{(diào)整辦學(xué)方向,改進(jìn)教學(xué)內(nèi)容,提升培養(yǎng)質(zhì)量。動(dòng)態(tài)監(jiān)測(cè)的方式降低了管理成本,減少了人為干預(yù)因素,促進(jìn)管理過程的科學(xué)性和規(guī)范性,保證研究生教育管理決策的公平性、客觀性和準(zhǔn)確性。教師、學(xué)生和社會(huì)公眾可以利用多種形式有效參與研究生教育管理,提高管理效率;同時(shí)監(jiān)督管理過程,促進(jìn)研究生教育管理決策公開透明,完善大學(xué)治理體系,提升大學(xué)治理能力。
研究生教育管理動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)是實(shí)現(xiàn)研究生教育管理動(dòng)態(tài)監(jiān)測(cè)的主要途徑,構(gòu)建動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)的關(guān)鍵是對(duì)多源異構(gòu)數(shù)據(jù)清洗融合。通過動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行群體分析、決策知識(shí)表示等,實(shí)現(xiàn)個(gè)性化、自主化、智能化的管理決策和可視化呈現(xiàn)等,為“雙一流”建設(shè)、研究生招生計(jì)劃制定、學(xué)位授權(quán)審核等研究生教育管理問題提供管理決策支持[22]。
動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)依據(jù)研究生教育規(guī)律,用大數(shù)據(jù)反映研究生教育的基本狀態(tài),通過在線方式進(jìn)行數(shù)據(jù)采集并提供服務(wù)。動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)由數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)融合和數(shù)據(jù)呈現(xiàn)四層組成,平臺(tái)加強(qiáng)了系統(tǒng)的數(shù)據(jù)治理功能,構(gòu)建了用戶授權(quán)體系、標(biāo)準(zhǔn)規(guī)范體系、數(shù)據(jù)質(zhì)量體系、信息安全體系和數(shù)據(jù)管理體系,為平臺(tái)規(guī)范安全運(yùn)行提供了保障,動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)架構(gòu)圖如圖3所示。
圖3 動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)架構(gòu)圖
1.數(shù)據(jù)采集
大數(shù)據(jù)的來源分為兩大類:一是來自物理世界,二是來自人類社會(huì)[23]。研究生教育質(zhì)量動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)的數(shù)據(jù)屬于人類社會(huì)的數(shù)據(jù),主要來自研究生教育活動(dòng)過程,來源主要有五個(gè)途徑:一是公共數(shù)據(jù),主要是研究生教育活動(dòng)相關(guān)的各類公開統(tǒng)計(jì)數(shù)據(jù),特別是政府部門、組織機(jī)構(gòu)和高校發(fā)布的各類公開統(tǒng)計(jì)數(shù)據(jù)。二是網(wǎng)絡(luò)抓取數(shù)據(jù),主要是指利用網(wǎng)絡(luò)信息收集技術(shù),對(duì)特定主題或指定領(lǐng)域的研究生教育活動(dòng)進(jìn)行實(shí)時(shí)抓取需要的過程數(shù)據(jù)。三是學(xué)校采集數(shù)據(jù),平臺(tái)建設(shè)秉持共建共享的原則并面向?qū)W校開放,學(xué)??梢噪S時(shí)將相關(guān)數(shù)據(jù)資料上傳到數(shù)據(jù)平臺(tái),平臺(tái)對(duì)學(xué)校用戶提供各種查詢和信息服務(wù)。四是文本報(bào)告數(shù)據(jù),主要指各類通知、政策文件、年度報(bào)告、總結(jié)報(bào)告等文本材料。五是國際比較數(shù)據(jù),既包含了國內(nèi)研究生教育在國際的影響和比較數(shù)據(jù),同時(shí)還包括國際研究生教育的狀態(tài)數(shù)據(jù)。
2.數(shù)據(jù)存儲(chǔ)
研究生教育管理動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)類型十分復(fù)雜多樣,既包含結(jié)構(gòu)化數(shù)據(jù),如研究生經(jīng)費(fèi)、授予學(xué)位規(guī)模等統(tǒng)計(jì)數(shù)據(jù),還包含大量的文本報(bào)告、圖形圖像和音頻視頻材料。大規(guī)模的數(shù)據(jù)生產(chǎn)就必然伴隨著大規(guī)模的數(shù)據(jù)存儲(chǔ),傳統(tǒng)存儲(chǔ)方式有其存儲(chǔ)限制,如何高效率管理和存儲(chǔ)大量復(fù)雜的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)是動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)亟須解決的首要問題。目前很多大數(shù)據(jù)企業(yè)包括Google,IBM,Amazon等都在研究分布式存儲(chǔ)技術(shù)和服務(wù),分布式存儲(chǔ)技術(shù)改變了人們的存儲(chǔ)理念并且是未來存儲(chǔ)發(fā)展的一種趨勢(shì)?,F(xiàn)有的分布式存儲(chǔ)系統(tǒng)有GFS(Google File System)、HDFS(Hadoop Distributed File System)、MongileFS、TFS(Taobao File System)等[24]。為了滿足平臺(tái)同源異構(gòu)數(shù)據(jù)可擴(kuò)展、高容錯(cuò)、高可用,且能快速檢索的要求,平臺(tái)采用HDFS分布式存儲(chǔ)的架構(gòu)。HDFS是GFS的開源版本實(shí)現(xiàn),主要由管理文件系統(tǒng)元數(shù)據(jù)的主要節(jié)點(diǎn)(Name Node)和存儲(chǔ)實(shí)際數(shù)據(jù)的數(shù)據(jù)節(jié)點(diǎn)(Data Node)組成。HDFS可以構(gòu)建典型的NoSQL產(chǎn)品——HBase分布式數(shù)據(jù)庫,實(shí)現(xiàn)對(duì)平臺(tái)數(shù)據(jù)高效地管理。
3.數(shù)據(jù)融合
單一數(shù)據(jù)來源和類型無法滿足人們對(duì)研究生教育管理數(shù)據(jù)多樣性、實(shí)時(shí)性、準(zhǔn)確可靠性等方面的要求,需要數(shù)據(jù)融合技術(shù)從多源數(shù)據(jù)中得出估計(jì)和判決,增加數(shù)據(jù)的置信度、提高可靠性、降低不確定性。因此,對(duì)研究生教育管理數(shù)據(jù)按需要進(jìn)行統(tǒng)計(jì)轉(zhuǎn)換、信息抽取、自然語言處理、模型提取等處理,形成不同層面、不同維度、不同類型的研究生教育管理數(shù)據(jù)集。數(shù)據(jù)集的形成需要相應(yīng)的計(jì)算引擎為其提供強(qiáng)大的計(jì)算能力,計(jì)算引擎包括批處理計(jì)算引擎、流計(jì)算引擎、內(nèi)存計(jì)算引擎、圖計(jì)算引擎等。
4.數(shù)據(jù)呈現(xiàn)
在研究生教育管理數(shù)據(jù)集的基礎(chǔ)之上,平臺(tái)利用數(shù)據(jù)分析挖掘技術(shù),如統(tǒng)計(jì)分析、關(guān)聯(lián)規(guī)則、聚類分析、趨勢(shì)預(yù)測(cè)、時(shí)序分析、回歸分析、情感分析、語義分析、社交網(wǎng)絡(luò)分析、文本分析、主題模型分析等,結(jié)合實(shí)際需求特征,構(gòu)建基于進(jìn)展分析模型、達(dá)成分析模型、水平提升模型、貢獻(xiàn)分析模型、美譽(yù)評(píng)價(jià)模型為核心的報(bào)表、簡(jiǎn)報(bào)和報(bào)告等服務(wù),同時(shí)提供多樣化的專業(yè)應(yīng)用接口以及平臺(tái)用戶的注冊(cè)、登錄、驗(yàn)證等通用管理接口,支持移動(dòng)終端對(duì)平臺(tái)的訪問。
5.數(shù)據(jù)治理
隨著大數(shù)據(jù)應(yīng)用的普及,要發(fā)揮大數(shù)據(jù)應(yīng)用的功能,應(yīng)該從目的、權(quán)利層次、對(duì)象和解決的實(shí)際問題等方面明確大數(shù)據(jù)治理[25]。動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)首先要對(duì)訪問用戶做分類權(quán)限管理,明確不同用戶的訪問權(quán)限、操作權(quán)限以及管理權(quán)限。其次,制定研究生教育管理大數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范。一般情況下,研究生教育數(shù)據(jù)都是在不同業(yè)務(wù)系統(tǒng)上獨(dú)立分布的,沒有考慮系統(tǒng)之間數(shù)據(jù)的重復(fù)性和一致性,造成多種數(shù)據(jù)信息共享困難,數(shù)據(jù)統(tǒng)計(jì)口徑無法匹配,業(yè)務(wù)之間無法溝通,甚至產(chǎn)生歧義。數(shù)據(jù)治理要明確數(shù)據(jù)需求、整合數(shù)據(jù)依據(jù)、統(tǒng)一業(yè)務(wù)口徑,完善研究生教育數(shù)據(jù)管理流程標(biāo)準(zhǔn),形成研究生教育數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系。同時(shí),還要考慮可回溯的數(shù)據(jù)質(zhì)量體系、數(shù)據(jù)管理體系、數(shù)據(jù)安全體系等,保證研究生教育管理數(shù)據(jù)的真實(shí)性、客觀性,數(shù)據(jù)分析使用的適切性。
研究生教育管理動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)構(gòu)建過程中所涉及的技術(shù)領(lǐng)域非常廣泛,根據(jù)平臺(tái)構(gòu)建的不同階段及大數(shù)據(jù)處理的不同需求,構(gòu)建過程中所涉及的主要關(guān)鍵技術(shù),主要有五個(gè)方面。
一是多源異構(gòu)數(shù)據(jù)融合技術(shù)。數(shù)據(jù)融合技術(shù)是一種多層次多角度的處理手段。數(shù)據(jù)源具有隨機(jī)性、多樣性、異構(gòu)性,而且存在“數(shù)據(jù)孤島”、數(shù)據(jù)質(zhì)量參差不齊等問題,對(duì)數(shù)據(jù)采集、清洗、存儲(chǔ)、查詢、分析等帶來巨大挑戰(zhàn)。為了得到精準(zhǔn)的狀態(tài)數(shù)據(jù)信息,將多源數(shù)據(jù)進(jìn)行一系列包括檢測(cè)、結(jié)合、關(guān)聯(lián)、估計(jì)和組合等操作[26],實(shí)現(xiàn)多元異構(gòu)數(shù)據(jù)融合是數(shù)據(jù)平臺(tái)的主要關(guān)鍵技術(shù)。平臺(tái)數(shù)據(jù)主要有公共數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)、學(xué)校采集數(shù)據(jù)、文本報(bào)告、國際比較數(shù)據(jù)等。數(shù)據(jù)平臺(tái)利用分布式、適應(yīng)性的網(wǎng)絡(luò)采集,對(duì)半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)清洗,通過數(shù)據(jù)分析、統(tǒng)計(jì)與生成功能,從國家、大學(xué)、學(xué)科等層面進(jìn)行主題監(jiān)測(cè)。按監(jiān)測(cè)主題構(gòu)建形成科學(xué)研究、師資隊(duì)伍、人才培養(yǎng)、社會(huì)服務(wù)、文化傳承等管理數(shù)據(jù)庫,能夠滿足不同層次、類型管理主體的管理需求。
二是輕量級(jí)Docker容器技術(shù)。從海量的研究生教育大數(shù)據(jù)中挖掘出有價(jià)值的信息是數(shù)據(jù)平臺(tái)的主要功能之一。HDFS分布式存儲(chǔ)需要較高的數(shù)據(jù)讀寫速率,而傳統(tǒng)的虛擬化技術(shù)對(duì)于主機(jī)資源的利用率無法達(dá)到真實(shí)物理主機(jī)的工作水平,容器技術(shù)是提高物理主機(jī)的資源利用率的新虛擬化技術(shù)。Docker是一種輕量級(jí)新興的虛擬化容器技術(shù),具有可移植、易使用、跨平臺(tái)等優(yōu)勢(shì),能夠快速、準(zhǔn)確、標(biāo)準(zhǔn)化封裝應(yīng)用程序并自動(dòng)化部署整個(gè)運(yùn)行環(huán)境[27]。動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)構(gòu)建的HDFS分布式文件系統(tǒng),采用冗余存儲(chǔ)的方式提高數(shù)據(jù)讀取效率和后續(xù)數(shù)據(jù)處理作業(yè)運(yùn)行速率,對(duì)結(jié)構(gòu)化數(shù)據(jù)采用關(guān)系型數(shù)據(jù)庫MySQL進(jìn)行管理,對(duì)海量半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)采用HBase技術(shù)建立面向列存儲(chǔ)的數(shù)據(jù)管理方式的分布式海量數(shù)據(jù)倉庫進(jìn)行管理。Docker容器技術(shù)解決了結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)采集、清洗、融合過程的技術(shù)問題,特別是數(shù)據(jù)的高效處理問題,保證數(shù)據(jù)處理作業(yè)的高效性、擴(kuò)展性、可靠性和安全性。
三是數(shù)據(jù)標(biāo)準(zhǔn)和規(guī)范。研究生教育管理數(shù)據(jù)標(biāo)準(zhǔn)和規(guī)范是動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)開發(fā)利用的基礎(chǔ),為促進(jìn)數(shù)據(jù)平臺(tái)互聯(lián)互通和實(shí)現(xiàn)研究生教育數(shù)據(jù)全生命周期管理提供了保障。研究生教育管理過程數(shù)據(jù)關(guān)系復(fù)雜、結(jié)構(gòu)多樣,為動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)信息的規(guī)范管理帶來了諸多挑戰(zhàn)。2018年4月,教育部發(fā)布的《教育信息化2.0行動(dòng)計(jì)劃》明確要求,規(guī)范教育資源數(shù)據(jù)和教育管理數(shù)據(jù)的數(shù)據(jù)采集和挖掘流程。動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)具有強(qiáng)大的研究生教育管理過程數(shù)據(jù)采集、清洗、存儲(chǔ)、處理、建模、分析等功能,要實(shí)現(xiàn)管理過程各環(huán)節(jié)數(shù)據(jù)的有效銜接、數(shù)據(jù)流程各關(guān)鍵技術(shù)有機(jī)結(jié)合,必須制定平臺(tái)數(shù)據(jù)標(biāo)準(zhǔn)和規(guī)范。從系統(tǒng)開發(fā)的角度,數(shù)據(jù)平臺(tái)根據(jù)研究生教育特點(diǎn)和管理過程數(shù)據(jù)的特征,統(tǒng)籌數(shù)據(jù)全生命周期管理的各項(xiàng)數(shù)據(jù)標(biāo)準(zhǔn)。數(shù)據(jù)標(biāo)準(zhǔn)對(duì)采集格式、存儲(chǔ)結(jié)構(gòu)、數(shù)據(jù)分類、數(shù)據(jù)管理及處理等進(jìn)行了規(guī)范,統(tǒng)一了不同管理環(huán)節(jié)和關(guān)鍵技術(shù)之間數(shù)據(jù)交互的規(guī)范和流程,形成研究生教育管理數(shù)據(jù)標(biāo)準(zhǔn)體系,實(shí)現(xiàn)動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)從采集到分析應(yīng)用各環(huán)節(jié)無縫聯(lián)動(dòng)。
四是文本數(shù)據(jù)預(yù)處理技術(shù)。文本數(shù)據(jù)是研究生教育管理數(shù)據(jù)中非常重要的數(shù)據(jù)類型。文本數(shù)據(jù)預(yù)處理一般包括文本分詞、文本特征提取、文本向量化、文本歸一化和文本預(yù)處理實(shí)現(xiàn)[28]。中文文本分詞方法分基于規(guī)則的分詞方法和基于統(tǒng)計(jì)的分詞方法兩大類,常見的方法有基于最大匹配算法的中文分詞方法、基于N-gram的雙向匹配法、基于深度神經(jīng)網(wǎng)絡(luò)模型的中文分詞、基于BERT語言模型的Tokenization等。動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)從原始報(bào)告中提取文本,以基于詞典的分詞技術(shù)為核心,詞頻分詞技術(shù)識(shí)別新詞和人工添加外來詞典為輔,實(shí)現(xiàn)研究生教育文本大數(shù)據(jù)分詞。特征提取包含特征抽取和特征選擇。特征抽取一般通過特征函數(shù)將文本數(shù)據(jù)投影到特征空間,得到特征空間值。特征選擇是利用文本集共性與規(guī)則對(duì)文本進(jìn)行歸納降維,達(dá)到降低計(jì)算復(fù)雜度和提高分類準(zhǔn)確率的目的。動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)結(jié)合TF(Term Frequency)和IDF(Inverse Document Frequency)的兩種方式,采用TF-IDF的方法進(jìn)行文本特征提取。文本向量化是將文檔模型由常見的摩爾模型、概率模型、圖空間模型轉(zhuǎn)化為向量空間模型,方便利用集合和權(quán)重對(duì)文本進(jìn)行分析處理。文本歸一化是將文本向量轉(zhuǎn)換成單位向量,提高文本計(jì)算的精度,主要?dú)w一方法有線性函數(shù)方法和中心化方法。動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)采用基于Map Reduce分布式計(jì)算框架向量空間模型對(duì)文本進(jìn)行向量化計(jì)算,以向量的方式進(jìn)行相似度、聚類分析,實(shí)現(xiàn)對(duì)研究生教育文本數(shù)據(jù)預(yù)處理[29]。
五是交互可視化呈現(xiàn)技術(shù)??梢暬尸F(xiàn)技術(shù)是輔助洞悉和呈現(xiàn)研究生教育管理大數(shù)據(jù)背后隱藏的知識(shí)和規(guī)律的重要方法。交互技術(shù)是數(shù)據(jù)可視化不可分割的重要組成部分,可視化領(lǐng)域的Focus+Context(F+C)技術(shù)是一種符合認(rèn)知心理學(xué)的人機(jī)交互技術(shù),能夠有效匹配人在探索信息時(shí)的認(rèn)知心理映像,在信息可視化各研究領(lǐng)域得到了廣泛的應(yīng)用[30]。交互可視化主要方便動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)大數(shù)據(jù)管理與處理結(jié)果反饋,將不同類型數(shù)據(jù)通過技術(shù)互接,包括知識(shí)服務(wù)結(jié)果交互可視、研究生教育管理全生命周期交互可視、研究生教育管理多主體協(xié)同交互可視等。
研究生教育動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)體現(xiàn)了研究生教育管理價(jià)值主體和價(jià)值客體的有機(jī)統(tǒng)一。數(shù)據(jù)平臺(tái)將研究生教育管理過程狀態(tài)映射為監(jiān)測(cè)數(shù)據(jù),通過對(duì)數(shù)據(jù)處理和分析產(chǎn)生管理決策的知識(shí)信息,最后將知識(shí)信息動(dòng)態(tài)反饋到相關(guān)管理主體實(shí)現(xiàn)多元價(jià)值判斷,支撐研究生教育科學(xué)管理和決策,推動(dòng)研究生教育管理效益持續(xù)改進(jìn)。
1.動(dòng)態(tài)監(jiān)測(cè)研究生教育運(yùn)行狀態(tài)
數(shù)據(jù)平臺(tái)動(dòng)態(tài)監(jiān)測(cè)并呈現(xiàn)研究生教育運(yùn)行和管理狀態(tài)。通過采集研究生教育全過程、全方位數(shù)據(jù),運(yùn)用數(shù)據(jù)融合和分析等技術(shù)與手段,數(shù)據(jù)平臺(tái)能夠客觀動(dòng)態(tài)反映和呈現(xiàn)全國、區(qū)域、大學(xué)的學(xué)科結(jié)構(gòu)分布、學(xué)位授予規(guī)模、導(dǎo)師配備數(shù)量、教師教學(xué)情況、科學(xué)研究項(xiàng)目和學(xué)術(shù)成果等研究生教育發(fā)展?fàn)顟B(tài)。多元管理主體可以通過數(shù)據(jù)平臺(tái)的分析工具,多維度、多層次、全方位、系統(tǒng)性了解全國、區(qū)域和大學(xué)研究生教育狀態(tài),客觀分析研究生教育管理環(huán)節(jié)和關(guān)鍵指標(biāo),把脈研究生教育發(fā)展問題,為研究生教育科學(xué)管理決策奠定基礎(chǔ)。
2.“數(shù)據(jù)+事實(shí)”綜合反映管理狀態(tài)
數(shù)據(jù)平臺(tái)強(qiáng)調(diào)用數(shù)據(jù)和事實(shí)綜合的方法反映研究生教育管理狀態(tài)。通過全面、客觀、系統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)和典型、真實(shí)、完整的非結(jié)構(gòu)化事實(shí),數(shù)據(jù)平臺(tái)借助于數(shù)據(jù)融合、數(shù)據(jù)關(guān)聯(lián)和數(shù)據(jù)可視化技術(shù),既客觀反映研究生教育管理過程因素的復(fù)雜關(guān)系,又減少了人為價(jià)值判斷的干預(yù),促進(jìn)動(dòng)態(tài)監(jiān)測(cè)過程科學(xué)規(guī)范,保證監(jiān)測(cè)結(jié)果公平、客觀和準(zhǔn)確。例如,研究生招生資源配置是研究生教育管理主要問題?;趧?dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)的資源配置,可以根據(jù)國家需求,大學(xué)、學(xué)科、導(dǎo)師的科研狀態(tài)分配博士生招生指標(biāo)。一方面通過結(jié)構(gòu)化的客觀數(shù)據(jù),政府、高校、學(xué)科可以從人才培養(yǎng)、研究經(jīng)費(fèi)、承擔(dān)研究任務(wù)、產(chǎn)出研究成果等呈現(xiàn)研究生教育全過程狀態(tài),從不同管理視角進(jìn)行分析;另一方面,在動(dòng)態(tài)監(jiān)測(cè)研究生教育狀態(tài)的基礎(chǔ)上,重視事實(shí)和非結(jié)構(gòu)化判斷在數(shù)據(jù)分析和結(jié)果解釋中的指導(dǎo)作用,通過數(shù)據(jù)分析和事實(shí)解釋相結(jié)合,綜合反映研究生教育狀態(tài)和潛在規(guī)律。
3.“及時(shí)反饋+持續(xù)改進(jìn)”提高管理水平
持續(xù)改進(jìn)是一種追求卓越和不斷提高管理效率的管理理念。動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)持續(xù)收集數(shù)據(jù),進(jìn)行研究生導(dǎo)師結(jié)構(gòu)、研究生培養(yǎng)質(zhì)量、研究生教育績(jī)效等問題分析,發(fā)現(xiàn)研究生教育管理過程的異常情況,并及時(shí)反饋給決策者,持續(xù)改進(jìn)。動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)對(duì)研究生教育管理的主要問題,如學(xué)位授權(quán)管理、資源差異化配置、學(xué)科動(dòng)態(tài)調(diào)整等提供管理依據(jù),提高管理水平。同時(shí),動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)平臺(tái)通過運(yùn)行,不斷提高技術(shù)方法,優(yōu)化平臺(tái)系統(tǒng),改進(jìn)分析模型,持續(xù)改進(jìn)平臺(tái)服務(wù)功能,為研究生教育系統(tǒng)不斷優(yōu)化完善提供更好支撐。
4.“定性+定量”服務(wù)多元主體決策