吳昊
(揚(yáng)州大學(xué)信息化建設(shè)與管理中心 江蘇省揚(yáng)州市 225009)
高等教育統(tǒng)計(jì)工作,是一項(xiàng)透析高等教育現(xiàn)象以進(jìn)一步探索教育發(fā)展規(guī)律的重要工作。高基報(bào)表填報(bào)時(shí)會(huì)存在填報(bào)效率低、數(shù)據(jù)質(zhì)量差等問(wèn)題。大數(shù)據(jù)技術(shù)的出現(xiàn),不僅能夠減輕統(tǒng)計(jì)員的工作壓力,而且易于數(shù)據(jù)后期的追溯和利用。
高基報(bào)表的填報(bào)工作一般首先由各省的教育主管部門(mén)召開(kāi)工作布置會(huì),高校參會(huì)人員傳達(dá)會(huì)議精神。之后,高校的各部門(mén)根據(jù)自身情況填寫(xiě)相關(guān)報(bào)表。最后,由專(zhuān)門(mén)統(tǒng)計(jì)員登錄教育統(tǒng)計(jì)軟件或者平臺(tái)進(jìn)行填報(bào)、核查與上報(bào)。通過(guò)對(duì)高等教育事業(yè)基層統(tǒng)計(jì)報(bào)表的整合與分析,為制定教育政策、編寫(xiě)教育發(fā)展規(guī)劃提供了直觀的依據(jù)。高基報(bào)表填報(bào)涉及高校內(nèi)的各類(lèi)信息,主要分為以下幾個(gè)方面,如圖1所示。
在管理學(xué)中有個(gè)不等式,即100-1≠99,100-1=0[1]。在統(tǒng)計(jì)工作中,這個(gè)細(xì)節(jié)不等式也有對(duì)應(yīng)的解釋?zhuān)?%的偏差可能導(dǎo)致整個(gè)工作的偏差。數(shù)據(jù)填報(bào)時(shí),由于高基報(bào)表填報(bào)的表格數(shù)量繁多,對(duì)每個(gè)數(shù)字的精確度要求極高,填報(bào)的數(shù)據(jù)很容易存在邏輯性和經(jīng)驗(yàn)性問(wèn)題。邏輯問(wèn)題是指在填報(bào)過(guò)程中出現(xiàn)的邏輯錯(cuò)誤,例如數(shù)據(jù)的統(tǒng)計(jì)運(yùn)算錯(cuò)誤、數(shù)據(jù)謄寫(xiě)錯(cuò)誤等。經(jīng)驗(yàn)錯(cuò)誤與邏輯錯(cuò)誤不同,是指按照常規(guī)的教育經(jīng)驗(yàn)理解,可能存在的問(wèn)題。例如在填報(bào)系統(tǒng)里,認(rèn)為招生數(shù)應(yīng)該小于或者等于一年級(jí)在校生數(shù)。然而在現(xiàn)實(shí)填報(bào)過(guò)程中,由于某些新生因故辦理了保留入學(xué)資格手續(xù),使得在校生數(shù)小于招生數(shù)。類(lèi)似問(wèn)題的存在,需要統(tǒng)計(jì)員仔細(xì)分析,這在一定程度上增加了統(tǒng)計(jì)員的工作量。
從互聯(lián)網(wǎng)+,到智能+,高校逐漸建立起各類(lèi)數(shù)據(jù)系統(tǒng),如智慧學(xué)工、人事系統(tǒng)、資產(chǎn)管理系統(tǒng)等。但是,高校內(nèi)部的數(shù)據(jù)系統(tǒng)仍存在以下幾個(gè)方面的問(wèn)題:首先,各部門(mén)間資源不共享,同一個(gè)含義的數(shù)據(jù)如果來(lái)源于不同的歸口部門(mén),會(huì)存在數(shù)據(jù)不一致的情況;其次,數(shù)據(jù)的存儲(chǔ)管理不規(guī)范,導(dǎo)致了過(guò)往數(shù)據(jù)的大量丟失。而高基報(bào)表要求能夠追溯到以往的數(shù)據(jù),即有清晰的臺(tái)賬與記錄,這給統(tǒng)計(jì)人員帶來(lái)了巨大的工作困難;再次,伴隨著海量的半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)的產(chǎn)生,能否高效的分析出這些數(shù)據(jù),也對(duì)統(tǒng)計(jì)工作提出了新的挑戰(zhàn)。
圖1:高基報(bào)表填報(bào)內(nèi)容結(jié)構(gòu)圖
圖2:高基報(bào)表填報(bào)分解圖
圖3:業(yè)務(wù)系統(tǒng)邏輯圖
傳統(tǒng)的高基報(bào)表填報(bào)模式一般可分為以下幾個(gè)步驟,如圖2所示。但是在填報(bào)的過(guò)程中,容易出現(xiàn)數(shù)據(jù)不一致、后期追溯難等問(wèn)題,本文利用大數(shù)據(jù)技術(shù),對(duì)高基報(bào)表的填報(bào)工作進(jìn)行探討。
大數(shù)據(jù)關(guān)鍵技術(shù)包括采集與預(yù)處理計(jì)算技術(shù)、存儲(chǔ)與管理技術(shù)、可視化計(jì)算技術(shù)、分析與挖掘技術(shù)等。為改善數(shù)據(jù)質(zhì)量,應(yīng)利用采集與預(yù)處理計(jì)算等技術(shù),對(duì)數(shù)據(jù)進(jìn)行治理。
國(guó)內(nèi)已經(jīng)有部分學(xué)者針對(duì)高校的數(shù)據(jù)治理模型與框架做出了相應(yīng)的研究:包冬梅等參考了以數(shù)據(jù)管理為主導(dǎo)的DAMA等框架,通過(guò)CALib模型,對(duì)數(shù)據(jù)治理的成熟度評(píng)估進(jìn)行了初步的探討[2];趙安新[3]充分利用互聯(lián)網(wǎng)+背景下的大數(shù)據(jù)技術(shù),從高校數(shù)據(jù)融合的角度研究了高校數(shù)據(jù)治理的框架;顧立平[4]等指出,圖書(shū)館執(zhí)行相關(guān)數(shù)據(jù)策略能夠支持?jǐn)?shù)據(jù)治理工作;從技術(shù)層面、制度層面等,魏楚元[5]等人對(duì)高校的數(shù)據(jù)治理構(gòu)建了相對(duì)完整的治理框架。
高校的數(shù)據(jù)治理需要解決以下幾個(gè)關(guān)鍵點(diǎn):首先,針對(duì)高基報(bào)表的數(shù)據(jù)填報(bào)工作,源頭數(shù)據(jù)是關(guān)鍵。只有源頭數(shù)據(jù)準(zhǔn)確,最終得到的數(shù)據(jù)才會(huì)真實(shí)、有效。在數(shù)據(jù)收集前期,可對(duì)學(xué)生數(shù)據(jù)子集、人事數(shù)據(jù)子集、教學(xué)資源數(shù)據(jù)子集、資產(chǎn)情況數(shù)據(jù)子集等仔細(xì)劃分,確定職能部門(mén),找準(zhǔn)源頭,解決數(shù)據(jù)流向混亂的問(wèn)題。其次,將獲取到的數(shù)據(jù)建立統(tǒng)一的編碼標(biāo)準(zhǔn)與規(guī)范,實(shí)現(xiàn)資源的互聯(lián)互通。例如都柏林核心元素集,此元素集就是一個(gè)致力于規(guī)范Web資源體系結(jié)構(gòu)的國(guó)際性元數(shù)據(jù)解決方案。同樣的,高校的數(shù)據(jù)治理也應(yīng)從實(shí)際情況出發(fā),制定出自定義的編碼規(guī)范,如學(xué)號(hào)、工號(hào)、單位部門(mén)編號(hào)等規(guī)則。最后將數(shù)據(jù)進(jìn)行清洗、處理,形成統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)的平臺(tái)。業(yè)務(wù)邏輯圖如圖3所示。
在前期數(shù)據(jù)的預(yù)處理和存儲(chǔ)工作完成后,可在一定程度上整合校內(nèi)數(shù)據(jù)資源。但高校必須清楚的認(rèn)識(shí)到,數(shù)據(jù)應(yīng)用才是校園信息化智慧建設(shè)的本質(zhì)。通過(guò)導(dǎo)入報(bào)表數(shù)據(jù),將教育數(shù)據(jù)用折線(xiàn)圖、餅狀圖等方式呈現(xiàn)出來(lái),如圖4所示。大數(shù)據(jù)可視化計(jì)算等技術(shù)幫助校領(lǐng)導(dǎo)了解管理與教學(xué)過(guò)程中存在的問(wèn)題,利于高校管理服務(wù)協(xié)同化、決策應(yīng)用科學(xué)化。
當(dāng)然,大數(shù)據(jù)的應(yīng)用不限于可視化模塊的展示,其價(jià)值也體現(xiàn)在預(yù)測(cè)功能。通過(guò)計(jì)算和整合,將學(xué)生、教師、資產(chǎn)等數(shù)據(jù)轉(zhuǎn)化為高校綜合辦學(xué)條件的12個(gè)指標(biāo)數(shù)據(jù)。對(duì)得出的近三年各項(xiàng)指標(biāo)加以分析與對(duì)比,構(gòu)建預(yù)測(cè)模型,從而預(yù)測(cè)出下一年度的指標(biāo)數(shù)據(jù)。若預(yù)測(cè)數(shù)據(jù)超過(guò)合格指標(biāo)范圍,則進(jìn)行預(yù)警提示。該功能不僅能讓校領(lǐng)導(dǎo)更深層次的把握高校的基本情況,對(duì)今后的發(fā)展做出合理的統(tǒng)籌與規(guī)劃,而且為高校追求高層次發(fā)展提供了有力的支撐。
近年來(lái),4G技術(shù)在教育、醫(yī)療等領(lǐng)域都發(fā)揮著重要的作用。但是,隨著科技的發(fā)展,傳統(tǒng)的4G已無(wú)法承載網(wǎng)絡(luò)激增的需求。5G與4G不同,除了高速率、低延時(shí)、高可靠性等特性帶來(lái)的優(yōu)質(zhì)體驗(yàn),還允許更多的設(shè)備高速安全的連接在一起。可見(jiàn),通過(guò)與大數(shù)據(jù)等技術(shù)緊密結(jié)合、相互滲透,5G的出現(xiàn)將構(gòu)筑一個(gè)“智能+”時(shí)代。同樣的,5G的發(fā)展為復(fù)雜的報(bào)表在移動(dòng)端實(shí)現(xiàn)高速下載、在線(xiàn)查看提供了可能。對(duì)于關(guān)鍵數(shù)據(jù),不僅可以實(shí)現(xiàn)查詢(xún)與分析功能,當(dāng)發(fā)現(xiàn)填報(bào)錯(cuò)誤時(shí),還可以修正數(shù)據(jù),并實(shí)時(shí)同步至PC端,使得填報(bào)方式更加靈活、方便。
圖4:數(shù)據(jù)可視化界面圖
通過(guò)將大數(shù)據(jù)的相關(guān)技術(shù)運(yùn)用于高基報(bào)表的數(shù)據(jù)填報(bào)之中,一方面能夠?qū)崿F(xiàn)數(shù)據(jù)的共享與復(fù)用,解決上報(bào)數(shù)據(jù)差異問(wèn)題,提高數(shù)據(jù)填報(bào)質(zhì)量;另一方面,通過(guò)對(duì)數(shù)據(jù)的分析和預(yù)測(cè),能夠輔助校領(lǐng)導(dǎo)科學(xué)決策,盤(pán)活學(xué)校各項(xiàng)資源。而對(duì)于高校,利用大數(shù)據(jù)技術(shù)獲得的成果不僅僅用于高基報(bào)表的填報(bào),更可用于其他工作。因此,高校應(yīng)掌握數(shù)據(jù)應(yīng)用的自主權(quán)。從事高校信息化工作的人員應(yīng)學(xué)會(huì)使用相應(yīng)的工具,熟練的進(jìn)行數(shù)據(jù)清洗和處理,并利用相關(guān)技術(shù)對(duì)數(shù)據(jù)進(jìn)行深度挖掘。讓高校既是數(shù)據(jù)的“生產(chǎn)者”,也是數(shù)據(jù)的“管理者”,從而讓數(shù)據(jù)的治理與應(yīng)用成為常態(tài)化、可持續(xù)的工作。