徐博
DOI:10.16661/j.cnki.1672-3791.2017.30.017
摘 要:新的時(shí)期下如何更好地做好高校學(xué)生工作,是擺在高校教育工作者面前新的問題。同時(shí),我們也應(yīng)該可以看到,目前高校的信息化系統(tǒng)越來(lái)越完善,信息化水平越來(lái)越高,大量的學(xué)生行數(shù)據(jù)被學(xué)校的各個(gè)部門采集到,這些數(shù)據(jù)匯集在一起會(huì)對(duì)學(xué)生工作帶來(lái)什么影響呢?本文利用大數(shù)據(jù)技術(shù),結(jié)合學(xué)生工作的要求和特點(diǎn),重點(diǎn)提出了學(xué)生預(yù)警系統(tǒng)建設(shè)的思路和方法。
關(guān)鍵詞:大數(shù)據(jù) 高校 學(xué)生預(yù)警
中圖分類號(hào):G444 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2017)10(c)-0017-02
為了實(shí)現(xiàn)高校從信息化過渡到智慧化的目標(biāo),引入大數(shù)據(jù)的體系,是關(guān)鍵性的一步。以往的開發(fā)模式是以高校業(yè)務(wù)為導(dǎo)向,流程運(yùn)轉(zhuǎn)使得高效沉淀下來(lái)大量的業(yè)務(wù)數(shù)據(jù)。比如一卡通系統(tǒng)、教務(wù)系統(tǒng)、門禁系統(tǒng)、圖書館系統(tǒng)等。這些數(shù)據(jù)的特征鮮明,結(jié)構(gòu)單一,是目前高校的核心數(shù)據(jù)資產(chǎn),也是大數(shù)據(jù)實(shí)施的基礎(chǔ)。這類數(shù)據(jù)的存儲(chǔ)普遍采用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù),比如Oracle、SqlServer等,以單個(gè)應(yīng)用為主題進(jìn)行設(shè)計(jì),比如一卡通、教務(wù)、門禁等系統(tǒng)中都有記錄學(xué)生相關(guān)的數(shù)據(jù),只是記錄的維度不一樣,而要實(shí)施大數(shù)據(jù)的項(xiàng)目,則需將這些數(shù)據(jù)綜合利用起來(lái),從單維數(shù)據(jù)變?yōu)槎嗑S數(shù)據(jù),以支持復(fù)雜的數(shù)據(jù)分析與調(diào)取。
但是數(shù)據(jù)本身而言,對(duì)于學(xué)校是寶貴的財(cái)富,我們要充分利用現(xiàn)有的數(shù)據(jù),同時(shí)納入更多的數(shù)據(jù)源,真正構(gòu)建智慧化校園的生態(tài)圈。
目前高校的能夠利用的數(shù)據(jù)一共分為三大塊,業(yè)務(wù)數(shù)據(jù)、機(jī)器數(shù)據(jù)以及互聯(lián)網(wǎng)數(shù)據(jù)。其中前面兩塊屬于校內(nèi)數(shù)據(jù),后面的互聯(lián)網(wǎng)數(shù)據(jù)屬于校外。
當(dāng)前大部分高校還在整合第一塊的業(yè)務(wù)數(shù)據(jù),通過建立傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)/數(shù)據(jù)中心來(lái)將這些數(shù)據(jù)進(jìn)行統(tǒng)一和集中的管理。這一步的建設(shè),可以直接橫向打通各個(gè)業(yè)務(wù)系統(tǒng)的壁壘,應(yīng)該來(lái)說(shuō)這個(gè)路是正確的。但是對(duì)于后面兩塊的數(shù)據(jù),重視程度不夠。機(jī)器數(shù)據(jù)實(shí)際上也是學(xué)校要實(shí)現(xiàn)智慧校園所不可獲取的數(shù)據(jù)基礎(chǔ),廣泛分布于學(xué)校的無(wú)線網(wǎng)、門禁、視頻等,都屬于這一類數(shù)據(jù),機(jī)器數(shù)據(jù)不僅僅數(shù)量龐大,同時(shí)記錄的信息也足夠全,合理整合及利用機(jī)器數(shù)據(jù),是智慧校園建設(shè)的重中之重。而互聯(lián)網(wǎng)媒體數(shù)據(jù)則是存在于校園網(wǎng)之外,但是又跟學(xué)校緊密程度比較高的一類數(shù)據(jù),在利用好業(yè)務(wù)數(shù)據(jù)和機(jī)器數(shù)據(jù)的同時(shí),將互聯(lián)網(wǎng)數(shù)據(jù)也納入到整個(gè)學(xué)校的數(shù)據(jù)體系中,也是智慧校園建設(shè)的一個(gè)關(guān)鍵指標(biāo)。
綜上所述,為了智慧校園的建設(shè)目標(biāo),我們需要打通業(yè)務(wù)數(shù)據(jù),開發(fā)利用現(xiàn)有的機(jī)器數(shù)據(jù),同時(shí)再納入互聯(lián)網(wǎng)數(shù)據(jù),構(gòu)建一個(gè)符合要求的大數(shù)據(jù)平臺(tái)。
1 架構(gòu)設(shè)計(jì)
傳統(tǒng)的數(shù)據(jù)中心和數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)目標(biāo)比較明確,但相對(duì)作用也很單一,就是針對(duì)學(xué)校各個(gè)業(yè)務(wù)系統(tǒng)所存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),并且由于其采用的集中式存儲(chǔ)架構(gòu),對(duì)于PB級(jí)以上的數(shù)據(jù)規(guī)模處理起來(lái)已經(jīng)十分吃力,同時(shí)對(duì)于非結(jié)構(gòu)化數(shù)據(jù),特別是軟硬件設(shè)備所產(chǎn)生的海量日志無(wú)法處理,而我們選用的平臺(tái)則實(shí)現(xiàn)了復(fù)雜的多平臺(tái)異構(gòu)環(huán)境下,校園數(shù)據(jù)的融合及海量數(shù)據(jù)的存儲(chǔ)挖掘,是校園大數(shù)據(jù)應(yīng)用的基礎(chǔ)設(shè)施。
1.1 數(shù)據(jù)流轉(zhuǎn)架構(gòu)
數(shù)據(jù)是大數(shù)據(jù)存儲(chǔ)交換平臺(tái)核心處理對(duì)象,如何進(jìn)行數(shù)據(jù)識(shí)別、抽取、存儲(chǔ)、計(jì)算、調(diào)取、呈現(xiàn),激活高校數(shù)據(jù)價(jià)值,釋放高校沉淀數(shù)據(jù)紅利,是平臺(tái)數(shù)據(jù)流轉(zhuǎn)架構(gòu)必須要解決的問題。
1.1.1 數(shù)據(jù)源
數(shù)據(jù)源主要包含高校各種業(yè)務(wù)系統(tǒng)的數(shù)據(jù)、機(jī)器的日志數(shù)據(jù)以及外部互聯(lián)網(wǎng)的數(shù)據(jù)。
(1)業(yè)務(wù)數(shù)據(jù)。
主要包含高校的一卡通系統(tǒng)、學(xué)工系統(tǒng)、門禁系統(tǒng)、教務(wù)系統(tǒng)、科研系統(tǒng)和圖書館系統(tǒng)等業(yè)務(wù)數(shù)據(jù)。主要是各個(gè)業(yè)務(wù)系統(tǒng)所對(duì)應(yīng)的關(guān)系型數(shù)據(jù)庫(kù)中存放的基礎(chǔ)數(shù)據(jù)。
(2)機(jī)器數(shù)據(jù)。
主要包含高校無(wú)線上網(wǎng)日志、網(wǎng)絡(luò)日志和URL日志,這里包括主流廠商如華為、華三、銳捷、Aruba、深信服等設(shè)備的日志。銳捷的SAM身份認(rèn)證日志和無(wú)線AP的記錄,記錄了用戶上網(wǎng)的身份認(rèn)證信息以及各個(gè)無(wú)線AP設(shè)備所記錄的用戶連接信息。
(3)互聯(lián)網(wǎng)數(shù)據(jù)。
主要包含各大門戶網(wǎng)站、新聞、微博、社交、論壇以及貼吧等數(shù)據(jù)。針對(duì)這些數(shù)據(jù)可以利用爬蟲引擎采集數(shù)據(jù),經(jīng)過清洗處理后存入大數(shù)據(jù)平臺(tái)中。
1.1.2 數(shù)據(jù)采集
為了智慧校園的建設(shè)目標(biāo),我們需要打通業(yè)務(wù)數(shù)據(jù),開發(fā)利用現(xiàn)有的機(jī)器數(shù)據(jù),同時(shí)再納入互聯(lián)網(wǎng)數(shù)據(jù),這里我們需要將各種數(shù)據(jù)進(jìn)行采集,經(jīng)過清洗合并后存入到大數(shù)據(jù)平臺(tái)中。
針對(duì)高校的一卡通系統(tǒng)、學(xué)工系統(tǒng)、門禁系統(tǒng)、教務(wù)系統(tǒng)、科研系統(tǒng)和圖書館系統(tǒng)等業(yè)務(wù)數(shù)據(jù)通過ETL引擎定期推送到MySQL集群的大數(shù)據(jù)基礎(chǔ)平臺(tái)中。這里一般采用比較常用的ODI工具來(lái)進(jìn)行推送。
針對(duì)高校無(wú)線上網(wǎng)日志、網(wǎng)絡(luò)日志和URL日志,這里包括主流廠商如華為、華三、銳捷、Aruba、深信服等設(shè)備的日志,通過開源軟件Flume去接收,并存放至NFS集群中。利用Ruby語(yǔ)言寫一個(gè)程序?qū)崟r(shí)從NFS集群中讀取數(shù)據(jù),經(jīng)過清洗轉(zhuǎn)換然后分別寫入MySQL集群、Redis集群和Elasticsearch集群的大數(shù)據(jù)基礎(chǔ)平臺(tái)中。
但是從設(shè)備接收的日志中,不包括用戶與用戶設(shè)備的對(duì)應(yīng)關(guān)系,這導(dǎo)致無(wú)法進(jìn)行關(guān)聯(lián)查詢。高校上網(wǎng)認(rèn)證系統(tǒng)有很多,常用的認(rèn)證系統(tǒng)有SAM,SAM中包括了用戶與用戶設(shè)備的對(duì)應(yīng)關(guān)系,所以這里通過Webservice接口從SAM系統(tǒng)中獲取我們關(guān)注的信息然后清洗轉(zhuǎn)換直接存放至MySQL集群中。
根據(jù)數(shù)據(jù)的規(guī)模和類別,對(duì)于數(shù)據(jù)計(jì)算分為離線的數(shù)據(jù)處理和在線實(shí)時(shí)數(shù)據(jù)處理。其中離線數(shù)據(jù)處理即采用傳統(tǒng)的Hadoop的MapReduce計(jì)算方式,通過大量廉價(jià)的硬件服務(wù)器分解海量的數(shù)據(jù)到單個(gè)節(jié)點(diǎn)進(jìn)行計(jì)算,之后將結(jié)果匯總給客戶端。
1.2 業(yè)務(wù)應(yīng)用類場(chǎng)景endprint
1.2.1 學(xué)生異常行為
隨著外部社會(huì)環(huán)境的日益復(fù)雜,高校對(duì)于學(xué)生的學(xué)習(xí)、生活情況需要異常關(guān)注。依據(jù)調(diào)查分析,平均1名高校輔導(dǎo)員管理的學(xué)生有300人,在數(shù)據(jù)無(wú)法及時(shí)分析處理的情況下,輔導(dǎo)員遇到的問題越來(lái)越多。
(1)輔導(dǎo)員工作繁忙,還需要花大量的時(shí)間用巡查的方式了解學(xué)生狀態(tài)。
(2)學(xué)生在跨越一段時(shí)間內(nèi)的多個(gè)細(xì)微異常舉動(dòng)很容易被忽略,留下隱患。
(3)信息分散在各個(gè)業(yè)務(wù)系統(tǒng)中,了解學(xué)生的情況需要登錄多個(gè)系統(tǒng),耗時(shí)費(fèi)力。
(4)大事發(fā)生,學(xué)校先知道,學(xué)院最后知道!小事發(fā)生,輔導(dǎo)員無(wú)從察覺,事態(tài)嚴(yán)重,學(xué)校才知道。
(5)學(xué)生辦理事務(wù),各層級(jí)掌握信息不同,一件事要多個(gè)層級(jí)確認(rèn)。
(6)各院系,以及輔導(dǎo)員日常學(xué)生安全管理工作成效很難被量化。
學(xué)生安全行為管理系統(tǒng)專為這種場(chǎng)景所定制,匯集多業(yè)務(wù)系統(tǒng)數(shù)據(jù),通過合理的數(shù)據(jù)建模方式,加強(qiáng)管理水平,確保校園安全,提高學(xué)生安全感。
平臺(tái)價(jià)值如下。
(1)校領(lǐng)導(dǎo):學(xué)生安全一目了然。通過報(bào)表、圖形、態(tài)勢(shì)圖了解學(xué)生校內(nèi)生活、學(xué)習(xí)情況。
(2)學(xué)工處:由被動(dòng)管理轉(zhuǎn)化為主動(dòng)服務(wù)。落實(shí)“以人為本、服務(wù)為先、學(xué)生至上”的服務(wù)理念。
(3)輔導(dǎo)員:傳統(tǒng)意義上的學(xué)生管理,每名輔導(dǎo)員少則管理200~300名學(xué)生、多則管理500~600名學(xué)生。輔導(dǎo)員幾乎將全部的時(shí)間和精力放在學(xué)生安全管理上,無(wú)法為學(xué)生提供其他服務(wù),同時(shí)也未必會(huì)取得良好的效果,在及時(shí)性和有效性方面都有所欠缺。
使用學(xué)生安全管理平臺(tái)后,系統(tǒng)篩選出存在風(fēng)險(xiǎn)的問題學(xué)生,輔導(dǎo)員可以將精力放在重點(diǎn)的1~20名學(xué)生身上,在學(xué)生安全方面會(huì)減少約90%的工作量,便于輔導(dǎo)員將更多的時(shí)間和精力投入到為學(xué)生提供更優(yōu)質(zhì)的服務(wù)中去。
1.2.2 學(xué)生心理健康
學(xué)校心理健康中心的心理輔導(dǎo)專家,每天會(huì)接到很多輔導(dǎo)員和家長(zhǎng)的電話咨詢。由于缺少數(shù)據(jù)支撐,只能通過談話溝通、問卷調(diào)查獲取信息,信息缺失非常難以判斷學(xué)生的心理波動(dòng)。
(1)校領(lǐng)導(dǎo)。通過大數(shù)據(jù)建模分析手段,大大減少因?yàn)閷W(xué)生心理問題帶來(lái)的極端事件從而對(duì)學(xué)校造成較大影響事件的概率。
(2)學(xué)工處。龐大而復(fù)雜的學(xué)生管理工作從以前的被動(dòng)轉(zhuǎn)變?yōu)橹鲃?dòng),面對(duì)數(shù)以萬(wàn)計(jì)的在校學(xué)生,通過數(shù)據(jù)的綜合分析獲取普遍學(xué)生對(duì)于學(xué)校管理方式的反饋,及時(shí)修正管理措施,針對(duì)個(gè)別學(xué)生會(huì)出現(xiàn)的心理變化問題,及時(shí)捕捉、重點(diǎn)監(jiān)管的范圍縮小90%以上,同時(shí)對(duì)于已經(jīng)確定的人群則可以進(jìn)行實(shí)時(shí)重點(diǎn)關(guān)注。
(3)輔導(dǎo)員。利用數(shù)據(jù)資源,縮小異常表現(xiàn)學(xué)生的范圍,提升輔導(dǎo)員監(jiān)管效率和減輕工作量。
參考文獻(xiàn)
[1] 范玉朋.基于高校公共數(shù)據(jù)中心的大學(xué)生預(yù)警平臺(tái)設(shè)計(jì)研究[J].赤峰學(xué)院學(xué)報(bào),2017(6):37-38.
[2] 李國(guó)俊,劉雪琳.高校應(yīng)對(duì)學(xué)生突發(fā)事件的預(yù)警能力評(píng)價(jià)研究[J].高教學(xué)刊,2017(16).
[3] 張晶華,丁福興,陳永靜.大學(xué)生學(xué)業(yè)風(fēng)險(xiǎn)管理:預(yù)警評(píng)估與干預(yù)幫扶[J].牡丹江大學(xué)學(xué)報(bào),2017(4):166-168.
[4] 貝虹.大學(xué)生心理問題及其預(yù)警干預(yù)機(jī)制研究[J].東方教育,2015(8).endprint