◆趙英淇
淺談校園大數(shù)據(jù)分析及其可視化研究
◆趙英淇
(華中科技大學計算機科學與技術學院 湖北 430074)
校園信息化的實現(xiàn),可將數(shù)據(jù)處理系統(tǒng)與基層數(shù)據(jù)產(chǎn)出端進行對接,分析出不同數(shù)據(jù)比對下的差異問題,進而為后續(xù)校園教育管理工作的開展提供數(shù)據(jù)支撐?;诖?,本文以校園大數(shù)據(jù)預處理工序為切入點,對學生數(shù)據(jù)庫建設及可視化的實現(xiàn)進行研究。
校園大數(shù)據(jù)分析;可視化;信息化
在校園信息化的建設與推進下,數(shù)據(jù)信息管控性能也隨之加強。對于學生管理而言,可通過不同維度的數(shù)據(jù)確認,映射出當前教育及管理信息,在實時化、動態(tài)化的數(shù)據(jù)界定下,充分界定出不同操控空間下,數(shù)據(jù)信息之間的對接屬性,為后續(xù)教育管理工作的開展提供數(shù)據(jù)支撐。校園大數(shù)據(jù)分析及可視化研究,則是通過數(shù)據(jù)模型的建設,利用數(shù)字化表達機制,確保相關技術在落實過程中,可以實現(xiàn)對數(shù)據(jù)本體的多維度解析,從多方面解讀出數(shù)據(jù)參數(shù)異常問題。例如,通過數(shù)據(jù)記錄學生日常學習、生活中所產(chǎn)生的信息,以大數(shù)據(jù)技術為核心,結合可視化模型,將動態(tài)化表達建立在信息傳輸訴求之上,真正做到抽象化與表象化的結合,提高數(shù)據(jù)分析質(zhì)量,加快智慧校園的構設效率。本文則是針對校園大數(shù)據(jù)分析及其可視化進行探討,僅供參考。
大數(shù)據(jù)時代的到來,海量數(shù)據(jù)信息的高效率處理,則成為數(shù)據(jù)系統(tǒng)運行的核心,保證在復雜性的數(shù)據(jù)結構中,可短時間內(nèi)獲取具有一定價值且有關聯(lián)的數(shù)據(jù),避免信息孤島問題的產(chǎn)生。校園大數(shù)據(jù)預處理則是對既有數(shù)據(jù)進行多維度分析,以高價值數(shù)據(jù)為基準,在高密度的數(shù)據(jù)體系中,查證出更為優(yōu)質(zhì)的數(shù)據(jù),進而為系統(tǒng)后續(xù)運行提供數(shù)據(jù)支撐。
此類數(shù)據(jù)抽取主要是在系統(tǒng)數(shù)據(jù)庫中建設具有目標統(tǒng)計功能的數(shù)據(jù)體系,結合整體與局部兩種形式,在目標數(shù)據(jù)庫中查證出相對應的數(shù)據(jù)參數(shù)。從實際應用效果而言,整體數(shù)據(jù)抽取具有應用廣泛性的特征,但是在海量數(shù)據(jù)中運行時,存在數(shù)據(jù)運算遲緩的問題,造成數(shù)據(jù)監(jiān)測約束的效果。局部抽取則是在固有的約束框架下,完成高質(zhì)量的數(shù)據(jù)抽取,有效規(guī)避時間問題的局限,可以在多場景下運行。
數(shù)據(jù)清洗主要是針對現(xiàn)有的校園工功數(shù)據(jù)進行源頭化分析,以數(shù)據(jù)庫為基準,建設出具有基準化可循化的數(shù)據(jù)檢測機制,這樣即便是在數(shù)據(jù)系統(tǒng)檢測異常時,也可以通過清洗功能對冗余性的數(shù)據(jù)進行查證,其主要可以分為兩個階段。第一數(shù)據(jù)清洗與處理階段,第二數(shù)據(jù)侵襲補償階段,第三數(shù)據(jù)內(nèi)容糾錯階段,第四數(shù)據(jù)邏輯糾錯階段,第五數(shù)據(jù)清洗與驗證階段,通過多階段的整合處理保證數(shù)據(jù),在關聯(lián)任務獲取與執(zhí)行過程中,可以直接建設在數(shù)據(jù)核心機制之上,保證每一項數(shù)據(jù)檢測的精準性。
數(shù)據(jù)標準化階段是針對現(xiàn)有的大數(shù)據(jù)體系進行深度挖掘,然后以聚類分析方法,解析出學生在日常學習與工作中存在的各類行為信息,并將其關聯(lián)通過數(shù)據(jù)信息本身之間的差異性建設就具有基準比對屬性的各類文本功能。但是在具體應用過程中,由于文本屬性本身之間存在的關聯(lián)影響,將造成數(shù)據(jù)歸集處理過程中無法正確衡量出基本差異值之間存在的各類影響性。這就需要通過數(shù)字列段之間的影響關系,建設出具有標準化處理能力的基準核驗體系,保證每一類數(shù)據(jù)在闡述過程中可以精準地映射出數(shù)據(jù)誤差值以及各類異常信息。只有這樣,才可以真正實現(xiàn)標準化處理,為整個信息系統(tǒng)的運行提供數(shù)據(jù)支撐。
從整個數(shù)據(jù)運行框架來講,數(shù)據(jù)可視化模型的建設是全過程貫穿于整個數(shù)據(jù)型體系中的,由數(shù)據(jù)空間、數(shù)據(jù)開發(fā)、數(shù)據(jù)分析,構筑出基于數(shù)據(jù)可視化分析的主體平臺。比如數(shù)據(jù)空間是將整個數(shù)據(jù)集進行多維度空間信息采集,以數(shù)據(jù)算法進行開發(fā)預算,以數(shù)據(jù)分塊及模擬進行數(shù)據(jù)分析,這樣便可以從多個角度觀測出數(shù)據(jù)變化過程,從而達到實時化動態(tài)化的檢測。數(shù)據(jù)可視化則是通過整個數(shù)據(jù)變動范圍之后進行信息節(jié)點的映射,保證在實際開發(fā)過程中可以將未知信息組建成基于數(shù)據(jù)可控化的原則體系,進一步提高可視化功能,為相關系統(tǒng)服務體系的建設提供數(shù)據(jù)支持。
在建設校園大數(shù)據(jù)系統(tǒng)時,整個系統(tǒng)所設定的標準功能,是以學生為核心,將教育管理作為約束框架,對學生從學習狀況、生活狀況以及日常行為等進行分析,保證學生數(shù)據(jù)庫可以真實反映出學生日常生活中存在的一系列問題。對于此,在進行特征庫建設時,則必須構筑出以學生為單位的區(qū)塊鏈認證體系,例如,以年齡性別以及年級為主體,以學生的學習行為生活行為為數(shù)據(jù)輔助體,通過成績、消費狀況、作息習慣、飲食規(guī)律、學習習慣等,考量出學生在當前信息水平下所呈現(xiàn)的一些規(guī)則,這樣通過主體基準的建設,評定中學生在日常生活中所存在的各類數(shù)據(jù)行為,將作為指標進行統(tǒng)一化核定,通過數(shù)據(jù)標準處理,提高整體數(shù)據(jù)運行質(zhì)量(系統(tǒng)業(yè)務處理流程如圖1所示)。
圖1 系統(tǒng)業(yè)務流程
在對學生數(shù)據(jù)特征庫建設時,需要按照數(shù)據(jù)羅列算法以及經(jīng)典聚類算法,進行數(shù)據(jù)挖掘與分析,保證每一個數(shù)據(jù)提升思路以及聚類思路,可以通過層次化、密度算法構筑出可視化模型體系。這樣一來,可以在整個網(wǎng)絡系統(tǒng)中,將不同數(shù)據(jù)節(jié)點之間的維度信息有效關聯(lián)到一起,真正實現(xiàn)以初始聚類點為主導的聚類算法,進而確保數(shù)據(jù)在運算過程中,可以通過不同點之間的有效聚集,實現(xiàn)對中心點與邊緣點之間的有效對接。當此類算法映射到整個校園管理框架時,則是通過對學生主體信息與邊緣信息之間的有效對接,構設出可能性與綜合性的網(wǎng)絡數(shù)據(jù)框架,將核心行為與數(shù)據(jù)列表行為進行比對,查證出學生在日常工作與生活過程中存在的一系列數(shù)據(jù)影響值。最后,算法在確認過程中,通過數(shù)據(jù)可視化模型對整個框架進行分析,以標準的處理方式,查證出數(shù)據(jù)在不同節(jié)點下存在的偏離屬性,進而在整個高密度的數(shù)據(jù)系統(tǒng)中精準挖掘出價值類的信息,提高整體的運算效率。
校園大數(shù)據(jù)可視化的實現(xiàn)是以數(shù)據(jù)信息為基礎,將學生作為數(shù)據(jù)源頭,進行可追溯式的數(shù)據(jù)表達,真實反映出學生在校園生活內(nèi)的各類狀況。從實際業(yè)務處理角度來講,學生個人信息的建設是以整體數(shù)據(jù)歸類為基準,構筑出多業(yè)務綜合處理的平臺框架,這樣在系統(tǒng)平臺與學生個人信息之間,可以建立出基于數(shù)據(jù)清洗數(shù)據(jù)挖掘的系統(tǒng)體系,真正實現(xiàn)數(shù)據(jù)分布式的轉移與聚類,以提高學生用戶與整個系統(tǒng)之間的交互功能。
從整體結構來講,校園大數(shù)據(jù)可視化分析可以分為4個方向。
(1)數(shù)據(jù)感知方向。其是針對校園所呈現(xiàn)出的公共數(shù)據(jù)進行主體分析與清洗,保證每一類數(shù)據(jù)所闡述出的行為信息具有真實性與可靠性,進而為后續(xù)系統(tǒng)數(shù)據(jù)處理提供核心支撐。
(2)數(shù)據(jù)分布式處理方向。此類處理功能主要是由感知層所提供的數(shù)據(jù)進行深度挖掘,然后利用數(shù)據(jù)庫內(nèi)的基礎信息進行比對,分析出數(shù)據(jù)存在的潛在價值并予以存儲。
(3)數(shù)據(jù)交互方向。主要是針對數(shù)據(jù)交接及運算模式進行存儲及分析,保證語言語句在整個文本處理過程中可以實現(xiàn)數(shù)據(jù)轉換,進一步提高整體處理質(zhì)量。
(4)數(shù)據(jù)可視化方面則是針對數(shù)據(jù)庫本身所具備的法律框架進行數(shù)據(jù)溯源,然后以圖表的形式進行數(shù)據(jù)呈現(xiàn),這樣通過數(shù)據(jù)可視化的分析,可以對整個信息所產(chǎn)生的動態(tài)化、實時化屬性進行映射。
從整體框架來講,數(shù)據(jù)可視化、數(shù)據(jù)交互、數(shù)據(jù)處理以及數(shù)據(jù)獲取之間存在一定的關聯(lián)特征,即彼此之間所具備的數(shù)據(jù)對接層呈現(xiàn)出交互屬性。例如,在數(shù)據(jù)可視化方面可以建設出一庫一表的大屏顯示界面,而在數(shù)據(jù)交互中則是以用戶交換學生主體特征進行分析,在數(shù)據(jù)處理中則是通過計算服務、存儲服務,進一步將整個數(shù)據(jù)獲取過程進行統(tǒng)一化表達,提高數(shù)據(jù)檢測效率。
在對校園大數(shù)據(jù)進行整合與結果分析時,其所涵蓋的服務屬性及教育屬性是全過程貫徹于學生管理過程的。這就需要在數(shù)據(jù)整合過程中,通過可視化功能將數(shù)據(jù)的模型進行整體涵蓋,結合數(shù)據(jù)侵襲數(shù)據(jù)挖掘功能,建設基于時間點與空間點的數(shù)據(jù)的挖掘機制。然后通過畫像庫聚類處理學生在日常生活與學習過程中存在的各類行為信息,進而真實反映出學生當前的各類狀況。從校園信息化實現(xiàn)過程來講,整個數(shù)據(jù)體系的建設是根植于學生教育管理之上,利用教學管理存在的定向屬性,將整個時間與空間進行關聯(lián),打造出更為完整的數(shù)據(jù)聯(lián)動體系,進一步提高可視化分析能力,為各項教育管理工作的開展提供數(shù)據(jù)支撐。
綜上所述,大數(shù)據(jù)時代的到來,對校園管理提出了更高的需求,依托于數(shù)據(jù)信息高效率、多維度的處理,保證相關數(shù)據(jù)信息可正確闡述出學生的學習及各類行為信息。為此,在后續(xù)發(fā)展過程中,必須加強對大數(shù)據(jù)技術的分析,保證每一類技術的實現(xiàn)可作用于信息管理系統(tǒng)中,為教育工作的開展提供數(shù)據(jù)服務。
[1]鄭菲,陳曉鳳,齊世玲,等.校園疫情防控可視化平臺設計與實現(xiàn)[J].電腦知識與技術,2021,17(20):69-71+77.
[2]李軍.基于疫情常態(tài)化的校園健康大數(shù)據(jù)分析與應用[J].電腦編程技巧與維護,2021(03):100-102.
[3]李強,李木昌.基于大數(shù)據(jù)挖掘的大學生上網(wǎng)行為分析與預警干預體系構建與研究[J].軟件,2021,42(02):18-20.
[4]陶紅麗,張軍,楊忠明.基于大數(shù)據(jù)的高校學生行為分析可視化系統(tǒng)的設計與實現(xiàn)[J].創(chuàng)新創(chuàng)業(yè)理論研究與實踐,2021,4(03):163-166.