張紹麗
〔摘 要〕教育大數(shù)據(jù)作為一種重要的資源,只有通過資源共享,才能達到最大化的利用。本文從教育大數(shù)據(jù)與資源共享關系出發(fā),構建教育大數(shù)據(jù)信息平臺,并對平臺的構建機理、框架結構和功能效用進行詳細闡述。最后,從開放獲取、分類存儲、整合共享、技術支撐和管理協(xié)同五個方面論述平臺的運行機制,旨在推動大數(shù)據(jù)背景下的教育大數(shù)據(jù)信息資源的開放與共享。
〔關鍵詞〕教育大數(shù)據(jù);資源共享;平臺構建;運行機制
DOI:10.3969/j.issn.1008-0821.2017.12.016
〔中圖分類號〕G250.76 〔文獻標識碼〕A 〔文章編號〕1008-0821(2017)12-0090-06
〔Abstract〕Being an important resource,only through resource sharing,could education big data get maximize utilization.This article embarked from the education big data and resource sharing relationship,builded the college education big data resource sharing platform,and expounded the construction mechanism,frame structure and functional utility of the platform in detail.Finally,from the open access,classification,storage,integration of sharing,technical support and management synergy five aspects discussed the operating mechanism of the platform,in order to promote the openness and sharing of education data resources in the context of big data.
〔Key words〕education big data;resource sharing;platform construction;operation mechanism
大數(shù)據(jù)時代已經到來,大數(shù)據(jù)正在成為推動教育系統(tǒng)顛覆性創(chuàng)新與變革的科學力量[1]。高校作為人才的聚集地和科學創(chuàng)新的發(fā)起地,擁有豐富的教育、教學、科研資源,而這些資源一直處于不斷地變化、更新和積累中,這些靜態(tài)和動態(tài)資源以及外界與之相關信息匯集在一起,勢必形成規(guī)模龐大且海量的教育大數(shù)據(jù)。2013年3月,國家發(fā)布了《教育信息化十年發(fā)展規(guī)劃(2011-2020)》將“優(yōu)質數(shù)字教育資源建設與共享行動”列為“中國數(shù)字教育2020行動計劃”之一[2],這說明教育資源共享已經成為社會關注的焦點。教育大數(shù)據(jù)作為一種特殊的資源,只有實現(xiàn)充分共享,才能達到最大化利用。因此,本文嘗試構建教育大數(shù)據(jù)信息平臺,并探討建立相應的運行機制確保其良性運行,以期豐富教育大數(shù)據(jù)共享的理論,支持和促進高校教育教學的創(chuàng)新與發(fā)展。
1 教育大數(shù)據(jù)與資源共享
1.1 教育大數(shù)據(jù)內涵
大數(shù)據(jù)是指大的、超過傳統(tǒng)數(shù)據(jù)庫系統(tǒng)處理能力的數(shù)據(jù)。它還包括創(chuàng)新的技術,以捕捉、存儲、分發(fā)、分析和管理不同結構的數(shù)據(jù)集[3]。通常,大數(shù)據(jù)的核心特征常被概括為“4V”,即數(shù)據(jù)量大(Volume)、 輸入和處理速度快(Velocity)、 數(shù)據(jù)多樣(Variety)和真實性(Veracity)[4]。高校的教育、教學、科研、管理等各種教育活動都會產生大量的數(shù)據(jù),我們稱之為教育大數(shù)據(jù)。教育領域大數(shù)據(jù)資源的內涵及構成是很廣泛的,一般來講,教育大數(shù)據(jù)特指整個教育活動過程中產生的以及根據(jù)教育需要采集到的、一切用于教育發(fā)展并可創(chuàng)造巨大潛在價值的數(shù)據(jù)集合[5]。
1.2 教育大數(shù)據(jù)構成
教育大數(shù)據(jù)分為與教育活動相關的學生學習行為大數(shù)據(jù)、教師教學行為大數(shù)據(jù)、學校教育資源大數(shù)據(jù)和政府教育管理大數(shù)據(jù)。1)學生學習行為大數(shù)據(jù),是指學生個體層面與學習相關的大數(shù)據(jù),包括學生基礎信息、學生思想、心理及健康狀態(tài)、學習行為記錄、學習興趣與動機、學習違規(guī)以及與學習相關的其他信息,如學生住宿起居、飲食、衛(wèi)生等。2)教師教學行為大數(shù)據(jù),是指教師層面教學相關的的大數(shù)據(jù),包括教職工基礎信息、教師教學行為記錄、教學方式方法、課件制作、作業(yè)布置、課程考核以及受歡迎程度等方面。3)學校教育資源大數(shù)據(jù),是指學校教育管理過程產生的大數(shù)據(jù),既包括教育建設管理過程生成的精品課、PPT課件、教學視頻、圖片、試題試卷等各種形式的教學資源,也包括大型科學儀器、實驗場地、辦公工具、科研成果、專利以及論文發(fā)表等各類科研資源,另外,還包括學生管理、教務管理、課堂管理、科研管理等教育管理資源。4)政府教育管理大數(shù)據(jù),是指政府層面有關教育管理的大數(shù)據(jù),包括教育政策、教育行政管理及相關統(tǒng)計數(shù)據(jù)等,如教育部在2012年發(fā)布的7個教育管理信息系列標準中提到的所有數(shù)據(jù)以及出臺的各項教育政策等。這些教育大數(shù)據(jù)資源將對促進教育發(fā)展、優(yōu)化教育資源配置、提升教育質量及水平起到極為重要的作用。
1.3 教育大數(shù)據(jù)信息共享主客體及銜接
數(shù)據(jù)也是一種資源,并且是極為重要的資源。從資源依賴理論來講,沒有任何一個組織是自給自足的,所有組織都必須為了生存而與其環(huán)境進行交換[6]。其實,教育大數(shù)據(jù)信息共享不是一個靜止的概念,而是一個動態(tài)的過程,涉及共享主體、共享客體及共享載體3個方面。其中,教育大數(shù)據(jù)信息共享主體是指對于高等學校的教育大數(shù)據(jù)信息進行開放共享的主體,可以是教育團體,如教育團隊、科研團隊以及創(chuàng)新團隊等,也可以是作為個體的人,如學生、教師等,還可以是組織機構,如高校及內部各職能部門、企業(yè)、政府機關等;教育大數(shù)據(jù)信息共享客體主要是指由學生學習行為大數(shù)據(jù)、教師教學行為大數(shù)據(jù)、學校教育資源大數(shù)據(jù)和政府教育管理大數(shù)據(jù)共同構成的資源集合。共享主體要想充分共享客體資源,必須借助一定形式的、可操作的、實踐性的載體才能最終實現(xiàn),這個載體稱之為教育大數(shù)據(jù)信息平臺,而教育大數(shù)據(jù)信息平臺在滿足共享主體的資源需求、促進共享客體的最大化利用等方面將發(fā)揮著關鍵作用。endprint
2 教育大數(shù)據(jù)信息平臺構建機理及效用
2.1 教育大數(shù)據(jù)信息平臺構建機理
2.1.1 平臺內涵
教育大數(shù)據(jù)信息平臺是一個跨地域、跨媒介的大系統(tǒng)體系,它針對教育大數(shù)據(jù)共享服務中涉及的基礎設施服務需求,能夠提供教育大數(shù)據(jù)的接入、存儲、管理、共享及服務所需的基礎支撐環(huán)境,并且為教育大數(shù)據(jù)共享的開發(fā)、測試、數(shù)據(jù)存儲、托管、運維與調優(yōu)提供支撐服務,從而有效地提高教育資源利用率。教育大數(shù)據(jù)信息平臺的功能主要有兩種:一是資源聚合,即打破部門壁壘、解決信息不暢,實現(xiàn)學生行為大數(shù)據(jù)、教師教學大數(shù)據(jù)、學校教育大數(shù)據(jù)和政府管理大數(shù)據(jù)的集成整合;二是共享服務,即通過標準化的數(shù)據(jù)處理和規(guī)范化的流程再造,為廣大教育大數(shù)據(jù)共享主體提供服務。
2.1.2 框架結構
教育大數(shù)據(jù)信息平臺是通過“三個支撐”架構起的平臺體系,即以計算機、網(wǎng)路軟硬件為技術支撐,以資源整合和數(shù)據(jù)處理為管理支撐,以應用服務和用戶服務為服務支撐,形成上、中、下三層既有區(qū)別又聯(lián)系緊密的功能架構。如圖1所示。
上層包括兩個方面:1)應用服務支撐層。應用服務支撐層其功能主要涉及教育大數(shù)據(jù)信息整合和教育大數(shù)據(jù)信息分析與挖掘兩個方面,其中教育大數(shù)據(jù)信息整合包括教育大數(shù)據(jù)信息融合和教育大數(shù)據(jù)共享信息檢索兩項服務;教育大數(shù)據(jù)信息分析與挖掘包括教育大數(shù)據(jù)信息分類篩選和教育大數(shù)據(jù)信息挖掘利用等。以上兩大系統(tǒng)相互融合形成對教育大數(shù)據(jù)共享應用服務的有力支撐。2)用戶服務層。具體包括以下方面:一是將教育大數(shù)據(jù)資源向全社會開放,并提供教育大數(shù)據(jù)資源信息查詢?yōu)g覽、信息發(fā)布及資源申請下載、云計算等服務;二是提供成果轉讓、產學研結合等教育成果的應用與推廣服務;三是開展教育大數(shù)據(jù)資源平臺租賃、校辦企業(yè)成長規(guī)劃建設、產業(yè)創(chuàng)新推廣等產業(yè)服務;四是對教育創(chuàng)新的全景展示、預測評估以及規(guī)劃建設等業(yè)務。該服務層主要是為大學、教育院所、網(wǎng)絡大眾、企業(yè)、政府等提供全方位的教育大數(shù)據(jù)資源共享服務。
中間層包括兩個方面:1)數(shù)據(jù)資源層。通過對各種積累數(shù)據(jù)、最近數(shù)據(jù)以及互聯(lián)網(wǎng)采集數(shù)據(jù)進行匯集、整合、重構,按照統(tǒng)一的信息標準、技術標準及管理標準進行規(guī)范,采用動態(tài)更新模式,形成學生學習行為大數(shù)據(jù)、教師教學行為大數(shù)據(jù)、學校教育資源大數(shù)據(jù)和政府教育管理大數(shù)據(jù)等教育大數(shù)據(jù)資源池。在教育大數(shù)據(jù)資源池中,按標準規(guī)范對數(shù)據(jù)進行清洗、質量評估和管理,并充分運用信息、網(wǎng)絡、大數(shù)據(jù)、云計算等現(xiàn)代技術,對教育大數(shù)據(jù)資源進行戰(zhàn)略重組和系統(tǒng)優(yōu)化,促進教育大數(shù)據(jù)資源的高效配置和綜合利用。2)基礎平臺層。主要包括教育大數(shù)據(jù)元數(shù)據(jù)管理平臺、教育資源管理與搜索平臺、教育資源融合與挖掘平臺、教育資源共享網(wǎng)絡服務平臺、教育資源質量監(jiān)控平臺等?;A平臺層主要為教育大數(shù)據(jù)資源訪問以及應用服務功能的實現(xiàn)提供基礎支撐。
下層包括兩個方面:1)硬件基礎設施層。硬件層分為網(wǎng)絡集成層及智能終端層兩部分。其中,網(wǎng)絡集成層指電信網(wǎng)絡、有線電視網(wǎng)絡和計算機網(wǎng)絡的教育資源相互滲透、互相兼容,并逐步整合成為全覆蓋、統(tǒng)一的資源信息共享網(wǎng)絡,其中計算機互聯(lián)網(wǎng)是其核心部分。其技術功能趨于一致,業(yè)務范圍趨于相同,網(wǎng)絡互聯(lián)互通、資源開發(fā)共享,教育協(xié)同創(chuàng)新,能為教育資源共享提供多種服務。智能終端層是指具有多媒體功能的智能設備,這些設備支持音頻、視頻、數(shù)據(jù)等功能,如可視電話、會議終端、內置多媒體功能的PC、PDA等,一般由固定終端(計算機)和移動終端(手機、筆記本電腦等)組成。硬件基礎設施層處于教育大數(shù)據(jù)信息平臺整體框架的最底層,可為平臺高效運行提供強有力的支撐。2)系統(tǒng)軟件層。教育大數(shù)據(jù)信息平臺的系統(tǒng)軟件層由IaaS、PaaS和SaaS架構整合而成,即Infrastructure(基礎設施)-as-a- Service,Platform(平臺)-as-a-Service,Software(軟件)-as-a-Service,主要向教育用戶提供3種模式服務[7]。其中IaaS提供的服務是對所有設施的利用,包括處理、存儲、網(wǎng)絡和其它基本的計算資源,用戶能夠部署和運行任意軟件,包括操作系統(tǒng)和應用程序,并且能控制操作系統(tǒng)的選擇、儲存空間、部署的應用,也有可能獲得有限制的網(wǎng)絡組件(防火墻,負載均衡器等)的控制;PaaS提供給教育用戶的服務是把客戶采用的開發(fā)語言和工具(Java,python,.Net等)、開發(fā)的或收購的應用程序部署到供應商的云計算基礎設施上去??蛻裟芸刂撇渴鸬膽贸绦?,也可能控制運行應用程序的托管環(huán)境配置;SaaS提供給用戶的服務是運營商運行在云計算基礎設施上的應用程序,用戶可以在各種設備上通過搜索客戶端界面訪問,如瀏覽器。消費者不需要管理或控制任何云計算基礎設施,包括網(wǎng)絡、服務器、操作系統(tǒng)、存儲等。因此,根據(jù)教育大數(shù)據(jù)的需求,向上層應用提供支持分布式文件系統(tǒng)、并行文件系統(tǒng)、分布式數(shù)據(jù)庫融合的大數(shù)據(jù)存儲服務,支持分布式計算、并行計算、流式計算融合的大數(shù)據(jù)計算服務,以及適于多樣化異構科技應用的統(tǒng)一程序接口及云服務全生命周期管理等服務,從而更好地服務于政府、高校、科研院所、企業(yè)以及廣大用戶。
2.2 教育大數(shù)據(jù)信息平臺功能效用
2.2.1 提高教育資源使用效率
教育大數(shù)據(jù)信息平臺通過信息開放共享,能有效避免人力、物力的重復投入,減少教育資源的浪費。與此同時,它也將促進教育管理工作模式發(fā)生改變,因為教育管理者可依托共享平臺提供的資訊和信息,最大限度地減少重復研究、無效研究,可將更多時間和精力投入到對專業(yè)水平要求更高的研究中去,從而減少研發(fā)操作成本。另一方面,對于高校或個人來講,大型科研儀器設備、實驗室等可通過教育大數(shù)據(jù)信息共享平臺來實現(xiàn)共享,這將減輕購置科技設備等帶來的運營困難和資金壓力。因此,教育大數(shù)據(jù)信息共享平臺通過資源開放和共享,可以實現(xiàn)國家科技投資的節(jié)約,提高教育大數(shù)據(jù)的利用效率。
2.2.2 減少教育資源流失endprint
以往教育數(shù)據(jù)積累和維護的規(guī)范性和連續(xù)性都欠佳,基本處于松散化狀態(tài),這很容易導致教育數(shù)據(jù)的丟失,進而產生難以估量的損失。教育大數(shù)據(jù)信息平臺建立后,將眾多的教育大數(shù)據(jù)匯集在一起,形成有價值的資源,統(tǒng)一存儲、管理和維護,因此,教育大數(shù)據(jù)信息平臺具有教育資源的積累和維護功能,有助于防止教育資源流失。
2.2.3 促進教育大數(shù)據(jù)資源共享
教育大數(shù)據(jù)信息平臺既是一種平臺,又是一種載體,可以為全社會的教育及科技創(chuàng)新活動提供普遍的公共服務。同時,教育大數(shù)據(jù)信息平臺能有效解決教育活動中的信息不對稱、資源對接難以及資源分配不公等問題。大型科研儀器、場地、實驗室等資源共享均可通過教育大數(shù)據(jù)信息平臺來實現(xiàn),從而提高場地設備使用率,減少教育資源的浪費。
2.2.4 加強教育交流與合作
教育大數(shù)據(jù)信息平臺不僅能提高教育資源信息存儲能力,而且將會促進教育交流與合作。教育大數(shù)據(jù)信息平臺利用最先進的網(wǎng)絡化、數(shù)字化和多媒體信息技術,建立共享服務平臺,將最新的教育教學成果和技術創(chuàng)新成果進行適時的展示和傳播。學生、教師、管理等各類人員都可及時地通過教育大數(shù)據(jù)信息平臺了解前沿信息、分享教育大數(shù)據(jù)知識、掌握研究最新進展,實現(xiàn)教育交流與合作。
2.2.5 發(fā)揮教育資源潛在價值
教育大數(shù)據(jù)作為重要的資源類型具有極強的使用價值。教育大數(shù)據(jù)信息平臺的建立將有助于教育大數(shù)據(jù)所蘊含的科學價值、社會價值和經濟價值充分發(fā)揮。此外,依托教育大數(shù)據(jù)信息平臺來促進資源共享,強化協(xié)同創(chuàng)新,可產生出新的科研成果,而新科研成果又形成了新的資源,從這一點來講,教育大數(shù)據(jù)資源通過共享利用能夠產生增值效應。
3 教育大數(shù)據(jù)信息平臺運行機制體系
教育大數(shù)據(jù)信息平臺運行機制體系是一個復雜的系統(tǒng),教育大數(shù)據(jù)共享主體只有通過共享平臺才能使客體發(fā)生效用,而這個過程的實現(xiàn)要依賴一定的運行機制來保障。因此,我們有必要對教育大數(shù)據(jù)信息平臺的運行機制體系進行分解重建,并將其解構為5個相互聯(lián)系的子系統(tǒng),即開放獲取機制、分類存儲機制、整合共享機制、技術支撐機制和管理協(xié)同機制,維持整個平臺體系的良性運轉。見圖2。
圖2 高校教育大數(shù)據(jù)信息平臺運行機制體系圖
3.1 開放獲取機制
對于教育大數(shù)據(jù)信息共享來講,開放是獲取的前提,獲取是開放的保障,共享才是最終目的。因此,最重要的一點就是教育大數(shù)據(jù)信息資源首先要開放,才能為而后的獲取和存儲奠定基礎。
3.1.1 有限開放與多種形式開放相結合
一方面,有限開放。高校大型科研儀器、實驗場地等資源大多是國家出資建設,從法理上講有其公共性,不能個人據(jù)為己有。因此,不僅科研儀器、實驗場地等公共資源應該放開,而且依托這些公共資源產生出的教育數(shù)據(jù)、科研成果等也應開放。同時,有些教育大數(shù)據(jù)成果、科研數(shù)據(jù)涉及國家安全、商業(yè)秘密、個人隱私,這樣的教育大數(shù)據(jù)資源是不便公開的,故教育大數(shù)據(jù)資源開放應是“有限”的,而不是“無限”的。
另一方面,采用多種形式開放。要想達到開放效果,需從以下方面下工夫:一是要強制開放。針對可開放和不可開放的教育大數(shù)據(jù)范圍,用法律法規(guī)形式進行明確界定,以保證開放的強制性和延續(xù)性;二是鼓勵開放。在教育大數(shù)據(jù)評價機制中引入教育大數(shù)據(jù)開放因子,將教育大數(shù)據(jù)成果開放數(shù)量、影響力等情況與課題申報、項目評審、職稱評定等掛鉤。又如將科研設備開放率、共享使用率作為儀器、設備再購置的重要參考因素等;三是有序開放。按照產生年代、產生主體以及產生方式等分門別類,采取分批次、分類別、分步驟的開放形式;四是網(wǎng)絡開放。在注重質量和使用價值的前提下,將科研數(shù)據(jù)、成果等教育大數(shù)據(jù)資源通過網(wǎng)絡形式進行開放,保證機器可讀,以增強數(shù)據(jù)的公開性、透明性。
3.1.2 明確獲取范圍、內容及手段
教育大數(shù)據(jù)共享的實現(xiàn)首先依賴于對來源廣泛的教育數(shù)據(jù)的獲取[8]。對教育大數(shù)據(jù)的獲取,可從以下三方面入手:一是明確教育大數(shù)據(jù)獲取范圍和內容。高校在教育活動過程中會產生大量的數(shù)據(jù),但受教育大數(shù)據(jù)共享主體需求、數(shù)據(jù)本身以及獲取時間、技術手段所限,并不是所有的教育大數(shù)據(jù)都會被獲取。因此,需要根據(jù)共享主體的需求、目的、用途等,對教育大數(shù)據(jù)獲取的范圍進行明確界定,以做到有的放矢;二是選擇合理的獲取形式及手段。一般來說,教育大數(shù)據(jù)獲取形式主要分為強制獲取和自愿獲取。對于政府或高校投資購置的大型儀器、實驗室、科技文獻、圖書等公共教育資源,可進行強制獲取,而對于本人付出腦力勞動以及時間、管理成本的科研成果、專利、科學數(shù)據(jù)、實驗數(shù)據(jù)等,需本著自愿原則進行獲??;三是運用大數(shù)據(jù)挖掘分析技術。通過對大規(guī)模并行處理(MPP)數(shù)據(jù)庫、數(shù)據(jù)挖掘電網(wǎng)、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫、云計算平臺、可擴展的存儲系統(tǒng)等大數(shù)據(jù)挖掘分析技術的綜合運用,可極大提高教育大數(shù)據(jù)挖掘與數(shù)據(jù)分析的速度,取得良好效果。
3.2 分類存儲機制
3.2.1 實施教育大數(shù)據(jù)分門別類
教育大數(shù)據(jù)的巨大價值主要表現(xiàn)在兩個方面:一是教育大數(shù)據(jù)本身隱含的價值,盡管收集到的數(shù)據(jù)信息是凌亂的,但其中卻可能隱含著有價值或有規(guī)律性的數(shù)據(jù);二是通過運用大數(shù)據(jù)分析處理技術,可從海量的數(shù)據(jù)中抽離有價值的東西,甚至歸納出有規(guī)律性的東西。因此,可按照價值性(Value,英文簡寫V)對教育大數(shù)據(jù)進行分類,具體可分為兩大類:一是有價值數(shù)據(jù),含關鍵價值數(shù)據(jù)(主要用于關鍵領域或進行關鍵決策)和非關鍵價值數(shù)據(jù)(主要用在非關鍵領域或進行非關鍵決策);二是無價值數(shù)據(jù),這類數(shù)據(jù)不重要,對教育決策不起什么作用,甚至可能起反作用。因此,針對現(xiàn)實中教育大數(shù)據(jù)質量的參差不齊現(xiàn)象,在數(shù)據(jù)采集時,應設置必要的信息采集規(guī)則和機制[9],并運用信息過濾技術,去粗取精、去偽存真,將符合采集規(guī)則和要求的數(shù)據(jù)收集到平臺數(shù)據(jù)庫中,然后引入更為專業(yè)的數(shù)據(jù)分析技術,將采集到的分散無序的教育大數(shù)據(jù)進行組織、加工與分析,使其轉換成符合數(shù)據(jù)庫文件格式的且有規(guī)律的有序數(shù)據(jù),最后對于有價值的數(shù)據(jù),按照一定的標準格式進行存儲,供開放共享和利用,對無價值的數(shù)據(jù)進行淘汰。這樣,通過教育大數(shù)據(jù)信息進行收集分析、分類處理以及價值提取,為日后教育大數(shù)據(jù)充分利用奠定了良好基礎。endprint
3.2.2 做好教育大數(shù)據(jù)存儲保值
首先,建立起教育大數(shù)據(jù)存儲的標準化體系。具體包含4個方面:一是通過標準規(guī)范化數(shù)據(jù)表示、元數(shù)據(jù)類型和操作方式,為數(shù)據(jù)的統(tǒng)一存儲提供基礎;二是制定關于分布式文件系統(tǒng)、數(shù)據(jù)倉庫的相關標準,解決多類型數(shù)據(jù)的可靠存儲問題[10];三是建立Hadoop開源分布式計算平臺,平臺由標準化硬件(服務器和內部服務器存儲)組成,能夠并行處理大數(shù)據(jù)請求。在存儲方面,該系統(tǒng)具有高容錯性,不僅提供了適合那些擁有大數(shù)據(jù)集的應用平臺,而且還提供了高吞吐率的數(shù)據(jù)讀寫[11];四是制定教育大數(shù)據(jù)分析技術要求、分析過程模型、可視化工具要求等標準,提高大數(shù)據(jù)處理的質量。
其次,選擇合適的大數(shù)據(jù)存儲技術方法。針對不同類型的教育大數(shù)據(jù),有3種存儲技術可以選擇:一是存儲海量非結構化數(shù)據(jù)的分布式文件系統(tǒng),有代表性的是 Google 的 GFS 和開源的 HDFS (Hadoop Distributed File System);二是存儲海量無模式的半結構化數(shù)據(jù)的NoSQL數(shù)據(jù)庫,能夠極大的適應云計算的需求;三是存儲海量結構化數(shù)據(jù)的分布式并行數(shù)據(jù)庫系統(tǒng),Greenplum是基于PostgreSQL開發(fā)的一款海量并行處理架構的、無共享的分布式并行數(shù)據(jù)庫系統(tǒng),采用Master/Slave架構,Master只存儲元數(shù)據(jù),真正的用戶數(shù)據(jù)被散列存儲在多臺Slave服務器上,并且所有的數(shù)據(jù)都在其他Slave節(jié)點上存有副本,從而提高了系統(tǒng)可用性[12]。
最后,注重云計算在大數(shù)據(jù)存儲中應用。云計算的出現(xiàn)為大數(shù)據(jù)存儲平臺的形成奠定了基礎,也為數(shù)據(jù)存儲以及計算提供了強大的載體??梢哉f,大數(shù)據(jù)與云計算是一個硬幣的兩個面,二者的有效結合將改變傳統(tǒng)數(shù)據(jù)存儲模式。由于云存儲標準與大數(shù)據(jù)的存儲標準需求在架構模型、數(shù)據(jù)模型、接口協(xié)議、操作模式以及服務使用方式上十分類似,所以,大數(shù)據(jù)存儲標準可以在現(xiàn)有云存儲標準上進行擴展,以滿足教育大數(shù)據(jù)的存儲需求。
3.3 整合共享機制
3.3.1 建立互惠互利的利益共享關系
教育大數(shù)據(jù)資源共享是一個信息使用過程,資源開放主體是信息的傳遞者,而資源共享主體是信息的接受者,兩者在資源共享過程中互惠互利的利益共享關系,是教育大數(shù)據(jù)進行大范圍共享的前提和基礎。教育大數(shù)據(jù)信息資源共享是資源擁有主體彼此之間的利益共享,因此,建立起互惠互利的利益共享關系至關重要。
3.3.2 推行平臺建設的標準化和規(guī)范化
標準化既是教育大數(shù)據(jù)信息平臺建設的關鍵,也是教育大數(shù)據(jù)資源共享得以實現(xiàn)的重要保障。首先要確定教育大數(shù)據(jù)資源共享的范圍,確定哪些教育大數(shù)據(jù)資源可以錄入到教育大數(shù)據(jù)信息平臺;其次,摸清共享資源的基本情況,形成第一手資料;再次,制定教育大數(shù)據(jù)資源信息的標準化規(guī)范,把“碎片化”、“零散化”的教育大數(shù)據(jù)資源進行分門別類,將符合要求和規(guī)范的教育大數(shù)據(jù)資源統(tǒng)一納入共享平臺;最后,對涉及教育大數(shù)據(jù)信息平臺的政策體制、組織結構、經費來源、隸屬關系等建設事項,通過法律法規(guī)形式進行規(guī)范和界定。
3.3.3 采用信息資源帶動實體資源路徑
在教育大數(shù)據(jù)信息平臺運行過程中,涉及到的各類資源勢必很多,并且這些資源基本上是處于分散狀態(tài),共享的優(yōu)先次序將對共享效果產生重要影響??尚械穆窂綉撌窍葘W校中的教育信息資源進行共享,然后帶動教育實物資源共享,從而實現(xiàn)教育大數(shù)據(jù)資源的廣泛共享。因此,教育大數(shù)據(jù)信息共享可采用信息資源帶動實體資源的形式來實現(xiàn)。
3.3.4 創(chuàng)設安全良好的大數(shù)據(jù)資源共享環(huán)境
隨著人們對教育大數(shù)據(jù)需求的不斷增加以及大數(shù)據(jù)本身數(shù)據(jù)量的不斷疊加,教育大數(shù)據(jù)資源將會是海量的。但是,海量的數(shù)據(jù)極有可能被計算機病毒、黑客攻擊,威脅到數(shù)據(jù)安全。因此,創(chuàng)設安全良好的教育大數(shù)據(jù)資源共享環(huán)境就顯得尤為必要。一方面,應采用先進的數(shù)據(jù)分析處理技術,對所采集的教育大數(shù)據(jù)進行價值提取,篩選出本身有價值且更安全的數(shù)據(jù);另一方面,加大信息安全技術的應用,如防火墻技術、加密技術、跟蹤檢測技術、病毒防范技術等。同時,通過用戶注冊認證、權限設置、實名制等形式,來對用戶進行有效識別和過濾,保證教育大數(shù)據(jù)的安全使用。另外,還應不斷更新數(shù)據(jù)分析處理技術,研發(fā)更加便捷和人性化的用戶操作界面,以提升教育大數(shù)據(jù)的存儲效率及用戶體驗。
3.4 技術支撐機制
3.4.1 設計開發(fā)與平臺相匹配的軟件系統(tǒng)
第一,資源開放軟件集。主要包括資源開放類軟件、資源發(fā)現(xiàn)類軟件、資源獲取類軟件,依托這些軟件實現(xiàn)教育資源的信息發(fā)布、智能檢索和資源下載服務,架起教育資源需求與供給雙方橋梁;第二,搜索引擎軟件集。采用新型語義分析技術,使資源和資訊搜索結果關聯(lián)豐富,實現(xiàn)從檢索引擎走向推薦引擎,增強對用戶的吸引力;第三,共享資源軟件集。建立數(shù)據(jù)庫系統(tǒng),如科學數(shù)據(jù)庫,大型設備、高精儀器、重點實驗室數(shù)據(jù)庫,以及財源、智源數(shù)據(jù)庫,這是教育資源共享的前提,同時開發(fā)元數(shù)據(jù)管理軟件、分析軟件,用來支持如指示存儲位置、歷史數(shù)據(jù)、資源查找、文件記錄等功能,實現(xiàn)教育資源的充分共享;第四,網(wǎng)絡社交軟件。搭建交流互動平臺,建設交互對象庫,負責各類輸入/輸出設備的管理,實現(xiàn)用戶動作到其內部形式的轉換,表現(xiàn)部件負責翻譯人機意圖,解析交互任務,對話管理部件對來自用戶多個交互通道的信息進行整合,理解用戶交互意圖[13]。這樣充分體現(xiàn)反饋、在線咨詢、資源評價等互動功能,促進用戶需求與教育資源供給的對接。
3.4.2 實現(xiàn)教育大數(shù)據(jù)資源與互聯(lián)網(wǎng)信息技術對接
計算機和網(wǎng)絡信息技術是教育大數(shù)據(jù)資源共享得以實現(xiàn)的重要載體和手段,這對整合碎片化的各類教育資源、方便多元化的用戶使用以及彼此之間的共享協(xié)作起到橋梁和紐帶作用。教育資源要實現(xiàn)與互聯(lián)網(wǎng)信息技術的對接,一方面需要對已摸底記錄的學術資源進行程序編碼,以符合網(wǎng)絡信息傳播特點;二是加強信息庫本身的改進升級,使其囊括所有可能開放共享的教育大數(shù)據(jù)資源;三是利用大數(shù)據(jù)的挖掘、分析技術、云計算等,對海量的教育大數(shù)據(jù)資源進行快速遴選、整合和利用,促進學科交叉和數(shù)據(jù)集成。教育大數(shù)據(jù)資源共享與互聯(lián)網(wǎng)信息技術的對接,在不遠的將來,有可能對教育創(chuàng)新產生巨大的推動作用,并極可能發(fā)現(xiàn)新的創(chuàng)新點。endprint
3.4.3 加速線上和線下教育大數(shù)據(jù)信息資源融合
線下的教育大數(shù)據(jù)資源整合,需要依托一定實體組織機構形式,如各種協(xié)同創(chuàng)新中心、聯(lián)合實驗室等,而線上網(wǎng)絡信息化是教育大數(shù)據(jù)資源共享發(fā)展的方向和落腳點。只有將線上、線下教育大數(shù)據(jù)資源進行有效整合,方能形成廣泛的教育資源共享。
3.4.4 加強大數(shù)據(jù)相關技術的研發(fā)與應用
隨著大數(shù)據(jù)的推進與發(fā)展,教育大數(shù)據(jù)處理與分析已經成為推動教育改革與發(fā)展的驅動力[14],將給教育大數(shù)據(jù)資源共享帶來前所未有的改變。通過應用大數(shù)據(jù)相關技術,能極大提高科研數(shù)據(jù)挖掘與數(shù)據(jù)分析的速度及效率。大數(shù)據(jù)技術包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫、數(shù)據(jù)挖掘電網(wǎng)、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫、云計算平臺、互聯(lián)網(wǎng)和可擴展的存儲系統(tǒng)等方面,這些技術的研發(fā)、升級與教育資源共享相融合至關重要。
3.5 管理協(xié)同機制
3.5.1 發(fā)揮政府政策主導作用
教育大數(shù)據(jù)資源大多具有很強的公共性和基礎性,是高校教育教學、科學研究以及政府教育決策重要的支撐條件。推進教育大數(shù)據(jù)資源開放共享、合理配置,涉及到學生、教師、高校及政府等多方利益,是一項復雜的系統(tǒng)工程。因此,政府部門除了在教育大數(shù)據(jù)資源共享的政策、法令等方面積極參與,更要在規(guī)劃設計、基礎設施建設、環(huán)境營造以及加強監(jiān)管等方面發(fā)揮主導作用。
3.5.2 強化高校的組織協(xié)調能力
高校具有管理部門多、學生教師群體大、教育資源豐富等特點,教育大數(shù)據(jù)在挖掘、獲取、存儲、開放、共享以及利用時,尤其需要高校強大的組織協(xié)調能力。要打破教育大數(shù)據(jù)共享的部門壁壘以及利益掣肘,拓展教育大數(shù)據(jù)共享范圍、共享深度,這需要高校建立適合教育大數(shù)據(jù)資源共享管理的組織機構。首先,成立教育大數(shù)據(jù)資源共享管理委員會,由分管教育管理工作的黨委/行政領導為負責人,教務、學工、科研、網(wǎng)絡、資產、圖書、后勤、政策咨詢、保衛(wèi)等部門負責人為成員;其次,設置教育大數(shù)據(jù)資源共享管理辦公室。作為教育大數(shù)據(jù)共享管理委員會的常設協(xié)調機構,具體負責部門協(xié)調溝通、制度規(guī)范制定、教育資源整合和管理隊伍建設等工作;最后,成立教育大數(shù)據(jù)信息平臺中心,作為業(yè)務執(zhí)行部門,下設綜合部、網(wǎng)絡部、技術部、運營部、財務部等核心部門,其他種類部門可根據(jù)實際情況進行增設。
3.5.3 強化教師、學生共享的自覺性
高校每天都會產生大量的、動態(tài)的、連續(xù)的教育大數(shù)據(jù),而其采集、獲取、存儲以及共享需要教師、學生的積極配合和支持,這離不開高校教師和學生的共享自覺性。因此,有必要建立起大數(shù)據(jù)共享的自律機制:首先建立定期培訓機制。從事高校教育大數(shù)據(jù)共享工作的部門工作人員應定期參加有關教育大數(shù)據(jù)管理、技能的培訓,加強工作人員的自覺性意識;其次,加強教育資源共享宣傳。學校各有關部門都應制定教育大數(shù)據(jù)共享的宣傳機制,在潛移默化中強化學生及教師的共享意識;最后,形成教育大數(shù)據(jù)共享的文化氛圍。只有營造一種全校性的倡導教育資源共享的氛圍,才能形成高校教育大數(shù)據(jù)持續(xù)共享的局面。
參考文獻
[1]劉雍潛,楊現(xiàn)民.大數(shù)據(jù)時代區(qū)域教育均衡發(fā)展新思路[J].電化教育研究,2014,35(5):11-14.
[2]錢冬明,管玨琪,祝智庭.數(shù)字教育資源共建共享的系統(tǒng)分析框架研究[J].電化教育研究,2013,35(7):53.
[3]李馨.高等教育大數(shù)據(jù)分析:機遇與挑戰(zhàn)[J].開放教育研究,2016,22(4):50-56.
[4]What is Big Data?[EB/OL].http//www.villanovau.com/university-online-programs/what-is-big-data/,2014-01-07.
[5]楊現(xiàn)民,王榴卉,唐斯斯.教育大數(shù)據(jù)的應用模式與政策建議[J].電化教育研究,2015,36(9):54-61.
[6]馬迎賢.資源依賴理論的發(fā)展和貢獻評析[J].甘肅社會科學,2005,(1):118.
[7]Hjxgood.云計算的三種服務模式:IaaS,PaaS和SaaS[EB/OL].http://blog.csdn.net/hjxgood/article/details/18363789,2014-01-16.
[8]顧小清,鄭隆威,簡菁.獲取教育大數(shù)據(jù):基于XAPI規(guī)范對學習經歷數(shù)據(jù)的獲取與共享[J].現(xiàn)代遠程教育研究,2014,(5):13-23.
[9]孫卓.基于大數(shù)據(jù)構建圖書館知識服務引擎研究[J].圖書館學研究,2013,(18):48-51.
[10]云計算和大數(shù)據(jù)的標準化需求和標準化組織有哪些?[EB/OL].http://blog.csdn.net/orangelizq/article/details/48086217.
[11]王鳳領.基于Hadoop高校教育資源云存儲平臺構建研究[J].計算機技術與發(fā)展,2016,26(3):176-180.
[12]李海波,程耀東.大數(shù)據(jù)存儲技術和標準化[J].信息技術與標準化,2013,(5):23-26.
[13]盧莉莉.面向任務的人機交互模型研究及應用[D].重慶:重慶大學,2005.
[14]胡水星.大數(shù)據(jù)及其關鍵技術的教育應用實證分析[J].遠程教育雜志,2015,33(5):46-53.
(本文責任編輯:孫國雷)endprint