徐勇
大數(shù)據(jù)時代觀:一種可以采納的思維模式
依據(jù)現(xiàn)有傳統(tǒng)思維模式實現(xiàn)上述的“全數(shù)據(jù)”評估,必然存在人力、物力和海量數(shù)據(jù)的困境。因此,我們必須轉(zhuǎn)變思維模式,革新傳統(tǒng)監(jiān)控評估技術(shù)。大數(shù)據(jù)時代觀就是一種可以采納的思維模式。其關(guān)鍵是“樣本=總體”。
在信息處理能力受限的時代,世界需要數(shù)據(jù)分析,卻缺少用來分析所收集數(shù)據(jù)的工具,因此隨機(jī)抽樣應(yīng)運(yùn)而生,“抽樣”的目的就是用最少的數(shù)據(jù)得到最多的信息,它可以被視為那個時代的產(chǎn)物。但是,當(dāng)感應(yīng)器、手機(jī)導(dǎo)航、網(wǎng)站點擊等被動地收集了大量數(shù)據(jù),而計算機(jī)可以輕易地對這些數(shù)據(jù)進(jìn)行處理,我們可以獲得海量數(shù)據(jù)的時候,其缺陷越來越難以忽視了?!惨娋S克托·邁爾-舍恩伯格(英)《大數(shù)據(jù)時代:生活、工作與思維的大變革》(中文版).浙江人民出版社.2012版,以下簡稱“維克托文”〕例如用抽樣的方法分析整個人口的情況,正確率可達(dá)97%。對于某些事物來說,3%的錯誤率是可以接受的。但是對于教育來說,3%的錯誤率是不能接受的。數(shù)據(jù)處理技術(shù)已經(jīng)發(fā)生了翻天覆地的改變,我們的方法和思維也要跟上這種改變,要以每一個學(xué)生數(shù)據(jù)中心,合法地收集他們的所有數(shù)據(jù),用“樣本=總體”為思路,設(shè)計評估,設(shè)計質(zhì)量監(jiān)控。
(一)大數(shù)據(jù)時代觀點綜述
進(jìn)入2012年,大數(shù)據(jù)(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)大數(shù)據(jù)時代來臨,并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。大數(shù)據(jù)時代觀下有許多成功案例,如2009年甲型H1N1流感爆發(fā)的時候,谷歌更有效、更及時的發(fā)布了“流感”指示標(biāo)。令人驚人的是,谷歌的方法是建立在大數(shù)據(jù)的基礎(chǔ)之上的,而不需要分發(fā)口腔試紙或聯(lián)系醫(yī)生。這是當(dāng)今社會所獨(dú)有的一種新型能力:以一種前所未有的方式,通過對海量數(shù)據(jù)進(jìn)行分析,獲得有巨大價值的產(chǎn)品和服務(wù),或深刻的洞見。(見“維克托文”)
為了引入大數(shù)據(jù)時代的基本觀點,我們對這段時間內(nèi)與監(jiān)控有聯(lián)系論點做一個綜述。
首先,“從硅谷到北京,大數(shù)據(jù)的話題正在被傳播?!薄拔覀兊男袨?、位置,甚至身體生理數(shù)據(jù)等每一點變化都成為了可被記錄和分析的數(shù)據(jù)?!缃瘢粋€大規(guī)模生產(chǎn)、分享和應(yīng)用數(shù)據(jù)的時代正在開啟?!薄盎ヂ?lián)網(wǎng)時代,尤其是社交網(wǎng)絡(luò)、電子商務(wù)與移動通信把人類社會帶入了一個以PB(1024TB)為單位的結(jié)構(gòu)與非結(jié)構(gòu)數(shù)據(jù)信息的新時代?!贝髷?shù)據(jù)也將改變我們生活中最重要的方面,因為它為我們的生活創(chuàng)造了前所未有的可量化的維度。大數(shù)據(jù)已經(jīng)成為了新發(fā)明和新服務(wù)的源泉,而更多的改變正蓄勢待發(fā)。
其次,讓數(shù)據(jù)“發(fā)聲”?!按髷?shù)據(jù)”專家杰夫·喬納斯(Jeff Jonas)提出要讓數(shù)據(jù)“說話”。在數(shù)字化時代,數(shù)據(jù)處理變得更加容易、更加快速,人們能夠在瞬間處理成千上萬的數(shù)據(jù)。但當(dāng)我們談?wù)撃堋罢f話”的數(shù)據(jù)時,我們指的遠(yuǎn)遠(yuǎn)不止這些。
其三,“樣本=總體”。當(dāng)數(shù)據(jù)處理技術(shù)已經(jīng)發(fā)生了翻天覆地的變化時,進(jìn)行抽樣分析在大數(shù)據(jù)時代就像在汽車時代騎馬一樣。(見“維克托文”)隨機(jī)抽樣取只是一條捷徑,是在不可收集和分析全部數(shù)據(jù)的情況下的選擇,它本身存在許多固有的缺陷。一旦抽樣過程中存在任何偏見,分析結(jié)果就會相去甚遠(yuǎn)。探索以大數(shù)據(jù)為基礎(chǔ)的克服抽樣缺陷的解決方案,是提高數(shù)據(jù)利用效率的重要手段。聯(lián)系到我國現(xiàn)代化所面臨的種種問題以及教育、交通、醫(yī)療保健等各方面挑戰(zhàn),通過大數(shù)據(jù)這種創(chuàng)新方式來解決問題,意義就更大。(見“維克托文”)
其四,大數(shù)據(jù)的核心就是建立在海量數(shù)據(jù)的基礎(chǔ)之上的1預(yù)測。有預(yù)測的監(jiān)控,才有可能不斷完善受監(jiān)控的學(xué)?;騾^(qū)域。而這種“完善”是自主,內(nèi)在的,隨著監(jiān)控系統(tǒng)接收到的數(shù)據(jù)越來越多,它們可以聰明到自動搜索最好的信號和模式,并監(jiān)控系統(tǒng)也將自己改善自己。將目前單純依靠人類判斷力的監(jiān)控模式,轉(zhuǎn)變?yōu)楸O(jiān)控在計算機(jī)系統(tǒng)幫助下,成為受監(jiān)測的主體和監(jiān)控實施者共同自主完善模式下的監(jiān)控行為。
從上述大數(shù)據(jù)的觀點來看,目前在教育質(zhì)量監(jiān)控評估上,過于依賴“抽樣”數(shù)據(jù),都比較重視各種終端信息的采集,但對于管理和教學(xué)過程中的信息及發(fā)展性的信息關(guān)注不夠,教學(xué)質(zhì)量信息采集時效性較差,是出現(xiàn)“兩費(fèi)兩差一不足”,不利于對教學(xué)質(zhì)量進(jìn)行全過程管理,影響教學(xué)質(zhì)量評估診斷、促進(jìn)效用的及時發(fā)揮。
(二)大數(shù)據(jù)時代觀下的教育質(zhì)量監(jiān)控設(shè)想
目前評價方法一般是“加權(quán)求和”,雖然簡單,但容易降低評價的可能性,無法發(fā)揮數(shù)據(jù)全部作用?,F(xiàn)有的網(wǎng)絡(luò)評價應(yīng)用無疑延伸了評價的時間、拓寬了評價的空間、豐富了監(jiān)控的內(nèi)容,但同時也使評價數(shù)據(jù)庫的數(shù)據(jù)急劇增多,這些浩瀚的數(shù)據(jù)背后隱藏著許多重要的信息。傳統(tǒng)的數(shù)據(jù)分析手段只能獲取這些數(shù)據(jù)的表層信息,難以從中挖掘出有助教學(xué)決策的有價值的信息,來構(gòu)建有效的教學(xué)質(zhì)量預(yù)警機(jī)制。
以下我們從教育質(zhì)量監(jiān)控體系包括以下五個相互聯(lián)系、相互影響的子系統(tǒng)(即教育教學(xué)質(zhì)量管理理念、組織機(jī)構(gòu)、資源狀況、教育教學(xué)過程和質(zhì)量評價分析)出發(fā),談?wù)劷逃|(zhì)量監(jiān)控的設(shè)想。
1. 樹立以學(xué)生發(fā)展為本質(zhì)量監(jiān)控的出發(fā)點和歸宿。首先在監(jiān)控上要關(guān)注每一個學(xué)生的發(fā)展,監(jiān)控的樣本等于所有學(xué)生,將學(xué)生體檢的健康數(shù)據(jù)、出入校門或班級的出勤數(shù)據(jù)、進(jìn)入場所(宿舍、飯?zhí)?、圖書館的時間)時間、作業(yè)次數(shù)記錄、以及學(xué)業(yè)水平數(shù)據(jù)、家庭及社區(qū)環(huán)境數(shù)據(jù)、入學(xué)畢業(yè)跟蹤數(shù)據(jù)都作為監(jiān)控的對象,并在此基礎(chǔ)上形成區(qū)域(或?qū)W生)學(xué)生發(fā)展?fàn)顩r報告,發(fā)布學(xué)生健康狀況報告、學(xué)業(yè)水平報告。
2. 教育管理機(jī)構(gòu)為主導(dǎo)的全員參與監(jiān)控實體。組成一個縱橫交錯、相互作用、相互制約的監(jiān)控機(jī)構(gòu)網(wǎng),對教育活動的全過程實施全面監(jiān)控。
3. 區(qū)域內(nèi)一體化的資源狀況監(jiān)控系統(tǒng)。監(jiān)控人力資源管理、基本設(shè)施建設(shè)與管理、經(jīng)費(fèi)管理等。在此基礎(chǔ)上可以了解區(qū)域內(nèi)的均衡化發(fā)展的程度,學(xué)校資源利用情況。
4. 實時化教育過程監(jiān)控系統(tǒng)。實時化過程監(jiān)控是對教學(xué)計劃運(yùn)行過程的觀察、監(jiān)督,對偏離教學(xué)質(zhì)量目標(biāo)的行為進(jìn)行實時分析和處理,保障課程設(shè)施正常開展,防范不按國家要求設(shè)置課程情況,防范加班加點情況。監(jiān)控主要包括教學(xué)準(zhǔn)備與設(shè)計監(jiān)控、課堂教學(xué)過程監(jiān)控、課程考試監(jiān)控、實踐教學(xué)監(jiān)控等。目前來看,課堂教學(xué)評價系統(tǒng)記錄產(chǎn)生大量評價數(shù)據(jù),然而,這些數(shù)據(jù)主要是在日常教務(wù)管理過程中產(chǎn)生的,是教學(xué)質(zhì)量測量的最重要的數(shù)據(jù)源,管理系統(tǒng)一般都沒有對其進(jìn)行深入分析,也沒有發(fā)現(xiàn)其中隱藏的各種知識,這就使得教學(xué)管理人員無法從整體上把教學(xué)的綜合效果、變化趨勢等,教務(wù)管理系統(tǒng)積累的海量數(shù)據(jù)沒有能夠發(fā)揮應(yīng)有的作用。要利用專門的分析軟件進(jìn)行分析,為改進(jìn)教學(xué)、提高教學(xué)質(zhì)量服務(wù)。
5. 評語式的質(zhì)量評價分析系統(tǒng)。要培育大數(shù)據(jù)時代的監(jiān)控專家,保障教育“數(shù)據(jù)”真正發(fā)言,形成基本“評語”;要努力開發(fā)符合“全數(shù)據(jù)”的智能化教育管理系統(tǒng),該系統(tǒng)對現(xiàn)有教育管理系統(tǒng)具有很強(qiáng)的兼容性,能夠采納已有數(shù)據(jù)。
為實現(xiàn)上述五點設(shè)想,建議采取以下工作策略:
1. 組建適合“全數(shù)據(jù)”質(zhì)量監(jiān)控機(jī)構(gòu)和隊伍;
2. 研究“全數(shù)據(jù)”質(zhì)量監(jiān)控理論,開發(fā)監(jiān)控框架,建立適合全數(shù)據(jù)評價評估的數(shù)學(xué)模型;
3. 摸清我省現(xiàn)有中小學(xué)學(xué)校內(nèi)管理系統(tǒng)的類型(教務(wù)、學(xué)籍、圖書、健康、成績等等),同時要研究非教育系統(tǒng)與學(xué)生相關(guān)的數(shù)據(jù)系統(tǒng),在此基礎(chǔ)上充分利用現(xiàn)有數(shù)據(jù)資源;
4. 監(jiān)控中的有關(guān)指標(biāo)盡量避免抽樣,其數(shù)據(jù)指向是現(xiàn)有教工、學(xué)生的日常數(shù)據(jù),達(dá)到兩個目標(biāo):監(jiān)控評估是真實的,監(jiān)控數(shù)據(jù)不需要臨時采集。
(三)教育監(jiān)控系統(tǒng)數(shù)據(jù)庫
教育監(jiān)控系統(tǒng)數(shù)據(jù)庫建設(shè)首先要抓好數(shù)據(jù)框架研究。從宏觀上看,質(zhì)量監(jiān)控系統(tǒng)數(shù)據(jù)一般分為 “硬數(shù)據(jù)”和“軟數(shù)據(jù)”。(見凌惜勤等《建立校級教學(xué)基本狀態(tài)數(shù)據(jù)系統(tǒng),完善教學(xué)質(zhì)量監(jiān)控體系》教改經(jīng)緯.2011.總第219期)
“硬數(shù)據(jù)”一般是以數(shù)字的形式出現(xiàn),具有統(tǒng)計功能,主要包括數(shù)量,名次和比率,如在校學(xué)生數(shù)、師資隊伍情況、學(xué)校占在面積、校舍及實驗室面積、教學(xué)儀器設(shè)備的數(shù)量及價值、圖書館藏書及體育場館面積,各項教學(xué)經(jīng)費(fèi)投入情況等。而“軟數(shù)據(jù)”一般是指對客觀事物的判斷和描述,不具有統(tǒng)計功能,主要包括文字、文檔、圖像信息等。大數(shù)據(jù)觀點下,格外重視“軟數(shù)據(jù)”。挖掘這些數(shù)據(jù)往往可以深入分析學(xué)校的辦學(xué)指導(dǎo)思想,辦學(xué)目標(biāo)定位、人才培養(yǎng)方案、教學(xué)計劃的制定與落實情況、教學(xué)管理制度的制定及執(zhí)行情況、教學(xué)質(zhì)量標(biāo)準(zhǔn)的制定及監(jiān)控情況,各種評估、評價(如學(xué)生評教、教師評學(xué)、各級各類的聽課評價,社會及用人單位的評價等)及反饋、各種總結(jié)報告、獲獎情況,無疑這些數(shù)據(jù)是十分重要的監(jiān)控信息。要重視軟數(shù)據(jù)庫模式的標(biāo)準(zhǔn)研究和建設(shè)。
為實現(xiàn)以學(xué)生發(fā)展為中心的全數(shù)據(jù)理念,首先要建立適合其理念數(shù)據(jù)維度。例如TQMDSS(見張忠玉等《一種基于本科教學(xué)質(zhì)量監(jiān)控的決策支持系統(tǒng)》華南師范大學(xué)學(xué)報(自然科學(xué)版).2007,04)中重要的維度有:
1. 時間維度。根據(jù)學(xué)校的實際情況又分為年度維度和學(xué)期維度,其屬性較為簡單“年度(年度編號,年度);學(xué)期(學(xué)期編號,學(xué)期)。
2. 學(xué)生維度。學(xué)生、教師信息都存放在TQMS中的用戶信息表中,為了方便區(qū)分教師和學(xué)生,在數(shù)據(jù)源數(shù)據(jù)庫Classroom Teaching中,建立專門的學(xué)生視圖,作為學(xué)生維度數(shù)據(jù)源。這樣學(xué)生維度屬性為:學(xué)生(學(xué)生號,年級,學(xué)生姓名)。由于學(xué)生用戶太多,為便于篩選,采用多級別維度;依次為年級、學(xué)院、專業(yè)、高級別的學(xué)生集合必須包含低級別的學(xué)生集合。
3. 教師維度。同學(xué)生維度一樣,建立教師視圖作為教師維度數(shù)據(jù)源,教師維度屬性為:教師(教師號,學(xué)院、教師名);教師沒有年級和專業(yè)屬性(因此許多高校教師主要以院系為單位管理,經(jīng)常跨專業(yè)授課)。
4. 教學(xué)班級維度。教學(xué)班級是對某學(xué)期、某教師為某班級(教學(xué)對象)開設(shè)的某一門課程的抽象描述。
其次,為提高監(jiān)控工作的水平,要設(shè)法保障監(jiān)控數(shù)據(jù)質(zhì)量。
可能造成統(tǒng)計數(shù)據(jù)質(zhì)量不高的原因會是多方面的,如法制意識不強(qiáng);統(tǒng)計人員隊伍素質(zhì)不高;被統(tǒng)計或調(diào)查對象不配合。提高統(tǒng)計數(shù)據(jù)質(zhì)量的措施首先要提高統(tǒng)計人員素質(zhì);要把握數(shù)據(jù)源頭,夯實統(tǒng)計數(shù)據(jù)質(zhì)量基礎(chǔ);也要對統(tǒng)計數(shù)據(jù)質(zhì)量進(jìn)行監(jiān)控。對數(shù)據(jù)質(zhì)量監(jiān)控的方法可以分為以下幾類:按監(jiān)控時間可分為日常監(jiān)控和時點監(jiān)控;安數(shù)據(jù)質(zhì)量監(jiān)控范圍可分為抽樣監(jiān)控和全數(shù)監(jiān)控;安數(shù)據(jù)質(zhì)量監(jiān)控的手段可分為審核、復(fù)核、校驗、實地檢查。
大數(shù)據(jù)時代觀下監(jiān)控模式的發(fā)展前景
(一)用數(shù)據(jù)庫(包括學(xué)校概況、師資隊伍、校園校舍、辦學(xué)經(jīng)費(fèi)、圖書資料、儀器設(shè)備、專業(yè)與課程、教學(xué)管理、教學(xué)效果、學(xué)生基本情況等數(shù)據(jù)群組信息)可以達(dá)到教育質(zhì)量全面監(jiān)控的目的,形成全面的、動態(tài)的教學(xué)質(zhì)量監(jiān)控體系。各個學(xué)校的狀態(tài)數(shù)據(jù)庫所采集的數(shù)據(jù)項是原始的,是真實、客觀、準(zhǔn)確的,未來開發(fā)的監(jiān)控系統(tǒng)會自動生成各項工作中所需要的衍生數(shù)據(jù),為更深的層次分析教育現(xiàn)象產(chǎn)生的原因以及教育發(fā)展的偏差和趨勢服務(wù)。
(二)監(jiān)控系統(tǒng)將是智能化的實時的開放的系統(tǒng),從目前監(jiān)控過于依賴專家的單一模式,轉(zhuǎn)變?yōu)閷⑾到y(tǒng)數(shù)據(jù)分析與專家協(xié)調(diào)監(jiān)控模式。系統(tǒng)也將有利于實施民主監(jiān)督與社會監(jiān)督。
(三)有利于教育主管部門和學(xué)校用數(shù)據(jù)信息治校,而不是分?jǐn)?shù)治校。教育行政部門用數(shù)據(jù)發(fā)現(xiàn)“細(xì)微”的問題,及時提醒,引導(dǎo)教育,而不是分?jǐn)?shù)掐死教育。也可以有效避免將教學(xué)質(zhì)量監(jiān)控等同于考試,避免監(jiān)控淪落為片面追求升學(xué)率的推手。
(作者單位:廣東省教育研究院)
責(zé)任編輯 鄒韻文