(華東師范大學(xué)教育學(xué)部 上海 200062)
可汗學(xué)院(Khan Academy)是由美國薩爾曼·可汗(Salman Khan)在2007年創(chuàng)立的一家非營利性質(zhì)的教育機構(gòu),它的愿景是“向世界上任何地方的任何人提供免費的一流教育”[1],滿足渴望學(xué)習(xí)的人們的個性化學(xué)習(xí)需求。2018年6月12日,從發(fā)布世界網(wǎng)站流量排名的公司Alexa官網(wǎng)獲得的信息中我們可以看出,可汗學(xué)院的訪問量在全球所有網(wǎng)站排名中高居第635位,而世界三大慕課網(wǎng)站Coursera、edX和Udacity的訪問量分別為680位、1 027位和1 473位,都低于可汗學(xué)院[2]。訪問人數(shù)之多,足見其受歡迎程度。
從高校圖書館對提升大數(shù)據(jù)應(yīng)用服務(wù)水平的需求來看,可汗學(xué)院的數(shù)據(jù)平臺及其框架在提供學(xué)習(xí)內(nèi)容和數(shù)據(jù)分析方面有非常成功的經(jīng)驗,值得借鑒。
目前,可汗學(xué)院擁有150人的團隊為世界各地的人們開設(shè)了3 500多個視頻課程,內(nèi)容系統(tǒng)全面,涵蓋了數(shù)學(xué)、科學(xué)與工程、計算、藝術(shù)與人文、經(jīng)濟學(xué)和金融學(xué),還設(shè)置SAT、GMAT等備考科目以及大學(xué)入學(xué)申請培訓(xùn)等共七大類課程[3],如圖1所示。
這些課程的目的在于給學(xué)習(xí)者提供符合個人節(jié)奏的校內(nèi)外學(xué)習(xí)機會。目前,成千上萬的來自世界各地的學(xué)生都在利用可汗學(xué)院學(xué)習(xí),它的學(xué)習(xí)資源被翻譯成36種語言,受到不同年齡學(xué)習(xí)者的喜愛。它利用練習(xí)、教學(xué)視頻以及個人學(xué)習(xí)儀表板等為學(xué)生提供課內(nèi)外的學(xué)習(xí)支持,其中數(shù)學(xué)教學(xué)的目標(biāo)是給學(xué)習(xí)者提供從幼兒園數(shù)數(shù)到微積分的學(xué)習(xí)內(nèi)容,通過自適應(yīng)技術(shù)發(fā)現(xiàn)學(xué)生的學(xué)習(xí)優(yōu)勢和學(xué)習(xí)差距。
圖1 可汗學(xué)院的課程(截至2018年6月11日)
可汗學(xué)院的貢獻(xiàn)者們相信大腦通過學(xué)習(xí)可以得到很好的鍛煉,智力水平在持續(xù)的思考中可以不斷提升,每一個人都能控制自己的學(xué)習(xí)能力,在學(xué)習(xí)中構(gòu)筑自己的思維模式,成為更好的學(xué)習(xí)者。正如可汗學(xué)院董事局主席Ann Doerr所說:“可汗學(xué)院的即時反饋,給予了學(xué)生了解自己掌握了什么和沒有掌握什么的機會。學(xué)生在可汗學(xué)院可以嘗試、失敗、再嘗試。學(xué)生們可以反復(fù)觀看視頻,逐步找到需要掌握的問題解決線索。過去學(xué)生要是不會什么,經(jīng)常會經(jīng)歷尷尬無助的場面,如今可汗學(xué)院減少了這樣的可能?!盵1]
基于這樣的教育理念,可汗學(xué)院為全世界的學(xué)習(xí)者提供了高質(zhì)量的課程內(nèi)容,除了最初的數(shù)學(xué)課程,它還與美國國家航空航天局(NASA)、美國現(xiàn)代藝術(shù)博物館(MoMA)、加利福尼亞州科學(xué)館(The California Academy of Sciences)以及麻省理工學(xué)院等機構(gòu)合作提供更專業(yè)的課程內(nèi)容[1]。這些整合了其他資源的課程,也為可汗學(xué)院帶來了大量的可利用數(shù)據(jù)。
2.1.1 觀看視頻(watch)
教學(xué)視頻是可汗學(xué)院為學(xué)生提供的獲取知識的主要手段,它有以下特點:①均為微視頻,時長10分鐘左右,質(zhì)量極高、趣味性強,短平快;②講師不出鏡,避免干擾,有助于學(xué)生集中注意力;③電子板書中包含大量圖示,猶如現(xiàn)場授課,淺顯易懂、循序漸進(jìn);④學(xué)生可以按自身學(xué)習(xí)水平對視頻操作快進(jìn)、后退,也可反復(fù)播放。
10分鐘的視頻教學(xué)易于消化,降低了認(rèn)知負(fù)荷。學(xué)生無需再依賴教師授課,而是看視頻自主學(xué)習(xí)。這樣的學(xué)習(xí)模式是開放與自由的。
傳統(tǒng)的課堂教學(xué)中,教師要顧及多數(shù)學(xué)生的認(rèn)知水平,可能為了趕進(jìn)度,放棄部分落后于班級平均水平的學(xué)生。在可汗學(xué)院,學(xué)生通過視頻,可以按照自己的步調(diào)學(xué)習(xí),能夠在任何不懂的地方暫停、重播,不用自卑和尷尬、提防外部負(fù)面評價;當(dāng)然,對于已經(jīng)理解的內(nèi)容同樣可以快進(jìn),提高學(xué)習(xí)效率。這樣的講課形式更具人性化,更能理解和尊重學(xué)生,使學(xué)習(xí)從恐懼走向了愉悅。
2.1.2 做練習(xí)(practice)
(1)不求及格,唯需精通
看完視頻,針對每個知識點都相應(yīng)提供配套的即時練習(xí)。每10分鐘一節(jié)課,隨堂測試,作業(yè)量不大,以免對學(xué)生造成過重負(fù)擔(dān)??珊箤W(xué)院推崇精熟教學(xué),一個知識點學(xué)通透了,才可以進(jìn)入下一環(huán)節(jié)?!熬旖虒W(xué)法”是1919年美國激進(jìn)教育家卡爾頓·沃什伯恩提出的,原本因為教學(xué)成本太高而未被推廣,而由于技術(shù)的支持,可汗學(xué)院的教學(xué)模式很好地解決了這個問題。
最初學(xué)生覺得連續(xù)答對10題是很苛刻的事,但如果他們做到了并得到獎勵,會很有成就感,自信心和自尊心都獲得大幅度提升,進(jìn)而對更難的挑戰(zhàn)充滿期待[4]。練習(xí)過程中若有疑問,可先點擊“提示按鈕”。平臺會就同一個問題,根據(jù)問題的難度給出3~12個不同提示[5],確保學(xué)生能夠掌握知識點的精髓,避免了傳統(tǒng)教育中存在的一知半解。
為了調(diào)動學(xué)生好奇心和學(xué)習(xí)熱情,把教育目標(biāo)與孩子的天性相結(jié)合,學(xué)習(xí)過程采取發(fā)放經(jīng)驗值與徽章獎勵的模式。學(xué)習(xí)猶如游戲通關(guān),只有完全學(xué)通透了,“十分過關(guān)”,才可以進(jìn)入下一階段學(xué)習(xí)。
可汗學(xué)院的學(xué)生統(tǒng)計數(shù)據(jù)如圖2所示,餅圖分為外、內(nèi)兩圈,外圈表示做過的知識點練習(xí),內(nèi)圈表示看過的知識點視頻。鼠標(biāo)移到外圈不同區(qū)域,可以看到該知識點的名稱、練習(xí)耗費的時間、完成了多少道題目、正確率如何、是否精通。
(2)串聯(lián)相通的知識地圖
在練習(xí)界面出現(xiàn)的星空圖,實質(zhì)是建立了一個基于知識點內(nèi)在聯(lián)系的知識地圖。圖3中標(biāo)識了每個具體的知識點,畫出了知識點之間的相關(guān)邏輯。知識不應(yīng)該強制性地分出科目和章節(jié),傳統(tǒng)的學(xué)科劃分局限了學(xué)生的思維,教學(xué)應(yīng)該將課程之間縱橫打通,幫助學(xué)生梳理各知識點間的聯(lián)系。根據(jù)學(xué)生的知識點選擇,可汗學(xué)院會依據(jù)知識點之間的聯(lián)系,給學(xué)生推薦下一步學(xué)習(xí)的內(nèi)容[2]。
圖2 可汗學(xué)院的學(xué)生統(tǒng)計數(shù)據(jù)
圖3 知識地圖
2.1.3 提供指導(dǎo)(coach)
(1)個人主頁
在個人主頁,學(xué)生可以查看自己的數(shù)據(jù)統(tǒng)計,了解系統(tǒng)針對每次學(xué)習(xí)與測試的數(shù)據(jù)分析后提供的實時評估,掌握自己的學(xué)習(xí)進(jìn)度。
(2)指導(dǎo)者
每個學(xué)生都可以在個人頁面上綁定一名或多名指導(dǎo)者,指導(dǎo)者可以共享學(xué)生的學(xué)習(xí)進(jìn)度,方便更加及時和有針對性地進(jìn)行管理和輔導(dǎo)。
(3)學(xué)習(xí)社區(qū)
在看完視頻后,還可以進(jìn)入學(xué)習(xí)社區(qū),向指導(dǎo)者或者其他學(xué)習(xí)者提問、交流。
(4)其他數(shù)據(jù)分析
除了正確率的數(shù)據(jù)外,平臺還會統(tǒng)計學(xué)生在每個模塊的停留時間、能力培養(yǎng)情況,以及學(xué)生的個人目標(biāo)等。學(xué)好了有獎勵,學(xué)不好可以自查問題所在;指導(dǎo)者會及時對癥下藥地進(jìn)行輔導(dǎo);有疑問可以在交流區(qū)進(jìn)行討論,互相啟迪創(chuàng)新、激發(fā)靈感。這種方式可促使學(xué)生對自己的學(xué)習(xí)更積極、更具有責(zé)任心。
可汗學(xué)院教育平臺擁有強大的在線課程,能夠讓學(xué)生觀看視頻,解決練習(xí)或獲得徽章。該平臺提供了具有可視化功能的高級學(xué)習(xí)分析模塊。每天可汗學(xué)院的數(shù)據(jù)分析師需要收集大約800萬運動和視頻互動的數(shù)據(jù)點,以及數(shù)百萬個關(guān)于社區(qū)討論、計算機科學(xué)課程和注冊的數(shù)據(jù)。同時還有原始的web請求日志,以及發(fā)送給MixPanel的一些客戶端事件。從難以理解的原始數(shù)據(jù)提取有意義的信息,分析處理,可視化為與技能進(jìn)步、練習(xí)報告或?qū)W生活動等有關(guān)的報告并反饋于用戶,這些數(shù)據(jù)使指導(dǎo)者與學(xué)生由此做出明智的選擇,因而可以產(chǎn)生積極的影響。
在可汗學(xué)院,目前主要有以下幾種框架用于從收集的數(shù)據(jù)中提取有意義的信息并分析。
2.2.1 MixPanel
Jace Kohlmeier是可汗學(xué)院前數(shù)據(jù)分析總監(jiān),之前則是著名對沖基金Citadel的高管。在可汗學(xué)院,Jace Kohlmeier使用Mixpanel的服務(wù)來分析數(shù)據(jù)。MixPanel是移動網(wǎng)絡(luò)最先進(jìn)的分析平臺之一,讓開發(fā)者跟蹤用戶的使用習(xí)慣,并提供實時分析。MixPanel的漏斗工具十分強大,主要跟蹤關(guān)鍵行為,可從頁面訪問量數(shù)據(jù)的局限跳出來,轉(zhuǎn)而以用戶行為為驅(qū)動。
Mixpanel主要給可汗學(xué)院提供了幾大關(guān)鍵指標(biāo):
(1)用戶動態(tài)分析(Trends):你關(guān)心的用戶行為發(fā)生了多少次,占總比例多少。
(2)行為漏斗模型(Funnels):某些關(guān)鍵行為是怎么發(fā)生了,每一步有多少的留存率和流失率。
(3)用戶活躍度(Cohorts):網(wǎng)站用戶的活躍度如何,可以用來區(qū)分忠實用戶和普通用戶。
(4)單用戶行為分析(People):單個用戶在網(wǎng)站上做了哪些操作,過程是如何的。
漏斗圖是對業(yè)務(wù)流程最直觀的一種表現(xiàn)形式,通過漏斗圖可以很快發(fā)現(xiàn)流程中存在的問題,通過相應(yīng)的方式進(jìn)行優(yōu)化,漏斗圖又可以很直觀地告訴我們流程的優(yōu)化效果。
MixPanel比其他公司的同類產(chǎn)品更好理解和設(shè)計。Jace表示,他們研究了其他分析提供商,但發(fā)現(xiàn)“類似的功能,例如事件跟蹤和漏斗報告,但很難理解,文檔很差,并且在可以跟蹤的事件的限制方面有一些障礙”[6]。
2.2.2 MapReduce
MapReduce最早是由Google公司研究提出的一種面向大規(guī)模數(shù)據(jù)處理的并行計算模型和方法。Google公司設(shè)計MapReduce的初衷主要是為了解決其搜索引擎中大規(guī)模網(wǎng)頁數(shù)據(jù)的并行化處理。可以把MapReduce理解為,把一堆雜亂無章的數(shù)據(jù)按照某種特征歸納起來,然后處理并得到最后的結(jié)果。Map面對的是雜亂無章的互不相關(guān)的數(shù)據(jù),它解析每個數(shù)據(jù),從中提取出key和value,也就是提取了數(shù)據(jù)的特征。經(jīng)過MapReduce的Shuffle階段之后,在Reduce階段看到的都是已經(jīng)歸納好的數(shù)據(jù)了,在此基礎(chǔ)上可以做進(jìn)一步的處理以便得到結(jié)果。這就回到了最初,終于知道MapReduce為何要這樣設(shè)計。
Khan academy的數(shù)據(jù)分析師Matt Faus指出,MapReduce庫允許數(shù)據(jù)分析師在生產(chǎn)服務(wù)器上對生產(chǎn)數(shù)據(jù)執(zhí)行查詢和數(shù)據(jù)維護(hù)。最常用的MapReduce庫是在數(shù)據(jù)存儲區(qū)中的許多實體上執(zhí)行模式更改和數(shù)據(jù)清理。例如,從模型中刪除現(xiàn)在未使用的屬性,授予基于時間的成就徽章,或者基于最終一致的問題日志重新計算鍛煉進(jìn)度。
另一個常見用途是計算聚合數(shù)據(jù),以確定學(xué)生完成練習(xí)的平均時間。MapReduce圖書館功能強大,但可能難以按需要正確地工作[7]。
2.2.3 Hive
目前,可汗學(xué)院最成熟的系統(tǒng)是在Amazon EMR上運行Hive。Matt Faus和同伴們創(chuàng)建了幾個在App Engine中直接運行的Google MapReduce和Pipeline框架的工作。快速實現(xiàn)簡單的MapReduce統(tǒng)計,不必開發(fā)專門的MapReduce應(yīng)用,十分適合數(shù)據(jù)倉庫的統(tǒng)計分析。而且他們已經(jīng)開始將備份導(dǎo)出到Google Cloud Storage,Google BigQuery可以以瘋狂的速度消耗和運行查詢。
將數(shù)據(jù)從生產(chǎn)數(shù)據(jù)存儲區(qū)移動到Hive中,使之能夠使用強大的HiveQL功能(如UNION,子查詢,最重要的是JOIN)來迭代查詢。有了這些,就可以回答“根據(jù)學(xué)生的活動,哪些指導(dǎo)者在過去一年中最活躍”的問題。分析師還使用這個系統(tǒng)來訓(xùn)練Khan academy的機器學(xué)習(xí)模型,以了解學(xué)生的知識狀態(tài),并推薦最有可能幫助他們改進(jìn)的內(nèi)容。這個設(shè)置需要幾個轉(zhuǎn)換的數(shù)據(jù)轉(zhuǎn)換成一種Hive可以理解的格式?,F(xiàn)在提供的數(shù)據(jù)存在一些地方不同程度的可訪問性,可以啟動一個Hive實例做一些重型查詢,或REST調(diào)用下載一個緊湊的總結(jié)。Hive并不提供實時的查詢和基于行級的數(shù)據(jù)更新操作。Hive的最佳使用場合是大數(shù)據(jù)集的批處理作業(yè),如網(wǎng)絡(luò)日志分析。
Matt Faus提到使用Hive和GCS進(jìn)行數(shù)據(jù)倉庫和巨型查詢,無需輸出原始的實時信息。Hive系統(tǒng)自創(chuàng)建以來一直運行良好,但現(xiàn)在Google技術(shù)正在提升,所以未來的數(shù)據(jù)分析工作將會更加輕松快捷[7]。
2.2.4 谷歌BigQuery云存儲
BigQuery是一個功能強大的大數(shù)據(jù)分析平臺,是Google專門面向數(shù)據(jù)分析需求設(shè)計的一種全面托管的PB級低成本企業(yè)數(shù)據(jù)倉庫。Google Cloud Storage和BigQuery管道在概念上非常類似于EMR和Hive管道,但是更容易設(shè)置。BigQuery是Google推出的一款SaaS查詢產(chǎn)品,其發(fā)展勢頭似乎越來越好。它允許查詢云中的大型柱狀數(shù)據(jù)結(jié)構(gòu)。開發(fā)人員可以通過上傳到Google云存儲(相當(dāng)于Amazon的S3)或者以流數(shù)據(jù)的方式把數(shù)據(jù)加載到BigQuery中,然后使用類似SQL的查詢語言執(zhí)行OLAP風(fēng)格的查詢。
它能提供許多強大的聲明,但缺乏添加自定義地圖或減少項目的功能,這在Hive中已經(jīng)完成??珊箤W(xué)院的數(shù)據(jù)分析師對這些新技術(shù)產(chǎn)生了興趣,認(rèn)為它設(shè)置和檢索查詢結(jié)果的速度非常好,將來會更廣泛地使用它[7]。
2.2.5 ALAS-KA
ALAS-KA被設(shè)計為可汗學(xué)院平臺的新型輔助型插件。這種架構(gòu)可以讓指導(dǎo)者處理大量的教育低級數(shù)據(jù)(以事件的形式),并獲得能以可視化和建議的形式呈現(xiàn)的更高級別的學(xué)習(xí)信息。
相比其他視覺分析工作通常集中在直接指標(biāo)(例如訪問次數(shù)、帖子數(shù)量和正確的練習(xí)次數(shù))上,ALAS-KA可顯示更復(fù)雜過程的信息,與學(xué)習(xí)相關(guān)的信息包括如主觀意圖明顯的用戶,他們的想法和情感取向,可作為分析時的補充。
以對馬德里卡洛斯三世大學(xué)(UC3M)本科課程(物理、化學(xué)和數(shù)學(xué))的300多名新生研究為例,研究者發(fā)現(xiàn)ALAS-KA模塊可以更加細(xì)致地分析學(xué)生的情感狀態(tài)與學(xué)習(xí)風(fēng)格,并可視化。例如圖4,使用ALASKA開發(fā)和實施的算法,設(shè)置縱坐標(biāo)情緒飽滿閾值為1.0,可以推斷出每個學(xué)生在課堂上的幸福感、無聊感、混亂感和沮喪感。之后對這些測量進(jìn)行匯總,可顯示整個教室的每個狀態(tài)。在這個例子中,與學(xué)習(xí)收益正相關(guān)的情感狀態(tài)是灰色的,而黑色狀態(tài)已被證明與學(xué)習(xí)成果呈負(fù)相關(guān)。
圖4 學(xué)生情感狀態(tài)
ALAS-KA模塊是支持可汗學(xué)院學(xué)習(xí)分析的重要附件,它提供的信息能夠幫助可汗學(xué)院關(guān)注到原先非設(shè)定的重要信息,如這里提到的情感、學(xué)習(xí)風(fēng)格等,不單是效率、行為,老師們將有更多機會通過直觀的圖表了解學(xué)習(xí)的全貌,有益于教師基于學(xué)生的數(shù)據(jù)做出更符合學(xué)情的決策,激發(fā)學(xué)生的學(xué)習(xí)動機[8]。
從傳統(tǒng)圖書館向數(shù)字圖書館轉(zhuǎn)型以實現(xiàn)服務(wù)升級的視角來看,當(dāng)前高校圖書館除了提供學(xué)習(xí)空間、書刊借閱之外,還提供了大量電子數(shù)據(jù)庫資源和開設(shè)一些資源利用的講座,滿足師生在資源利用方面的個性化需求。因此,高校師生的圖書館生活不僅僅限于流通閱覽,除了實體書外,他們還會在圖書館的網(wǎng)頁上瀏覽和使用數(shù)字化資源,參與圖書館的講座,目前這部分?jǐn)?shù)據(jù)在學(xué)校提供的個人圖書館信息中沒有反映。如果高校圖書館能夠像可汗學(xué)院一樣,建立讀者圖書館利用儀表盤,就可以幫助讀者整合自己的圖書館利用現(xiàn)狀,分析自己的資源利用類型。一方面可以將為讀者提供諸如精準(zhǔn)推送這樣的個性化服務(wù)落到實處,另一方面也為讀者基于準(zhǔn)確了解自己的閱讀現(xiàn)狀、反思閱讀習(xí)慣、選擇閱讀方向提供支持。比方說,某位讀者在進(jìn)行研究的過程中,已經(jīng)通過學(xué)校的圖書館查閱了大量的文獻(xiàn),這些文獻(xiàn)除了下載的之外,還有很多可能已經(jīng)瀏覽過。目前,讀者想知道自己是否看過,需要去回看瀏覽歷史,它是完全線性的、獨立的一篇篇文章。而儀表盤的設(shè)計往往具有聚類分析的功能,通過瀏覽停頓時間、文章關(guān)鍵詞分類等符合數(shù)據(jù)采集需要的模塊化數(shù)據(jù)統(tǒng)計,讓讀者直觀看到自己在圖書館都看了什么,下載了什么,所查看的資源之間的關(guān)聯(lián)性是什么,哪些是關(guān)注的重點,哪些資源還關(guān)注得不夠,等等。因為在科學(xué)研究的過程中,反思自己對研究領(lǐng)域的文獻(xiàn)掌握了多少是衡量其對一個領(lǐng)域熟悉程度的重要指標(biāo)。
對圖書館而言,讀者利用儀表盤也能夠幫助更好地了解讀者的喜好、研究現(xiàn)狀和研究趨勢。何勝等人認(rèn)為“國內(nèi)外學(xué)者從多角度探討了圖書館大數(shù)據(jù)應(yīng)用面臨的問題,明確關(guān)注服務(wù)創(chuàng)新,提出應(yīng)對策略,但是多數(shù)偏重于概述方法和概念解析,在如何解決高校圖書館服務(wù)面臨的學(xué)科知識服務(wù)和個性化服務(wù)問題上,缺乏有效的理論支持和技術(shù)視角的應(yīng)對方案”[9]。他們的研究表明:“在數(shù)據(jù)開放和知識共享的大趨勢下,圖書館需要依據(jù)用戶需求,通過知識搜索、組織、分析、重組等方式為用戶提供知識服務(wù),以支持知識應(yīng)用和知識創(chuàng)新”[9]。而讀者圖書館利用儀表盤的應(yīng)用,將有助于直接了解讀者的學(xué)科知識服務(wù)需求,成為為讀者提供精準(zhǔn)服務(wù)的重要依據(jù)。
可汗學(xué)院提供的各類課程服務(wù),主要是基于學(xué)科知識點建立起了串聯(lián)相通的知識地圖。目前,高校圖書館也普遍提供圖書館資源與服務(wù)利用課程或系列講座,這些課程或講座有些已經(jīng)能在線觀看,課件往往也能下載,極大地方便了師生的學(xué)習(xí)和研究。然而,普遍的問題在于這些課程都是單向的信息傳遞,未被設(shè)計成能夠互動交流的在線課程,因此不能隨時搜集到關(guān)于讀者使用這些課程的信息,同時,讀者在這些課程的收獲是什么,還有哪些問題以及這些課程本身有哪些改進(jìn)之處往往很難得到及時的回應(yīng)。可汗學(xué)院的數(shù)據(jù)平臺是建立在它提供了大量課程的基礎(chǔ)之上的,學(xué)生在學(xué)習(xí)課程的過程中,通過做練習(xí)、互動交流等在線學(xué)習(xí)行為,留下了他們對知識掌握程度、相應(yīng)速度、互動交流狀況等相關(guān)的數(shù)據(jù)以及對知識內(nèi)容準(zhǔn)確性和有效性的反饋數(shù)據(jù),實現(xiàn)了數(shù)據(jù)流通和分析的雙回路有效信息溝通,增進(jìn)了彼此的了解,使雙方都獲得了提升所需要依據(jù)的信息。
如果圖書館的課程,特別是有關(guān)個人知識管理、文獻(xiàn)整理工具、在線數(shù)據(jù)庫有效利用等學(xué)習(xí)內(nèi)容被設(shè)計成類似可汗學(xué)院這樣可以通過完成挑戰(zhàn)性學(xué)習(xí)任務(wù)來學(xué)習(xí)的課程,將增加課程的吸引力和讀者的黏度,有助于提高這些課程被使用的頻度、靈活性和有效性,使圖書館課程真正成為支持讀者學(xué)習(xí)的助手,而學(xué)習(xí)者在課程學(xué)習(xí)時留下的痕跡以及反饋數(shù)據(jù)將幫助圖書館更好地提升課程水平,讀者學(xué)習(xí)數(shù)據(jù)和圖書館提供的課程內(nèi)容數(shù)據(jù)也因此被打通。圖書館也將成為支持讀者不斷成長的重要平臺。
每天有大量的學(xué)習(xí)者訪問可汗學(xué)院,高校圖書館在這方面也不遜色。目前各個高校圖書館都在關(guān)注智慧圖書館的建設(shè),也非常重視大數(shù)據(jù)分析方面的研究。
魏來、張伊認(rèn)為智慧圖書館的資源管理,不僅要充分利用資源,還需要對資源進(jìn)行深度挖掘,探究數(shù)據(jù)層面間的關(guān)聯(lián)智慧圖書館業(yè)務(wù)數(shù)據(jù)的管理,不僅可以優(yōu)化圖書館的業(yè)務(wù)流程,提高圖書館工作效率,而且能夠?qū)D書館的發(fā)展決策和戰(zhàn)略規(guī)劃提供支持”[10];何勝等人指出“伴隨著高校圖書館數(shù)字化進(jìn)程的迅速推進(jìn),圖書館數(shù)據(jù)在一定程度上具備了大數(shù)據(jù)的特征,這些數(shù)據(jù)具有很強的時效性,只有及時加以分析,其價值才能得到有效利用發(fā)揮”[9];包冬梅等人認(rèn)為“圖書館數(shù)據(jù)的統(tǒng)計分析,直接關(guān)系到高校圖書館的建設(shè)水平和服務(wù)質(zhì)量。一方面高校圖書館應(yīng)加強統(tǒng)計分析與挖掘,致力于推動信息資源體系的優(yōu)化、知識發(fā)現(xiàn)服務(wù)的完善、學(xué)術(shù)評價體系的創(chuàng)新,以及為高校教學(xué)科研和戰(zhàn)略決策提供權(quán)威、高質(zhì)量依據(jù);另一方面,應(yīng)建立可實行的、可測量的統(tǒng)計與評估指標(biāo)體系,開發(fā)高校圖書館數(shù)據(jù)統(tǒng)計分析平臺及工具(問卷調(diào)查與統(tǒng)計分析),促成順暢、持續(xù)的統(tǒng)計報告制度”[11]。可見,對圖書館資源的深度挖掘,體現(xiàn)數(shù)據(jù)的價值,形成定期的圖書館統(tǒng)計報告已經(jīng)成為建設(shè)智慧圖書館的重要任務(wù)。
目前,關(guān)于高校圖書館數(shù)據(jù)治理有其特定的工具,如“OCLC對館藏資源的網(wǎng)格化分類、W3C圖書館關(guān)聯(lián)數(shù)據(jù)孵化小組從信息處理和組織角度對圖書館數(shù)據(jù)的狹義界定、中國國家圖書館對圖書館數(shù)據(jù)的劃分與歸總”[11],“基于WorldCat數(shù)據(jù)庫和基于HPCABDS(High Performance Computing Apache Big Data Stack)的圖書館大數(shù)據(jù)應(yīng)用框架”[9]等。我們從理解讀者數(shù)據(jù)平臺使用習(xí)慣、使用結(jié)果,掌握使用動向的視角來看,可汗學(xué)院目前使用的幾類大數(shù)據(jù)分析框架,是有一定的啟發(fā)意義的。如可以通過MixPanel及相應(yīng)的升級平臺能夠?qū)崿F(xiàn)對讀者的動態(tài)分析,了解他們使用圖書館各類資源行文、頻率、活躍程度等;通過類似MapReduce的技術(shù)把不同讀者在應(yīng)用圖書館過程中產(chǎn)生的雜亂無章的數(shù)據(jù),按照相應(yīng)特征歸納清洗,然后處理并得到最后可以說明問題的結(jié)果;通過Hive解決數(shù)據(jù)處理和計算問題,快速了解用戶的知識狀態(tài),并推薦最有可能適合他們學(xué)習(xí)和研究需要的內(nèi)容;通過谷歌BigQuery云存儲來進(jìn)行大數(shù)據(jù)存儲與分析;通過ALAS-KA這樣的插件理解讀者的情感需求和體驗,等等。當(dāng)然這些數(shù)據(jù)平臺和工具并非與圖書館的大數(shù)據(jù)存儲、應(yīng)用和分析是一一對應(yīng)的關(guān)系,但是它們的數(shù)據(jù)處理、分析和應(yīng)用的方式能夠提供一定的思考視角,幫助圖書館在數(shù)字化資源建設(shè)的過程中高效地獲取整合的以及個性化的讀者信息,洞悉學(xué)習(xí)和科研的現(xiàn)狀和問題,為基于數(shù)據(jù)的高效決策奠定基礎(chǔ)。
可汗學(xué)院作為學(xué)習(xí)內(nèi)容的供應(yīng)者,通過其數(shù)據(jù)分析為學(xué)習(xí)者提供了全面的學(xué)習(xí)診斷和學(xué)習(xí)指導(dǎo)。在今天這樣一個數(shù)字化時代,高校圖書館服務(wù)的升級和創(chuàng)新,同樣離不開對其海量數(shù)據(jù)的分析和應(yīng)用,也離不開所有讀者的積極參與,可汗學(xué)院的教學(xué)、運營和數(shù)據(jù)應(yīng)用模式的確給我們帶來了重要的啟示。