• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    信息化教育中學(xué)生學(xué)習(xí)行為數(shù)據(jù)的分類研究

    2017-06-21 12:04:08鄢慧文
    關(guān)鍵詞:社交分類算法

    鄢慧文,王 磊,李 波

    (華中師范大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)學(xué)院,武漢 430079)

    ?

    信息化教育中學(xué)生學(xué)習(xí)行為數(shù)據(jù)的分類研究

    鄢慧文,王 磊,李 波*

    (華中師范大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)學(xué)院,武漢 430079)

    隨著大數(shù)據(jù)時代的到來,教育信息化發(fā)展迅猛.近年來以云計算、數(shù)據(jù)挖掘、移動互聯(lián)網(wǎng)等為基礎(chǔ)的大數(shù)據(jù)技術(shù)為教育研究提供了多方面支持.利用數(shù)據(jù)技術(shù)進(jìn)行教育領(lǐng)域的研究,為教育教學(xué)決策提供有效支持正在成為教育的發(fā)展趨勢.基于華中師范大學(xué)云課堂平臺上的數(shù)據(jù),通過社群分類算法,對學(xué)生學(xué)習(xí)行為進(jìn)行分類研究.構(gòu)建學(xué)習(xí)行為社交網(wǎng)絡(luò),通過PageRank算法尋找網(wǎng)絡(luò)中的“核心人物”,并結(jié)合SimRank算法實(shí)現(xiàn)分類.

    教育大數(shù)據(jù);社群分類; PageRank算法;SimRank算法

    隨著互聯(lián)網(wǎng)的飛速發(fā)展,人們越來越多的行為在網(wǎng)絡(luò)中發(fā)生,互聯(lián)網(wǎng)包含了海量的相關(guān)數(shù)據(jù),人類已經(jīng)進(jìn)入了一個大數(shù)據(jù)時代.聯(lián)合國在2012年5月發(fā)布的大數(shù)據(jù)白皮書“Big Data for Development: Challenges & Opportunities”中指出,大數(shù)據(jù)時代已經(jīng)到來,大數(shù)據(jù)的出現(xiàn)將會對社會各個領(lǐng)域產(chǎn)生深刻影響[1].大數(shù)據(jù)的意義在于分析研究多種類型數(shù)據(jù)構(gòu)成的數(shù)據(jù)集體,提取有價值的信息,從而幫助人們在解決問題時做出科學(xué)決策.大數(shù)據(jù)在商業(yè)、金融、通訊和醫(yī)療等方面已有較長時間的發(fā)展.在教育領(lǐng)域,隨著國家對教育信息化的快速推進(jìn)和信息技術(shù)與教育教學(xué)的深度融合,大數(shù)據(jù)的教育應(yīng)用研究迅速發(fā)展起來.2014 年教育部辦公廳印發(fā)的《2014 年教育信息化工作要點(diǎn)》中指出:加強(qiáng)對動態(tài)監(jiān)測、決策應(yīng)用、教育預(yù)測等相關(guān)數(shù)據(jù)資源的整合與集成,為教育決策提供及時和準(zhǔn)確的數(shù)據(jù)支持,推動教育基礎(chǔ)數(shù)據(jù)在全國的共享[2].

    隨著教育信息化的推進(jìn),數(shù)字化學(xué)習(xí)已經(jīng)成為當(dāng)今學(xué)習(xí)者的學(xué)習(xí)常態(tài)方式.學(xué)習(xí)者在學(xué)習(xí)終端的支持下在各種學(xué)習(xí)系統(tǒng)中產(chǎn)生大量的數(shù)字化學(xué)習(xí)記錄,教育大數(shù)據(jù)技術(shù)可以有條件地去跟蹤和關(guān)注學(xué)習(xí)者的學(xué)習(xí)過程.在大數(shù)據(jù)支持下,教育政策可以是根據(jù)從大量教育數(shù)據(jù)中挖掘出來的事實(shí)真相制定的措施,因此,教育決策的過程更加科學(xué)化,制定的教育政策更加符合教育教學(xué)的發(fā)展需要,從而可以更好地發(fā)揮教育政策的引導(dǎo)作用.

    當(dāng)前,大數(shù)據(jù)教育的研究內(nèi)容主要包括對教育數(shù)據(jù)挖掘、學(xué)習(xí)分析、個性化教育、教育方式的改善、學(xué)習(xí)策略探討、教育管理方式的改變、大數(shù)據(jù)對于教育的推動作用、數(shù)據(jù)驅(qū)動以及對圖書館建設(shè)、對教與學(xué)需求、評價方法的影響等方面[3-4].雖然國內(nèi)外大數(shù)據(jù)在教育中應(yīng)用的相關(guān)研究涉獵內(nèi)容比較廣泛,但是研究深度不夠,也缺乏具體的實(shí)踐應(yīng)用經(jīng)驗,還需要進(jìn)一步加強(qiáng)大數(shù)據(jù)在教育中應(yīng)用的研究力度,以期盡早推動大數(shù)據(jù)在具體教育實(shí)踐中真正發(fā)揮其優(yōu)勢和作用.本文基于華中師范大學(xué)云課堂平臺[5]上的數(shù)據(jù)對學(xué)生學(xué)習(xí)行為進(jìn)行分析研究,采用定量方法挖掘?qū)W生學(xué)習(xí)行為的內(nèi)在規(guī)律,從而為進(jìn)一步推動教學(xué)精準(zhǔn)化和學(xué)習(xí)個性化提供支持.

    1 研究方法

    1.1 資料來源及說明

    表1 樣本數(shù)據(jù)(部分)

    本文資料來源于華中師范大學(xué)云課堂平臺,收集整理得到某課堂共118名學(xué)生的學(xué)習(xí)行為數(shù)據(jù),樣本數(shù)據(jù)如表1所示.其中,X1為學(xué)生日均在線時長,單位為分鐘(min);X2=1,2,…,5為學(xué)生計算作業(yè)成績;X3=1,2,…,5為學(xué)生證明作業(yè)成績,X6=1,2,…,5為學(xué)生考試成績;1,2,3,4,5則分別表示90分以上,80~<90分,70~<80分,60~<70分和60分以下;X4表示學(xué)生是否屬于課堂論壇的計算版;X5表示學(xué)生是否屬于課堂論壇的推理版,1表示是,0表示否,若某學(xué)生在課堂論壇某版出現(xiàn)3次以上,則認(rèn)為該生屬于某版.

    1.2 模型引入

    基于上述學(xué)生學(xué)習(xí)行為數(shù)據(jù),構(gòu)建學(xué)生學(xué)習(xí)行為社交網(wǎng)絡(luò).對于圖G=(V,E),定義每個學(xué)生為圖中一個頂點(diǎn)Vi;若兩個學(xué)生屬于課堂論壇的同一版或作業(yè)成績相同,則定義這兩個頂點(diǎn)Vi,Vj之間有一條邊E(Vi,Vj).例如,5名學(xué)生的學(xué)習(xí)行為社交網(wǎng)絡(luò)圖如圖1所示.

    本文基于樣本學(xué)習(xí)行為數(shù)據(jù)構(gòu)建的社交網(wǎng)絡(luò)圖如圖2所示.這是一個包含118名學(xué)生的學(xué)習(xí)行為社交網(wǎng)絡(luò).圖2中帶有數(shù)字標(biāo)號的點(diǎn)表示對應(yīng)編號的學(xué)生,點(diǎn)之間的邊表示學(xué)生學(xué)習(xí)行為間的關(guān)系.

    1.2.1 PageRank算法 PageRank算法[6-7]是Google公司專有的網(wǎng)頁排名技術(shù),將網(wǎng)頁之間的相互超鏈接作為網(wǎng)頁排名的要素之一,可衡量特定網(wǎng)頁相對于搜索引擎索引中的其他網(wǎng)頁而言的重要程度,亦有學(xué)者將其應(yīng)用于教育研究中[8-9].其算法原理如下.

    若P存在極限分布,則可求得平穩(wěn)概率分布.

    基于學(xué)生學(xué)習(xí)行為數(shù)據(jù)構(gòu)建學(xué)生學(xué)習(xí)行為社交網(wǎng)絡(luò),于是每位學(xué)生變成社交網(wǎng)絡(luò)中的一點(diǎn),而學(xué)生之間的關(guān)系變?yōu)樯缃痪W(wǎng)絡(luò)中的邊,通過PageRank算法可衡量社交網(wǎng)絡(luò)中不同學(xué)生的重要性.學(xué)生重要性越高,說明其與社交網(wǎng)絡(luò)中其他學(xué)生的連接越多,與社交網(wǎng)絡(luò)中其他學(xué)生的共同點(diǎn)越多(基于本文學(xué)習(xí)行為社交網(wǎng)絡(luò)模型邊的定義),因而越具有代表性.

    1.2.2SimRank算法PageRank算法可實(shí)現(xiàn)學(xué)習(xí)行為社交網(wǎng)絡(luò)中各學(xué)生重要性的衡量,然而本文所研究的是所有樣本的學(xué)習(xí)行為,而非只關(guān)注其中重要性高的點(diǎn),因而還需進(jìn)一步的分析研究.

    與PageRank算法不同的是,SimRank算法[10-12]可基于圖的拓?fù)浣Y(jié)構(gòu)信息來衡量圖中任意兩點(diǎn)的相似程度.其核心思想是如果兩個對象分別和相似的對象相連,那么這兩個對象也相似.容易知道,每個點(diǎn)與其自身相似程度最高.SimRank算法在相似性研究方面應(yīng)用廣泛[13-15].

    記a,b為圖中任意兩點(diǎn),這兩點(diǎn)的SimRank相似度記為s(a,b).I(a)表示所有指向結(jié)點(diǎn)a的結(jié)點(diǎn)集合,則SimRank的迭代公式為:

    實(shí)際應(yīng)用中為方便,亦常使用SimRank算法的矩陣形式.記SimRank相似度矩陣為S,則有:

    2 結(jié)果分析

    為了更好地分析學(xué)生學(xué)習(xí)行為特征,本文基于學(xué)生學(xué)習(xí)行為社交網(wǎng)絡(luò)模型,綜合運(yùn)用PageRank算法和SimRank算法,找出網(wǎng)絡(luò)中具有代表性的學(xué)生,并實(shí)現(xiàn)對網(wǎng)絡(luò)中所有學(xué)生的分類.

    2.1 學(xué)習(xí)行為社交網(wǎng)絡(luò)中代表類型

    通過PageRank算法計算學(xué)習(xí)行為社交網(wǎng)絡(luò)中各學(xué)生重要性的值并排序,可得PageRank數(shù)值最大的兩組學(xué)生如表2所示.

    表2 PageRank計算結(jié)果1

    分析數(shù)據(jù)不難發(fā)現(xiàn),這兩組學(xué)生均既屬于課堂論壇計算版又屬于課堂論壇推理版,與學(xué)習(xí)行為社交網(wǎng)絡(luò)內(nèi)其他學(xué)生連接較為密切,計算能力和推理能力發(fā)展較為平衡,其PageRank值最高符合現(xiàn)實(shí)意義.

    除此之外,PageRank值較大的兩組學(xué)生分別為編號為6,16,32,40,66,68,75,83,85,94,99,104,117的學(xué)生和編號為12,29,34,35,50,55,57,71,72,77,82,88,101,105,113,115的學(xué)生,其PageRank值分別如表3和表4所示.

    分析可知,編號為6,16,32,40,66,68,75,83,85,94,99,104,117的學(xué)生在課堂論壇中屬于推理版而不屬于計算版,且計算作業(yè)成績差于證明作業(yè)成績,說明這些學(xué)生在學(xué)習(xí)中相對偏向推理能力.并且這些學(xué)生的成績均為中等(成績?yōu)?或4),因此可認(rèn)為是推理型學(xué)生的代表人物.

    編號為12,29,34,35,50,55,57,71,72,77,82,88,101,105,113,115的學(xué)生在課堂論壇中屬于計算版而不屬于推理版,且證明作業(yè)成績差于計算作業(yè)成績,說明這些學(xué)生在學(xué)習(xí)中相對偏向計算能力.并且這些學(xué)生的成績均為中等(成績?yōu)?或4),因此可認(rèn)為是計算型學(xué)生的代表人物.

    表3 PageRank計算結(jié)果2

    表4 PageRank計算結(jié)果3

    另外,PageRank值最小的一組學(xué)生如表5所示.他們在課堂論壇中既不屬于計算版,也不屬于推理版,與學(xué)習(xí)行為網(wǎng)絡(luò)中其他學(xué)生連接較少,且成績相對較差(成績?yōu)?或5),學(xué)習(xí)效果相對滯后,其PageRank值最低符合現(xiàn)實(shí)意義.

    表5 PageRank計算結(jié)果4

    通過上述分析,可知學(xué)習(xí)行為社交網(wǎng)絡(luò)中存在四種類型的學(xué)生,分別為平衡型學(xué)生、推理型學(xué)生、計算型學(xué)生以及滯后型學(xué)生.

    2.2 學(xué)習(xí)行為社交網(wǎng)絡(luò)學(xué)生分類

    表6 SimRank計算結(jié)果

    運(yùn)用SimRank算法對學(xué)習(xí)行為社交網(wǎng)絡(luò)中其他學(xué)生進(jìn)一步分析,計算他們與2.1中四組學(xué)生的相似度,其中與推理型代表學(xué)生以及計算型代表學(xué)生相似度如表6所示.

    比較上表中數(shù)據(jù)可得,部分學(xué)生與推理型代表學(xué)生6,16,32,40,66,68,75,83,85,94,99,104,117 SimRank相似度較大,而另一部分學(xué)生與計算型代表學(xué)生12,29,34,35,50,55,57,71,72,77,82,88,101,105,113,115 SimRank相似度較大,據(jù)此可將其分別分為推理型學(xué)生和計算型學(xué)生.

    表7 分類結(jié)果表

    另外,滯后型學(xué)生15,110,11,56,89,95,44,39與推理型代表學(xué)生和計算型代表學(xué)生的SimRank相似度相差不大,且均很低,進(jìn)一步說明他們互相并不在同一類.

    綜合上述分析,可將學(xué)生學(xué)習(xí)行為社交網(wǎng)絡(luò)中的學(xué)生分為4類,分別為平衡型、推理型、計算型和滯后型,具體結(jié)果如表7所示.

    分類結(jié)果圖如圖3所示.其中,藍(lán)色虛線框內(nèi)為推理型學(xué)生,紅色點(diǎn)線框內(nèi)為計算型學(xué)生,綠色實(shí)線框內(nèi)為滯后型學(xué)生,其余為標(biāo)記的為平衡型學(xué)生(位于圖中部).并且,藍(lán)色實(shí)線框以及紅色實(shí)線框內(nèi)分別為推理型學(xué)生和計算型學(xué)生的代表人物,亦即“核心人物”.

    圖3 分類結(jié)果Fig.2 Results of classification

    3 總結(jié)及展望

    學(xué)生學(xué)習(xí)行為數(shù)據(jù)的分類研究可為教育教學(xué)中進(jìn)一步研究提供參考和支持.例如本文通過分析將學(xué)習(xí)行為社交網(wǎng)絡(luò)中的學(xué)生分為平衡型、推理型、計算型和滯后型,基于此可進(jìn)一步研究造成這種現(xiàn)象的因素、針對不同類型學(xué)生的不同教學(xué)方案和不同類型學(xué)生在學(xué)習(xí)過程中的差異等諸多問題.以此促進(jìn)學(xué)習(xí)個性化和教學(xué)精準(zhǔn)化的推進(jìn).

    當(dāng)前,教育大數(shù)據(jù)的研究尚不成熟,有待進(jìn)一步思考和研究.隨著教育信息化的不斷推進(jìn)和大數(shù)據(jù)技術(shù)的不斷發(fā)展,相信教育大數(shù)據(jù)將為我國教育事業(yè)的發(fā)展提供強(qiáng)有力的支持和幫助.

    [1] UN Global Pulse.Big Data for Development: Challenges and Opp-ortunities[OL].(2012-05-29)[2016-09-08]. http://www.unglobalpulse.org/sites/default/files/BigDataforDevelopment-UNGlobalPulseMay2012.pdf.

    [2] 教育部辦公廳.關(guān)于印發(fā)《2014年教育信息化工作要點(diǎn)》的通知[OL].(2014-03-12)[2016-09-08]. http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/s7062/201403/165870.html.

    [3] 劉鳳娟.大數(shù)據(jù)的教育應(yīng)用研究綜述[J].現(xiàn)代教育技術(shù),2014, 24(8):13-19.

    [4] 馬婧,韓錫斌,周潛.基于學(xué)習(xí)分析的高校師生在線教學(xué)群體行為的實(shí)證研究[J].電化教育研究,2014(2):13-18.

    [5] 孫建文,張昭理,劉三女牙,等. 基于開源技術(shù)的云課堂平臺構(gòu)建[J].中國教育信息化,2014(19):19-23.

    [6] PAGE L,BRIN S,MOTWANI R,et al.The PageRank citation ranking: bringing order to the web [OL].(1999-01-20)[2016-08-15].http://ilpubs.stanford.edu:8090/422/1/1999-66.pdf.

    [7] 李青淋,邵家玉. PageRank 算法的研究與改進(jìn)[J].工業(yè)控制計算,2016,29(5):117-118.

    [8] LONDON A, NEMETH T.Student evaluation by graph based data mining of administrational systems of education[C]∥RACHEV B,SMRIKAROV A.Proceedings of the 15th International Conference on Computer Systems and Technologies.Bulgaria:Association for Computing Machinery,2014:363-369.

    [9] WANG Y Y,KAVAI Y,MIYAMOTO S,et al.A students'mutual eva-luation method for their reports using PageRank algorithm[C]∥LIU,C.-C.et al,Proceedings of the 22nd international conference oncomputers in education.Japan:Asia-Pacific Society for Computers in Education,2014:113-115.

    [10] JEH G,WIDOM J.SimRank:a measure of structural-context similarity[C]∥VAN HAVER S,JANSSEN AJEM.In proceedings of the Eighth ACM SIGKDD international conference on knowledge discovery and data mining,Canada:Association for Computing Machinery,2002:538-543.

    [11] FOGARAS D,RACZ.Scaling link-based similarity search[C]∥ELLIS A,HAGINO T.Proceedings of the 14th international conference on World Wide Web.Japan:Association for Computing Machinery,2005:641-650.

    [12] LI C P,HAN J W,HE G M,et al.Fast Computation of SimRank for Static and Dynamic Information Networks[C]∥MANOLESCU I,SPACCAPIETRA S.Teubner J,et al,Proceedings of the 13th International Conference on Extending Database Technology.Switzerland:Association for Computing Machinery,2010:465-476.

    [13] 劉萍,黃純?nèi)f.基于SimRank的作者相似度計算[J].情報理論與實(shí)踐,2015,38(6):109-114.

    [14] 尹坤,尹紅風(fēng),楊燕,等.基于SimRank的百度百科詞條語義相似度計算[J].山東大學(xué)學(xué)報(工學(xué)版),2014,44(3):29-34.

    [15] AL-ADROUSY W M,ALI H A,HAMZA T T.A Framework for Career-Education Hybrid Recommender System using a Selective Path Delta-SimRank Algorithm[J].International Journal of Computer Applications, 2014,90(2):42-47.

    責(zé)任編輯:高 山

    Study on Classification of Students′ Learning Behavior in Information Education

    YAN Huiwen,WANG Lei, LI Bo

    (School of Mathematics and Statistics, Central China Normal University, Wuhan 430079, China)

    With the advent of the era of big data,the information education is developing rapidly.In recent years,big data technology based on cloud computing,data mining and Internet provides a wide range of support for educational research.Using data technology in the field of education research to provide effective support of teaching decision-making is becoming the trend of education.Based on the data on the cloud classroom platform of Central China Normal University,this paper classifies the students' learning behavior through the community classification algorithm.The paper constructs the learning behavior social network,figures out the core characters in the network by PageRank algorithm, and classifies the subjects by SimRank algorithm.

    big data and education;community classification; PageRank; SimRank

    2016-12-05.

    湖北省高等學(xué)校省級教學(xué)研究項目(2016086);華中師范大學(xué)中央高?;究蒲袠I(yè)務(wù)費(fèi)教育科學(xué)專項(KJ02072016-0222).

    鄢慧文(1993-),女,碩士生,主要從事數(shù)理統(tǒng)計的研究;*

    李波(1977-),男,副教授,主要從事應(yīng)用概率統(tǒng)計和教育大數(shù)據(jù)的研究.

    1008-8423(2017)02-0152-05

    10.13501/j.cnki.42-1569/n.2017.06.009

    O212.1

    A

    猜你喜歡
    社交分類算法
    社交之城
    英語世界(2023年6期)2023-06-30 06:28:28
    社交牛人癥該怎么治
    意林彩版(2022年2期)2022-05-03 10:25:08
    分類算一算
    社交距離
    基于MapReduce的改進(jìn)Eclat算法
    Travellng thg World Full—time for Rree
    分類討論求坐標(biāo)
    進(jìn)位加法的兩種算法
    你回避社交,真不是因為內(nèi)向
    文苑(2018年17期)2018-11-09 01:29:28
    數(shù)據(jù)分析中的分類討論
    南部县| 林州市| 天祝| 天镇县| 友谊县| 澜沧| 博湖县| 牟定县| 阿坝县| 彩票| 宁南县| 安岳县| 仁寿县| 达日县| 武宁县| 尼勒克县| 阜南县| 澄迈县| 海晏县| 阿尔山市| 新安县| 界首市| 林甸县| 洛南县| 墨玉县| 高安市| 吴江市| 宜城市| 三明市| 太原市| 庆安县| 清水河县| 永吉县| 宁海县| 腾冲县| 雅安市| 昆明市| 滦南县| 栾城县| 兴海县| 克东县|