年晴
摘要:為了實現(xiàn)漢語言在線學(xué)習(xí)用戶學(xué)習(xí)行為聚類分析,針對FCM聚類結(jié)果易受其初始聚類中心選擇的影響,提出一種基于IHSFCM的漢語言學(xué)習(xí)用戶學(xué)習(xí)行為聚類分析。選擇參與維度、專注維度、規(guī)律維度、交互維度和學(xué)習(xí)成績等作為學(xué)習(xí)行為的分析指標(biāo),學(xué)習(xí)者層次分為5個等級,分別為優(yōu)秀、良好、中、合格和差。與HSFCM、SVM和決策樹對比發(fā)現(xiàn),文中算法IHSFCM具有更高的聚類準(zhǔn)確率和更快的收斂速度以及更低的適應(yīng)度,為學(xué)習(xí)者層次劃分和優(yōu)化課程學(xué)習(xí)提供了新的方法。
關(guān)鍵詞:在線學(xué)習(xí);漢語言;學(xué)習(xí)行為;模糊均值聚類;和聲搜索算法
中圖分類號:TP391
文獻(xiàn)標(biāo)志碼:A
StudyontheLearningBehaviorModelofChineseLanguage
LearnersBasedonImprovedFuzzyCmeansClustering
NIANQing
(
SchoolofHumanitiesManagement,ShanxiUniversityofTraditionalChineseMedicine,Xian712046,China
)
Abstract:InordertoanalyzethelearningbehaviorofChineselanguageonlinelearners,duetoFCMclusteringresultsareeasilyaffectedbytheinitialclustercenterselection,thispaperpresentsaclusteringanalysisofChineselanguagelearningbehaviorbasedonIHSFCM.Participationdimension,attentiondimension,regularitydimension,interactiondimensionandlearningachievementareselectedastheanalysisindexesoflearningbehavior.Thelearners'levelisdividedinto5grades,i.e.,excellent,good,medium,qualifiedandpoor.ComparedwithHSFCM,SVManddecisiontree,theIHSFCMhashigherclusteringaccuracy,fasterconvergencespeedandlowerfitness.Itprovidesanewmethodforlearnerstodivideandoptimizecourselearning.
Keywords:onlinelearning;Chineselanguage;learningbehavior;fuzzyCmeansclustering;harmonysearchalgorithm
0引言
隨著我國經(jīng)濟(jì)的快速發(fā)展和綜合國力的不斷上升,對外交流和對外貿(mào)易的深度和規(guī)模不斷加深和擴(kuò)大以及網(wǎng)絡(luò)教學(xué)和在線課程的飛速發(fā)展,漢語言學(xué)習(xí)的人數(shù)和規(guī)模不斷增加和擴(kuò)大,積累了大量的學(xué)習(xí)數(shù)據(jù),如何利用這些學(xué)習(xí)數(shù)據(jù)挖掘出學(xué)習(xí)數(shù)據(jù)的內(nèi)在價值更好地服務(wù)于漢語言的教與學(xué),引起了廣泛關(guān)注和研究[12]。因此研究漢語言學(xué)習(xí)用戶的學(xué)習(xí)行為對優(yōu)化課程教學(xué)和完善課程評估具有重要意義。
模糊C均值(FuzzyCmean,F(xiàn)CM)聚類[3]是運用隸屬度確定每個數(shù)據(jù)樣本類別的方法,具有效率高、計算量小的優(yōu)點,然而FCM聚類結(jié)果易受其初始聚類中心選擇的影響,本文將和聲搜索算法(HarmonySearch,HS)應(yīng)用于FCM初始聚類中心的選擇,提出一種基于IHSFCM的漢語言學(xué)習(xí)用戶學(xué)習(xí)行為聚類分析。研究結(jié)果表明,IHSFCM具有更快的收斂速度和更低的適應(yīng)度,效果較HSFCM更優(yōu),為漢語言課程學(xué)習(xí)優(yōu)化提供科學(xué)決策的依據(jù)。
1改進(jìn)的HS算法
(1)隨機(jī)位置更新
若HS算法中最差和最好和聲分別為xworst以及xbest,將xworst視為基向量,則較優(yōu)和聲通過學(xué)習(xí)xbest調(diào)節(jié)出來,本文提出一種基于隨機(jī)位置更新的方法如式(1)—式(2)。
xnewi=xri+rand×(xd-xri)
(1)
xd=F×xbesti-xri,r∈(1,2,…,HMS)
(2)
若xr
(2)反向?qū)W習(xí)
為擴(kuò)大HS算法的搜索空間,將反向?qū)W習(xí)[45]引入HS算法,反向?qū)W習(xí)策略如式(3)。
xnewi=
xUi+xLi-xri,rand≤0.5
xri,其他
(3)
(3)小概率變異
HS算法中的小概率變異操作如式(4)。
xnewi=xLi+rand×(xUi-xLi)
(4)
如果rand≤Pm,則進(jìn)行小概率變異,取Pm=0.005。
(4)修正音調(diào)微調(diào)概率
音調(diào)微調(diào)概率PAR可設(shè)計如式(5)。
PARt+1=PARmax-PARminT·t+PARmin
(5)
式(5)中,PARmax、PARmin為音調(diào)微調(diào)概率的最大值和最小值;PARt+1為第t+1次的音調(diào)微調(diào)概率。
改進(jìn)HS算法流程,如圖1所示。
2基于IHSFCM聚類
2.1學(xué)習(xí)行為分析指標(biāo)
為實現(xiàn)漢語言學(xué)習(xí)用戶學(xué)習(xí)行為的分析,在參考文獻(xiàn)[68]基礎(chǔ)上,選擇參與維度、專注維度、規(guī)律維度、交互維度和學(xué)習(xí)成績等作為評價指標(biāo),詳細(xì)評價指標(biāo),如表1所示。
2.2FCM聚類
假設(shè)樣本數(shù)據(jù)x={x1,x2,…,xn},樣本數(shù)據(jù)為n個,每個元素包含d個屬性。FCM聚類數(shù)目為C(2≤C≤n),聚類中心W={w1,w2,…,wC}。由于FCM模糊聚類的每個元素類別不能被嚴(yán)格劃分到具體的某一類別之中,所以令μik為第k個元素屬于第i類的隸屬度,其中
∑Ci=1μik=1,μik∈[0,1]。
FCM模糊均值聚類的目標(biāo)函數(shù)定義為:
minJm(U,W)=∑nk=1
∑Ci=1μbikd2ik
(6)
式中,b為指數(shù)權(quán)重,文中取b=2;U為隸屬度矩陣;dik=||xk-wi||表示元素xk與類中心wi二者之間的歐式距離。FCM模糊均值聚類的中心思想就是不斷調(diào)整(U,W)使得目標(biāo)函數(shù)Jm(U,W)最小。FCM模糊均值聚類的迭代步驟為:
Step1:設(shè)定聚類數(shù)目C(2≤C≤n)和指數(shù)權(quán)重b,并隨機(jī)初始化聚類中心矩陣W(0),令迭代次數(shù)l=0;
Step2:計算隸屬度矩陣U;
u(l)ik=
1/∑Cj=1(dik/djk)2b-1,dik>0
1,dik=0
(7)
Step3:修正聚類中心W;
w(l+1)i=∑nk=1(μ(l)ik)bxk∑nk=1(μ(l)ik)b
(8)
Step4:對于給定閾值ε>0,若J(l)m-J(l-1)m≤ε,則FCM算法結(jié)束,此時對應(yīng)的最優(yōu)聚類中心W(l)=w(l)1,w(l)2,…,w(l)C;反之,l=l+1,返回Step2。
2.3IHSFCM聚類
IHSFCM聚類思想:先隨機(jī)產(chǎn)生幾組聚類中心點,運用IHS算法的思想變化區(qū)域中心點計算適應(yīng)度,淘汰適應(yīng)度低的中心點和產(chǎn)生新的中心點,重新迭代計算,如此反復(fù),直到滿足結(jié)束條件為止,算法流程圖,如圖2所示。
基于IHSFCM的漢語言在線學(xué)習(xí)用戶學(xué)習(xí)行為聚類分析算法可以具體詳細(xì)地描述為:
Step1:讀取漢語言在線學(xué)習(xí)用戶學(xué)習(xí)行為分析指標(biāo)數(shù)據(jù);
Step2:初始化HS算法參數(shù):創(chuàng)作的次數(shù)T、聲記憶庫的個數(shù)HMS、音調(diào)微調(diào)的概率PAR、音調(diào)微調(diào)的帶寬bw以及和聲記憶庫保留的概率HMCR;
Step3:初始化和聲記憶庫;
Step4:生成新和聲;
Step4:更新和聲記憶庫:根據(jù)適應(yīng)度函數(shù)(6)評價Step3中的新解,若比HM中的函數(shù)值最差的一個好,則更新至HM中;
Step5:重復(fù)Step3和Step4,直到滿足終止條件,輸出FCM最優(yōu)聚類中心,并將FCM最優(yōu)聚類中心帶入FCM模型進(jìn)行漢語言在線學(xué)習(xí)用戶學(xué)習(xí)行為聚類。
3實證分析
3.1數(shù)據(jù)來源
為了驗證本文算法的有效性,選擇網(wǎng)易公開課《漢語言文字學(xué)類課程導(dǎo)論》在線課程學(xué)習(xí)數(shù)據(jù)為研究對象[1213],將學(xué)習(xí)者層次分為5個等級,分別為優(yōu)秀、良好、中、合格和差,不同學(xué)習(xí)者類型數(shù)據(jù)分布,如表2所示。
3.2評價指標(biāo)
為了說明漢語言在線學(xué)習(xí)用戶學(xué)習(xí)行為聚類分析的效果,評價指標(biāo)選擇聚類
準(zhǔn)確率T和誤判率F。
(1)準(zhǔn)確率T:如果學(xué)習(xí)者類型被正確聚類的數(shù)量為A,而學(xué)習(xí)者類型的實際數(shù)量為B,則學(xué)習(xí)者類型聚類的準(zhǔn)確率如式(9)。
T=AB×100%
(9)
(2)誤判率F:如果學(xué)習(xí)者類型是第i類的實際數(shù)量為H,而將第i類學(xué)習(xí)者類型誤判為第j類學(xué)習(xí)者類型的數(shù)量為G,則學(xué)習(xí)者類型判斷的誤判率如式(10)。
Fij=GH×100%
(10)
3.3實驗結(jié)果
為了驗證漢語言在線學(xué)習(xí)用戶學(xué)習(xí)行為聚類算法的效果,將本文算法IHSFCM和HSFCM[14]、SVM[15]和決策樹[1617]進(jìn)行對比,如表3和圖3圖7所示。
IHS算法參數(shù)設(shè)置為:種群規(guī)模為10,最大迭代次數(shù)為100,聚類結(jié)果如表3所示。IHSFCM和HSFCM收斂曲線
對比如圖7所示,由圖7可知,IHSFCM具有更快的收斂速度和更低的適應(yīng)度,效果較HSFCM更優(yōu)。
圖3圖7中,“*”表示學(xué)習(xí)者層次的預(yù)測類別,“○”表示學(xué)習(xí)者層次的實際類別,通過對比展示可以直觀地顯示學(xué)習(xí)者層次聚類結(jié)果和實際學(xué)習(xí)者層次類別,其中1、2、3、4、5分別表示學(xué)習(xí)者層次為優(yōu)秀、良好、中、合格和差。當(dāng)“*”和“○”重合時,學(xué)習(xí)者層次的預(yù)測類別和實際類別一致,說明聚類正確;當(dāng)“*”和“○”不重合時,學(xué)習(xí)者層次的預(yù)測類別和實際類別不一致,此時學(xué)習(xí)者層次聚類錯誤。由表3和圖3圖6可知,IHSFCM的聚類準(zhǔn)確率和誤判率分別為99.42%和0.58%,優(yōu)于HSFCM的96.27%和3.73%,SVM的96.40%和3.55%和決策樹的92.30%和2.70%。與HSFCM、SVM和決策樹對比發(fā)現(xiàn),本文算法IHSFCM具有更高的聚類準(zhǔn)確率,為學(xué)習(xí)者層次劃分和優(yōu)化課程學(xué)習(xí)提供了新的方法。
4總結(jié)
為了實現(xiàn)漢語言在線學(xué)習(xí)用戶學(xué)習(xí)行為聚類分析,針對FCM聚類結(jié)果易受其初始聚類中心選擇的影響,提出一種基于IHSFCM的漢語言學(xué)習(xí)用戶學(xué)習(xí)行為聚類分析。研究結(jié)果表明,IHSFCM具有更快的收斂速度和更低的適應(yīng)度,效果較HSFCM更優(yōu),為漢語言課程學(xué)習(xí)優(yōu)化提供科學(xué)決策的依據(jù)。然而,由于本文學(xué)習(xí)行為分析指標(biāo)可能考慮不夠全面,導(dǎo)致聚類效果存在適應(yīng)性較差的缺點,后續(xù)將考慮更多因素的在線學(xué)習(xí)行為聚類分析,從而提高學(xué)習(xí)行為分析模型的準(zhǔn)確性和適用性。
參考文獻(xiàn)
[1]
胡藝齡,顧小清,趙春.在線學(xué)習(xí)行為分析建模及挖掘[J].開放教育研究,2014,20(2):102110.
[2]范潔,楊岳湘,溫璞.C4.5算法在在線學(xué)習(xí)行為評估系統(tǒng)中的應(yīng)用[J].計算機(jī)工程與設(shè)計,2016(6):946948.
[3]王法玉,姜妍.基于自組織神經(jīng)網(wǎng)絡(luò)和模糊聚類的校園無線網(wǎng)用戶學(xué)習(xí)興趣度行為分析[J].計算機(jī)應(yīng)用研究,2018,35(1):1115.
[4]劉思遠(yuǎn).一種新的多目標(biāo)改進(jìn)和聲搜索優(yōu)化算法[J].計算機(jī)工程與應(yīng)用,2010,46(34):2730.
[5]陳春,汪沨,劉蓓,等.基于基本環(huán)矩陣與改進(jìn)和聲搜索算法的配電網(wǎng)重構(gòu)[J].電力系統(tǒng)自動化,2014,38(6):5560.
[6]李爽,王增賢,喻忱,等.在線學(xué)習(xí)行為投入分析框架與測量指標(biāo)研究——基于LMS數(shù)據(jù)的學(xué)習(xí)分析[J].開放教育研究,2016,22(2):7990.
[7]曹建芳,郝耀軍.基于并行AdaboostBP網(wǎng)絡(luò)的大規(guī)模在線學(xué)習(xí)行為評價[J].計算機(jī)應(yīng)用與軟件,2017,34(7):267272.
[8]陳志雄.基于藍(lán)墨云班課的語文在線學(xué)習(xí)行為數(shù)據(jù)分析——中職語文混合式學(xué)習(xí)在線學(xué)習(xí)行為的數(shù)據(jù)挖掘與學(xué)習(xí)分析[J].現(xiàn)代職業(yè)教育,2018(11):2426.
[9]李小娟,梁中鋒,趙楠.在線學(xué)習(xí)行為對混合學(xué)習(xí)績效的影響研究[J].現(xiàn)代教育技術(shù),2017(2):8086.
[10]吳林靜,勞傳媛,劉清堂,等.網(wǎng)絡(luò)學(xué)習(xí)空間中的在線學(xué)習(xí)行為分析模型及應(yīng)用研究[J].現(xiàn)代教育技術(shù),2018,28(6):4754.
[11]劉冰,李彥敏.SPOC學(xué)習(xí)者在線學(xué)習(xí)行為特征分析——基于互動視角[J].集美大學(xué)學(xué)報(教育科學(xué)版),2019,20(1):3338.
[12]陳鵬宇,馮曉英,孫洪濤,等.在線學(xué)習(xí)環(huán)境中學(xué)習(xí)行為對知識建構(gòu)的影響[J].中國電化教育,2015(8):5963.
[13]宗陽,陳麗,鄭勤華,等.基于在線學(xué)習(xí)行為數(shù)據(jù)的遠(yuǎn)程學(xué)習(xí)者學(xué)業(yè)情緒分析研究——以Moodle平臺為例[J].開放學(xué)習(xí)研究,2017(6):1120.
[14]宗陽,鄭勤華,陳麗.中國MOOCs學(xué)習(xí)者價值研究——基于RFM模型的在線學(xué)習(xí)行為分析[J].現(xiàn)代遠(yuǎn)距離教育,2016(2):2128.
[15]孔麗麗,馬志強(qiáng),易玉何,等.在線學(xué)習(xí)行為影響因素模型研究——基于行為科學(xué)理論的評述[J].開放學(xué)習(xí)研究,2017,22(5):4653.
[16]王士霞.基于決策樹的在線學(xué)習(xí)行為分析[J].河南科技學(xué)院學(xué)報(自然科學(xué)版),2015,43(5):6770.
[17]顧倩頤.基于在線學(xué)習(xí)行為的個性化學(xué)習(xí)需求智能挖掘技術(shù)研究[J].軟件導(dǎo)刊,2015,14(12):1214.
(收稿日期:2020.03.24)