楊宇,鄒臣嵩,譚永洲
(廣東松山職業(yè)技術(shù)學(xué)院機械工程系,廣東韶關(guān)512126)
一種基于序列聚類的現(xiàn)代學(xué)徒制課程體系建構(gòu)方法
楊宇,鄒臣嵩,譚永洲
(廣東松山職業(yè)技術(shù)學(xué)院機械工程系,廣東韶關(guān)512126)
采用多種數(shù)據(jù)挖掘算法建構(gòu)現(xiàn)代學(xué)徒制課程體系的組織結(jié)構(gòu),解決將職業(yè)教育的課程裝進“學(xué)科體系”架構(gòu)之中被“強制性”序化的問題,改變將復(fù)雜多變的內(nèi)容主觀機械地套入既定的課程結(jié)構(gòu)模式的常見做法.用關(guān)聯(lián)規(guī)則算法分析課程前導(dǎo)后續(xù)的關(guān)聯(lián)關(guān)系,用序列模式算法分析課程開設(shè)學(xué)期的序列關(guān)聯(lián)關(guān)系,定義課程序列結(jié)構(gòu)、內(nèi)容和加權(quán)相似性的度量方法,提出基于全局中心的序列相似性距離乘積最大法來改進K均值聚類算法,并生成現(xiàn)代學(xué)徒制課程體系結(jié)構(gòu).
序列;聚類;現(xiàn)代學(xué)徒制;課程體系建構(gòu)
現(xiàn)代學(xué)徒制是國家大力推廣的職業(yè)教育模式,是職業(yè)教育模式改革的集大成者,其在強調(diào)雙主體、雙身份、雙導(dǎo)師、一體化育人之外,更加突出在崗培養(yǎng)、在崗成才.現(xiàn)代學(xué)徒制專業(yè)教學(xué)標準的研制路徑包括供需調(diào)研、職業(yè)能力分析、課程體系建構(gòu)、標準編制四個階段[1],根據(jù)調(diào)研得出的“職業(yè)生涯發(fā)展路徑表”,從項目、任務(wù)、能力點三個層次解構(gòu)職業(yè)能力,獲得了大量的“原子態(tài)”的能力要素、頻率系數(shù)、重要性系數(shù)、項目評定系數(shù)[2]以及課程開設(shè)學(xué)期、前導(dǎo)后續(xù)課程等數(shù)據(jù).傳統(tǒng)的課程體系建構(gòu)多采用頭腦風(fēng)暴、多元協(xié)商等定性的方法,采集的大量數(shù)據(jù)沒有發(fā)揮應(yīng)有的作用.而數(shù)據(jù)挖掘等社會實證的方法是基于對數(shù)據(jù)的定量研究來建構(gòu)課程體系,是對定性分析的重要補充,不但可以提高課程體系與企業(yè)的動態(tài)行動體系匹配度,方便實現(xiàn)在崗培養(yǎng)和在崗成才,還可以挖掘出人們無法用觀察法準確鑒定的社會現(xiàn)實問題,幫助破譯不同生產(chǎn)環(huán)境條件下完成任務(wù)(課程)的工作過程[3],分析出課程之間隱藏的內(nèi)在聯(lián)系,揭示隱含的規(guī)律.本文以廣東省現(xiàn)代學(xué)徒制培養(yǎng)試點項目——機電設(shè)備維修與管理專業(yè)的課程體系建構(gòu)為例進行了關(guān)聯(lián)規(guī)則分析、序列模式分析和K均值聚類分析等數(shù)據(jù)挖掘研究,提出了一種課程體系建構(gòu)方案.
課程設(shè)計有兩個決定性因素:一是課程內(nèi)容的選擇,也就是對“筑道材料”的選擇;另一個是課程內(nèi)容的序化,也就是對“跑之過程”的確定[4].對于課程體系來講決定性因素也是一致的,職業(yè)能力分析和典型工作任務(wù)分析選擇了現(xiàn)代學(xué)徒制課程體系的內(nèi)容,需要突破的是課程間的序化問題,即課程組織結(jié)構(gòu)問題.
課程體系的組織結(jié)構(gòu)問題是當(dāng)前職業(yè)教育課程改革面臨的重要問題,也是難點問題[5].當(dāng)前研究職業(yè)教育課程體系的組織結(jié)構(gòu)主要集中在兩個方向:一是課程體系的組織原理和方法,二是課程體系的結(jié)構(gòu)模式和構(gòu)建.前者研究的重點是組織的思想、原理、原則,在組織方法與技術(shù)層面的研究還比較欠缺[6],還沒有形成比較成熟和易于操作的方法與技術(shù),造成已經(jīng)明確選取的凸現(xiàn)職業(yè)教育特色的課程內(nèi)容被重新裝進“學(xué)科體系”的架構(gòu)之中而被“強制性”地序化,以致課程又重新成為被簡化了的、被壓縮了的學(xué)科課程的翻版[7].后者的研究重點是模式分類與構(gòu)建,當(dāng)前適于職業(yè)教育的課程結(jié)構(gòu)模式有很多,但從結(jié)構(gòu)角度基本都可以分為專門化課程模式、系列化課程模式、階段化課程模式和模塊化模式.其中模塊化模式逐步成為主流,它又包括CBE指導(dǎo)下的DACUM法常采用的模塊化矩陣式課程模式和國際勞工組織的MES培訓(xùn)體系常采用的模塊化組合式課程模式[8],以及“寬基礎(chǔ)活模塊”等眾多國內(nèi)改進模式.這些模式為現(xiàn)代學(xué)徒制課程體系的建構(gòu)提供了很好的結(jié)構(gòu)模板,操作性也強,但依然存在將復(fù)雜多變的內(nèi)容主觀機械地套入既定模式的問題,很少著眼于蘊含在動態(tài)行動體系之中的隱性實踐知識的生成與構(gòu)建[7].
典型工作任務(wù)轉(zhuǎn)換為課程后,確定了課程內(nèi)容,也明確了課程的數(shù)量、功能與屬性等課程組織要素,但并未生成與構(gòu)建出現(xiàn)代學(xué)徒制課程體系的組織結(jié)構(gòu),而要完成此項任務(wù)必須先明確課程間的關(guān)聯(lián)關(guān)系.
姜大源將課程內(nèi)容的關(guān)聯(lián)關(guān)系分為“平行、遞進、包容的邏輯關(guān)系,或者是這三者排列組合的結(jié)果”,為方便表達關(guān)聯(lián)關(guān)系的結(jié)構(gòu),項目組將課程間的關(guān)聯(lián)關(guān)系修正為串行遞進、并行組合、串并交叉三種關(guān)系.
上述三種關(guān)聯(lián)關(guān)系的排列組合就生長與構(gòu)建出了課程結(jié)構(gòu):具有串行遞進關(guān)系的課程形成一條職業(yè)能力培養(yǎng)的課程鏈路;相對獨立的課程鏈路通過并行組合實現(xiàn)專業(yè)培養(yǎng)目標要求的多項職業(yè)能力的培養(yǎng);與相對獨立的課程鏈路交叉較多的鏈路形成輔助鏈路,顯化隱含的職業(yè)能力培養(yǎng)路徑.
上述三種關(guān)聯(lián)關(guān)系在程度上還有強弱之分,并作用于課程結(jié)構(gòu):若同一條串行遞進鏈路上的課程遞進關(guān)系變?nèi)蹙陀锌赡墚a(chǎn)生串并交叉,形成輔助鏈路;若遞進關(guān)系繼續(xù)弱化就應(yīng)該將課程歸屬到不同的并行鏈路中構(gòu)成組合關(guān)系;若多條鏈路出現(xiàn)同一課程則該課程就有可能是交叉課程甚至公共平臺課程,反之若鏈路中都不出現(xiàn)的課程就屬于孤立課程,并有可能獨立形成新的鏈路.
項目組采集了課程開設(shè)學(xué)期、前導(dǎo)課程和后續(xù)課程三個關(guān)聯(lián)關(guān)系數(shù)據(jù),課程只涉及能全面反映動態(tài)行動體系復(fù)雜關(guān)聯(lián)關(guān)系的13門專業(yè)技術(shù)技能課和學(xué)徒崗位能力課,提高了數(shù)據(jù)的針對性和準確性;樣表如表1.數(shù)據(jù)采集面向11名企業(yè)專家,5名校外課程專家,5名校內(nèi)骨干教師,5名學(xué)徒,共采集了1 358個樣本數(shù)據(jù),樣本量滿足數(shù)據(jù)分析要求.
用傳統(tǒng)統(tǒng)計方法分析“開設(shè)學(xué)期”數(shù)據(jù)時發(fā)現(xiàn)部分課程的開設(shè)學(xué)期非常分散,得不出具備統(tǒng)計意義的開設(shè)學(xué)期結(jié)論.其次,分析“前導(dǎo)后續(xù)”數(shù)據(jù)時,課程排序數(shù)量巨大,而且矛盾排序很多,無法得出課程的前后關(guān)聯(lián)關(guān)系.第三,無法將“開設(shè)學(xué)期”的時間關(guān)系與“前導(dǎo)后續(xù)”的順序關(guān)系有機的統(tǒng)一起來分析.
本文用數(shù)據(jù)挖掘方法分析課程間關(guān)聯(lián)關(guān)系數(shù)據(jù)的方案設(shè)計,具體步驟如下:(1)用Apriori算法分析課程前導(dǎo)后續(xù)的關(guān)聯(lián)關(guān)系,篩選出大于一定強度閾值的關(guān)聯(lián)規(guī)則及其2-序列;(2)用Sequence pattern算法分析課程開設(shè)學(xué)期的序列關(guān)聯(lián)關(guān)系,篩選出大于一定強度閾值的序列關(guān)聯(lián)規(guī)則及其2-序列;(3)合并上述兩種算法篩選出的具有相同形式的2-序列,并定義序列的相似性度量方法;(4)提出一種基于全局中心的序列相似性距離乘積最大法來改進K-means算法,并對合并的序列進行聚類分析;(5)按聚類結(jié)果構(gòu)建課程體系并進行評估.
本方案解決了傳統(tǒng)統(tǒng)計方法的問題,能分析時間關(guān)系與順序關(guān)系的強弱并加以取舍,還能將兩種性質(zhì)完全不同的關(guān)聯(lián)關(guān)系有機的統(tǒng)一起來.
表1 課程關(guān)系數(shù)據(jù)采集樣表
5.1 用Apriori算法分析課程前導(dǎo)后續(xù)的關(guān)聯(lián)關(guān)系
Apriori算法是最為經(jīng)典的關(guān)聯(lián)規(guī)則算法,是通過分層搜索挖掘單維邏輯型關(guān)聯(lián)規(guī)則頻繁項目集的有效算法,其任務(wù)是在事務(wù)數(shù)據(jù)庫中找出具有給定最小支持度和最小置信度的強關(guān)聯(lián)規(guī)則[9].
本方案將“項目”定義為兩門有前導(dǎo)后續(xù)關(guān)系的課程的組合,如AB,它指先開設(shè)A課程再開設(shè)B課程,因此候選項目集為{AB,AC,AD,……,MJ,MK,ML},共包含156個項目.本文選擇IBM SPSS MODELER的14.1版進行計算,規(guī)定規(guī)則最小支持度為12.5%,規(guī)則最小置信度為60%,算法分析后生成形如“AB→CD”的強關(guān)聯(lián)規(guī)則,其包含的2-序列為AB、AC、AD、BC、BD、CD.
5.2 用Sequence pattern算法分析課程開設(shè)學(xué)期的序列關(guān)聯(lián)關(guān)系
Sequence pattern算法是序列關(guān)聯(lián)分析的經(jīng)典算法,它采用邊讀入邊計算再批量篩選的動態(tài)處理策略,將頻繁序列組織成鄰接格的形式,使序列規(guī)則的生成更加準確,也降低了計算開銷[10].
本文選擇IBM SPSS MODELER的14.1版進行計算,規(guī)定規(guī)則最小支持度為30%,規(guī)則最小置信度為70%,算法分析后生成形如“C and D>E→F”的強關(guān)聯(lián)規(guī)則,其包含的2-序列可以簡化為不含并列關(guān)系的CD、CE、CF、DE、DF、EF、DC.
5.3 定義課程序列的相似性度量方法
上述分析已經(jīng)將兩種關(guān)系統(tǒng)一為不含并列關(guān)系的2-序列,將其合并后生成新的序列數(shù)據(jù)事務(wù)庫,候選集包括156個項目,項目是由A到M的13個元素中的兩個相異元素有序排列而成.針對課程序列的特點和建構(gòu)課程體系的需求,項目組采用一種新的方法定義課程序列的相似性及相似性距離.
定義1序列結(jié)構(gòu)相似度.假設(shè)Si和Sj是序列數(shù)據(jù)事務(wù)庫中的兩個序列,則序列Si和序列Sj的結(jié)構(gòu)相似度Csim(Si,Sj):
式中COM(Si)、COM(Sj)表示序列Si、Sj所包含的元素的集合;∣COM(Si)∩COM(Sj)∣表示序列Si、Sj所共有的元素的個數(shù),∣COM(Si)∪COM(Sj)∣表示序列Si、Sj所包含的全部元素的個數(shù).
Csim(Si,Sj)的取值范圍是[0,1],當(dāng)Csim(Si,Sj)=0時,序列Si和Sj之間沒有任何結(jié)構(gòu)相似性;當(dāng)Csim(Si,Sj)=1時,序列Si和Sj之間結(jié)構(gòu)完全相同.
定義2序列內(nèi)容相似度:
式中PER(Si)、PER(Sj)表示序列Si、Sj所包含的項目的集合.
定義3序列加權(quán)相似度:
定義4序列間的相似度距離:
根據(jù)定義1的符號解釋和邊界條件,可方便的推出定義2到定義4的相應(yīng)解釋和條件.
聚類分析是數(shù)據(jù)挖掘領(lǐng)域的一個重要分支,根據(jù)在數(shù)據(jù)中發(fā)現(xiàn)的描述對象及其關(guān)系的信息,將數(shù)據(jù)對象分類.其目標是簇內(nèi)的對象相互之間是相似的(相關(guān)的),而不同簇中的對象是不同的(不相關(guān)的).簇內(nèi)的相似性(同質(zhì)性)越大,簇間差別越大,聚類就越好[11].K-means算法思路清晰簡單,但也因此帶來了一個重大問題,K-means算法對初始聚類中心敏感:從隨機的初始聚類中心出發(fā),得到的聚類結(jié)果可能不同;反復(fù)迭代,計算開銷大;一般不會得到全局最優(yōu)解[12].
優(yōu)化初始聚類中心點選取是改進K-means算法的一個重要方向:翟東海等人采用了最大距離法選取初始簇中心[13];袁方等人采用了基于高密度的最大距離法選取初始簇中心[14];熊忠陽等人采用了基于高密度的最大距離乘積法選取初始簇中心[15];段桂芹采用了基于均值與最大距離乘積法選取初始簇中心[16].
針對課程序列的特點和建構(gòu)課程體系的需求,項目組提出了一種基于全局中心的序列相似性距離乘積最大法來優(yōu)化初始聚類中心的選取.具體算法描述如下:
a)計算全部序列的支持度.
b)將序列按支持度降序排列后提取前N個序列,構(gòu)建序列候選樣本集Sequence_N.
c)根據(jù)序列間的相似度距離公式(定義4),構(gòu)建距離矩陣dist_array_N.
d)從距離矩陣中取出同時滿足以下3個條件的K個序列(K>=3)作為聚類中心.
條件1:K個序列完全相異;
條件2:K個序列間的距離乘積最大;
條件3:K個序列映射至二維空間所構(gòu)成的平面圖形必須是首尾相連的閉合曲線.
e)從樣本集中選擇離聚類中心最近的M個序列與聚類中心求并集,生成集合S.
f)去除集合S中的重復(fù)元素,輸出聚類結(jié)果.
為驗證算法核心部分的正確性,計算平臺選擇了Matlab.R2011b,選取UCI數(shù)據(jù)庫中的Iris、Balance-Scale和Wine作為測試數(shù)據(jù),在準確率、迭代次數(shù)、聚類誤差平方和的綜合評價上總體較優(yōu).
將現(xiàn)代學(xué)徒制課程體系的相關(guān)數(shù)據(jù)進行序列聚類分析,結(jié)果如表2所示.
在表2的12簇中,刪除重復(fù)簇和元素個數(shù)大于等于8的簇,對剩余的6簇分別計算其元素排序支持度,形成6條課程鏈路;對孤立元素,計算其與簇元素的排序支持度,得到1條課程鏈路Ⅳ,見表3.
表2 聚類結(jié)果表
表3 路徑排序表
表3中的前4條是課程主鏈路,是與崗位能力對應(yīng)的培養(yǎng)路徑;后3條是課程輔鏈路,是與專項能力對應(yīng)的培養(yǎng)路徑,它是由數(shù)據(jù)挖掘出的隱性培養(yǎng)路徑.
在7條鏈路中出現(xiàn)3次及以上的課程為平臺課程,共有7門;出現(xiàn)2次的課程為交叉課程,共有4門;只出現(xiàn)1次的課程為非交叉課程,共有2門.
結(jié)合“開設(shè)學(xué)期”數(shù)據(jù)的分析,將13門課程排列組合成的7條鏈路分為4個層級,得到現(xiàn)代學(xué)徒制課程體系結(jié)構(gòu)圖,如圖1所示.
每條鏈路上的課程是串行遞進關(guān)系;4條主鏈路相對獨立,與“職業(yè)生涯發(fā)展路徑表”中的崗位對應(yīng)清晰,他們之間是并行組合關(guān)系;3條輔鏈路與4條主鏈路之間至少有2門課程出現(xiàn)交叉,兩種路徑之間構(gòu)成串并交叉關(guān)系.
在7條鏈路中出現(xiàn)3次及以上的課程為平臺課程,共有7門,這些課程對能力的培養(yǎng)具有核心意義;根據(jù)它們在鏈路中的序位可以確定其課程功能:排序靠前的2門是基礎(chǔ)平臺課程;排序居中的兩門是中繼平臺課程;排序靠后的3門是綜合平臺課程.
項目組與企業(yè)專家、課程專家對基于序列聚類的現(xiàn)代學(xué)徒制課程體系結(jié)構(gòu)進行了評估.本課程體系結(jié)構(gòu)是在數(shù)據(jù)挖掘的過程中逐步生成的,算法的綜合應(yīng)用與改進基本完成了課程體系在識別、分類、分級和序化4個生長階段的任務(wù),具備了課程體系“生成論”的基礎(chǔ)特征:按照行動體系的框架序化,強調(diào)的是動態(tài)的、有生命的“主體”對知識的“有機地”主觀構(gòu)建[7].其主要有以下幾個優(yōu)點:第一,課程體系完全建立在數(shù)據(jù)基礎(chǔ)上,特別適應(yīng)突出在崗培養(yǎng)的現(xiàn)代學(xué)徒制,對企業(yè)的實際需求與具體工作過程有更強的針對性.第二,是傳統(tǒng)定性方法的重要補充,解決了容易發(fā)生的兩個問題:將職業(yè)教育的課程裝進“學(xué)科體系”架構(gòu)之中被“強制性”序化問題,將復(fù)雜多變的內(nèi)容主觀機械地套入既定的課程結(jié)構(gòu)模式中的問題.第三,清晰的展現(xiàn)了課程間串行遞進、并行組合、串并交叉的關(guān)聯(lián)關(guān)系和他們的排列組合方式,形成了7條對能力培養(yǎng)有明確針對性的課程路徑,明確了課程性質(zhì)與功能,促進了課程的組織與實施.第四,可以挖掘出蘊含在動態(tài)行動體系之中的隱性實踐知識,揭示隱含的規(guī)律.如:在技術(shù)專家主導(dǎo)的課程構(gòu)建階段設(shè)備管理崗位只建構(gòu)出一門與其他課程關(guān)聯(lián)關(guān)系較弱的相對孤立的課程A,但通過數(shù)據(jù)挖掘卻生成了由ALM組成的主鏈路Ⅳ.企業(yè)專家認為該鏈路厘清了設(shè)備管理崗位的技術(shù)要求,企業(yè)需要在崗位標準修訂時加以補充.第五,操作性較強.關(guān)聯(lián)規(guī)則算法和序列模式算法都選擇使用范圍廣、功能全面和數(shù)據(jù)格式簡單的IBM SPSS MODELER軟件;聚類算法經(jīng)改進后,準確率高,計算開銷少.
但本方法還有一些地方需要完善:首先,每門課程都是由4~6個模塊組成,模塊間依然存在遞進、交叉、并行的關(guān)系,不可避免的使課程間的關(guān)系復(fù)雜化,造成路徑的關(guān)系還存在一些無法解釋的地方.其次,雖然對職業(yè)能力進行了詳盡分析,采集并計算了項目系數(shù)以及項目、任務(wù)、能力點三級的頻度系數(shù)和重要性系數(shù),但沒有深度挖掘它們之間的相關(guān)性和強度,沒有為課程體系結(jié)構(gòu)提供直接支撐.最后,該課程結(jié)構(gòu)還未在教學(xué)中實施完畢,教學(xué)質(zhì)量與效果有待檢驗.
圖1 現(xiàn)代學(xué)徒制課程體系結(jié)構(gòu)圖
項目組將從三個方面對本方法進行優(yōu)化:第一,是淡化課程的綜合性屬性及學(xué)時學(xué)分方面的要求,強化模塊的專門化屬性和短小靈活的特點,再通過數(shù)據(jù)挖掘的方法建構(gòu)模塊的體系結(jié)構(gòu),真正實現(xiàn)課程的模塊化.第二,定義、識別職業(yè)能力的難度系數(shù)、學(xué)時參數(shù)等新的屬性,挖掘項目系數(shù)、頻度系數(shù)和重要性系數(shù)的關(guān)系,生成能力素質(zhì)模型.第三,在教學(xué)實施完畢后采集學(xué)徒的興趣度、課程價值系數(shù)和考試成績等信息,再經(jīng)數(shù)據(jù)分析后調(diào)整課程體系結(jié)構(gòu).
[1]杜怡萍,李海東.中高職銜接標準建設(shè)新視野:從能力到課程[M].廣州:廣東高等教育出版社,2015:30.
[2]廣東省教育廳,廣東省教育研究院.廣東現(xiàn)代學(xué)徒制專業(yè)教學(xué)標準研制:職業(yè)能力分析(一)[M].廣州:廣東高等教育出版社,2016:290-347.
[3]趙志群.職業(yè)教育學(xué)習(xí)領(lǐng)域課程及課程開發(fā)[J].徐州建筑職業(yè)技術(shù)學(xué)院學(xué)報,2010(6):5.
[4]姜大源.論高等職業(yè)教育課程的系統(tǒng)化設(shè)計——關(guān)于工作過程系統(tǒng)化課程開發(fā)的解讀[J].中國高教研究,2009(4):14.
[5]徐國慶.論職業(yè)教育項目課程體系的設(shè)計[J].職教論壇,2009(6)下:4.
[6]郭炯,劉懷恩.高等職業(yè)教育課程研究的文獻綜述[J].中國職業(yè)技術(shù)教育,2009(12)下:54.
[7]姜大源.學(xué)科體系的解構(gòu)與行動體系的重構(gòu)[J].中國職業(yè)技術(shù)教育,2006(3)上:15-16.
[8]中華人民共和國教育部高等教育司,全國高職高專校長聯(lián)席會.點擊核心——高等職業(yè)教育專業(yè)設(shè)置與課程開發(fā)[M].北京:高等教育出版社,2004:79-83.
[9]元昌安.數(shù)據(jù)挖掘原理與SPSS Clementine應(yīng)用寶典[M].北京:電子工業(yè)出版社,2009:181-183.
[10]薛薇,陳歡歌.SPSS Modeler數(shù)據(jù)挖掘方法及應(yīng)用[M].北京:電子工業(yè)出版社,2010:224-228.
[11]Pang-Ning Tan,Michael S,Vipin K.數(shù)據(jù)挖掘?qū)д揫M].范明,范宏建,譯.北京:人民郵電出版社,2011:306.
[12]Han Jiawei,Kamber M.Data Mining Concepts and Techniques[M].北京:機械工業(yè)出版社,2006:344-345.
[13]翟東海,魚江,高飛,等.最大距離法選取初始簇中心的K-means文本聚類算法的研究[J].計算機應(yīng)用研究,2014,31(3):713-715,719.
[14]袁方,周志勇,宋鑫.初始聚類中心優(yōu)化的k-means算法[J].計算機工程,2007,33(3):65-66.
[15]熊忠陽,陳若田,張玉芳.一種有效的K-means聚類中心初始化方法[J].計算機應(yīng)用研究,2011,28(11):4188-4190.
[16]段桂芹.基于均值與最大距離乘積的初始聚類中心優(yōu)化K-means算法[J].計算機與數(shù)字工程,2015(3):379.
A Method of Curriculum System Construction in Modern Apprenticeship Based on Sequence Clustering
YANG Yu,ZOU Chen-song,TAN Yong-zhou
(Department of Mechanical Engineering,Guangdong Songshan Polytechnic,Shaoguan 512126,Guangdong,China)
Using multiple data mining algorithms to construct the organizational structure of curriculum system in modern apprenticeship,it aims to solve the problem of"compulsory"ordering in the curriculum of vocational education into the framework of the discipline system,and to change common practice of the complex and changeable contents which are mechanically set into the established curriculum structure model.By analyzing the incidence relation between the leading and subsequent courses by Apriori,it analyzed the sequential incidence relation of courses offered by sequence pattern,defining a method of similarity measurement for the sequence structure,content and weighted similarity of courses,presenting a method of improving the K-means clustering algorithm for the sequence similarity distance product maximum based on the global center,and generating curriculum system construction in modern apprenticeship.
sequence;clustering;modern apprenticeship;curriculum system construction
TP311
A
1007-5348(2017)06-0021-06
(責(zé)任編輯:邵曉軍)
2017-03-22
2015年度廣東省高等職業(yè)教育專業(yè)教學(xué)標準研制項目(BZ201511);2015年廣東省高等職業(yè)教育現(xiàn)代學(xué)徒制試點項目(粵教高函[2015]131號).
楊宇(1970-),男,四川成都人,廣東松山職業(yè)技術(shù)學(xué)院機械工程系副教授,碩士;研究方向:職業(yè)教育、數(shù)據(jù)挖掘.