• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      關(guān)聯(lián)規(guī)則Apriori算法在個(gè)性化學(xué)習(xí)系統(tǒng)中的應(yīng)用研究

      2014-04-21 10:05:47繆廣寒
      新媒體研究 2014年5期
      關(guān)鍵詞:項(xiàng)集數(shù)據(jù)挖掘關(guān)聯(lián)

      繆廣寒

      摘 要 關(guān)聯(lián)算法是實(shí)現(xiàn)學(xué)習(xí)系統(tǒng)的個(gè)性化、自主化的有效工具,利用Apriori算法我們可以在學(xué)習(xí)系統(tǒng)中尋找到學(xué)生的學(xué)習(xí)規(guī)律,進(jìn)而實(shí)現(xiàn)個(gè)性化的學(xué)習(xí)推薦,是為個(gè)性化學(xué)習(xí)系統(tǒng)不可取少的功能模塊。

      關(guān)鍵詞 Apriori算法;個(gè)性化學(xué)習(xí)系統(tǒng);AprioriTid算法;數(shù)據(jù)挖掘

      中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-7597(2014)05-0047-02

      目前,眾多的學(xué)習(xí)系統(tǒng)大多類似,主要表現(xiàn)在:通用型較多,有專業(yè)特色的開發(fā)者少;理論類多,實(shí)踐類少;大眾類多,個(gè)性化少。而對(duì)于目前的個(gè)性化系統(tǒng)來(lái)說(shuō),由于缺乏一個(gè)可以量化的個(gè)性化的標(biāo)準(zhǔn),所以在具體實(shí)現(xiàn)上很難真正的實(shí)現(xiàn)個(gè)性化學(xué)習(xí),即在內(nèi)容上、模塊上、結(jié)構(gòu)上很難有較為系統(tǒng)、全面、高質(zhì)量的系統(tǒng)出現(xiàn)。同時(shí),人們的網(wǎng)絡(luò)學(xué)習(xí)已經(jīng)不再滿足于傳統(tǒng)書本的電子化。交互性、自主性、個(gè)性、多元化等各種學(xué)習(xí)特征急需實(shí)現(xiàn)。因此,許多教育學(xué)者協(xié)同學(xué)習(xí)系統(tǒng)開發(fā)者們都不斷投入到個(gè)性化學(xué)習(xí)系統(tǒng)中的個(gè)性化的開發(fā)建設(shè)中去,希望能在技術(shù)層面解決個(gè)性化需求與海量學(xué)習(xí)資源之間的矛盾,實(shí)時(shí)給網(wǎng)絡(luò)學(xué)習(xí)者個(gè)性化的學(xué)習(xí)指導(dǎo),實(shí)現(xiàn)真正的因材施教。

      基于上述問(wèn)題的解決,本文構(gòu)建設(shè)計(jì)了一個(gè)課外體育的個(gè)性化學(xué)習(xí)系統(tǒng),并利用數(shù)據(jù)挖掘技術(shù)中Apriori算法來(lái)改進(jìn)當(dāng)前的個(gè)性化學(xué)習(xí)系統(tǒng)的學(xué)習(xí)模式,對(duì)每一個(gè)網(wǎng)絡(luò)學(xué)習(xí)者提供個(gè)性化的學(xué)習(xí)進(jìn)程。

      1 個(gè)性化學(xué)習(xí)系統(tǒng)及其技術(shù)支持

      個(gè)性化學(xué)習(xí)是指根據(jù)學(xué)習(xí)者的個(gè)性特征實(shí)施教育活動(dòng),充分發(fā)揮學(xué)習(xí)者的主動(dòng)性,促進(jìn)學(xué)生全面、自由、協(xié)調(diào)的發(fā)展,從而進(jìn)一步發(fā)展學(xué)生的個(gè)性和潛能激發(fā)。個(gè)性化學(xué)習(xí)是一種創(chuàng)造性、實(shí)踐性和探索性的學(xué)習(xí)方式,它的根本目標(biāo)是讓每個(gè)學(xué)生獲得個(gè)性發(fā)展,實(shí)現(xiàn)個(gè)性化學(xué)習(xí)的關(guān)鍵主要是看個(gè)性化系統(tǒng)能否適應(yīng)學(xué)生的個(gè)性化差異,其中包括學(xué)生的學(xué)習(xí)能力的差異、學(xué)習(xí)興趣的差異、學(xué)習(xí)適應(yīng)性差異和學(xué)習(xí)經(jīng)驗(yàn)差異。

      為了滿足學(xué)習(xí)者個(gè)性化、自主式學(xué)習(xí)要求,網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)平臺(tái)也在不斷的發(fā)展改進(jìn),以各種技術(shù)支撐的學(xué)習(xí)系統(tǒng)應(yīng)運(yùn)而生,如自適應(yīng)學(xué)習(xí)系統(tǒng)、課程點(diǎn)播系統(tǒng)系統(tǒng)、課程視頻會(huì)議等,還有以建設(shè)個(gè)性化學(xué)習(xí)環(huán)境為主的WEB2.0技術(shù),RSS聚合技術(shù)、Ajax技術(shù)、Ontology本體檢索技術(shù)、數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)庫(kù)技術(shù)等應(yīng)運(yùn)而生??梢哉f(shuō)從國(guó)家到學(xué)校,各種相關(guān)研究和投入已經(jīng)多有嘗試,頗具規(guī)模。

      要實(shí)現(xiàn)學(xué)習(xí)系統(tǒng)個(gè)性關(guān)鍵在于從信息資源的海洋中得到關(guān)于學(xué)習(xí)者對(duì)系統(tǒng)資源使用模式的相關(guān)知識(shí),并進(jìn)一步結(jié)合這些知識(shí)根據(jù)學(xué)習(xí)者的個(gè)人興趣特征實(shí)現(xiàn)對(duì)學(xué)習(xí)者的個(gè)性化推薦,提供相應(yīng)資源。目前這些功能的實(shí)現(xiàn)主要采用數(shù)據(jù)挖掘技術(shù)來(lái)實(shí)現(xiàn)。其中,關(guān)聯(lián)規(guī)則就是數(shù)據(jù)挖掘技術(shù)中的一個(gè)重要分析模式。

      1.1 關(guān)聯(lián)規(guī)則

      數(shù)據(jù)關(guān)聯(lián)是指數(shù)據(jù)庫(kù)中存在的一類重要的可被發(fā)現(xiàn)的知識(shí)。如果兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,就可稱之為關(guān)聯(lián)。數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則實(shí)在滿足一定支持度和置信度算法的同時(shí)在事務(wù)數(shù)據(jù)庫(kù)數(shù)量龐大的關(guān)聯(lián)規(guī)則中找到強(qiáng)規(guī)則。Apriori算法是一個(gè)典型的關(guān)聯(lián)規(guī)則算法 ,也稱廣度優(yōu)先算法。是R Agrawal和R Srikant 于1994年提出的。

      1.2 Apriori算法

      Apriori算法的基本思想是:1)找出所有的頻集,這些項(xiàng)集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持度一樣;2)從頻繁項(xiàng)集發(fā)現(xiàn)強(qiáng)關(guān)聯(lián)規(guī)則。從一開始找到的頻繁項(xiàng)集的規(guī)則中找出只包含集合的項(xiàng)的所有規(guī)則。掃描項(xiàng)集,使用遞歸的方法找出所有頻繁項(xiàng)集,為了生成所有頻集,使用了遞歸的方法。具體算法偽代碼如下:

      Input:數(shù)據(jù)庫(kù)D;最小支持度MinSuport_count。

      Output:數(shù)據(jù)庫(kù)D中的頻繁項(xiàng)集I。

      Begin

      a、獲得所有支持度不小于 MinSupport的1-項(xiàng)目集

      Im=large1-Itemsets;

      b、找出數(shù)據(jù)庫(kù)D 中所有的頻繁項(xiàng)集I

      FOR(k=2;Ik-1≠Ф;k++)DO

      Ck=apriori_gen(Ik-1);

      FOR 所有transactions l ∈D DO

      Ct=subset(CK,t);

      FOR 所有候選 c∈Ct DO

      c.count++

      END

      END

      Ik={ c ∈Ck|c.count≥MinSuport_count}

      END

      I=∪Ik

      End

      其中,apriori_gen(Ik-1)算法按照上一次迭代發(fā)現(xiàn)新的候選項(xiàng)集,分為鏈接和修剪兩個(gè)部分。具體描述如下:

      1.2.1 鏈接

      Begin

      FOR 所有項(xiàng)目集 p∈Lk-1 DO

      FOR 所有項(xiàng)目集 q∈Lk-1 DO

      IF p.item1=q.item1,p.item2=q.item2…p.itemk-2=

      q.itemk-2, p.itemk-1=q.itemk-1, THEN {

      C=p∪q; //鏈接,產(chǎn)生候選集

      IF has_infrequent_subset(c,Ik-1) THEN

      Delete c; // 修剪。去掉無(wú)用候選項(xiàng)

      ELSE add c to Ck}

      Return Ck

      End

      1.2.2 修剪

      在上述算法中,語(yǔ)句“IF has_infrequent_subset(c,Lk-1) THEN刪除”是判斷c 是否需要加入到 k-候選集中,不需要就修剪掉。endprint

      Begin

      FOR each (k-1)-subsets of c DO

      IF S ? Ik-1 THEN

      Return true;

      Return False;

      END

      End

      2 使用Apriori 算法獲得學(xué)習(xí)者的學(xué)習(xí)規(guī)則

      關(guān)聯(lián)規(guī)則挖掘算法可以應(yīng)用在學(xué)生的成績(jī)分析上,如知識(shí)點(diǎn)與測(cè)試成績(jī)之間函數(shù)關(guān)系。通過(guò)對(duì)籃球課程的活動(dòng)記錄與相應(yīng)的測(cè)試成績(jī)的數(shù)據(jù)分析,我們可以找到一些對(duì)今后指導(dǎo)學(xué)生課外學(xué)習(xí)的有用規(guī)律。其具體流程如下。

      2.1 整理數(shù)據(jù)

      學(xué)生的學(xué)習(xí)記錄庫(kù)中記錄了學(xué)生的個(gè)人信息與基本學(xué)習(xí)過(guò)程信息。如學(xué)生姓名、學(xué)號(hào)、學(xué)習(xí)風(fēng)格、學(xué)習(xí)時(shí)間、學(xué)習(xí)路徑、測(cè)試成績(jī)等內(nèi)容。整理數(shù)據(jù)的目的是為了使學(xué)生的數(shù)據(jù)記錄等符合Apriori算法所需的項(xiàng)目集開展數(shù)據(jù)挖掘,首先需要將關(guān)系表轉(zhuǎn)換成相應(yīng)的事務(wù)數(shù)據(jù)庫(kù)。

      2.2 生成事物數(shù)據(jù)庫(kù)選擇自主學(xué)習(xí)內(nèi)容,以代碼代替

      2.3 生成頻繁項(xiàng)集

      通過(guò)以上的對(duì)應(yīng)抽象,我們可知事務(wù)集,假設(shè)最小支持度為25%,使用Apriori算法尋找D的所有頻繁項(xiàng)集。

      2.4 關(guān)聯(lián)規(guī)則生成

      在Apriori算法中,對(duì)于每一個(gè)頻繁k-項(xiàng)集都要找出其中所有可能的真子集,計(jì)算出相應(yīng)規(guī)則的置信度。當(dāng)我們發(fā)現(xiàn)某一規(guī)則的置信度大于設(shè)定的最小置信度就導(dǎo)出該規(guī)則。其中,每驗(yàn)證一個(gè)項(xiàng)子集都要重新掃描一遍Ik-1。在對(duì)某學(xué)生的籃球?qū)W習(xí)記錄中分析,最小置信度閾值設(shè)置為75%則可以發(fā)現(xiàn)強(qiáng)規(guī)則I01∧I08→I03。此規(guī)則告訴我們發(fā)現(xiàn)如果某生的運(yùn)球技能與防守戰(zhàn)術(shù)同時(shí)成績(jī)優(yōu)秀,則發(fā)現(xiàn)的該生在實(shí)踐活動(dòng)中的投籃技能成績(jī)也一般為優(yōu)秀。通過(guò)該例,我們可以發(fā)現(xiàn)數(shù)據(jù)關(guān)聯(lián)算法可以發(fā)現(xiàn)學(xué)生學(xué)習(xí)中的一些隱藏的學(xué)習(xí)規(guī)律,而這些規(guī)律正好可供學(xué)習(xí)系統(tǒng)給學(xué)習(xí)者提供下一步個(gè)性化學(xué)習(xí)方案。

      3 多項(xiàng)目集的Apriori算法改進(jìn)

      我們發(fā)現(xiàn),由于Apriori算法對(duì)數(shù)據(jù)庫(kù)的掃描次數(shù)過(guò)多,所以在有限的內(nèi)存容量下存放大量的事務(wù)數(shù)據(jù)時(shí),系統(tǒng)I/O負(fù)載會(huì)變大,每次掃描數(shù)據(jù)庫(kù)的時(shí)間就會(huì)越長(zhǎng)。此外,如果學(xué)習(xí)系統(tǒng)中某一課程的知識(shí)節(jié)點(diǎn)太多而導(dǎo)致分析的頻繁項(xiàng)集個(gè)數(shù)太多會(huì)產(chǎn)生大量的侯選項(xiàng)集。這會(huì)導(dǎo)致運(yùn)算時(shí)間顯著增加。所以根據(jù)不同的課程,我們可以改進(jìn)Apriori算法,采用減低候選項(xiàng)目數(shù)量的方法,我們稱之為AprioriTid。此算法無(wú)需此次掃描數(shù)據(jù)庫(kù),當(dāng)?shù)谝淮螔呙钄?shù)據(jù)庫(kù)之后,第二次只需要掃描前一次產(chǎn)生的項(xiàng)目集而不再需要完全的掃描數(shù)據(jù)庫(kù),這樣就可以有效的減少了I/O負(fù)載和數(shù)據(jù)運(yùn)算時(shí)間。

      具體改進(jìn)為在事務(wù)集TID中。當(dāng)k=1時(shí),C1掃描數(shù)據(jù)庫(kù)D,C1=數(shù)據(jù)庫(kù)D,但當(dāng)k>1時(shí),有算法產(chǎn)生Ck,Ck=apriori-gen(Lk-1)。

      此外,我們還可以在AprioriTid的基礎(chǔ)上通過(guò)把項(xiàng)目集中一些無(wú)關(guān)的屬性先去掉以及通過(guò)把兩個(gè)元素結(jié)合在一起組成一個(gè)新屬性的辦法來(lái)減少工作量,又或者在產(chǎn)生頻繁k-項(xiàng)集以后去掉一些非頻繁項(xiàng)集來(lái)簡(jiǎn)化掃描時(shí)間。以上兩種方法的結(jié)合使用類似于矩陣中逐漸去掉行與列。

      4 現(xiàn)存的問(wèn)題與思考

      利用Apriori算法與AprioriTid算法,我們可以有效的挖掘出個(gè)性化學(xué)習(xí)中學(xué)習(xí)者的學(xué)習(xí)關(guān)聯(lián),掌握學(xué)生的學(xué)習(xí)動(dòng)態(tài),進(jìn)而更深入了了解學(xué)生的學(xué)習(xí)規(guī)律與特點(diǎn)。但是在分布式計(jì)算與學(xué)習(xí)增量的情況下,我們不得不需要進(jìn)一步地改進(jìn)算法,以適合當(dāng)前及未來(lái)的個(gè)性化學(xué)習(xí)系統(tǒng)發(fā)展的趨勢(shì)。

      參考文獻(xiàn)

      [1]劉美玲.基于數(shù)據(jù)挖掘技術(shù)的個(gè)性化學(xué)習(xí)系統(tǒng)研究[D].揚(yáng)州:揚(yáng)州大學(xué),2009.

      [2]盛立,高明,劉希玉.一種高效的關(guān)聯(lián)規(guī)則的算法研究[J].濱州學(xué)院學(xué)報(bào),2005(12).

      [3]盛立,劉希玉,高明.數(shù)據(jù)關(guān)聯(lián)規(guī)則中AprioriTid[J].山東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2005(10).

      [4]李曼.Web日志挖掘技術(shù)在心靈家園網(wǎng)中的應(yīng)用研究[D].河南:河南大學(xué),2013.

      [5]何月順.關(guān)聯(lián)規(guī)則挖掘技術(shù)的研究及應(yīng)用[D].江蘇:南京航空航天大學(xué),2010.

      [6]王志強(qiáng).基于遠(yuǎn)程教育網(wǎng)站的信息采集與數(shù)據(jù)挖掘技術(shù)研究[D].上海:華東師范大學(xué),2007.endprint

      Begin

      FOR each (k-1)-subsets of c DO

      IF S ? Ik-1 THEN

      Return true;

      Return False;

      END

      End

      2 使用Apriori 算法獲得學(xué)習(xí)者的學(xué)習(xí)規(guī)則

      關(guān)聯(lián)規(guī)則挖掘算法可以應(yīng)用在學(xué)生的成績(jī)分析上,如知識(shí)點(diǎn)與測(cè)試成績(jī)之間函數(shù)關(guān)系。通過(guò)對(duì)籃球課程的活動(dòng)記錄與相應(yīng)的測(cè)試成績(jī)的數(shù)據(jù)分析,我們可以找到一些對(duì)今后指導(dǎo)學(xué)生課外學(xué)習(xí)的有用規(guī)律。其具體流程如下。

      2.1 整理數(shù)據(jù)

      學(xué)生的學(xué)習(xí)記錄庫(kù)中記錄了學(xué)生的個(gè)人信息與基本學(xué)習(xí)過(guò)程信息。如學(xué)生姓名、學(xué)號(hào)、學(xué)習(xí)風(fēng)格、學(xué)習(xí)時(shí)間、學(xué)習(xí)路徑、測(cè)試成績(jī)等內(nèi)容。整理數(shù)據(jù)的目的是為了使學(xué)生的數(shù)據(jù)記錄等符合Apriori算法所需的項(xiàng)目集開展數(shù)據(jù)挖掘,首先需要將關(guān)系表轉(zhuǎn)換成相應(yīng)的事務(wù)數(shù)據(jù)庫(kù)。

      2.2 生成事物數(shù)據(jù)庫(kù)選擇自主學(xué)習(xí)內(nèi)容,以代碼代替

      2.3 生成頻繁項(xiàng)集

      通過(guò)以上的對(duì)應(yīng)抽象,我們可知事務(wù)集,假設(shè)最小支持度為25%,使用Apriori算法尋找D的所有頻繁項(xiàng)集。

      2.4 關(guān)聯(lián)規(guī)則生成

      在Apriori算法中,對(duì)于每一個(gè)頻繁k-項(xiàng)集都要找出其中所有可能的真子集,計(jì)算出相應(yīng)規(guī)則的置信度。當(dāng)我們發(fā)現(xiàn)某一規(guī)則的置信度大于設(shè)定的最小置信度就導(dǎo)出該規(guī)則。其中,每驗(yàn)證一個(gè)項(xiàng)子集都要重新掃描一遍Ik-1。在對(duì)某學(xué)生的籃球?qū)W習(xí)記錄中分析,最小置信度閾值設(shè)置為75%則可以發(fā)現(xiàn)強(qiáng)規(guī)則I01∧I08→I03。此規(guī)則告訴我們發(fā)現(xiàn)如果某生的運(yùn)球技能與防守戰(zhàn)術(shù)同時(shí)成績(jī)優(yōu)秀,則發(fā)現(xiàn)的該生在實(shí)踐活動(dòng)中的投籃技能成績(jī)也一般為優(yōu)秀。通過(guò)該例,我們可以發(fā)現(xiàn)數(shù)據(jù)關(guān)聯(lián)算法可以發(fā)現(xiàn)學(xué)生學(xué)習(xí)中的一些隱藏的學(xué)習(xí)規(guī)律,而這些規(guī)律正好可供學(xué)習(xí)系統(tǒng)給學(xué)習(xí)者提供下一步個(gè)性化學(xué)習(xí)方案。

      3 多項(xiàng)目集的Apriori算法改進(jìn)

      我們發(fā)現(xiàn),由于Apriori算法對(duì)數(shù)據(jù)庫(kù)的掃描次數(shù)過(guò)多,所以在有限的內(nèi)存容量下存放大量的事務(wù)數(shù)據(jù)時(shí),系統(tǒng)I/O負(fù)載會(huì)變大,每次掃描數(shù)據(jù)庫(kù)的時(shí)間就會(huì)越長(zhǎng)。此外,如果學(xué)習(xí)系統(tǒng)中某一課程的知識(shí)節(jié)點(diǎn)太多而導(dǎo)致分析的頻繁項(xiàng)集個(gè)數(shù)太多會(huì)產(chǎn)生大量的侯選項(xiàng)集。這會(huì)導(dǎo)致運(yùn)算時(shí)間顯著增加。所以根據(jù)不同的課程,我們可以改進(jìn)Apriori算法,采用減低候選項(xiàng)目數(shù)量的方法,我們稱之為AprioriTid。此算法無(wú)需此次掃描數(shù)據(jù)庫(kù),當(dāng)?shù)谝淮螔呙钄?shù)據(jù)庫(kù)之后,第二次只需要掃描前一次產(chǎn)生的項(xiàng)目集而不再需要完全的掃描數(shù)據(jù)庫(kù),這樣就可以有效的減少了I/O負(fù)載和數(shù)據(jù)運(yùn)算時(shí)間。

      具體改進(jìn)為在事務(wù)集TID中。當(dāng)k=1時(shí),C1掃描數(shù)據(jù)庫(kù)D,C1=數(shù)據(jù)庫(kù)D,但當(dāng)k>1時(shí),有算法產(chǎn)生Ck,Ck=apriori-gen(Lk-1)。

      此外,我們還可以在AprioriTid的基礎(chǔ)上通過(guò)把項(xiàng)目集中一些無(wú)關(guān)的屬性先去掉以及通過(guò)把兩個(gè)元素結(jié)合在一起組成一個(gè)新屬性的辦法來(lái)減少工作量,又或者在產(chǎn)生頻繁k-項(xiàng)集以后去掉一些非頻繁項(xiàng)集來(lái)簡(jiǎn)化掃描時(shí)間。以上兩種方法的結(jié)合使用類似于矩陣中逐漸去掉行與列。

      4 現(xiàn)存的問(wèn)題與思考

      利用Apriori算法與AprioriTid算法,我們可以有效的挖掘出個(gè)性化學(xué)習(xí)中學(xué)習(xí)者的學(xué)習(xí)關(guān)聯(lián),掌握學(xué)生的學(xué)習(xí)動(dòng)態(tài),進(jìn)而更深入了了解學(xué)生的學(xué)習(xí)規(guī)律與特點(diǎn)。但是在分布式計(jì)算與學(xué)習(xí)增量的情況下,我們不得不需要進(jìn)一步地改進(jìn)算法,以適合當(dāng)前及未來(lái)的個(gè)性化學(xué)習(xí)系統(tǒng)發(fā)展的趨勢(shì)。

      參考文獻(xiàn)

      [1]劉美玲.基于數(shù)據(jù)挖掘技術(shù)的個(gè)性化學(xué)習(xí)系統(tǒng)研究[D].揚(yáng)州:揚(yáng)州大學(xué),2009.

      [2]盛立,高明,劉希玉.一種高效的關(guān)聯(lián)規(guī)則的算法研究[J].濱州學(xué)院學(xué)報(bào),2005(12).

      [3]盛立,劉希玉,高明.數(shù)據(jù)關(guān)聯(lián)規(guī)則中AprioriTid[J].山東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2005(10).

      [4]李曼.Web日志挖掘技術(shù)在心靈家園網(wǎng)中的應(yīng)用研究[D].河南:河南大學(xué),2013.

      [5]何月順.關(guān)聯(lián)規(guī)則挖掘技術(shù)的研究及應(yīng)用[D].江蘇:南京航空航天大學(xué),2010.

      [6]王志強(qiáng).基于遠(yuǎn)程教育網(wǎng)站的信息采集與數(shù)據(jù)挖掘技術(shù)研究[D].上海:華東師范大學(xué),2007.endprint

      Begin

      FOR each (k-1)-subsets of c DO

      IF S ? Ik-1 THEN

      Return true;

      Return False;

      END

      End

      2 使用Apriori 算法獲得學(xué)習(xí)者的學(xué)習(xí)規(guī)則

      關(guān)聯(lián)規(guī)則挖掘算法可以應(yīng)用在學(xué)生的成績(jī)分析上,如知識(shí)點(diǎn)與測(cè)試成績(jī)之間函數(shù)關(guān)系。通過(guò)對(duì)籃球課程的活動(dòng)記錄與相應(yīng)的測(cè)試成績(jī)的數(shù)據(jù)分析,我們可以找到一些對(duì)今后指導(dǎo)學(xué)生課外學(xué)習(xí)的有用規(guī)律。其具體流程如下。

      2.1 整理數(shù)據(jù)

      學(xué)生的學(xué)習(xí)記錄庫(kù)中記錄了學(xué)生的個(gè)人信息與基本學(xué)習(xí)過(guò)程信息。如學(xué)生姓名、學(xué)號(hào)、學(xué)習(xí)風(fēng)格、學(xué)習(xí)時(shí)間、學(xué)習(xí)路徑、測(cè)試成績(jī)等內(nèi)容。整理數(shù)據(jù)的目的是為了使學(xué)生的數(shù)據(jù)記錄等符合Apriori算法所需的項(xiàng)目集開展數(shù)據(jù)挖掘,首先需要將關(guān)系表轉(zhuǎn)換成相應(yīng)的事務(wù)數(shù)據(jù)庫(kù)。

      2.2 生成事物數(shù)據(jù)庫(kù)選擇自主學(xué)習(xí)內(nèi)容,以代碼代替

      2.3 生成頻繁項(xiàng)集

      通過(guò)以上的對(duì)應(yīng)抽象,我們可知事務(wù)集,假設(shè)最小支持度為25%,使用Apriori算法尋找D的所有頻繁項(xiàng)集。

      2.4 關(guān)聯(lián)規(guī)則生成

      在Apriori算法中,對(duì)于每一個(gè)頻繁k-項(xiàng)集都要找出其中所有可能的真子集,計(jì)算出相應(yīng)規(guī)則的置信度。當(dāng)我們發(fā)現(xiàn)某一規(guī)則的置信度大于設(shè)定的最小置信度就導(dǎo)出該規(guī)則。其中,每驗(yàn)證一個(gè)項(xiàng)子集都要重新掃描一遍Ik-1。在對(duì)某學(xué)生的籃球?qū)W習(xí)記錄中分析,最小置信度閾值設(shè)置為75%則可以發(fā)現(xiàn)強(qiáng)規(guī)則I01∧I08→I03。此規(guī)則告訴我們發(fā)現(xiàn)如果某生的運(yùn)球技能與防守戰(zhàn)術(shù)同時(shí)成績(jī)優(yōu)秀,則發(fā)現(xiàn)的該生在實(shí)踐活動(dòng)中的投籃技能成績(jī)也一般為優(yōu)秀。通過(guò)該例,我們可以發(fā)現(xiàn)數(shù)據(jù)關(guān)聯(lián)算法可以發(fā)現(xiàn)學(xué)生學(xué)習(xí)中的一些隱藏的學(xué)習(xí)規(guī)律,而這些規(guī)律正好可供學(xué)習(xí)系統(tǒng)給學(xué)習(xí)者提供下一步個(gè)性化學(xué)習(xí)方案。

      3 多項(xiàng)目集的Apriori算法改進(jìn)

      我們發(fā)現(xiàn),由于Apriori算法對(duì)數(shù)據(jù)庫(kù)的掃描次數(shù)過(guò)多,所以在有限的內(nèi)存容量下存放大量的事務(wù)數(shù)據(jù)時(shí),系統(tǒng)I/O負(fù)載會(huì)變大,每次掃描數(shù)據(jù)庫(kù)的時(shí)間就會(huì)越長(zhǎng)。此外,如果學(xué)習(xí)系統(tǒng)中某一課程的知識(shí)節(jié)點(diǎn)太多而導(dǎo)致分析的頻繁項(xiàng)集個(gè)數(shù)太多會(huì)產(chǎn)生大量的侯選項(xiàng)集。這會(huì)導(dǎo)致運(yùn)算時(shí)間顯著增加。所以根據(jù)不同的課程,我們可以改進(jìn)Apriori算法,采用減低候選項(xiàng)目數(shù)量的方法,我們稱之為AprioriTid。此算法無(wú)需此次掃描數(shù)據(jù)庫(kù),當(dāng)?shù)谝淮螔呙钄?shù)據(jù)庫(kù)之后,第二次只需要掃描前一次產(chǎn)生的項(xiàng)目集而不再需要完全的掃描數(shù)據(jù)庫(kù),這樣就可以有效的減少了I/O負(fù)載和數(shù)據(jù)運(yùn)算時(shí)間。

      具體改進(jìn)為在事務(wù)集TID中。當(dāng)k=1時(shí),C1掃描數(shù)據(jù)庫(kù)D,C1=數(shù)據(jù)庫(kù)D,但當(dāng)k>1時(shí),有算法產(chǎn)生Ck,Ck=apriori-gen(Lk-1)。

      此外,我們還可以在AprioriTid的基礎(chǔ)上通過(guò)把項(xiàng)目集中一些無(wú)關(guān)的屬性先去掉以及通過(guò)把兩個(gè)元素結(jié)合在一起組成一個(gè)新屬性的辦法來(lái)減少工作量,又或者在產(chǎn)生頻繁k-項(xiàng)集以后去掉一些非頻繁項(xiàng)集來(lái)簡(jiǎn)化掃描時(shí)間。以上兩種方法的結(jié)合使用類似于矩陣中逐漸去掉行與列。

      4 現(xiàn)存的問(wèn)題與思考

      利用Apriori算法與AprioriTid算法,我們可以有效的挖掘出個(gè)性化學(xué)習(xí)中學(xué)習(xí)者的學(xué)習(xí)關(guān)聯(lián),掌握學(xué)生的學(xué)習(xí)動(dòng)態(tài),進(jìn)而更深入了了解學(xué)生的學(xué)習(xí)規(guī)律與特點(diǎn)。但是在分布式計(jì)算與學(xué)習(xí)增量的情況下,我們不得不需要進(jìn)一步地改進(jìn)算法,以適合當(dāng)前及未來(lái)的個(gè)性化學(xué)習(xí)系統(tǒng)發(fā)展的趨勢(shì)。

      參考文獻(xiàn)

      [1]劉美玲.基于數(shù)據(jù)挖掘技術(shù)的個(gè)性化學(xué)習(xí)系統(tǒng)研究[D].揚(yáng)州:揚(yáng)州大學(xué),2009.

      [2]盛立,高明,劉希玉.一種高效的關(guān)聯(lián)規(guī)則的算法研究[J].濱州學(xué)院學(xué)報(bào),2005(12).

      [3]盛立,劉希玉,高明.數(shù)據(jù)關(guān)聯(lián)規(guī)則中AprioriTid[J].山東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2005(10).

      [4]李曼.Web日志挖掘技術(shù)在心靈家園網(wǎng)中的應(yīng)用研究[D].河南:河南大學(xué),2013.

      [5]何月順.關(guān)聯(lián)規(guī)則挖掘技術(shù)的研究及應(yīng)用[D].江蘇:南京航空航天大學(xué),2010.

      [6]王志強(qiáng).基于遠(yuǎn)程教育網(wǎng)站的信息采集與數(shù)據(jù)挖掘技術(shù)研究[D].上海:華東師范大學(xué),2007.endprint

      猜你喜歡
      項(xiàng)集數(shù)據(jù)挖掘關(guān)聯(lián)
      “苦”的關(guān)聯(lián)
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      奇趣搭配
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
      卷宗(2014年5期)2014-07-15 07:47:08
      一種頻繁核心項(xiàng)集的快速挖掘算法
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      語(yǔ)言學(xué)與修辭學(xué):關(guān)聯(lián)與互動(dòng)
      泰宁县| 松潘县| 合肥市| 四川省| 东乡县| 兴宁市| 苍梧县| 紫云| 宁城县| 三江| 金堂县| 龙游县| 石屏县| 正蓝旗| 孝昌县| 桃园县| 南安市| 沂源县| 深水埗区| 浙江省| 罗源县| 图木舒克市| 宝应县| 临潭县| 巫山县| 黄浦区| 榆林市| 彰化市| 铁力市| 古丈县| 崇州市| 普陀区| 巴彦县| 七台河市| 佛坪县| 民丰县| 贵州省| 梅河口市| 通州区| 聂拉木县| 莲花县|