• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      關(guān)聯(lián)規(guī)則方法在學(xué)生學(xué)習(xí)行為中的應(yīng)用研究

      2021-03-22 02:53:17張琳吳軍歐陽艾嘉
      電腦知識與技術(shù) 2021年4期
      關(guān)鍵詞:關(guān)聯(lián)規(guī)則學(xué)習(xí)數(shù)據(jù)挖掘

      張琳 吳軍 歐陽艾嘉

      摘要:學(xué)生在學(xué)習(xí)課程中的各種學(xué)習(xí)活動都產(chǎn)生了大量的數(shù)據(jù)信息,本文以《數(shù)據(jù)庫應(yīng)用技術(shù)》課程中學(xué)生學(xué)習(xí)情況作為研究對象,對學(xué)習(xí)行為進(jìn)行數(shù)據(jù)分析,采用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則方法進(jìn)行實際分析,找出學(xué)習(xí)行為中的聯(lián)系,以調(diào)整教學(xué)方法,從而實現(xiàn)良好的教學(xué)效果。

      關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;學(xué)習(xí)

      中圖分類號: TP391? ? ? ? 文獻(xiàn)標(biāo)識碼:A

      文章編號:1009-3044(2021)04-0215-02

      1 數(shù)據(jù)挖掘技術(shù)

      隨著大數(shù)據(jù)產(chǎn)業(yè)的全面發(fā)展與普及,數(shù)據(jù)挖掘技術(shù)的作用日益突出,目前在各個領(lǐng)域都會應(yīng)用到數(shù)據(jù)挖掘的相關(guān)技術(shù)進(jìn)行數(shù)據(jù)分析。比如,在超市日常營業(yè)的活動中,顧客購物時會產(chǎn)生大量的消費(fèi)數(shù)據(jù),通過關(guān)聯(lián)規(guī)則方法、聚類分析方法等可以設(shè)計出合理的營銷方案;比如,在銀行業(yè)務(wù)中產(chǎn)生了大量的交易數(shù)據(jù),通過對這些數(shù)據(jù)進(jìn)行挖掘,可以對客戶行為進(jìn)行深入研究,從而設(shè)計出更具特色的理財產(chǎn)品等。

      數(shù)據(jù)挖掘(DM)是指從海量的數(shù)據(jù)中,采用專業(yè)的挖掘技術(shù)進(jìn)行數(shù)據(jù)分析,將內(nèi)在的、未知的以及具有實際價值的信息進(jìn)行發(fā)現(xiàn)、分析、提取的過程。

      數(shù)據(jù)挖掘的主要特點(diǎn)有:

      1)需進(jìn)行處理的數(shù)據(jù)規(guī)模和數(shù)量比較龐大、雜亂,僅用簡單的統(tǒng)計方法無法進(jìn)行處理,需要采用專業(yè)的數(shù)據(jù)處理方法;

      2)數(shù)據(jù)挖掘采用的是預(yù)測的方法,挖掘出來的知識(即知識發(fā)現(xiàn))是不能實現(xiàn)預(yù)知的,并不能進(jìn)行精確查詢。

      3)在進(jìn)行數(shù)據(jù)挖掘的過程中,規(guī)則的發(fā)現(xiàn)需要事先設(shè)置閾值,當(dāng)置信度達(dá)到要求時,即認(rèn)為規(guī)則成立,否則就視為不成立。

      4)挖掘的實際過程中,除了完成潛在的任務(wù),還要進(jìn)行管理和維護(hù)規(guī)則。

      總之,數(shù)據(jù)挖掘技術(shù)主要有兩種功能,一是預(yù)測/驗證功能,二是描述功能。其中,預(yù)測/驗證功能主要是對已知的屬性進(jìn)行預(yù)測或驗證;描述功能主要是根據(jù)實際需要找出描述數(shù)據(jù)的可理解模式。

      2 關(guān)聯(lián)規(guī)則

      關(guān)聯(lián)規(guī)則挖掘的目的是找出數(shù)據(jù)庫中不同數(shù)據(jù)項集之間隱藏的關(guān)聯(lián)關(guān)系。關(guān)聯(lián)規(guī)則挖掘技術(shù)已經(jīng)被廣泛應(yīng)用在各個行業(yè),其中最典型的是在一些超市里面,通過從超市購買的信息中挖掘出潛在的、有用的、有價值的信息,從而更加合理的、有針對性地去對商品銷售的情況進(jìn)行調(diào)整和管理,以便提高超市銷售額。

      最為出名的就是數(shù)據(jù)挖掘歷史上的“尿布與啤酒”的故事,利用這個故事來闡述幾個會使用到的概念。

      現(xiàn)有購買食品的一個簡單數(shù)據(jù)庫,如下圖所示:

      關(guān)聯(lián)規(guī)則就是有關(guān)聯(lián)的規(guī)則,比如上圖中買了啤酒的同時也買尿布,{啤酒}->{尿布}(X->Y)就是一條關(guān)聯(lián)規(guī)則。那么這條規(guī)則的強(qiáng)度如何呢?比如說如果買啤酒的人里面只有1%的人同時買了尿布,這樣的話似乎這個規(guī)則就不算準(zhǔn)確了。那么如果買啤酒的人100%都會買尿布,是不是就算很強(qiáng)的規(guī)則呢?也不盡然,比如在這10000次購買中,只有一個人買了啤酒,雖然買啤酒的人100%買了尿布,但是畢竟就一次購買,所以也算不得多么有效。這兩項指標(biāo)便是confidence和support。

      confidence指的是這兩項在同一條記錄中同時出現(xiàn)的次數(shù)/集合中X(啤酒)出現(xiàn)的次數(shù),如上例中 3/4 = 75%

      confidence(A==>B)=P(A|B)可信度是準(zhǔn)確性的衡量,夠買啤酒的用戶有多少購買了尿布。

      support指的是這兩項在同一條記錄中同時出現(xiàn)的次數(shù)/記錄的總個數(shù) ,如上例中 3/5 = 60%

      support(A=>B)=P(A n B)

      支持度是重要性的衡量,在所有的事物中占多大的代表性。

      關(guān)聯(lián)規(guī)則方法的主要步驟是:先找出頻繁集,在從頻繁集中找出強(qiáng)關(guān)聯(lián)規(guī)則。

      頻繁集,是指滿足最小支持度或置信度的集合,支持度或置信度是事先預(yù)定義的。

      強(qiáng)關(guān)聯(lián)規(guī)則,是指既滿足最小支持度又滿足最小置信度的規(guī)則,也是進(jìn)行數(shù)據(jù)挖掘的最終目的。

      3 Apriori算法

      關(guān)聯(lián)規(guī)則方法中最常用的是Apriori 算法。

      本文中,用到的Apriori 算法主要步驟是:根據(jù)給定的數(shù)據(jù),形成一個數(shù)據(jù)庫。首先,第一次通過掃描數(shù)據(jù)庫形成C1(1階候選項集),從C1中找出所有支持度[≥]最小支持度的項集組成L1(1階大項集);然后,再進(jìn)行第二次掃描數(shù)據(jù)庫形成C2(2階候選項集),從C2中找出所有支持度≥最小支持度的項集組成L2(2階大項集);然后,再進(jìn)行第三次掃描數(shù)據(jù)庫形成C3(3階候選項集),從C2中找出所有支持度≥最小支持度的項集組成L3(3階大項集);最后,合并所有的大項集形成最大項頻繁項集。本文只運(yùn)算到3階大項集,若數(shù)據(jù)庫比較龐大,有N階項集,需要進(jìn)行第N次掃描數(shù)據(jù)庫時,每次都與最小支持度比較,從而得到相對性的N階候選項集。

      4 具體應(yīng)用

      以學(xué)生參加《數(shù)據(jù)庫應(yīng)用技術(shù)》課程的學(xué)習(xí)情況為例,進(jìn)行深入分析與研究。 通過獲取學(xué)生作業(yè)統(tǒng)計情況,進(jìn)行初步的數(shù)據(jù)清洗,取出需要的數(shù)據(jù)項進(jìn)行處理,本文只截取一小部分為例進(jìn)行說明。

      使用數(shù)值型關(guān)聯(lián)規(guī)則將數(shù)據(jù)轉(zhuǎn)化為二值型,將每個用戶的事務(wù)進(jìn)行處理,比如每一項完成80%以上就處理為“1”,否則處理為“0”。

      進(jìn)一步規(guī)范,將完成的學(xué)習(xí)行為作為數(shù)據(jù)挖掘的商品,進(jìn)行編號,生成數(shù)據(jù)庫D。

      使用Apriori算法基本思想,進(jìn)行關(guān)聯(lián)規(guī)則運(yùn)算,預(yù)定義min support=5/10,具體運(yùn)算步驟如下:

      產(chǎn)生的關(guān)聯(lián)規(guī)則如下表所示:

      Apriori算法最終的輸出結(jié)果是:L=L1UL2UL3

      通過L1、L2、L3進(jìn)一步生成學(xué)習(xí)行為之間的關(guān)聯(lián)規(guī)則,則可挖掘出存在的強(qiáng)關(guān)聯(lián)規(guī)則(即發(fā)現(xiàn)那些置信度和支持度都大于或等于閾值的規(guī)則)

      例如:

      規(guī)則1[?]2:

      Support=support({1,2})=50%

      Confidence=support({1,2})/support({1})=83.3%

      規(guī)則2[?]1:

      Support=support({1,2})=50%

      Confidence=support({1,2})/support({2})=62.5%

      規(guī)則1,2?[5]

      Support=support({1,2,5})=50%

      Confidence=support({1,2,5})/support({1,2})=100%

      同理,可以計算出每個規(guī)則。

      假定min confidence=3/4=75%,通過分析,發(fā)現(xiàn)滿足X.Confidence>min Confidence條件的關(guān)聯(lián)規(guī)則有:1[?]2,{1,2}[?5,]1[?]5,2 ?5,5 ?2,這些規(guī)則都成為強(qiáng)關(guān)聯(lián)規(guī)則。

      總之,從以上分析中可見,在學(xué)生學(xué)習(xí)《數(shù)據(jù)庫應(yīng)用技術(shù)》行為中,章節(jié)測驗、討論和簽到這三者學(xué)習(xí)行為之間是息息相關(guān)的,互相影響的。通過有針對性的調(diào)整學(xué)習(xí)任務(wù),可以較好地實現(xiàn)教學(xué)效果,從而為教師的備課、授課指引明確的方向。

      參考文獻(xiàn):

      [1] 崔妍,包志強(qiáng).關(guān)聯(lián)規(guī)則挖掘綜述[J].計算機(jī)應(yīng)用研究,2016,33(2):330-334.

      [2] 吳青,羅儒國,王權(quán)于.基于關(guān)聯(lián)規(guī)則的網(wǎng)絡(luò)學(xué)習(xí)行為實證研究[J].現(xiàn)代教育技術(shù),2015,25(7):88-94.

      [3] 田娜,陳明選.網(wǎng)絡(luò)教學(xué)平臺學(xué)生學(xué)習(xí)行為聚類分析[J].中國遠(yuǎn)程教育,2014(11):38-41.

      【通聯(lián)編輯:唐一東】

      猜你喜歡
      關(guān)聯(lián)規(guī)則學(xué)習(xí)數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
      數(shù)據(jù)挖掘在高校課堂教學(xué)質(zhì)量評價體系中的應(yīng)用
      試論在高?!爱a(chǎn)、學(xué)、研”中發(fā)展現(xiàn)代傳統(tǒng)手工藝文化
      人間(2016年26期)2016-11-03 18:25:32
      小學(xué)數(shù)學(xué)學(xué)習(xí)興趣的培養(yǎng)
      家庭習(xí)得環(huán)境對初中學(xué)生英語學(xué)習(xí)的影響研究
      創(chuàng)設(shè)探索情境,讓學(xué)生在“探”中“學(xué)”
      關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進(jìn)
      中國市場(2016年36期)2016-10-19 04:10:44
      基于關(guān)聯(lián)規(guī)則的計算機(jī)入侵檢測方法
      新安县| 仁怀市| 长沙县| 察雅县| 府谷县| 台中市| 丹寨县| 桐梓县| 遂溪县| 石嘴山市| 博湖县| 吴旗县| 米易县| 洛川县| 陇川县| 廉江市| 广丰县| 陵水| 宜宾县| 江阴市| 鄂托克旗| 牡丹江市| 枞阳县| 金平| 盐亭县| 丰城市| 清苑县| 广宁县| 修水县| 海兴县| 忻城县| 灌云县| 龙陵县| 松原市| 平顶山市| 都兰县| 武汉市| 梧州市| 定州市| 阿图什市| 濉溪县|