• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于CDIO理念的數(shù)據(jù)挖掘課程教學(xué)探索*

      2021-12-31 15:47:49黃發(fā)良鐘世華何萬(wàn)莉
      關(guān)鍵詞:數(shù)據(jù)挖掘算法實(shí)驗(yàn)

      黃發(fā)良,鐘世華,何萬(wàn)莉

      (1.南寧師范大學(xué) a.計(jì)算機(jī)與信息工程學(xué)院;b.新聞與傳播學(xué)院;c.馬克思主義學(xué)院,廣西 南寧 530001)

      0 引言

      大數(shù)據(jù)時(shí)代的來(lái)臨對(duì)人們的現(xiàn)實(shí)生活、企業(yè)的運(yùn)營(yíng)管理模式提出新的挑戰(zhàn),也帶來(lái)新的市場(chǎng)機(jī)會(huì)。在大數(shù)據(jù)時(shí)代,無(wú)處不在的智能終端、互動(dòng)頻繁的社交網(wǎng)絡(luò)和超大容量的數(shù)字化存儲(chǔ),大數(shù)據(jù)已經(jīng)滲透到各個(gè)行業(yè),已成為一種生產(chǎn)要素并逐漸發(fā)揮著重要作用,擁有大數(shù)據(jù)系統(tǒng)技術(shù)將成為未來(lái)競(jìng)爭(zhēng)的制高點(diǎn)。如何從動(dòng)態(tài)高速、多模異質(zhì)與價(jià)值比低的海量數(shù)據(jù)中發(fā)現(xiàn)潛在有價(jià)值的規(guī)律與知識(shí),并應(yīng)用于經(jīng)濟(jì)生產(chǎn)、行業(yè)管理和社會(huì)服務(wù),是一個(gè)關(guān)系著國(guó)計(jì)民生的重大課題。在這樣的背景下,數(shù)據(jù)挖掘已經(jīng)成為學(xué)術(shù)界與工業(yè)界的研究熱點(diǎn)和焦點(diǎn),數(shù)據(jù)挖掘課程在數(shù)據(jù)科學(xué)與工程的人才培養(yǎng)中扮演日益重要的角色[1-5]。

      盡管數(shù)據(jù)挖掘課程在高等教育普及度在逐步增長(zhǎng),但在教學(xué)內(nèi)容、教學(xué)方法和實(shí)驗(yàn)教學(xué)模式等方面存在諸多不足,比如培養(yǎng)目標(biāo)模糊、創(chuàng)新意識(shí)薄弱、實(shí)驗(yàn)?zāi)J疥惻f等等。本研究筆者結(jié)合大數(shù)據(jù)特性與數(shù)據(jù)分析理論,對(duì)數(shù)據(jù)挖掘理課程的理論教學(xué)與實(shí)踐教學(xué)進(jìn)行了思考與探究,實(shí)現(xiàn)了教學(xué)水平和教學(xué)質(zhì)量的提升,培養(yǎng)出更多的能適應(yīng)大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘優(yōu)秀人才。

      1 課程特點(diǎn)

      數(shù)據(jù)挖掘課程作為一門(mén)理論與實(shí)踐緊密結(jié)合的交叉學(xué)科,具有如下的自身特點(diǎn):

      (1)學(xué)科交融性。從技術(shù)上講,數(shù)據(jù)挖掘是一個(gè)知識(shí)發(fā)現(xiàn)的過(guò)程,就是從具有模糊隨機(jī)、異構(gòu)低質(zhì)等不同特性的大量實(shí)際應(yīng)用數(shù)據(jù)中提取人們事先未知卻又潛在實(shí)用的隱含信息和規(guī)律的過(guò)程。數(shù)據(jù)挖掘挖掘任務(wù)往往是一個(gè)涉及信息收集、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約、數(shù)據(jù)清理、數(shù)據(jù)變換、模式推導(dǎo)、模式評(píng)估與知識(shí)表示等不同子任務(wù)的迭代過(guò)程。從其定義與實(shí)施可知,數(shù)據(jù)挖掘是一個(gè)與機(jī)器學(xué)習(xí)、數(shù)據(jù)倉(cāng)庫(kù),統(tǒng)計(jì)學(xué),智能決策等多個(gè)學(xué)科緊密交融的交叉性學(xué)科。例如,統(tǒng)計(jì)機(jī)器學(xué)習(xí)是非結(jié)構(gòu)化的文本數(shù)據(jù)挖掘中重要方法之一。

      (2)理論復(fù)雜性。各種數(shù)據(jù)挖掘任務(wù)往往可以形式化為不同性質(zhì)的數(shù)學(xué)問(wèn)題,研究求解這些數(shù)學(xué)問(wèn)題的算法或理解相關(guān)數(shù)學(xué)問(wèn)題都需要不同領(lǐng)域的復(fù)雜數(shù)學(xué)理論。例如,理解數(shù)據(jù)降維算法主成分分析PCA就需要以研究函數(shù)和變換為重點(diǎn)的代數(shù)理論,理解數(shù)據(jù)分類算法決策樹(shù)的信息熵需要具備以統(tǒng)計(jì)模型和樣本分布為重點(diǎn)的統(tǒng)計(jì)學(xué)理論,研究數(shù)據(jù)預(yù)測(cè)模型神經(jīng)網(wǎng)絡(luò)中的權(quán)重梯度下降算法就需要應(yīng)用連續(xù)度量空間中的微分理論,優(yōu)化數(shù)據(jù)分類模型支持向量機(jī)SVM需要泛函分析理論以理解從有限維空間拓展到無(wú)限維空間的映射。

      (3)技術(shù)前瞻性。信息技術(shù)的快速發(fā)展已經(jīng)極大地促進(jìn)海洋、環(huán)境、太空、能源等不同領(lǐng)域?qū)W科的數(shù)據(jù)急劇增長(zhǎng),這些來(lái)自不同應(yīng)用領(lǐng)域、類型豐富的海量數(shù)據(jù)不斷提出新的數(shù)據(jù)挖掘挑戰(zhàn),為了更好地滿足各種新興挖掘需求,研究人員提出了各種新的挖掘模型與算法,數(shù)據(jù)挖掘項(xiàng)目實(shí)施者需要跟蹤理解各種新模型與新算法。比如,微博微信、Twitter、Facebook等社交用戶產(chǎn)生了包含視頻、圖像、文本與鏈接等不同模態(tài)的海量數(shù)據(jù),使得傳統(tǒng)挖掘算法難以有效發(fā)現(xiàn)隱藏其中的規(guī)律與知識(shí),海量數(shù)據(jù)的易獲性與算力資源的廉價(jià)性促使以神經(jīng)網(wǎng)絡(luò)為基本組成單元的深度神經(jīng)模型備受關(guān)注,并在社交媒體數(shù)據(jù)挖掘任務(wù)上取得了極大的成功。

      2 CDIO理念

      CDIO(Conceive,Design,Implement,Operate)工程教育模式是近年來(lái)國(guó)際工程教育改革的最新成果,其提出者是麻省理工學(xué)院和瑞典皇家工學(xué)院等大學(xué)組成的跨國(guó)研究組織。CDIO的核心思想是促使學(xué)生以主動(dòng)實(shí)踐與課程交融的學(xué)習(xí)方法學(xué)習(xí)產(chǎn)品生命周期內(nèi)的工程理論、工程技術(shù)與工程經(jīng)驗(yàn)。具體而言,C(Conceive)就是通過(guò)工程實(shí)踐讓學(xué)生掌握專業(yè)知識(shí)的基本原理以確定其發(fā)展方向,D(Design)是圍繞產(chǎn)品設(shè)計(jì)與規(guī)劃來(lái)解決具體問(wèn)題,I (Implement)就是以制造為核心,組織一體化的課程實(shí)踐以提升學(xué)生的理論知識(shí)儲(chǔ)備與實(shí)踐能力,O(Operate)是產(chǎn)品應(yīng)用的各個(gè)環(huán)節(jié)[6-7]。

      當(dāng)前,應(yīng)用型創(chuàng)新人才培養(yǎng)已經(jīng)引起國(guó)家的高度重視,“工程教育認(rèn)證”和“執(zhí)業(yè)資格認(rèn)證”的火熱推廣便是明證。極具特色的CDIO教育理念越來(lái)越受到教育工作者的重視。史曉楠[8]以校級(jí)軟件創(chuàng)新班為例,基于CDIO理念對(duì)軟件類創(chuàng)新型人才培養(yǎng)模式進(jìn)行了研究,設(shè)計(jì)出一套完整的人才培養(yǎng)模式體系。宮喚春[9]探討了基于CBE和CDIO理念的智能運(yùn)輸系統(tǒng)實(shí)驗(yàn)教學(xué)改革,強(qiáng)調(diào)以學(xué)生為中心,以職業(yè)崗位職責(zé)能力為導(dǎo)向,并基于校企聯(lián)合開(kāi)發(fā)的智能交通實(shí)踐教學(xué)平臺(tái),對(duì)智能運(yùn)輸系統(tǒng)實(shí)驗(yàn)教學(xué)進(jìn)行了項(xiàng)目化設(shè)計(jì)。張麗娟等[10]探索了“3+1”“2+1+1”人才培養(yǎng)模式,形成了基于OBE-CDIO的教學(xué)體系,與企業(yè)聯(lián)合構(gòu)建了“協(xié)同創(chuàng)新”“聯(lián)合研發(fā)”“合作辦學(xué)”“校中工廠”4種協(xié)同育人模式。曾華鵬等[11]以項(xiàng)目為載體,采取分組分崗的形式,在CDIO的產(chǎn)品全生命周期中培養(yǎng)學(xué)生綜合運(yùn)用技能解決實(shí)際問(wèn)題的工程能力。盧愛(ài)臣等[12]根據(jù)《計(jì)算機(jī)程序設(shè)計(jì)》理論性和實(shí)踐性強(qiáng)的學(xué)科特點(diǎn),提出了一種構(gòu)建以項(xiàng)目為牽引的CDIO開(kāi)放式“創(chuàng)客”課堂及實(shí)踐教學(xué)體系,為《計(jì)算機(jī)程序設(shè)計(jì)》提供STEMX教育模式參考。劉敬等[13]反向設(shè)計(jì)各實(shí)踐教學(xué)環(huán)節(jié),依托CDIO項(xiàng)目式教學(xué),借助設(shè)計(jì)單元、專項(xiàng)設(shè)計(jì)和科研項(xiàng)目,構(gòu)建遞進(jìn)式實(shí)踐教學(xué)模式,循序漸進(jìn)培養(yǎng)學(xué)生各項(xiàng)實(shí)踐能力。

      3 教改探索

      3.1 數(shù)據(jù)思維驅(qū)動(dòng)的教學(xué)目標(biāo)更新

      隨著大數(shù)據(jù)和人工智能的發(fā)展,數(shù)據(jù)思維能力對(duì)數(shù)據(jù)挖掘人才的重要性日益凸顯。為了適應(yīng)新的人才需求,筆者根據(jù)新的學(xué)生培養(yǎng)目標(biāo)與培養(yǎng)方案,對(duì)數(shù)據(jù)挖掘課程的教學(xué)目標(biāo)進(jìn)行了適當(dāng)更新,以提升學(xué)生的數(shù)據(jù)抽象概括、數(shù)據(jù)領(lǐng)域變換、分析工具制作等計(jì)算思維能力及綜合運(yùn)用的能力。具體表現(xiàn)如下幾個(gè)方面:

      (1)培養(yǎng)學(xué)生的數(shù)據(jù)概括能力和數(shù)據(jù)抽象思維,以能夠從整體上理解數(shù)據(jù)和把握數(shù)據(jù)。大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)數(shù)量級(jí)一般都是GB級(jí)甚至TB級(jí),大數(shù)據(jù)的海量性使得數(shù)據(jù)挖掘教學(xué)過(guò)程中的“小數(shù)據(jù)講大故事”傳統(tǒng)教學(xué)思維難以湊效,由于小數(shù)據(jù)與大數(shù)據(jù)在性質(zhì)與處理方式上差異顯著。比如,大數(shù)據(jù)往往難以滿足小數(shù)據(jù)分析的“獨(dú)立同分布”假設(shè),基于內(nèi)存的小數(shù)據(jù)處理方式難以滿足大數(shù)據(jù)處理需求。習(xí)慣小數(shù)據(jù)思維的學(xué)生在面對(duì)體量巨大的大數(shù)據(jù)時(shí)容易出現(xiàn)害怕心理甚至作出放棄的行為。因而,很有必要加強(qiáng)數(shù)據(jù)抽樣、數(shù)據(jù)摘要等理論與技能的教學(xué),提升學(xué)生的數(shù)據(jù)概括能力。

      (2)培養(yǎng)學(xué)生動(dòng)手制造與正確選擇挖掘任務(wù)計(jì)算工具的數(shù)據(jù)思維能力。面對(duì)一個(gè)數(shù)據(jù)挖掘任務(wù),學(xué)生容易走向兩個(gè)極端方向。其一是,自己動(dòng)手編程實(shí)現(xiàn)一個(gè)從輸入到輸出的全過(guò)程數(shù)據(jù)分析工具,其二是,完全放棄自己制造的路線,利用現(xiàn)有的開(kāi)源或商業(yè)軟件來(lái)完成數(shù)據(jù)挖掘任務(wù)中的每個(gè)子任務(wù)。顯然,這兩個(gè)極端情況都不利于數(shù)據(jù)挖掘工作的順利開(kāi)展,也不利于真實(shí)應(yīng)用需求的有效解決。因此,需要培養(yǎng)學(xué)生的數(shù)據(jù)思維能力,根據(jù)數(shù)據(jù)挖掘任務(wù)的實(shí)際情況,將自力更生與拿來(lái)主義有效結(jié)合,實(shí)現(xiàn)數(shù)據(jù)挖掘任務(wù)效率和效能的最大化。

      (3)樹(shù)立學(xué)生的數(shù)據(jù)即知識(shí)與數(shù)據(jù)即財(cái)富的觀念。在大數(shù)據(jù)背景下,若擁有足夠強(qiáng)大的算法與足夠規(guī)模的數(shù)據(jù),就有可能從中獲得無(wú)法憑直覺(jué)或經(jīng)驗(yàn)?zāi)塬@取的知識(shí),這些知識(shí)可能帶來(lái)巨大的財(cái)富。幫助學(xué)生形成數(shù)據(jù)數(shù)據(jù)即知識(shí)與數(shù)據(jù)即財(cái)富的觀念,有助于培養(yǎng)學(xué)生克服數(shù)據(jù)挖掘難題的信心與韌性。

      3.2 面向理論創(chuàng)新的教學(xué)內(nèi)容改革

      圍繞制定的教學(xué)目標(biāo),在數(shù)據(jù)挖掘課程教學(xué)過(guò)程中,筆者從基礎(chǔ)理論與高級(jí)應(yīng)用兩個(gè)層面對(duì)教學(xué)內(nèi)容進(jìn)行設(shè)定。

      基礎(chǔ)理論部分教學(xué)內(nèi)容主要依據(jù)數(shù)據(jù)挖掘的基本流程來(lái)確定。具體內(nèi)容包括:

      (1)數(shù)據(jù)預(yù)處理:數(shù)據(jù)缺失填補(bǔ)、噪聲數(shù)據(jù)光滑與異常數(shù)據(jù)刪除等數(shù)據(jù)清洗理論與方法,實(shí)現(xiàn)多源數(shù)據(jù)集成實(shí)體識(shí)別、冗余檢測(cè)等理論與方法,基于pearson相關(guān)系數(shù)、卡方檢驗(yàn)與Gini指數(shù)的屬性度測(cè)定,基于主成分分析與奇異值分解的數(shù)據(jù)線性轉(zhuǎn)換理論,基于min-max與Z-Score的數(shù)據(jù)歸一化處理方法。

      (2)數(shù)據(jù)關(guān)聯(lián)分析:關(guān)聯(lián)規(guī)則挖掘中的支持度、可信度、效用度等基本概念,經(jīng)典Apriori算法的基本思想與計(jì)算步驟,分析其空間復(fù)雜度等方面的不足,基于頻繁模式樹(shù)FP-tree的頻繁模式發(fā)現(xiàn)算法FP-growth。

      (3)數(shù)據(jù)聚類分析:聚類分析的哲學(xué)原理,歐氏距離、海明距離、明氏距離等不同測(cè)度方法,聚類有效性測(cè)度指標(biāo),層次聚類、劃分聚類與密度聚類的基本思想,KMeans算法的核心步驟與復(fù)雜度分析。

      (4)數(shù)據(jù)分類分析:有監(jiān)督學(xué)習(xí)的基本原理,分類器訓(xùn)練過(guò)程的欠學(xué)習(xí)與過(guò)學(xué)習(xí),基于條件獨(dú)立性假設(shè)的樸素貝葉斯算法及其優(yōu)缺點(diǎn),基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)及其優(yōu)缺點(diǎn),基于多數(shù)投票原則的最近鄰算法及其優(yōu)缺點(diǎn)。

      (5)數(shù)據(jù)預(yù)測(cè)分析:數(shù)據(jù)預(yù)測(cè)與分類的區(qū)別與聯(lián)系,基于神經(jīng)網(wǎng)絡(luò)模型的非線性預(yù)測(cè)算法及其優(yōu)缺點(diǎn),基于移動(dòng)算術(shù)平均與移動(dòng)指數(shù)平均的外推型預(yù)測(cè)方法及其優(yōu)缺點(diǎn),基于線性回歸模型與動(dòng)態(tài)回歸模型的因果分析預(yù)測(cè)方法及其優(yōu)缺點(diǎn)。

      高級(jí)應(yīng)用部分的教學(xué)內(nèi)容主要是根據(jù)當(dāng)前流行的信息技術(shù)應(yīng)用場(chǎng)景選擇不同類型的數(shù)據(jù),講授如何將基礎(chǔ)理論知識(shí)與具體應(yīng)用問(wèn)題相結(jié)合,培養(yǎng)學(xué)生獨(dú)立完成數(shù)據(jù)挖掘?qū)嶋H應(yīng)用項(xiàng)目的能力。具體內(nèi)容包括:(1)文本數(shù)據(jù)挖掘:理解文本數(shù)據(jù)的非結(jié)構(gòu)化與序列性等特點(diǎn),掌握文本表示的向量空間模型與TFIDF加權(quán)模式,了解基于特征項(xiàng)頻率的文本特征過(guò)濾技術(shù),應(yīng)用支持向量機(jī)與樸素貝葉斯進(jìn)行文本分類。(2)圖像數(shù)據(jù)挖掘:理解圖像數(shù)據(jù)的灰度、通道、紋理、邊緣與區(qū)域等概念,應(yīng)用KMeans方法完成圖像分割的數(shù)據(jù)挖掘任務(wù)。(3)流數(shù)據(jù)挖掘:以傳感數(shù)據(jù)、金融數(shù)據(jù)等為應(yīng)用場(chǎng)景實(shí)現(xiàn)流數(shù)據(jù)的動(dòng)態(tài)變化、快速到達(dá)、體量巨大等特點(diǎn),應(yīng)用基于BP神經(jīng)網(wǎng)絡(luò)模型完成傳感時(shí)間序列預(yù)測(cè),應(yīng)用滑動(dòng)平均等外推型方法實(shí)現(xiàn)金融時(shí)間序列的預(yù)測(cè)。(4)交易數(shù)據(jù)挖掘:理解購(gòu)物籃等超市交易數(shù)據(jù)的離散特征,應(yīng)用Apriori與FP-growth算法進(jìn)行交易數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘,比較不同挖掘算法的效果以深度認(rèn)知不同算法的優(yōu)缺點(diǎn)。

      在上述教學(xué)內(nèi)容的具體實(shí)施過(guò)程中,始終堅(jiān)持?jǐn)?shù)據(jù)思維導(dǎo)向,突出數(shù)據(jù)科學(xué)的理論性,通過(guò)分析各種算法的優(yōu)缺點(diǎn)與各類數(shù)據(jù)類型的本質(zhì)特性,引導(dǎo)學(xué)生從算法設(shè)計(jì)、模型改進(jìn)、框架重構(gòu)等不同方面進(jìn)行理論創(chuàng)新。比如,在教學(xué)內(nèi)容文本數(shù)據(jù)挖掘的講授過(guò)程中,一方面讓學(xué)生感受到當(dāng)前的向量空間模型難以捕捉到文本語(yǔ)義與情感,現(xiàn)有基于淺層表示模型的算法很難有效提升文本分類的性能,另一方面從文本數(shù)據(jù)的序列特性出發(fā),引導(dǎo)學(xué)生嘗試引入LSTM、GRU等深度遞歸神經(jīng)網(wǎng)絡(luò)模型,構(gòu)建新的基于深度學(xué)習(xí)的文本分布式表示機(jī)制,實(shí)現(xiàn)基于數(shù)據(jù)思維的理論創(chuàng)新。

      3.3 理論結(jié)合實(shí)踐的教學(xué)方法創(chuàng)新

      在上述教學(xué)目標(biāo)的驅(qū)動(dòng)下,筆者在進(jìn)行數(shù)據(jù)挖掘課程的教學(xué)過(guò)程中,根據(jù)教學(xué)內(nèi)容提出了一系列的教改措施,主要包括理論教學(xué)、實(shí)驗(yàn)教學(xué)與考核方式三個(gè)方面的教學(xué)方法創(chuàng)新。

      3.3.1 理論教學(xué)創(chuàng)新

      (1)重視新篇章導(dǎo)入課的設(shè)計(jì)。若導(dǎo)入課設(shè)計(jì)不當(dāng)則可能導(dǎo)致學(xué)生無(wú)法理解待講授的教學(xué)內(nèi)容的價(jià)值及其與已學(xué)知識(shí)之間的關(guān)系,從而導(dǎo)致學(xué)習(xí)目標(biāo)不清晰、方向不明確的不良情形。筆者在設(shè)計(jì)每個(gè)教學(xué)章節(jié)的導(dǎo)入課時(shí),都是在數(shù)據(jù)思維培養(yǎng)目標(biāo)指引下,以具體應(yīng)用場(chǎng)景中的數(shù)據(jù)挖掘需求為課堂導(dǎo)入點(diǎn),用具體案例喚起學(xué)生的興趣與熱情。比如,在導(dǎo)入數(shù)據(jù)關(guān)聯(lián)分析理論時(shí),首先引導(dǎo)學(xué)生觀測(cè)到超市的牙膏緊鄰牙刷、沐浴露緊鄰洗發(fā)水等商品陳列現(xiàn)象,然后提問(wèn)這種商品擺放背后的原因,學(xué)生立即熱情高漲地探索超市是如何發(fā)現(xiàn)這種巧妙的盈利模式,最后展示超市交易數(shù)據(jù),進(jìn)一步激發(fā)學(xué)生學(xué)習(xí)關(guān)聯(lián)分析的興趣。

      (2)提高課堂教學(xué)師生互動(dòng)的多樣性。數(shù)據(jù)挖掘算法的理論性比較強(qiáng),涉及數(shù)學(xué)、統(tǒng)計(jì)學(xué)與控制學(xué)等不同學(xué)科的知識(shí),若只是采用傳統(tǒng)的教師單方面講授方式則可能增加學(xué)生接受知識(shí)的難度,也容易導(dǎo)致學(xué)生學(xué)習(xí)挫敗感的產(chǎn)生。在概念理解、公式推導(dǎo)與定理證明的過(guò)程中靈活采用啟發(fā)式、討論式和交互式等多種方式教學(xué),教師在課堂上穿針引線般地評(píng)述一些重點(diǎn)、難點(diǎn)的知識(shí),學(xué)生進(jìn)行分組討論,迭代實(shí)現(xiàn)相關(guān)理論的理解。譬如, 在講授樸素貝葉斯算法時(shí),筆者首先帶領(lǐng)學(xué)生回顧概率論中的條件概率、獨(dú)立同分布等基本知識(shí),然后簡(jiǎn)述先驗(yàn)概率與后驗(yàn)概率的計(jì)算方法,最后學(xué)生分組討論最大后驗(yàn)的數(shù)學(xué)意義與物理意義及基于最大后驗(yàn)概率的樸素貝葉斯分類器的訓(xùn)練過(guò)程。

      (3)加強(qiáng)算法流程的樣例講解,以具體的簡(jiǎn)單數(shù)據(jù)樣例來(lái)講解算法運(yùn)行過(guò)程中的關(guān)鍵步驟。數(shù)據(jù)挖掘算法相對(duì)比較復(fù)雜,若只是進(jìn)行文字講解,學(xué)生難以把握其中的關(guān)鍵環(huán)節(jié),這會(huì)制造學(xué)生深度理解算法思想的障礙,不利于后續(xù)的實(shí)驗(yàn)教學(xué)。譬如,在講解關(guān)聯(lián)規(guī)則挖掘算法Apriori的流程時(shí),以具體交易數(shù)據(jù)來(lái)說(shuō)明候選項(xiàng)集的產(chǎn)生過(guò)程與基于支持度的頻繁項(xiàng)集生成過(guò)程,輔助學(xué)生理解造成Apriori算法空間度過(guò)高的原因,有助于學(xué)生形成新的改進(jìn)思路。通過(guò)這些教改措施,提升了學(xué)生對(duì)數(shù)據(jù)挖掘課程的興趣度,夯實(shí)了學(xué)生理解與改進(jìn)現(xiàn)有算法所必需的數(shù)學(xué)基礎(chǔ)。

      3.3.2 小結(jié)

      筆者依托北京航空航天大學(xué)研發(fā)的信息類專業(yè)教學(xué)云平臺(tái)CourseGrading(www.educg.net.cn)與weka(www.cs.waikato.ac.nz/ml/weka)等開(kāi)源數(shù)據(jù)挖掘軟件,提出了線下編程和線上操作相互結(jié)合、理論算法實(shí)現(xiàn)與商業(yè)應(yīng)用實(shí)踐相互印證的實(shí)驗(yàn)教學(xué)方法,根據(jù)實(shí)驗(yàn)內(nèi)容將實(shí)驗(yàn)任務(wù)劃分為驗(yàn)證性實(shí)驗(yàn)、實(shí)操性實(shí)驗(yàn)與應(yīng)用性實(shí)驗(yàn)三個(gè)層次,對(duì)不同層次的實(shí)驗(yàn)項(xiàng)目實(shí)施教學(xué)方法。(1)驗(yàn)證性實(shí)驗(yàn)項(xiàng)目主要包括主成分分析法PCA、關(guān)聯(lián)規(guī)則挖掘算法Apriori、分類算法KNN與聚類算法kmeans。利用weka軟件自帶的數(shù)據(jù)集體驗(yàn)算法的計(jì)算機(jī)制,通過(guò)調(diào)整算法參數(shù)體驗(yàn)算法對(duì)參數(shù)的敏感性,通過(guò)在同一算法參數(shù)配置下計(jì)算不同規(guī)模數(shù)據(jù)集的計(jì)算結(jié)果以使學(xué)生體會(huì)算法復(fù)雜度的意義,進(jìn)而加深算法優(yōu)缺點(diǎn)的理解,為后續(xù)的應(yīng)用性實(shí)驗(yàn)打下良好的基礎(chǔ)。(2)操作性實(shí)驗(yàn)項(xiàng)目主要是在云平臺(tái)CourseGrading上以線上方式進(jìn)行實(shí)戰(zhàn)環(huán)境訓(xùn)練,學(xué)生自己根據(jù)實(shí)驗(yàn)項(xiàng)目的輸入要求從UCI數(shù)據(jù)集市中選擇合適的實(shí)驗(yàn)數(shù)據(jù)集,或者通過(guò)一些數(shù)據(jù)預(yù)處理方法對(duì)所選取得數(shù)據(jù)執(zhí)行轉(zhuǎn)換、規(guī)約、降維等操作,以完成實(shí)驗(yàn)數(shù)據(jù)的準(zhǔn)備工作,然后要求學(xué)生利用數(shù)據(jù)進(jìn)行模型訓(xùn)練與評(píng)估,以此加深訓(xùn)練集、驗(yàn)證集與測(cè)試集等概念的理解,體驗(yàn)交叉驗(yàn)證與模型選擇的價(jià)值,培養(yǎng)學(xué)生基于拿來(lái)主義的算法選型能力。(3)應(yīng)用性實(shí)驗(yàn)是以培養(yǎng)學(xué)生發(fā)現(xiàn)問(wèn)題、分析問(wèn)題與解決問(wèn)題的綜合能力,應(yīng)用性數(shù)據(jù)挖掘任務(wù)的工作量往往比較大,一般單個(gè)學(xué)生難以獨(dú)立完成,筆者根據(jù)學(xué)生自愿組合的方式將實(shí)驗(yàn)班級(jí)分成若干個(gè)4人小組,在完成相關(guān)應(yīng)用性數(shù)據(jù)挖掘項(xiàng)目時(shí)實(shí)行小組組長(zhǎng)負(fù)責(zé)制下的組內(nèi)成員協(xié)作管理方式,這一方面培養(yǎng)學(xué)生個(gè)體獨(dú)立專研的能力,另一方面培養(yǎng)學(xué)生的團(tuán)隊(duì)協(xié)作能力。以社交媒體情感分析為例,來(lái)說(shuō)明應(yīng)用性實(shí)驗(yàn)的教學(xué)方法。首先引導(dǎo)學(xué)生利用現(xiàn)有的爬蟲(chóng)工具或者自編網(wǎng)絡(luò)爬蟲(chóng)程序來(lái)完成數(shù)據(jù)采集工作,尋找合適情感詞典,然后指導(dǎo)學(xué)生借助TFIDF模型獲得文本的淺層表示,鼓勵(lì)有專研能力的學(xué)生學(xué)習(xí)GRU、LSTM、Text-CNN等適用于序列表示學(xué)習(xí)的深度模型,在情感分析上,提供適用于文本情感分析的有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)與半監(jiān)督學(xué)習(xí)等不同思路,學(xué)生根據(jù)自己對(duì)問(wèn)題的認(rèn)識(shí)作出選擇,最后鼓勵(lì)學(xué)生尋找相關(guān)可視化開(kāi)源庫(kù)對(duì)小組的情感分析結(jié)果進(jìn)行展示。通過(guò)上述三個(gè)層次的實(shí)驗(yàn)教學(xué),學(xué)生不但可以理解數(shù)據(jù)挖掘算法的具體原理,而且通過(guò)在云平臺(tái)上的實(shí)際操作練習(xí)更加深刻地體會(huì)到數(shù)據(jù)挖掘技術(shù)實(shí)踐應(yīng)用的魅力。

      3.3.3 考核方式創(chuàng)新

      課程考核成績(jī)主要由理論考核與實(shí)驗(yàn)考核兩部分組成,分別占總成績(jī)的50%。理論考核是通過(guò)開(kāi)卷或閉卷形式的考試來(lái)完成。實(shí)驗(yàn)考核是由指導(dǎo)教師評(píng)價(jià)與小組成員互評(píng)二部分構(gòu)成。小組成員根據(jù)本組每位成員在實(shí)驗(yàn)過(guò)程中的分工情況與對(duì)實(shí)驗(yàn)內(nèi)容完成的貢獻(xiàn)度進(jìn)行成績(jī)?cè)u(píng)價(jià),占實(shí)驗(yàn)成績(jī)的30%。教師通過(guò)每個(gè)學(xué)生提交的實(shí)驗(yàn)總結(jié)書(shū)面報(bào)告進(jìn)行成績(jī)?cè)u(píng)價(jià),占實(shí)驗(yàn)成績(jī)的70%。

      4 結(jié)論

      隨著人工智能和大數(shù)據(jù)技術(shù)的發(fā)展和應(yīng)用,數(shù)據(jù)挖掘人才的需求持續(xù)高漲?,F(xiàn)有的數(shù)據(jù)挖掘課程教學(xué)方法難以適應(yīng)高等教育內(nèi)涵發(fā)展的新要求。本研究借助CDIO 理念,從教學(xué)目標(biāo)、教學(xué)內(nèi)容與教學(xué)方法三個(gè)方面入手,圍繞新時(shí)代人才培養(yǎng)目標(biāo),在數(shù)據(jù)挖掘理論知識(shí)傳授與實(shí)驗(yàn)教學(xué)模式設(shè)計(jì)分別進(jìn)行探索,理論與實(shí)踐緊密結(jié)合,推動(dòng)課程建設(shè)和課程教學(xué)改革。教學(xué)實(shí)踐證明了所提出的教改措施是行之有效的。

      猜你喜歡
      數(shù)據(jù)挖掘算法實(shí)驗(yàn)
      記一次有趣的實(shí)驗(yàn)
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      基于MapReduce的改進(jìn)Eclat算法
      做個(gè)怪怪長(zhǎng)實(shí)驗(yàn)
      Travellng thg World Full—time for Rree
      進(jìn)位加法的兩種算法
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
      實(shí)踐十號(hào)上的19項(xiàng)實(shí)驗(yàn)
      太空探索(2016年5期)2016-07-12 15:17:55
      一種改進(jìn)的整周模糊度去相關(guān)算法
      合山市| 福州市| 萨迦县| 千阳县| 阳泉市| 巴里| 泾川县| 隆化县| 奎屯市| 赤峰市| 当阳市| 崇明县| 南江县| 山阳县| 离岛区| 焉耆| 广丰县| 屏山县| 江永县| 崇阳县| 六安市| 绥化市| 武安市| 仁布县| 通榆县| 神木县| 鹤峰县| 太仆寺旗| 张家川| 姜堰市| 中西区| 游戏| 平度市| 松潘县| 从江县| 昔阳县| 吉水县| 固原市| 白城市| 蓝山县| 日喀则市|