• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)據(jù)挖掘課程中過程生成式啟發(fā)教學(xué)研究

      2021-03-14 06:14:10杜振鑫
      電腦與電信 2021年12期
      關(guān)鍵詞:貝葉斯數(shù)據(jù)挖掘經(jīng)驗

      杜振鑫

      (安徽財經(jīng)大學(xué)管理科學(xué)與工程學(xué)院,安徽 蚌埠 233030)

      1 引言

      隨著各行各業(yè)技術(shù)的發(fā)展,這個時代的數(shù)據(jù)量已經(jīng)發(fā)生跨越式的增長[1,2]。大數(shù)據(jù)技術(shù)的出現(xiàn)很好地解決了大量數(shù)據(jù)的計算問題,數(shù)據(jù)挖掘和機器學(xué)習(xí)也成為一門非常重要的課程。但是數(shù)據(jù)挖掘和機器學(xué)習(xí)教學(xué)存在抽象、難于理解的問題。傳統(tǒng)教材大多采用算法加例題的講授模式,雖然表述嚴(yán)謹(jǐn),卻不利于教學(xué)。覃鳳萍[1]提出問題引導(dǎo)+案例教學(xué)法,高建瓴[3]提出問題驅(qū)動教學(xué)模式,這些方法都是通過案例進行教學(xué),能夠有效降低學(xué)生的學(xué)習(xí)難度。但是這些方法也存在一定缺點:(1)學(xué)生從一個抽象的案例或者項目類比另一個抽象的算法,仍有不小的難度;(2)這些方法往往需要一定軟硬件條件或者明顯降低講課精度,只能偶爾為之,多數(shù)情況下仍然采用傳統(tǒng)的講授式教學(xué)。(3)案例式教學(xué)、項目教學(xué),沒有從本質(zhì)上將算法原理剖開給學(xué)生,學(xué)生只是熟練地模仿項目或案例,王積社等認(rèn)為這種靜態(tài)的實體觀存在缺陷[6],因為事實上世界萬物是不斷變化的,是動態(tài)的,知識就是其生成過程,所以教學(xué)就必須模擬、展現(xiàn)知識的生成過程,學(xué)習(xí)就必須感受、理解知識的生成過程,這樣才能做到知其然而又知其所以然。李文閣[7]等認(rèn)為,“生成:現(xiàn)代哲學(xué)的最強音”,“生成性思維是現(xiàn)代哲學(xué)的基本精神和思維方式”。

      基于過程生成式理念與啟發(fā)式方法,本文首次提出在數(shù)據(jù)挖掘教學(xué)中,讓學(xué)生從最熟悉的生活經(jīng)驗出發(fā),引導(dǎo)學(xué)生將粗糙的生活經(jīng)驗經(jīng)過抽絲剝繭、去粗取精,最后得到嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)表述,相當(dāng)于親自推導(dǎo)出相關(guān)的數(shù)據(jù)挖掘算法,既有效降低了學(xué)習(xí)難度,又加深了理解和記憶,在保證學(xué)科知識教學(xué)正確性與科學(xué)性的基礎(chǔ)上,助力學(xué)生學(xué)科素養(yǎng)與學(xué)科能力的生成,而核心素養(yǎng)已然成為推動當(dāng)代教育課程改革與促進教學(xué)模式轉(zhuǎn)型的頂層理念。近年來,過程生成理念得到了較多的關(guān)注[5,9]。采用過程生成式啟發(fā)教學(xué)法,學(xué)習(xí)過程即知識建構(gòu)的過程,能夠促進高階思維的形成[5]。

      2 教學(xué)現(xiàn)狀

      數(shù)據(jù)挖掘課程需要用到線性代數(shù)、概率統(tǒng)計、機器學(xué)習(xí)等先修課。教學(xué)中主要存在問題是:

      (1)該課程具有知識點多和教學(xué)點分散的特點,理論學(xué)習(xí)難度較大。

      (2)實踐教學(xué)可操作性不強、主要以抽象的理論教學(xué)為主,學(xué)生難以將新知識與老知識進行遷移對照,容易遺忘、理解也不夠深刻。很多學(xué)校將數(shù)據(jù)挖掘歸類為實踐課程,但是在實際操作中,需要花費大量實踐學(xué)習(xí)相關(guān)軟件的使用,造成實踐的效果大打折扣,學(xué)生對完成一套完整的數(shù)據(jù)挖掘流程是比較困難的。

      3 基于過程生成理念的啟發(fā)式教學(xué)設(shè)計

      趙衛(wèi)東等[1-3]提出基于“問題引導(dǎo)+案例”、項目驅(qū)動等教學(xué)模式。例如覃鳳萍[1]將關(guān)聯(lián)規(guī)則用電影推薦作為例子導(dǎo)入。但在教學(xué)中發(fā)現(xiàn),這種方法雖然有效,學(xué)生仍然感覺抽象、難以理解??枴げㄆ諣栒J(rèn)為:“一個人要分享人類緩慢取得的知識,我所知道的唯一方法,就是循著知識創(chuàng)造者的腳印再走一遍”。王積社認(rèn)為[6]:“過程→生成”教學(xué)是由師生共同參與的知識生成過程,該過程始于某種背景,在思想、情操的層層支配下,激起對學(xué)習(xí)目標(biāo)的步步追求,誘導(dǎo)已有知識、技能、方法的循循攝入,形成流變與合生?!斑^程→生成”教學(xué)的基本原則,應(yīng)該遵循:(1)動態(tài)性原則:學(xué)生主動的動手動腦參與推導(dǎo)知識的生成過程。(2)攝入性原則:攝入是過程哲學(xué)的核心范疇,是揭示事物間相互關(guān)聯(lián)的思維方法。例如本文的例題中,將學(xué)生的生活經(jīng)驗與數(shù)據(jù)挖掘算法之間的聯(lián)系揭示出來,就是遵循了攝入性原則。(3)生成性原則:類似于搭積木,避免把知識直接搬給學(xué)生,而是引導(dǎo)學(xué)生逐步搭建出知識。基于過程生成式理念,讓學(xué)生從自己粗糙的生活經(jīng)驗出發(fā),在教師引導(dǎo)下逐步求精地推導(dǎo)出數(shù)據(jù)挖掘算法,讓學(xué)生理解算法的來龍去脈,能夠降低學(xué)習(xí)難度,提高學(xué)習(xí)效率,可以分成三個主要步驟:(1)提出一種學(xué)生熟悉的生活原型,可以比較好地吻合相應(yīng)的數(shù)據(jù)挖掘算法;(2)將粗糙的生活經(jīng)驗提煉,用嚴(yán)密的數(shù)學(xué)語言進行描述,推導(dǎo)出相應(yīng)的數(shù)據(jù)挖掘算法;(3)將學(xué)生根據(jù)生活經(jīng)驗推導(dǎo)的數(shù)據(jù)挖掘算法與教材的數(shù)據(jù)挖掘算法進行對比,揭示兩種算法之間的聯(lián)系。下面將以數(shù)據(jù)挖掘中經(jīng)典的貝葉斯算法作為例子來說明過程生成理念引導(dǎo)的啟發(fā)式教學(xué)方法的應(yīng)用。傳統(tǒng)的貝葉斯分類的教學(xué)大多只關(guān)注后驗概率公式的計算過程,學(xué)生普遍反映這部分的教學(xué)內(nèi)容抽象枯燥,理論與實際相脫離。如果僅僅按照公式講解,學(xué)生比較難以理解。我們從基本的生活經(jīng)驗出發(fā),采用過程生成式啟發(fā)方法教學(xué),引導(dǎo)學(xué)生自己推導(dǎo)出貝葉斯算法。

      例:已知某電腦店銷售數(shù)據(jù)如表1所示,現(xiàn)在有一個新顧客X={“年齡='≤30',收入='中',學(xué)生='是',信譽='中'},試判斷X是否應(yīng)該購買計算機?

      表1 某電腦店銷售數(shù)據(jù)

      分析:(1)提出生活原型:運用生活經(jīng)驗類比法,我們根據(jù)X的年齡=‘≤30’,收入=‘中’,學(xué)生=‘是’,信譽=‘中’,首先憑生活經(jīng)驗判斷,這個人是否應(yīng)該購買計算機?經(jīng)過對學(xué)生提問,發(fā)現(xiàn)90%以上的學(xué)生都能憑直覺得出正確答案:顧客X應(yīng)該購買計算機。教師進一步啟發(fā)學(xué)生思考,為什么會得到這個結(jié)果?如果沒有生活經(jīng)驗,你會得出這樣的結(jié)論嗎?如果是沒有生活經(jīng)驗的幼兒園的學(xué)生,能得出這樣的結(jié)論嗎?學(xué)生經(jīng)過思索,回答:是因為X是學(xué)生,而且收入是‘中’,而計算機并不貴,中等收入足夠購買計算機了,所以根據(jù)生活經(jīng)驗判斷,X多數(shù)會購買計算機。教師進一步啟發(fā)學(xué)生,要用數(shù)據(jù)說話才更加可信。學(xué)生仔細觀察上面的表格,終于找出規(guī)律:提供的銷售記錄共有14個顧客,其中9個人購買了計算機;再仔細觀察這9個人,購買計算機的人中,有6個是學(xué)生,概率是6/9=0.67,這說明,多數(shù)學(xué)生都買了計算機,而X恰好是學(xué)生,因此購買計算機的概率比較大。

      (2)將生活經(jīng)驗提煉:教師進一步引導(dǎo),用數(shù)學(xué)公式表述上面的經(jīng)驗,P(學(xué)生='是'|購買計算機='是')=6/9=0.67;同理,我們可以得出不買計算機的概率是P(學(xué)生='是'|購買計算機='否')=1/5=0.2。上面只分析了X的一個屬性“學(xué)生”,我們同理分析X的其他屬性,得出:P(年齡='≤30'|購買計算機='是')=2/9=0.22;P(年齡='≤30'|購買計算機='否')=3/5=0.6;P(信譽='中'|購買計算機='是')=6/9=0.67;P(信譽='中'|購買計算機='否')=2/5=0.4;P(收入='中'|購買計算機='是')=4/9=0.44;P(收入='中'|購買計算機='否')=2/5=0.4。

      假設(shè)條件獨立性,使用以上概率得到:P(X|購買計算機='是')=P(年齡='≤30'|購買計算機='是')×P(收入='中'|購買計算機='是')×P(學(xué)生='是'|購買計算機='是')×P(信譽='中'|購買計算機='是')=0.22×0.44×0.67×0.67=0.04;P(X|購買計算機='否')=P(年齡='≤30'|購買計算機='否')×P(收入='中'|購買計算機='否')×P(學(xué)生='是'|購買計算機='否')×P(信譽='中'|購買計算機='否')=0.6×0.4×0.2×0.4=0.02。

      到此,我們得出解題需要的兩個關(guān)鍵數(shù)字:P(X|購買計算機='是')=0.04,P(X|購買計算機='否')=0.02。

      進一步,根據(jù)概率統(tǒng)計的知識,考慮“購買計算機='是'”的類:P(X|購買計算機='是')×P(購買計算機='是')=0.04×0.64=0.03;考慮“購買計算機='否'”的類:P(X|購買計算機='否')×P(購買計算機='否')=0.02×0.36=0.01。因此,對于樣本X預(yù)測為“購買計算機='是'”。

      在上面的教學(xué)過程中,我們首先讓學(xué)生完全不管貝葉斯算法的原理,僅僅引導(dǎo)學(xué)生用生活經(jīng)驗自己推導(dǎo),逐步去粗取精,然后用數(shù)學(xué)語言加以嚴(yán)謹(jǐn)描述,最終自己推導(dǎo)出貝葉斯分類算法。經(jīng)過對比,學(xué)生發(fā)現(xiàn)自己推導(dǎo)的貝葉斯算法與教材中的貝葉斯算法的原理一模一樣,從來很快就牢牢理解了貝葉斯算法的思想,并形成了深刻印象。多數(shù)學(xué)生感覺這種類比法有明顯的效果,克服了案例法或者項目法過于抽象、降低講課速度的缺點,知識已經(jīng)內(nèi)化為思維的一部分,更加容易理解和接受。

      在其他很多數(shù)據(jù)挖掘算法中,都可以運用生活經(jīng)驗類比法。例如K近鄰分類,讓學(xué)生回答:假設(shè)對某個人一無所知,但是知道他的K個朋友學(xué)習(xí)都很好,請問此人學(xué)習(xí)是否也很好?學(xué)生很容易自己推導(dǎo)出K近鄰算法,得出此人學(xué)習(xí)很好的結(jié)論。再如:集成學(xué)習(xí)可以用生活中的投票的經(jīng)驗進行類比等等。復(fù)雜的算法,往往都是由簡單的問題加以延伸而成,因此多數(shù)能夠找到問題的原型,用過程生成式教學(xué)方法加以推導(dǎo),就可以得到相應(yīng)的算法。

      4 結(jié)語

      數(shù)據(jù)挖掘的學(xué)習(xí)難度較高,以往的案例驅(qū)動、項目驅(qū)動教學(xué)法仍然存在過于抽象的缺點;而大量的主動學(xué)習(xí)、合作學(xué)習(xí)、研究性學(xué)習(xí)雖然有其優(yōu)點,在實際課堂講授中往往受到軟硬件條件限制或者講課速度過慢,導(dǎo)致講授法仍然占據(jù)課堂主流。本文首次提出在數(shù)據(jù)挖掘中引入過程生成式啟發(fā)教學(xué)方法,克服了上述缺點,引導(dǎo)學(xué)生從熟悉的生活經(jīng)驗出發(fā)推導(dǎo)出相應(yīng)的算法,讓學(xué)生知其然更知其所以然,使得學(xué)生很容易將熟悉的知識遷移到對數(shù)據(jù)挖掘算法的理解中去,具有較高的課堂應(yīng)用價值。

      猜你喜歡
      貝葉斯數(shù)據(jù)挖掘經(jīng)驗
      2021年第20期“最值得推廣的經(jīng)驗”評選
      黨課參考(2021年20期)2021-11-04 09:39:46
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      經(jīng)驗
      2018年第20期“最值得推廣的經(jīng)驗”評選
      黨課參考(2018年20期)2018-11-09 08:52:36
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      貝葉斯公式及其應(yīng)用
      基于貝葉斯估計的軌道占用識別方法
      一種基于貝葉斯壓縮感知的說話人識別方法
      電子器件(2015年5期)2015-12-29 08:43:15
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      當(dāng)你遇見了“零經(jīng)驗”的他
      都市麗人(2015年4期)2015-03-20 13:33:22
      科技| 平江县| 喀喇沁旗| 株洲市| 白水县| 南郑县| 孝义市| 荥阳市| 田东县| 边坝县| 丰宁| 富顺县| 井研县| 河池市| 潞城市| 北安市| 昌平区| 凉山| 波密县| 华坪县| 蓝山县| 沾化县| 龙游县| 长治县| 梅州市| 南京市| 三河市| 榆中县| 玉田县| 巴中市| 砀山县| 房产| 昭觉县| 濮阳县| 山东| 陕西省| 绍兴县| 普定县| 黄陵县| 孝义市| 绥化市|