• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      “數(shù)據(jù)挖掘技術(shù)”課程教學(xué)改革與探索
      ——以北華航天工業(yè)學(xué)院電子與通信工程專業(yè)研究生“數(shù)據(jù)挖掘技術(shù)”課程教學(xué)為例

      2021-07-15 07:34:48李會民王延倉馬桂英
      關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘航天

      李會民,王延倉,馬桂英

      (1.北華航天工業(yè)學(xué)院 計算機學(xué)院,河北 廊坊 065000;2.北華航天工業(yè)學(xué)院 遙感信息工程學(xué)院,河北 廊坊 065000;3.北華航天工業(yè)學(xué)院 圖書館,河北 廊坊 065000)

      一、前言

      作為航天特色院校,我校電子與通信工程專業(yè)研究生開設(shè)了“數(shù)據(jù)挖掘技術(shù)”課程,結(jié)合我校培養(yǎng)要求,對“數(shù)據(jù)挖掘技術(shù)”課程教學(xué)與實踐進行了一系列的探索與改革。“數(shù)據(jù)挖掘技術(shù)”課程本身是實踐性很高的課程,是其他專業(yè)領(lǐng)域開展科學(xué)研究的重要工具,是為其他專業(yè)研究服務(wù)的[1](350)。

      數(shù)據(jù)挖掘是指從數(shù)據(jù)庫或流數(shù)據(jù)的大量數(shù)據(jù)中通過分析、處理,揭示出隱含的、先前未知的并有潛在價值的信息的過程。也可以認(rèn)為,數(shù)據(jù)挖掘是一種決策支持手段,它主要基于人工智能、機器學(xué)習(xí)、模式識別、統(tǒng)計學(xué)、數(shù)據(jù)庫技術(shù)和可視化技術(shù)等,通過不同算法實施,自動化地分析企業(yè)給定的數(shù)據(jù)或?qū)崟r到來的流媒體數(shù)據(jù),作出歸納性的推理,從中“挖掘”出潛在的、有價值的模式和規(guī)律,從而幫助決策者調(diào)整市場策略,減少風(fēng)險產(chǎn)生,作出正確的決策。數(shù)據(jù)挖掘技術(shù)的知識發(fā)現(xiàn)過程由以下三個階段構(gòu)成:第一是數(shù)據(jù)準(zhǔn)備階段;第二是數(shù)據(jù)挖掘階段;第三是結(jié)果表達和解釋階段。數(shù)據(jù)挖掘也可以與用戶或知識庫交互?,F(xiàn)在,許多高校的數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)、人工智能專業(yè)、軟件工程專業(yè)大都開設(shè)有“數(shù)據(jù)挖掘技術(shù)”這門課程,工科研究生培養(yǎng)中也都開設(shè)有此課程,足以見數(shù)據(jù)挖掘技術(shù)之重要。除了傳統(tǒng)的基于數(shù)據(jù)庫的挖掘技術(shù)外,現(xiàn)在又興起對大數(shù)據(jù)、流媒體數(shù)據(jù)進行挖掘的技術(shù),這相較于傳統(tǒng)數(shù)據(jù)挖掘有些區(qū)別,主要是處理的數(shù)據(jù)對象不同,大數(shù)據(jù)由于數(shù)據(jù)量大和類型多樣化,甚至大部分是非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),而傳統(tǒng)數(shù)據(jù)技術(shù)都是基于結(jié)構(gòu)化數(shù)據(jù)處理和靜態(tài)數(shù)據(jù)庫的,因此,新的數(shù)據(jù)挖掘技術(shù)要能運行在分布式集群中,支持大數(shù)據(jù)的挖掘,也要在算法上進行改進,支持實時流媒體數(shù)據(jù)的挖掘處理,總之,數(shù)據(jù)挖掘技術(shù)要與時俱進,跟上時代潮流。可喜的是,目前已有基于大數(shù)據(jù)和流媒體數(shù)據(jù)的挖掘軟件,如針對流數(shù)據(jù)處理分析的軟件有Storm、S4、Flume、Streams、Puma、DStream、SuperMario、銀 河流數(shù)據(jù)處理平臺等;基于大數(shù)據(jù)挖掘的軟件有Dremel、Hive、Cassandra、Impala、Pig等;針對大規(guī)模圖結(jié)構(gòu)數(shù)據(jù)的挖掘處理的軟件有Pregel、GraphX、Giraph、PowerGraph、Hama、GoldenOrb等。數(shù)據(jù)挖掘過程如圖1所示。

      圖1 典型數(shù)據(jù)挖掘過程

      因此研究生培養(yǎng)過程中,為了更好適應(yīng)研究領(lǐng)域處理數(shù)據(jù)的需要,需要切實掌握數(shù)據(jù)挖掘相關(guān)技術(shù),并通過大量的專業(yè)領(lǐng)域挖掘案例,結(jié)合本專業(yè)實際才能盡快入門和掌握這門技術(shù),將之熟練運用到相關(guān)專業(yè)的研究中去。目前,隨著“人工智能”、大數(shù)據(jù)、“物聯(lián)網(wǎng)”、云計算時代的到來,各行各業(yè)的數(shù)據(jù)獲取變得很方便,如何從這些海量領(lǐng)域數(shù)據(jù)中挖掘出有價值的專業(yè)知識、規(guī)律,是學(xué)習(xí)和掌握”數(shù)據(jù)挖掘技術(shù)”課程的目的[2](93)。

      二、“數(shù)據(jù)挖掘技術(shù)”課程的特點和受眾分析

      (一)”數(shù)據(jù)挖掘技術(shù)”課程特點

      數(shù)據(jù)挖掘技術(shù)能運用統(tǒng)計、OLAP在線分析處理、信息資料檢索、機器深度學(xué)習(xí)、專家系統(tǒng)和模式識別等方法從海量的數(shù)據(jù)中挖掘出有價值的內(nèi)容,從而幫助決策者做出準(zhǔn)確判斷。如今流行的車牌識別、人像識別技術(shù)都與數(shù)據(jù)挖掘之機器學(xué)習(xí)有聯(lián)系[3](146)。數(shù)據(jù)挖掘技術(shù)是結(jié)合了其他多領(lǐng)域的綜合學(xué)科,與大數(shù)據(jù)技術(shù)、人工智能、機器學(xué)習(xí)、多源數(shù)據(jù)融合技術(shù)存在密切的聯(lián)系,它們都可以歸為數(shù)據(jù)挖掘的概念?!皵?shù)據(jù)挖掘技術(shù)”本身的特點也決定了在教學(xué)過程中的特殊性,即注重結(jié)合實際專業(yè)的應(yīng)用性,結(jié)合本專業(yè)實際,適當(dāng)調(diào)整和優(yōu)化數(shù)據(jù)挖掘算法,以更好地適應(yīng)本領(lǐng)域科學(xué)研究的需要?!皵?shù)據(jù)挖掘技術(shù)”課程的前導(dǎo)課程是數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)庫技術(shù)、程序設(shè)計。要求研究生能熟練掌握常用的數(shù)據(jù)挖掘算法[4](95),如關(guān)聯(lián)規(guī)則、對數(shù)據(jù)分類和聚類,特別是對大數(shù)據(jù)的處理,能熟練運用一種編程語言,C或C++、JAVA或者PYTHON語言。

      (二)課程受眾分析

      針對不同類型的學(xué)生,對此課程要求也有所不同。本科生階段開設(shè)此課程,多數(shù)是要求了解和掌握相關(guān)技術(shù),并進行一定的案例操作,為后續(xù)學(xué)習(xí)打下基礎(chǔ)。而研究生培養(yǎng)階段開設(shè)此課程,多數(shù)是通過掌握數(shù)據(jù)相關(guān)技術(shù),對本研究領(lǐng)域開展研究工作,是作為一種工具出現(xiàn)的。針對不同學(xué)校,開設(shè)此課的側(cè)重點也有所不同。要針對研究生的專業(yè)特點和個人編程基礎(chǔ),開展個性化因材施教。本屆選修本課的共十二名研究生,三分之二的研究生本科專業(yè)與計算機相關(guān),其余的有通信工程、控制工程專業(yè)。不管是計算機相關(guān)專業(yè)和其他專業(yè),他們普遍存在程序設(shè)計理論基礎(chǔ)差和編程實踐少的問題。問卷調(diào)研和座談走訪顯示,他們雖學(xué)過一定的編程,但大多數(shù)人只是能應(yīng)付課程考試,缺乏實際案例挖掘經(jīng)驗與項目驅(qū)動。

      選擇一種合適、順手的編程語言對于掌握數(shù)據(jù)挖掘技術(shù)是十分必要的[5](129-130)。綜合比較常用程序語言,發(fā)現(xiàn)PYTHON和java語言都易于學(xué)習(xí)和上手,對基礎(chǔ)要求不高,況且有多種支持此語言的數(shù)據(jù)挖掘組件庫供選擇使用,也容易自學(xué)和擴展,況且用java語言編寫的程序兼容性較好,因多數(shù)軟件都是基于java環(huán)境運行的。學(xué)習(xí)時在快速掌握基本語法結(jié)構(gòu)后,結(jié)合實際挖掘領(lǐng)域案例來加快對語言的理解和掌握,也訓(xùn)練了挖掘算法的使用,實在是一舉多得的事情。我們在實際教學(xué)中引入了“電商用戶行為分析數(shù)據(jù)挖掘分析”“電影推薦”“公交站點優(yōu)化”等案例[6](217),從而激發(fā)了研究生的學(xué)習(xí)興趣,提高了他們分析問題和解決問題的能力。通過分組協(xié)作完成的模式,也促進了他們之間的思想交流和經(jīng)驗總結(jié)、創(chuàng)新思維表達方式、團隊合作意識和能力的提高,為后面專業(yè)領(lǐng)域研究打下了堅實的基礎(chǔ)。

      三、“數(shù)據(jù)挖掘技術(shù)”教學(xué)內(nèi)容和方法設(shè)計

      “數(shù)據(jù)挖掘技術(shù)”課程教學(xué)中開展了多種教學(xué)方式。首先,在教學(xué)過程中融入思政元素,培養(yǎng)具有吃苦耐勞、耐得住寂寞、精益求精的航天精神,傳遞社會正能量[7](108)。其次,學(xué)習(xí)方法有針對性,重視實踐教學(xué)在該課程中的重要作用,該課程對研究生能力的培養(yǎng)主要針對航天電子與通信工程專業(yè),培養(yǎng)數(shù)據(jù)挖掘分析能力是課程的最終目標(biāo)。最后,教學(xué)中通過案例驅(qū)動,分層次帶領(lǐng)研究生進行企業(yè)學(xué)習(xí)與實習(xí),將面覆蓋到所有研究生,使所有研究生學(xué)有所成、學(xué)有所得[8](141)。研究生能力的提高能夠帶動研究生做科研、參加研究生競賽等活動。再結(jié)合導(dǎo)師的項目實際,以形成項目驅(qū)動教學(xué)、教學(xué)促進項目的良性循環(huán)研究模式。整個教學(xué)內(nèi)容和方法設(shè)計如圖2所示。

      圖2 教學(xué)內(nèi)容和方法設(shè)計

      (一)教學(xué)與培養(yǎng)設(shè)計

      經(jīng)過多年的課程實踐建設(shè),完成了“數(shù)據(jù)挖掘技術(shù)”課程大綱的撰寫及授課計劃的制定,并根據(jù)教學(xué)情況及社會需求不斷調(diào)整;特別是一年來在新冠疫情影響下,更是根據(jù)課程目標(biāo)需求,設(shè)計了線上教學(xué)案例,案例的工作量、難度適中,顧及各個層面、不同專業(yè)背景的研究生,使所有研究生都能學(xué)有所長。另外,在教學(xué)中自覺引入思政教育,結(jié)合學(xué)校航天特色,課程與案例中有意識地融入了傳遞航天精神、不成功決不罷休精神,通過介紹航天科學(xué)家錢學(xué)森、孫家棟等英雄的事跡,傳遞社會主義核心價值觀、社會正能量和正義感等內(nèi)容,有利于研究生更好地踏入社會,融入專業(yè)領(lǐng)域研究工作中。為適應(yīng)航天專業(yè)特色,我們編制了“數(shù)據(jù)挖掘技術(shù)”教材講義、輔助閱讀等資料。由于國內(nèi)沒有與大綱完全吻合的教材選用,課程團隊教師針對大綱內(nèi)容自編了講義和實驗指導(dǎo)文檔,并指導(dǎo)研究生進行課外資料的選擇和閱讀,達到了擴充知識面和提高研究能力的目的。課堂教學(xué)完成后,后期進行課程網(wǎng)絡(luò)資源建設(shè)。本課程利用本校圖書館電子資源和網(wǎng)絡(luò)進行師生交互,利用學(xué)校泛雅課程教學(xué)平臺、雨課堂在線教學(xué)平臺、超星學(xué)習(xí)通平臺進行課程資源共享,學(xué)校圖書館也提供各類電子資源、學(xué)習(xí)網(wǎng)站鏈接,尋求多種問題解決方法,以促進研究生自學(xué),同學(xué)們與老師課堂交流外,還可以通過教學(xué)網(wǎng)站的論壇討論問題,滿足有針對性、個性化學(xué)習(xí)需要。

      (二)案例教學(xué)設(shè)計

      教學(xué)中,針對不同研究生層次,引入多個當(dāng)今主流案例教學(xué),如博客訪客分析、購物用戶分群、抖音粉絲分類等。電商用戶行為分析是綜合運用數(shù)據(jù)挖掘技術(shù)的一個案例之一。數(shù)據(jù)來源是某網(wǎng)站每天的訪問量,數(shù)千萬次訪問量非常巨大。為了便于初步分析,選取近10個月時間內(nèi)某地區(qū)的所有用戶訪問的詳細(xì)記錄作為原始數(shù)據(jù)集,總共包括7,986,459條記錄。非結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)包括USERID、ACCESSTIME、WEB、WEB-PAGE、TITLE、LABALE、CLASS、KEYWORDS等。然后將其存入HBASE列式數(shù)據(jù)庫備用。對其進行數(shù)據(jù)處理與分析挖掘如下:第一是獲取用戶訪問網(wǎng)頁的原始記錄;第二是對數(shù)據(jù)進行多維度分析,包括ACCESSTIME、CONTENT的分析,流失用戶分析以及用戶分群等分析;第三是對數(shù)據(jù)進行預(yù)處理,包含數(shù)據(jù)去重、清洗、缺失值填充、依據(jù)關(guān)鍵字分類等處理,對數(shù)據(jù)預(yù)處理質(zhì)量的好壞,直接關(guān)系到后繼挖掘的效率和意義,通常數(shù)據(jù)預(yù)處理所花費的時間占整個數(shù)據(jù)挖掘過程的70%左右;第四是以用戶訪問網(wǎng)頁后綴為關(guān)鍵條件,對數(shù)據(jù)進行分類及聚類處理;第五是針對得到的不同數(shù)據(jù),使用幾種推薦算法進行對比,通過模型評價,得到較好的最優(yōu)推薦模型。通過模型對樣本數(shù)據(jù)進行預(yù)測,獲得推薦結(jié)果提供給電商平臺,以改進電商平臺的服務(wù)質(zhì)量,提高銷售量和留下老客戶。

      (三)教學(xué)方案設(shè)計

      “數(shù)據(jù)挖掘技術(shù)”課程教學(xué)與實踐中,我們尤其重視實踐教學(xué)的作用,整個課程內(nèi)容以多個案例驅(qū)動,涉及到案例完成所需的各部分技術(shù),分模塊進行講解、實際操作,將案例融入課程教學(xué)的全程雖不是首次,但案例質(zhì)量的好壞、與項目緊密程度就顯得相當(dāng)重要,通常我們會選擇跟他們研究方向、領(lǐng)域相近的案例,進行個性化教育與實踐。通過這種任務(wù)驅(qū)動的授課方式,研究生能夠在學(xué)習(xí)全程精力集中,抓住學(xué)習(xí)重點。在授課過程中,除部分老師講解外,多次使用討論課、啟發(fā)式、探討式教學(xué)和研究生登臺講解相結(jié)合的教學(xué)方法,從而鍛煉他們的表達能力、溝通能力和團隊協(xié)作能力,通過這些嘗試來探索最適合本課程的授課方式。在實施過程中,除了需要注意討論課、啟發(fā)式和探討式教學(xué)對研究生學(xué)習(xí)的積極作用外,還特別注意具體細(xì)節(jié)上的開展。如從研二上學(xué)期,開始推薦研究生到適合的基地實習(xí)。歷年來,多次選派大部分研究生到我校的河北省遙感協(xié)同創(chuàng)新中心、北京軟件測試中心鍛煉,產(chǎn)教融合的教學(xué)特色使研究生能夠在做數(shù)據(jù)分析處理與挖掘的項目中成長,在實踐中得到鍛煉。使得培養(yǎng)的研究生能力更適合航天專業(yè)領(lǐng)域的需求,從歷年就業(yè)情況來看,我們的“數(shù)據(jù)挖掘技術(shù)”課程教學(xué)模式改革與探索是行之有效的,也逐漸推廣到其他課程的教學(xué)中。

      (四)考核方式設(shè)計

      在課程考核方法上,因為是研究生培養(yǎng)階段,對“期末考試+平時成績”的考核機制說“不”。因這種考核方式忽視了對研究生動手實踐能力的考核,不利于研究生科研能力的培養(yǎng)?!皵?shù)據(jù)挖掘技術(shù)”課程注重對案例操作能力的考核,在課程完成后,需要研究生團隊互助配合完成整個案例,能力強的同學(xué)還可以從教師給定的題目中選擇多個來完成,最后進行答辯,根據(jù)研究生的完成情況給出實踐成績。另外為培養(yǎng)研究生的科研與閱讀文獻、寫作能力,也會采用撰寫課程前沿研究報告,并制作PPT公開講解的形式進行輔助考核。這種考核方式重視實踐能力、科研能力、表達能力和自我約束能力,有助于培養(yǎng)研究生動手實踐和獨立開展科學(xué)研究的能力。

      (五)教學(xué)保障設(shè)計

      課程實施中收到了較好的教學(xué)效果,這得益于學(xué)校充分的教學(xué)條件保障。首先,“數(shù)據(jù)挖掘技術(shù)”課程團隊教師具有豐富的教學(xué)經(jīng)驗,從職稱上配備有教授、副教授、講師和助教,從學(xué)歷上有博士、研究生,從年齡上采用老、中、青傳幫帶模式,且以青年教師為主。因青年團隊成員在課程建設(shè)方面思維超前、銳意創(chuàng)新、不拘一格,教學(xué)與實踐效果顯著。其次,本課程建設(shè)突出航天軍工特色,教學(xué)團隊編寫具備航天特色的教材、分層次的課程學(xué)習(xí)模塊、逐步拓展深入的實訓(xùn)項目、完善項目遞進驅(qū)動教學(xué)法,精心設(shè)計多媒體教案、PPT內(nèi)容,生動醒目的課程演示課件、素材、實驗文檔從教學(xué)和實踐各個環(huán)節(jié)都保證了教學(xué)目標(biāo)的實現(xiàn)。最后,除了采用多種教學(xué)方法,形成重視實踐教學(xué)的良性循環(huán)教學(xué)模式,還創(chuàng)建了方便的網(wǎng)上教學(xué)與學(xué)習(xí)環(huán)境,配有學(xué)習(xí)視頻,編程語言python學(xué)習(xí)教程、java自學(xué)教程,網(wǎng)上自學(xué)資源極其豐富。教師可通過課程網(wǎng)站共享優(yōu)秀學(xué)習(xí)資源,并在網(wǎng)上通過E-MAILS、微信、QQ課程群實時在線或離線答疑。研究生通過課堂教學(xué)、課下自習(xí)研究、實訓(xùn)項目的實踐和前沿報告等形式進行常規(guī)學(xué)習(xí)之外,還可借助網(wǎng)站資源自主學(xué)習(xí)及實踐、研究,查閱電子資料等,形成方便的網(wǎng)上學(xué)習(xí)環(huán)境,培養(yǎng)研究生的學(xué)習(xí)常態(tài)化和創(chuàng)新精神,不忘航天初心,不辱學(xué)子使命。經(jīng)過航天特色教育,研究生大都養(yǎng)成了能吃苦、耐勞、不成功決不罷休的好習(xí)慣,良好的學(xué)風(fēng)和寬松的科研環(huán)境,鑄就了研究生精益求精的航天精神,從入學(xué)就立志為祖國的航天事業(yè)做貢獻。在這樣思想引領(lǐng)下,加上個人勤奮好學(xué),團隊合作交流,圓滿完成“數(shù)據(jù)挖掘技術(shù)”課程學(xué)習(xí)任務(wù)、圓滿完成學(xué)業(yè)是必然的。

      四、結(jié)語

      “數(shù)據(jù)挖掘技術(shù)”課程作為一門專業(yè)工具,是其他研究領(lǐng)域不可或缺的。為更好地進行教學(xué)與實踐,培養(yǎng)“德、智”雙收的合格航天人才,結(jié)合我校航天特色,教學(xué)團隊進行了一系列的教學(xué)與實踐探索和改革,包括研究生基礎(chǔ)調(diào)研分析與課程特點分析、課程受眾分析,然后從五個方面對教學(xué)和實踐進行設(shè)計,結(jié)合案例教育、產(chǎn)教融合到企業(yè)“半工半讀“式的實習(xí)模式。幾輪教學(xué)與實踐下來,通過畢業(yè)生100%的航天部門就業(yè)情況分析,此方法理論對于航天電子通信與工程專業(yè)研究生是切實可行的。相信不久的將來,該方法理論也同樣適應(yīng)于其他應(yīng)用型本科院校的研究生培養(yǎng),讓數(shù)據(jù)挖掘不僅僅成為一門工具,更是一種數(shù)字生活方式,甚至成為一種大數(shù)據(jù)時代下的工作模式。

      猜你喜歡
      數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘航天
      我的航天夢
      兒童時代(2022年4期)2022-04-19 11:14:10
      航天夢,我的夢
      軍事文摘(2021年22期)2022-01-18 06:22:56
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      逐夢航天日
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      基于Web的數(shù)據(jù)挖掘技術(shù)與相關(guān)研究
      數(shù)據(jù)挖掘技術(shù)在生物信息學(xué)中的應(yīng)用
      數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用
      基于南京地鐵AFC系統(tǒng)的數(shù)據(jù)挖掘
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      朝阳县| 迁西县| 都匀市| 时尚| 南涧| 舒兰市| 德州市| 巴东县| 庄河市| 鱼台县| 兖州市| 布尔津县| 黑龙江省| 德州市| 尼木县| 商河县| 平阴县| 嘉定区| 油尖旺区| 襄垣县| 白沙| 聊城市| 通道| 怀远县| 珠海市| 大新县| 奉化市| 三台县| 塔城市| 黔东| 利辛县| 图木舒克市| 平昌县| 惠安县| 凯里市| 丰镇市| 凤山市| 车险| 手游| 沂水县| 且末县|