• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      學(xué)籍檔案數(shù)據(jù)挖掘流程與技術(shù)初探

      2018-11-14 23:56:26
      長江叢刊 2018年8期
      關(guān)鍵詞:學(xué)籍海量數(shù)據(jù)挖掘

      廣東醫(yī)科大學(xué)教務(wù)處

      隨著信息社會(huì)日新月異的發(fā)展,不少人已經(jīng)感覺到大數(shù)據(jù)時(shí)代的來臨,也享受到大數(shù)據(jù)技術(shù)給生活和工作上帶來的種種便利,大數(shù)據(jù)技術(shù)的意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些海量的數(shù)據(jù)進(jìn)行專業(yè)化處理,通過進(jìn)行海量數(shù)據(jù)挖掘來挖掘出其背后的存在的有價(jià)值的信息,這也是最重要的。

      作為一所有多年歷史的高校,我校內(nèi)部運(yùn)行的各種管理系統(tǒng)和各類數(shù)據(jù)庫,已經(jīng)積累了海量的數(shù)據(jù),然而隱藏在這些海量數(shù)據(jù)背后的深層內(nèi)涵和聯(lián)系一直沒有得到充分的發(fā)掘和應(yīng)用,學(xué)校管理者只能通過簡單數(shù)據(jù)查詢和排序等傳統(tǒng)數(shù)據(jù)庫技術(shù)功能獲得表面的信息。我們努力想要解決的是,如何對那些龐大的海量數(shù)據(jù)進(jìn)行高層次的處理,從中找出管理者關(guān)心的規(guī)律和模式,以此幫助管理者更好地把現(xiàn)有的數(shù)據(jù)轉(zhuǎn)化為可供使用的知識(shí)進(jìn)行決策和研究,來提高學(xué)校管理決策的科學(xué)性,提高管理水平和辦學(xué)質(zhì)量。

      學(xué)籍檔案是由學(xué)生自進(jìn)入高校就形成的文件,包括新生錄取名冊,新生入學(xué)登記表,學(xué)生學(xué)籍卡,完整記載每學(xué)期學(xué)習(xí)成績的學(xué)生成績單,因出現(xiàn)留級(jí),休學(xué),復(fù)學(xué)等學(xué)籍異動(dòng)而產(chǎn)生的相關(guān)學(xué)籍異動(dòng)資料及學(xué)籍異動(dòng)證明,在校受到獎(jiǎng)勵(lì)或者處分的獎(jiǎng)懲記錄,畢業(yè)就業(yè)檔案等整個(gè)在?;顒?dòng)中形成的文字、報(bào)表、圖像等有保存價(jià)值的原始記錄,是記錄和反映學(xué)生在讀期間所有學(xué)習(xí)表現(xiàn)的最全面的資料。

      學(xué)籍檔案數(shù)據(jù)挖掘過程就是有目的地從大量數(shù)據(jù)中發(fā)掘出有用知識(shí)的過程,此過程通常包括六個(gè)基本步驟:定義主題、準(zhǔn)備數(shù)據(jù)、瀏覽數(shù)據(jù)、生成模型、瀏覽和驗(yàn)證模型、部署和更新模型。從檔案信息挖掘角度來講就是對現(xiàn)有檔案數(shù)據(jù)信息進(jìn)行分析,將信息之間包含的信息進(jìn)行解構(gòu),最后從中發(fā)掘出自己想要了解的數(shù)據(jù)之間的聯(lián)系及找出他們之間潛在的發(fā)展規(guī)律,并最終將所需要的結(jié)果呈現(xiàn)出來。這個(gè)過程光是借助目前學(xué)籍檔案電子數(shù)據(jù)所依存的學(xué)校信息系統(tǒng)是不能夠完成的,這就需要在對現(xiàn)有的學(xué)籍檔案有足夠的了解的基礎(chǔ)上,對目前急需解決的教學(xué)管理方面的問題深入研究以后,精心制定方案,準(zhǔn)備整理資源、指導(dǎo)技術(shù)實(shí)施、部署應(yīng)用等一系列程序。

      首先就是要對接下來的學(xué)籍檔案數(shù)據(jù)挖掘進(jìn)行前期規(guī)劃。確定預(yù)期目標(biāo)和最終效果,定義主題。所有的技術(shù)工作開展都是圍繞著同一個(gè)目標(biāo)來進(jìn)行的,前期規(guī)劃沒做好,預(yù)期目標(biāo)和最終效果沒定位好,會(huì)導(dǎo)致數(shù)據(jù)挖掘方向盲目不清,造成資源的浪費(fèi)。因此,作為高校,對學(xué)生的學(xué)籍檔案信息進(jìn)行數(shù)據(jù)挖掘應(yīng)與推動(dòng)學(xué)校教學(xué)發(fā)展,促進(jìn)學(xué)生個(gè)人成長的作為戰(zhàn)略目標(biāo),充分了解學(xué)校教學(xué)管理當(dāng)前的工作需求,從而確定對哪些數(shù)據(jù)進(jìn)行挖掘,最終需要達(dá)到怎樣的目標(biāo)。

      高等院校的根本任務(wù)是通過教學(xué)和教育工作來培養(yǎng)高層次人才,所以教學(xué)工作始終是學(xué)校的中心工作。高等教育的重點(diǎn)和關(guān)鍵是提高整個(gè)教育質(zhì)量,學(xué)生成績是評估教學(xué)質(zhì)量的重要依據(jù),也是學(xué)生是否掌握好所學(xué)知識(shí)的重要標(biāo)志。努力提高學(xué)生學(xué)習(xí)成績是每一所高校的目標(biāo),但是影響學(xué)生學(xué)習(xí)成績的因素很多,傳統(tǒng)對正常學(xué)生進(jìn)行學(xué)習(xí)成績分析大多只能得到平均值、學(xué)生成績的分布曲線等,這些信息大多數(shù)還是基于教學(xué)自身來考慮,對于教育決策特別是教學(xué)計(jì)劃修訂,課程安排意義不大。

      根據(jù)我們需要實(shí)現(xiàn)的目標(biāo),教學(xué)管理開發(fā)需求,制定行之有效的方案,收集準(zhǔn)備數(shù)據(jù)。準(zhǔn)備數(shù)據(jù)的過程是先將相關(guān)數(shù)據(jù)進(jìn)行收集,合并和清除定義問題步驟中標(biāo)識(shí)的數(shù)據(jù)。數(shù)據(jù)有可能分布在系統(tǒng)的不同存儲(chǔ)內(nèi)以不同的格式出現(xiàn),其中還可能包含錯(cuò)誤項(xiàng)。將現(xiàn)有數(shù)據(jù)進(jìn)行合并和清除,找出數(shù)據(jù)間互有的相關(guān)性,并把最符合要求的數(shù)據(jù)確定下來,用于分析。

      數(shù)據(jù)準(zhǔn)備大致分為以下幾步:

      (1)數(shù)據(jù)集成:將多個(gè)數(shù)據(jù)源中的數(shù)據(jù)結(jié)合起來存放在一個(gè)一致的數(shù)據(jù)存儲(chǔ)中,根據(jù)用戶的要求從數(shù)據(jù)庫中提取相關(guān)的數(shù)據(jù),數(shù)據(jù)挖掘?qū)⒅饕獜倪@些數(shù)據(jù)中進(jìn)行知識(shí)提取。

      (2)數(shù)據(jù)清理:對數(shù)據(jù)進(jìn)行初步的整理和清理,提高數(shù)據(jù)的質(zhì)量和有效性,做好數(shù)據(jù)分析的提前準(zhǔn)備。

      (3)數(shù)據(jù)轉(zhuǎn)換:將數(shù)據(jù)轉(zhuǎn)換成易于進(jìn)行數(shù)據(jù)挖掘的形式。

      (4)數(shù)據(jù)歸約:數(shù)據(jù)歸約的目的是縮小所挖掘數(shù)據(jù)的規(guī)模,但不會(huì)影響或基本不影響挖掘結(jié)果。

      完成數(shù)據(jù)準(zhǔn)備基本步驟后,根據(jù)因?qū)嶋H工作需求而確定下來的目標(biāo)和對現(xiàn)有各種算法的特點(diǎn)進(jìn)行分析后選擇出最適合的挖掘方法,用數(shù)據(jù)挖掘工具和方法對經(jīng)過轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行分析,搜索或產(chǎn)生一個(gè)特定的感興趣的模式。對發(fā)現(xiàn)的模式或數(shù)據(jù)集進(jìn)行解釋和評價(jià),過濾出符合用戶需求的知識(shí);最后利用可視化技術(shù)將有意義的模式轉(zhuǎn)化成用戶可理解的語言。

      數(shù)據(jù)挖掘這項(xiàng)技術(shù)在現(xiàn)在這個(gè)講究大數(shù)據(jù)的時(shí)代,特別是面對數(shù)據(jù)類型紛繁復(fù)雜的學(xué)籍檔案,能夠幫助我們找出數(shù)據(jù)背后隱藏深層次的聯(lián)系,它需要對各項(xiàng)學(xué)籍檔案數(shù)據(jù)最大限度的實(shí)現(xiàn)信息化管理為數(shù)據(jù)挖掘搭建基礎(chǔ)平臺(tái),另一方面也需要有信息技術(shù)知識(shí)基礎(chǔ)而又了解的學(xué)籍檔案及教學(xué)管理工作的綜合性管理人才的參與,只有這樣才能真正了解學(xué)籍檔案信息挖掘的需求和目標(biāo),使得來的知識(shí)真正服務(wù)于教學(xué)管理的實(shí)際工作。

      [1]徐敏.教務(wù)管理系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用探究[J].教育教學(xué)論壇,2017(4):9~10.

      [2]張偉.檔案大數(shù)據(jù)挖掘流程與技術(shù)研究[J].蘭臺(tái)世界,2017(17):35~38.

      猜你喜歡
      學(xué)籍海量數(shù)據(jù)挖掘
      一種傅里葉域海量數(shù)據(jù)高速譜聚類方法
      高校學(xué)籍異動(dòng)學(xué)生管理工作的思考
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      學(xué)籍學(xué)歷電子注冊管理系統(tǒng)在學(xué)籍管理中的應(yīng)用與實(shí)現(xiàn)
      海量快遞垃圾正在“圍城”——“綠色快遞”勢在必行
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      一個(gè)圖形所蘊(yùn)含的“海量”巧題
      教育部:不得將學(xué)籍作為中小學(xué)生入學(xué)和轉(zhuǎn)學(xué)條件
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      邯郸县| 郑州市| 昌黎县| 谢通门县| 贵德县| 固始县| 博罗县| 大同县| 平江县| 双江| 淮北市| 黔南| 云和县| 广元市| 库尔勒市| 方山县| 柳河县| 昭平县| 杂多县| 抚顺市| 萝北县| 含山县| 芜湖县| 安西县| 香港 | 新民市| 平利县| 加查县| 哈巴河县| 龙海市| 宜黄县| 汕头市| 白山市| 施甸县| 电白县| 景德镇市| 富锦市| 大宁县| 灵台县| 水城县| 开平市|