王勤超 顧陸偉 蔡小慶 劉小丹 許俊
摘要:隨著互聯(lián)網(wǎng)的普及,電腦、iPad等移動終端被廣泛運用在人們生產(chǎn)生活中,極大地提升了工作效率,高校學(xué)生信息管理系統(tǒng)也逐步朝著智能化、自動化和信息化的方向發(fā)展。數(shù)據(jù)挖掘作為建設(shè)學(xué)生信息管理系統(tǒng)中重要技術(shù)之一,不僅能夠確保信息管理的有效性,更可輔助高校及時調(diào)整教學(xué)決策,促進學(xué)生的健康全面發(fā)展。高校應(yīng)結(jié)合自身實際情況,綜合考慮學(xué)生就業(yè)需要、教學(xué)目標等方面的內(nèi)容,合理地運用數(shù)據(jù)挖掘技術(shù),開發(fā)針對性學(xué)生信息管理系統(tǒng),確保學(xué)生信息管理的完整性與可靠性。該文簡要分析數(shù)據(jù)挖掘技術(shù),重點探討該種技術(shù)在學(xué)生信息管理系統(tǒng)的應(yīng)用途徑和注意要點。
關(guān)鍵詞:數(shù)據(jù)挖掘;信息管理;決策樹;應(yīng)用效率
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2016)29-0020-02
在科學(xué)技術(shù)日新月異的時代背景下,計算機等設(shè)備開始運用在高校學(xué)生信息管理系統(tǒng)中,為提升學(xué)生信息管理的有效性,高校應(yīng)重視開發(fā)針對性信息管理系統(tǒng),收集學(xué)生完整的信息,降低學(xué)生信息管理工作的難度。但受到多種內(nèi)外部因素的限制,當(dāng)前高校學(xué)生信息管理系統(tǒng)多而雜,且不同的系統(tǒng)支持后臺與軟件都存在差異,增加了信息管理工作的難度,因此,高校須合理運用數(shù)據(jù)挖掘技術(shù),將其應(yīng)用在信息管理系統(tǒng)中,通過存儲數(shù)據(jù)、分布數(shù)據(jù)等方式,實現(xiàn)信息管理工作的高效性、準確性。
1學(xué)生信息管理系統(tǒng)中應(yīng)用的數(shù)據(jù)挖掘技術(shù)
信息管理系統(tǒng)以辦公設(shè)備、通信傳輸設(shè)備、計算機技術(shù)等為基礎(chǔ),將信息的挖掘、收集、傳遞、整理、儲存等過程有機統(tǒng)一,從而科學(xué)簡化信息管理系統(tǒng)的操作程序,減少信息管理的工作量,因此,將信息管理系統(tǒng)應(yīng)用在高校日常工作中,不僅能夠提高學(xué)校工作效率,更可為高校決策提供準確的數(shù)據(jù)參考。
1.1數(shù)據(jù)挖掘技術(shù)方式與功能
數(shù)據(jù)挖掘技術(shù)主要是指在大量不完整、隨機、模糊的原始數(shù)據(jù)中,通過一定的技術(shù),提取出深層次、具備實際價值、無法提前預(yù)測信息的整個過程,該技術(shù)具備應(yīng)用性、潛在性和價值性三個特征,其具體的操作程序為:收集原始數(shù)據(jù)—選擇恰當(dāng)數(shù)據(jù)一對數(shù)據(jù)進行預(yù)處理一轉(zhuǎn)換數(shù)據(jù)一挖掘數(shù)據(jù)一發(fā)現(xiàn)知識;其中,收集原始數(shù)據(jù)的過程屬于確定信息挖掘?qū)ο螅x擇數(shù)據(jù)等三個步驟屬于準備數(shù)據(jù)的過程。
數(shù)據(jù)挖掘技術(shù)常用到的方式包括以下幾種:一是決策樹一,顧名思義,決策樹屬于樹形結(jié)構(gòu)的分類模型,每個樹形結(jié)構(gòu)都代表著一個屬性的數(shù)值,整個結(jié)點就表示一個數(shù)據(jù)集,其遞歸方式通常采取自上而下的形式,該種決策樹的運用范圍較廣,特別是大規(guī)模的數(shù)據(jù)集,其具備容易理解、描述語言簡單、信息準確性高等多種優(yōu)點;二是神經(jīng)網(wǎng)絡(luò),根據(jù)網(wǎng)絡(luò)性能的不同,可分為確定式、連續(xù)式、隨機式等形式的神經(jīng)網(wǎng)絡(luò),該種數(shù)據(jù)挖掘技術(shù)能夠獨立存儲信息、并行處理數(shù)據(jù),可應(yīng)用在快速搜索中;三是遺傳算法,該種技術(shù)以生物進化論為基礎(chǔ),屬于搜索中最優(yōu)解算法,分為優(yōu)化過程與尋優(yōu)過程。將其與決策樹相聯(lián)系,有利于提升數(shù)據(jù)分析的準確率。
1.2決策樹計算方式
決策樹(判定樹)屬于數(shù)據(jù)挖掘技術(shù)中應(yīng)用得較為廣泛的方式,分為多叉樹、二叉樹等結(jié)構(gòu),創(chuàng)建完整決策樹通常分為生成與剪枝兩個過程,主要包括以下幾種算法:
1)ID3計算方式:該種計算方式運用時間長,且影響較廣,具體的計算公式為:
式中pi表示數(shù)據(jù)樣本歸屬于Ci類別中的概率,通過sis公式計算,log2表示采取二進制編碼。
2)C4.5計算方式,具體計算公式為:
3)CART計算方式,具體的計算公式為:
2學(xué)生信息管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)的途徑
學(xué)生信息管理系統(tǒng)主要包括學(xué)籍管理系統(tǒng)、成績管理系統(tǒng)等部分,具體如表1所示,將這些管理系統(tǒng)用數(shù)據(jù)挖掘技術(shù)有機統(tǒng)一,對于提高學(xué)校信息管理工作的有效性有著重要意義。
2.1應(yīng)用的數(shù)據(jù)挖掘技術(shù)
在學(xué)生信息管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù),其具體包括以下幾種方式,分為ASP.NET、Membership、AJAX,每個數(shù)據(jù)挖掘技術(shù)的應(yīng)用范圍不同,發(fā)揮的作用也發(fā)生了相應(yīng)變化,因此,高校應(yīng)結(jié)合自身實際情況,充分發(fā)揮不同數(shù)據(jù)挖掘技術(shù)的作用,確保學(xué)生信息管理工作的順利進行。
2.2設(shè)計數(shù)據(jù)庫
數(shù)據(jù)庫主要包括學(xué)生基本信息、學(xué)籍信息、獎懲信息、成績信息、補考信息和學(xué)生的畢業(yè)信息,本文以學(xué)生基本信息為例,其具體包含學(xué)生序號、姓名、班級、學(xué)號等部分,每個模塊的字段名與數(shù)據(jù)類型如表2所示:
2.3運用數(shù)據(jù)挖掘技術(shù)設(shè)計學(xué)生信息管理系統(tǒng)
設(shè)計學(xué)生信息管理系統(tǒng)時,應(yīng)設(shè)置針對性登錄驗證方式,選擇恰當(dāng)?shù)臄?shù)據(jù)挖掘技術(shù),確保信息管理系統(tǒng)能夠符合教師與學(xué)生的需求。科學(xué)簡化信息管理工作程序,不斷引進先進管理理念,實現(xiàn)信息管理系統(tǒng)的智能化與自動化。
2.3.1數(shù)據(jù)挖掘技術(shù)運用于基本信息管理系統(tǒng)中
學(xué)生與教師在登錄信息管理系統(tǒng)時,應(yīng)通過以下途徑:一是找到登錄入口;二是輸入網(wǎng)絡(luò)地址,只有輸入正確的登錄名與密碼并完成驗證后,才能夠進入到指定頁面,學(xué)校須對登錄名、密碼做出規(guī)定,借助對應(yīng)的人員管理系統(tǒng)生成一一對應(yīng)的登錄名與密碼,管理系統(tǒng)也可以智能判斷用戶角色,協(xié)助教師或者學(xué)生完成操作。將數(shù)據(jù)挖掘技術(shù)運用于學(xué)生基本信息管理系統(tǒng)中,主要包括以下幾個步驟:一是維護基本信息,信息管理系統(tǒng)的教師既可以手動地輸入學(xué)生基本信息,也可借助EXCEL表格直接導(dǎo)入;二是查詢基本信息,直接在數(shù)字平臺上選擇對應(yīng)班級,快速了解學(xué)生情況;三是統(tǒng)計基本信息;四是導(dǎo)出數(shù)據(jù)并打印。
2.3.2數(shù)據(jù)挖掘技術(shù)運用于學(xué)籍管理系統(tǒng)中
將數(shù)據(jù)挖掘技術(shù)運用在學(xué)籍管理系統(tǒng)中,首先,應(yīng)科學(xué)地排列學(xué)生學(xué)號,借助學(xué)生人學(xué)時間、學(xué)院代碼、班級代碼、專業(yè)代碼等內(nèi)容,依次編排學(xué)號;其次,注冊或者變動學(xué)生的學(xué)籍,按照學(xué)生實際情況,處理好學(xué)生學(xué)籍工作;最后,管理學(xué)生的獎懲情況,將學(xué)生在校表現(xiàn)如實地記錄在管理系統(tǒng)中。
2.3.3數(shù)據(jù)挖掘技術(shù)運用于成績管理系統(tǒng)中
成績管理系統(tǒng)是學(xué)生信息管理中重要組成部分,其具體的設(shè)計應(yīng)用步驟有:一是準確錄入學(xué)生的各科考試成績,教師在系統(tǒng)中選擇需要輸入成績的班級,結(jié)合學(xué)生實際情況,錄入其分數(shù),對于沒有成績的學(xué)生,可點擊缺考、緩考;二是審核學(xué)生的考試成績并管理好補考計劃;三是查詢學(xué)生成績并做出統(tǒng)計。
2.3.4數(shù)據(jù)挖掘技術(shù)運用于畢業(yè)管理系統(tǒng)中
畢業(yè)管理系統(tǒng)運行的有效性直接反映著學(xué)校就業(yè)情況,學(xué)校應(yīng)不斷更新畢業(yè)管理系統(tǒng),適時收錄畢業(yè)生最新消息。同時,畢業(yè)管理系統(tǒng)中還需記錄學(xué)生唯一的畢業(yè)證書編號,做好查詢數(shù)據(jù)與統(tǒng)計工作,并將其導(dǎo)出打印,促進數(shù)據(jù)挖掘技術(shù)的運用,提升畢業(yè)生管理的有效性。
3學(xué)生信息管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)注意要點
學(xué)生信息管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)時,主要需注意以下兩方面,一是確保管理系統(tǒng)的安全性,通過設(shè)置防火墻、密碼驗證、輸入內(nèi)容驗證等方式,設(shè)計系統(tǒng)的安全功能;二是確保數(shù)據(jù)收集的完整性,數(shù)據(jù)挖掘技術(shù)能夠收集較大規(guī)模的模糊型信息,因此,在實際應(yīng)用過程中,也必須注重數(shù)據(jù)的完整性,使其可以更全面地反映數(shù)據(jù)的真實性,有機統(tǒng)一數(shù)字挖掘技術(shù)與信息管理之間的關(guān)系,發(fā)揮出原始數(shù)據(jù)信息的價值。
4結(jié)束語
綜上所述,在互聯(lián)網(wǎng)飛速發(fā)展的時代,傳統(tǒng)人工學(xué)生信息管理系統(tǒng)已經(jīng)不能符合學(xué)生需求,高校應(yīng)綜合考慮學(xué)生實際情況、教學(xué)目標等方面的因素,以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ),重點開發(fā)研究綜合性學(xué)生信息管理系統(tǒng),將不同信息管理系統(tǒng)有機統(tǒng)一,充分發(fā)揮信息管理系統(tǒng)的作用,優(yōu)化系統(tǒng)各項操作程序,方便學(xué)校教師學(xué)生使用,提升學(xué)生信息管理的安全性與有效性。在未來的發(fā)展過程中,高校應(yīng)加大對數(shù)據(jù)挖掘技術(shù)的重視程度,科學(xué)運用決策樹的計算方式,在保障管理系統(tǒng)安全性、數(shù)據(jù)完整性的同時,更好地為高校決策參考依據(jù),培養(yǎng)綜合型人才。