李旭軍
數(shù)據(jù)挖掘技術(shù)在高校教學質(zhì)量評估中的應用
李旭軍
所謂數(shù)據(jù)挖掘,即從海量的、不完全的、存在一定噪聲的、隨機的數(shù)據(jù)中提取潛在有用的知識信息的過程,這些知識信息人們事先并不知道,可以說它是一種更深層意義的數(shù)據(jù)分析方法,其與多門學科互相交叉,比如數(shù)量統(tǒng)計、模式識別、數(shù)據(jù)庫、神經(jīng)網(wǎng)絡以及數(shù)量統(tǒng)計與模糊學等。在教學評價中應用數(shù)據(jù)挖掘技術(shù)可以對教學評價結(jié)果與其它因素間所隱藏的內(nèi)在聯(lián)系進行全面分析,從而促進教育體制的改革、發(fā)展與完善。討論了數(shù)據(jù)挖掘技術(shù)在高校教學質(zhì)量評估中的應用方法與步驟。
數(shù)據(jù)挖掘;教學質(zhì)量;評估方法
(一)數(shù)據(jù)挖掘的方法
常用的數(shù)據(jù)挖掘的方法包括關(guān)聯(lián)分析、分類、預測、時序模式、聚類分析以及偏差分析等等。下面逐一來看:第一,關(guān)聯(lián)分析。所謂關(guān)聯(lián),即兩個或以上的變量取值間存在一定的規(guī)律性,即為關(guān)聯(lián)。而數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫存中一種重要的、可被發(fā)現(xiàn)的知識。進行關(guān)聯(lián)分析的主要目的是挖掘出隱藏在數(shù)據(jù)庫中的關(guān)聯(lián)網(wǎng)。通常用支持度、可信度兩個閾值來度量關(guān)聯(lián)規(guī)則的相關(guān)性,還可以將興趣度、相關(guān)性等其它參數(shù)引入其中,以保證挖掘的規(guī)則與實際需求更相符。第二,聚類分析。是把相似性較高的數(shù)據(jù)歸納為幾個類別,類別相同其數(shù)據(jù)之間就相似,反之,類別不同其數(shù)據(jù)也存在差異。聚類分析從宏觀的角度建立概念,挖掘數(shù)據(jù)屬性間的相互關(guān)系,找出數(shù)據(jù)的分布模式。第三,分類。將一個類別的概念描述找出來,它可以代表同一類別數(shù)據(jù)的整體信息,也就是這種類別的內(nèi)涵描述,其模型的構(gòu)造也可以通過這種描述來完成,通常用決策樹或者規(guī)則的模式來表示。分類是訓練數(shù)據(jù)集按照相應的算法求出的分類規(guī)則,規(guī)則描述或者預測等均可采用這種方法。第四,預測。這種方法是在分析歷史數(shù)據(jù)的基礎上挖掘出數(shù)據(jù)的變化規(guī)則并建立模型,再由該模型來預測未來數(shù)據(jù)的種類與特征。預測所關(guān)注的是不確定性與精度,其度量指標通常是預測方差。第五,時序模式。這種方法是利用時間序列把一些有較高發(fā)生概率的模式挖掘出來,利用已知的數(shù)據(jù)對未來的值作出預測,不過這些數(shù)據(jù)最大的區(qū)別即為變量的時間有所區(qū)別。第六,偏差分析。其實偏差中有很多有用的知識,數(shù)據(jù)庫的數(shù)據(jù)往往也會存在一些異常,找出這些異常情況也是非常有必要的,因此,偏差分析方法就是挖掘出觀察結(jié)果和參照之間的差異之處。
(二)數(shù)據(jù)挖掘的一般流程
通常數(shù)據(jù)挖掘的一般流程包括以下幾個步驟:第一,定義問題。即將業(yè)務問題做出清晰的定義,以確定出挖掘的目標;第二,數(shù)據(jù)準備。主要包括數(shù)據(jù)選擇、數(shù)據(jù)預處理兩項內(nèi)容,其中:數(shù)據(jù)選擇是在數(shù)據(jù)庫與數(shù)據(jù)倉庫目標中將所要挖掘的數(shù)據(jù)的目標數(shù)據(jù)集提取出來;而數(shù)據(jù)預處理是對數(shù)據(jù)的再加工,主要是對數(shù)據(jù)的完整性、一致性做出檢查,去噪聲,將丟失的域做填補,將無效數(shù)據(jù)刪除等等;第三,數(shù)據(jù)挖掘。即按照數(shù)據(jù)功能的類型、特點選擇適用的計算方法,數(shù)據(jù)集經(jīng)過凈化與轉(zhuǎn)換后即可進行數(shù)據(jù)挖掘;第四,結(jié)果分析。即對挖掘所得的結(jié)果做出評價解釋,并將其轉(zhuǎn)換為用戶可以理解的知識;第五,運用知識。把挖掘出來經(jīng)過轉(zhuǎn)換的知識集成到業(yè)務信息系統(tǒng)組織中去。
通常構(gòu)建教學質(zhì)量的評價體系包括兩個方面,即確定指標與權(quán)值。其中,指標是可測量的行為化、操作化的、具體的目標在某個方面的規(guī)定,即它所反映出的不是所有的目標,而是整體目標其中的一個方面。相關(guān)的一組指標構(gòu)成一個系統(tǒng),可以將目標整體全面地反映出來,即為指標體系。常用確定指標的方法包括窮舉法、專家經(jīng)驗編制法、主成分分析法以及問卷調(diào)查法等等。而權(quán)值是指標影響目標程度的尺度,人們對其價值的認識通過其大小反映出來,即權(quán)值越大,其所對應的指標影響目標的程度就越高,大家對其重視度就越高。常用確定權(quán)值的方法包括比較平均法、對偶比較法、層次分析法以及專家咨詢法等等。本文所采用的是層次分析法,將數(shù)據(jù)挖掘技術(shù)應用其中進行擴展研究。
建立科學、高效的教學質(zhì)量評價體系,不僅提高了高校管理的有效性,而且也為采集、分析、處理教學信息提供了良好的平臺。一個科學、合理的教學質(zhì)量評價體系所反映的問題,可以幫助教學管理人員做出更加合理的決策,比如教學的改革或者師資的調(diào)整等。通常評價體系是一個多層次的、多目標的、復雜的系統(tǒng),建立這種評價體系可以采用層次分析法。所謂的層次分析法是結(jié)合了定性、定量分析的多目標決策分析法,而AHP可以很好地解決多指標權(quán)值分配的問題。層次分析法會將指標體系進行分層分解,將總目標、各個指標的隸屬關(guān)系、準則由上到下確定下來,建立起多級指標,并在后續(xù)的教學發(fā)展過程中不斷地完善。
(一)層次分析法
層次分析法是一種比較常用的進行科學決策的技術(shù)。決策是人們對行為所做出的選擇和判斷,不管決策活動是簡單還是復雜,都是基于系統(tǒng)觀點的綜合判斷過程。人們做出決策前要對會影響到結(jié)果的各方面因素進行比較、判斷以及評價,不過有些指標是可以定量的,有些則無法定量,所以需要一種既可以適應大系統(tǒng)規(guī)模的龐大性、狀態(tài)多變性以及影響的廣泛性、又能夠綜合分析定性、定量問題的決策工具,而層次分析法就是一種構(gòu)建多層次評價體系的方法。
(二)層次分析法的基本步驟
第一,建立起層次結(jié)構(gòu)的模型。按照相關(guān)因素的屬性由上到下將其分解為數(shù)個層次,同一個層次的各個因素均從屬于上層因素,或者會對上層因素產(chǎn)生影響,又會同時對下層因素進行支配,或者受下層因素的影響。第二,構(gòu)造為對比較矩陣。從層次結(jié)構(gòu)模型第二層開始,采用成對比較法與成對比較標度,構(gòu)建成對比較矩陣直至最底層。第三,對每個成對比較矩陣的權(quán)向量進行計算。第四,檢驗一致性。即對成對比較矩陣的一致性進行測量,如果其一致性程度與要求不相符,則專家組要對矩陣進行重新審核與判斷,必要時進行修改。層次分析法可以將思維過程加以系統(tǒng)化、數(shù)學化,并非一味地追求高深的數(shù)學運算方法,但是,又不會片面地側(cè)重于定性問題的邏輯推理。這種方法最大的特點是將定性與定量的方法進行有機的結(jié)合,將復雜的系統(tǒng)分解為清晰的、多層次的、多目標的決策體系。其最關(guān)鍵的步驟就是遞階層次結(jié)構(gòu)的建立以及通過成對比較標度建構(gòu)比較矩陣。
(三)基于數(shù)據(jù)挖掘的AHP擴展模型
AHP擴展模型是以AHP基礎思想為基礎,并將數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則技術(shù)引入其中,以提高評價指標的科學性、正確性為主要目的,從而將具有多目標、多層次的相同結(jié)構(gòu)的評價體系構(gòu)建問題動態(tài)的解決。在結(jié)束了一致性檢驗后需要做關(guān)聯(lián)規(guī)則的驗證,如果挖掘出的規(guī)則與評價體系的要求相符,即可將評價體系輸出,將知識存儲于知識庫;反之,挖掘出的規(guī)則與評價體系要求不符,同樣也要將相關(guān)知識存儲于知識庫,然后再回到建立遞階層結(jié)構(gòu)的步驟,對評價體系的結(jié)構(gòu)進行重新調(diào)整,將對應的指標內(nèi)容做出相應的修改,或者回到建立判斷矩陣的步驟將比較標度進行重新的調(diào)整。其具體過程如下:
1.建立遞階層次結(jié)構(gòu)
通過專家智能建立起一個遞階層次結(jié)構(gòu)模型,它可以對系統(tǒng)的功能或特征加以描述?;谙到y(tǒng)層次性的角度,將系統(tǒng)和環(huán)境區(qū)分開來,從高層到低層逐級分解,整個系統(tǒng)可以被分解為樹狀的或者金字塔狀的層次結(jié)構(gòu)。通常結(jié)構(gòu)中層次有三類:第一類,目標層,也是最高層。通常是數(shù)據(jù)挖掘的預定目標,只包含一個元素;第二類,準則層,即中間層。通常由若干個層次共同組成,其包括目標實現(xiàn)過程中所涉及的各種中間環(huán)節(jié),需要考慮的準則與子準則;第三層即為方案層,也是最底層。它包括在目標實現(xiàn)過程中所需的各種決策方案或者措施等。需挖掘的問題的復雜度、需要分析的詳盡度會對遞階層次結(jié)構(gòu)的層次數(shù)產(chǎn)生決定性作用,通常層次數(shù)是沒有限制的,每個層次中每個目標可以支配的準則通常要小于9個,因為支配準則太多,會導致兩兩比較的困難度上升。層次結(jié)構(gòu)的好壞是解決問題的關(guān)鍵所在,所以專家組要與最新的領(lǐng)域知識庫相結(jié)合,將各層次間的指標支配關(guān)系確定出來,以保證層次結(jié)構(gòu)的合理性。知識庫是一個動態(tài)的、不斷擴展的數(shù)據(jù)庫,知識的來源均為相關(guān)領(lǐng)域、相關(guān)理論、經(jīng)驗以及AHP擴展模型內(nèi)部產(chǎn)生的部分規(guī)則。
2.構(gòu)造兩兩比較判斷矩陣
在遞階層次結(jié)構(gòu)中,已經(jīng)確定了上、下層因素之間的隸屬關(guān)系。假設目標層次u為準則,受其支配的下層因素則為u1、u2、……un,這些因素對u的相對重要性不同,因此賦予其權(quán)值也各不相同。如果各因素對于u的重要性能夠采用定量的方法來表示,比如發(fā)表論文的數(shù)量、工作的時間等等,則可以直接確定出相應的權(quán)值,不過,如果一些因素的決策涉及到經(jīng)濟、人文、社會等,無法通過定量的方法獲得,則其權(quán)值的計算就要采用相適當?shù)姆椒ā?梢圆捎脤<医M評價的方法將所有因素進行兩兩比較,再與專家組意見相結(jié)合,從而構(gòu)造出比較判斷矩陣。
3.關(guān)聯(lián)規(guī)則驗證
以準評價體系為基礎面向測試用戶采集的評價數(shù)據(jù),對評價結(jié)果進行處理,采用Apriori算法挖掘評價數(shù)據(jù)和評價結(jié)果關(guān)系的關(guān)聯(lián)規(guī)則,將有興趣的信息提取出來,并輸入知識庫,同時對評價體系的正確性加以驗證。求解其置信度,將各指標對評價結(jié)果的影響程度分析出來,對權(quán)值分配的合理性加以驗證;求解作用度,對各指標、評價目標的相關(guān)程度進行分析,對指標選擇的正確性加以證明。最后再把通過Apriori算法獲取的分析結(jié)果存儲于知識庫,對其加以完善,并對專家決策做出相應的指導。按照分析結(jié)果對遞階層次結(jié)構(gòu)進行實時的調(diào)整,提高評價體系結(jié)構(gòu)的合理性。
總之,基于數(shù)據(jù)挖掘的AHP擴展模型一般適用于可行方案、單位人員的決策等領(lǐng)域。教學質(zhì)量評價內(nèi)容是對老師整個教學工作的質(zhì)量監(jiān)控點。教學過程需要師生的相互合作、共同完成。在該過程中,學生對老師的了解從某種程度而言是最全面、最深刻的,因此學生評價結(jié)果的優(yōu)勢非常突出,學生對老師教學質(zhì)量評價的穩(wěn)定性、可靠性得到國內(nèi)外廣大教育學家認可。此外,同行評價、老師自我評價以及專家評價等,均可為教育管理者決策提供信息。
[1]張興科.數(shù)據(jù)挖掘技術(shù)在提高教學質(zhì)量中的應用研究[J].黑龍江科技,2010(11).
[2]董軍凱.數(shù)據(jù)挖掘技術(shù)在教學質(zhì)量評價中的應用[J].大眾科技,2009(8).
[3]章麗芳.數(shù)據(jù)挖掘技術(shù)在高校教學質(zhì)量評估中的應用[J].計算機應用教學研究,2008(1).
[4]高曉.數(shù)據(jù)挖掘技術(shù)在高校教學質(zhì)量評估中的應用研究[J].福建質(zhì)量管理,2010(3).
[5]段小斌.基于數(shù)據(jù)挖掘技術(shù)的教學質(zhì)量評價模型研究[J].職業(yè)教育,2009(5).
[6]劉華,李瑗.基于高校課堂教學質(zhì)量評價系統(tǒng)的數(shù)據(jù)挖掘方法與應用[J].石家莊學院學報,2011(3).
[7]岳麓,潘郁.動態(tài)層次分析法在客戶關(guān)系管理系統(tǒng)中的應用[J].南京工業(yè)大學學報:自然科學版,2009(6).
[8]袁繼東,郭有全.層次分析法在地空導彈團戰(zhàn)斗力評估中的應用[J].空軍工程大學學報:自然科學版,2007(5).
G642.0
A
1673-1999(2012)01-0177-03
李旭軍(1976-),男,安徽巢湖人,碩士,安徽經(jīng)濟管理學院(安徽合肥230051)計算機工程系講師。
2011-09-28
安徽經(jīng)濟管理學院教學研究項目(yjjyxm201105)。