王與,劉洋
(滁州學(xué)院數(shù)學(xué)科學(xué)學(xué)院,安徽滁州 239000)
分類技術(shù)在高校教學(xué)管理中的應(yīng)用
王與,劉洋
(滁州學(xué)院數(shù)學(xué)科學(xué)學(xué)院,安徽滁州 239000)
隨著高等教育的日益普及,運(yùn)用科學(xué)的分析方法找出更科學(xué)更有效的管理手段,已經(jīng)成為高校管理面臨的新課題。以某新建本科院校學(xué)生專業(yè)方向選擇為例,根據(jù)學(xué)生的學(xué)習(xí)情況,運(yùn)用貝葉斯分類技術(shù)對(duì)其進(jìn)行分類預(yù)測(cè),從而幫助教學(xué)管理部門做出科學(xué)的決策,合理分配教學(xué)資源。
分類預(yù)測(cè);貝葉斯分類技術(shù);教學(xué)管理
隨著我國(guó)高等教育的日益普及,高校的辦學(xué)規(guī)模在不斷增大,高校的管理也隨之面臨著巨大的壓力和挑戰(zhàn)。對(duì)于高校教學(xué)管理者來(lái)說(shuō),基于現(xiàn)有的資源運(yùn)用科學(xué)的分析方法找出更科學(xué)更有效的管理手段,已經(jīng)成為高校面臨的新課題。為適應(yīng)高等教育的大眾化,培養(yǎng)高素質(zhì)的應(yīng)用型人才,很多高校在培養(yǎng)模式上進(jìn)行了大幅度的改革,比較常見(jiàn)的做法是在各專業(yè)實(shí)行“大專業(yè)、寬口徑、多方向”的培養(yǎng)模式,即在大學(xué)的前兩年內(nèi),學(xué)生主要學(xué)習(xí)公共基礎(chǔ)課和學(xué)科基礎(chǔ)課(必修),而后兩年,學(xué)生可以根據(jù)自己的愛(ài)好、個(gè)性發(fā)展以及現(xiàn)階段的學(xué)習(xí)情況,在設(shè)置的多個(gè)專業(yè)方向中任選一個(gè)方向進(jìn)行深入學(xué)習(xí)。專業(yè)方向的選擇一定程度上決定了學(xué)生今后的發(fā)展,因此合理的選擇合適自己的專業(yè)方向顯得尤為重要。一般來(lái)說(shuō),學(xué)生在進(jìn)行專業(yè)方向的選擇時(shí),往往是依據(jù)自己的理解及興趣愛(ài)好進(jìn)行的,有時(shí)還會(huì)受到諸多外界因素的影響,主要包括同學(xué)、老師、父母、家庭和社會(huì)的影響。雖然大三學(xué)生已經(jīng)在本專業(yè)進(jìn)行了兩年的學(xué)習(xí),但對(duì)專業(yè)方向了解并不深,面對(duì)多種多樣的方向及課程設(shè)置,大部分的學(xué)生對(duì)各門課程間的關(guān)聯(lián)并不了解,對(duì)何種專業(yè)方向合適自己也沒(méi)有認(rèn)識(shí),因此在選擇時(shí)多半是隨意選擇,具有一定的盲目性,這也就造成了學(xué)生在后續(xù)的學(xué)習(xí)中遇到很多困難,可能選擇了完全不合適自己的方向,甚至影響今后職業(yè)發(fā)展。如何科學(xué)的指導(dǎo)學(xué)生選擇專業(yè)方向,將學(xué)生的興趣愛(ài)好與專業(yè)知識(shí)的掌握程度充分相結(jié)合,從而合理的選擇專業(yè)方向,成為高校教育管理中的一個(gè)重要的課題。
本文以某新建本科院校數(shù)學(xué)與應(yīng)用數(shù)學(xué)專業(yè)學(xué)生方向選擇為例,結(jié)合學(xué)生對(duì)專業(yè)方向選擇的實(shí)際需求,運(yùn)用貝葉斯分類技術(shù),根據(jù)學(xué)生的學(xué)習(xí)情況對(duì)其進(jìn)行分類預(yù)測(cè),幫助教學(xué)管理部門做出合理決策,達(dá)到指導(dǎo)學(xué)生合理選擇專業(yè)方向以及預(yù)測(cè)方向人數(shù)的目的。
1.1 分類技術(shù)概述
數(shù)據(jù)挖掘技術(shù)是一門綜合性多學(xué)科的技術(shù),被認(rèn)為是數(shù)據(jù)庫(kù)和人工智能領(lǐng)域中研究、開(kāi)發(fā)和應(yīng)用最活躍的分支之一。近年來(lái)已廣泛應(yīng)用在產(chǎn)品質(zhì)量分析、金融風(fēng)險(xiǎn)預(yù)測(cè)、電信、分子生物學(xué)、基因工程研究以及信息搜索等眾多領(lǐng)域。分類作為數(shù)據(jù)挖掘中具有代表性的一種方法,也漸漸成為目前數(shù)據(jù)挖掘領(lǐng)域應(yīng)用廣泛的一個(gè)分支。分類技術(shù)是運(yùn)用分類方法構(gòu)建一個(gè)分類函數(shù)(分類模型或分類器),根據(jù)這個(gè)分類將輸入的數(shù)據(jù)映射到某個(gè)給定的類別上。分類問(wèn)題的應(yīng)用領(lǐng)域很廣,數(shù)據(jù)挖掘中的很多問(wèn)題都可以轉(zhuǎn)換為分類問(wèn)題來(lái)處理。比較典型的是客戶服務(wù)領(lǐng)域,比如將客戶按忠誠(chéng)度分類,預(yù)測(cè)客戶的流失度等。
貝葉斯分類方法是一種使用方便且錯(cuò)誤率最小的概率分類法,其具有完善的貝葉斯理論基礎(chǔ),有很好的模型、學(xué)習(xí)以及推理能力,是一種使用普遍的數(shù)據(jù)挖掘分類方法。貝葉斯分類技術(shù)是一種統(tǒng)計(jì)學(xué)分類方法,一般用于預(yù)測(cè)類成員聯(lián)系的可能性,例如,數(shù)據(jù)項(xiàng)屬于某個(gè)特定類的概率[1]。
1.2 貝葉斯分類模型
貝葉斯分類是一種基于概率統(tǒng)計(jì)中貝葉斯定理的分類模型,其利用數(shù)據(jù)的屬性值,通過(guò)計(jì)算來(lái)預(yù)測(cè)數(shù)據(jù)屬于某個(gè)類的可能性來(lái)對(duì)數(shù)據(jù)進(jìn)行分類。分類數(shù)據(jù)項(xiàng)是由條件屬性值組成的特征向量,并且還具有一個(gè)目標(biāo)屬性。其具體的數(shù)據(jù)項(xiàng)形式X{x1,x2,…,x n;c}為離散變量的有限集,其中xi(1≤i≤n)為條件屬性值,c為目標(biāo)屬性。令樣本集有A1,A2,…,An這n個(gè)屬性,構(gòu)成了樣本的特征向量,可能的類別為{C1,C2,…,Cm},待分類樣本X的特征向量為{x1,x2,…,xn;c}。這樣,我們通過(guò)求出X分別屬于每個(gè)類別的概率P(Ci|X),其中P(Ci|X)=P(X|Ci)P(Ci)/P(X),得出最大概率的即為X的預(yù)測(cè)類別。對(duì)所有的Ci,P(X)都相同,而P(Ci)等于訓(xùn)練集中類別為Ci的樣本所占的比例值,則只需比較P(X|Ci)·P(Ci)的大小。若假設(shè)屬性獨(dú)立,則有P(X|Ci)=
2.1 問(wèn)題描述及數(shù)據(jù)預(yù)處理
該專業(yè)設(shè)置兩個(gè)方向供學(xué)生選擇,分別為:軟件工程方向及經(jīng)濟(jì)金融方向。入學(xué)前兩年學(xué)生主要學(xué)習(xí)公共基礎(chǔ)課和學(xué)科基礎(chǔ)課,大三時(shí)學(xué)生可以根據(jù)自己的興趣愛(ài)好及課程學(xué)習(xí)情況進(jìn)行選擇其中任意一個(gè)方向進(jìn)行深入學(xué)習(xí)。
本例中,分類目標(biāo)屬性為本專業(yè)方向:軟件工程方向及經(jīng)濟(jì)金融方向,數(shù)據(jù)樣本包含19個(gè)條件屬性(即課程),分別為:數(shù)值分析、數(shù)學(xué)建模與計(jì)算軟件、數(shù)據(jù)庫(kù)原理與應(yīng)用、數(shù)據(jù)結(jié)構(gòu)、解析幾何、概率統(tǒng)計(jì)、離散數(shù)學(xué)、常微分方程、復(fù)變函數(shù)、計(jì)算機(jī)基礎(chǔ)、高等代數(shù)(一、二)、數(shù)學(xué)分析(一、二、三)等17門課程,課程成績(jī)轉(zhuǎn)化為四級(jí)制(優(yōu)秀、良好、中等、及格)記錄,數(shù)據(jù)中還另外包含2個(gè)條件屬性,分別是學(xué)生對(duì)兩個(gè)方向的興趣度:對(duì)軟件方向的興趣度及對(duì)金融方向的興趣度,以三級(jí)制(較多、一般、較少)記錄,即所有屬性值均為離散值。在選擇某屆該專業(yè)學(xué)生成績(jī)及專業(yè)方向選擇情況作為專業(yè)選擇訓(xùn)練集樣本,經(jīng)過(guò)預(yù)處理共有62條記錄,其中2個(gè)目標(biāo)屬性數(shù)據(jù)來(lái)自于學(xué)生方向選擇表,19個(gè)成績(jī)條件屬性來(lái)自于學(xué)生成績(jī)表,而2個(gè)興趣度條件屬性則來(lái)自于對(duì)學(xué)生的問(wèn)卷調(diào)查。
2.2 貝葉斯分類模型流程
貝葉斯學(xué)生方向選擇模型流程如圖1所示:
圖1 貝葉斯分類的流程
2.3 實(shí)例分析預(yù)測(cè)
推斷新樣本的專業(yè)方向選擇情況,用貝葉斯分類法對(duì)某高校數(shù)學(xué)與應(yīng)用數(shù)學(xué)專業(yè)方向選擇進(jìn)行預(yù)測(cè)。例如,某學(xué)生N的各門課程成績(jī)?yōu)椋簲?shù)值分析=中等,數(shù)學(xué)建模與計(jì)算機(jī)軟件=優(yōu)秀,數(shù)學(xué)分析一=良好,數(shù)學(xué)分析二=及格,數(shù)學(xué)分析三=中等,數(shù)據(jù)庫(kù)原理及應(yīng)用=中等,數(shù)據(jù)結(jié)構(gòu)=及格,離散數(shù)學(xué)=良好,解析幾何=優(yōu)秀,計(jì)算機(jī)基礎(chǔ)=及格,程序設(shè)計(jì)基礎(chǔ)=及格,高等代數(shù)一=良好,高等代數(shù)二=中等,概率統(tǒng)計(jì)=良好,復(fù)變函數(shù)=良好,大學(xué)英語(yǔ)=及格,常微分方程=良好;其對(duì)軟件方向的興趣度為一般,經(jīng)濟(jì)金融方向興趣度為一般。
使用貝葉斯算法計(jì)算各屬性的所有取值相對(duì)于每個(gè)類別的概率結(jié)果如表1所示。
另,P(軟件工程方向)=17/62,P(經(jīng)濟(jì)金融方向)=45/62。由上述條件,我們有
根據(jù)上述結(jié)果P(N|軟件工程方向)>P(N|經(jīng)濟(jì)金融方向),可以推測(cè)該學(xué)生有較大的幾率選擇軟件工程方向,該預(yù)測(cè)結(jié)果也于實(shí)際情況相一致。
表1 各屬性的條件概率
運(yùn)用數(shù)據(jù)挖掘中的分類技術(shù),科學(xué)地預(yù)測(cè)學(xué)生專業(yè)方向的選擇,將學(xué)生的興趣愛(ài)好與專業(yè)知識(shí)的掌握程度充分結(jié)合,指導(dǎo)學(xué)生更合理的選擇專業(yè)方向;通過(guò)對(duì)學(xué)生專業(yè)方向選擇的預(yù)測(cè),可以幫助教學(xué)管理部門做出決策,充分利用教學(xué)資源,避免了資源的浪費(fèi)。本文只對(duì)分類技術(shù)在教學(xué)管理中作了簡(jiǎn)單的應(yīng)用,還可以通過(guò)對(duì)學(xué)生每一學(xué)習(xí)階段的情況進(jìn)行預(yù)測(cè),指導(dǎo)學(xué)生為專業(yè)方向的選擇早做準(zhǔn)備,更有利于學(xué)生的職業(yè)生涯規(guī)劃。
[1]董 倩,王克儉,韓憲忠,苑迎春.基于貝葉斯分類的網(wǎng)上書(shū)店潛在用戶挖掘[J].Microcomputer &Its Applications,2011,(1):47-49.
[2]韓家煒.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2000.
[3]王 俊.樸素貝葉斯分類模型的研究與應(yīng)用[D].安徽:合肥工業(yè)大學(xué),2006.
[4]丁智斌,袁 方,董賀偉.數(shù)據(jù)挖掘在高校學(xué)生學(xué)習(xí)成績(jī)分析中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2006,(4).
TP301
A
1673-1794(2011)05-0124-02
王 與(1984-),女,碩士,主要研究方向?yàn)閿?shù)據(jù)挖掘。
2011-07-14