黃丹珍 李小強(qiáng)
摘 要: 文章根據(jù)數(shù)據(jù)倉庫發(fā)展的現(xiàn)狀和教學(xué)存在的問題,從理論和實(shí)踐出發(fā),對(duì)這些問題進(jìn)行闡述,以求在以后的數(shù)據(jù)倉庫課程教學(xué)中取得較好的教學(xué)效果。
關(guān)鍵詞: 數(shù)據(jù)倉庫 存在問題 解決策略
在當(dāng)今的信息時(shí)代,數(shù)據(jù)時(shí)刻以指數(shù)方式增長,人們每天都在不知不覺中與形形色色的數(shù)據(jù)打交道,如銀行查詢?nèi)】?、電話通訊等。然而在這個(gè)數(shù)據(jù)大爆炸時(shí)代的背景下,如何利用這些信息和數(shù)據(jù),并從這些數(shù)據(jù)中提煉出幫助人們選擇和決策的信息,成了當(dāng)今社會(huì)的一門重要科學(xué);當(dāng)然也成了當(dāng)今高校的一門重要課程和研究方向(數(shù)據(jù)倉庫與數(shù)據(jù)挖掘)。因?yàn)閿?shù)據(jù)倉庫是建立在數(shù)據(jù)庫基礎(chǔ)上的一門科學(xué),而且理論與實(shí)踐都較復(fù)雜,所以一般在本科高年級(jí)或者研究生才開設(shè)此專業(yè)和課程。我從數(shù)據(jù)倉庫原理特點(diǎn)出發(fā),探討了當(dāng)前數(shù)據(jù)倉庫原理課程教學(xué)中存在的一些問題及解決策略。
一、教學(xué)內(nèi)容不統(tǒng)一
因數(shù)據(jù)倉庫是一門新型科學(xué)技術(shù),教學(xué)目標(biāo)和教學(xué)大綱要求沒有明確的要求,因此該專業(yè)的課程選擇非常廣泛,各高校教學(xué)側(cè)重點(diǎn)有所不同。
由于數(shù)據(jù)倉庫的主要特點(diǎn)是強(qiáng)調(diào)解決現(xiàn)實(shí)生活中的問題,這樣課程安排和教學(xué)的內(nèi)容必須貼近行業(yè)需求,說白了就是讓學(xué)生在就業(yè)時(shí)有好的選擇,因此,該專業(yè)對(duì)學(xué)生的實(shí)踐、動(dòng)手能力的要求標(biāo)準(zhǔn)非常高。目前,我接觸的大多數(shù)數(shù)據(jù)倉庫理論課程,雖然注重實(shí)用技能,但教學(xué)方法仍然停留在傳統(tǒng)基礎(chǔ)上,有很大比例的教學(xué)內(nèi)容是圍繞原理展開,對(duì)實(shí)際應(yīng)用和操作能力的要求遠(yuǎn)遠(yuǎn)不夠,因此,對(duì)在原有課程內(nèi)容繼續(xù)進(jìn)行調(diào)整,使設(shè)置課程的基本原則建立在將數(shù)據(jù)倉庫理論與現(xiàn)實(shí)生活實(shí)踐相結(jié)合的基礎(chǔ)上,并使學(xué)生自由選擇課程內(nèi)容,使不同專業(yè)方向的學(xué)生有選擇地培養(yǎng)動(dòng)手能力,同時(shí)通過調(diào)整理論課和選修課的比例,獲得符合自身發(fā)展方向的知識(shí)。
事實(shí)上,盡管數(shù)據(jù)倉庫的技術(shù)發(fā)展飛速,但基礎(chǔ)理論是相對(duì)穩(wěn)定的,也就是說,數(shù)據(jù)倉庫的基本理論是變化不大的,因此,在進(jìn)行教學(xué)時(shí)要保持教學(xué)大綱基本穩(wěn)定,而課程內(nèi)容設(shè)置時(shí),努力將基本理論擴(kuò)展到操作實(shí)踐中,使學(xué)生在掌握數(shù)據(jù)倉庫理論的基礎(chǔ)上更理解實(shí)踐中為何要這樣設(shè)計(jì),并且推陳出新。
二、教材的選擇存在的問題
數(shù)據(jù)倉庫教材,無論是對(duì)教師還是學(xué)生來講,都有不可替代的作用,它是該課程教學(xué)內(nèi)容的主要依據(jù),教材的不同,直接影響教學(xué)方法的實(shí)施。目前,市面上的數(shù)據(jù)倉庫教材形式多種多樣,根據(jù)學(xué)生對(duì)職業(yè)規(guī)劃側(cè)重點(diǎn)的不同,基本教材可分為原理教材、實(shí)踐應(yīng)用型教材和理論與應(yīng)用型教材。對(duì)學(xué)習(xí)數(shù)據(jù)倉庫的學(xué)生而言,僅僅學(xué)習(xí)理論,與應(yīng)用脫鉤顯然是不行的,因此,大多數(shù)高校選擇應(yīng)用型教材或者理論和應(yīng)用相結(jié)合的教材,但這樣籠統(tǒng)地選擇仍然是不夠的。根據(jù)數(shù)據(jù)倉庫的特點(diǎn),學(xué)生專業(yè)方向有很大不同,目前存在的專業(yè)方向大致有數(shù)據(jù)過濾、數(shù)據(jù)抽取、數(shù)據(jù)建模、數(shù)據(jù)報(bào)表等,因?yàn)閷I(yè)方向的不同直接影響學(xué)生的未來就業(yè),這無疑增加了教材選擇的難度,同時(shí),同一類型的教材無法滿足不同學(xué)生的需求,編纂者無法把教學(xué)內(nèi)容涵蓋所有的理論和實(shí)踐。
以上都是教材選擇面臨的問題,要通過簡單選擇不同類型的教學(xué)材料顯然是不能夠解決所有問題的。這就要求教師在教學(xué)過程中,盡量選擇和補(bǔ)充符合專業(yè)和專業(yè)方向所需要的材料,同時(shí)通過改變教學(xué)方法,使教學(xué)內(nèi)容更具有突出的針對(duì)性和實(shí)用性。
三、教學(xué)設(shè)計(jì)存在的問題
教學(xué)設(shè)計(jì)就是指課堂教學(xué)的設(shè)想和計(jì)劃,這對(duì)數(shù)據(jù)倉庫這門課來講非常重要,因?yàn)閿?shù)據(jù)倉庫原理的復(fù)雜性且技術(shù)本身還在不斷更新,簡單地采用課題實(shí)錄、過程呈現(xiàn)或者導(dǎo)學(xué)案例只會(huì)使課堂索然無味。
我認(rèn)為數(shù)據(jù)倉庫教學(xué)設(shè)計(jì)應(yīng)該在以下幾個(gè)方向設(shè)計(jì):
1.營造氛圍,借機(jī)提出問題
一堂課的氣氛很重要,導(dǎo)入課題更重要,在數(shù)據(jù)倉庫的教學(xué)中要精心設(shè)計(jì)導(dǎo)入語,做到一上課就牢牢地吸引學(xué)生的注意力,并激發(fā)學(xué)生的學(xué)習(xí)興趣。
2.加強(qiáng)與學(xué)生的探討、互動(dòng)
在課堂合適的時(shí)機(jī),加強(qiáng)與學(xué)生的互動(dòng),引用不同的案例,使學(xué)生在老師的引導(dǎo)下,充分發(fā)揮主動(dòng)性與能動(dòng)性,提高自我解決問題的能力,這對(duì)學(xué)習(xí)數(shù)據(jù)倉庫這門課來講很容易做到,同時(shí)建議老師采用這種教學(xué)方式。
3.解釋、概括
某些老師不重視這個(gè)環(huán)節(jié),通常比較簡單或沒有。建議:不能忽視,將這個(gè)環(huán)節(jié)上出一定的特色。很多老師在這個(gè)環(huán)節(jié)略微帶過,其實(shí)這部分很重要,所謂老師的職責(zé)“傳道授業(yè)解惑也”,在課堂的結(jié)尾處,對(duì)數(shù)據(jù)的倉庫的精髓進(jìn)行概括和解釋,一般會(huì)取得畫龍點(diǎn)睛的效果。
4.當(dāng)堂訓(xùn)練,鞏固達(dá)標(biāo)
這個(gè)環(huán)節(jié)跟所有的課一樣,主要讓學(xué)生當(dāng)堂鞏固,加深理解。
四、教學(xué)方式、方法要有所側(cè)重
數(shù)據(jù)倉庫作為一門實(shí)踐標(biāo)準(zhǔn)要求很高、而理論基礎(chǔ)又比較深的課程,在教學(xué)目標(biāo)的設(shè)定上對(duì)學(xué)生提出比較高的要求,不僅要求學(xué)生有比較扎實(shí)的理論基礎(chǔ),而且要求實(shí)踐操作能力強(qiáng)。但目前從事教學(xué)的教師有豐富項(xiàng)目經(jīng)驗(yàn)的非常少,這就使這門課教學(xué)方法顯得單一甚至枯燥,有的學(xué)校甚至直接將實(shí)踐這一非常重要的技能培訓(xùn)直接扔給學(xué)生的實(shí)習(xí)單位;而單一的理論教學(xué),會(huì)導(dǎo)致學(xué)生缺乏實(shí)際的操作經(jīng)驗(yàn),不能滿足工作的需要,很難達(dá)到企業(yè)的用人標(biāo)準(zhǔn),更別說滿意。
因此,為了解決上述問題,我們應(yīng)該從根源入手,根據(jù)教學(xué)目標(biāo)的要求,加強(qiáng)對(duì)學(xué)生實(shí)踐技能的培養(yǎng),這些都需要對(duì)教學(xué)方式和教學(xué)方法進(jìn)行改革。
首先在硬件配置方面,給學(xué)生提供模擬崗位操作實(shí)踐環(huán)境,通過以理論、應(yīng)用、培養(yǎng)個(gè)人能力為目標(biāo)的教學(xué)方式,讓學(xué)生在掌握數(shù)據(jù)倉庫理論的基礎(chǔ)上,對(duì)各種實(shí)際的數(shù)據(jù)倉庫開發(fā)項(xiàng)目進(jìn)行分析演練,以達(dá)到學(xué)以致用的教學(xué)目的。同時(shí),在教學(xué)方法上和教學(xué)過程中,教師要積極引導(dǎo)學(xué)生通過各種方式自主設(shè)計(jì)數(shù)據(jù)倉庫項(xiàng)目,從被動(dòng)和主動(dòng)兩方面,培養(yǎng)他們學(xué)習(xí)和實(shí)踐的能力。下面介紹幾種比較合適數(shù)據(jù)倉庫的教學(xué)方法:
1.老師、學(xué)生互動(dòng)式的教學(xué)方法
互動(dòng)式教學(xué)指在教學(xué)過程中,學(xué)生與老師雙方在平等的基礎(chǔ)上進(jìn)行交流、探討、協(xié)商,根據(jù)各自依據(jù),彼此討論、辯解甚至激烈的碰撞,達(dá)到以理服人、以事實(shí)為依據(jù)的教學(xué)效果,這種教學(xué)方法既能調(diào)動(dòng)學(xué)生學(xué)習(xí)的主動(dòng)性,又可以拓展學(xué)生的創(chuàng)造性思維。
這里我們舉一個(gè)關(guān)于數(shù)據(jù)抽取的教學(xué)方法,當(dāng)然是先由老師講解數(shù)據(jù)抽取的原理、必要性及實(shí)現(xiàn)的過程;接著老師就要通過一個(gè)具體的簡單實(shí)例(用SQL來實(shí)現(xiàn))講解一個(gè)具體實(shí)現(xiàn)的過程,接著老師可以提出問題,在問題的基礎(chǔ)上提出更復(fù)雜的案例,由于前面老師已經(jīng)作了比較詳細(xì)的案例分析,學(xué)生一般都可以通過自己的思考和動(dòng)手完成這個(gè)更復(fù)雜的案例,接著老師就可以數(shù)據(jù)抽取的算法準(zhǔn)確性、效率提出問題,并講解對(duì)大型數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取時(shí)應(yīng)該做哪些準(zhǔn)備,有經(jīng)驗(yàn)的老師還可以介紹他們在具體生活中的案例是怎樣實(shí)現(xiàn)的等,通過這些講解,讓學(xué)生深入思考、理解數(shù)據(jù)抽取的精髓,并開始探討如何改進(jìn)現(xiàn)有的案例算法,達(dá)到課程循序漸進(jìn)、逐步理解、到掌握的最高目的。對(duì)于一些具體案例,老師還可以通過精彩的視頻演示給學(xué)生看后,再探討、再加以理論與現(xiàn)實(shí)的引導(dǎo),從而使學(xué)習(xí)過程生動(dòng)、直觀,最后使學(xué)生實(shí)現(xiàn)掌握的目標(biāo)。
2.自主學(xué)習(xí)
數(shù)據(jù)倉庫是一門理論比較深,高年級(jí)或者是研究生才上的課程,因此學(xué)習(xí)該課程的學(xué)生一般都具備良好的信息技術(shù)基礎(chǔ),自學(xué)能力也比較強(qiáng),所以,該課程由老師引導(dǎo),解剖難點(diǎn)后,讓學(xué)生自主學(xué)習(xí)是一種很好的教學(xué)方法。比如,數(shù)據(jù)采集與數(shù)據(jù)清洗部分的講解,如果老師一味在課程上講,如何如何,其結(jié)果是學(xué)生一知半解,或者只有一個(gè)印象,但如果把學(xué)生分組,老師共同參與討論,學(xué)生在分組討論中理解為何有些數(shù)據(jù)必須在歸納在這個(gè)維度上,那些數(shù)據(jù)必須剔除,那些數(shù)據(jù)是錯(cuò)誤的;最終老師做歸納總結(jié)。通過這種自主學(xué)習(xí)的過程,讓學(xué)生摸索現(xiàn)實(shí)項(xiàng)目中存在的問題,老師與學(xué)生共同學(xué)習(xí)、討論,這樣不僅加強(qiáng)了學(xué)生對(duì)專業(yè)知識(shí)的掌握,而且鍛煉了學(xué)生的口才,加強(qiáng)了師生之間的交流。
3.教師博客、微博與數(shù)據(jù)倉庫教學(xué)
現(xiàn)在上課的時(shí)間一般是45分鐘,學(xué)生要在課題上掌握所有知識(shí)是不可能的,因此在課余時(shí)間加強(qiáng)與老師的溝通是一種必不可少的方式。目前比較多的方式是E-mail,但該方式功能太過單一。校園網(wǎng)也提供了基于論壇、師生互動(dòng)等平臺(tái),但由于受校園網(wǎng)的限制,應(yīng)用也不是太廣泛。最近興起了微信等平臺(tái),老師可把自己的教學(xué)理念、教學(xué)日志、教學(xué)內(nèi)容等上傳到網(wǎng)上,也可引用國內(nèi)外優(yōu)秀資料鏈接到自己網(wǎng)頁上;學(xué)生可在老師上微信上留言、討論、下載等,老師也可隨時(shí)隨地地回答學(xué)生的問題,這就極大地豐富了交流的方式,不受空間和時(shí)間的限制。
4.考核方式
數(shù)據(jù)倉庫這門課目前大多數(shù)學(xué)校的考核方式還是以期末筆試為依據(jù),這就在一定程度上遏制學(xué)生平時(shí)學(xué)習(xí)的動(dòng)力,大學(xué)學(xué)生很喜歡的一種方式是期末突擊學(xué)習(xí),應(yīng)付考試。杜撰這種弊端,就要調(diào)整考核方式,使學(xué)生花更多時(shí)間在平時(shí)積累實(shí)踐經(jīng)驗(yàn)上,這里我們可以借鑒一些國外的教學(xué)的經(jīng)驗(yàn):
(1)把學(xué)生分成很多組(可以自由組合,體現(xiàn)民主),讓學(xué)生在業(yè)余時(shí)間完成規(guī)定的實(shí)驗(yàn)項(xiàng)目;這個(gè)作為平時(shí)成績的一個(gè)重要依據(jù)。
(2)有條件的學(xué)校,邀請一些從這里畢業(yè)的老生回來串聯(lián),讓他們介紹他們實(shí)踐中的實(shí)戰(zhàn)經(jīng)驗(yàn),并在允許的情況下讓學(xué)生自愿加入一些項(xiàng)目的開發(fā),這個(gè)也可以作為平時(shí)成績加分的參考。
(3)基于數(shù)據(jù)倉庫的特性,期末考試改為上機(jī)開卷考試,在規(guī)定時(shí)間完成項(xiàng)目的比例,作為評(píng)分依據(jù)。
五、在數(shù)據(jù)倉庫不同專業(yè)方向講解的側(cè)重點(diǎn)不同
1.數(shù)據(jù)采集,數(shù)據(jù)清洗
數(shù)據(jù)采集是建立數(shù)據(jù)倉庫的第一步,它是保證后面數(shù)據(jù)挖掘的準(zhǔn)確性的保證,在講解此部分時(shí),要側(cè)重業(yè)務(wù)流程的講解,不斷地提示學(xué)生數(shù)據(jù)采集時(shí)要保證數(shù)據(jù)來源的準(zhǔn)確性與關(guān)聯(lián)性,同時(shí)對(duì)不用的和不正確的數(shù)據(jù)進(jìn)行清洗。在進(jìn)行案例教學(xué)時(shí),盡量選擇簡單業(yè)務(wù)流程的案例,同時(shí)在案例中舉幾個(gè)例子說明數(shù)據(jù)來源的重要性及數(shù)據(jù)清洗的必要性;在案例教學(xué)中,還讓學(xué)生初步理解什么是事實(shí)表,什么是維度表等。
2.數(shù)據(jù)建模
數(shù)據(jù)建模是數(shù)據(jù)倉庫建立的第二步,這一部分講解較為復(fù)雜,首先要讓學(xué)生理解什么是邏輯表和物理表,理解這兩部分可以引用工具教學(xué),市面上的建模工具比較多,選取一款比較流行的(例:ERstudio);事實(shí)表和維度表是這部分的重點(diǎn),要詳細(xì)講解,這是學(xué)生理解數(shù)據(jù)倉庫后面部分的基石,另外在星系模型、雪花型模型講解時(shí),可采用類比講解法,比較為何幾種模型存在的必要性。
3.數(shù)據(jù)抽取
數(shù)據(jù)抽取聽起來好像是比較簡單的一步,這一部分老師講解時(shí)一般會(huì)比較簡單,但它是連接實(shí)時(shí)數(shù)據(jù)與數(shù)據(jù)倉庫關(guān)鍵的一步,也是技術(shù)性要求較高的一步,這部分可以專門作為一門課程講,老師可選擇用SQL/Plus語言講解,條件好的學(xué)校也可以選擇比較流行的軟件(infomatica等)進(jìn)行講解,因?yàn)樵摬糠旨夹g(shù)性較強(qiáng),盡量讓學(xué)生上機(jī)訓(xùn)練,安排學(xué)生按一定時(shí)間完成要求的案例任務(wù)。
4.數(shù)據(jù)集市
數(shù)據(jù)集市是數(shù)據(jù)倉庫子集,主要是把中央數(shù)據(jù)倉庫劃分成若干個(gè)不同子集,以滿足不同部門對(duì)歷史數(shù)據(jù)的報(bào)告需求。這一部分老師講解時(shí)主要是讓學(xué)生搞清數(shù)據(jù)集市與數(shù)據(jù)倉庫概念上的區(qū)別。
5.數(shù)據(jù)展示
數(shù)據(jù)展示對(duì)技術(shù)、藝術(shù)都有一定的專業(yè)要求,同時(shí)對(duì)交流能力也要求很高,這部分老師講解時(shí)可把它分三部分進(jìn)行。首先在講解技術(shù)時(shí)讓學(xué)生加深對(duì)維度表的理解,同時(shí)引用一到兩款軟件,了解數(shù)據(jù)展示是怎么進(jìn)行的;在講解展示的方式時(shí),比較不同類型的報(bào)表直覺效果,并向?qū)W生強(qiáng)調(diào)雖然給決策層提供的數(shù)據(jù)一樣,但不同的展示方式往往取得意想不到的效果,報(bào)表盡量做到直觀、簡單,同時(shí)給學(xué)生若干個(gè)案例,讓學(xué)生用不同的報(bào)表展示方式展示相同的數(shù)據(jù)進(jìn)行類比;在講解對(duì)決策層的業(yè)務(wù)理解需求時(shí),主要是給學(xué)生講解交流技巧,讓學(xué)生在掌握決策層需求時(shí),頭腦中有設(shè)計(jì)的思路等。
六、結(jié)語
根據(jù)數(shù)據(jù)倉庫發(fā)展的現(xiàn)狀和目前教學(xué)過程存在的問題,本文作者根據(jù)自己的工作經(jīng)驗(yàn)(6年數(shù)據(jù)倉庫工程師,2年高校計(jì)算機(jī)教學(xué)),從理論和實(shí)踐出發(fā),對(duì)這些問題做了簡要闡述,以求在以后的數(shù)據(jù)倉庫課程教學(xué)中,取得較好的教學(xué)效果,使學(xué)生在學(xué)習(xí)這門課中掌握數(shù)據(jù)倉庫的精髓,同時(shí)體會(huì)到團(tuán)隊(duì)和溝通的重要性。隨著數(shù)據(jù)倉庫技術(shù)的發(fā)展和需求的不斷更新,數(shù)據(jù)倉庫這課還需要不斷深化和探索,最終越來越與現(xiàn)實(shí)接軌,并達(dá)到提高教學(xué)質(zhì)量的目的。
參考文獻(xiàn):
[1]李嶶,李宛州.基于數(shù)據(jù)倉庫技術(shù)的進(jìn)銷存系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).2001(10):93-94.
[2]W.H.Inmon.數(shù)據(jù)倉庫.機(jī)械工業(yè)出版社,2000,5.
[3]林字等編著.數(shù)據(jù)倉庫原理與實(shí)踐.北京:人民郵電出版社,2003.
[4]張春陽,周繼恩,劉貴全,蔡慶生.基于數(shù)據(jù)倉庫的決策支持系統(tǒng)的構(gòu)建,計(jì)算機(jī)工程,2002(4):249-252.
[5]陳德軍,盛翊智,陳綿云.基于數(shù)據(jù)倉庫的OLAP在DSS中的應(yīng)用研究.2003(1):30-31.
[6]朱明,數(shù)據(jù)挖掘.合肥:中國科技大學(xué)出版社,2002,5.
[7]陳京民等.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].北京:電子工業(yè)出版社,2002.
[8]毛國君等.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2005.
[9]陳文偉等.數(shù)據(jù)挖掘技術(shù)[M].北京:北京工業(yè)大學(xué)出版社,2002.