尹幫治
關(guān)鍵詞:大數(shù)據(jù)技術(shù);專業(yè)核心課程;解釋結(jié)構(gòu)模型;層次關(guān)系構(gòu)建
0 引言
大數(shù)據(jù)技術(shù)的使用在各個領(lǐng)域迅速擴(kuò)展,尋求有效的方法來設(shè)計專業(yè)核心課程體系結(jié)構(gòu),顯得非常重要。高等職業(yè)院校大數(shù)據(jù)技術(shù)專業(yè)的課程體系結(jié)構(gòu)可以通過各種方法來確定,如行業(yè)咨詢、課程基準(zhǔn)、基于研究的方法和教師專業(yè)知識[1]。咨詢行業(yè)專家可以使課程體系結(jié)構(gòu)符合行業(yè)要求,學(xué)生為就業(yè)做了更好的準(zhǔn)備。但這種方法可能會導(dǎo)致狹隘地關(guān)注當(dāng)前的行業(yè)需求,隨著時間的推移,這可能會變得過時。課程基準(zhǔn)是將各高校的教學(xué)計劃進(jìn)行比較,在必要時進(jìn)行調(diào)整。這種方法可能導(dǎo)致大學(xué)之間缺乏差異,并且可能沒有考慮到特定機(jī)構(gòu)的獨(dú)特優(yōu)勢和重點(diǎn)?;谘芯康姆椒ㄊ歉咝8鶕?jù)與大數(shù)據(jù)技術(shù)相關(guān)的現(xiàn)有研究和出版物來設(shè)計課程體系結(jié)構(gòu)。這種方法的優(yōu)勢在于它將課程建立在最新的學(xué)術(shù)研究之上,但是缺點(diǎn)是這種方法可能沒有考慮到大數(shù)據(jù)技術(shù)在行業(yè)中的實(shí)際應(yīng)用。依靠教師的專業(yè)知識和經(jīng)驗(yàn)來定制課程體系結(jié)構(gòu),可以成為高校吸引學(xué)生的競爭優(yōu)勢,但這可能無法反映大數(shù)據(jù)技術(shù)領(lǐng)域更廣泛的要求。
本文將上述方法有效地結(jié)合起來,充分利用每一種方法的優(yōu)點(diǎn),采用解釋結(jié)構(gòu)建模(ISM) ,科學(xué)設(shè)計高等職業(yè)院校大數(shù)據(jù)技術(shù)專業(yè)核心課程的層次結(jié)構(gòu)圖,強(qiáng)調(diào)多學(xué)科課程的重要性,反映最新的學(xué)術(shù)研究、行業(yè)趨勢和實(shí)際應(yīng)用,同時保持靈活性并適應(yīng)該領(lǐng)域不斷變化的需求。
1 大數(shù)據(jù)技術(shù)專業(yè)核心課程識別
識別大數(shù)據(jù)技術(shù)專業(yè)包含的核心課程對于學(xué)生選擇專業(yè)以及在專業(yè)中學(xué)習(xí)和發(fā)展都具有重要意義。首先,了解核心課程有助于學(xué)生建立起全面深入的大數(shù)據(jù)技術(shù)知識體系,把握大數(shù)據(jù)技術(shù)的主要應(yīng)用領(lǐng)域和發(fā)展趨勢。其次,核心課程還涵蓋了大數(shù)據(jù)技術(shù)的各種基礎(chǔ)和重要的應(yīng)用技術(shù),如大數(shù)據(jù)處理、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等,這些技術(shù)在實(shí)際工作中都有廣泛的應(yīng)用和需求。最后,了解大數(shù)據(jù)技術(shù)專業(yè)包含的核心課程還有助于學(xué)生在今后的職業(yè)生涯中為自己制定學(xué)習(xí)和發(fā)展計劃,更好地適應(yīng)職業(yè)發(fā)展的需要。
從國內(nèi)的研究文獻(xiàn)來看,主要分為本科層次和??茖哟蔚拇髷?shù)據(jù)教育。在本科層次中,賀文武博士設(shè)計的數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)課程體系中,主干課程包含了機(jī)器學(xué)習(xí)、數(shù)據(jù)可視化、并行與分布式計算等課程[2]。中南大學(xué)數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)主要課程包含了數(shù)據(jù)挖掘與分析、大型數(shù)據(jù)庫技術(shù)及應(yīng)用,數(shù)據(jù)安全等課程。福建工程學(xué)院數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)主要課程包含了機(jī)器學(xué)習(xí)與模式識別、時間序列分析、數(shù)據(jù)挖掘等課程。在??茖哟沃?,從潘梅勇教授設(shè)計的課程體系中可以看出,高職大數(shù)據(jù)技術(shù)與應(yīng)用專業(yè)核心課程包含了數(shù)據(jù)庫應(yīng)用技術(shù)、Hadoop實(shí)用技術(shù)、數(shù)據(jù)可視化技術(shù)等課程[3]。李建平老師指出,大數(shù)據(jù)技術(shù)與應(yīng)用專業(yè)課程應(yīng)涉及數(shù)學(xué)、統(tǒng)計學(xué)、計算機(jī)科學(xué)等領(lǐng)域[4],大數(shù)據(jù)技術(shù)與應(yīng)用專業(yè)核心課程建設(shè)除了要重視理論知識外,還要重視實(shí)踐技術(shù)。
國外的研究文獻(xiàn)主要包括大學(xué)教育、行業(yè)資訊和專著出版物。在大學(xué)教育中,Wadhwa和Krishnamur?thy 提出了一套指導(dǎo)原則和經(jīng)驗(yàn)教訓(xùn),用于設(shè)計大數(shù)據(jù)課程,為學(xué)生在該領(lǐng)域的未來職業(yè)生涯做準(zhǔn)備。指導(dǎo)原則來自對現(xiàn)有課程的審查、對行業(yè)專家的調(diào)查以及來自教師和學(xué)生的反饋[5]。Gehringer提出了數(shù)據(jù)科學(xué)專業(yè)的課程設(shè)計框架[6]。該框架包括一套數(shù)據(jù)科學(xué)畢業(yè)生應(yīng)具備的核心能力,以及一套可供學(xué)生根據(jù)興趣和職業(yè)目標(biāo)選擇的選修課程。該框架旨在靈活適應(yīng)不同機(jī)構(gòu)的需求,同時仍然提供一致和全面的數(shù)據(jù)科學(xué)教育。
綜上所述,數(shù)據(jù)建??梢允箤W(xué)生掌握大數(shù)據(jù)的基礎(chǔ)理論知識和數(shù)據(jù)架構(gòu)設(shè)計方法,從而能夠?qū)⒋髷?shù)據(jù)理論應(yīng)用到實(shí)際的數(shù)據(jù)分析和處理中。數(shù)據(jù)庫系統(tǒng)課程使學(xué)生掌握數(shù)據(jù)庫系統(tǒng)的基本原理和技術(shù),掌握數(shù)據(jù)庫設(shè)計和管理技術(shù)。數(shù)據(jù)可視化能夠培養(yǎng)學(xué)生對數(shù)據(jù)加工和可視化的能力,使其能夠從數(shù)據(jù)中挖掘出信息和知識。統(tǒng)計分析培養(yǎng)學(xué)生對探索性數(shù)據(jù)分析、統(tǒng)計分析和數(shù)據(jù)建模的能力,為數(shù)據(jù)分析和決策提供科學(xué)支持。機(jī)器學(xué)習(xí)課程是培養(yǎng)學(xué)生應(yīng)用機(jī)器學(xué)習(xí)方法解決大數(shù)據(jù)分析問題、構(gòu)建機(jī)器學(xué)習(xí)實(shí)踐項目的必修課程。分布式數(shù)據(jù)處理課程是培養(yǎng)學(xué)生理解分布式計算的理念和機(jī)制,掌握分布式計算平臺的原理和使用方法,提高學(xué)生大規(guī)模數(shù)據(jù)命令的能力。數(shù)據(jù)安全是大數(shù)據(jù)時代面臨的重要議題,數(shù)據(jù)安全課程是培養(yǎng)學(xué)生對大數(shù)據(jù)可信和安全行為的認(rèn)識和掌握,增強(qiáng)學(xué)生的大數(shù)據(jù)安全意識。數(shù)據(jù)挖掘培養(yǎng)學(xué)生填補(bǔ)大數(shù)據(jù)領(lǐng)域各種知識間斷的人才,掌握大數(shù)據(jù)分析整體思路及熟悉算法,能夠應(yīng)對大數(shù)據(jù)領(lǐng)域的多元場景要求。因此,選擇上述8門課程作為數(shù)據(jù)技術(shù)專業(yè)的核心課程是科學(xué)的,這些課程的設(shè)置可以讓學(xué)生全面、深入、系統(tǒng)地了解大數(shù)據(jù)技術(shù)專業(yè)相關(guān)知識和技術(shù),為學(xué)生的學(xué)習(xí)和未來的職業(yè)發(fā)展提供了必要的保障。
2 解釋結(jié)構(gòu)建模(ISM)
解釋結(jié)構(gòu)模型(Interpretative Structural Modeling,ISM) 是由Gregory H. Watson于1982年首次提出的一種處理復(fù)雜戰(zhàn)略規(guī)劃問題的方法,用于識別系統(tǒng)或問題的不同組件之間的復(fù)雜關(guān)系。 它包括將一個復(fù)雜的系統(tǒng)或問題分解成更小的子系統(tǒng)或組件,并創(chuàng)建一個層次結(jié)構(gòu)來表示這些組件之間的關(guān)系。然后,使用該結(jié)構(gòu)來理解系統(tǒng)或問題的組件如何相互作用,并識別影響系統(tǒng)的整體行為和動態(tài)的關(guān)鍵驅(qū)動因素和依賴因素。
解釋結(jié)構(gòu)模型(ISM) 方法可以作為一種有效的工具,用于確定專業(yè)領(lǐng)域中核心專業(yè)課程的順序。通過使用ISM,有可能確定不同課程之間的關(guān)系,并確定在給定順序中影響其重要性的關(guān)鍵驅(qū)動因素。 特別是,ISM可以幫助確定構(gòu)成專業(yè)領(lǐng)域基礎(chǔ)的核心課程,以及它們相對于其他課程的相對重要性。它可以揭示不同課程之間的依賴關(guān)系,以及它們?nèi)绾斡兄趯W(xué)生知識和技能的發(fā)展。然后,這些信息可用于設(shè)計結(jié)構(gòu)良好的課程,并與該計劃的學(xué)習(xí)目標(biāo)保持最佳一致。 此外,ISM可以幫助識別不同課程之間的潛在沖突或權(quán)衡,并提供如何解決它們的見解。它還可以幫助根據(jù)課程對專業(yè)實(shí)踐的影響或它們對實(shí)現(xiàn)學(xué)習(xí)目標(biāo)的貢獻(xiàn)程度來確定課程的優(yōu)先順序。
3 專業(yè)核心課程層次關(guān)系ISM 模型構(gòu)建
ISM模型一般遵循四個步驟:研究問題的目標(biāo)抽象確定模型中的要素及其關(guān)系,并生成鄰接矩陣;對鄰接矩陣進(jìn)行相乘操作,得到可達(dá)矩陣,必要時進(jìn)行多次自乘,直至矩陣不再發(fā)生變化;基于可達(dá)矩陣進(jìn)行模型層級分解,形成模型層次結(jié)構(gòu),通常最上層為系統(tǒng)目標(biāo),下面的各層則為上一層因素;劃分完層次后,使用有向連接圖更直觀地表示模型的層次結(jié)構(gòu)。
3.1 確定課程關(guān)系鄰接矩陣
為了方便討論,將8門核心專業(yè)課程標(biāo)記如下:C1為數(shù)據(jù)建模、C2為數(shù)據(jù)庫系統(tǒng)、C3為數(shù)據(jù)可視化、C4為統(tǒng)計分析、C5為機(jī)器學(xué)習(xí)、C6為分布式數(shù)據(jù)處理、C7為數(shù)據(jù)安全、C8為數(shù)據(jù)挖掘。通過與企業(yè)專家、高校專業(yè)教師和已畢業(yè)的相關(guān)學(xué)生進(jìn)行訪談,明確各課程之間的邏輯關(guān)系(學(xué)生學(xué)習(xí)課程的優(yōu)先順序關(guān)系),生成鄰接矩陣 A,如式(1) 所示。矩陣A 中,當(dāng)Ci對Cj有直接優(yōu)先順序關(guān)系,則元素aij=1,否則aij=0。
3.2 求解可達(dá)矩陣
若M=(A+I)n = (A+I)n-1則M=(A+I)n
利用上述方法,根據(jù)鄰接矩陣A,利用Python編程語言,可求得可達(dá)矩陣M=(A+I)4,如式(2) 。
3.3 可達(dá)集合與先行集合的抽取過程
可達(dá)集合定義為式(3) ,先行集合定義為式(4) 。
若P (c ) i ∩ Q(c ) j = P (c ) i 則Ci 為當(dāng)前最高級要素??蛇_(dá)集合與先行集合的初始狀態(tài)如表1所示。從表1可以得出:L1={C5}。
根據(jù)表1,對可達(dá)集合與先行集合進(jìn)行第1次抽取后,得到的結(jié)果如表2所示。從表2可以得出:L2 ={C8}。
根據(jù)表2,對可達(dá)集合與先行集合進(jìn)行第2次抽取后,得到的結(jié)果如表3所示。從表3可以得出:L3={C1 ,C4 ,C7}。
根據(jù)表3,對可達(dá)集合與先行集合進(jìn)行第3次抽取后,得到的結(jié)果如表4所示。從表4可以得出:L4={C3 ,C6 }。
根據(jù)表4,對可達(dá)集合與先行集合進(jìn)行第4次抽取后,得到的結(jié)果如表5所示。從表5可以得出:L5={C2 }。
最后得到核心課程層級表,如表6所示。
4 課程層次關(guān)系分析
大數(shù)據(jù)技術(shù)專業(yè)核心課程層次關(guān)系如圖1所示。
第一層的課程是數(shù)據(jù)庫系統(tǒng),可安排在第一學(xué)期。數(shù)據(jù)庫是用于存儲、管理和處理大量數(shù)據(jù)的軟件系統(tǒng),是大數(shù)據(jù)技術(shù)不可或缺的基礎(chǔ)。Hadoop、Spark等大數(shù)據(jù)技術(shù)都依賴于數(shù)據(jù)庫系統(tǒng),而這些大數(shù)據(jù)技術(shù)也被廣泛應(yīng)用于數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等領(lǐng)域。數(shù)據(jù)庫系統(tǒng)提供了大量的數(shù)據(jù)處理和管理功能,如查詢、索引、事務(wù)管理、并發(fā)控制、安全控制等,這些功能對于處理和管理大量的數(shù)據(jù)必不可少。因此,數(shù)據(jù)庫系統(tǒng)作為大數(shù)據(jù)技術(shù)的基礎(chǔ),是大數(shù)據(jù)技術(shù)專業(yè)最基礎(chǔ)的課程之一,需要最先開始學(xué)習(xí)。掌握數(shù)據(jù)庫系統(tǒng)的知識和技能,有助于學(xué)生更好地應(yīng)對大規(guī)模數(shù)據(jù)的處理和管理。
第二層的課程包含分布式數(shù)據(jù)處理、數(shù)據(jù)可視化,這兩門課程可以安排在第二學(xué)期。其中分布式數(shù)據(jù)處理的前導(dǎo)課程是數(shù)據(jù)庫系統(tǒng)。分布式數(shù)據(jù)處理建立在數(shù)據(jù)庫知識之上。學(xué)生需要掌握數(shù)據(jù)庫的基本原理和知識,能夠快速編寫SQL查詢語言,以及實(shí)際上手操作數(shù)據(jù)庫,這些都是分布式數(shù)據(jù)處理所需要的技能和知識。另外,數(shù)據(jù)庫系統(tǒng)還提供了諸如索引、事務(wù)、完整性控制和并發(fā)控制等重要的功能,這些功能也是分布式數(shù)據(jù)處理所依賴的。通過學(xué)習(xí)數(shù)據(jù)庫系統(tǒng),學(xué)生可以掌握這些重要的功能和技能,有助于學(xué)習(xí)分布式系統(tǒng)的設(shè)計和開發(fā)。
第三層的課程包含數(shù)據(jù)建模、統(tǒng)計分析、數(shù)據(jù)安全,這三門課可以同時安排在第三學(xué)期。其中,統(tǒng)計分析的前導(dǎo)課程是分布式數(shù)據(jù)處理、數(shù)據(jù)可視化,數(shù)據(jù)安全的前導(dǎo)課程是數(shù)據(jù)庫系統(tǒng)。對于統(tǒng)計分析而言,分布式數(shù)據(jù)處理和數(shù)據(jù)可視化是必不可少的工具和技術(shù)。分布式數(shù)據(jù)處理可以協(xié)助學(xué)生處理大量數(shù)據(jù),通過并行計算實(shí)現(xiàn)數(shù)據(jù)的快速處理和分析;而數(shù)據(jù)可視化則可以幫助學(xué)生更好地理解數(shù)據(jù),從而提高分析的準(zhǔn)確性和可靠性。對于數(shù)據(jù)安全,其中一個核心部分是數(shù)據(jù)庫系統(tǒng)。數(shù)據(jù)庫系統(tǒng)是數(shù)據(jù)安全的基礎(chǔ),因?yàn)榇蠖鄶?shù)應(yīng)用程序需要與數(shù)據(jù)庫打交道。學(xué)生需要了解關(guān)系型數(shù)據(jù)庫,掌握SQL查詢語言以及防范SQL注入等攻擊。
第四層的課程是數(shù)據(jù)挖掘,需要先修讀數(shù)據(jù)建模、統(tǒng)計分析、數(shù)據(jù)安全、數(shù)據(jù)可視化,可安排在第四學(xué)期。數(shù)據(jù)挖掘是一個涉及多個學(xué)科領(lǐng)域的綜合性任務(wù),需要很多專業(yè)知識來支持。數(shù)據(jù)建模能幫助人們了解數(shù)據(jù)是如何構(gòu)成的,以及如何進(jìn)行數(shù)據(jù)清洗和預(yù)處理;統(tǒng)計分析能夠幫助人們處理大量的數(shù)據(jù)并從中提取有價值的信息;數(shù)據(jù)安全能夠幫助人們保護(hù)數(shù)據(jù)的安全性,防止未經(jīng)授權(quán)的訪問或?yàn)E用;數(shù)據(jù)可視化能夠幫助人們以圖形化的方式展現(xiàn)數(shù)據(jù),更直觀地理解數(shù)據(jù)的內(nèi)涵。所以,修讀這些課程將有助于人們建立一種全面的數(shù)據(jù)挖掘理解和方法,從而更好地進(jìn)行數(shù)據(jù)挖掘工作。
第五層的課程是機(jī)器學(xué)習(xí),需要先修讀數(shù)據(jù)挖掘、統(tǒng)計分析、數(shù)據(jù)建模,可安排在第五學(xué)期。現(xiàn)代大數(shù)據(jù)技術(shù)趨向于自動化和智能化,機(jī)器學(xué)習(xí)技術(shù)可以在海量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律和模式,為大數(shù)據(jù)技術(shù)的應(yīng)用提供支持。機(jī)器學(xué)習(xí)可以促進(jìn)大數(shù)據(jù)處理中的數(shù)據(jù)預(yù)處理、特征提取和分類任務(wù)等,提高大數(shù)據(jù)生成的價值,減少對人工處理的依賴。大數(shù)據(jù)技術(shù)的發(fā)展離不開數(shù)據(jù)挖掘、數(shù)據(jù)分析等相關(guān)領(lǐng)域的知識,機(jī)器學(xué)習(xí)作為數(shù)據(jù)挖掘和數(shù)據(jù)分析的重要工具,可以幫助學(xué)生更好地理解和運(yùn)用這些領(lǐng)域的知識。同時,學(xué)習(xí)機(jī)器學(xué)習(xí)課程需要具備一定的數(shù)學(xué)、統(tǒng)計學(xué)和計算機(jī)科學(xué)基礎(chǔ)。如果沒有良好的數(shù)據(jù)挖掘、統(tǒng)計分析和數(shù)據(jù)建模的基礎(chǔ),學(xué)習(xí)機(jī)器學(xué)習(xí)課程會相對困難,可能會對機(jī)器學(xué)習(xí)的深入理解和應(yīng)用產(chǎn)生影響。
5 結(jié)束語
從引入ISM模型到遞階結(jié)構(gòu)的建立,專業(yè)核心課程體系結(jié)構(gòu)的設(shè)計是高等職業(yè)院校大數(shù)據(jù)技術(shù)專業(yè)建設(shè)的重要內(nèi)容。而ISM模型為專業(yè)課程建設(shè)提供了方法指導(dǎo),并通過分析課程間的關(guān)系,優(yōu)化教學(xué)計劃、排布教學(xué)進(jìn)度等方面提供了有效方法。這一過程中,理論的支持與現(xiàn)實(shí)系統(tǒng)的運(yùn)作吻合,為課程體系優(yōu)化提供了更加可靠的基礎(chǔ)。