張小松 郭琳虹
摘 要:大數(shù)據(jù)技術(shù)的快速發(fā)展,導(dǎo)致大數(shù)據(jù)人才市場需求也在發(fā)生著變化。對應(yīng)大數(shù)據(jù)技術(shù)體系各個階段的技術(shù)人才需求,根據(jù)數(shù)據(jù)科學(xué)學(xué)科特點和專業(yè)關(guān)鍵能力研究,通過數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)課程建設(shè)實踐,構(gòu)建符合新工科要求的以培養(yǎng)能夠從事大數(shù)據(jù)相關(guān)工作的應(yīng)用型和創(chuàng)新型大數(shù)據(jù)專門技術(shù)人才為目標(biāo)的課程體系。
關(guān)鍵詞:數(shù)據(jù)科學(xué);大數(shù)據(jù)技術(shù);課程體系
中圖分類號:G642 文獻(xiàn)標(biāo)識碼:A DOI:10.3969/j.issn.1003-6970.2021.02.017
本文著錄格式:張小松,郭琳虹.新工科背景下數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)課程體系建設(shè)探索與實踐[J].軟件,2021,42(02):
057-060
Exploration and Practice of the Construction of Data Science and Big Data Technology Major Curriculum System under the Background of New Engineering
ZHANG Xiaosong, GUO Linhong
(Tangshan University, Tangshan? HeBei? 063000)
【Abstract】:The rapid development of big data technology has led to changes in the market demand for big data talents. Corresponding to the needs of technical talents at each stage of the big data technology system, the characteristics of the data science discipline and the research of key professional capabilities are researched and analyzed. Through the practice of data science and big data technology major curriculum construction, the curriculum system that meets the requirements of the new engineering is constructed with the goal of cultivating applied and innovative big data specialized technical talents who can engage in big data-related work.
【Key words】:data science;big data technology;curriculum system;
0引言
數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)的設(shè)置,完全契合了“新工科”建設(shè)的需求,即學(xué)科交叉融合、解決產(chǎn)業(yè)新問題與引領(lǐng)未來技術(shù)和產(chǎn)業(yè)。作為本地區(qū)第一所開設(shè)該專業(yè)的高校,在多年應(yīng)用型人才培養(yǎng)經(jīng)驗的基礎(chǔ)上,引入新工科專業(yè)建設(shè)思維,加強專業(yè)課程體系建設(shè),采用“大數(shù)據(jù)+”的培養(yǎng)模式,努力培養(yǎng)具有多學(xué)科交叉能力的大數(shù)據(jù)工程與應(yīng)用實踐方面的人才。對于數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的人才培養(yǎng),從專業(yè)要求角度看,“有技術(shù)、懂業(yè)務(wù)”應(yīng)是人才培養(yǎng)設(shè)計的核心[1]。而文獻(xiàn)[2]給出了數(shù)據(jù)科學(xué)人才培養(yǎng)的四點建議:重視基礎(chǔ)學(xué)科的學(xué)習(xí),系統(tǒng)地掌握知識發(fā)掘方法,掌握高效的數(shù)據(jù)處理方法以及精通數(shù)據(jù)科學(xué)在不同領(lǐng)域中的應(yīng)用。
數(shù)據(jù)科學(xué)是一個新興的科學(xué)領(lǐng)域,它需要一種多學(xué)科的方法,并且與大數(shù)據(jù)和數(shù)據(jù)驅(qū)動技術(shù)有著緊密的聯(lián)系,這些技術(shù)為所有研究和行業(yè)領(lǐng)域帶來了變革性的影響。他們的可持續(xù)發(fā)展需要對傳統(tǒng)的教育模式和現(xiàn)有課程進(jìn)行重新思考和重新設(shè)計。但是,目前大多數(shù)現(xiàn)有的大學(xué)課程和培訓(xùn)計劃都是基于可用的課程構(gòu)建的,涵蓋了數(shù)據(jù)科學(xué)和通用數(shù)據(jù)管理專業(yè)人員相關(guān)的有限能力和知識領(lǐng)域。這可能會導(dǎo)致未來的數(shù)據(jù)科學(xué)畢業(yè)生在實際工作環(huán)境中,在知識和能力方面造成差距。
數(shù)據(jù)科學(xué)教育需要新方法,教育和培訓(xùn)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)人員需要一個新模型,該模型必須在設(shè)計中反映研究和行業(yè)領(lǐng)域中數(shù)據(jù)的整個生命周期,并要求擁有廣泛的技能來使用數(shù)據(jù)洞悉組織過程及其改進(jìn)[3]。這種模型必須建立在對現(xiàn)代數(shù)據(jù)科學(xué)要求的透徹分析之上,以定義能力概況、所需技能和其他專業(yè)智能特征。在科學(xué)、技術(shù)、研究、商業(yè)和教育等相互聯(lián)系的部門中連接不同的術(shù)語,操作模型也面臨著概念上的挑戰(zhàn),這些共同為一個新興的職業(yè)創(chuàng)造了一個生態(tài)系統(tǒng)。
圖1說明了EDISON數(shù)據(jù)科學(xué)框架[3]的主要組成部分及其相互關(guān)系,這些概念為數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的發(fā)展提供了概念基礎(chǔ)。數(shù)據(jù)科學(xué)能力框架包括數(shù)據(jù)專業(yè)人員在工業(yè),研究和整個職業(yè)道路的不同工作環(huán)境中成功工作所需的共同能力。數(shù)據(jù)科學(xué)能力框架包括使數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)人員參與團(tuán)隊并在現(xiàn)代敏捷數(shù)據(jù)驅(qū)動型企業(yè)中工作所需的常見軟硬技能。數(shù)據(jù)科學(xué)能力框架為定義數(shù)據(jù)科學(xué)知識體系提供了基礎(chǔ),數(shù)據(jù)科學(xué)知識體系是數(shù)據(jù)科學(xué)從業(yè)人員執(zhí)行其職業(yè)中與數(shù)據(jù)相關(guān)的所有過程所需的知識。數(shù)據(jù)科學(xué)示范課程可以被視為一個藍(lán)圖,教育者和培訓(xùn)者可以使用它來制定各種教育機構(gòu)和針對不同目標(biāo)群體的課程。數(shù)據(jù)科學(xué)示范課程的定義應(yīng)結(jié)合最佳實踐,并以教育理論為基礎(chǔ),以實現(xiàn)所需的學(xué)習(xí)成果。數(shù)據(jù)科學(xué)人才與職業(yè)分類定義有效的組織結(jié)構(gòu)和相應(yīng)的角色,同時還可以用于建立個人職業(yè)道路以及組織和經(jīng)濟部門之間的相應(yīng)能力和技能轉(zhuǎn)移能力。數(shù)據(jù)科學(xué)科學(xué)學(xué)科分類將用于保持四個核心組成部分之間的一致性。
2 數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的特點
2.1數(shù)據(jù)科學(xué)的跨學(xué)科性質(zhì)
數(shù)據(jù)科學(xué)本質(zhì)上是跨學(xué)科的。處理數(shù)據(jù)需要掌握各種能力和概念,包括許多傳統(tǒng)上與統(tǒng)計、計算機科學(xué)和數(shù)學(xué)領(lǐng)域相關(guān)的能力和概念。數(shù)據(jù)科學(xué)融合了所有這三個學(xué)科的許多教學(xué)內(nèi)容,但它既不是這三個學(xué)科的簡單交集,也不是這三個學(xué)科的超集。以數(shù)據(jù)為中心的課程整合是有效的數(shù)據(jù)科學(xué)教學(xué)計劃的基本特征,并導(dǎo)致以協(xié)同方式解決問題。
2.2 以數(shù)據(jù)為核心
獲取數(shù)據(jù)、整理數(shù)據(jù)、管理和處理數(shù)據(jù)、探索數(shù)據(jù)、定義問題、執(zhí)行分析以及傳達(dá)結(jié)果的遞歸數(shù)據(jù)周期是數(shù)據(jù)科學(xué)經(jīng)驗的核心。本科生需要理解和實踐數(shù)據(jù)周期的所有步驟,以便參與實質(zhì)性的開發(fā)和研究問題,學(xué)生需要具備“思考數(shù)據(jù)”的能力[4]。從基礎(chǔ)課程到專業(yè)課程再到選修課程,數(shù)據(jù)實踐經(jīng)驗都必須在所有課程中發(fā)揮核心作用。這些實踐經(jīng)驗應(yīng)包括來自各種來源的原始數(shù)據(jù),并應(yīng)涉及清洗、轉(zhuǎn)換和構(gòu)建數(shù)據(jù)以進(jìn)行分析的過程。數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的學(xué)生必須經(jīng)常遇到基于項目的具有真實數(shù)據(jù)的真實世界的應(yīng)用程序,以補充基礎(chǔ)算法和模型,實踐經(jīng)驗至關(guān)重要。
2.3 分析思維
數(shù)據(jù)科學(xué)提供了整合和使用計算和統(tǒng)計思維來解決問題的機會,而不是一味強調(diào)某一種思維。計算和統(tǒng)計思維的兩個支柱不應(yīng)分開教授。它們之間的平衡可能會從一門課程轉(zhuǎn)換為另一門課程,但是為了實現(xiàn)最有效且最高效的教學(xué)效果,應(yīng)該同時存在兩者。
2.4 數(shù)學(xué)基礎(chǔ)
數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)人員使用模型來理解世界,而數(shù)學(xué)為這些模型提供了語言,因此,數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)人員需要在數(shù)學(xué)上有堅實的基礎(chǔ)。但是,傳統(tǒng)的數(shù)學(xué)課程通常會延遲抽象數(shù)學(xué)與混亂的現(xiàn)實世界中的問題之間的聯(lián)系,尤其是涉及數(shù)據(jù)的問題。因此,在對數(shù)據(jù)驅(qū)動的問題進(jìn)行建模的背景下,高效的數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)應(yīng)該簡化數(shù)學(xué)課程,將重點放在數(shù)據(jù)科學(xué)上,而不是理論推導(dǎo)或證明上。矩陣代數(shù)是通過求解線性系統(tǒng)來激發(fā)的,導(dǎo)數(shù)是通過優(yōu)化和靈敏度分析來激發(fā)的,而積分是通過概率應(yīng)用來激發(fā)的。
3 數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的關(guān)鍵能力
3.1計算和統(tǒng)計能力
數(shù)據(jù)科學(xué)由一種解決問題的方法組成,用于在經(jīng)驗環(huán)境中工作,必須從數(shù)據(jù)中提取含義。這種方法是統(tǒng)計、計算機科學(xué)和數(shù)學(xué)中思維方式的綜合。處理數(shù)據(jù)需要全面的計算能力,數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)學(xué)生必須準(zhǔn)備好使用工作場所和研究實驗室中常見的數(shù)據(jù)。例如,訪問和組織數(shù)據(jù)庫中的數(shù)據(jù),從網(wǎng)站上抓取數(shù)據(jù),將文本處理成可以分析的數(shù)據(jù)以及確保安全和機密的數(shù)據(jù)存儲,都需要具備全面的計算能力。這些計算問題解決能力會在數(shù)據(jù)科學(xué)專業(yè)人員的整個工作流程中反復(fù)出現(xiàn)。該專業(yè)的畢業(yè)生應(yīng)該精通許多基礎(chǔ)軟件能力、計算機科學(xué)學(xué)科的相關(guān)算法和計算問題解決方案。為了為數(shù)據(jù)科學(xué)職業(yè)做好準(zhǔn)備,學(xué)生還需要配備并接觸專業(yè)的數(shù)據(jù)分析軟件包,并且需要理解構(gòu)成這些軟件包的編程原理和算法問題解決原理。另外,統(tǒng)計思維是一種通過數(shù)據(jù)了解世界的方法,涉及從問題提出到結(jié)論的所有內(nèi)容。數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)人員需要了解基本的統(tǒng)計理論。學(xué)生應(yīng)了解數(shù)據(jù)分析、數(shù)據(jù)收集、建模和推理的基本統(tǒng)計概念。具備基本的理論基礎(chǔ)的豐富知識將有助于為他們的分析和模型的局限性提供信息。成功的數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的畢業(yè)生將能夠運用統(tǒng)計知識和計算能力來制定問題、計劃數(shù)據(jù)收集活動或識別和收集相關(guān)的現(xiàn)有數(shù)據(jù),然后分析數(shù)據(jù)以提供見解。
3.2 數(shù)學(xué)基礎(chǔ)能力
從數(shù)學(xué)方面來看,數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的重點應(yīng)該放在選擇、擬合和使用數(shù)學(xué)模型上。由于數(shù)據(jù)驅(qū)動的問題通常是混亂且不精確的,因此學(xué)生應(yīng)能夠通過培養(yǎng)結(jié)構(gòu)化的數(shù)學(xué)問題解決能力來對這些問題設(shè)計數(shù)學(xué)結(jié)構(gòu)。學(xué)生應(yīng)具有足夠的數(shù)學(xué)知識,以了解統(tǒng)計和機器學(xué)習(xí)中常用模型的基本結(jié)構(gòu)以及相關(guān)算法的優(yōu)化和收斂性問題。盡管這些工具所需的工具包括微積分、線性代數(shù)、概率論和離散數(shù)學(xué),但這些課程中的內(nèi)容將進(jìn)行適當(dāng)調(diào)整,使其更符合該專業(yè)的數(shù)學(xué)基礎(chǔ)能力需求。
3.3 模型建立與評估能力
首先,統(tǒng)計模型用于描述、預(yù)測和解釋過程,但它們也用于傳達(dá)理解并為將來的模型奠定基礎(chǔ)。非正式建模涉及識別潛在的變異源,辨別隨機變異和確定性變異,以及了解如何用數(shù)學(xué)和計算方法對它們進(jìn)行建模。畢業(yè)生還必須精通數(shù)據(jù)可視化,這是非正式建模中的重要工具,因為它可用于與其他人進(jìn)行交流并找出擬議模型中的弱點。其次,畢業(yè)生應(yīng)該能夠建立和評估統(tǒng)計數(shù)據(jù)和機器學(xué)習(xí)模型,采用各種形式的推理程序,并從分析中得出適當(dāng)范圍的結(jié)論。這包括了解數(shù)據(jù)問題如何影響統(tǒng)計結(jié)果的分析、解釋和概括。畢業(yè)生還應(yīng)該能夠在數(shù)據(jù)分析中考慮包括規(guī)模問題的計算因素。
3.4 算法設(shè)計和軟件開發(fā)能力
數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的畢業(yè)生應(yīng)該能夠運用算法解決問題的能力來完成當(dāng)前的任務(wù)。這些措施包括定義問題的明確要求、分解問題、使用有效策略來獲得算法解決方案以及通過使用合適的高級語言進(jìn)行編程來實現(xiàn)解決方案。畢業(yè)生應(yīng)該了解所設(shè)計軟件以及所使用的庫和軟件包的內(nèi)存和執(zhí)行性能,并能夠使用適當(dāng)?shù)墓ぞ邅砭S護(hù)其軟件,能夠利用現(xiàn)有的軟件包和工具來解決其計算問題。
3.5 數(shù)據(jù)治理能力
數(shù)據(jù)治理涉及在整個問題解決過程中管理數(shù)據(jù),主要包含兩個主要步驟。一是數(shù)據(jù)準(zhǔn)備,畢業(yè)生應(yīng)該能夠處理來自各種來源和格式的數(shù)據(jù)。數(shù)據(jù)可能來自網(wǎng)頁、數(shù)據(jù)庫或流,并且可能包含圖像、聲音或視頻以及數(shù)字或文本。這些數(shù)據(jù)可能是通過受控實驗或觀察性研究收集的,也可能是通過傳感器或自動化程序收集的機會數(shù)據(jù)。在給定特定數(shù)據(jù)集的情況下,畢業(yè)生應(yīng)該能夠準(zhǔn)備將數(shù)據(jù)用于各種統(tǒng)計方法和模型,并應(yīng)認(rèn)識到數(shù)據(jù)質(zhì)量和數(shù)據(jù)收集方式如何影響結(jié)論。二是數(shù)據(jù)管理。數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)人員不僅必須準(zhǔn)備數(shù)據(jù)進(jìn)行分析,還必須確保數(shù)據(jù)在通過分析的所有階段時的完整性。這需要使用關(guān)系數(shù)據(jù)庫維護(hù)版本控制,并在合并來自多個源的數(shù)據(jù)時跟蹤數(shù)據(jù)出處。
4 數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)課程體系
數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)課程知識體系流程圖如圖2所示,整個課程體系包含數(shù)據(jù)科學(xué)基礎(chǔ)、數(shù)學(xué)基礎(chǔ)、統(tǒng)計模型、算法設(shè)計與軟件開發(fā)、機器學(xué)習(xí)與數(shù)據(jù)分析、數(shù)據(jù)治理及綜合性項目實踐等七個方面的課程。只有依托專業(yè)領(lǐng)域,建設(shè)數(shù)據(jù)科學(xué)類課程,與大數(shù)據(jù)技術(shù)專業(yè)教育相輔相成,方能適應(yīng)不同層次的人才需求[5]。
4.1 數(shù)據(jù)科學(xué)基礎(chǔ)
學(xué)生將理解使用高級語言來探索、可視化和提出有關(guān)數(shù)據(jù)的問題。引入一種更具算法性的語言,以幫助學(xué)生理解自己所體驗的高級功能背后的思想和結(jié)構(gòu)。數(shù)據(jù)科學(xué)基礎(chǔ)方面涉及到的課程主要有數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)導(dǎo)論等。
4.2 數(shù)學(xué)基礎(chǔ)
數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的學(xué)生將數(shù)學(xué)工具與實際問題聯(lián)系起來。與純粹的數(shù)學(xué)尋求建立理論并證明命題的方法不同,數(shù)據(jù)科學(xué)是在了解數(shù)學(xué)方法的價值的同時了解它們的局限性。數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的學(xué)生在整個數(shù)學(xué)訓(xùn)練中還應(yīng)發(fā)展出一種幾何、直觀、可視化的思維方式。該課程強調(diào)數(shù)學(xué)建模,尤其是線性和多項式模型。數(shù)學(xué)基礎(chǔ)方面涉及到的課程主要有高等數(shù)學(xué)、線性代數(shù)、離散數(shù)學(xué)、概率論與數(shù)理統(tǒng)計等。
4.3 算法設(shè)計和軟件開發(fā)
為了培養(yǎng)扎實的計算能力,數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的本科生應(yīng)學(xué)習(xí)基礎(chǔ)計算機科學(xué),并為算法問題解決和軟件開發(fā)提供支持。學(xué)生必須培養(yǎng)算法設(shè)計能力來理解問題,將其分解為可管理的部分,評估替代性問題解決策略,并得出可以有效解決問題的算法。學(xué)生應(yīng)能夠使用過程和功能編程技術(shù)及其相關(guān)的數(shù)據(jù)結(jié)構(gòu)補充其算法,應(yīng)了解工具的適當(dāng)用法和可用的軟件包。隨著與數(shù)據(jù)科學(xué)相關(guān)的數(shù)據(jù)和處理的不斷發(fā)展,從規(guī)模上講,該專業(yè)的學(xué)生應(yīng)該培養(yǎng)處理更大數(shù)據(jù)集的能力,能夠在并發(fā)編程中應(yīng)用技術(shù)來構(gòu)建執(zhí)行數(shù)據(jù)并行處理的系統(tǒng),還必須能夠使用當(dāng)前和新形式的分布式數(shù)據(jù)存儲,作為上述數(shù)據(jù)管理領(lǐng)域的一部分。算法設(shè)計與軟件開發(fā)方面涉及的課程主要有程序設(shè)計基礎(chǔ)、數(shù)據(jù)結(jié)構(gòu)、面向?qū)ο蟪绦蛟O(shè)計、大數(shù)據(jù)應(yīng)用開發(fā)語言等。
4.4 數(shù)據(jù)治理
數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)學(xué)生必須理解并能夠有效地應(yīng)用數(shù)據(jù)治理原理。它比傳統(tǒng)的數(shù)據(jù)庫管理要廣泛得多,并且必須包括支持大數(shù)據(jù)所帶來的數(shù)量和速度的系統(tǒng)。因此,該專業(yè)必須將數(shù)據(jù)查詢語言的知識應(yīng)用于關(guān)系數(shù)據(jù)庫和新興的大型存儲NoSQL數(shù)據(jù)系統(tǒng),并且必須能夠通過Web服務(wù)從結(jié)構(gòu)較少的系統(tǒng)訪問數(shù)據(jù),對數(shù)據(jù)進(jìn)行較低級別的訪問可從Internet上獲取。收集完數(shù)據(jù)后,數(shù)據(jù)治理包括使用軟件知識和技能進(jìn)行清理和初始結(jié)構(gòu)化,然后將數(shù)據(jù)轉(zhuǎn)換為探索、可視化和分析所需的結(jié)構(gòu)化形式。數(shù)據(jù)治理方面涉及的課程主要有數(shù)據(jù)采集與網(wǎng)絡(luò)爬蟲、數(shù)據(jù)導(dǎo)入與預(yù)處理、大數(shù)據(jù)技術(shù)原理與應(yīng)用、非結(jié)構(gòu)化數(shù)據(jù)存儲與分析等。
4.5 統(tǒng)計模型
統(tǒng)計模型方面的課程有助于向?qū)W生介紹數(shù)據(jù)的統(tǒng)計分析和推理框架的要素。基礎(chǔ)是線性模型,然后將其與非線性方法進(jìn)行比較。以第一年數(shù)據(jù)科學(xué)導(dǎo)論課程中引入的重要概念為基礎(chǔ),這些概念構(gòu)成了任何統(tǒng)計分析的基礎(chǔ)。所有的想法都牢固地扎根于現(xiàn)實數(shù)據(jù)中并從中得到啟發(fā)。課程內(nèi)容包括:探索性數(shù)據(jù)分析方法和圖形數(shù)據(jù)分析方法、估計和檢驗、仿真和重采樣、模型選擇與性能等。統(tǒng)計模型方面涉及的課程主要有統(tǒng)計學(xué)、數(shù)值分析、數(shù)據(jù)建模等。
4.6 機器學(xué)習(xí)與數(shù)據(jù)分析
該方面的課程融合計算機科學(xué)中機器學(xué)習(xí)的算法觀點和統(tǒng)計思維的預(yù)測觀點。重點是常見的機器學(xué)習(xí)方法及其在各種學(xué)科中的應(yīng)用。學(xué)生不僅將了解統(tǒng)計學(xué)學(xué)習(xí)的理論基礎(chǔ),還將獲得成功應(yīng)用科學(xué)和工業(yè)新問題所必需的實踐技能。包括進(jìn)一步探索經(jīng)典回歸和分類的替代方法、模型的算法分析、性能指標(biāo)和預(yù)測以及交叉驗證、數(shù)據(jù)轉(zhuǎn)換、有監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)、集成學(xué)習(xí)方法等。機器學(xué)習(xí)與數(shù)據(jù)分析方面涉及的課程主要有數(shù)據(jù)挖掘與分析、深度學(xué)習(xí)等。
4.7 綜合性項目實踐
學(xué)生可以通過綜合性項目實踐,考慮科學(xué)問題、收集和分析數(shù)據(jù)并獲得可視化的結(jié)果。綜合性項目實踐主要涉及的課程有大數(shù)據(jù)技術(shù)實訓(xùn)、數(shù)據(jù)存儲與處理技術(shù)實訓(xùn)、專業(yè)實習(xí)、畢業(yè)實習(xí)和畢業(yè)設(shè)計等實踐環(huán)節(jié)。
5 結(jié)語
數(shù)據(jù)科學(xué)是一門快速發(fā)展的學(xué)科,以數(shù)據(jù)的獲取、管理和分析為中心。目前,數(shù)學(xué)、統(tǒng)計學(xué)和計算機科學(xué)等傳統(tǒng)學(xué)科的課程為該專業(yè)提供了基礎(chǔ)。對課程的重新設(shè)計,將各個層次的數(shù)學(xué)基礎(chǔ)以及計算和統(tǒng)計思維的要素整合在一起,將提供一系列豐富而有效的課程,為畢業(yè)生提供從事數(shù)據(jù)科學(xué)職業(yè)的準(zhǔn)備。大數(shù)據(jù)專業(yè)與我校其他專業(yè)密切相關(guān),“大數(shù)據(jù)+電子商務(wù)”“大數(shù)據(jù)+交通”“大數(shù)據(jù)+建筑”等必將促進(jìn)我校學(xué)科間的融合發(fā)展,大數(shù)據(jù)專業(yè)必將與相關(guān)聯(lián)學(xué)科專業(yè)互相促進(jìn)共同成長,形成我校特色的數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的課程體系,也將為我校人才培養(yǎng)、教學(xué)科研等方面帶來極大促進(jìn)作用,同時為智慧城市建設(shè)乃至京津冀地區(qū)新型產(chǎn)業(yè)建設(shè)提供強有力的智力支持。
參考文獻(xiàn)
[1] 賈蓓.學(xué)科融合視角下的數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)人才培養(yǎng)思考[J].大學(xué)教育,2020(1):166-169.
[2] 陳振沖,賀田田.數(shù)據(jù)科學(xué)人才的需求與培養(yǎng)[J].大數(shù)據(jù),2016,
2(5):95-106.
[3] Demchenko Y,Belloum A,Los W,et al.EDISON Data Science Framework:A Foundation for Building Data Science Profession for Research and Industry[C]// IEEE International Conference on Cloud Computing Technology & Science.IEEE,2017.
[4] Horton N J,Hardin J S.Teaching the Next Generation of Statistics Students to "Think With Data":Special Issue on Statistics and the Undergraduate Curriculum[J].The American Statistician,2015,69(4):259-265.
[5] 賀文武,劉國買.數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)核心課程建設(shè)的探索與研究[J].教育評論,2017(11):31-35.