閆秋玲+司海芳
摘 要:在大數(shù)據(jù)時(shí)代,數(shù)據(jù)已成為一種新的“石油”,爆炸式增長(zhǎng)的海量數(shù)據(jù)驅(qū)動(dòng)著行業(yè)的轉(zhuǎn)型和升級(jí)。以數(shù)據(jù)為驅(qū)動(dòng),挖掘其中的價(jià)值以揭示自然、社會(huì)現(xiàn)象的特征和規(guī)律,則是數(shù)據(jù)科學(xué)人才的使命。然而,數(shù)據(jù)科學(xué)人才儲(chǔ)備在目前遠(yuǎn)遠(yuǎn)不能滿足社會(huì)需求。作為培養(yǎng)人才的主力軍,高校應(yīng)積極響應(yīng)國(guó)家對(duì)復(fù)合型人才的需求,著手培養(yǎng)滿足社會(huì)發(fā)展需求的數(shù)據(jù)科學(xué)人才。從高校角度出發(fā),分析了數(shù)據(jù)科學(xué)人才培養(yǎng)的先決條件、課程體系的設(shè)置以及相應(yīng)的授課模式,以期拋磚引玉。
關(guān)鍵詞:數(shù)據(jù)科學(xué);人才;課程
一、數(shù)據(jù)科學(xué)人才需求
數(shù)據(jù)科學(xué)強(qiáng)調(diào)以數(shù)據(jù)為導(dǎo)向,是一門交叉學(xué)科,結(jié)合了諸多領(lǐng)域中的理論和技術(shù),包括應(yīng)用數(shù)學(xué)、統(tǒng)計(jì)、模式識(shí)別、機(jī)器學(xué)習(xí)、數(shù)據(jù)可視化、數(shù)據(jù)倉(cāng)庫(kù)以及高性能計(jì)算、社會(huì)科學(xué)等,目標(biāo)是用數(shù)據(jù)揭示復(fù)雜的自然、人類和社會(huì)現(xiàn)象的特征或規(guī)律。具體而言,數(shù)據(jù)科學(xué)主要有兩個(gè)內(nèi)涵:一是研究數(shù)據(jù)本身,研究數(shù)據(jù)的各種類型、狀態(tài)、屬性以及變化形式和變化規(guī)律;二是為自然科學(xué)和社會(huì)科學(xué)研究提供一種新的方法,稱為科學(xué)研究的數(shù)據(jù)方法,其目的在于揭示自然界、社會(huì)的現(xiàn)象和規(guī)律[1]。
正是數(shù)據(jù)科學(xué)的提出與發(fā)展,為目前火熱的大數(shù)據(jù)的發(fā)展與應(yīng)用提供了理論支撐[2],以致形成了科學(xué)研究的第四范式——數(shù)據(jù)密集型科學(xué)研究。與主張模擬仿真的第三范式相比,第四范式則是以數(shù)據(jù)為導(dǎo)向,主張從數(shù)據(jù)出發(fā),通過(guò)觀察、分析數(shù)據(jù),提煉出信息、知識(shí)、理論,發(fā)現(xiàn)規(guī)律。無(wú)論是大數(shù)據(jù)技術(shù)還是第四范式,均需依托于數(shù)據(jù)科學(xué)。與計(jì)算機(jī)科學(xué)相比,數(shù)據(jù)科學(xué)的內(nèi)涵和外延更加寬泛[3]。
在我國(guó),未來(lái)3~5年需要180萬(wàn)數(shù)據(jù)科學(xué)人才,但目前只有約30萬(wàn)人。面對(duì)此缺口,高校應(yīng)盡快制訂培養(yǎng)方案,設(shè)置課程體系,投入師資,以培養(yǎng)出滿足社會(huì)發(fā)展需求的數(shù)據(jù)科學(xué)人才。
二、國(guó)內(nèi)外培養(yǎng)現(xiàn)狀
在美國(guó),很多知名大學(xué)都已設(shè)立了數(shù)據(jù)科學(xué)專業(yè)碩士學(xué)位,如紐約大學(xué)、哥倫比亞大學(xué)、伍斯特理工學(xué)院、弗吉尼亞大學(xué)、北卡羅來(lái)納州立大學(xué)、東北大學(xué)、德州農(nóng)工大學(xué)、路易斯安那州立大學(xué)、加州大學(xué)伯克利分校等。紐約大學(xué)和哥倫比亞大學(xué)還設(shè)置了博士學(xué)位。在英國(guó),鄧迪大學(xué)、謝菲爾德大學(xué)和愛丁堡大學(xué)設(shè)立了碩士學(xué)位。
在我國(guó),復(fù)旦大學(xué)、清華大學(xué)、香港中文大學(xué)都設(shè)置了碩士學(xué)位。中國(guó)科學(xué)院、中山大學(xué)、華東師范大學(xué)等成立了數(shù)據(jù)科學(xué)研究機(jī)構(gòu)。2015年,阿里云、慧科教育啟動(dòng)了“阿里云大學(xué)合作計(jì)劃AUCP”,已與多所高校聯(lián)合,擬培養(yǎng)和認(rèn)證一批云計(jì)算和數(shù)據(jù)科學(xué)人才。
雖然數(shù)據(jù)科學(xué)方向的人才培養(yǎng)在國(guó)內(nèi)高校中受到了重視,但學(xué)科體系并沒(méi)有建立起來(lái),人才的培養(yǎng)缺乏系統(tǒng)性。
三、人才培養(yǎng)思路
與傳統(tǒng)學(xué)科不同,對(duì)數(shù)據(jù)科學(xué)方向的人才需求是市場(chǎng)驅(qū)動(dòng)的。因此,數(shù)據(jù)科學(xué)的學(xué)科體系構(gòu)建的原則應(yīng)是針對(duì)各種應(yīng)用,所培養(yǎng)的人才能夠理解應(yīng)用需求,根據(jù)需求設(shè)計(jì)算法級(jí)別(或系統(tǒng)級(jí)別)求解框架,具備較強(qiáng)的數(shù)學(xué)建模能力,能夠使用合適的工具進(jìn)行數(shù)據(jù)分析,搭建計(jì)算平臺(tái),并能夠通過(guò)提供一定的算法將數(shù)據(jù)的價(jià)值挖掘出來(lái)。
1.先決條件
為了開設(shè)數(shù)據(jù)科學(xué)專業(yè),高校需滿足一些先決條件。第一,計(jì)算條件。第二,數(shù)據(jù)資源。高校應(yīng)建立實(shí)驗(yàn)場(chǎng),提供足夠的多樣數(shù)據(jù)或數(shù)據(jù)源。充足的數(shù)據(jù)資源有助于學(xué)生實(shí)踐操作,有助于學(xué)生的學(xué)以致用。第三,師資條件。這是人才培養(yǎng)的關(guān)鍵因素。目前,這方面的師資力量比較匱乏,為了培養(yǎng)數(shù)據(jù)科學(xué)人才,需要不同專業(yè)背景的教師協(xié)同合作。第四,如果有條件,高校應(yīng)與政府、企業(yè)合作。高校的優(yōu)勢(shì)在于理論和技術(shù)研究,但并沒(méi)有數(shù)據(jù)應(yīng)用場(chǎng)景,通過(guò)與企業(yè)、政府合作,可以彌補(bǔ)這一點(diǎn),并且更易獲得充足的數(shù)據(jù)資源,同時(shí)可以從政府、企業(yè)吸取具有一線工作經(jīng)驗(yàn)的人才,以補(bǔ)充師資。
2. 課程設(shè)置
具備先決條件后,我們來(lái)分析怎樣為數(shù)據(jù)科學(xué)專業(yè)配置課程。要想做一位完美的數(shù)據(jù)科學(xué)家,至少需要具備統(tǒng)計(jì)學(xué)、編程功底,同時(shí)需要具備一定的領(lǐng)域知識(shí)和良好的溝通能力。只有具備統(tǒng)計(jì)學(xué)和編程能力還不夠,處理數(shù)據(jù)不僅需要理論和技巧,更需要領(lǐng)域知識(shí)的支持,并以此獲得對(duì)數(shù)據(jù)的敏感度和洞察力。完美的數(shù)據(jù)科學(xué)家需要能夠處理好關(guān)于數(shù)據(jù)的方方面面:不僅能從理論角度進(jìn)行分析建模,還能夠運(yùn)用技術(shù)手段進(jìn)行分析、描述、預(yù)測(cè),并能讓結(jié)論落地,服務(wù)于現(xiàn)實(shí)中的行業(yè),讓數(shù)據(jù)的價(jià)值得以變現(xiàn)。
因此,在設(shè)置課程時(shí),四類課程不可少。一是統(tǒng)計(jì)學(xué)。許多知識(shí)挖掘方法都源于統(tǒng)計(jì)學(xué)的模型。二是數(shù)據(jù)分析。培養(yǎng)學(xué)生建模的能力,并能使用工具進(jìn)行數(shù)據(jù)分析。三是分布式計(jì)算、并行計(jì)算。大數(shù)據(jù)時(shí)代,數(shù)據(jù)規(guī)模往往很大,非單機(jī)環(huán)境能夠承受,這就需要面向集群環(huán)境進(jìn)行系統(tǒng)架構(gòu),編寫高效的分布式或并行計(jì)算算法。四是機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘。除此之外,還應(yīng)學(xué)習(xí)一定的領(lǐng)域知識(shí),如財(cái)務(wù)分析、服務(wù)業(yè)中的分析、健康醫(yī)療、供應(yīng)鏈管理、綜合營(yíng)銷溝通中的概率模型等,這樣才能夠?qū)⒅R(shí)轉(zhuǎn)換為生產(chǎn)力,能夠真正服務(wù)于業(yè)務(wù)。
由于數(shù)據(jù)科學(xué)方向的人才需求是多類型的,數(shù)據(jù)科學(xué)人才的培養(yǎng)也應(yīng)多類型,如科研人才和應(yīng)用人才的培養(yǎng)側(cè)重點(diǎn)各有不同。對(duì)于科研人才,需要注重理論能力和創(chuàng)新能力的培養(yǎng),以及科研方法的培養(yǎng),使他們善于從各種類型的數(shù)據(jù)中揭示模式,發(fā)現(xiàn)規(guī)律。這類人才需要具備深厚的數(shù)學(xué)功底、良好的計(jì)算機(jī)編程能力。對(duì)于應(yīng)用型人才,則應(yīng)注重技能的訓(xùn)練,比如,熟練使用大數(shù)據(jù)工具,如Hadoop,Spark等,具備分析特定類型數(shù)據(jù)的能力。無(wú)論培養(yǎng)科研人才還是應(yīng)用型人才,都需要進(jìn)行大量的實(shí)踐,通過(guò)操作真實(shí)數(shù)據(jù),培養(yǎng)他們對(duì)數(shù)據(jù)的分析能力和洞察力。
3.授課模式
授課模式可分為認(rèn)證課程、本科課程、碩士課程以及博士課程四個(gè)層次。
認(rèn)證課程可采取線上方式進(jìn)行,課程結(jié)束授予證書。
在當(dāng)前大數(shù)據(jù)時(shí)代,培養(yǎng)信息素養(yǎng)是至關(guān)重要的。培養(yǎng)信息素養(yǎng),應(yīng)該從本科生抓起,而數(shù)據(jù)科學(xué)則為信息素養(yǎng)的培養(yǎng)提供了一個(gè)很好的切入點(diǎn)。對(duì)于本科生,無(wú)論學(xué)生的專業(yè)背景是什么,都應(yīng)學(xué)習(xí)數(shù)據(jù)科學(xué)概論等基礎(chǔ)課程。
對(duì)于普通高校而言,在本科階段設(shè)置數(shù)據(jù)科學(xué)學(xué)士學(xué)位并不明智,原因在于,數(shù)據(jù)科學(xué)需要足夠的計(jì)算機(jī)基礎(chǔ)和數(shù)學(xué)理論功底,而本科階段的學(xué)生在四年學(xué)制下難以達(dá)到這種要求。因此,設(shè)置相應(yīng)的碩士、博士學(xué)位比較合理。正如第三節(jié)所介紹的國(guó)內(nèi)外現(xiàn)狀,知名大學(xué)大多在研究生階段開設(shè)相關(guān)學(xué)位,而非在本科階段。在碩士、博士階段,有了本科階段的理論基礎(chǔ),校方應(yīng)幫助學(xué)生建立明確的學(xué)科規(guī)劃,配置科學(xué)、合理的課程體系,搭建真正的業(yè)務(wù)平臺(tái),培養(yǎng)學(xué)生的數(shù)據(jù)建模能力、數(shù)據(jù)計(jì)算能力、跨領(lǐng)域數(shù)據(jù)分析能力,等等。
數(shù)據(jù)科學(xué)人才的培養(yǎng),不僅是各行各業(yè)的需要,也關(guān)系著國(guó)家發(fā)展的核心競(jìng)爭(zhēng)力。培養(yǎng)數(shù)據(jù)科學(xué)人才,高校應(yīng)首當(dāng)其沖。高校需結(jié)合自身情況,選擇相應(yīng)的授課模式,進(jìn)行合理的課程配置,構(gòu)建師資團(tuán)隊(duì),并通過(guò)與企業(yè)、政府合作,搭建真正的業(yè)務(wù)平臺(tái),強(qiáng)化數(shù)據(jù)科學(xué)人才培養(yǎng)能力,不斷為國(guó)家、社會(huì)輸送時(shí)代需要的人才。
參考文獻(xiàn):
[1]朱揚(yáng)勇,熊 贇.大數(shù)據(jù)時(shí)代的數(shù)據(jù)科學(xué)家培養(yǎng)[J].大數(shù)據(jù),2016(3).
[2]劉 磊.從數(shù)據(jù)科學(xué)到第四范式:大數(shù)據(jù)研究的科學(xué)淵源[J].廣告大觀(理論版), 2016(2).
[3]周傲英,錢衛(wèi)寧,王長(zhǎng)波.數(shù)據(jù)科學(xué)與工程:大數(shù)據(jù)時(shí)代的新興交叉學(xué)科[J].大數(shù)據(jù),2015(2).