鄭婷婷
(廣東開放大學,廣東廣州,510091)
大數(shù)據(jù)是信息技術領域的又一創(chuàng)新浪潮。2013年被稱為中國大數(shù)據(jù)元年,各行各業(yè)開始高度關注大數(shù)據(jù)的研究和應用[1]。隨著大數(shù)據(jù)的快速發(fā)展,各行業(yè)對大數(shù)據(jù)技術人才的需求呈增長趨勢,大數(shù)據(jù)從業(yè)人員的職業(yè)前景普遍看好,但掌握和應用大數(shù)據(jù)的技術技能人才卻十分稀缺。因此,如何培養(yǎng)能在各領域中應用的、合格的大數(shù)據(jù)人才,成為大數(shù)據(jù)技術應用與推廣中最緊迫的問題。
美國最早開辦數(shù)據(jù)分析專業(yè)的是北卡羅萊納州立大學(2007年)[2]。在大數(shù)據(jù)迅速發(fā)展的背景下,我國也開始加強對大數(shù)據(jù)方面的重視程度。2015年9月,國務院印發(fā)了《促進大數(shù)據(jù)發(fā)展行動綱要》,明確指出鼓勵高等院校、職業(yè)院校和企業(yè)合作,積極培育大數(shù)據(jù)技術和應用創(chuàng)新型人才[3]。在此背景下,教育部于2016年2月首次在本科層面增設“數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)”,截至2018年3月,全國已有283所高校獲批這個本科專業(yè)[4]。在高等職業(yè)教育(??疲哟危按髷?shù)據(jù)技術與應用”專業(yè)也于2016年首次出現(xiàn)在教育部公布的《普通高等學校高等職業(yè)教育(??疲I(yè)目錄》中,據(jù)教育部高等職業(yè)教育備案數(shù)據(jù),截至2018年,大數(shù)據(jù)技術與應用專業(yè)招生院校共有212所[5]。2018年,教育部又以文件的形式明確指出,要主動布局集成電路、人工智能、云計算、大數(shù)據(jù)、網(wǎng)絡空間安全等戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展[6]。
大數(shù)據(jù)技術具有顯著的跨學科特點,且各高校目前對于大數(shù)據(jù)相關專業(yè)的建設和人才培養(yǎng)尚處于起步和摸索階段。因此,在大數(shù)據(jù)產(chǎn)業(yè)迅速發(fā)展背景下,其廣闊的應用前景與技術人員缺失之間的矛盾尤為凸顯。結合目前高校大數(shù)據(jù)相關專業(yè)的人才培養(yǎng)調研情況和文獻搜集總結情況可知,大數(shù)據(jù)相關專業(yè)人才培養(yǎng)方面主要存在三方面問題:
一是專業(yè)服務方向不明確,人才培養(yǎng)定位模糊,對部分課程把握不夠,使得一些教學內容偏理論性,難度偏大,甚至超出本科生的平均能力,讓相當部分的學生產(chǎn)生畏難情緒。二是受現(xiàn)有條件的限制,包括數(shù)據(jù)源、硬件、師資等的影響,使得實踐教學難以開展或開展的效果不理想。三是受大數(shù)據(jù)技術復合型特點的影響,學生不僅要掌握數(shù)學、統(tǒng)計學、計算機科學、軟件工程、管理科學等專業(yè)的基礎知識,也要掌握與業(yè)務過程相關的一些專業(yè)領域的知識背景,這容易造成人才培養(yǎng)目標和方向模糊,使學生“什么都學”,卻“無一精通”,無法找準其定位。
上述問題使得現(xiàn)有的大數(shù)據(jù)人才培養(yǎng)與企業(yè)崗位實際要求有所偏差,影響了高校服務社會職能的體現(xiàn),造成大數(shù)據(jù)人才門檻的看似“高大上”。因此,如何讓大數(shù)據(jù)技術 “落地”,轉化為真正融入生活的數(shù)據(jù)思維;如何把握學科“夠用、適用、實用”的原則,把大數(shù)據(jù)轉換為切實生產(chǎn)力,并能兼顧學生的學習時間和能力,為學生進一步的發(fā)展打下基礎等,既是技能型大數(shù)據(jù)人才培養(yǎng)的重點,也是開放教育中技能型大數(shù)據(jù)人才培養(yǎng)的要點。
大數(shù)據(jù)行業(yè)的就業(yè)崗位主要集中在互聯(lián)網(wǎng)、金融等領域[7],具體情況如圖1所示。大數(shù)據(jù)人才需求按領域可分為數(shù)據(jù)處理技術人才、數(shù)據(jù)管理人才、數(shù)據(jù)安全人才、數(shù)據(jù)分析人才、數(shù)據(jù)科學家[8]等;按職業(yè)角色則主要有大數(shù)據(jù)系統(tǒng)研發(fā)工程師、大數(shù)據(jù)應用開發(fā)工程師、大數(shù)據(jù)分析師、大數(shù)據(jù)可視化工程師、大數(shù)據(jù)運維工程師、大數(shù)據(jù)管理與安全工程師等等;從涉及的關鍵技術看,包括數(shù)據(jù)采集與數(shù)據(jù)管理、分布式存儲和并行計算、大數(shù)據(jù)應用開發(fā)、數(shù)據(jù)分析與挖掘、大數(shù)據(jù)前端應用、數(shù)據(jù)服務和展現(xiàn)[9]。
圖1 大數(shù)據(jù)就業(yè)崗位分布概況
因此,高校一般結合大數(shù)據(jù)的職業(yè)角色和需要掌握的關鍵技術來設計其人才培養(yǎng)體系。而課程體系組織方面則主要依據(jù)大數(shù)據(jù)的價值鏈來設計,包括數(shù)據(jù)采集、數(shù)據(jù)清洗和處理、數(shù)據(jù)挖掘與預測分析等過程[10]。除此之外,也可以圍繞Hadoop生態(tài)圈來組織課程體系。
表1 大數(shù)據(jù)關鍵技術與主要職業(yè)角色分工
綜上可知,大數(shù)據(jù)技術本身具有復合性特征,因此,對從業(yè)就業(yè)能力的要素也是多方面的。即要求從業(yè)者具有一定的數(shù)理統(tǒng)計基礎和算法的基本功,能較好地理解和使用各種數(shù)據(jù)分析算法,具備海量數(shù)據(jù)獲取、數(shù)據(jù)清洗、數(shù)據(jù)預處理、數(shù)據(jù)組織與存儲、數(shù)據(jù)分析與挖掘及數(shù)據(jù)可視化的工程實踐能力,掌握數(shù)據(jù)處理各個環(huán)節(jié)的基本技能,并對物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)相關理論和技術有一定的認識。
就開放大學而言,其大數(shù)據(jù)方向的學生多來自行業(yè)企業(yè)生產(chǎn)一線,具備一定的計算機技術基礎,具備一定的行業(yè)背景知識,多從事計算機技術密切相關的工作崗位,對大數(shù)據(jù)知識與技能的需求更傾向于生產(chǎn)實踐上的應用,更多是希望通過掌握大數(shù)據(jù)的新思維、新技術,在大數(shù)據(jù)時代的企業(yè)行業(yè)升級轉型中為自己的職業(yè)生涯尋找新的機會。因此,考慮到本校學生的學習需求、基礎與能力、學習時間和精力、理論基礎等情況,大數(shù)據(jù)運維等職位可能更符合開放大學中技能型大數(shù)據(jù)人才培養(yǎng)的實際。其目標崗位主要要求與原崗位對比情況如表2所示。
表2 目標崗位與原崗位對比情況
考慮到大數(shù)據(jù)人才的巨大培養(yǎng)需求和人才缺口,廣東開放大學于2015年在計算機應用技術??茖I(yè)設置了大數(shù)據(jù)技術應用培養(yǎng)方向,于2016年春開始在廣東省全省范圍內招生,并于2018年申報了“大數(shù)據(jù)技術與應用”專科專業(yè),面向各行業(yè)企業(yè)的應用領域培養(yǎng)大數(shù)據(jù)的技能型專門人才。
大數(shù)據(jù)自生成到產(chǎn)生商業(yè)價值需要經(jīng)過五個主要的環(huán)節(jié):數(shù)據(jù)生成、數(shù)據(jù)獲取、數(shù)據(jù)存儲、數(shù)據(jù)分析、結果展現(xiàn),而大數(shù)據(jù)技術人才需要掌握的技術技能主要集中在數(shù)據(jù)獲取、數(shù)據(jù)存儲、數(shù)據(jù)分析、結果展現(xiàn)這四個環(huán)節(jié)。每個環(huán)節(jié)及涉及到的技術、可使用的工具或框架等的情況如圖2所示。
圖2 各環(huán)節(jié)相關技術及對應的工具、框架
根據(jù)大數(shù)據(jù)技術的復合型特點可知,學生若要熟練掌握圖2所示的技術、工具、框架等內容,就需要在人才培養(yǎng)過程中注重數(shù)理統(tǒng)計基礎、應用程序開發(fā)、數(shù)據(jù)處理、數(shù)據(jù)管理、文檔編號、系統(tǒng)管理、閱讀表達等七方面的能力培養(yǎng),如圖3所示。同時,這七種能力也是大數(shù)據(jù)相關專業(yè)課程設計與建設的主要依據(jù)。
圖3 技能型大數(shù)據(jù)人才能力組成
針對大數(shù)據(jù)的生產(chǎn)流程和價值鏈,結合表1和圖2的分析,可將學校大數(shù)據(jù)技術與應用的課程設置劃分為數(shù)據(jù)獲取、數(shù)據(jù)存儲、數(shù)據(jù)分析、結果展現(xiàn)四個階段,每個階段涉及到的技術技能、專業(yè)課程設置與實驗實訓設計等具體情況如表3所示。為避免課程體系過于臃腫和膨脹,考慮到學生的學習時間與能力,對大數(shù)據(jù)崗位所需的技術技能作了一些提煉,盡量讓學生著重把握一些技術要點,理論內容夠用、適用即可,注重加強數(shù)據(jù)科學與知識領域的融合,突出強調大數(shù)據(jù)的應用與技能實踐。同時,及時總結近年的教學經(jīng)驗,緊跟技術發(fā)展的步伐,對課程和實驗實訓作了一些調整,如增加了主流數(shù)據(jù)分析語言Python及主流大數(shù)據(jù)管理與分析平臺Hadoop相關的課程和內容。考慮到大數(shù)據(jù)在行業(yè)中的應用,我們選取了目前大數(shù)據(jù)技術應用較廣、需求較多的行業(yè)——互聯(lián)網(wǎng)和金融,在專業(yè)課中引入大數(shù)據(jù)技術在這些行業(yè)中的應用實例。
表3 主要專業(yè)課程設置
在大數(shù)據(jù)實踐教學方面,廣東開放大學一直在積極推進與不斷完善,但目前仍存在一些問題:一是實驗實訓的軟、硬件環(huán)境建設及實踐條件存在困難。如各種大數(shù)據(jù)工具及數(shù)據(jù)源的部署、服務器的配置及搭建,尤其是各個分校或教學點的分布較為分散、條件不一,難以統(tǒng)一;二是各實驗實訓之間的聯(lián)系不夠緊密,內容沒能形成呼應關系;三是實驗實訓師資較為欠缺,大數(shù)據(jù)技術所涉及知識面較廣、較新,因此,亟需提升師資在實踐操作技能和工程實踐等方面的能力。
為解決上述問題,廣東開放大學將在實踐教學中大力推進云計算技術及虛擬化技術的應用,并采取了以下措施促進實踐教學的開展:第一,搭建虛擬實訓平臺。在試點專業(yè)的核心課程中開設若干虛擬實訓項目,解決了基層教學點硬件、軟件及數(shù)據(jù)源難以搭建的問題。不管身處哪個教學點,學生只要通過瀏覽器登錄虛擬實訓平臺,即可開展指定的實訓項目,還可以隨時查看相關的實驗指導書和微課,這給實踐教學帶來了極大的便利,讓全省的學生都能“看得到,摸得著”大數(shù)據(jù)。第二,組織立體式、多形式的實踐教學體系。開發(fā)多樣化的實踐教學課程資源,包括微課、教學案例等,讓學生對大數(shù)據(jù)有全面、多方位的認識,加強學生對大數(shù)據(jù)技術的應用能力。第三,考慮大數(shù)據(jù)人才的綜合能力培養(yǎng)。切實培養(yǎng)學生的數(shù)據(jù)思維,綜合考慮各專業(yè)課程的特點及崗位能力需求,設計若干綜合性較強的實訓。如圖4所示,設計一個簡易推薦系統(tǒng),組織其從數(shù)據(jù)采集、數(shù)據(jù)預處理、數(shù)據(jù)分析到推薦結果呈現(xiàn)的過程,讓學生理解整個大數(shù)據(jù)價值鏈,把握大數(shù)據(jù)的工作流程,提高其分析解決具體問題的能力。第四,加強大數(shù)據(jù)專業(yè)與行業(yè)的融合。由于全省各教學點的需求不同,可適當考慮學生來源和去向、地區(qū)特色等,加強數(shù)據(jù)科學與行業(yè)領域知識的高度融合,在具體的實踐環(huán)節(jié)中落實具有扎實基礎、較寬知識面、較強動手能力的創(chuàng)新型人才的培養(yǎng)特色。第五,加強校企合作。通過校企合作,盡量給學生提供真實、有效的項目實踐機會,力求讓學生在真實的企業(yè)環(huán)境中得到鍛煉和成長。
圖4 簡易推薦系統(tǒng)綜合實訓設計示例
通過以上舉措,開放教育大數(shù)據(jù)人才培養(yǎng)的定位更加明確,更凸顯了開放教育的特色,力求為各行各業(yè)培養(yǎng)更多合格的技能型大數(shù)據(jù)人才,大力推動數(shù)據(jù)技術的普及。