牟少敏,溫孚江,宋長青
山東農(nóng)業(yè)大學農(nóng)業(yè)大數(shù)據(jù)研究中心,山東 泰安 271018
農(nóng)業(yè)大數(shù)據(jù)研究生培養(yǎng)模式探索
牟少敏,溫孚江,宋長青
山東農(nóng)業(yè)大學農(nóng)業(yè)大數(shù)據(jù)研究中心,山東 泰安 271018
大數(shù)據(jù)應用尚處于初級階段,農(nóng)業(yè)大數(shù)據(jù)又是多學科的交叉融合產(chǎn)物,相應人才的缺乏是其研究和應用的重要瓶頸。簡要介紹了農(nóng)業(yè)大數(shù)據(jù)的概念、處理技術(shù)及其應用。并結(jié)合農(nóng)業(yè)大數(shù)據(jù)的特點,針對目前人才嚴重缺乏的現(xiàn)狀,提出了農(nóng)業(yè)大數(shù)據(jù)研究生培養(yǎng)的重要性,并在此基礎(chǔ)上,探討了培養(yǎng)方案的要素以及人才培養(yǎng)模式。
農(nóng)業(yè)大數(shù)據(jù);機器學習;大數(shù)據(jù)處理技術(shù);研究生培養(yǎng)模式
自2008年國際綜合性期刊《Nature》發(fā)表有關(guān)大數(shù)據(jù)(big data)的??詠恚髷?shù)據(jù)的采集、存儲、挖掘、處理、分析和利用,已成為我國各行業(yè)和科學研究關(guān)注的焦點。全球IT、互聯(lián)網(wǎng)巨頭都已經(jīng)意識到數(shù)據(jù)的重要性,包括EMC、IBM、惠普、微軟和阿里巴巴等大型IT企業(yè)都紛紛通過收購和建立相應的大數(shù)據(jù)研發(fā)機構(gòu)等手段實現(xiàn)技術(shù)整合。人們進入了一個“數(shù)據(jù)為王”的時代。
我國政府、高等院校、科研院所和各個行業(yè)都認識到信息科技時代大數(shù)據(jù)技術(shù)和應用的重要性,其發(fā)展將成為我國應對經(jīng)濟全球化、加快經(jīng)濟結(jié)構(gòu)調(diào)整、培育新的經(jīng)濟增長點的催化劑。目前,我國不僅對數(shù)據(jù)共享、數(shù)據(jù)處理和數(shù)據(jù)安全等迫切需要解決的問題進行了頂層設(shè)計,而且對大數(shù)據(jù)的技術(shù)參考模型、數(shù)據(jù)交易平臺交易數(shù)據(jù)描述、數(shù)據(jù)能力成熟度評價模型、數(shù)據(jù)質(zhì)量評價指標等有關(guān)標準的制定也在加緊進行中,其必將為大數(shù)據(jù)的可持續(xù)發(fā)展提供強有力的保障。
農(nóng)業(yè)大數(shù)據(jù)指的是來源廣泛、類型多樣、結(jié)構(gòu)復雜、具有潛在價值,并難以應用通常方法處理和分析的數(shù)據(jù)集合[1],具有農(nóng)業(yè)地域性、季節(jié)性、多樣性、周期性、準公益性等特點。目前,農(nóng)業(yè)大數(shù)據(jù)在我國已經(jīng)取得了初步的應用。利用地理信息系統(tǒng)(geographic information system,GIS)、遙感和機器學習(machine learning,ML)等技術(shù),對小麥和玉米等農(nóng)作物病蟲害的數(shù)據(jù)進行分析,并對其發(fā)生程度進行預測預警。農(nóng)產(chǎn)品檢測信息已成為消費者追溯產(chǎn)品最直觀、最可信的信息[2]。利用物聯(lián)網(wǎng)和數(shù)據(jù)庫等技術(shù),實現(xiàn)農(nóng)產(chǎn)品檢測數(shù)據(jù)的整合,進行農(nóng)產(chǎn)品質(zhì)量安全溯源。采用O2O(online to offline)電商模式,使互聯(lián)網(wǎng)成為線下交易的前臺,將農(nóng)產(chǎn)品的線上交易與線下服務相結(jié)合,大大節(jié)省了農(nóng)產(chǎn)品的交易成本。在我國經(jīng)濟進入新常態(tài)的背景下,互聯(lián)網(wǎng)+農(nóng)村金融也受到了人們的廣泛關(guān)注。農(nóng)業(yè)大數(shù)據(jù)可以當好政府的智囊,為企業(yè)提供支撐,為學科提升和轉(zhuǎn)型提供平臺,為提高管理水平提供手段[3]。
由以上分析可以看出,大數(shù)據(jù)廣闊的應用前景需要大量的大數(shù)據(jù)人才。2018年美國需要44萬~49萬名大數(shù)據(jù)深入分析人才,存在14萬~19萬名的人才缺口;需要400萬名具備基于大數(shù)據(jù)分析進行決策的經(jīng)理和分析師,這一類人才缺口在2018年將達到150萬人[4]。而我國系統(tǒng)和專業(yè)培養(yǎng)農(nóng)業(yè)大數(shù)據(jù)人才的機構(gòu)和單位基本沒有,從事農(nóng)業(yè)大數(shù)據(jù)的人才更是非常缺乏,甚至是農(nóng)業(yè)大數(shù)據(jù)發(fā)展的一個短板。
目前,我國農(nóng)業(yè)大數(shù)據(jù)人才的主要來源是農(nóng)業(yè)信息化的人才,農(nóng)業(yè)信息化人才本身就存在數(shù)量嚴重不足的問題。同時,農(nóng)業(yè)信息化人才主要是來自農(nóng)學類專業(yè)、計算機類專業(yè)和經(jīng)濟管理類專業(yè)等。這些專業(yè)培養(yǎng)人才的專業(yè)針對性強,知識面不廣,而既具有農(nóng)業(yè)基本知識又掌握大數(shù)據(jù)技術(shù)的人才則是少之又少,如果不加快培養(yǎng)復合型的人才,將會制約農(nóng)業(yè)大數(shù)據(jù)的發(fā)展。
我國農(nóng)業(yè)大數(shù)據(jù)的研究和應用可以視為一個非常巨大和復雜的系統(tǒng)工程。農(nóng)業(yè)生產(chǎn)過程中,多年積累的數(shù)據(jù)是許多領(lǐng)域無法比擬的,它具有大量、高維、動態(tài)、不完全(缺值)、不確定(數(shù)據(jù)中的系統(tǒng)或隨機噪聲)和稀疏性(很少甚至沒有有用的記錄)等特性。只有將機器學習、深度學習和自然語言的理解等人工智能技術(shù)、云計算技術(shù)、Hadoop等大數(shù)據(jù)處理技術(shù)和農(nóng)業(yè)領(lǐng)域進行深度融合,農(nóng)業(yè)大數(shù)據(jù)才能產(chǎn)生巨大的效益。因此,未來農(nóng)業(yè)大數(shù)據(jù)的人才需求必然呈現(xiàn)出爆發(fā)性增長,農(nóng)業(yè)大數(shù)據(jù)研究生人才必然會成為最炙手可熱的人才,如何突破目前國內(nèi)農(nóng)業(yè)大數(shù)據(jù)領(lǐng)域人才需求的瓶頸以及對人才培養(yǎng)戰(zhàn)略的積極布局,加速其培養(yǎng),顯得尤為重要。
近年來,山東農(nóng)業(yè)大學在農(nóng)業(yè)大數(shù)據(jù)的研究和應用方面取得了一定的成績,在經(jīng)過深入調(diào)研和基礎(chǔ)上,率先將農(nóng)業(yè)大數(shù)據(jù)人才培養(yǎng)納入了研究生培養(yǎng)體系,設(shè)立了大數(shù)據(jù)科學與技術(shù)研究生研究方向,下面重點探討一下農(nóng)業(yè)大數(shù)據(jù)研究生人才培養(yǎng)的新模式。
2.1 農(nóng)業(yè)大數(shù)據(jù)研究生人才培養(yǎng)的必要性與可行性
汪洋副總理指出“用發(fā)展新理念大力推進農(nóng)業(yè)現(xiàn)代化”,而農(nóng)業(yè)現(xiàn)代化的發(fā)展需要物聯(lián)網(wǎng)、大數(shù)據(jù)和云計算等技術(shù),需要大量的農(nóng)業(yè)大數(shù)據(jù)人才,因此農(nóng)業(yè)大數(shù)據(jù)研究生人才的培養(yǎng)是一項非常必要和迫切的工作。
大數(shù)據(jù)時代賦予了農(nóng)業(yè)大數(shù)據(jù)研究生人才培養(yǎng)特殊意義,是非單一學科所能完成的,需要多元化的培養(yǎng)體系,需要跨界和多學科的深度融合。山東農(nóng)業(yè)大學是一所多學科的農(nóng)業(yè)院校,既有農(nóng)業(yè)相關(guān)學科,也有計算機科學與技術(shù)和信息科學等學科,在農(nóng)業(yè)大數(shù)據(jù)研究生人才培養(yǎng)方面具有跨界和多學科深度融合的優(yōu)勢和基礎(chǔ)。
目前,國內(nèi)設(shè)置大數(shù)據(jù)研究生人才培養(yǎng)的狀況如下:2014年中國人民大學、北京大學等5所大學聯(lián)合培養(yǎng)大數(shù)據(jù)分析研究生,首批招生50名,5所高校還將共同組建大數(shù)據(jù)分析研究生培養(yǎng)協(xié)同創(chuàng)新平臺。香港中文大學設(shè)立數(shù)據(jù)科學與商業(yè)統(tǒng)計(data science & business statistics)研究生課程,紐約大學上海分校設(shè)立商業(yè)數(shù)據(jù)分析科學(master of science in business analytics)研究生課程。北京航空航天大學、清華大學等高校也啟動了大數(shù)據(jù)項目,培養(yǎng)相關(guān)人才。上海復旦大學自設(shè)了數(shù)據(jù)科學本科專業(yè)。
但是,針對農(nóng)業(yè)大數(shù)據(jù)的研究生人才培養(yǎng)還未見報道,山東農(nóng)業(yè)大學的農(nóng)業(yè)大數(shù)據(jù)研究生第一期實驗班2016年開始招生,計劃招生人數(shù)30~50人。
2.2 農(nóng)業(yè)大數(shù)據(jù)研究生人才培養(yǎng)模式
國務院促進大數(shù)據(jù)發(fā)展行動綱要指出:“鼓勵高校設(shè)立數(shù)據(jù)科學和數(shù)據(jù)工程相關(guān)專業(yè),重點培養(yǎng)專業(yè)化數(shù)據(jù)工程師等大數(shù)據(jù)專業(yè)人才。鼓勵采取跨校聯(lián)合培養(yǎng)等方式開展跨學科大數(shù)據(jù)綜合型人才培養(yǎng)。”這為農(nóng)業(yè)大數(shù)據(jù)研究生人才培養(yǎng)模式指明了方向。針對農(nóng)業(yè)大數(shù)據(jù)的特點,使計算機科學與技術(shù)、信息與計算科學、統(tǒng)計學與經(jīng)濟金融、生命科學、資源與環(huán)境、農(nóng)學、園藝科學與工程和植物保護等眾多學科領(lǐng)域相互滲透,深度交叉,建立跨學科、跨領(lǐng)域的師資隊伍和研發(fā)團隊,開展農(nóng)業(yè)大數(shù)據(jù)研究生人才培養(yǎng)工作。
研究生培養(yǎng)模式指的是在一定的現(xiàn)代教育理論、教育思想指導下,按照特定的培養(yǎng)目標和人才規(guī)格,以相對穩(wěn)定的教學內(nèi)容和課程體系、管理制度和評估方式,實施研究生教育的過程。下面結(jié)合農(nóng)業(yè)大數(shù)據(jù)研究生人才培養(yǎng)模式的特點,以山東農(nóng)業(yè)大學的農(nóng)業(yè)大數(shù)據(jù)研究生人才培養(yǎng)模式為例,從以下幾個方面探討如何進行農(nóng)業(yè)大數(shù)據(jù)研究生人才培養(yǎng)。
2.2.1 農(nóng)業(yè)大數(shù)據(jù)方向培養(yǎng)目標
針對農(nóng)業(yè)大數(shù)據(jù)的特點,在充分調(diào)研的基礎(chǔ)上,確定了農(nóng)業(yè)大數(shù)據(jù)方向培養(yǎng)目標。即從數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)應用3個主要應用層面出發(fā),依托農(nóng)業(yè)學科的優(yōu)勢,強化學科交叉,著重培養(yǎng)學生數(shù)據(jù)的收集、融合、管理能力,挖掘農(nóng)業(yè)大數(shù)據(jù)背后價值的能力,成為未來農(nóng)業(yè)大數(shù)據(jù)等領(lǐng)域具有豐富實踐經(jīng)驗和能力的實用型大數(shù)據(jù)人才。
2.2.2 師資隊伍
農(nóng)業(yè)大數(shù)據(jù)研究生人才培養(yǎng)的關(guān)鍵問題之一就是師資隊伍的建設(shè)。農(nóng)業(yè)大數(shù)據(jù)的跨學科、跨領(lǐng)域的特點,決定了其師資隊伍建設(shè)需要打破以往傳統(tǒng)的構(gòu)建模式,需要新思路和新模式。
農(nóng)業(yè)大數(shù)據(jù)研究生人才培養(yǎng)主要依托信息科學與工程專業(yè)的師資力量,同時根據(jù)人才培養(yǎng)的需要,聯(lián)合相關(guān)學科師資力量和領(lǐng)域?qū)<覍W者力量共同培養(yǎng)。如山東農(nóng)業(yè)大學在涉農(nóng)、經(jīng)濟管理、計算數(shù)學等學科建設(shè)方面具有雄厚的學科基礎(chǔ),能夠為數(shù)據(jù)科學與應用學科起到良好的支撐作用。
研究生的培養(yǎng)實行雙導師負責制和導師組相結(jié)合的模式。為了強調(diào)學科交叉課程學習,完善研究生多學科的知識結(jié)構(gòu)與農(nóng)業(yè)大數(shù)據(jù)的思維方式,采用了雙導師制。雙導師1名來自本校,另外1名來自其他國內(nèi)知名大學或國內(nèi)知名企業(yè)。本校導師是研究生培養(yǎng)和管理的第一責任人。由于農(nóng)業(yè)大數(shù)據(jù)應用會滲透到農(nóng)業(yè)產(chǎn)業(yè)鏈的產(chǎn)前、產(chǎn)中和產(chǎn)后的整個過程,這還需要構(gòu)建以雙導師為中心,多學科導師相輔助的集體指導小組,結(jié)合實際科研課題或工程項目進行培養(yǎng)。
2.2.3 人才培養(yǎng)
為了進一步加強人才培養(yǎng)力度,重視科研能力和方法的訓練,還采用與名校、名企聯(lián)合培養(yǎng)模式。因材施教,強調(diào)自學和對話式、討論式教學,發(fā)揮導師和研究生雙方的積極性和創(chuàng)造性。教學方式也有別于傳統(tǒng)的課堂講授,采取案例教學和討論班的方式,或者以團隊的形式共同完成一個項目。同時,聘請國內(nèi)外知名數(shù)據(jù)科學和農(nóng)業(yè)等領(lǐng)域的專家教授定期進行講座,不斷擴大對外交流,通過創(chuàng)新培養(yǎng)機制,保障農(nóng)業(yè)大數(shù)據(jù)研究生人才培養(yǎng)質(zhì)量。
2.2.4 科學研究
依托山東農(nóng)業(yè)大學信息科學與工程學院、山東農(nóng)業(yè)大數(shù)據(jù)研究中心和山東省農(nóng)業(yè)大數(shù)據(jù)產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟,在農(nóng)業(yè)大數(shù)據(jù)的科學研究上已經(jīng)完成了以下工作:利用物聯(lián)網(wǎng)技術(shù)進行農(nóng)業(yè)數(shù)據(jù)(如溫度、濕度等)的采集;建立了分布式的存儲數(shù)據(jù)庫HB as e和基于Hadoop的農(nóng)業(yè)數(shù)據(jù)分析平臺。將采集到的農(nóng)業(yè)相關(guān)數(shù)據(jù)(農(nóng)業(yè)病蟲害等結(jié)構(gòu)化數(shù)據(jù)以及圖像、文字等非結(jié)構(gòu)化數(shù)據(jù))存儲到分布式數(shù)據(jù)庫中。借助于Hadoop大數(shù)據(jù)處理平臺將支持向量機等主要的機器學習算法進行并行化數(shù)據(jù)分析,實現(xiàn)農(nóng)業(yè)數(shù)據(jù)從存儲到分析的并行化,極大地提高了農(nóng)業(yè)數(shù)據(jù)處理的吞吐效率和分析準確率,為農(nóng)業(yè)數(shù)據(jù)的收集存儲分析提供了一種新的處理模式。
充分發(fā)揮先期已經(jīng)取得的數(shù)據(jù)技術(shù)與應用科研優(yōu)勢,結(jié)合國家“十三五”規(guī)劃,從數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)分析與處理技術(shù)、數(shù)據(jù)的可視化等幾個方面入手,加速培養(yǎng)適應農(nóng)業(yè)信息化各方面需要的高層次、多層次的復合型研究生人才。充分發(fā)揮山東農(nóng)業(yè)大學農(nóng)業(yè)科學優(yōu)勢及生命科學特色,充分發(fā)揮大數(shù)據(jù)技術(shù)與應用技術(shù)的強大功能及優(yōu)勢,進一步拓寬大數(shù)據(jù)技術(shù)在農(nóng)業(yè)上的應用領(lǐng)域,提高農(nóng)業(yè)數(shù)據(jù)收集整理分析和決策的科學化。
2.2.5 課程體系與實踐教學
科學合理的研究生課程體系對保障研究生培養(yǎng)質(zhì)量具有重要作用。緊緊圍繞研究生培養(yǎng)目標,從體現(xiàn)農(nóng)業(yè)大數(shù)據(jù)的特色出發(fā),構(gòu)建開放式的研究生課程體系。課程體系主要包括核心課程和專業(yè)學位課程。課程學習時間為1年。確定了“農(nóng)業(yè)大數(shù)據(jù)分析技術(shù)基礎(chǔ)”、“數(shù)據(jù)挖掘”、“機器學習”、“農(nóng)業(yè)信息科學”、“非結(jié)構(gòu)化大數(shù)據(jù)分析”和“農(nóng)業(yè)大數(shù)據(jù)案例分析”等必修課程。每門課程不是由一位老師獨立完成,而是由一個課程組各有特長的多位老師共同進行講授。
實踐教學是培養(yǎng)農(nóng)業(yè)大數(shù)據(jù)創(chuàng)新人才非常重要的一個環(huán)節(jié),是合作培養(yǎng)模式的具體體現(xiàn)。研究生在修滿專業(yè)規(guī)定的學分后,以實際項目為背景,由校企雙方發(fā)揮各自的優(yōu)勢,共同指導農(nóng)業(yè)大數(shù)據(jù)課題的研究。實習基地是學生實習和社會實踐的重要場所,建立跨學科的研究中心和實驗室,并以如泰山神農(nóng)智谷農(nóng)業(yè)大數(shù)據(jù)產(chǎn)業(yè)園區(qū)作為農(nóng)業(yè)大數(shù)據(jù)研究生人才的校外實習基地,計劃逐步增加更多的實習基地,使得農(nóng)業(yè)大數(shù)據(jù)研究生的培養(yǎng)更加貼合學科前沿的發(fā)展,更好地滿足國民經(jīng)濟建設(shè)需求。
大數(shù)據(jù)時代背景下,如何培養(yǎng)農(nóng)業(yè)大數(shù)據(jù)的復合型研究生人才無論是在國內(nèi)還是在國外都沒有先例,數(shù)據(jù)科學和技術(shù)的研究也還處于起步階段。山東農(nóng)業(yè)大學率先在農(nóng)業(yè)大數(shù)據(jù)研究生人才培養(yǎng)方面進行了相關(guān)的探索和研究。農(nóng)業(yè)大數(shù)據(jù)研究生人才的培養(yǎng)必將是一項長期而艱巨的工作,仍需要不斷地創(chuàng)新、探索和實踐。隨著大數(shù)據(jù)時代的到來和研究生培養(yǎng)模式的不斷創(chuàng)新和完善,一定能夠培養(yǎng)出高質(zhì)量的農(nóng)業(yè)大數(shù)據(jù)研究生人才,服務于我國農(nóng)業(yè)現(xiàn)代化的建設(shè)。
[1] 趙璞. 淺談農(nóng)業(yè)大數(shù)據(jù)[EB/OL].[2015-01-11]. http://www.caas.net.cn/zt/ kxjd1/250773.shtml. ZHAO P. Discussion on agricultural big data[EB/OL].[2015-01-11]. http://www. caas.net.cn/zt/kxjd1/250773.shtml.
[2] 錢建平, 張保巖, 邢斌, 等. 集成實時快速檢測信息的蔬菜追溯系統(tǒng)改進與應用[J]. 農(nóng)業(yè)工程學報,2015(4): 306-311. QIAN J P, ZHANG B Y, XING B, et al. Improvement and application of vegetable traceability system with integrated realtime rapid detection of information[J]. Transactions of the Chinese Society of Agricultural Engineering, 2015(4): 306-311.
[3] 溫孚江. 農(nóng)業(yè)大數(shù)據(jù)研究的戰(zhàn)略意義與協(xié)同機制[J]. 高等農(nóng)業(yè)教育, 2013(11):3-6. WEN F J. Strategic significance and synergetic mechanism of agricultural big data research[J]. Higher Agricultural Education, 2013(11): 3-6.
[4] 何海地. 美國大數(shù)據(jù)專業(yè)碩士研究生教育的背景、現(xiàn)狀、特色與啟示[J]. 圖書與情報, 2014(2): 48-56. HE H D. The status and suggestions of American great universities with master’s programs in big data analytics[J]. Library & Information, 2014(2):48-56.
Training mode of graduate students majored in agricultural big data
MU Shaomin, WEN Fujiang, SONG Changqing
Agricultural Big Data Research Center, Shandong Agricultural University, Taian 271018, China
Big data application is still in its primary stage, and agricultural big data is the integrated products of many different subjects, so the insufficiency of big data specialists or experts is an important bottle-neck of big data application. The concept of agricultural big data, the processing technology and its application were briefly introduced. Combining the characteristics of the agricultural big data, aiming at the situation of agricultural big data talent lack, the importance of graduate students majored in agriculture big data was discussed. On this basis, the essence of training scheme and the training mode of graduate students were discussed.
agricultural big data, machine learning, big data processing technology, training mode of graduate students
G643
A
10.11959/j.issn.2096-0271.2016006
牟少敏(1964-),男,博士,山東農(nóng)業(yè)大學教授,主要研究方向為大數(shù)據(jù)、機器學習和模式識別。
溫孚江(1955-),男,現(xiàn)任山東農(nóng)業(yè)大學校長、教授,農(nóng)業(yè)大數(shù)據(jù)創(chuàng)新戰(zhàn)略聯(lián)盟理事長,全國人民代表大會常務委員會委員。早年留學美國,并獲得博士學位。主要從事植物保護研究和宏觀農(nóng)業(yè)研究工作。發(fā)表論文210余篇,專著5部。最近一本專著《大數(shù)據(jù)農(nóng)業(yè)》由中國農(nóng)業(yè)出版社于2015年9月出版。目前主要從事農(nóng)業(yè)大數(shù)據(jù)應用研究工作,是我國農(nóng)業(yè)大數(shù)據(jù)研究主要發(fā)起人之一。
宋長青(1963-),男,山東農(nóng)業(yè)大學教授,農(nóng)業(yè)大數(shù)據(jù)研究中心常務副主任,主要從事農(nóng)業(yè)大數(shù)據(jù)采集、入庫、平臺建設(shè)、示范基地等研究與示范工作。
2015-12-15
國家科技支撐計劃基金資助項目(No.2013BAD15B02);公益性行業(yè)(農(nóng)業(yè))科研專項經(jīng)費基金資助項目(No.201303107);中國農(nóng)業(yè)科學院科技創(chuàng)新工程基金資助項目(No.CAAS-ASTIP-201X-AII-04)
Foundation Items: The National Key Technology R&D Program (No.2013BAD15B02), Public Sector (Agriculture) Scientific Research Funding Program (No.201303107) , Scientific and Technical Innovation Project of CAAS (No.CAAS-ASTIP-201XAII-04)