河南省農(nóng)業(yè)農(nóng)村信息中心 王志遠(yuǎn)
當(dāng)前,我國(guó)農(nóng)業(yè)正處于傳統(tǒng)農(nóng)業(yè)向現(xiàn)代農(nóng)業(yè)的轉(zhuǎn)型期,農(nóng)業(yè)信息化水平穩(wěn)步發(fā)展,農(nóng)業(yè)信息服務(wù)水平也在逐步提升。全面提高面向農(nóng)業(yè)服務(wù)水平,是強(qiáng)化政府公共服務(wù)職能的一個(gè)重要組成部分;如何使用信息技術(shù)將農(nóng)業(yè)、農(nóng)村、農(nóng)民信息服務(wù)產(chǎn)生的大數(shù)據(jù)進(jìn)行采集、挖掘、研究、分析,使數(shù)據(jù)產(chǎn)生價(jià)值,是農(nóng)業(yè)信息服務(wù)發(fā)展的一個(gè)難點(diǎn)。本文主要闡述目前農(nóng)業(yè)信息服務(wù)的數(shù)據(jù)采集手段,以這些大數(shù)據(jù)為數(shù)據(jù)挖掘?qū)ο?,嘗試建立農(nóng)業(yè)大數(shù)據(jù)中心模型,并應(yīng)用在生產(chǎn)服務(wù)、經(jīng)營(yíng)預(yù)警等場(chǎng)景中。
農(nóng)業(yè)大數(shù)據(jù)的研究應(yīng)用需要重視數(shù)據(jù)的采集工作。在農(nóng)業(yè)系統(tǒng)中需要針對(duì)不同的情況分類建設(shè),繼續(xù)完善局部地區(qū)的數(shù)據(jù)采集體系,利用智能終端,如傳感器、無(wú)人機(jī)等,去采集實(shí)時(shí)的農(nóng)情;利用數(shù)據(jù)采集傳輸控制系統(tǒng),進(jìn)行相關(guān)的硬件系統(tǒng)整合;利用傳感器來(lái)檢測(cè)農(nóng)業(yè)操作棚內(nèi)的光照強(qiáng)度、溫濕度及二氧化碳、氧氣等相關(guān)氣體的濃度,待檢測(cè)到農(nóng)業(yè)操作棚中的環(huán)境數(shù)據(jù)達(dá)到用戶自行設(shè)定的相關(guān)數(shù)據(jù)后,進(jìn)行相關(guān)的控制溫濕度、光照強(qiáng)度等活動(dòng),如自動(dòng)進(jìn)行灌溉、自動(dòng)遮陽(yáng)等相關(guān)操作。此外,在實(shí)時(shí)作物生長(zhǎng)環(huán)境數(shù)據(jù)信息和實(shí)時(shí)視頻信息等方面,數(shù)據(jù)采集傳輸控制系統(tǒng)也發(fā)揮著重要的作用。如利用采集前端傳感器進(jìn)行采集;將采集到的相關(guān)數(shù)據(jù)統(tǒng)一格式后,利用無(wú)線傳輸?shù)姆绞缴蟼鞯綌?shù)據(jù)平臺(tái)后,進(jìn)行用戶相關(guān)需求的分析;利用硬件的自動(dòng)化設(shè)計(jì)來(lái)控制后端的遮陽(yáng)幕、補(bǔ)光燈、風(fēng)機(jī)等設(shè)備的自動(dòng)開(kāi)啟和關(guān)閉,從而在節(jié)約人資、物資的前提下為農(nóng)作物的生長(zhǎng)提供適宜的環(huán)境,提高農(nóng)產(chǎn)品的產(chǎn)量。
一是主動(dòng)人工采集。主要由專人在“菜籃子”基地、有代表性的農(nóng)業(yè)龍頭企業(yè)、農(nóng)產(chǎn)品市場(chǎng)等益農(nóng)信息社布置信息采集點(diǎn),使其能通過(guò)信息平臺(tái)上傳農(nóng)產(chǎn)品市場(chǎng)信息。二是依托政務(wù)服務(wù)辦事平臺(tái)進(jìn)行采集。依托政府機(jī)構(gòu)建設(shè)的業(yè)務(wù)信息系統(tǒng)、辦事服務(wù)系統(tǒng)進(jìn)行數(shù)據(jù)采集。兩種信息采集方式采集的數(shù)據(jù)又分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),其都要把數(shù)據(jù)經(jīng)過(guò)分析、驗(yàn)證、清洗、轉(zhuǎn)換,去重后進(jìn)行數(shù)據(jù)存儲(chǔ),然后根據(jù)應(yīng)用途徑進(jìn)行應(yīng)用功能設(shè)計(jì)及數(shù)據(jù)計(jì)算,形成大數(shù)據(jù)報(bào)表輸出,達(dá)到數(shù)據(jù)決策支持的目的。
數(shù)據(jù)挖掘是發(fā)現(xiàn)知識(shí)過(guò)程中的一個(gè)步驟,主要是從數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)以及其他信息庫(kù)的大量數(shù)據(jù)中挖掘知識(shí)的過(guò)程。其中,數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)挖掘的對(duì)象,通常需要對(duì)其進(jìn)行的操作有數(shù)據(jù)清洗、數(shù)據(jù)集成等相關(guān)性操作及對(duì)數(shù)據(jù)對(duì)象進(jìn)行初步的預(yù)處理流程;數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器其主要的功能是讀取相關(guān)的數(shù)據(jù),其讀取數(shù)據(jù)的數(shù)據(jù)是由用戶的挖掘數(shù)據(jù)請(qǐng)求來(lái)決定的;知識(shí)庫(kù)是將挖掘到的領(lǐng)域知識(shí)存放的地方,這些知識(shí)放在數(shù)據(jù)庫(kù)中,來(lái)對(duì)特定的知識(shí)進(jìn)行搜索;數(shù)據(jù)挖掘引擎主要是由數(shù)據(jù)挖掘功能模塊組成,實(shí)現(xiàn)關(guān)聯(lián)分析、進(jìn)化計(jì)算、定性歸納、偏差分析等主要功能;模式評(píng)估模塊將根據(jù)興趣度,聯(lián)合數(shù)據(jù)挖掘模塊定位到更有意義的模式,其是否能與數(shù)據(jù)挖掘模塊完美結(jié)合,主要與其使用的算法相關(guān),正確的數(shù)據(jù)挖掘算法與知識(shí)評(píng)估方法的完美結(jié)合將有利于增強(qiáng)挖掘的效率和精度;可視化用戶界面主要是用戶的操作界面,幫助用戶與系統(tǒng)進(jìn)行交流,是一個(gè)雙向傳輸?shù)倪^(guò)程,首先通過(guò)用戶界面將自己的挖掘任務(wù)以及相關(guān)的要求傳輸給該系統(tǒng),其次將數(shù)據(jù)挖掘到的相關(guān)信息傳輸回來(lái)。
數(shù)據(jù)挖掘技術(shù)在農(nóng)業(yè)市場(chǎng)中的應(yīng)用,其數(shù)據(jù)源是多種多樣的,如農(nóng)產(chǎn)品市場(chǎng)價(jià)格數(shù)據(jù)庫(kù)、外國(guó)農(nóng)產(chǎn)品進(jìn)口貿(mào)易數(shù)據(jù)庫(kù)、中國(guó)農(nóng)產(chǎn)品出口貿(mào)易數(shù)據(jù)庫(kù)等,利用數(shù)據(jù)挖掘的算法和規(guī)則,來(lái)提取隱含模糊的、具有價(jià)值的信息。如使用預(yù)測(cè)和分類,可以對(duì)將來(lái)的農(nóng)產(chǎn)品價(jià)格進(jìn)行預(yù)測(cè);利用關(guān)聯(lián)分析,進(jìn)而來(lái)發(fā)現(xiàn)一些相關(guān)性的規(guī)則;使用聚類分析,可以對(duì)農(nóng)產(chǎn)品客觀地分類(如將蛋類與油類變成一類),再利用統(tǒng)計(jì)技術(shù)來(lái)發(fā)現(xiàn)各種農(nóng)產(chǎn)品的價(jià)格走勢(shì)(如海鮮與糧食作物的價(jià)格變動(dòng)相關(guān)趨勢(shì));使用孤立點(diǎn)分析技術(shù),可以找出一些罕見(jiàn)的事件(如發(fā)現(xiàn)災(zāi)情、金融事件等)。
數(shù)據(jù)挖掘技術(shù)在病蟲(chóng)害防治中的應(yīng)用主要是對(duì)病蟲(chóng)害的動(dòng)態(tài)監(jiān)測(cè)、發(fā)生趨勢(shì)預(yù)測(cè)及風(fēng)險(xiǎn)評(píng)估等幾個(gè)方面。農(nóng)作物的栽培環(huán)境、耕作條件、相關(guān)布局方式和農(nóng)作物品種抗藥性、耐寒性、抗旱性及氣象條件等諸多因素都是病蟲(chóng)害發(fā)生的原因,另外,還與農(nóng)作物所處的地理位置及不同的氣候帶有關(guān)。
預(yù)測(cè)某段時(shí)間發(fā)生蟲(chóng)害的可能性可以通過(guò)數(shù)據(jù)挖掘技術(shù)來(lái)實(shí)現(xiàn),同時(shí),通過(guò)在發(fā)生其他種類蟲(chóng)害的可能性方面也可提供相關(guān)的技術(shù)支持。病蟲(chóng)害的防治可以通過(guò)三個(gè)層次來(lái)實(shí)現(xiàn),即表示層、邏輯層、數(shù)據(jù)層。首先,表示層的設(shè)計(jì)主要完成用戶與系統(tǒng)的交互功能,即用戶目的搜索的設(shè)計(jì)以及簡(jiǎn)單的數(shù)據(jù)處理。其次,邏輯層的設(shè)計(jì)主要是完成復(fù)雜的應(yīng)用,集成服務(wù)器端構(gòu)件,供調(diào)用即可完成功能。最后,數(shù)據(jù)層的設(shè)計(jì)主要是利用數(shù)據(jù)庫(kù)管理系統(tǒng),將搜集到的數(shù)據(jù)表和視圖等進(jìn)行相應(yīng)地封裝和存儲(chǔ),用戶可在用戶界面,通過(guò)使用瀏覽器輸入來(lái)查詢所需的數(shù)據(jù)信息。
農(nóng)業(yè)電子商務(wù)是指利用互聯(lián)網(wǎng)的廣域性、互通性、易用性等相關(guān)特性,為從事農(nóng)業(yè)生產(chǎn)領(lǐng)域的生產(chǎn)經(jīng)營(yíng)主體,提供在網(wǎng)上完成產(chǎn)品或服務(wù)的銷售和電子支付等業(yè)務(wù)交易的過(guò)程。數(shù)據(jù)挖掘技術(shù)能從海量的網(wǎng)絡(luò)信息中挖掘出有用的信息,能自動(dòng)預(yù)測(cè)客戶的消費(fèi)趨勢(shì)、市場(chǎng)走向,指導(dǎo)農(nóng)業(yè)企業(yè)建設(shè)個(gè)性化的智能網(wǎng)站,為農(nóng)業(yè)企業(yè)創(chuàng)造新的商業(yè)增長(zhǎng)點(diǎn)。