王丹妮,包世泰,王春林,唐力生
(1華南農(nóng)業(yè)大學(xué)信息學(xué)院,廣東廣州510642;2中山大學(xué)新華學(xué)院,廣東廣州510520; 3廣東省氣候與農(nóng)業(yè)氣象中心,廣東廣州510680)
基于氣象數(shù)據(jù)挖掘的廣東省農(nóng)業(yè)高溫災(zāi)害預(yù)測研究
王丹妮1,2,包世泰1,王春林3,唐力生3
(1華南農(nóng)業(yè)大學(xué)信息學(xué)院,廣東廣州510642;2中山大學(xué)新華學(xué)院,廣東廣州510520; 3廣東省氣候與農(nóng)業(yè)氣象中心,廣東廣州510680)
【目的】對廣東省氣象觀測數(shù)據(jù)挖掘分析,以廣東省農(nóng)業(yè)氣象災(zāi)害中的高溫為例,預(yù)測可能存在的災(zāi)害及其等級.【方法】在缺乏災(zāi)害判定規(guī)則和歷史災(zāi)情等先驗(yàn)知識的條件下,應(yīng)用模糊C均值聚類算法(FCM)挖掘得出關(guān)鍵屬性的聚類中心和隸屬度矩陣,建立災(zāi)害等級判定規(guī)則,進(jìn)而通過氣象觀測數(shù)據(jù)預(yù)測可能即將發(fā)生的農(nóng)業(yè)氣象災(zāi)害及其等級.通過誤差反向傳播(BP)神經(jīng)網(wǎng)絡(luò)算法對氣象觀測歷史數(shù)據(jù)及同期發(fā)布的災(zāi)害等級數(shù)據(jù)進(jìn)行學(xué)習(xí),訓(xùn)練后的網(wǎng)絡(luò)模型可以準(zhǔn)確地揭示內(nèi)在的災(zāi)害發(fā)生規(guī)律,進(jìn)而通過氣象觀測數(shù)據(jù)精確地預(yù)測可能即將發(fā)生的農(nóng)業(yè)氣象災(zāi)害及其等級.【結(jié)果和結(jié)論】BP和FCM 2種數(shù)據(jù)挖掘方法在缺乏先驗(yàn)知識的條件下,均可以通過氣象觀測數(shù)據(jù)準(zhǔn)確預(yù)測農(nóng)業(yè)氣象災(zāi)害,結(jié)果對比表明前者預(yù)測氣象站點(diǎn)災(zāi)害等級的精度略優(yōu)于后者.
模糊聚類;BP神經(jīng)網(wǎng)絡(luò);數(shù)據(jù)挖掘;高溫災(zāi)害;災(zāi)害預(yù)測
近年來全球氣候變化不穩(wěn)定性更加劇烈,氣象災(zāi)害對農(nóng)業(yè)生產(chǎn)影響更加突出,農(nóng)業(yè)氣象災(zāi)害頻現(xiàn)[1-3].如何充分利用大量連續(xù)觀測的氣象資料,從中挖掘分析可能成災(zāi)的災(zāi)害性天氣過程,并預(yù)測預(yù)警災(zāi)害等級,對預(yù)防氣象災(zāi)害減少農(nóng)業(yè)損失具有重要意義[3-6].目前數(shù)據(jù)挖掘技術(shù)成為解決氣象觀測“數(shù)據(jù)豐富、知識貧乏”問題的有效手段[7-12],其中的聚類分析和神經(jīng)網(wǎng)絡(luò)方法經(jīng)常應(yīng)用于氣候特征分析與氣象災(zāi)害研究[13-19].本文嘗試應(yīng)用這2種數(shù)據(jù)挖掘方法預(yù)測農(nóng)業(yè)高溫災(zāi)害,具體是采用模糊聚類方法在無先驗(yàn)知識的情況下,利用氣象觀測資料生成模糊聚類中心和隸屬度信息,即建立高溫災(zāi)害等級判定標(biāo)準(zhǔn)預(yù)測未來可能的高溫災(zāi)害;采用誤差反向傳播(Backprop,BP)神經(jīng)網(wǎng)絡(luò)算法對廣東省氣象局發(fā)布的高溫災(zāi)害歷史數(shù)據(jù)進(jìn)行學(xué)習(xí),經(jīng)訓(xùn)練后的網(wǎng)絡(luò)模型可以根據(jù)實(shí)時氣象觀測資料,精確地預(yù)測可能的高溫災(zāi)害并判定其等級.
1.1 試驗(yàn)區(qū)概況
以廣東省為試驗(yàn)區(qū),采用的原始數(shù)據(jù)是2011年廣東省地面氣象觀測多要素逐日數(shù)據(jù)和逐日災(zāi)害數(shù)據(jù),涵蓋全省86個氣象遙測站(圖1),地面氣象遙測站多要素逐日觀測數(shù)據(jù)結(jié)構(gòu)和農(nóng)業(yè)氣象災(zāi)害發(fā)布數(shù)據(jù)結(jié)構(gòu)如表1和表2.
圖1 廣東省氣象遙測站站點(diǎn)分布圖Fig.1 The site map of meteorological stations in Guangdong Province
表1 廣東省氣象遙測站多要素逐日觀測數(shù)據(jù)結(jié)構(gòu)Tab.1 Data structures of themeteorological observation in Guangdong Province
表2 廣東省農(nóng)業(yè)氣象災(zāi)害發(fā)布數(shù)據(jù)結(jié)構(gòu)Tab.2 Data structures of public agricu lturalmeteorological disasters in Guangdong Province
1.2 挖掘流程
對氣象觀測數(shù)據(jù)采用2種方法挖掘分析,預(yù)測可能出現(xiàn)的農(nóng)業(yè)高溫災(zāi)害,并判定災(zāi)害等級,達(dá)到預(yù)測高溫災(zāi)害發(fā)生、及時預(yù)警災(zāi)害等級的效果.第1種是模糊C均值聚類法(FCM),首先從觀測數(shù)據(jù)表中提取5—7月氣象觀測逐日數(shù)據(jù)(7 913條),采用FCM算法對最高氣溫、高溫日數(shù)等關(guān)鍵屬性進(jìn)行模糊聚類,利用生成的模糊聚類中心及隸屬度矩陣確定高溫災(zāi)害等級判定標(biāo)準(zhǔn),再預(yù)測未來月份可能出現(xiàn)的高溫災(zāi)害;第2種是BP神經(jīng)網(wǎng)絡(luò)算法,對發(fā)布的氣象觀測逐日數(shù)據(jù)及同期高溫災(zāi)害歷史數(shù)據(jù)進(jìn)行學(xué)習(xí),利用訓(xùn)練后的BP神經(jīng)網(wǎng)絡(luò)預(yù)測未來月份可能出現(xiàn)的高溫災(zāi)害及其等級;最后,應(yīng)用2種方法分別對同年8月一段時間的氣象觀測逐日數(shù)據(jù)(檢驗(yàn)樣本)進(jìn)行判斷,對比分析判斷結(jié)果.農(nóng)業(yè)高溫災(zāi)害研究流程見圖2.
圖2 農(nóng)業(yè)高溫災(zāi)害預(yù)測研究流程Fig.2 Research process of agricultural high temperature disastersmonitoring
1.3 算法原理
1.3.1 FCM算法原理 將連續(xù)屬性離散化是挖掘數(shù)量型屬性關(guān)聯(lián)規(guī)則的關(guān)鍵,這里采用的FCM算法是Bezdek提出來的對數(shù)據(jù)進(jìn)行模糊聚類的方法,基本思想是找到一個隸屬矩陣(μij)k×n以及k個聚類中心c=(c1,c2,…,ck),使得給定的目標(biāo)函數(shù)最?。?0].本文采用FCM算法將數(shù)量型屬性(如逐日高溫值)劃分成若干個模糊集,模糊集能在集合元素和非集合元素之間提供平滑的變遷,較好地實(shí)現(xiàn)連續(xù)量和離散量之間的轉(zhuǎn)換,同時,在處理高偏度的數(shù)據(jù)時FCM算法能有效地體現(xiàn)出數(shù)據(jù)的實(shí)際分布情況.FCM算法的核心是計算目標(biāo)函數(shù)[21]:
FCM算法將X劃分成k類的迭代過程如下:
FCM-1,取定聚類數(shù)目k,2≤k<n,取定模糊加權(quán)系數(shù)m,m∈[1,+∞],取定迭代停止閾值ε,用值在[0,1]間的隨機(jī)數(shù)初始化隸屬矩陣μ()0,并滿足.設(shè)置迭代循環(huán)次數(shù)s=0,1,….
FCM-2,用μ=μ(s)計算k個聚類中心ci=cs
i,
FCM-3,修改μ=μ(s+1),
FCM-4,直到P Js+1P<ε1,或者P J(s+1)-JsP<ε2,ε1、ε2為預(yù)先設(shè)定的閾值,換句話說直到價值函數(shù)小于某個確定的閥值ε1,或它相對上次價值函數(shù)值的改變量小于某個閥值ε2,則算法停止.否則,返回FCM-2.
1.3.2 BP神經(jīng)網(wǎng)絡(luò)算法原理 人工神經(jīng)網(wǎng)絡(luò)是以模擬人腦神經(jīng)元的數(shù)學(xué)模型為基礎(chǔ)而建立的,它由一系列神經(jīng)元(單元)組成,單元之間彼此連接.BP神經(jīng)網(wǎng)絡(luò)是應(yīng)用最廣泛的一種網(wǎng)絡(luò),它具有多層結(jié)構(gòu),連接是前向的,采用最小均方差的糾錯學(xué)習(xí)規(guī)則.反向傳播算法包括正向傳播和反向傳播2個步驟,在正向傳播時,輸入樣本從輸入層開始逐層進(jìn)行處理,上層單元的輸出是下層單元的輸入,通過隱藏層傳向輸出層,最終得到樣本的實(shí)際輸出值,然后比較實(shí)際輸出值與期望輸出值,如果相同,那么權(quán)系數(shù)保持不變,否則進(jìn)入反向傳播過程.在反向傳播時,把輸出層的誤差從后向前逐層傳播,根據(jù)下層單元的誤差計算各隱藏層單元的誤差,并對權(quán)系數(shù)進(jìn)行修正.不斷重復(fù)這個學(xué)習(xí)過程,直到滿足終止判斷條件[23].
BP算法的過程[23-24].輸入:層數(shù)為m的神經(jīng)網(wǎng)絡(luò),其中第i層節(jié)點(diǎn)數(shù)為ni,訓(xùn)練樣本集T.輸出:經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò).
1)初始化各層的權(quán)系數(shù)和偏置.
2)輸入訓(xùn)練樣本:輸入T中的1個樣本X= (X1,X2,…,Xn1)和期望輸出Y=(Y1,Y2,…,Ynm).
3)正向傳播:從第2層開始到第m層,計算每層單元的輸出.令第k層第j個單元的輸出記為,計算公式為
其中,Wij()t為t時刻單元i與下層單元j間的權(quán)系數(shù),θj()t為t時刻單元j的偏置,為t時刻第k-1層單元i的輸出.對于輸入單元來說,輸出就等于輸入,即=Xj.4)反向傳播:從第m層開始直到第2層,計算每層單元的誤差.將第k層第j個單元的誤差記為,對于輸出層單元,誤差為
對于各隱藏層單元,誤差為
(2≤k≤m-1,1≤j≤nk).
5)修改權(quán)系數(shù)和各單元的偏置:
其中,η為學(xué)習(xí)率.
6)根據(jù)給定的結(jié)束條件判斷是否滿足.如果滿足,則算法結(jié)束,否則返回“2)”繼續(xù)執(zhí)行.
1.4 算法應(yīng)用
1.4.1 利用FCM算法建立模糊等級與模糊聚類中心 先對溫度數(shù)據(jù)表中的平均氣溫、最高氣溫和日照時數(shù)等屬性分別應(yīng)用FCM算法,利用各自生成的模糊聚類中心,將每個屬性分別聚類成5個模糊等級,即較高(vhigh)、高(high)、中(middle)、低(low)、較低(vlow).其次,增加高溫日數(shù)屬性(hot_day),即高溫持續(xù)的天數(shù)(其高溫判定標(biāo)準(zhǔn)為:當(dāng)日平均氣溫大于平均氣溫vhigh閾值,或最高氣溫大于最高氣溫vhigh閾值,該日為高溫災(zāi)害).同時利用FCM算法對高溫日數(shù)屬性進(jìn)行模糊聚類,分別為高(high)、中(middle)、低(low)、零(zero)4類.所得高溫模糊等級與模糊聚類中心見表3.
表3 高溫模糊等級與模糊聚類中心Tab.3 High temperature fuzzy levels and fuzzy cluster centers
本文利用FCM算法生成的模糊聚類中心建立高溫災(zāi)害等級判定標(biāo)準(zhǔn):根據(jù)最大隸屬度原則,當(dāng)hot_day=0時,正常等級;當(dāng)hot_day=low時,高溫輕度等級;當(dāng)hot_day=middle時,高溫中度等級;當(dāng)hot _day=high時,高溫嚴(yán)重等級.
1.4.2 利用BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練高溫災(zāi)害數(shù)據(jù) 在進(jìn)行BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練前,選取與高溫災(zāi)害密切相關(guān)的平均氣溫、最高氣溫、日照時數(shù)和高溫日數(shù)等4個影響因子作為輸入變量,期望輸出變量為當(dāng)日的高溫災(zāi)害等級.由于單獨(dú)輸出災(zāi)害等級結(jié)果在實(shí)際訓(xùn)練時會引起較大的誤差,本文采用形如布爾離散向量的輸出形式,如以[0,0,0,1]表示正常、無災(zāi)害,[0,0,1,0]表示災(zāi)害輕度等級,[0,1,0,0]表示災(zāi)害中度等級,[1,0,0,0]表示災(zāi)害嚴(yán)重等級,可以大大提高網(wǎng)絡(luò)模型的通用性和精度.
從廣東省氣象局發(fā)布的2011年逐日災(zāi)害數(shù)據(jù)中提取7月27日至8月9日的86個站點(diǎn)逐日高溫災(zāi)害數(shù)據(jù)(1 204條)建立高溫災(zāi)害表,并作為訓(xùn)練樣本.在MATLAB環(huán)境下建立BP神經(jīng)網(wǎng)絡(luò)模型,選擇訓(xùn)練函數(shù)trainlm(),它采用了 Levenberg-Marquardt算法,避免了直接計算赫賽矩陣,從而減少了訓(xùn)練中的計算量和內(nèi)存需求量,使對于中等規(guī)模的 BP神經(jīng)網(wǎng)絡(luò)具有最快的收斂速度,而且很好地利用了MATLAB對矩陣運(yùn)算的優(yōu)勢[25].輸入、輸出變量均由4個神經(jīng)元組成,根據(jù)隱藏層神經(jīng)元節(jié)點(diǎn)數(shù)的滿足條件,隱藏層神經(jīng)元應(yīng)該在2~12個,通過比較運(yùn)行結(jié)果,選出較合適的神經(jīng)元數(shù)為12,即網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為4-12-4.BP神經(jīng)網(wǎng)絡(luò)模型主要參數(shù):適應(yīng)性學(xué)習(xí)函數(shù)為LEARNGDM,性能函數(shù)為MSE,隱藏層傳遞函數(shù)為TANSIG,輸出層傳遞函數(shù)為LOGSIG;訓(xùn)練最大循環(huán)次數(shù)1 000次,最大驗(yàn)證數(shù)據(jù)失敗的次數(shù)6次,動量的初始值為0.001,動量減少系數(shù)為0.1,動量增加系數(shù)10,動量最大值為1014;性能目標(biāo)為0,最小性能梯度為10-20.
上述模型參數(shù)經(jīng)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練后所得的輸出變量與實(shí)際目標(biāo)輸出變量的絕對誤差較小,輸出變量的結(jié)構(gòu)因采用[0,0,0,1](正常無災(zāi)害)/[0,0,1,0](輕度等級)/[0,1,0,0](中度等級)/[1,0,0,0](嚴(yán)重等級)的輸出形式,其分類結(jié)果直觀、精確度高且易于識別,所判定的高溫災(zāi)害等級與實(shí)際災(zāi)害發(fā)布等級一致.綜上所述,網(wǎng)絡(luò)具有非常好的性能,能揭示災(zāi)害判定的內(nèi)在規(guī)則,可以根據(jù)氣象觀測數(shù)據(jù)準(zhǔn)確地預(yù)測并判定災(zāi)害的等級.
以2011年8月23日全省86個氣象遙測站氣溫數(shù)據(jù)作為輸入,對上述訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行農(nóng)業(yè)高溫災(zāi)害預(yù)測,所得各氣象站點(diǎn)的判定結(jié)果與廣東省氣象局發(fā)布的災(zāi)害等級進(jìn)行對比驗(yàn)證,結(jié)果(表4)顯示,各站點(diǎn)的預(yù)測等級與發(fā)布結(jié)果完全一致,預(yù)
測總誤差接近0,表明經(jīng)訓(xùn)練后的BP神經(jīng)網(wǎng)絡(luò)可以準(zhǔn)確地預(yù)測廣東省農(nóng)業(yè)高溫災(zāi)害、并判定其等級.可見,BP神經(jīng)網(wǎng)絡(luò)算法相對比較精確,適用于有歷史氣象觀測數(shù)據(jù)以及同期的災(zāi)害數(shù)據(jù)的情況,通過對歷史數(shù)據(jù)訓(xùn)練有效的神經(jīng)網(wǎng)絡(luò),參照新觀測的數(shù)據(jù)可以預(yù)測未來可能存在的災(zāi)害及其等級.若災(zāi)害判定有明確的規(guī)則(未公開),訓(xùn)練的神經(jīng)網(wǎng)絡(luò)可以精準(zhǔn)地揭示這個規(guī)則,預(yù)測結(jié)果非常準(zhǔn)確(即與實(shí)際發(fā)布結(jié)果一致).
表4 各站點(diǎn)神經(jīng)網(wǎng)絡(luò)方法預(yù)測災(zāi)害等級與實(shí)際發(fā)布結(jié)果對比1)Tab.4 The com parison between public disaster level and predicted result based on neural network at every meteorological station
采用模糊聚類方法建立高溫災(zāi)害等級判定標(biāo)準(zhǔn),對2011年8月23日氣溫數(shù)據(jù)進(jìn)行災(zāi)害等級判定.根據(jù)最大隸屬度原則,同一個站點(diǎn)在3種災(zāi)害等級及正常等級中取隸屬度最大者為該站該日高溫災(zāi)害等級.由于神經(jīng)網(wǎng)絡(luò)方法預(yù)測的結(jié)果與實(shí)際發(fā)布結(jié)果完全一致,所以將模糊聚類方法的結(jié)果與神經(jīng)網(wǎng)絡(luò)方法結(jié)果進(jìn)行對比.廣東省范圍內(nèi)高溫災(zāi)害不同等級的站點(diǎn)數(shù)目的對比結(jié)果見圖3.由圖3可見,模糊聚類方法判定的結(jié)果與神經(jīng)網(wǎng)絡(luò)方法判定結(jié)果(即官方發(fā)布結(jié)果)略有差異,重度和中度災(zāi)害等級的站點(diǎn)數(shù)偏高,這是模糊聚類生成的聚類中心較神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的災(zāi)害等級閾值略小,所以判定的中度等級以上受災(zāi)站點(diǎn)數(shù)略高.
圖3 2種方法各災(zāi)害等級的站點(diǎn)數(shù)對比Fig.3 A comparison of station counts between different disaster levels based on fuzzy clustering and neural network
可見,模糊聚類方法相對比較粗略,適用于僅有氣象觀測數(shù)據(jù)、無同期災(zāi)害歷史數(shù)據(jù)的情況,先根據(jù)氣象觀測數(shù)據(jù)計算出模糊聚類中心即災(zāi)害等級的閾值,再根據(jù)閾值預(yù)測可能存在的災(zāi)害及其等級,其精度依賴于觀測數(shù)據(jù),觀測數(shù)據(jù)的極值、中值及其比例會影響模糊聚類找到的閾值.為了進(jìn)一步說明2種方法對同一站點(diǎn)災(zāi)害等級判定的差異,將2種方法挖掘得到的各站點(diǎn)及其高溫災(zāi)害等級分別進(jìn)行空間插值得到農(nóng)業(yè)高溫災(zāi)害分布圖(圖4),圖4直觀地對比分析高溫災(zāi)害等級有差異的站點(diǎn)及其分布,更便于不同區(qū)域結(jié)合不同作物及時采用相應(yīng)的預(yù)防措施.
圖4 神經(jīng)網(wǎng)絡(luò)和模糊聚類高溫災(zāi)害分布圖Fig.4 The sitemap of fuzzy clustering high temperature disaster map
本文應(yīng)用模糊聚類算法(FCM)和BP神經(jīng)網(wǎng)絡(luò)算法,對廣東省氣象觀測數(shù)據(jù)挖掘分析可能存在的農(nóng)業(yè)高溫災(zāi)害并判定其等級,結(jié)果表明2種方法均可預(yù)測農(nóng)業(yè)高溫災(zāi)害,類似地可以推廣到其他農(nóng)業(yè)氣象災(zāi)害預(yù)測.模糊聚類算法(FCM)可在缺乏災(zāi)害判定規(guī)則和歷史災(zāi)害等級等先驗(yàn)知識的條件下,基于長期氣象觀測資料得出關(guān)鍵屬性的聚類中心和隸屬度矩陣,根據(jù)最大隸屬度原則,將連續(xù)屬性離散化為模糊屬性,在此基礎(chǔ)上建立災(zāi)害等級判定規(guī)則,進(jìn)而通過氣象觀測數(shù)據(jù)預(yù)測可能即將發(fā)生的農(nóng)業(yè)氣象災(zāi)害及其等級.BP神經(jīng)網(wǎng)絡(luò)算法在缺乏災(zāi)害判定規(guī)則情況下,可對氣象觀測歷史數(shù)據(jù)及同期發(fā)布的災(zāi)害等級數(shù)據(jù)進(jìn)行學(xué)習(xí),訓(xùn)練后的網(wǎng)絡(luò)模型可以更準(zhǔn)確地揭示內(nèi)在的災(zāi)害發(fā)生規(guī)律,并通過氣象觀測數(shù)據(jù)精確地預(yù)測可能發(fā)生的農(nóng)業(yè)氣象災(zāi)害及其等級.神經(jīng)網(wǎng)絡(luò)和模糊聚類2種數(shù)據(jù)挖掘方法在缺乏先驗(yàn)知識的條件下,均可以通過氣象觀測數(shù)據(jù)準(zhǔn)確地預(yù)測農(nóng)業(yè)氣象災(zāi)害,結(jié)果對比表明,前者預(yù)測氣象站點(diǎn)災(zāi)害等級的精度略優(yōu)于后者.
[1] 李祎君,王春乙,趙蓓,等.氣候變化對中國農(nóng)業(yè)氣象災(zāi)害與病蟲害的影響[J].農(nóng)業(yè)工程學(xué)報,2010,26 (S1):263-271.
[2] 婁偉平,諸曉明,周鎖銓,等.紹興市農(nóng)業(yè)生態(tài)和農(nóng)業(yè)氣象災(zāi)害監(jiān)測預(yù)警系統(tǒng)[J].農(nóng)業(yè)工程學(xué)報,2007,23 (12):182-186.
[3] 陽園燕,何永坤,羅孳孳,等.三峽庫區(qū)水稻高溫?zé)岷ΡO(jiān)測預(yù)警技術(shù)研究[J].西南農(nóng)業(yè)學(xué)報,2013,26(3): 1249-1254.
[4] 夏于,杜克明,孫忠富,等.基于物聯(lián)網(wǎng)的小麥氣象災(zāi)害監(jiān)控診斷系統(tǒng)應(yīng)用研究[J].中國農(nóng)學(xué)通報,2013,29(23):129-134.
[5] 王長委,胡月明,謝健文,等.基于WebGIS的廣東省農(nóng)作物生物災(zāi)害動態(tài)監(jiān)測系統(tǒng)的研制[J].華南農(nóng)業(yè)大學(xué)學(xué)報,2008,29(4):104-107.
[6] 莫建飛,鐘仕全,陳燕麗,等.廣西主要農(nóng)業(yè)氣象災(zāi)害監(jiān)測預(yù)警系統(tǒng)的開發(fā)與應(yīng)用[J].自然災(zāi)害學(xué)報,2013,22(2):150-157.
[7] SHI J,CUI L L.Characteristics of high impact weather and meteorological disaster in Shanghai,China[J].Natural Hazards,2012,60(3):951-969.
[8] TAO F L,ZHANG S,ZHANG Z.Changes in rice disasters across China in recent decades and themeteorological and agronomic causes[J].Regional Environ Change,2013,13(4):743-759.
[9] 劉亞彬,劉黎明,許迪,等.基于信息擴(kuò)散理論的中國糧食主產(chǎn)區(qū)水旱災(zāi)害風(fēng)險評估[J].農(nóng)業(yè)工程學(xué)報,2010,26(8):1-7.
[10] 李明陽,劉方,徐婷,等.基于GIS的森林資源空間數(shù)據(jù)挖掘方法研究:以紫金山為例[J].西北林學(xué)院學(xué)報,2012,27(3):180-186.
[11]WU JJ,ZHOU L,LIU M,et al.Establishing and assessing the integrated surface drought index(ISDI)for agricultural droughtmonitoring inmid-eastern China[J].Int J Appl Earth Observa and Geoinforma,2013,23:397-410.
[12]BARTOK J,HABALA O,BEDNAR P,et al.Datamining and integration for predicting dignificantmeteorological phenomena[J].Proceedia Comput Sci,2010,1(1):37-46.
[13]PETERS JF,SURAJZ,SHAN S,et al.Classification of meteorological volumetric radar data using rough setmethods[J].Pattern Recognition Letters,2003,24(6):911-920.
[14]吳正龍,熊范綸,滕明貴.基于模糊聚類的模糊關(guān)聯(lián)規(guī)則挖掘[J].小型微型計算機(jī)系統(tǒng),2004,25(7):1295-1297.
[15]仝凌云,潘佳,刁鑫.一種用于機(jī)場氣象預(yù)測的模糊神經(jīng)網(wǎng)絡(luò)模型[J].計算機(jī)工程,2008,34(15):185-186.
[16]董全,黃小玉,宗志平.人工神經(jīng)網(wǎng)絡(luò)法和線性回歸法對降水相態(tài)的預(yù)報效果對比[J].氣象,2013,39(3): 324-332.
[17]余運(yùn)河,胡邦輝,孔玉壽,等.RLS-BP人工神經(jīng)網(wǎng)絡(luò)算法在降水預(yù)報中的應(yīng)用[J].氣象科學(xué),2004,24(3): 333-341.
[18]曲培青,施潤和,劉剋,等.基于遙感和BP人工神經(jīng)網(wǎng)絡(luò)的城鄉(xiāng)氣象站點(diǎn)劃分分析[J].地球信息科學(xué)學(xué)報,2010,12(5):726-732.
[19]黃子洋,李毅,高太長.一種基于神經(jīng)網(wǎng)絡(luò)的氣象要素插值方法與分析[J].解放軍理工大學(xué)學(xué)報:自然科學(xué)版,2008,9(4):404-408.
[20]陸建江,張亞非,宋自林.模糊關(guān)聯(lián)規(guī)則的研究與應(yīng)用[M].北京:科學(xué)出版社,2008:28-40.
[21]呂志軍,王照飛,謝福鼎,等.基于FCM聚類的時間序列模糊關(guān)聯(lián)規(guī)則挖掘[J].大連理工大學(xué)學(xué)報,2010,50(5):806-810.
[22]范春年,傅德勝.用神經(jīng)網(wǎng)絡(luò)方法進(jìn)行氣象溫度預(yù)測[J].計算機(jī)應(yīng)用與軟件,2004(3):108-110.
[23]陳安,陳寧,周龍驤,等.數(shù)據(jù)挖掘技術(shù)及應(yīng)用[M].北京:科學(xué)出版社,2006:139-146.
[24]張迎春,肖冬榮,趙遠(yuǎn)東.基于時間序列神經(jīng)網(wǎng)絡(luò)的氣象預(yù)測研究[J].武漢理工大學(xué)學(xué)報:交通科學(xué)與工程版,2003,27(2):237-240.
[25]高丹,遲道才,王鐵良.基于MATLAB神經(jīng)網(wǎng)絡(luò)的水稻需水量的預(yù)報模型[J].沈陽農(nóng)業(yè)大學(xué)學(xué)報,2005,36 (5):599-602.
【責(zé)任編輯 柴 焰】
Agricultural high tem perature disaster monitoring based on meteorological data m ining in Guangdong Province
WANG Danni1,2,BAO Shitai1,WANG Chunlin3,TANG Lisheng3
(1 College of Informatics,South China Agricultural University,Guangzhou 510642,China; 2 Xinhua College of Sun Yat-Sen University,Guangzhou 510520,China; 3 Climate and Agro-meteorological Center of Guangdong Province,Guangzhou 510680,China)
【Objective】To forecast agrometeorological disasters and their levels as an example of high temperature disaster in Guangdong Province.【Method】Due to lack of disaster decision rule and historical disaster level data,high temperature disaster level rules were built using fuzzy clustering algorithm (FCM)based on themeteorological data in the long term.Those rules were concluded from the cluster centers of the key attribute and membership degreematrix according to themaximum membership degree principle.Based on these rules,possible disasters and their levels were predicted by dynamic meteorological data.The back propagation network algorithm(BP)in the absence of disa-ster decision ruleswas applied to study historicalmeteorological observation data and synchronous disaster level released by the meteorological bureau.The trained BP network modelswere accurate to discover the inner rules of disasters,so the BP network models were fit for predicting the possible disasters and their level through dynamic observation of data atmanymeteorological stations.【Result and conclusion】Comparing the results of the twomethods of datamining,the neural network is found slightly better than the fuzzy cluste-ring to predict themeteorological disaster level.
fuzzy clustering;BP neural network;datamining;high temperature disaster;disaster forecasting
S166
A
1001-411X(2015)02-0106-07
王丹妮,包世泰,王春林,等.基于氣象數(shù)據(jù)挖掘的廣東省農(nóng)業(yè)高溫災(zāi)害預(yù)測研究[J].華南農(nóng)業(yè)大學(xué)學(xué)報,2015,36(2):106-112.
2014-08-14 優(yōu)先出版時間:2015-01-21
優(yōu)先出版網(wǎng)址:http://www.cnki.net/kcms/detail/44.1110.s.20150121.0939.013.html
王丹妮(1988—),女,碩士,E-mail:mochen_nini@foxmail.com;通信作者:包世泰(1977—),男,副教授,博士,E-mail:bst100@scau.edu.cn
廣東省科技計劃項(xiàng)目(2011B020313016)