戴月真,徐海峰,朱增強(qiáng),王金星,王冉冉
(1.山東農(nóng)業(yè)大學(xué),山東 泰安271018;2.煙臺(tái)工程職業(yè)技術(shù)學(xué)院,山東 煙臺(tái)264000;3.泰山管委櫻桃園管理區(qū),山東 泰安271000)
土壤是不均一和變化的時(shí)空連續(xù)體,即使在土壤質(zhì)地相同的區(qū)域內(nèi),土壤特性在不同空間位置上也有明顯差異[1]。精細(xì)農(nóng)業(yè)就是在認(rèn)識(shí)環(huán)境中不同時(shí)間不同區(qū)域土壤肥力等因素的空間差異下,根據(jù)其空間差異性調(diào)整化肥等的使用,以達(dá)到減少投入、增加產(chǎn)量、提高農(nóng)資利用率的目的[2]。其中土壤信息采集是重要前提,要求采集到的樣品能夠比較準(zhǔn)確的反映果園土壤的情況,如果規(guī)模布設(shè)較大則采樣成本過高,布設(shè)較少不足以反應(yīng)果園土壤的信息。所以怎樣合理部署傳感器采樣點(diǎn)是精準(zhǔn)農(nóng)業(yè)研究的重要內(nèi)容之一。目前國內(nèi)常用的采樣點(diǎn)部署方法主要有簡(jiǎn)單隨機(jī)采樣、網(wǎng)格采樣、Cochran方法,最適分配法、地統(tǒng)計(jì)學(xué)方法等。盛建東等[3]以三種取樣間距進(jìn)行網(wǎng)格取樣,研究不同取樣間距對(duì)合理取樣數(shù)量的影響;姜城等[4]等研究發(fā)現(xiàn)分層采樣可以有效降低采樣數(shù)量,且最適分配法可以獲得理想的采樣數(shù)量,且可根據(jù)情況調(diào)節(jié)局部的采樣點(diǎn)密度提高采樣精度;薛正平等[5]利用地統(tǒng)計(jì)學(xué)的方法對(duì)上海精準(zhǔn)農(nóng)業(yè)示范基地進(jìn)行取樣數(shù)量分析;陳天恩[6]等研究了縣域范圍農(nóng)田土壤養(yǎng)分統(tǒng)一采樣規(guī)劃問題。但這些方法均是確定在一定范圍內(nèi)的傳感器的部署密度,對(duì)傳感器的具體部署研究較少。而采樣點(diǎn)的部署位置對(duì)采樣有著重要的作用。在采樣點(diǎn)數(shù)目相同的情況下,布局方式不同,每一樣點(diǎn)能表征空間變異性的范圍和效率不同[7]。王蒙[8]等研究果園土壤不同位置養(yǎng)分與葉片營養(yǎng)的關(guān)系發(fā)現(xiàn)在距樹干75 cm處,20~30 cm土層為果園最佳采樣區(qū)域。所以如何在整個(gè)果園中保證精度的情況下精確部署傳感器成為傳感器優(yōu)化布局的關(guān)鍵。本文研究一種傳感器的位置部署方法,通過Cochran采樣與MATLAB反聚類方法確定果園內(nèi)采樣點(diǎn)數(shù)量以及具體部署,以達(dá)到精度的要求,節(jié)約成本。
Cochran[9]對(duì)于區(qū)域隨機(jī)取樣的最佳取樣數(shù)量為:
式中λ為在置信度為α、自由度為f的t分布,f=采樣數(shù)-1,Δ為采樣精度,σ為總體標(biāo)準(zhǔn)差。
如果考慮到取樣精度的要求,通常Δ=kE(式中k為相對(duì)誤差,E為總體均值),當(dāng)總體方差未知時(shí),可以用樣本標(biāo)準(zhǔn)差差s代替總體標(biāo)準(zhǔn)差σ,當(dāng)總體樣本均值未知時(shí),可以用樣本均值U代替總體均值E,即 Δ =ku,s= σ =CvE,則(1)可改寫為:
其中相對(duì)誤差k的確定方法如下:
合理相對(duì)誤差根據(jù)土壤養(yǎng)分評(píng)價(jià)標(biāo)準(zhǔn)臨界值水平和實(shí)際平均濃度確定[10]。
土壤養(yǎng)分分級(jí)標(biāo)準(zhǔn)采用全國第二次土壤普查分類標(biāo)準(zhǔn)如表1.
表1 全國第二次土壤普查分類標(biāo)準(zhǔn)
如果果園土壤養(yǎng)分含量分在5%、10%、15%誤差范圍內(nèi),對(duì)平均值的估測(cè)值都在養(yǎng)分等級(jí)指標(biāo)的同一范圍內(nèi),則應(yīng)該選取誤差范圍最大的情況;如果土壤養(yǎng)分含量在5%、10%、15%的誤差范圍內(nèi)跨越多個(gè)養(yǎng)分等級(jí),說明有一部分?jǐn)?shù)值因誤差存在會(huì)出現(xiàn)在下一個(gè)等級(jí)中,則應(yīng)該選取同一個(gè)精度較高的,在誤差范圍盡可能小的情況。
聚類分析是指按照事物的某些屬性將其聚集成類,使類間相似性盡量小,類內(nèi)相似性盡量大[11],它的目的是使得屬于同一組的樣本之間彼此相似。那么如果將果園無限分為n個(gè)類別即n個(gè)區(qū)域,每個(gè)區(qū)域相差很小,則每個(gè)區(qū)域可以用一個(gè)傳感器來監(jiān)測(cè),換言之如果一個(gè)區(qū)域可以用一個(gè)傳感器來監(jiān)測(cè),則這個(gè)區(qū)域可以看做是一類,即當(dāng)n=1(公式2)時(shí),一個(gè)傳感器可以監(jiān)測(cè)果園的一部分區(qū)域,基于此設(shè)計(jì)以下算法:
(1)將果園分別以兩個(gè)垂直方向?yàn)閤軸y軸建立直角坐標(biāo)系并將采樣點(diǎn)進(jìn)行坐標(biāo)編碼(初始采樣點(diǎn)應(yīng)盡可能遍布在整個(gè)果園,使數(shù)據(jù)更全面準(zhǔn)確)。選擇果園養(yǎng)分變異性最大的養(yǎng)分的采集數(shù)據(jù)為基礎(chǔ)。
(2)初始化并讀入數(shù)據(jù)。首先以采樣點(diǎn)中的第1個(gè)點(diǎn)為中心點(diǎn),分別計(jì)算其余點(diǎn)與其的距離,選出距離大于0的最短的點(diǎn),通過Cochran公式當(dāng)n=1時(shí),計(jì)算出這兩個(gè)點(diǎn)的養(yǎng)分含量的理論變異系數(shù),如果實(shí)際變異系數(shù)值小于理論值,將該點(diǎn)附屬類別,并判斷是否所有樣本點(diǎn)均附屬類別,若為否,則繼續(xù)尋找距離次短的點(diǎn),再次比較這三個(gè)點(diǎn)的變異系數(shù)理論值和實(shí)際值的大小,如果實(shí)際變異系數(shù)值小于理論值,則繼續(xù)尋找距離更短的點(diǎn),逐漸擴(kuò)大范圍。
(3)如果實(shí)際變異系數(shù)值大于理論值,則傳感器數(shù)量加一,停止尋找,那么這個(gè)點(diǎn)為第一個(gè)區(qū)域的中心點(diǎn),即第一個(gè)傳感器部署位置。再以最后的一個(gè)不符合點(diǎn)為起點(diǎn),分別計(jì)算其余沒有附屬類別點(diǎn)與該點(diǎn)的距離,同步驟(2)。當(dāng)所有點(diǎn)均有附屬區(qū)域,則循環(huán)結(jié)束。記錄需要的傳感器數(shù)量。
(4)再分別以采樣點(diǎn)的第2個(gè)、第3個(gè)點(diǎn)......第n個(gè)點(diǎn)為中心重復(fù)以上三步,直到每個(gè)點(diǎn)均作為中心點(diǎn)循環(huán)一遍后,選出布置傳感器最少的方案。
(5)輸出傳感器的部署位置,并在MATLAB中可視化。
MATLAB流程圖如圖1所示。
圖1 MATLAB程序流程圖
實(shí)驗(yàn)點(diǎn)設(shè)在煙臺(tái)市萊山鎮(zhèn)蘋果園內(nèi),果樹東西株距為4 m,南北株距為3 m,果園的面積為1 944 m2,地勢(shì)比較平坦,園內(nèi)東部坡度為3°,果園土壤類型為壤土。將取樣點(diǎn)設(shè)在每棵果樹根部附近,取樣點(diǎn)包括9行18列,其中南北方向每隔3 m取樣,每列共9個(gè);東西方向每隔4 m取樣,每行共取樣18個(gè)樣點(diǎn)。整個(gè)果園共取樣162個(gè)取樣點(diǎn)。
對(duì)實(shí)驗(yàn)果園得到的土壤樣本進(jìn)行分析,結(jié)果見表2.
表2 果園土壤養(yǎng)分特征值
(1)均值單位為mg/kg.Average unit is mg/kg.
(2)其中區(qū)域A為西部平地,區(qū)域B為東部坡地。
從表1可以看出,果園東部坡地養(yǎng)分變異程度較西部平地大,從變異系數(shù)上看,由于研究區(qū)的10% 2.2.1 反聚類最優(yōu)布局法 從表2可以看出,P元素的變異系數(shù)最大達(dá)到92%,則以變異系數(shù)最大的P元素的數(shù)據(jù)為基礎(chǔ)數(shù)據(jù)。以果園的南邊界和西邊界為x軸和y軸,橫坐標(biāo)間隔值為4,縱坐標(biāo)間隔值為3,則每棵樹為一個(gè)坐標(biāo)交點(diǎn),將采樣得到的162個(gè)點(diǎn)分布在坐標(biāo)軸上如圖2所示(其中“*”代表緩坡上樣點(diǎn),“+”代表平地上樣點(diǎn))。 圖2 果園初始采樣位置坐標(biāo)分布圖 由于P的均值為22.64 mg/kg,根據(jù)相對(duì)誤差確定方法,相對(duì)誤差取10%.采用公式(2),則當(dāng)n=1時(shí),Cv=(k/λα,f)2,分別以162個(gè)點(diǎn)為起點(diǎn)進(jìn)行運(yùn)算。 最優(yōu)解是以(24,12)即第24列第12行的果樹為起始傳感器部署中心得到傳感器數(shù)量最少為27個(gè),分布位置如圖3所示。 圖3 果園傳感器優(yōu)化布局分布圖 土壤養(yǎng)分變異越大,為了達(dá)到所要求精度所需要的傳感器數(shù)量也會(huì)增加。秦松[12]等研究表明土壤養(yǎng)分與地形地貌在一定程度上有很強(qiáng)的相關(guān)性。果園東部坡地土壤養(yǎng)分變異系數(shù)較大,西部平坦地區(qū)土壤養(yǎng)分變異系數(shù)較小,從圖中可以看出在西部地區(qū)傳感器分布較為稀疏,而在東部傳感器部署較密集。2.2.2 Cochran采樣法 由于Cochran公式方法將土壤作為一個(gè)均質(zhì)整體,而果園整體變異系數(shù)較大,那么按照地形將果園分為兩大區(qū)域A和B,則對(duì)于每一個(gè)區(qū)域土壤相對(duì)均勻,對(duì)區(qū)域A、B分別運(yùn)用Cochran公式設(shè)計(jì)采樣。對(duì)于區(qū)域A可以求得在95%的置信區(qū)間和一定相對(duì)誤差要P元素需要32個(gè)取樣點(diǎn),K元素次之,需要11個(gè),由于N元素最小為4個(gè),所以按各養(yǎng)分標(biāo)準(zhǔn)差加權(quán)平均得到綜合采樣數(shù)為14個(gè)。而對(duì)于區(qū)域B,在95%的置信區(qū)間下P元素需要141個(gè),N元素次之需要22個(gè),K元素最小為18個(gè),則所以按各養(yǎng)分標(biāo)準(zhǔn)差加權(quán)平均得到綜合采樣數(shù)為43個(gè),所以整個(gè)果園所需要的采樣數(shù)為57個(gè)。 在MATLAB R2016a環(huán)境下采用DACE-A MATLAB Kriging Toolbox V2.0,選用球狀半方差模型作為半變異函數(shù)擬合函數(shù),以上述兩種方法所得樣本為擬合數(shù)據(jù),使用普通克里金插值估計(jì)法進(jìn)行預(yù)測(cè),選擇3個(gè)評(píng)價(jià)指標(biāo):平均絕對(duì)誤差(MAE),均方根誤差(RMSE),一致性系數(shù)(AC)對(duì)不同的采樣布局進(jìn)行精度分析評(píng)價(jià)標(biāo)準(zhǔn)。從統(tǒng)計(jì)學(xué)角度來說MAE、RMSE的均值越小,準(zhǔn)確性越高;AC取值范圍為0到1,預(yù)測(cè)值與觀測(cè)值越趨于一致,AC值越接近1,反之,預(yù)測(cè)值與觀測(cè)值約不同,AC值越接近于0[13]。其中AC的計(jì)算方法如下: 式中:n是樣本數(shù);PE為可能的誤差變化,Pi為預(yù)測(cè)值,Oi為觀測(cè)值,是觀測(cè)值的平均值。 對(duì)研究區(qū)采用MATLAB反聚類方法以及經(jīng)典Cochran方法進(jìn)行評(píng)價(jià),結(jié)果如表3所示。 表3 精度評(píng)價(jià)指標(biāo)結(jié)果表 從表中可以看出反聚類方法無論在RMSE還是MAE上,均較Cochran小,精度有所改善,在AC指標(biāo)上,反聚類法值為0.68更接近1,即預(yù)測(cè)值與實(shí)際值更接近。可以看出,運(yùn)用反聚類方法對(duì)土壤的描述精度更好。綜上所述,本文方法在一定采樣點(diǎn)數(shù)量下,對(duì)土壤描述精度更高。 準(zhǔn)確確定土壤采樣傳感器部署位置,本文以Cochran方法和反聚類分析方法為基礎(chǔ)提出一種兼顧精確度和數(shù)量的傳感器布局方法,并以煙臺(tái)市萊山鎮(zhèn)蘋果園為研究區(qū)設(shè)計(jì)了傳感器部署方案,結(jié)果表明: (1)利用本方法,在保證精度的前提下,計(jì)算出了每個(gè)傳感器的位置,且數(shù)量較常規(guī)的均勻分布法要少,在本實(shí)驗(yàn)條件下,蘋果園的最佳部署傳感器數(shù)量為27個(gè)。 (2)不同地形區(qū)域土壤養(yǎng)分變異系數(shù)相差較大時(shí),養(yǎng)分之間差異也較大,單純利用Cochran公式方法的取樣數(shù)量有一定的不足,利用本文的反聚類算法對(duì)土壤養(yǎng)分分布,具有更高精度的描述。 (3)本文中實(shí)驗(yàn)果園較小,初始將每棵果樹均進(jìn)行采樣,而對(duì)于更大面積的土壤檢測(cè),可利用有限元?jiǎng)澐志W(wǎng)格的方法,則傳感器部署位置為所在網(wǎng)格的中心,再利用本文算法確定傳感器部署位置。2.3 效果評(píng)價(jià)
3 結(jié)論