王子龍, 陳偉杰, 付 強(qiáng), 姜秋香, 常廣義, 胡石濤
(東北農(nóng)業(yè)大學(xué) 水利與土木工程學(xué)院, 黑龍江 哈爾濱 150030)
土壤優(yōu)化采樣策略研究進(jìn)展
王子龍, 陳偉杰, 付 強(qiáng), 姜秋香, 常廣義, 胡石濤
(東北農(nóng)業(yè)大學(xué) 水利與土木工程學(xué)院, 黑龍江 哈爾濱 150030)
[目的] 對(duì)現(xiàn)有的采樣方式進(jìn)行系統(tǒng)地總結(jié)歸納,并探尋一種優(yōu)化的采樣策略,對(duì)采樣強(qiáng)度、分析成本及其研究精度三方面進(jìn)行均衡,即以最小的經(jīng)濟(jì)投入換取最大化的試驗(yàn)精度。[方法] 廣泛查閱近幾年國(guó)內(nèi)外的相關(guān)文獻(xiàn),對(duì)土壤優(yōu)化采樣策略的設(shè)定進(jìn)行了系統(tǒng)的總結(jié)。將優(yōu)化采樣策略的理論分為合理采樣數(shù)和樣點(diǎn)布設(shè)兩方面,就此分別介紹確定采樣數(shù)的3種方法和確定樣點(diǎn)布設(shè)的4種方式,詳細(xì)介紹其發(fā)展現(xiàn)狀,并對(duì)該領(lǐng)域今后的研究進(jìn)行展望。[結(jié)果] 目前的優(yōu)化采樣法大多基于模型來(lái)優(yōu)化采樣設(shè)計(jì)的研究,其初步采樣的方式忽略了空間相關(guān)性所導(dǎo)致的信息損失,必然在一定程度上造成試驗(yàn)結(jié)果的偏差和人力物力的浪費(fèi)。而且,研究尺度多集中在縣級(jí)以下,沒(méi)有對(duì)采樣方案的設(shè)計(jì)確立統(tǒng)一的評(píng)價(jià)體系和標(biāo)準(zhǔn)。[結(jié)論] 未來(lái)優(yōu)化采樣設(shè)計(jì)在樣點(diǎn)優(yōu)先級(jí)方面還應(yīng)進(jìn)行更加深入的研究。
土壤特性; 采樣策略; 經(jīng)典抽樣; 地統(tǒng)計(jì)學(xué); 采樣優(yōu)先級(jí); 空間采樣
研究土壤特性、分析其變異性必須以科學(xué)的采樣策略為依托。抽樣策略的本質(zhì)即尋求達(dá)到經(jīng)濟(jì)投入與試驗(yàn)精度間的優(yōu)化平衡,以最小的經(jīng)濟(jì)投入所換取的離散樣本集來(lái)估測(cè)連續(xù)總體集的主要信息而不失其精確性[1]。建立集代表性、準(zhǔn)確性和經(jīng)濟(jì)適用性為一體的土壤采樣策略不但影響著研究工作的效率,而且也是其研究成敗的關(guān)鍵。采樣策略一般建立在統(tǒng)計(jì)非全面調(diào)查的基礎(chǔ)上,根據(jù)實(shí)際工作所研究對(duì)象的性質(zhì)和相關(guān)工作的目的而采用與其相適用的方法。各種采樣策略會(huì)形成各異的采樣結(jié)果,由此產(chǎn)生的抽樣誤差也有較大的差別[2]。相對(duì)于實(shí)驗(yàn)室分析誤差而言,不科學(xué)的采樣策略帶來(lái)的誤差影響更為顯著[3],因此,對(duì)于土壤采樣策略的選定及其代表性的研究是土壤特性研究的立論之本。
在傳統(tǒng)抽樣中,只考慮抽樣對(duì)象的不同(通常賦予其編號(hào)),而抽樣對(duì)象的排列組合不影響抽樣結(jié)果。但在空間抽樣中,加入了采樣對(duì)象空間位置這一因素,與其屬性值共同參與到空間采樣中來(lái),并對(duì)最終的結(jié)果產(chǎn)生極大的影響。在空間抽樣中,抽樣方法大致劃分為:基于設(shè)計(jì)的抽樣方法和基于模型的抽樣方法。目前,已有國(guó)內(nèi)外學(xué)者均對(duì)其間的本質(zhì)區(qū)別進(jìn)行了系統(tǒng)的討論[4-6]。
在設(shè)計(jì)采樣方案中,為使有限的樣本值能夠盡可能精確地代表總體樣本的期望值,采樣數(shù)應(yīng)當(dāng)達(dá)到一定的數(shù)量,即合理采樣數(shù)。合理采樣數(shù)是一個(gè)非常重要的因素,它不但決定了采樣調(diào)查過(guò)程的效率和耗費(fèi),而且也極大程度上影響著采樣結(jié)果的準(zhǔn)確性。
在估計(jì)研究區(qū)樣本容量時(shí),首先要對(duì)其標(biāo)準(zhǔn)差做出估計(jì),同時(shí),還應(yīng)提出預(yù)定的準(zhǔn)確度和置信系數(shù)的要求,然后據(jù)以下幾種方式來(lái)確定樣本容量。一般而言,標(biāo)準(zhǔn)差和準(zhǔn)確度可由過(guò)去的相關(guān)資料來(lái)估計(jì),但僅有部分地域范圍內(nèi)的采樣數(shù)據(jù),也可以通過(guò)少量小樣本的平均極差來(lái)估算標(biāo)準(zhǔn)差σ。
(1)
1.1 Cochran采樣數(shù)法
當(dāng)采樣相互獨(dú)立且采樣數(shù)目足夠多時(shí),可以認(rèn)為中心極限定理成立[7]。普遍使用的是Cochran[8]應(yīng)用于區(qū)域純隨機(jī)采樣而提出滿足t分布的最佳采樣數(shù)量計(jì)算公式,在一定置信區(qū)間和相對(duì)誤差的條件下,求得相應(yīng)的采樣數(shù)。Cochran公式如下:
(2)
式中:n——采樣數(shù);λα,f——t分布特征值;α——顯著水平,α通常設(shè)為90%,95%;f——自由度,f=N-1,N——研究區(qū)總樣本容量;Δ——采樣精度,通常按Δ=kμ;μ——總體樣本均值,取k=5%,10%,15%等,其中相對(duì)相對(duì)誤差k的確定應(yīng)根據(jù)研究對(duì)象的實(shí)際平均值和臨界水平來(lái)確定[9]。
當(dāng)樣本容量較小或總體方差σ2未知時(shí),由經(jīng)典統(tǒng)計(jì)理論可知,隨機(jī)變量服從t分布,可以用樣本方差S2代替總體方差σ2。則采樣數(shù)為:
(3)
(4)
則采樣數(shù)為:
(5)
通過(guò)t分布法樣本合理采樣數(shù)n值表,選用不同的Cv可以得到不同的采樣數(shù)目。
以上樣本容量估算的方法將總體看作為無(wú)限性的。若總樣本量有限,估計(jì)的抽樣誤差應(yīng)通過(guò)抽樣分?jǐn)?shù)矯正,因此,可得下式:
(6)
如果N很大時(shí),可近似看作總樣本容量具有無(wú)限性,不必進(jìn)行矯正,直接計(jì)算其近似值。如果,抽樣分?jǐn)?shù)n0/N不大,可采用n0作為采樣數(shù)的樣本量,否則,必須計(jì)算n’值。
(7)
從式(7)可知n’(采樣樣本容量)分別與s2(樣本方差)和1-α(置信概率)呈正相關(guān),同時(shí),與Δ(采樣精度)呈負(fù)相關(guān)。
Cochran合理采樣數(shù)法是將整個(gè)研究區(qū)域土壤設(shè)定為一個(gè)性質(zhì)隨機(jī)分布的均質(zhì)整體,在忽略土壤的空間結(jié)構(gòu)變化的情況下,通過(guò)變異系數(shù)和標(biāo)準(zhǔn)差等參數(shù)推出所求置信區(qū)間和誤差條件下的合理采樣數(shù)。謝寶妮等[10]認(rèn)為由此得出的采樣數(shù)量偏少,無(wú)法得出局部變異情況,只能獲得變化的大致趨勢(shì)。
1.2 分層采樣法
在分層隨機(jī)抽樣中,抽樣單位在各層次的分配方法可分為比重分配法和最適分配法。
1.2.1 比重分配法 若各區(qū)層比例為pi=Ni/N,其中Ni為區(qū)層的總樣本容量,則當(dāng)研究區(qū)總采樣樣本容量為n′時(shí),各層區(qū)采樣樣本容量可通過(guò)pi*n′來(lái)分配,故而,若要確定各層區(qū)的采樣樣本容量,只需估計(jì)出研究區(qū)采樣樣本容量n′。比例配置法的分層采樣樣本容量的近似公式為:
(8)
式中:si——第i層區(qū)的標(biāo)準(zhǔn)差;d——允許的誤差;t——t分布的統(tǒng)計(jì)數(shù),可通過(guò)查表(由平均極差折算標(biāo)準(zhǔn)差的折算系數(shù)和近似自由度值表),由其中的自由度估計(jì)值以及置信系數(shù)決定。
如果,抽樣分?jǐn)?shù)n0/N極小,則n0′≈n′。如果計(jì)算所得采樣樣本容量大于總體樣本容量的10%,則采用不重復(fù)抽樣公式,進(jìn)一步計(jì)算精確n′值[11]。
(9)
比重分配法與Cochran法相似,利用樣本的標(biāo)準(zhǔn)差和相對(duì)誤差計(jì)算出總的采樣數(shù)量,再依據(jù)各區(qū)層的比例來(lái)分配,因此造就忽略客觀存在于各區(qū)層間的變異程度,導(dǎo)致其層區(qū)所占比例越大,所需的采樣數(shù)量就會(huì)越多。
1.2.2 最適分配法 最適分配法的著眼點(diǎn)在于根據(jù)各層次的區(qū)層和誤差大小來(lái)配置相應(yīng)的抽樣單位,其數(shù)量與區(qū)層和誤差成正相關(guān)。Neyman證實(shí)若按區(qū)層大小與相應(yīng)標(biāo)準(zhǔn)差乘積相應(yīng)地分配抽樣單位,可得到最小方差的樣本平均數(shù),故而稱其為最適分配法[12]。各區(qū)層抽樣數(shù)計(jì)算公式為:
(10)
最適分配法樣本容量估算的近似公式:
n0′=(∑pisi)2(d2/t2)=(∑pisi)2/V
(11)
(12)
抽樣分?jǐn)?shù)n0/N極小時(shí),可令n′0≈n′。
式中:V——一定置信系數(shù)下的樣本必需方差。
姜城等[13]發(fā)現(xiàn)最適分配法不但可以取得較為理想的采樣數(shù),而且也可以而且也可以根據(jù)實(shí)際情況的需要的調(diào)節(jié)局部區(qū)域采樣點(diǎn)分布的密度,提高采樣效率。姚榮江等[14]通過(guò)經(jīng)典統(tǒng)計(jì)學(xué)和地統(tǒng)計(jì)學(xué)法對(duì)黃河三角洲地區(qū)不同層次土壤鹽分的合理采樣數(shù)研究中發(fā)現(xiàn)采用分層采樣法可以很好地降低采樣數(shù),采用最適分配法相對(duì)于比重分配法可最大降低35%的采樣數(shù)。
1.3 基于地統(tǒng)計(jì)學(xué)法
地統(tǒng)計(jì)學(xué)是由Matheron[15]提出,并最早由礦物學(xué)家D.R.krige應(yīng)用于南非金礦查找過(guò)程中?;诘亟y(tǒng)計(jì)學(xué)的合理采樣數(shù)研究是在原土壤研究指標(biāo)的半方差函數(shù)結(jié)構(gòu)和分布格局等研究的基礎(chǔ)上分別抽樣,通過(guò)比較各抽樣方式下研究對(duì)象的空間變異特性和插值精度來(lái)確定合理采樣數(shù)目。其一般研究方式如下:首先,將各研究對(duì)象的采樣數(shù)據(jù)集劃分為訓(xùn)練樣本和驗(yàn)證樣本,在此基礎(chǔ)上不斷對(duì)訓(xùn)練樣本隨機(jī)抽取數(shù)據(jù)減少其樣點(diǎn)數(shù)量,然后,探討分析研究對(duì)象的空間結(jié)構(gòu)特征和克里格插值精度的變化,由此,確定其合理采樣數(shù)。閻波杰等[16]研究發(fā)現(xiàn),地統(tǒng)計(jì)學(xué)法分析和克立格插值法相比經(jīng)典統(tǒng)計(jì)法而言考慮了空間結(jié)構(gòu)性和隨機(jī)性,能夠據(jù)此推求較為科學(xué)的采樣數(shù)。
克里格插值法也稱作空間局部估計(jì),是一種線性無(wú)偏估計(jì)的方法,是通過(guò)考慮研究對(duì)象的空間變異性,得到對(duì)待插點(diǎn)屬性值的影響范圍,利用該范圍的已有采樣點(diǎn)來(lái)估計(jì)待插點(diǎn)值[17]。其中,應(yīng)用最為廣泛的當(dāng)屬普通克里格法,但由于其只需考慮目標(biāo)變量的空間信息,故而其估測(cè)精度需要大量的采樣數(shù)據(jù)和合理的采樣密度為依托[18]。協(xié)同克里格法是普通克里格法的拓展,一般涉及多個(gè)變量,即主變量和其他的輔助變量。利用主變量的自相關(guān)性和具有良好協(xié)同性的輔助變量來(lái)提高其估測(cè)精度,在精度相同的條件下能夠有效地優(yōu)化采樣數(shù)。與線性回歸相結(jié)合的克里格法是利用建立主變量與現(xiàn)存的輔助變量間的線性關(guān)系,從而求得主變量的數(shù)據(jù)集,據(jù)此,可通過(guò)普通克里格法插值求得研究區(qū)域的估值分布。
李潤(rùn)林等[19]研究表明,基于輔助變量的協(xié)同克里格插值的精度高于普通克里格插值,同時(shí),得出了該研究在保證精度條件下的采樣數(shù)下限。龐夙等[20]將有機(jī)質(zhì)作為輔助變量來(lái)研究農(nóng)田土壤銅含量進(jìn)行插值分析和采樣數(shù)量?jī)?yōu)化研究。李楠等[21]以有機(jī)質(zhì)作為輔助變量,也通過(guò)協(xié)同克里格法對(duì)速效磷、速效鉀等進(jìn)行采樣數(shù)優(yōu)化。李艷等[22]將土壤電導(dǎo)率作為輔助變量來(lái)分析土壤的全鹽含量,并發(fā)現(xiàn)通過(guò)協(xié)同克里格法,深層的采樣數(shù)減少40%仍能夠滿足精度要求,據(jù)此可以優(yōu)化采樣數(shù)目,節(jié)省成本花費(fèi)。Wu等[23]發(fā)現(xiàn)采用線性回歸相結(jié)合的克里格法顯著優(yōu)于協(xié)同克里格法。
基于地統(tǒng)計(jì)學(xué)的合理采樣數(shù)研究具有諸多優(yōu)勢(shì),但也同樣在應(yīng)用上有一定程度的不足。其主要問(wèn)題在于,合理采樣數(shù)設(shè)定依賴于大量采樣后所得的變異函數(shù),因此,對(duì)于不具備區(qū)域先驗(yàn)知識(shí)的條件下,難以利用該法指導(dǎo)采樣。此外,建立變異函數(shù)還需要滿足二階準(zhǔn)平穩(wěn)假設(shè)和準(zhǔn)本征假設(shè)。由于該假設(shè)在野外采樣時(shí)很難滿足,故而,使得這樣優(yōu)化得到的采樣方案有一定的局限性。
自Tobler[24]提出了普遍存在于地理空間事物間的空間自相關(guān)性的概念開(kāi)始,許多研究人員投入了對(duì)地理空間對(duì)象相關(guān)性和變異性特征的研究。正是基于空間自相關(guān)性的存在,Haining等[4]指出處于相關(guān)性影響范圍內(nèi)的點(diǎn)具有相近的性質(zhì),樣本信息的重疊造成有效樣本信息的損失。已有研究表明,采樣點(diǎn)的優(yōu)化布設(shè)比單單添加采樣數(shù)更為重要[25]。故而,對(duì)樣點(diǎn)的空間布設(shè)的研究意義重大。所謂樣點(diǎn)的優(yōu)化布設(shè),可理解為在研究范圍中確定m個(gè)樣點(diǎn)的最優(yōu)位置,使其具有最佳的全局代表性,以滿足研究目的所需。目前確定樣點(diǎn)空間布設(shè)的方法有經(jīng)典采樣法、目的性采樣法、輔助變量法和樣點(diǎn)代表性等級(jí)法4種。
2.1 經(jīng)典采樣法
經(jīng)典采樣方法一般被包含于基于設(shè)計(jì)的抽樣范疇。該方法以有限樣本總體的隨機(jī)抽樣為理論基礎(chǔ)。其隨機(jī)性產(chǎn)生于從總體樣本抽樣的過(guò)程中,而不必要對(duì)推測(cè)研究對(duì)象的總體分布進(jìn)行假設(shè)。該方法通過(guò)隨機(jī)采樣所得的子樣本對(duì)整體樣本的參數(shù)進(jìn)行估測(cè),一定程度上適用于大尺度采樣調(diào)查的參數(shù)估計(jì)。用于抽樣的樣本量越大,其對(duì)總體樣本參數(shù)的估計(jì)就越接近,直到抽樣樣本等同于總體樣本時(shí),誤差為零。但由于該方法沒(méi)有充分考慮樣本的空間相關(guān)性,僅通過(guò)隨機(jī)性產(chǎn)生布設(shè)結(jié)果,通常與其他確定樣點(diǎn)空間布設(shè)的方法相結(jié)合使用,也常作為參照進(jìn)行比較評(píng)估。目前,常涉及的經(jīng)典采樣法有如下6種。
2.1.1 隨機(jī)采樣法 隨機(jī)采樣法,即從研究區(qū)域中對(duì)各個(gè)采樣單元都賦予同等概率被選取的采樣方法,其過(guò)程具有隨機(jī)性,可以避免主觀影響,具有最小的采樣方差,此前已被證明其樣本均值和樣本方差均可較好地代表總體的最佳估計(jì)。但是,因?yàn)殡S機(jī)抽樣其特性使得采樣點(diǎn)分布并不均勻,甚至?xí)霈F(xiàn)局部集中和局部空缺的情況。
2.1.2 規(guī)則柵格采樣法 規(guī)則柵格采樣法是將研究區(qū)域劃分成規(guī)則的柵格小區(qū)后規(guī)律進(jìn)行采樣的方式,具有系統(tǒng)的成分,是土壤特性時(shí)空變異分析的基礎(chǔ)。一般做法是在研究區(qū)地圖上根據(jù)所研究對(duì)象的變異性和其他因素而確定的網(wǎng)格尺寸進(jìn)行疊加,在網(wǎng)格的交點(diǎn)或者網(wǎng)格內(nèi)部進(jìn)行采樣,通常,會(huì)選取半徑3~10 m范圍內(nèi)的5~10鉆通過(guò)四分法進(jìn)行混合為一份樣本。柵格形狀除正方形外,還包括矩形、三角形、菱形和六角形,有研究表明,采用正三角形的柵格相于正方形而言得到的樣本估值更精細(xì)一些[26]。
雖然規(guī)則柵格采樣技術(shù)原理簡(jiǎn)單,但在實(shí)際操作中由于受到地形復(fù)雜、交通條件等多種因素的影響,很難將計(jì)劃采樣點(diǎn)在研究區(qū)域中準(zhǔn)確定位實(shí)施采樣。此外,由于規(guī)則柵格采樣帶有系統(tǒng)采樣的性質(zhì),與純隨機(jī)采樣相比,在方差估算方面會(huì)有偏差,對(duì)于樣本總量平均值的估算則近似隨機(jī)采樣。很多情況下,規(guī)則柵格采樣技術(shù)會(huì)與地統(tǒng)計(jì)學(xué)方法相結(jié)合對(duì)區(qū)域土壤特性進(jìn)行描述,這樣可以很好地體現(xiàn)其連續(xù)性和變異性。Franzen和Peck在比較了不同網(wǎng)格尺度下的土質(zhì)估算精度后,發(fā)現(xiàn)以200英寸網(wǎng)格經(jīng)行采樣最為合適,并由此提出了一種以200英寸為基準(zhǔn)根據(jù)數(shù)據(jù)變化差異來(lái)調(diào)整網(wǎng)格尺寸繼而選定最尺寸的方法[27]。
2.1.3 嵌套采樣法 嵌套采樣法是將研究區(qū)劃分為若干個(gè)一級(jí)單元,在每個(gè)一級(jí)單元里繼續(xù)劃分出若干二級(jí)單元,在所得結(jié)果中,可以隨機(jī)選取或根據(jù)研究需要進(jìn)一步細(xì)分,此過(guò)程可以根據(jù)實(shí)際情況持續(xù)到可分辨的最小單位。在大尺度的研究區(qū)域中,通過(guò)整體的經(jīng)驗(yàn)推斷結(jié)合局部的嵌套采樣能夠獲得較為精準(zhǔn)的采樣結(jié)果。
2.1.4 分層采樣 分層采樣,即在對(duì)調(diào)查對(duì)象性質(zhì)深入分析的基礎(chǔ)上,將研究區(qū)域劃分為性質(zhì)較為均勻的類型區(qū)層,在各個(gè)區(qū)層中獨(dú)立進(jìn)行隨機(jī)等量抽樣構(gòu)成樣本總體。因此,亦稱為類型采樣。相對(duì)于純隨機(jī)采樣法,分層采樣法集統(tǒng)計(jì)分組和抽樣原理于一體應(yīng)用于研究變量的均值在各區(qū)層間存在明顯差異的情況下,能夠得到較為精確的估值,此外,在大尺度研究區(qū)域下的估測(cè)精度也有較好的改善。分層采樣的精髓在于其高效的分層方式,由此提出分層效率的概念,即通過(guò)相同條件下隨機(jī)抽樣的方差與分層抽樣所得方差的比值來(lái)定義,比值越大即分層效率越高;只有當(dāng)分層效率大于1時(shí),相對(duì)于簡(jiǎn)單隨機(jī)抽樣才更具有代表性。朱爽等[28]研究表明,選取不同的分層方法得到的分層效率差異較大。曹志冬等[29]認(rèn)為先驗(yàn)知識(shí)越豐富其指導(dǎo)下的分層采樣所得的估算精度越高,而在沒(méi)有先驗(yàn)知識(shí)的條件下隨意分層,其估算精度相較于簡(jiǎn)單隨機(jī)抽樣并沒(méi)有明顯差異。張錦水等[30]研究表明,隨著分層層數(shù)的增加抽樣量在降低,抽樣精度也在降低。
近年來(lái),隨著地理信息產(chǎn)業(yè)的發(fā)展,傳統(tǒng)的分層采樣方法也有了相關(guān)的改進(jìn)研究。連健等[31]在分層抽樣的基礎(chǔ)上利用GIS和ESDA方法與空間信息相結(jié)合,對(duì)基于空間“動(dòng)態(tài)抽樣框”編織技術(shù)的空間分層抽樣法經(jīng)行了研究和應(yīng)用。翟佩璇等[32]則借鑒聚類分析K-Means算法的思想將聚類算法和分層抽樣相組合,并較為客觀地評(píng)定了聚類分層抽樣的可行性和有效性,為傳統(tǒng)分層采樣方法的改進(jìn)提供了借鑒。王勁峰[33]在分層采樣的基礎(chǔ)上首次提出了“三明治空間抽樣模型”。三明治空間模型不但完成了樣本層、知識(shí)層和報(bào)告層的信息和誤差的傳遞,而且報(bào)告單元可由用戶設(shè)定的靈活性也突破了經(jīng)典抽樣理論默認(rèn)其唯一性的局限,解決了多個(gè)報(bào)告單元布設(shè)帶來(lái)的費(fèi)用問(wèn)題。
2.1.5 系統(tǒng)采樣 系統(tǒng)采樣又稱為等距抽樣或機(jī)械采樣,其基本思想是在樣本總體中以某種既定順序排列,隨機(jī)采取第一個(gè)樣本點(diǎn),然后按照一定距離進(jìn)行采樣,直到形成所需的樣本總體。在此基礎(chǔ)上,繼而發(fā)展形成系統(tǒng)分層采樣,在對(duì)總體樣本所規(guī)劃的柵格小區(qū)中,繼續(xù)細(xì)分二級(jí)柵格,并賦予每個(gè)二級(jí)柵格一個(gè)坐標(biāo)值(X,Y)(其中X,Y取正整數(shù)),在第一個(gè)一級(jí)柵格中隨機(jī)選取一個(gè)二級(jí)柵格,通過(guò)行列間的既定規(guī)律變化,繼而依次得到各個(gè)一級(jí)柵格中的二級(jí)柵格,由此構(gòu)成整個(gè)樣本總體。王迪等[34]在對(duì)玉米種植面積空間抽樣調(diào)查方案的研究中,發(fā)現(xiàn)系統(tǒng)分層采樣相對(duì)于簡(jiǎn)單隨機(jī)采樣、分層采樣和系統(tǒng)采樣而言更為合理。
2.1.6 整群采樣 整群采樣又稱之為區(qū)域抽樣,適用于主要變異來(lái)源在區(qū)域間或區(qū)域內(nèi)各單元間。通常,整個(gè)研究區(qū)域可劃為單元數(shù)近似相等的組群,在此基礎(chǔ)上,隨機(jī)選取采樣組群,最后,在所選組群的各個(gè)單元內(nèi)隨機(jī)采樣得最終的采樣結(jié)果。其中,群的作用是擴(kuò)大抽樣單位。由于整群采樣具有均勻性差和誤差較大的缺點(diǎn),故而一般在空間采樣中很少利用,通常與分層抽樣組合使用,以此加強(qiáng)其代表性。吳炳方等[35]將整群采樣和樣條采樣相配合來(lái)計(jì)算作物種植面積,發(fā)現(xiàn)利用整群采樣可以克服遙感監(jiān)測(cè)大面積區(qū)域的技術(shù)瓶頸,同時(shí)也節(jié)約成本保證精度。
綜上所述,對(duì)隨機(jī)采樣法、規(guī)則柵格采樣法、嵌套采樣法、分層采樣法、系統(tǒng)采樣法和整群采樣法的特點(diǎn)比較,總結(jié)可得如表1所示[33]。
表1 基本經(jīng)典采樣方法間比較
2.2 目的性采樣法
目的性采樣即根據(jù)專家的先驗(yàn)知識(shí)或數(shù)據(jù)挖掘算法,通過(guò)采集被判定為具有區(qū)域代表性或者能代表區(qū)域均值的典型樣點(diǎn)來(lái)估算整個(gè)研究區(qū)域特性的采樣方式。目的性采樣屬于早期應(yīng)用較多的采樣方法,由于其本身極其依賴具有多年實(shí)踐經(jīng)驗(yàn)積累的專家和先驗(yàn)知識(shí)的指導(dǎo),故而自身的局限性導(dǎo)致其不易推廣。此外,目的性采樣的精度是建立在專家主觀選擇的基礎(chǔ)上,很難得到客觀的誤差評(píng)價(jià)。隨著地統(tǒng)計(jì)學(xué)的不斷發(fā)展,空間采樣不斷進(jìn)步,目的性采樣已經(jīng)漸漸淡出歷史舞臺(tái)。
2.3 輔助變量法
20世紀(jì)70年代,Huggett[36]詳盡地闡述了土壤成因與景觀類型間的關(guān)系,在土壤發(fā)生學(xué)理論的基礎(chǔ)上提出了土壤景觀模型。在世界各國(guó)的大量研究下,逐步形成了一種基于土壤景觀模型,結(jié)合空間分析和數(shù)學(xué)方法的土壤調(diào)查法,并被廣泛地應(yīng)用于空間采樣點(diǎn)的合理布設(shè)。土壤屬性的空間分布是在多種地形因子共同作用下形成的,故而,將地形因子作為輔助變量來(lái)估測(cè)研究對(duì)象的空間分布,不但更容易借助遙感等先進(jìn)技術(shù)獲得大尺度研究區(qū)域的輔助信息,而且在一定程度上考慮了地形因子對(duì)土壤性質(zhì)空間變異的影響。所謂地形因子就是描述空間地理特征的指標(biāo),常見(jiàn)的有高程、坡度、平面曲率和植被覆蓋等。其中定量環(huán)境因子如高程、坡度等相對(duì)容易獲得,應(yīng)用較為普遍,此外,定性環(huán)境因子如成土母質(zhì)、土地利用類型等對(duì)土壤屬性也就較為顯著的影響。將定量和定性環(huán)境因子結(jié)合作為輔助變量,對(duì)于提高土壤性質(zhì)空間分布估測(cè)精度有較好的效果。另有研究表明,基于地形因子作為輔助信息來(lái)對(duì)研究對(duì)象空間屬性估計(jì)的精度相較于僅基于采樣點(diǎn)的方法而言有顯著的提高[37]。Hengl等[38]、Kerry等[39]、Simbahan等[40]和Minasny等[41]均利用輔助變量法進(jìn)行采樣點(diǎn)的布設(shè)并成功獲取了所研究對(duì)象的空間信息。
在已有研究的基礎(chǔ)上,可總結(jié)其一般研究方式是通過(guò)輔助因子與土壤性質(zhì)的相關(guān)性來(lái)推求其空間分布,利用優(yōu)化算法,以不確定性最低為目標(biāo)函數(shù),在研究區(qū)域內(nèi)搜索一定數(shù)量點(diǎn)的最佳位置。對(duì)于一定數(shù)量采樣點(diǎn)的最優(yōu)布設(shè)方式,有枚舉法、貪婪法、模擬退火法3種。
(1) 枚舉法是處理該類型最直接的方法,通過(guò)列舉全部可能的樣本點(diǎn)集組合來(lái)比對(duì)得到全局最優(yōu)樣本。但是,在大尺度的采樣區(qū)域內(nèi),面對(duì)數(shù)量較多的采樣數(shù),其位置的組合方式會(huì)異常復(fù)雜,采用枚舉法往往會(huì)造成“組合爆炸”問(wèn)題,故而在實(shí)際中應(yīng)用范圍有限。
(2) 貪婪法是利用已知采樣點(diǎn)通過(guò)Kriging variance或weighted kriging varianc等方法來(lái)推求未知采樣點(diǎn)的權(quán)重,從而選定權(quán)重最大的點(diǎn),繼而推算下一個(gè)點(diǎn)直到滿足總體精度無(wú)法再隨樣點(diǎn)數(shù)的增加而顯著增大時(shí)為止。這類方法便于操作,但是整個(gè)過(guò)程是通過(guò)單向推求,無(wú)法回溯,最終形成的樣點(diǎn)集并不一定是組合形式下的全局最優(yōu),容易形成局部最優(yōu)的結(jié)果。
2.4 樣點(diǎn)代表性等級(jí)法
樣點(diǎn)代表性等級(jí)是對(duì)樣點(diǎn)全局代表性強(qiáng)弱的等級(jí)劃分。其中。樣點(diǎn)全局代表性是指樣點(diǎn)具備的土壤空間特性能夠很好地契合研究區(qū)實(shí)際的變異分布。全局代表性高的樣點(diǎn)不但在數(shù)值空間內(nèi)很好地囊括了目標(biāo)區(qū)域土壤特性的典型值,而且在地理空間內(nèi),也可以極大限度地代表土壤屬性的空間變異。而樣點(diǎn)代表性等級(jí)法,即是由具有全局代表性樣點(diǎn)構(gòu)成的集合中,在有限樣本容量的條件下,可以優(yōu)先選擇代表性較高的樣點(diǎn),由此獲得最大的研究效益。其一般方法是,在土壤景觀模型理論的基礎(chǔ)上,將所選環(huán)境因子的分布圖疊加,通過(guò)賦予的權(quán)重計(jì)算而得到各位置的代表性等級(jí),根據(jù)一定的優(yōu)化規(guī)則剔除冗余信息,最后確定可供采樣點(diǎn)布設(shè)的代表性等級(jí)序列。
楊琳等[44]發(fā)現(xiàn),通過(guò)少量的代表性較高的樣點(diǎn)可以較好地代表研究區(qū)域的相關(guān)特性,而隨著低代表性等級(jí)樣點(diǎn)的加入,其精度并沒(méi)有太大變化。這種采樣方法不但可以極好地避免數(shù)據(jù)冗余,提高采樣效率,降低研究成本,為后續(xù)研究提供了很好的數(shù)據(jù)支撐,而且,由此得到的采樣點(diǎn)能夠更好地保證插值結(jié)果的精度,即具有Mcbratney等[45]指出的現(xiàn)有插值方法所要求樣點(diǎn)須具備研究區(qū)空間變化的全局代表性。在此基礎(chǔ)上,孫孝林等[46]在相關(guān)研究中證實(shí)了樣點(diǎn)代表性等級(jí)法在成本、精確度上有明顯的優(yōu)點(diǎn),同時(shí)提出了推廣此法的關(guān)鍵,即探尋較好的土壤協(xié)同環(huán)境因子。此外,早在2009年郭麗娜等[47]按照觀生態(tài)學(xué)理論引入了等別多樣性指數(shù),以此提出了一種利用等別質(zhì)量代表性來(lái)確定農(nóng)用地等別質(zhì)量檢測(cè)帶的方法。
盡管國(guó)內(nèi)外學(xué)者對(duì)于優(yōu)化采樣設(shè)計(jì)做了大量的研究,提出了多種方法,但在應(yīng)用中仍存在諸多問(wèn)題:
(1) 當(dāng)下對(duì)合理采樣數(shù)的研究,多熱衷于利用地統(tǒng)計(jì)學(xué)通過(guò)克里格法進(jìn)行優(yōu)化,這種優(yōu)化采樣設(shè)計(jì)的方式更多的是為多次采樣和日后的監(jiān)測(cè)點(diǎn)布置提供參考,然而,并不適用于沒(méi)有先驗(yàn)知識(shí)情況下的初步采樣設(shè)計(jì)。
(2) 多數(shù)基于模型來(lái)優(yōu)化采樣設(shè)計(jì)的研究,支撐其理論的初步采樣數(shù)據(jù),往往是通過(guò)簡(jiǎn)單地遵循隨機(jī)抽樣的方法甚至是通過(guò)目的性采樣得到的。這種忽略空間相關(guān)性所導(dǎo)致的信息損失,必然在一定程度上造成試驗(yàn)結(jié)果的偏差和人力物力的浪費(fèi)。
(3) 建立在樣本個(gè)體完全獨(dú)立基礎(chǔ)上經(jīng)典抽樣方法雖然廣泛運(yùn)用于各個(gè)領(lǐng)域,但是,隨著3S技術(shù)的成熟和推廣,對(duì)具有相關(guān)性的地理空間對(duì)象而言,這種傳統(tǒng)的方法自帶的弊病已無(wú)法滿足于當(dāng)下的研究所需。
(4) 合理采樣設(shè)計(jì)的研究尺度多集中在縣級(jí)以下的區(qū)域,在大尺度上的研究尚少。
(5) 對(duì)合理采樣方案設(shè)計(jì)沒(méi)有統(tǒng)一的評(píng)價(jià)體系和標(biāo)準(zhǔn)。
通過(guò)對(duì)國(guó)內(nèi)外相關(guān)研究和發(fā)展的總結(jié)可知,樣點(diǎn)代表性等級(jí)法開(kāi)拓的新思路,可能會(huì)使今后相關(guān)研究的采樣策略更傾向于帶有采樣優(yōu)先級(jí)的彈性設(shè)計(jì)。在利用輔助因子來(lái)推斷優(yōu)先級(jí)的過(guò)程中,可引入相關(guān)的評(píng)估機(jī)制。其中,對(duì)于研究對(duì)象和輔助因子的相關(guān)性研究以及尋找一套契合該方法的評(píng)價(jià)機(jī)制將成為相關(guān)研究的重點(diǎn)。
[1] 李連發(fā),王勁峰.地理數(shù)據(jù)空間抽樣模型[J].自然科學(xué)進(jìn)展,2002,12(5):545-548.
[2] 郝向東.淺談系統(tǒng)抽樣和分層抽樣[J].統(tǒng)計(jì)與信息論壇,1996(4):62-65.
[3] Havlin J L, Jacobsen J S. Soil testing: Prospects for improving nutrient recommendations.[M]. Madison, Wisconsin, USA: Soil Science Society of America, Inc. American Society of Agronomy, Inc. 1994.
[4] Haining R, Zhang J. Spatial Data Analysis: Theory and Practice[M]∥Spatial Data Analysis: Theory and practice. Cambridge University Press,2003:1077.
[5] Brus D J, De Gruijter J J. Random sampling or geostatistical modelling? Choosing between design-based and model-based sampling strategies for soil[J]. Geoderma, 1997,80(1/2):1-44.
[6] 賀本嵐. 復(fù)雜抽樣中基于設(shè)計(jì)與基于模型推斷的比較研究[J].北京市第十六次統(tǒng)計(jì)科學(xué)研討會(huì)獲獎(jiǎng)?wù)撐募?2011.
[7] 史海濱,陳亞新.土壤水分空間變異的套合結(jié)構(gòu)模型及區(qū)域信息估值[J].水利學(xué)報(bào),1994(7):70-77,89.
[8] Cochran W G. Sampling Techniques(3rd ed.)[M]. John Wiley and Sons, Inc, New York, 1977.
[9] Cameron D R, Nyborg M, Toogood J A, et al. Accuracy of field sampling for soil tests[J]. Canadian Journal of Soil Science, 1971,51(2):165-175.
[10] 謝寶妮,常慶瑞,秦占飛.縣域土壤養(yǎng)分離群樣點(diǎn)檢測(cè)及其合理采樣數(shù)研究[J].干旱地區(qū)農(nóng)業(yè)研究,2012,30(2):56-61.
[11] Sachs L. Applied Statistics[J]. Springer, 1984,17(3):389-390.
[12] 蓋鈞鎰.試驗(yàn)統(tǒng)計(jì)方法[M].北京:中國(guó)農(nóng)業(yè)出版社,2003:339-346.
[13] 姜城,楊俐蘋(píng),金繼運(yùn),等.土壤養(yǎng)分變異與合理取樣數(shù)量[J].植物營(yíng)養(yǎng)與肥料學(xué)報(bào),2001,7(3):262-270.
[14] 姚榮江,楊勁松,姜龍.黃河三角洲土壤鹽分空間變異性與合理采樣數(shù)研究[J].水土保持學(xué)報(bào),2006,20(6):89-94.
[15] Matheron G. Principles of geostatistics[J]. Economic Geology, 1963,58(8):1246-1266.
[16] 閻波杰,潘瑜春,趙春江.區(qū)域土壤重金屬空間變異及合理采樣數(shù)確定[J].農(nóng)業(yè)工程學(xué)報(bào),2008,24(S2):260-264.
[17] 陳飛香,戴慧,胡月明,等.區(qū)域土壤空間抽樣方法研究[J].地理與地理信息科學(xué),2012,28(6):53-56.
[18] Cattle J A, McBratney A, Minasny B. Kriging method evaluation for assessing the spatial distribution of urban soil lead contamination[J]. Journal of Environmental Quality, 2002,31(5):1576-1588.
[19] 李潤(rùn)林,姚艷敏,唐鵬欽,等.縣域耕地土壤鋅含量的協(xié)同克里格插值及采樣數(shù)量?jī)?yōu)化[J].土壤通報(bào),2013,44(4):830-838.
[20] 龐夙,李廷軒,王永東,等.縣域農(nóng)田土壤銅含量的協(xié)同克里格插值及采樣數(shù)量?jī)?yōu)化[J].中國(guó)農(nóng)業(yè)科學(xué),2009,42(8):2828-2836.
[21] 李楠,徐東瑞,吳楊潔.土壤養(yǎng)分含量的協(xié)同克里格法插值研究[J].浙江農(nóng)業(yè)學(xué)報(bào),2011,23(5):1001-1006.
[22] 李艷,史舟,王人潮,等.海涂土壤剖面電導(dǎo)率的協(xié)同克立格法估值及不同取樣數(shù)目的比較研究[J].土壤學(xué)報(bào),2004,41(3):434-443.
[23] Wu J, Norvell W A, Hopkins D G, et al. Improved prediction and mapping of soil copper by kriging with auxiliary data for cation-exchange capacity[J]. Soil Science Society of America Journal, 2003,67(3):919-927.
[24] Tobler W R. A Computer Movie Simulating Urban Growth in the Detroit Region[J]. Economic Geography, 1970,46(2):234-240.
[25] 趙業(yè)婷,李志鵬,常慶瑞,等.基于Cokriging的耕層土壤全氮空間特征及采樣數(shù)量?jī)?yōu)化研究[J].土壤學(xué)報(bào),2014,51(2):415-422.
[26] Weindorf D C, Zhu Y. Spatial variability of soil properties at Capulin Volcano, New Mexico, USA: Implications for sampling strategy[J]. Pedosphere, 2010,20(2):185-197.
[27] Franzen D W, Peck T R. Field soil sampling density for variable rate fertilization. [J]. Journal of Production Agriculture, 1996,8(4):568-574.
[28] 朱爽,張錦水.面向省級(jí)農(nóng)作物種植面積遙感估算的分層方法[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(2):184-191.
[29] 曹志冬,王勁峰,李連發(fā),等.地理空間中不同分層抽樣方式的分層效率與優(yōu)化策略[J].地理科學(xué)進(jìn)展,2008,27(3):152-160.
[30] 張錦水,潘耀忠,胡潭高,等.冬小麥種植面積空間抽樣效率影響因子分析[J].農(nóng)業(yè)工程學(xué)報(bào),2009,25(8):169-173.
[31] 連健,李小娟,宮輝力,等. GIS支持下的空間分層抽樣方法研究:以北京市人均農(nóng)業(yè)總產(chǎn)值抽樣調(diào)查為例[J].地理與地理信息科學(xué),2008,24(6):30-3338.
[32] 翟佩璇,高飛,吳兆福,等.基于聚類分層的地理空間數(shù)據(jù)抽樣研究[J].信息通信,2016(4):26-28.
[33] 王勁峰.空間抽樣與統(tǒng)計(jì)推斷[M].北京:科學(xué)出版社,2009.
[34] 王迪,周清波,陳仲新,等.玉米種植面積空間抽樣調(diào)查方案優(yōu)化設(shè)計(jì)[J].農(nóng)業(yè)工程學(xué)報(bào),2014,30(8):117-125.
[35] 吳炳方,李強(qiáng)子.基于兩個(gè)獨(dú)立抽樣框架的農(nóng)作物種植面積遙感估算方法[J].遙感學(xué)報(bào),2004,8(6):551-569.
[36] Huggett R J. Soil landscape systems: A model of soil Genesis[J]. Geoderma, 1975,13(1):1-22.
[37] Li Qiquan, Yue Tianxiang, Wang Changquan, et al. Spatially distributed modeling of soil organic matter across China: An application of artificial neural network approach[J]. Catena, 2013,104(2):210-218.
[38] Hengl T, Rossiter D G, Stein A. Soil sampling strategies for spatial prediction by correlation with auxiliary maps[J]. Australian Journal of Soil Research, 2003,41(8):1403-1422.
[39] Kerry R, Oliver M A. Variograms of ancillary data to aid sampling for soil surveys[J]. Precision Agriculture, 2003,4(3):261-278.
[40] Simbahan G C, Dobermann A. Sampling optimization based on secondary information and its utilization in soil carbon mapping[J]. Geoderma, 2006,133(3):345-362.
[41] Minasny B, McBratney A B. A conditioned Latin hypercube method for sampling in the presence of ancillary information[J]. Computers & geosciences, 2006,32(9):1378-1388.
[42] Va?át R, Heuvelink G B M, Boruvka L. Sampling design optimization for multivariate soil mapping[J]. Geoderma, 2010,155(3):147-153.
[43] 韓宗偉,黃魏,羅云,等.基于路網(wǎng)的土壤采樣布局優(yōu)化:模擬退火神經(jīng)網(wǎng)絡(luò)算法[J].應(yīng)用生態(tài)學(xué)報(bào),2015,26(3):891-900.
[44] 楊琳,朱阿興,秦承志,等.一種基于樣點(diǎn)代表性等級(jí)的土壤采樣設(shè)計(jì)方法[J].土壤學(xué)報(bào),2011,48(5):938-946.
[45] Mcbratney A B, Santos M L M, Minasny B. On digital soil mapping[J]. Geoderma, 2003,117(1/2):3-52.
[46] 孫孝林,王會(huì)利,寧源.樣點(diǎn)代表性等級(jí)采樣法在丘陵山區(qū)土壤表層有機(jī)質(zhì)制圖中的應(yīng)用[J].土壤,2014,46(3): 439-445.
[47] 郭力娜,張鳳榮,馬仁會(huì),等.基于標(biāo)準(zhǔn)樣地的國(guó)家級(jí)農(nóng)用地等別質(zhì)量監(jiān)測(cè)點(diǎn)設(shè)置方法探討:以冀豫鄂三省為例[J].資源科學(xué),2009,31(11):1957-1966.
ResearchProgressofSoilSamplingStrategyOptimization
WANG Zilong, CHEN Weijie, FU Qiang, JIANG Qiuxiang, CHANG Guangyi, HU Shitao
(SchoolofWaterConservancyandCivilEngineering,NortheastAgriculturalUniversity,Harbin,Heilongjiang150030,China)
[Objective] To systematically summarize the existing sampling methods, and to explore an optimized sampling strategy to balance the sampling intensity, analysis cost and research precision, which was expected to maximize the accuracy of experiments with minimum economic input. [Methods] On the basis of extensive review on the domestic and foreign literatures in recent years, the optimized sampling strategy for soil properties was summarized. The theory of optimal sampling strategy was elucidated in two parts: the reasonable sampling number and the sampling point layout. Three methods and four modes were introduced to determine the reasonable sampling number and sampling points, respectively, and the future research was prospected. [Results] Most of the sampling program design used in current methods was model-based, and of which the spatial correlation of samples was ignored and relevant information was unused, these all were responsible to the deviation of experimental results and wastes of labor and materials to some extent. In addition, most researches were county scale or and/or lower scale, and there was no unified evaluation system or standards to design a formal sampling program . [Conclusion] In the future, the priority for optimal sampling design should be strengthened.
soilproperties;samplingstrategy;classicalsampling;geostatistics;samplingpriority;spatialsampling
A
1000-288X(2017)05-0205-08
S159-3
文獻(xiàn)參數(shù): 王子龍, 陳偉杰, 付強(qiáng), 等.土壤優(yōu)化采樣策略研究進(jìn)展[J].水土保持通報(bào),2017,37(5):205-212.
10.13961/j.cnki.stbctb.2017.05.034; Wang Zilong, Chen Weijie, Fu Qiang, et al. Research progress of soil sampling strategy optimization[J]. Bulletin of Soil and Water Conservation, 2017,37(5):205-212.DOI:10.13961/j.cnki.stbctb.2017.05.034
2017-02-06
2017-03-10
國(guó)家自然科學(xué)基金項(xiàng)目“考慮積雪覆蓋的區(qū)域土壤春墑?lì)A(yù)報(bào)機(jī)理與模型研究:以松嫩平原黑土區(qū)為例”(51579045,51209039); 黑龍江省自然科學(xué)基金(D201403); 黑龍江省普通本科高等學(xué)校青年創(chuàng)新人才培養(yǎng)計(jì)劃(UNPYSCT-2015006); 東北農(nóng)業(yè)大學(xué)“學(xué)術(shù)骨干”項(xiàng)目(16XG10); 東北農(nóng)業(yè)大學(xué)“青年才俊”項(xiàng)目(14QC45); 黑龍江省博士后科研啟動(dòng)金(LBH-Q16017)
王子龍(1982—),男(漢族),山東省膠州市人,博士,副教授,主要從事寒區(qū)農(nóng)業(yè)水土資源高效利用研究。E-mail:wangzilong@neau.edu.cn。
付強(qiáng)(1973—),男(漢族),遼寧省錦州市人,博士,教授,主要從事農(nóng)業(yè)水土資源高效利用理論、方法及應(yīng)用研究。E-mail:fuqiang@neau.edu.cn。