劉 芳,李 晟,李迪強,*
(1.中國林業(yè)科學研究院森林生態(tài)環(huán)境與保護研究所,國家林業(yè)局森林生態(tài)環(huán)境重點實驗室,北京 100091;2.Department of Forest& Wildlife Ecology,University of Wisconsin-Madison,209 Russell Labs,1630 Linden Drive University of Wisconsin-Madison Madison,WI 53706-1598,USA)
準確的物種分布地圖或者棲息地適宜性是環(huán)境相關(guān)研究、資源管理以及保護規(guī)劃等許多方面所必需的[1],如生物多樣性評估、保護區(qū)設(shè)計、棲息地管理和恢復、物種保護規(guī)劃、種群生存力分析、環(huán)境風險評估、入侵種的管理、群落及生態(tài)系統(tǒng)模型以及預測全球氣候變化對物種和生態(tài)系統(tǒng)的影響等均需要物種分布圖[2]。近年來,利用物種分布有/無的數(shù)據(jù)并結(jié)合環(huán)境變量建立模型對物種分布進行預測的方法,在物種保護規(guī)劃和管理上的應用越來越廣泛[3-5]。這種方法所采用的數(shù)理模型被稱為生態(tài)位模型、棲息地適宜性模型或物種分布模型等,本文將統(tǒng)一使用物種分布模型這一名稱。廣義上的物種分布模型包括定量模型和基于規(guī)則的模型,本文將只討論其中的定量模型,因為這類模型在生態(tài)學研究和物種保護中應用最為廣泛。這些模型尤其適用于在較大的空間尺度上分布的物種[4],其基本原理是:在一個合適的空間尺度上,區(qū)域內(nèi)有某物種出現(xiàn)的地點占整個區(qū)域的比例可以反映該物種種群分布大小,對其分布范圍的變化進行監(jiān)測就可以得到該物種種群變化的信息[6-7]。物種分布模型的方法多樣,研究人員如何從眾多的模型中選擇合適的方法存在一定的困難。
利用物種分布有/無數(shù)據(jù)建立模型預測物種分布,最先應用于一些狩獵物種上[8];后來也廣泛應用于鳥類[9]、大型獸類(例如狼(Canis lupus)[10]和棕熊(Ursus arctos)[11]等)、小型獸類[12]、兩棲類[13]、蝴蝶[14]等物種的研究上,在真菌類[15]和植物的分布研究上也有所應用[16-17]。物種分布模型在物種的生態(tài)學及進化生物學上有著廣泛的應用:1)可以用來研究物種分布與環(huán)境變量之間的關(guān)系[12];2)研究物種可以生存的棲息地特征,從而確認目標物種可能高度利用的棲息地[18];3)分析物種分布隨時間變化如何變化,對于瀕危物種來說人們對于其棲息地的萎縮比較感興趣,而對于入侵物種來說,人們對于其棲息地的擴張更為關(guān)注;4)預測物種在將來環(huán)境變化,尤其是氣候變化條件下的分布變化[19],從而分析氣候變化對物種分布潛在的影響;5)研究相近物種的分布在生態(tài)學和地理分布上的分化[20];6)也有些研究者試圖將物種出現(xiàn)頻率和物種種群豐度聯(lián)系起來,從而推斷物種種群動態(tài)[1,21]。
利用物種分布有/無數(shù)據(jù)預測分布,關(guān)鍵的步驟包括構(gòu)建概念模型,收集物種分布有/無的數(shù)據(jù),選擇合適的方法建立模型,以及評估模型的精度[2](圖1)。首先,需要構(gòu)建總體概念模型,也即構(gòu)建物種分布與環(huán)境變量之間的關(guān)系函數(shù),并確定將要使用的建模方法。收集物種分布有/無數(shù)據(jù)有系統(tǒng)調(diào)查及非系統(tǒng)調(diào)查方法。在野外調(diào)查時,可以將幾個物種的調(diào)查結(jié)合起來進行,在投入相似的資金、時間、人力的情況下收集更多物種的信息。利用GIS工具將影響物種分布的環(huán)境變量數(shù)字化,通過AIC或者BIC等指標篩選最優(yōu)的變量組合。然后,選擇合適的算法建立模型,利用環(huán)境變量和物種分布有/無的結(jié)果來構(gòu)建模型,并對模型進行檢驗和評估。本文將針對以上各個環(huán)節(jié)的技術(shù)細節(jié)進行綜述。
構(gòu)建物種分布模型的第一步,就是構(gòu)建總體概念模型[22],即:綜合考慮研究對象的生物學特征以及對資源的需求,提出物種分布與環(huán)境變量之間的關(guān)系假設(shè),確定所用模型的類型及算法,選擇具有生物學意義的環(huán)境變量,設(shè)計數(shù)據(jù)收集方案,為模型的運算及評估做準備。
圖1 利用物種分布有無數(shù)據(jù)建立物種分布模型的步驟及其技術(shù)細節(jié)Fig.1 The steps and technique details of species distribution models using presence-absence data
與物種分布模型最相關(guān)的生態(tài)學理論是生態(tài)位概念[16,23]。Elton將生態(tài)位定義為“生物在棲息地所占據(jù)的空間單元”[24],而Hutchinson將生態(tài)位定義為“一個物種生存和繁殖所需要的環(huán)境”[25],更進一步區(qū)分了“基礎(chǔ)生態(tài)位”(即不考慮種間關(guān)系下的物種對環(huán)境的反應)和“現(xiàn)實生態(tài)位”(即包含了種間相互作用下的物種可以生存和繁殖的真實的環(huán)境維度)[26]。現(xiàn)實生態(tài)位一般是基礎(chǔ)生態(tài)位的子集。物種分布模型強調(diào)物種對環(huán)境的需求,尤其是影響物種分布的非生物環(huán)境因素,評估其基礎(chǔ)和現(xiàn)實生態(tài)位[2]。將限制物種分布的環(huán)境因子,尤其是較大的空間尺度上的氣候數(shù)據(jù),以及物種分布有無的數(shù)據(jù)置入模型,所獲得結(jié)果應是基礎(chǔ)生態(tài)位[27],在此基礎(chǔ)上進一步考慮物種的擴散特征、干擾因素以及資源因素,所獲取的結(jié)果更接近于現(xiàn)實生態(tài)位[23,26]。物種分布模型利用環(huán)境變量與已知的物種分布點間的關(guān)系,建立反應關(guān)系式,再利用該反應關(guān)系式,推斷未調(diào)查區(qū)域物種出現(xiàn)概率,將出現(xiàn)概率放到地理空間上顯示,則表現(xiàn)為物種的棲息地適宜性或潛在分布范圍。
建立物種分布模型,需要同時準備物種分布有無數(shù)據(jù)以及相關(guān)的環(huán)境數(shù)據(jù)。概念模型提出了影響物種分布的因素,包括非生物環(huán)境、生物間相互作用、物種本身的特性(如擴散特點)以及社會經(jīng)濟因素。非生物環(huán)境一般包括地形因素(如海拔、坡度、坡向等)、氣候因素(如年降水量、年均溫、降水及氣溫季節(jié)變動率等)、地理因素(如土壤類型、pH值等),生物因素則包括植被類型、人為干擾類型及強度及種間相互作用(如競爭、捕食、協(xié)作等)[2]。篩選并準備這些因素,利用GIS工具處理,使之成為符合模型條件的具有合適的空間尺度的數(shù)字化圖層。環(huán)境變量的選擇一般是基于專家知識[28]以及數(shù)據(jù)的可得性。
物種分布有/無的數(shù)據(jù),可以通過系統(tǒng)取樣的方式獲取,也可以通過非系統(tǒng)的方式從調(diào)查報告、博物館以及標本館收集。很多研究者利用系統(tǒng)取樣的方式獲取研究區(qū)域內(nèi)物種分布有/無的信息,從而建立模型預測未調(diào)查地區(qū)的物種出現(xiàn)概率[29-30]。首先,將研究區(qū)域劃分為一定大小的調(diào)查單元[4],可以依據(jù)物種的生物學特征(如家域面積)人為劃分面積相等的網(wǎng)格[31],也可以根據(jù)自然形成的棲息地斑塊[32]或行政管理區(qū)劃單位[33]劃分調(diào)查單元。然后,對所有調(diào)查單元或抽取部分調(diào)查單元進行實地調(diào)查(如樣線調(diào)查、紅外相機調(diào)查等),獲取物種有/無信息。取樣時可依據(jù)環(huán)境的梯度分層取樣,以使數(shù)據(jù)更具有代表性。
通過觀察物種實體或痕跡,可以比較容易確定物種在某地是有分布的,但是確定一個物種在某地是沒有分布卻不是那么容易,這是因為在一個地點觀察不到物種出現(xiàn),可能是因為調(diào)查方法沒有檢測到這個物種的存在,而該物種在此地點實際上是存在的;也就是說由于調(diào)查方法的限制物種的檢測概率不可能達到100%[4]。因此收集物種分布有/無信息的關(guān)鍵問題之一就是評估所選調(diào)查方法對該物種的檢測概率,如果在數(shù)據(jù)分析和構(gòu)建模型時忽略了不完美檢測的客觀事實,將使構(gòu)建的模型估算參數(shù)時出現(xiàn)偏差,從而導致對物種分布情況得出錯誤的推斷,進而導致管理者做出錯誤的管理決定[34]。為了改進這個問題,研究者一方面需要改進數(shù)據(jù)收集方法以盡量提高檢測概率(如在短時間內(nèi)對調(diào)查單元進行重復調(diào)查),另外一方面也需要利用統(tǒng)計學方法對實際的檢測概率進行評估和計算,以保證能夠得到無偏差的參數(shù)估計[4]。
利用重復調(diào)查方法對同一個調(diào)查單元收集物種分布有/無信息的方式包括:1)多次分散調(diào)查;2)多個觀察者獨立調(diào)查;3)同一觀察者多次調(diào)查(每次調(diào)查間隔一定時間);4)在一個較大的景觀單元內(nèi)調(diào)查多個地點[4]。
在一個季節(jié)內(nèi)重復調(diào)查,有效的取樣設(shè)計包括以下3種方式[35]:1)標準方式,即所有取樣的調(diào)查單元都重復調(diào)查同樣多的次數(shù);2)雙重取樣設(shè)計,即只在一部分已取樣的調(diào)查單元內(nèi)進行一定次數(shù)的重復調(diào)查,其他的取樣單元只調(diào)查1次;3)排除設(shè)計,即對調(diào)查單元設(shè)定最大重復調(diào)查次數(shù)(如K次),如果沒有發(fā)現(xiàn)物種出現(xiàn)則重復調(diào)查K次之后停止調(diào)查,但是一旦發(fā)現(xiàn)物種出現(xiàn)就停止調(diào)查。MacKenzie和Royle[36]認為第3種重復調(diào)查方法最為有效,因為一旦發(fā)現(xiàn)物種存在就可以確認物種在該調(diào)查單元內(nèi)是有分布的,而不必繼續(xù)花費力氣進行重復調(diào)查。
除了以上所述通過系統(tǒng)取樣的方式收集到的物種分布有/無的信息之外,近年來從博物館或植物標本館獲得的物種分布記錄[37]也用于物種分布模型中。其中某些數(shù)據(jù)可以在網(wǎng)絡(luò)上獲取(如全球生物多樣性信息組織(The Global Biodiversity Information Facility)提供了3.2億條物種分布記錄,網(wǎng)址為 http://www.gbif.org/),但這些數(shù)據(jù)并不是通過系統(tǒng)取樣獲得的,而且往往只有物種有分布的記錄,因此不能推斷物種無分布的信息;但是,正確利用這樣的數(shù)據(jù)可以用來分析生物多樣性的格局[5]。
一般來說,同時利用物種分布有和無的信息構(gòu)建模型,得到的結(jié)果比僅用物種分布有的信息的模型的精度要高[38],雖然也有例外。因此,在兩種數(shù)據(jù)均可得的情況下,可以優(yōu)先考慮使用二者同時建模的方法,如Logisitc回歸、MARS,GDM等(表1)。在僅有物種分布有的信息可用的情況下,如果利用與物種出現(xiàn)點具有同樣偏差的環(huán)境背景數(shù)據(jù)作為“偽不出現(xiàn)數(shù)據(jù)(Pseudo-absence data)”構(gòu)建模型,可以提高模型的精度[39]。
模型的表現(xiàn)與物種分布數(shù)據(jù)的數(shù)量正相關(guān)[30,40],即:物種分布的記錄越多,模型的預測表現(xiàn)越好。但是物種分布數(shù)據(jù)又受到調(diào)查工作的限制。有些研究表明,將至少50—100個有物種分布的記錄置入模型就可得到可接受的結(jié)果[40-42],甚至有些研究僅利用30個物種分布記錄就得到了可接受的結(jié)果[5,43]。Coudon和Gégout利用人造數(shù)據(jù)的模擬實驗也表明,利用logistic回歸要較為準確的評估物種的反應方程,至少需要50個物種出現(xiàn)的觀察數(shù)據(jù)[44]。
為了利用物種分布有/無的信息來預測其在更大范圍內(nèi)的分布狀況,很多技術(shù)已被用來建立預測模型,依據(jù)算法不同,物種分布模型可以分為統(tǒng)計學模型,機器學習模型以及其它模型[2](表1)。統(tǒng)計學模型包括廣義線性模型(GLM)[45],廣義加性模型(GAM)[26],多元自適應回歸樣條(MARS)[46],多重判別分析(MDA)[47]等;機器學習模型包括人工智能網(wǎng)絡(luò)(ANN)[48],分類回歸樹(CART)[26],基于遺傳算法的模型[48]。另外還有多元距離模型(MD)[5]以及基于專家知識的模型[50]。
選擇模型的方法需要綜合考慮自變量及因變量的類型(定量或分類)、物種分布數(shù)據(jù)的類型以及研究者對于物種分布數(shù)據(jù)與環(huán)境變量之間關(guān)系的數(shù)學假設(shè)(表1)以及研究者的使用經(jīng)驗[2]。在物種分布有無數(shù)據(jù)均可得的情況下,最常用的方法是廣義線性模型中的Logistic回歸模型。也就是通過Logistic回歸將物種出現(xiàn)和不出現(xiàn)數(shù)據(jù)與環(huán)境或棲息地變量聯(lián)系起來,從而預測一定區(qū)域里物種出現(xiàn)概率[50]。Logistic回歸模型已廣泛用來預測瀕危脊椎動物的出現(xiàn)和棲息地利用[47,51],狩獵物種(game species)的分布范圍[8],以及植物的空間分布格局[52]。此外,還有一些模型用來分析僅有物種出現(xiàn)的數(shù)據(jù),比如 BIOCLIM[53]、ENFA[30]、DOMAIN[54]、GARP[49]以及 MAXENT[55]等,其中表現(xiàn)比較好的有 MAXENT 和 GARP 等[5,43],而 ENFA 模型則可以區(qū)分出物種生態(tài)位與環(huán)境背景,并且能給出環(huán)境變量對物種分布的影響[2]。基于距離算法的模型,只能利用定量的環(huán)境變量,而且不能給出環(huán)境變量對物種分布影響的評估[2]。表1系統(tǒng)總結(jié)了利用有/無數(shù)據(jù)及只用物種有分布的數(shù)據(jù)建立模型的方法所利用的物種分布數(shù)據(jù)類型、環(huán)境變量類型以及模型所用的反應函數(shù)。
當環(huán)境或棲息地變量比較多時,選擇哪些變量來構(gòu)建模型就成為一個關(guān)鍵問題,也即從若干候選模型中選出最佳模型來。信息測量指標常被用來比較不同模型的優(yōu)劣[56]。其中一種著名的信息測量指標是Akaike信息標準(為 AIC,公式 1)[27]。
AIC 的定義為[57]:
式中,log Likelihood是模型的估計最大似然值的自然對數(shù),K為模型中自變量的數(shù)目。
其它條件不變的情況下,AIC值越小,表示模型的擬合優(yōu)度越高。將所有模型按照AIC的值從低到高排列起來,并計算每個模型的AIC值與所有模型中最小的AIC的差值,記為ΔAIC。Burnham和 Anderson[58]認為ΔAIC<2的模型是等效的最佳模型。但是當樣本量較少時(如n/K≤40時),應該利用AICc(公式2)值比較模型[58]。
Akaike權(quán)重(公式3)是用來比較模型的另一個常用的指標,其值可以反應某候選模型成為最優(yōu)模型的相對概率[58]。相比較于ΔAIC和AICc,Akaike權(quán)重更易于解釋模型的優(yōu)勢,同時也可以用于評估單個變量對模型的貢獻率。
式中,R為候選模型的數(shù)目。
還有一種使用的越來越多的信息標準,叫做貝葉斯信息標準(BIC)[59]。BIC適用于模型中自變量的數(shù)目較低的情況[60]。
很多物種分布模型給出的結(jié)果是0—1的值,被解釋為物種出現(xiàn)概率[61]或者棲息地適宜性[30]。在環(huán)境保護和野生動物管理實踐中,物種分布有/無的信息比直接的預測出現(xiàn)概率值更直觀和實用[62];另一方面,在對模型預測準確性進行評估時往往需要將物種預測出現(xiàn)概率值轉(zhuǎn)化為物種是否出現(xiàn)的結(jié)果,從而通過對比預測的分布有/無與對應的觀察結(jié)果有/無之間的匹配程度來評估模型的預測表現(xiàn)[63]。因此,需要確定物種出現(xiàn)概率的一個閾值,預測出現(xiàn)概率高于閾值就認為預測結(jié)果是物種會出現(xiàn),否則,就認為預測結(jié)果是物種不會出現(xiàn)[63]。評估模型精度的很多指標是與閾值相關(guān)的。
確定閾值的方法可分為主觀和客觀兩種方式[63]。主觀的方式一般隨意選擇一個數(shù)值作為閾值,比如很多人選擇0.5作為閾值將物種預測出現(xiàn)概率劃分為物種分布出現(xiàn)或不出現(xiàn)[47,63]。也有研究者選擇0.3[64]或者0.05[40]作為閾值。但是選擇0.5作為閾值是有問題的,特別是當物種分布有和無的數(shù)據(jù)量不一致的時候[65]。因此需要采用某些客觀標準來選擇最佳的閾值,主要的原理是選擇的閾值能使觀察值和預測值之間的吻合度最大化。基于不同的預測表現(xiàn)指標,有多種方法可以用來確定最佳閾值[62]。例如,選取使敏感度與特異度之和達到最大時的閾值作為最佳閾值[63,66]。利用受試者工作特征曲線ROC曲線)來確定閾值也越來越受到重視[3,50]。
閾值的確定也和模型應用目的相關(guān),可以通過考察錯誤否定率(FNC)和錯誤肯定率(FPC)的代價矩陣來確定閾值[3]:如果模型用來確立保護區(qū),那么FNC>FPC,需要用特異性來評估模型預測能力;如果模型用來預測瀕危物種的棲息地,那么FNC<FPC[44],因此要用敏感性作為評估模型預測能力的指標。
一旦通過確定預測概率的閾值而將預測結(jié)果分為有/無兩類,可以建立一個2×2的交互表來比較預測情況和實際觀察結(jié)果(圖2)。從觀察結(jié)果與預測結(jié)果2×2分類表中,可以得出用來評估模型預測準確性的一系列指標(表2)[62]。其中,廣泛使用的指標是Kappa、總的預測準確率(OPS)和TSS[62]。Kappa指數(shù)依賴于取樣比例((A+C)/n)),而TSS不依賴于取樣的偏差而且能保留Kappa指數(shù)的優(yōu)點,因而比 Kappa指數(shù)更有優(yōu)勢[71]。
近年來,使用與閾值無關(guān)的指標來衡量模型的精度也很普遍[2],其中最常用的指標是受試者操作曲線下面積(AUC)。AUC在0.5—0.7說明模型表現(xiàn)較差,0.7—0.9說明表現(xiàn)一般,高于0.9說明模型表現(xiàn)良好[63]。因為AUC值與閾值無關(guān),也經(jīng)常用來比較不同物種分布模型的表現(xiàn)[5,43]。
圖2 觀察結(jié)果與預測結(jié)果2×2分類表Fig.2 The 2×2 classification table of observed presence and absence of a species and the predicted presence or absence of a species
表2 由預測結(jié)果二分類變量得出的評估模型準確性的指標Table 2 Indices for assessing the predictive performance of species distribution models
使用獨立數(shù)據(jù)驗證模型的預測表現(xiàn)是利用物種分布有/無的數(shù)據(jù)建立預測模型的關(guān)鍵步驟之一[50]。如果不能或者沒有使用獨立數(shù)據(jù)對模型的預測表現(xiàn)進行評估,那么這種模型就沒有太大的應用價值[72]。但是,一般調(diào)查數(shù)據(jù)的樣本量不可能很大,因此也就沒有足夠多的獨立的數(shù)據(jù)來評估模型預測表現(xiàn)[50]。在獨立數(shù)據(jù)缺乏時,研究者可將一套數(shù)據(jù)分成兩部分,一部分數(shù)據(jù)用來建立模型(稱為訓練數(shù)據(jù)),一部分數(shù)據(jù)用來檢驗模型預測表現(xiàn)(稱為檢驗數(shù)據(jù))。Verbyla和Litaitis提出了訓練數(shù)據(jù)與檢驗數(shù)據(jù)的比例應為的經(jīng)驗法則,式中p為環(huán)境變量的個數(shù)[71]。有些研究者建議在建立模型的過程中使用全部的調(diào)查數(shù)據(jù),但是在評估模型預測準確性時將數(shù)據(jù)以一定的方式分成幾部分[73]或進行重采樣。最流行的數(shù)據(jù)重取樣方式包括拔靴法(Bootstraping),K折交叉檢驗(K-fold Cross-validation),以及刀切法方法[50,74]。拔靴法最早由Efron提出[75],基本方法是從總體樣本中選取多個子樣本出來,通過對子樣本的研究推斷總體樣本特征,抽取出來的子樣本在下次重采樣時將被放回總體樣本中去。K折交叉檢驗的做法是,將數(shù)據(jù)平均分成K等份,每次從中抽取K-1份來建立模型,剩下的1份用來預測,共需重復這樣的步驟K次。刀切法最早由Quenouille提出[76],具體做法是:對于樣本量為n的數(shù)據(jù),每次剔除一個個例,用剩下的n-1個個例來評估模型的參數(shù),重復這樣的步驟n次,得到模型參數(shù)估計的平均值。K折交叉檢驗適用于數(shù)據(jù)量比較充分的情況,而刀切法是其中的一個特例。在數(shù)據(jù)比較稀少的情況下,研究者經(jīng)常使用拔靴法來對數(shù)據(jù)重取樣[2]。
物種分布模型的預測表現(xiàn)主要可以通過兩個方面進行評估:一是模型擬合優(yōu)度,即模型預測值與觀察值之間的擬合程度;二是模型預測準確度,最簡單最常用的指標包括總的預測正確率(表2)、Kappa指數(shù)以及模型能夠正確區(qū)分物種分布有或無的能力[3,50]。模型的區(qū)分能力一般以AUC的值作為指標,其值越接近于1,表示模型區(qū)分物種分布有或無的能力越良好。
利用物種分布有/無數(shù)據(jù)建立模型預測空間分布,是一項較新的、發(fā)展迅速的且已在多個動植物類群廣泛應用的方法。物種分布模型既可以使用物種分布有和無的數(shù)據(jù),也可以僅利用物種分布有的數(shù)據(jù)[38]。因為確認物種無分布往往是困難的或者需要付出巨大的努力來調(diào)查,當前僅利用物種有的信息來建立模型預測分布的應用更為廣泛。博物館、標本館的動植物分布信息,保護區(qū)監(jiān)測取得的動植物點位,以及各種科學調(diào)查(特別是無線電及GPS頸圈以及紅外照相機的廣泛使用)所取得分布數(shù)據(jù),均可以用于物種分布模型,以獲得物種在較精細的尺度上的空間分布格局。物種分布模型能夠用很少的數(shù)據(jù)得到較好的預測結(jié)果[77],節(jié)省了時間、精力及費用,得到的結(jié)果較為可靠,可為保護管理計劃提供科學依據(jù)。
物種分布模型如果能夠?qū)⑸镩g的相互作用(如競爭、捕食、協(xié)作等)以及物種自身的生物學特點(如遷移能力、生活史等)以及人類的干擾等信息考慮進來,則可以提高模型的精度以甄別物種現(xiàn)實生態(tài)位的能力[26,78]。種間作用會限制物種對生態(tài)位的利用。而物種遷移能力影響到物種對潛在生境的利用能力。人類活動的干擾會壓縮物種的生存空間,進一步限制其生態(tài)位空間。
物種分布模型還可用于檢驗進化生物學中的假設(shè)[79-80],如分類地位相近的分類群對氣候條件的容忍性是否相似。系統(tǒng)進化的生態(tài)位保守性假設(shè)指物種傾向于通過穩(wěn)定的自然選擇在進化歷史上保留其基礎(chǔ)生態(tài)位的特征[81]。因此,可以利用物種分布模型,結(jié)合物種的歷史或化石分布數(shù)據(jù)以及大尺度的氣候變量,推測其分布范圍的變化,從而界定物種,尤其是甄別形態(tài)學特征相似的物種[76,82]。這一類結(jié)合系統(tǒng)進化和生物氣候模型的的方法已被命名為“系統(tǒng)進化氣候模型”[83]。
物種分布模型獲得的當前的物種分布范圍或者棲息地適宜性,可為未來的監(jiān)測提供本底數(shù)據(jù)[2]。定期的采用同一套系統(tǒng)方法預測物種分布范圍的變化,可以衡量人類活動對物種及生態(tài)系統(tǒng)的影響程度。氣候變化影響野生動物的地理分布、物候(如鳥類遷徙)、種群大小等[84],是國際上研究者和生物多樣性管理者所關(guān)注的熱點問題之一。物種分布模型可以利用物種分布有和/或無的數(shù)據(jù)預測當前和未來氣候條件下瀕危物種分布范圍的變化。如Turner等[85]通過模型預測,發(fā)現(xiàn)氣候變化可能使溫帶森林喪失48%的面積,并使棲息于其中的15%的物種受到威脅。在全球氣候變化的背景下,生物多樣性的保護的策略必須考慮氣候變化的影響,制定動態(tài)的而非靜態(tài)的保護策略框架[86]。物種分布模型可為這一框架提供預測的依據(jù)。將物種擴散或者遷徙的機制與物種分布模型結(jié)合,能夠改善對氣候變化下物種分布范圍變化的預測[87]。
[1] Nielsen S E,Johnson C J,Heard D C,Boyce M S.Can models of presence-absence be used to scale abundance?Two case studies considering extremes in life history.Ecography,2005,28(2):197-208.
[2] Franklin J.Mapping Species Distributions:Spatial Inference and Prediction.Cambridge:Cambridge University Press,2010.
[3] Fielding A H,Bell J F.A review of methods for the assessment of prediction errors in conservation presence/absence models.Environmental Conservation,1997,24(1):38-49.
[4] MacKenzie D I.What are the issues with presence-absence data for wildlife managers?.Journal of Wildlife Management,2005,69(3):849-860.
[5] Elith J,Graham C H,Anderson R P,Dudík M,F(xiàn)errier S,Guisan A,Hijmans R J,Huettmann F,Leathwick J R,Lehmann A,Li J,Lohmann L G,Loiselle B A,Manion G,Moritz C,Nakamura M,Nakazawa Y,Overton J M M,Peterson A T,Phillips S J,Richardson K,Scachetti-Pereira R,Schapire R E,Soberón J,Williams S,Wisz M S,Zimmermann N E.Novel methods improve prediction of species′distributions from occurrence data.Ecography,2006,29(2):129-151.
[6] Trenham P C,Koenig W D,Mossman M J,Stark S L,Jagger L A.Regional dynamics of wetland-breeding frogs and toads:turnover and synchrony.Ecological Applications,2003,13(6):1522-1532.
[7] Weber D,Hintermann U,Zangger A.Scale and trends in species richness:considerations for monitoring biological diversity for political purposes.Global Ecology and Biogeography,2004,13(2):97-104.
[8] Straw J A Jr,Wakeley J S,Hudgins J E.A model for management of diurnal habitat for American woodcock in Pennsylvania.The Journal of Wildlife Management,1986,50(3):378-383.
[9] Franco A M A,Brito J C,Almeida J.Modelling habitat selection of Common Cranes Grus grus wintering in Portugal using multiple logistic regression.Ibis,2000,142(3):351-358.
[10] Mladenoff D J,Sickley T A,Wydeven A P.Predicting gray wolf landscape recolonization:logistic regression models vs.new field data.Ecological Applications,1999,9(1):37-44.
[11] Pyare S,Berger J.Beyond demography and delisting:ecological recovery for Yellowstone′s grizzly bears and wolves.Biological Conservation,2003,113(1):63-73.
[12] Ball L C,Doherty PF Jr,McDonald M W.An occupancy modeling approach to evaluating a Palm Springs ground squirrel habitat model.Journal of Wildlife Management,2005,69(3):894-904.
[13] Knapp R A,Matthews K R,Preisler H K,Jellison R.Developing probabilistic models to predict amphibian site occupancy in a patchy landscape.Ecological Applications,2003,13(4):1069-1082.
[14] Mac Nally R,F(xiàn)leishman E.A successful predictive model of species richness based on indicator species.Conservation biology,2004,18(3):646-654.
[15] Dreisbach T A,Smith J E,Molina R.Challenges of modeling fungal habitat:when and where do you find chanterelles//Scott J M,Heglund P J,Morrison M L,eds.Predicting Species Occurrence:Issues of Accuracy and Scale.Washington DC:Island Press,2002:475-481.
[16] Austin M P,Nicholls A O,Margules C R.Measurement of the realized qualitative niche:environmental niches of five Eucalyptus species.Ecological Monographs,1990,60(2):161-177.
[17] Zuo W Y,Lao N,Geng Y Y,Ma K P.Predicting species′potential distribution—SVM compared with GARP.Journal of Plant Ecology,2007,31(4):711-719.
[18] Ferrier S.Mapping spatial pattern in biodiversity for regional conservation planning:where to from here?Systematic Biology,2002,51(2):331-363.
[19] Skov F,Svenning J C.Potential impact of climatic change on the distribution of forest herbs in Europe.Ecography,2004,27(3):366-380.
[20] Graham C H,Ron S R,Santos J C,Schneider C J,Moritz C.Integrating phylogenetics and environmental niche models to explore speciation mechanisms in dendrobatid frogs.Evolution,2004,58(8):1781-1793.
[21] Stanley T R,Royle J A.Estimating site occupancy and abundance using indirect detection indices.The Journal of Wildlife Management,2005,69(3):874-883.
[22] Guisan A,Lehmann A,F(xiàn)errier S,Austin M,Overton J MC C,Aspinall R,Hastie T.Making better biogeographical predictions of species′distributions.Journal of Applied Ecology,2006,43(3):386-392.
[23] Guisan A,Thuiller W.Predicting species distribution:offering more than simple habitat models.Ecology Letters,2005,8(9):993-1009.
[24] Elton C S.Animal Ecology.Chicago:University of Chicago Press,1927.
[25] Hutchinson M F.Methods of generation of weather sequences//Bunting A H,ed.Agricultural Environments:Characterization,Classification and Mapping.Wallingford:CAB,International,1987:149-157.
[26] Austin M P.Spatial prediction of species distribution:an interface between ecological theory and statistical modelling.Ecological Modelling,2002,157(2/3):101-118.
[27] Soberón J,Peterson A T.Interpretation of models of fundamental ecological niches and species′distributional areas.Biodiversity Informatics,2005,2:1-10.
[28] Hirzel A H,Le Lay G.Habitat suitability modeling and niche theory.Journal of Applied Ecology,2008,45(5):1372-1381.
[29] Cawsey E M,Austin M P,Baker B L.Regional vegetation mapping in Australia:a case study in the practical use of statistical modelling.Biodiversity and Conservation,2002,11(12):2239-2274.
[30] Hirzel A,Guisan A.Which is the optimal sampling strategy for habitat suitability modelling.Ecological Modelling,2002,157(2/3):331-341.
[31] Liu F,McShea W,Garshelis D,Zhu X J,Wang D J,Gong J E,Chen Y P.Spatial distribution as a measure of conservation needs:an example with Asiatic black bears in south-western China.Diversity and Distributions,2009,15(4):649-659.
[32] Barlow A C D,Ahmed M I U,Rahman M M,Howlader A,Smith A C,Smith J L D.Linking monitoring and intervention for improved management of tigers in the Sundarbans of Bangladesh.Biological Conservation 2008,141(8):2032-2040.
[33] Sargeant G A,Sovada M A,Slivinsk C C,Johnson D H.Markov chain Monte Carlo estimation of species distributions:a case study of the swift fox in western Kansas.Journal of Wildlife Management,2005,69(2):483-497.
[34] Tyre A J,Tenhumberg B,F(xiàn)ield S A,Niejalke D,Parris K,Possingham H P.Improving precision and reducing bias in biological surveys:estimating false-negative error rates.Ecological Applications,2003,13(6):1790-1801.
[35] Azuma D L,Baldwin J A,Noon B R.Estimating the occupancy of spotted owl habitat areas by sampling and adjusting for bias.Berkeley,CA:US Dept.of Agriculture,F(xiàn)orest Service,Pacific Southwest Research Station,1990.
[36] MacKenzie D I,Royle J A.Designing occupancy studies:general advice and allocating survey effort.Journal of Applied Ecology,2005,42(6):1105-1114.
[37] Graham C H,F(xiàn)errier S,Huettman F,Moritz C,Peterson A T.New developments in museum-based informatics and applications in biodiversity analysis.Trends in Ecology and Evolution,2004,19(9):497-503.
[38] Brotons L,Thuiller W,Araújo M B,Hirzel A H.Presence-absence versus presence-only modelling methods for predicting bird habitat suitability.Ecography,2004,27(4):437-448.
[39] Phillips S J,Dudík M,Elith J,Graham C H,Lehmann A,Leathwick J,F(xiàn)errier S.Sample selection bias and presence-only distribution models:implications for background and pseudo-absence data.Ecological Applications,2009,19(1):181-197.
[40] Cumming G S.Using habitat models to map diversity:pan-African species richness of ticks(Acari:Ixodida).Journal of Biogeography,2000,27(2):425-440.
[41] Stockwell D R B,Peterson A T.Effects of sample size on accuracy of species distribution models.Ecological Modelling,2002,148(1):1-13.
[42] Loiselle B A,J?rgensen P M,Consiglio T,Jiménez I,Blake J G,Lohmann L G,Montiel O M.Predicting species distributions from herbarium collections:does climate bias in collection sampling influence model outcomes?.Journal of Biogeography,2008,35(1):105-116.
[43] Wisz M S,Hijmans R J,Li J,Peterson A T,Graham C H,Guisan A.Effects of sample size on the performance of species distribution models.Diversity and Distributions,2008,14(5):763-773.
[44] Coudun C,Gégout J C.Quantitative prediction of the distribution and abundance of Vaccinium myrtillus with climatic and edaphic factors.Journal of Vegetation Science,2007,18(4):517-524.
[45] Guisan A,Weiss S B,Weiss A D.GLM versus CCA spatial modeling of plant species distribution.Plant Ecology,1999,143(1):107-122.
[46] Moisen G G,F(xiàn)rescino T S.Comparing five modelling techniques for predicting forest characteristics.Ecological Modelling,2002,157(2/3):209-225.
[47] Manel S,Dias J M,Ormerod S J.Comparing discriminant analysis,neural networks and logistic regression for predicting species distributions:a case study with a Himalayan river bird.Ecological Modelling,1999,120(2/3):337-347.
[48] Patterson D.Artificial Neural Networks.Singapore:Prentice Hall,1996.
[49] Stockwell D,Peters D.The GARP modelling system:problems and solutions to automated spatial prediction.International Journal of Geographical Information Science,1999,13(2):143-158.
[50] Pearce J,F(xiàn)errier S.Evaluating the predictive performance of habitat models developed using logistic regression.Ecological Modelling,2000,133(3):225-245.
[51] Brito J C,Crespo E G,Paulo O S.Modelling wildlife distributions:logistic multiple regression vs overlap analysis.Ecography,1999,22(3):251-260.
[52] Augustin N H,Cummins R P,F(xiàn)rench D D.Exploring spatial vegetation dynamics using logistic regression and a multinomial logit model.Journal of Applied Ecology 2001,38(5):991-1006.
[53] Busby J R.BIOCLIM-a bioclimate analysis and prediction system//Margules C R,Austin M P,eds.Nature Conservation.Victoria,Australia:CSIRO,1991:64-68.
[54] Carpenter G,Gillison A N,Winter J.DOMAIN:a flexible modelling procedure for mapping potential distributions of plants and animals.Biodiversity and Conservation,1993,2(6):667-680.
[55] Phillips S J,Anderson R P,Schapire R E.Maximum entropy modeling of species geographic distributions.Ecological Modelling,2006,190(3/4):231-259.
[56] Wang J C,Guo Z G.Logistic Regression Model——Methods and Applications.Beijing:China Higher Education Press,2001.
[57] Akaike H.A Bayesian extension of the minimum AIC procedure of autoregressive model fitting.Biometrika,1979,66(2):237-242.
[58] Burnham K P,Anderson D R.Model Selection and Multi-Model Inference:A Practical Information-Theoretic Approach.2nd ed.New York:Springer,2002.
[59] Schwarz G.Estimating the dimension of a model.Annals of Statistics,1978,6(2):461-464.
[60] Anderson D R,Burnham K P,White G C.AIC model selection in overdispersed capture-recapture data.Ecology 1994,75(6):1780-1793.
[61] Scott J M,Heglund P,Morrison M L.Predicting Species Occurrences:Issues of Accuracy and Scale.Washington:Island Press,2002.
[62] Liu C R,Berry P M,Dawson T P,Pearson R G.Selecting thresholds of occurrence in the prediction of species distributions.Ecography,2005,28(3):385-393.
[63] Manel S,Williams H C,Ormerod S J.Evaluating presence-absence models in ecology:the need to account for prevalence.Journal of Applied Ecology,2001,38(5):921-931.
[64] Robertson M P,Caithness N,Villet M H.A PCA-based modelling technique for predicting environmental suitability for organisms from presence records.Diversity and Distributions,2001,7(1/2):15-27.
[65] Cramer J S.Logit Models from Economics and Other Fields.Cambridge:Cambridge University Press,2003.
[66] Cantor S B,Sun C C,Tortolero-Luna G,Richards-Kortum R,F(xiàn)ollen M.A comparison of C/B ratios from studies using receiver operating characteristic curve analysis.Journal of Clinical Epidemiology,1999,52(9):885-892.
[67] Hastie T,Tibshirani R,Buja A.Flexible discriminant analysis by optimal scoring.Journal of the American statistical association,1994:1255-1270.
[68] Pearson R G,Dawson T P,Berry P M.SPECIES:a spatial evaluation of climate impact on the envelope of species.Ecological Modelling,2002,154:289-300.
[69] Austin M P.Spatial prediction of species distribution:an interface between ecological theory and statistical modelling.Ecological modelling,2002,157:101-118.
[70] Murray J V,Goldizen A W,O′Leary R A,et al.How useful is expert opinion for predicting the distribution of a species within and beyond the region of expertise?A case study using brush-tailed rock-wallabies Petrogale penicillata.Journal of Applied Ecology,2009,46:842-851.
[71] Allouche O,Tsoar A,Kadmon R.Assessing the accuracy of species distribution models:prevalence,kappa and the true skill statistic(TSS).Journal of Applied Ecology,2006,43(6):1223-1232.
[72] Verbyla D L,Litvaitis J A.Resampling methods for evaluating classification accuracy of wildlife habitat models.Environmental Management,1989,13(6):783-787.
[73] Rencher A C.Methods of Multivariate Analysis.New York:Wiley,1995.
[74] Shao J,Tu D S.The Jackknife and Bootstrap.New York:Springer,1995.
[75] Efron B.Bootstrap methods:another look at the jackknife.The Annals of Statistics,1979,7(1):1-26.
[76] Quenouille M H.Approximate tests of correlation in time-series.Journal of the Royal Statistical Society,Series B:Methodological,1949,11(1):68-84.
[77] Pearson R G,Raxworthy C J,Nakamura M,Peterson A T.Predicting species′distributions from small numbers of occurrence records:a test case using cryptic geckos in Madagascar.Journal of Biogeography,2007,34(1):102-117.
[78] Chase J M,Leibold M A.Ecological Niches:Linking Classical and Contemporary Approaches.Chicago:Chicago University Press,2003.
[79] Ree R H,Moore B R,Webb C O,Donoghue M J.A likelihood framework for inferring the evolution of geographic range on phylogenetic trees.Evolution,2005,59(11):2299-2311.
[80] Peterson A T,Nyari A S.Ecological niche conservatism and Pleistocene refugia in the thrush-like mourner,Schiffornis sp.,in the neotropics.Evolution,2008,62(1):173-183.
[81] Wiens J J,Graham C H.Niche conservatism:integrating evolution,ecology,and conservation biology.Annual Review of Ecology,Evolution,and Systematics,2005,36:519-539.
[82] Bond J E,Stockman A K.An integrative method for delimiting cohesion species:finding the population-species interface in a group of Californian trapdoor spiders with extreme genetic divergence and geographic structuring.Systematic Biology,2008,57(4):628-646.
[83] Yesson C,Cullham A.Phyloclimatic modeling:combining phylogenetics and bioclimatic modeling.Systematic Biology,2006,55(5):785-802.
[84] Walther G R,Post E,Convey P,Menzel A,Parmesan C,Beebee T C J,F(xiàn)romentin J M,Hoegh-Guldberg O,Bairlein F.Ecological responses to recent climate change.Nature,2004,416(6879):389-395.
[85] Turner W R,Oppenheimer M,Wilcove D S.A force to fight global warming.Nature,2009,462(7271):278-279.
[86] Hannah L.A global conservation system for climate-change adaptation.Conservation Biology,2009,24(1):70-77.
[87] Thuiller W,Albert C,Araújo M B,Berry P M,Cabeza M,Guisan A,Hickler T,Midgley G F,Paterson J,Schurr F M,Sykes M T,Zimmermann N E.Predicting global change impacts on plant species′distributions:future challenges.Perspectives in Plant Ecology,Evolution and Systematics,2008,9(3/4):137-152.
參考文獻:
[17] 左聞韻,勞逆,耿玉英,馬克平.預測物種潛在分布區(qū)——比較SVM與GARP.植物生態(tài)學報,2007,31(4):711-719.
[85] 王濟川,郭志剛.Logistic回歸模型——方法與應用.北京:中國高等教育出版社,2001.