王凱莉,陳佳欣,范雪
1.安徽農(nóng)業(yè)大學(xué) 資源與環(huán)境學(xué)院,安徽 合肥,230036 2.中國科學(xué)院植物研究所,北京 100093
薔薇科 (Rosaleae) 屬種子植物門被子植物亞門雙子葉植物綱薔薇目,全世界共有 124 屬 3300 余種,廣布于全球,北溫帶地區(qū)分布較多[1]。薔薇科植物一直備受各國學(xué)者的關(guān)注,我國約有 51 屬 1000 多種,也是薔薇科植物的分布中心[2]。薔薇科植物具有很高的經(jīng)濟(jì)價值和生態(tài)價值,包括觀賞價值、藥用價值、食用價值以及大氣污染物的檢測治理,與此同時富饒的物種資源、較強的生態(tài)適應(yīng)能力、多樣化的景觀效果以及深厚的文化內(nèi)涵使得薔薇科植物成為生產(chǎn)生活中必不可少的一部分,因此科研人員致力于薔薇科植物方面的相關(guān)研究。例如,常見薔薇科植物對大氣中的氟化物吸收累計特征的研究中表明研究所選取的薔薇科植物屬于氟化物敏感物種, 特別是紅葉李、桃等吸收累積氟化物的能力較強,基本適宜用于氟污染的監(jiān)測和治理工程中[3];各地區(qū)薔薇科植物木本資源的觀賞及園林應(yīng)用的研究結(jié)果顯示為在各地區(qū)的城市景觀建設(shè)與園林應(yīng)用中,薔薇科植物十分普遍。近些年來,記載物種分布的標(biāo)本記錄數(shù)據(jù)被廣泛地應(yīng)用于開展經(jīng)典的生物地理學(xué)和保護(hù)生物學(xué)領(lǐng)域的研究,郭書賢等 (2007) 通過調(diào)查并結(jié)合有關(guān)文獻(xiàn)和植物標(biāo)本的資料,對青海幾種重要薔薇科野生果樹資源進(jìn)行了評價,并提出了開發(fā)利用以及保護(hù)的建議[4]。宋敏麗等 (2010) 根據(jù)歷山植物野外實習(xí)調(diào)查、標(biāo)本的采集和鑒定以及歷山標(biāo)本館標(biāo)本的相關(guān)資料,統(tǒng)計歷山薔薇科植物亞科、屬、種的數(shù)量、生活型及地理分布,對歷山自然保護(hù)區(qū)薔薇科植物區(qū)系分布區(qū)類型進(jìn)行劃分[5]。
植物標(biāo)本是研究各植物類群的起源,演化及時空動態(tài)的基本參考資料。采集人員在標(biāo)本采集的過程中往往會因為地理條件、氣候和個人的主觀意識而出現(xiàn)采集偏差,導(dǎo)致采集地區(qū)分布不均勻,部分地區(qū)采集遺漏,或采集數(shù)量過少導(dǎo)致數(shù)據(jù)不完整,例如常見種和具有較高的科研、經(jīng)濟(jì)和觀賞價值的植物在采集過程中會受到偏愛,這是物種分布數(shù)據(jù)庫普遍存在的地理性采集偏差[6]。由于采集的地理偏差的存在,許多物種的地理分布信息沒有完全記錄[7];在小尺度上,地區(qū)的物種名錄往往不完全的,把它稱為名錄不完整性。有相關(guān)的研究表明地理性的采集偏差會影響人們對生物多樣性格局的認(rèn)識,基于原始的物種分布數(shù)據(jù)得出的物種豐富度格局往往是不真實甚至是扭曲的[8-9]。其次,由于薔薇科植物標(biāo)本采集數(shù)據(jù)是其他有關(guān)數(shù)據(jù)分析的分析基礎(chǔ),所以數(shù)據(jù)的不完整性會使后續(xù)的研究結(jié)果產(chǎn)生誤差。而大多數(shù)的研究人員是直接應(yīng)用數(shù)據(jù)進(jìn)行研究分析,很少會有人去對數(shù)據(jù)進(jìn)行檢測和評估,當(dāng)前針對薔薇科植物標(biāo)本采集地理性偏差和采集完整性的評估研究較為缺乏。本研究以中國薔薇科植物標(biāo)本采集記錄為研究對象,依據(jù) (1) 標(biāo)本記錄數(shù)量;(2) 物種豐富度記錄數(shù);(3) 物種豐富度估計值;(4) 估計值與記錄數(shù)之間的差值;(5) 物種累積曲線末端 10% 的斜率這五個方面對標(biāo)本采集完整程度進(jìn)行評估分析。擬解決植物標(biāo)本記錄的采集強度不均衡所帶來的誤差,減小植物采集數(shù)據(jù)對后期研究結(jié)果的影響,對指導(dǎo)野外標(biāo)本的采集、生物多樣性空間格局研究以及薔薇科植物保護(hù)策略制定等領(lǐng)域有著重要的借鑒意義。
1.1.1 數(shù)字化標(biāo)本記錄的獲取與篩選
本研究中選取的薔薇科植物數(shù)字化標(biāo)本信息均從“中國國家標(biāo)本資源共享平臺 (National Specimen Information Infrastructure,”NSII (http://www.nsii.org.cn/) 以及其下的全部子平臺系統(tǒng)數(shù)據(jù)庫中獲得 (圖 1)。NSII 平臺數(shù)據(jù)是實時更新的,開始處理數(shù)據(jù)時獲取薔薇科植物標(biāo)本的詳細(xì)信息約 605640 份,這些標(biāo)本信息是由全國近 200 家單位提供。經(jīng)過初步的篩選,選取了 474166 份薔薇科植物的標(biāo)本采集記錄,包括序列編號、科名、種名、所屬國家、省名以及縣名。
為避免異常數(shù)據(jù)的干擾,進(jìn)一步對初步篩選出的標(biāo)本記錄進(jìn)行了校對,具體步驟如下:(1) 以數(shù)據(jù)庫中唯一的序列編號為標(biāo)準(zhǔn),對于重復(fù)輸入的標(biāo)本記錄進(jìn)行確認(rèn)并刪除保留唯一記錄;(2) 植物學(xué)拉丁名校正,主要利用網(wǎng)站 (http://tnrs.iplantcollaborative.org/TNRSapp.html) 對薔薇科植物標(biāo)本拉丁名進(jìn)行剔除錯誤數(shù)據(jù)與標(biāo)準(zhǔn)化,將查詢標(biāo)本拉丁名準(zhǔn)確率結(jié)果顯示在 0.9 以下的標(biāo)本數(shù)據(jù)剔除,準(zhǔn)確率在 0.9 以上的替換為正確拉丁名;(3) 對于采集于中國行政轄區(qū)以外的記錄和栽培記錄進(jìn)行確認(rèn)并進(jìn)行刪除;(4) 采集地點在自然保護(hù)區(qū)內(nèi)的標(biāo)本記錄,根據(jù)電子地圖查詢自然保護(hù)區(qū)所在地,若完整保護(hù)區(qū)在某個縣級地區(qū)內(nèi),將保護(hù)區(qū)名改為該縣名。(5) 依據(jù)我國最新的行政區(qū)劃圖對縣名進(jìn)行校對,統(tǒng)一縣的名稱。部分舊縣名經(jīng)歷行政區(qū)劃的合并和重新劃分,經(jīng)查找其歷史沿革后,確定最新的縣名。
圖1 薔薇科植物標(biāo)本館藏分布統(tǒng)計圖Fig.1 Institutional preservation of Rosaceae specimen
1.2.1 物種豐富度與 Chao1 估計
對于某個地區(qū)而言,由于稀有種的存在和野外調(diào)查限制,被記錄的物種數(shù)量一般要少于真實存在的物種數(shù)量。因此,利用物種豐富度估計模型 (species richness estimator) Chao1 來估計中國每個縣真實的薔薇科植物物種數(shù)量,采用 Chao1 指數(shù)評估每個生境類型中真實的薔薇科植物物種豐富度。Chao1 在生態(tài)學(xué)中常用來估計物種總數(shù),由 Chao (1984) 最早提出,Chao1 指數(shù)是用來反映物種豐富度的指標(biāo)。它通過觀測到的結(jié)果推算出一個理論的豐富度,這個豐富度更接近真實的豐富度。Chao1 值越大代表物種總數(shù)越多。它僅使用單數(shù)和雙數(shù)的數(shù)量來估計未檢測到的物種的數(shù)量。Chao1 指數(shù)是基于這樣一種假設(shè):在一個群體中隨機抽樣,當(dāng)稀有的物種 (singletons) 依然不斷的被發(fā)現(xiàn)時,則表明還有一些稀有的物種沒有被發(fā)現(xiàn);直到所有物種至少被抽到兩次 (doubletons) 時,則表明不會再有新的物種被發(fā)現(xiàn)。Chao1 的估計是根據(jù)已有取樣中物種個體數(shù)量的分布頻率來進(jìn)行的[10-11],當(dāng)取樣中每個物種都是兩個或兩個以上的個體時,Chao1 認(rèn)為該地區(qū)的取樣比較完全;而當(dāng)取樣中有物種只有一個個體時,Chao1 認(rèn)為該地區(qū)仍有新物種有待發(fā)現(xiàn)。
Chao1 指數(shù)計算公式為:
其中,Sobs是觀測到的物種數(shù)量,F(xiàn)1是取樣中只有一個個體的物種數(shù)量,F(xiàn)2是只有兩個個體的物種數(shù)量。
從公式可以得知當(dāng)每個縣中稀有種數(shù)量越多,根據(jù) Chao1 認(rèn)為該地區(qū)新物種未被發(fā)現(xiàn)的概率越大;而每個縣中稀有種數(shù)量越少,根據(jù) Chao1 認(rèn)為該地區(qū)新物種未被發(fā)現(xiàn)的概率越小。一般來講能觀測到的物種豐富度肯定會比實際少,兩者之間的差距通過對 singletons 和 doubletons 進(jìn)行了合理的推算,分析chao1經(jīng)典公式的后半段 (F1^2)/(2*F2) 可以得知 F1^2比2*F2 變化的速度更快。綜上,Chao1是度量物種豐富度的指標(biāo),它和豐度、均勻度無關(guān),但是它對稀有的物種很敏感。
1.2.2 標(biāo)本采集記錄完整性評估
用兩種方法來評估薔薇科植物物種在每個縣的采集數(shù)據(jù)的不完整程度。第一種方法計算每個縣觀測的物種數(shù)量和 Chao1 估計的物種數(shù)量之間的差值來表示某一個縣物種在該地的采集數(shù)據(jù)的不完整程度。第二種方法是利用物種累積曲線的彎曲程度來表示物種的不完整程度。物種累積曲線 (species accumulation curve,SAC) 用于描述隨著抽樣量的的加大物種增加的狀況,它以抽樣量作為橫坐標(biāo),以物種數(shù)目作為縱坐標(biāo),將每一抽樣量所對應(yīng)的物種數(shù)目在坐標(biāo)系中標(biāo)出并連起來,就得到了一條曲線。在生物多樣性和群落調(diào)查中,科研人員用物種累積曲線對抽樣量是否充分進(jìn)行判斷以及對物種豐富度的估計。它記錄了繼續(xù)抽樣下新物種出現(xiàn)的概率,是理解調(diào)查樣地物種組成和預(yù)測物種豐富度的有效工具。抽樣量可以用多種形式來表現(xiàn),包括樣本數(shù)量,個體數(shù)量,采集時間等等,本文抽樣量是薔薇科植物標(biāo)本記錄數(shù)。物種累積曲線具有以下特點:在一定的抽樣范圍內(nèi),隨著抽樣量的加大,群落中大量的物種被發(fā)現(xiàn),物種積累速率較快,曲線表現(xiàn)為急劇上升;至某一抽樣量,物種積累速率變的緩慢,曲線不再急劇上升而是趨于平緩。根據(jù)這一特點,可對抽樣量是否充分進(jìn)行判斷,如果曲線一直急劇上升,幾乎為直線,表明抽樣量不足,需要增加抽樣量; 如果曲線在急劇上升后變?yōu)橐粷u近線,上升舒緩,則表明抽樣充分,可進(jìn)行數(shù)據(jù)分析[12-14]。計算物種累積曲線末端 10% 部分的平均斜率來表示物種各累積曲線的彎曲程度,代表某個縣名錄的不完整程度。當(dāng)斜率值近于 0 時,說明取樣較為完整,而當(dāng)斜率近于 1 時,說明取樣十分不完整。該斜率值還意味著如果采集繼續(xù)時,有新種增加到取樣的概率。
定義一個域值 0.05,當(dāng)斜率值小于或等于 0.05 (SAC slope ≤ 0.05) 時,認(rèn)為縣的名錄較為完整,斜率值大于 0.05 (SACslope > 0.05) 時,認(rèn)為名錄不完整。由于客觀原因,大多數(shù)生物多樣性和群落調(diào)查無法做到全面系統(tǒng)的調(diào)查,只能是抽樣調(diào)查。而抽樣調(diào)查總是很難完全的反映實際存在的物種數(shù)目,對未知地區(qū)進(jìn)行調(diào)查時往往缺乏全面準(zhǔn)確的方法,通常是根據(jù)經(jīng)驗設(shè)計抽樣調(diào)查的方案,卻沒有對抽樣量是否充分進(jìn)行考察,就不能確定調(diào)查結(jié)果是否能夠真實反映物種存在的狀況,其科學(xué)性就令人置疑。因此,需要通過物種累積曲線來判斷抽樣量是否充分。將名錄不完整的縣 (SAC slope > 0.05) 按照名錄的不完整程度高低逐漸排除出去,每排除一些縣,把剩下的縣作為一個數(shù)據(jù)子集 (data subset),一直到只有名錄完整的縣 (SAC slope ≤ 0.05) 留下,這樣一共得到了4個數(shù)據(jù)子集,分別略微不完整 (0.05 < SAC slope ≤ 0.30)、相對不完整 (0.30 < SAC slope ≤ 0.55)、十分不完整 (0.55 < SAC slope ≤ 0.80)、極其不完整 (SAC slope > 0.80)。
前期初步選取的 474166 份標(biāo)本信息在統(tǒng)計分析之前,經(jīng)過認(rèn)真仔細(xì)的處理得到符合要求的數(shù)據(jù)是 370543 份,遍布 1164 個縣,該標(biāo)本數(shù)據(jù)所在縣涵蓋 32 個省,占全國省份的 94.12%。根據(jù)統(tǒng)計,標(biāo)本記錄數(shù)最多的是四川省、云南省,最少的記錄數(shù)是臺灣省 (圖 2)。標(biāo)本數(shù)量最多的縣級市是四川省峨眉山市,有 12151 份標(biāo)本 (圖 3)。中國縣級地區(qū)2377個,有 22% 的縣 (n = 428) 沒有標(biāo)本記錄。24% 的縣 (n = 564) 標(biāo)本數(shù)量少于 11 (圖 4-A)。沒有標(biāo)本記錄或標(biāo)本記錄數(shù)很少的縣大多分布在青海省、甘肅省、新疆維吾爾自治區(qū)、西藏自治區(qū)以及內(nèi)蒙古自治區(qū)等偏遠(yuǎn)地區(qū)。在中國還沒實施針對縣級水平的植物調(diào)查時。采集地點的選擇一般是根據(jù)采集者的經(jīng)驗決定,采集主要集中在物種豐富度高的地區(qū),如西南地區(qū)的四川省、重慶市、云南省和華南地區(qū)的廣東省,廣西省以及華中地區(qū)的湖南省,湖北省。而偏遠(yuǎn)地區(qū)的采集強度較低,如西北地區(qū)的新疆維吾爾自治區(qū)、青海省、甘肅省、寧夏和東北地區(qū)。
根據(jù)圖表可知,薔薇科物種豐富度較高的數(shù)據(jù)分布在西南地區(qū)。物種數(shù)量較多的縣是四川省峨眉山市以及重慶市的南川縣級市,每個縣記錄的物種數(shù)量最少為 10 個,最多為 481 個。四川、重慶一帶的物種豐富度記錄數(shù)與估計的理論值普遍高于其他地區(qū),這是因為其中包含了自然保護(hù)區(qū)、風(fēng)景區(qū)、四川大學(xué)標(biāo)本館、重慶自然保護(hù)館等 (圖 4-B,圖 4-C)。利用每個縣觀測記錄到的物種數(shù)量和 Chao1 估計的物種數(shù)量之間的差值來表示某一個縣物種在該地的采集完整程度。物種豐富度的原始記錄數(shù)與 Chao1估計數(shù)差值越大,說明該地發(fā)現(xiàn)稀有種的概率越大;原始記錄數(shù)與 Chao1估計數(shù)差值越小,說明該地發(fā)現(xiàn)稀有種的概率越小。當(dāng)差值大于 0 時,表明該地區(qū)標(biāo)本采集不完整,還有未被發(fā)現(xiàn)的新物種等待著采集記錄,需要對采集不完整的地區(qū)加大采集強度;當(dāng)差值為 0 時,表明該地區(qū)的標(biāo)本采集完整。通過對薔薇科植物標(biāo)本數(shù)據(jù)的統(tǒng)計分析得知采集完整的縣主要分布在西南地區(qū),分別是勃利縣、大邑縣、關(guān)嶺布依族苗族自治縣、偏關(guān)縣、仁壽縣、銅梁縣、西吉縣、資中縣、達(dá)川市、桂林市市轄區(qū)、虹橋區(qū)。 (表 1,圖 4-D)
縣級名錄不完整程度指數(shù) (用物種累積曲線末端斜率值 SACslope 來表示) 在 0.006135 和 0.882353 之間變化,其中有 53 個縣 (占數(shù)據(jù)統(tǒng)計分析縣的 4.5%) 的斜率值小于或等于 0.05,可以認(rèn)為是名錄較為完整的縣。這些完整的縣所在的省份分別是黑龍江、重慶、浙江、新疆、西藏、四川、上海、陜西、山西、山東、青海、寧夏、內(nèi)蒙古、江西、湖南、河南、河北、廣西、廣東、甘肅 (圖 4-E)。而1111個采集不完整的縣中,略微不完整 (0.05<SACslope≤0.30) 的縣數(shù)遠(yuǎn)大于極其不完整 (SACslope>0.80) 的縣,表明薔薇科植物標(biāo)本數(shù)據(jù)具有一定的利用價值,其可信程度相對較高 (圖 5)。但科研人員在利用這些數(shù)據(jù)進(jìn)行相關(guān)的生態(tài)分析時,也會造成結(jié)果的不準(zhǔn)確性,所以薔薇科縣級的植物物種名錄有待于完善,在以后的薔薇科植物標(biāo)本采集的方案制定中應(yīng)完善略微不完整縣的采集,加強極其不完整的縣的采集工作。
圖2 各省薔薇科植物標(biāo)本記錄數(shù)Fig.2 Specimen records of Rosaceae plants in each province
圖3 薔薇科植物標(biāo)本數(shù)量排名前 20 的縣 (縣級市,縣級區(qū))Fig.3 The top 20 counties of the Rosaceae plant specimens (county-level cities, county-level districts)
圖5 不完整縣的梯度圖Fig.5 Graph showing the gradients of counties with incomplete collection
使用兩種方法來評估每個縣物種名錄的不完整程度。第一種方法計算縣的記錄物種數(shù)量和 Chao1 估計的理論值之間的差值來表示某一個縣物種名錄的不完整程度。這種方法必須先利用 CHAO1 模型估計每個分析地“真實”的物種豐富度。然而,對于采集數(shù)量很少的地區(qū),物種豐富度的估計往往是不可靠的,為了克服這個問題,采用了第二種方法就是利用物種累積曲線末端斜率作為物種名錄完整程度指數(shù)。該方法的優(yōu)點是不需要估計地區(qū)“真實”的物種豐富度,因此對于取樣嚴(yán)重不足的地區(qū)同樣適用。
表1 各縣薔薇科植物的豐富度記錄數(shù)、CHAO1 估計值、殘差Table 1 Richness records, CHAO1 estimates, and residuals of Rosaceae plants in each county
根據(jù)兩種評估物種名錄完整性的方法可知,薔薇科植物標(biāo)本記錄的縣級植物名錄 95.5% (n =1111) 是不完整的。對于中國植物物種如此豐富的國家,在縣級水平名錄不完整程度高的原因可能是中國植物采集的歷史相對較短和標(biāo)本總體數(shù)量不足有關(guān)[15]。結(jié)合采集的地理偏差可知,在不同省份地區(qū)的采集強度不均衡,或是在同一省份的不同縣級地區(qū)采集力度不一致,都會導(dǎo)致數(shù)據(jù)的不完整,因為采集不全面的影響,數(shù)據(jù)庫只包括一部分植物標(biāo)本,并且每年還有一些新類群被不斷發(fā)現(xiàn),說明目前的物種名錄還是不完全的,而這些信息是生物地理和生態(tài)學(xué)研究的數(shù)據(jù)基礎(chǔ),也是評估物種生存狀況和保護(hù)等級的重要依據(jù)[16-17]?,F(xiàn)有數(shù)據(jù)得出的物種豐富度可能不是真實的。因此建議在使用物種分布數(shù)據(jù)之前應(yīng)該評估數(shù)據(jù)的質(zhì)量,以確保分析結(jié)果的可靠性。
本研究選取國家標(biāo)本資源共享平臺收錄的薔薇科植物標(biāo)本記錄數(shù)據(jù),對其進(jìn)行一系列的處理,得知標(biāo)本采集強度不均衡和采集地理偏差對縣級名錄的采集完整度有影響。根據(jù)標(biāo)本采集地理偏差分析的結(jié)果可知現(xiàn)階段需要將中國的薔薇科植物每個物種的縣級地理分布信息名錄趨于完整,增加對新類群發(fā)現(xiàn)熱點地區(qū)的采集。這意味著有必要開展針對縣級的物種名錄清查工作,逐漸完善縣級的植物物種名錄。因此,有必要繼續(xù)增加在野外調(diào)查和采集和標(biāo)本館管理等方面的人力、物力和財力的投入,基于現(xiàn)有的標(biāo)本采集信息,開展更細(xì)致深入的研究,找出采集薄弱的地區(qū)和類群,作為未來植物調(diào)查的重點。