王 謝,張建華
(四川省農(nóng)業(yè)科學(xué)院土壤肥料研究所,四川成都 610066)
?
植物葉片形態(tài)學(xué)特征全自動提取的難點
王 謝,張建華*
(四川省農(nóng)業(yè)科學(xué)院土壤肥料研究所,四川成都 610066)
摘 要:葉片形態(tài)是植物適應(yīng)生存環(huán)境的重要表征之一,如何準確、高效地獲取葉片形態(tài)資料是當前植物葉片形態(tài)學(xué)研究方法和研究技術(shù)發(fā)展的主要驅(qū)動力。由于傳統(tǒng)方法大多存在費時費力、測量指標有限等弊端,研究者們希望能夠利用計算機技術(shù)對葉片形態(tài)學(xué)特征進行全自動化提取。文章總結(jié)了當前葉片形態(tài)學(xué)特征研究的主要方法和計算機圖像分析的原理和使用經(jīng)驗,并分析了現(xiàn)有葉片形態(tài)學(xué)特征自動化提取技術(shù)的主要問題和解決這些問題的難點,結(jié)果表明,最小外接矩形算法在葉片形態(tài)學(xué)特征自動化提取中局限性較大。未來對葉片形態(tài)學(xué)自動化提取軟件的開發(fā)須全面考慮所提取葉片特征的整體效應(yīng)和生物學(xué)意義,合理利用植物的真實形態(tài)學(xué)結(jié)構(gòu)特征進行判別,以控制純幾何學(xué)和純圖形學(xué)運算結(jié)果的失真程度。
關(guān)鍵詞:形態(tài)學(xué)特征;自動化;葉面積;形態(tài)學(xué)
文獻著錄格式:王謝,張建華.植物葉片形態(tài)學(xué)特征全自動提取的難點[J].浙江農(nóng)業(yè)科學(xué),2016,57 (4):579-582.
葉片形態(tài)學(xué)一直是植物生理及植物生態(tài)學(xué)研究中的熱點[1]。植物可通過調(diào)節(jié)葉片的形態(tài)來增強自身的生存適應(yīng)能力,對時空的環(huán)境變化表現(xiàn)出極強的敏感性和可塑性[1],表明植物葉片的形態(tài)特征及其進化史可以反應(yīng)植物在地球各個氣候階段的進化過程和形態(tài)演化趨勢。植物葉片和花器官形態(tài)上的差異都為研究者們提供了直觀有效的證據(jù)以直接證明植物對環(huán)境的適應(yīng)性,以及其在分類學(xué)中的地位。此外,葉片作為植物進行呼吸作用、光合作用和蒸騰作用的主要器官,其葉面積大小、葉輪廓周長、葉長和葉寬等信息不僅是植物生長狀態(tài)診斷中重要的參數(shù),還是研究植物栽培技術(shù)、生理生化、遺傳育種等內(nèi)容的重要形態(tài)指標[2]。因此,如何準確量化葉片的形態(tài)學(xué)特征是葉形態(tài)研究的一個核心內(nèi)容。
起初,人們采用硫酸紙稱重法、網(wǎng)格法、求積儀法、面積系數(shù)換算法和打孔稱重法來統(tǒng)計葉面積[3],同時按照主脈的位置測定其長和寬。隨著計算機技術(shù)的不斷普遍化和常規(guī)化,人們逐漸認識到了這些方法所存在的巨大缺陷,即工作量大、費時費力、測量指標有限,且人為操作時具有較強的主觀性,在判斷構(gòu)型不規(guī)范的葉片時容易產(chǎn)生爭議。為了更快、更準地獲取更多葉片形態(tài)信息,學(xué)者們開始利用各種可能的軟件來進行數(shù)據(jù)分析和提取,主要包括window畫圖工具[4]、Image J科學(xué)用圖像處理軟件[5]、Photoshop圖像處理軟件[6-7],ArcGIS[2,8-9]、MapInfo等桌面地理信息系統(tǒng)軟件[10]、R2V高級光柵圖矢量化軟件[11]等,以快速獲取葉面、葉長、葉寬等指標。
隨著計算機語言的普遍化,上述軟件也不能完全滿足人們對形態(tài)指標數(shù)據(jù)的需求。學(xué)者們開始利用C,C + + ,VB,Java,Matlab等語言自動提取自身需要的形態(tài)指標特征,植物葉片形態(tài)學(xué)指標的建立得到了極大的發(fā)展,已經(jīng)可以自動化獲取主要葉片形態(tài)的一些基本參數(shù),如葉面積、葉周長、葉長、葉寬、縱橫比、矩形度、面積凹凸比、周長凹凸比、球形比、圓形度、偏心率、形態(tài)參數(shù)[12]、離心率、橢圓長短軸長、分形維度等。雖然計算機可識別和提取的形態(tài)指標在一些生理和生態(tài)學(xué)研究中已經(jīng)相當豐富,但對于植物分類和形態(tài)進化而言,僅僅是邁出了工作的第一步。
為清楚地了解現(xiàn)階段植物葉片形態(tài)學(xué)特征全自動化提取中出現(xiàn)的問題和狀況,本研究基于以上研究背景,通過大量的數(shù)據(jù)提取實踐,提出了現(xiàn)階段全自動化提取的主要原理和常見問題,并提供了解決這些問題的一些思路,為植物葉片形態(tài)學(xué)特征的全自動化提取提供參考。
植物葉片形態(tài)學(xué)特征全自動化提取的基礎(chǔ)是圖片分辨率單位與空間坐標單位之間的成功轉(zhuǎn)換。圖片的分辨率(dpi)是指每英寸掃描對象所表示的像素點的數(shù)目,即1dpi = dots/inch。根據(jù)1 inch = 2.54 cm,可推算出單個像素的長度為(2.54/dpi) cm,面積為(2.54/dpi)2cm2[2]。
在此基礎(chǔ)上,基于對圖片信息的提取,提出柵格圖像分類與最小外接矩形算法聯(lián)用的自動化特征提取的主要思路(圖1),該算法是實現(xiàn)自動化特征提取的核心所在。通過對上個柵格圖片進行二值化處理形成黑白鮮明的圖像數(shù)據(jù)結(jié)構(gòu),利用數(shù)學(xué)形態(tài)學(xué)算法對小面積區(qū)域進行刪除、對大面積區(qū)域進行膨脹或填充,確定出連續(xù)的圖形邊界,對圖形數(shù)據(jù)進行模擬分析,分析其內(nèi)在面積、邊界長度和最小外接矩形,并將最小外接矩形的長邊定義為葉長,短邊定義為葉寬。相關(guān)研究已經(jīng)證實了該算法在一些植物葉片形態(tài)學(xué)特征自動化提取中的有效性,但這并不意味著該算法適合大部分植物。
圖1 葉片特征自動化提取的主要原理
由于葉片形態(tài)多樣、數(shù)據(jù)庫不完善、設(shè)計者跨專業(yè)學(xué)習(xí)等多種原因,造成許多測定數(shù)據(jù)不能反映葉片的真實特征,這些數(shù)據(jù)有的可以通過二次計算得到真實值,而有的則是完全錯誤的。通過對各種葉片形態(tài)數(shù)據(jù)的運算和分析,發(fā)現(xiàn)在葉片形態(tài)特征自動化提取過程中客觀存在的幾種數(shù)據(jù)異常的情況,而這些情況在以往的研究中并未提及。
2.1長寬數(shù)據(jù)倒置
無論是基于地理信息系統(tǒng)的ArcGIS,還是LEAFSHAPES 1.0,其對葉片長寬數(shù)據(jù)的提取都是基于最小外接矩形的。一般情況下,按照最小面積和最小邊長做約束條件提取的數(shù)據(jù)差異并不顯著,因此,所得出的結(jié)果將長的邊默認為葉長,短的邊默認為葉寬。然而,葉長是葉片主脈方向上的最大邊長,當真實的葉片長寬比小于1時,這種長寬數(shù)據(jù)倒置的現(xiàn)象就會出現(xiàn)(圖2中A)。由于LEAFSHAPES 1.0軟件主要針對單葉進行數(shù)據(jù)提取,提取的數(shù)值和圖形可配套顯示,這種長寬數(shù)據(jù)倒置的情況可能被發(fā)現(xiàn);但當真實長寬比很難被肉眼發(fā)現(xiàn)時,這種錯誤的數(shù)據(jù)很容易被忽略。同樣,在ArcGIS處理批量提取數(shù)據(jù)時,如果有些葉片長寬比大于1,有些葉片長寬比小于1,后續(xù)往往會花費一些時間去調(diào)整這些數(shù)據(jù)的前后位置,這樣不僅增加了工作量,沒有體現(xiàn)自動化的優(yōu)勢,而且增加了數(shù)據(jù)錯誤的風(fēng)險。
2.2葉長數(shù)據(jù)偏小
基于最小外接矩形算法自動提取菱形、橢圓形或近橢圓形葉片時,得到的葉長常常會出現(xiàn)偏小的情況,主要是因為主脈的實際位置并非接近最小接矩形算法模擬出來的長邊,而更接近最小外接矩形的對角線長(圖2中B)。同時,由于葉柄和葉尖的存在,真實的葉片長度常介于最小外接矩形的長邊和對角線長度之間。
2.3葉寬數(shù)據(jù)錯誤
基于最小外接矩形算法自動提取鐮形和部分披針形葉片時,由于葉片整體近線性,且具有一定弧度,其所計算出的葉片寬度顯著大于葉片的實際寬度(圖2中C)。從幾何學(xué)特征出發(fā),不難發(fā)現(xiàn)這種差異與葉柄長短和位置,以及葉片自身的彎曲弧度等存在密切關(guān)系,而且這種差異很難用簡單的數(shù)學(xué)公式計算出。如出現(xiàn)這種現(xiàn)象,最小外接矩形算法是不可取的。
圖2 葉片特征自動化提取中的常見錯誤
2.4周長數(shù)據(jù)偏小
對于地理信息系統(tǒng)法而言,常采用眾數(shù)濾波等技術(shù)手段對監(jiān)督分類的數(shù)據(jù)進行純化,在這個純化過程中,葉緣的形狀變得更加平滑,葉緣信息被模糊了,造成周長計算偏小。LEAFSHAPES 1.0軟件為了防止這種情況的出現(xiàn),未采用濾波技術(shù),直接利用二值圖進行計算,可以得到較為準確的周長信息,但該軟件只能處理分辨率為50 dpi的葉片掃描圖,當分辨率大于50 dpi時,圖片上出現(xiàn)的雜色(特別是掃描的邊緣的像素差異)會對圖像識別造成巨大的影響,計算結(jié)果誤差較大。LEAFSHAPES 2.0在二值化過程稱中加入了濾波處理和開運算處理,隨著圖片二值化次數(shù)的增加,得到的周長數(shù)據(jù)會越來越小。因此,正確利用數(shù)學(xué)形態(tài)學(xué)計算方法對圖形進行膨脹、腐蝕、去噪等處理,需要進行更多的論證和系統(tǒng)的規(guī)劃。
2.5葉色對二值化的影響
雖然大部分葉片都是綠色,但是對于一些草本植物和觀葉植物葉片而言,其葉器官上常常伴有其他顏色。色調(diào)較深的顏色對圖像二值化處理的影響不大,但一些較淺的顏色,特別是白色,會對葉片二值化處理造成極大的影響。由于其色調(diào)與背景色幾乎一致,二值化過程中常將其背景化,導(dǎo)致處理后的圖像面積小于葉片的實際面積,圖像周長也小于葉片的實際周長。因此,在研究葉片形態(tài)時,需要對淺色部分進行處理,如在掃描前對葉片進行涂黑、在處理前用其他畫圖軟件對掃描圖的淺色區(qū)域進行深色填充等。
無論是在物種水平,還是在植物個體水平,甚至是個體內(nèi)部構(gòu)建水平上,葉片的形態(tài)結(jié)構(gòu)都是其最重要的身份特征。每一個物種的每個種群內(nèi),每一個位置上的葉片都有其特定的表達方式和存在意義,這也就決定了葉片形態(tài)的多樣性和復(fù)雜性。在物種水平上,從單復(fù)葉的整體形態(tài)差異到單葉葉形差異,再到葉基部、葉尖、葉緣和葉裂等各個細節(jié)的差異,這些差異的具體表現(xiàn)形式都是分類研究者非常關(guān)心的問題,而這些差異更是對自動化數(shù)據(jù)提取的一個極大挑戰(zhàn)。由于現(xiàn)階段數(shù)學(xué)語言和數(shù)學(xué)圖形學(xué)語言與植物學(xué)語言之間缺乏一個系統(tǒng)且周密的語言轉(zhuǎn)換橋梁,導(dǎo)致許多研究手段尚屬于嘗試階段,并沒有真正形成一套只屬于植物葉片特征自動化提取體系的思路和系統(tǒng),因而出現(xiàn)了上述自動化數(shù)據(jù)提取的失誤,甚至是錯誤。上述的5種數(shù)據(jù)錯誤在一定程度上暗示了最小外接矩形算法和數(shù)學(xué)形態(tài)學(xué)算法在葉形上的半適用性,若要從根本上解決上述問題,需要正確的對待以下4個方面的問題。
3.1如何對待葉柄
模擬試驗表明葉柄大小、斜率等對最小外接矩形算法的影響是客觀存在的,甚至可以直接導(dǎo)致自動提取數(shù)據(jù)出現(xiàn)錯誤。因此,在現(xiàn)階段的研究中,學(xué)者們常采用直接去除葉柄掃描和掃描后在圖像中通過數(shù)學(xué)形狀學(xué)處理去掉葉柄的處理方法。前者可較好地得到葉片形態(tài)信息,但實際操作中,這種方法主要適合于葉柄形態(tài)完全分離的單葉,對復(fù)葉研究并無太大意義,對葉柄帶翅的葉片更是抹殺了其特定的生物學(xué)意義。而后者,不僅存在與前者相同的情況,更重要的是其模糊化處理影響了其他指標提取的準確性和精度。因此,為了保證數(shù)據(jù)的準確性和對生物學(xué)意義的保存,葉柄應(yīng)該被保留在分析的主要內(nèi)容之中。
3.2如何對待復(fù)葉
復(fù)葉和單葉是分類的2個重要方式??创龔?fù)葉的方式有2種:一種是將其看作是單葉、深裂直至分離,且二級葉脈基部特化;一種是將其看是單葉空間組合。前一種觀點在形態(tài)學(xué)的研究中必須考慮葉柄的意義,將其整體看作一片單葉來進行模擬和自動化提取,基于這種認識可創(chuàng)造適用性更廣的葉片形態(tài)特征算法,而且葉裂特征的算法已經(jīng)被提出,在一些樹葉的葉裂分析中也具有較高的分析精度[13-18]。第2種觀點雖然放棄了葉柄和小葉葉柄存在的意義,在分類學(xué)上可能不及第1種觀點,但在突顯葉片生理功能上,可能會表現(xiàn)的更直接和有效?,F(xiàn)階段對于復(fù)葉的研究主要是基于第2種觀點,但作者在對待復(fù)葉的問題上更主張第1種觀點,雖然基于第1種觀點實現(xiàn)的葉片形態(tài)特征自動化提取的難度比第2種觀點大,但一旦成功,其在植物分類和植物生理學(xué)研究中將具有重要意義。
3.3如何對待局部細節(jié)
葉尖特征、葉緣特征等更多局部特征并非現(xiàn)階段葉片形態(tài)學(xué)自動化提取的主流。在沒能準確的自動化提取葉面積、葉長、葉寬、周長等情況下,對于其他相對局部特征的自動化提取問題很容易被忽略。但是葉片是一個整體,無論是葉柄還是葉緣等信息都不應(yīng)該被模糊掉。一個從總體構(gòu)思的葉片面積自動化提取算法,絕對強于對各個部件單獨研究,這是實現(xiàn)植物形態(tài)學(xué)分類從定性描述到定量判斷的一個重要手段。鄭小東等[19]根據(jù)植物學(xué)中對葉緣的描述,采用改進的SUSAN算法檢測植物葉緣鋸齒,然后計算葉緣鋸齒數(shù)量、尖銳度、偏斜度3個特征參數(shù)。相較于植物分類學(xué)的定性指標,幾何學(xué)和圖形學(xué)給出的參數(shù)更加客觀,這些數(shù)據(jù)對植物分類的定量化研究具有重要意義。李燦燦等[20]基于K-means聚類的對葉脈信息進行了提取,但這僅限于對葉脈的顯示,尚未提出能用于進一步分析的指標體系。
3.4如何對待葉色
對于基于圖像分析的研究方法而言,葉色是造成了誤差的最主要原因之一,為消除葉色帶來的誤差,所進行的各種運算處理都會對各指標的自動化提取造成或大或小的影響。而在植物生理和病理研究中[21],葉色是一個非常重要的表觀特征,對植物生長的智能監(jiān)控具有重要意義。在研究葉斑特征時,葉形往往也是研究中必須配套使用的支撐數(shù)據(jù),因此,是否應(yīng)該將葉片表面的色調(diào)特征列為葉片形態(tài)全自動提取研究的主要內(nèi)容還需要認真思考。在考慮葉色的情況下,如何依據(jù)葉色對形態(tài)數(shù)據(jù)進行矯正或判別等也需要進一步思考。因此,強調(diào)指標屬性之間的關(guān)聯(lián)性和整體性是葉形態(tài)特征全自動提取的核心。只有基于這個原則,才能構(gòu)建起數(shù)學(xué)語言和植物學(xué)語言的橋梁,才能為研究提供準確的數(shù)據(jù)基礎(chǔ)。
上述5點主要問題都來源于對葉形態(tài)指數(shù)自動化提取過程中遇到的困難,4個工作的難點也是可能解決上述問題的關(guān)鍵思路,從這些問題的發(fā)現(xiàn)到解決思路的提出,已經(jīng)指明了最小外接矩形算法在葉片形態(tài)學(xué)特征自動化提取中的局限性和不可推廣性。未來葉片形態(tài)學(xué)自動化提取軟件需要創(chuàng)造出一種真正基于植物學(xué)原理的非純幾何學(xué)和圖形學(xué)的運算法則,這種法則的建立應(yīng)全面考慮葉器官的整體效應(yīng),對葉柄、葉尖、葉緣、葉脈、葉表面等信息都不可忽略。植物葉片全自動化提取技術(shù)的研究還有很長的道路,除了上述各種困難之外,還需要思考“如何更加細致地提取葉片的形態(tài)學(xué)特征”這一問題。未來對于葉片形態(tài)學(xué)的研究也絕不會停留在二維空間,如何利用三維激光掃描技術(shù)自動化提取葉片三維空間形態(tài)特征,如表面粗糙度、起伏度等,都是植物葉片特征全自動化提取需要思考和解決的問題。葉片形態(tài)的全自動化提取不僅是為了方便和簡化工作量,更是為了使研究技術(shù)規(guī)范化、科學(xué)化和統(tǒng)一化,使研究結(jié)果更準確和更具有可對比性和可借鑒性。
參考文獻:
[1]李永華,盧琦,吳波,等.干旱區(qū)葉片形態(tài)特征與植物響應(yīng)和適應(yīng)的關(guān)系[J].植物生態(tài)學(xué)報,2012,36 (1):88-98.
[2]樂通潮,張會儒,譚芳林.基于自動分類法的紅樹植物葉片信息測定[J].林業(yè)科學(xué),2014,50 (5):34-40.
[3]莊建守.葉面積測定法[J].新疆農(nóng)業(yè)科學(xué),1979 (3):23-24.
[4]王旺田,馬靜芳,張金林,等.一種新的葡萄葉面積測定方法[J].果樹學(xué)報,2007,24 (5):709-713.
[5]劉洪波,張江輝,白云崗,等.香梨葉面積測定方法對比研究[J].新疆農(nóng)業(yè)科學(xué),2013 (3):453-459.
[6]于守超,張秀省,冀蘆莎.基于PhotoshopCS5的植物葉面積測定方法[J].湖北農(nóng)業(yè)科學(xué),2012,51 ( 15 ):3340-3342.
[7]鐵軍,馬婧,金山,等.瀕危植物南方紅豆杉的葉面積測定及其相關(guān)分析[J].山西大學(xué)學(xué)報(自然科學(xué)版),2012 (3):581-586.
[8]陳智芳,王景雷,宋妮.GIS空間分析技術(shù)在棉花葉面積測定中的應(yīng)用[J].中國農(nóng)學(xué)通報,2012,28 (9):145-149.
[9]陳積山,朱瑞芬,張月學(xué).基于GIS在苜蓿葉面積測定中的應(yīng)用[J].草業(yè)科學(xué),2012,29 (7):1044-1048.
[10]吳玉德,張鵬.基于Mapinfo的樹木葉面積測定方法[J].林業(yè)調(diào)查規(guī)劃,2005,30 (6):23-25.
[11]張美海,趙玉如,劉陽,等.基于用R2V軟件和攝像手機測定葉面積的方法[J].山東林業(yè)科技,2011,41 (6):59-62.
[12]肖雪洋.植物葉片圖像識別特征的研究和在線識別系統(tǒng)實現(xiàn)[D].合肥:中國科學(xué)技術(shù)大學(xué),2011.
[13]馮冬霞,施生錦.葉面積測定方法的研究效果初報[J].中國農(nóng)學(xué)通報,2005,21 (6):150-152.
[14]宰松梅,溫季,郭冬冬,等.基于支持向量機模型和圖像處理技術(shù)的甜椒葉面積測定[J].農(nóng)業(yè)工程學(xué)報,2011,27 (3):237-241.
[15]郭孝玉,孫玉軍,王軼夫,等.基于改進人工神經(jīng)網(wǎng)絡(luò)的植物葉面積測定[J].農(nóng)業(yè)機械學(xué)報,2013,44 (2):200-204.
[16]張寧,劉文萍.基于圖像分析的植物葉片識別技術(shù)綜述[J].計算機應(yīng)用研究,2011,28 (11):4001-4007.
[17]高建昌,郭廣君,國艷梅,等.平臺掃描儀結(jié)合ImageJ軟件測定番茄葉面積[J].中國蔬菜,2011 (2):73-77.
[18]鄭小東,張曉煜,薄樹奎.植物葉裂特征自動提取研究[J].中國農(nóng)學(xué)通報,2012 (27):152-156.
[19]鄭小東,王曉潔,高潔.SUSAN算法在植物葉緣特征提取中的應(yīng)用[J].中國農(nóng)學(xué)通報,2011,27 (27):174-178.
[20]李燦燦,王寶,王靜,等.基于K-means聚類的植物葉片圖像葉脈提取[J].農(nóng)業(yè)工程學(xué)報,2012,28 ( 17 ):157-162.
[21]鄭小東,王曉潔,李玲玲.面向植物生長智能監(jiān)控的葉顏色特征提取[J].中國農(nóng)學(xué)通報,2010,26 (19):401-407.
(責(zé)任編輯:侯春曉)
中圖分類號:TP20; Q944-3
文獻標志碼:A
文章編號:0528-9017(2016)04-0579-04
DOI10.16178/j.issn.0528-9017.20160437
收稿日期:2015-11-05
基金項目:現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系建設(shè)專項(CARS-22-ZJ0307)
作者簡介:王 謝(1987—),男,四川雅安人,博士,助理研究員,主要從事生物數(shù)字化和土壤生態(tài)學(xué)研究工作,E-mail:wangxiechangde@hotmail.com。
通信作者:張建華,E-mail:zjhu-11@163.com。