• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      植物及煙草表型組學(xué)大數(shù)據(jù)研究進(jìn)展

      2021-03-24 05:28:24金靜靜曹培健許亞龍李澤鋒
      煙草科技 2021年3期
      關(guān)鍵詞:高通量組學(xué)表型

      盧 鵬,金靜靜,曹培健,許亞龍,李澤鋒

      中國煙草總公司鄭州煙草研究院,鄭州高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)楓楊街2 號 450001

      近年來,隨著高通量植物表型數(shù)據(jù)獲取技術(shù)的廣泛應(yīng)用和植物表型數(shù)據(jù)的快速積累,逐步形成了以植物表型組學(xué)數(shù)據(jù)為基礎(chǔ)、以多學(xué)科交叉分析技術(shù)為手段的大數(shù)據(jù)體系,并在植物表型大數(shù)據(jù)的數(shù)據(jù)獲取、數(shù)據(jù)存儲管理以及數(shù)據(jù)分析應(yīng)用等方面取得了較快的研究進(jìn)展,利用表型大數(shù)據(jù)開展植物育種尤其是為作物進(jìn)行智能輔助育種已逐漸成為研究熱點。為及時了解植物表型大數(shù)據(jù)相關(guān)技術(shù)的發(fā)展,跟蹤植物表型大數(shù)據(jù)的研究前沿與熱點,回顧了植物表型組學(xué)的相關(guān)概念,并對植物表型組學(xué)大數(shù)據(jù)的研究進(jìn)展,尤其是對其在育種方面的應(yīng)用進(jìn)行了梳理,同時關(guān)注了煙草表型大數(shù)據(jù)的產(chǎn)生和發(fā)展過程,并對該領(lǐng)域今后的發(fā)展作了展望。

      1 植物表型組學(xué)大數(shù)據(jù)發(fā)展概況

      在植物學(xué)和遺傳學(xué)研究領(lǐng)域,特別是在作物育種領(lǐng)域,表型(Phenotype)是一個使用非常廣泛的術(shù)語,該術(shù)語來源于希臘詞語Phainein 和Typos的組合。在1911 年“表型”這一術(shù)語被Johannsen首次定義為“可通過直接觀察或精細(xì)測量進(jìn)行描述區(qū)分的生物屬性”[1]。表型組(Phenome)則在1949 年被Davis 首次定義為“細(xì)胞中所有非遺傳性、非自復(fù)制部分的總和,是所有表型的集合”[2]。20 世紀(jì)90 年代,人類基因組、轉(zhuǎn)錄組以及遺傳疾病關(guān)聯(lián)分析等各類研究的開展促進(jìn)了相關(guān)理論的不斷發(fā)展,1997 年,Schork 等[3]首次在疾病研究中提出了表型組學(xué)概念。此后,隨著表型組學(xué)研究的不斷深入和發(fā)展,表型組學(xué)的定義也在不斷地完善。2010 年,Houle 等[4]定義表型組學(xué)為“在整個組織范圍內(nèi)獲取多維表型數(shù)據(jù)”。2013年,F(xiàn)iorani 等[5]提出將植物表型組學(xué)定義為“作為一套方法學(xué),在不同尺度上精確測量植物的生長、結(jié)構(gòu)和組成”。現(xiàn)在植物表型組學(xué)更傾向于被定義為“在植物發(fā)育過程中,對整個生物體進(jìn)行高通量數(shù)據(jù)準(zhǔn)確采集和多維表型分析的多學(xué)科研究”[6]。表型組學(xué)自20 世紀(jì)90 年代被提出,經(jīng)歷多年的研究和發(fā)展,現(xiàn)已逐漸成為生命科學(xué)領(lǐng)域的一個重要分支。

      系統(tǒng)的植物表型組學(xué)研究正式開始于20 世紀(jì)末,主要收集質(zhì)量較高、可重復(fù)獲取的植物表型數(shù)據(jù),在該數(shù)據(jù)的基礎(chǔ)上分析基因型和環(huán)境因素的互作效應(yīng),研究該數(shù)據(jù)對產(chǎn)量、質(zhì)量和抗性等主要植物性狀的影響[7]。進(jìn)入21 世紀(jì)以后,隨著下一代測序技術(shù)的廣泛應(yīng)用和基因組學(xué)研究的不斷深入,表型組學(xué)的理論基礎(chǔ)和研究方法也得到了快速的發(fā)展[8]。2011 年,澳大利亞植物學(xué)家Furbank等[9]指出,高通量表型數(shù)據(jù)采集技術(shù)在田間的應(yīng)用、全球表型組學(xué)信息數(shù)據(jù)庫的元數(shù)據(jù)標(biāo)準(zhǔn)化缺失、植物非生物脅迫的高通量表型數(shù)據(jù)分析等問題已經(jīng)成為植物表型組學(xué)研究的瓶頸。為有效解決這些問題,打破植物表型研究的發(fā)展瓶頸,大量優(yōu)秀的商業(yè)機構(gòu)和科研機構(gòu)進(jìn)行了相關(guān)技術(shù)的開發(fā),促進(jìn)了高通量、高精度表型數(shù)據(jù)采集工具的快速發(fā)展。隨著表型獲取技術(shù)精度的不斷提升、通量的不斷提高、成本的逐漸降低,越來越多的植物進(jìn)行了高精度高通量的表型數(shù)據(jù)獲取,如擬南芥[10]、大麥[11]、玉米[12]等。

      科學(xué)大數(shù)據(jù)的形成依賴于海量數(shù)據(jù)的獲取和積累,隨著各類高通量表型數(shù)據(jù)采集設(shè)備的使用,植物表型數(shù)據(jù)量也呈現(xiàn)出快速增長的態(tài)勢。隨著數(shù)據(jù)體量不斷增大,各類植物表型數(shù)據(jù)庫和相關(guān)數(shù)據(jù)管理分析平臺紛紛建立,期間多種學(xué)科領(lǐng)域數(shù)據(jù)分析和挖掘技術(shù)也開始研發(fā)與應(yīng)用,逐漸形成了數(shù)據(jù)體量大、增長速度快、多學(xué)科技術(shù)交叉、數(shù)據(jù)多樣的植物表型組學(xué)大數(shù)據(jù)體系,該體系涵蓋了從植物細(xì)胞到植物群體的多個尺度、多種生長環(huán)境下植物性狀的遺傳與變異,以及植物對生物和非生物脅迫的響應(yīng)等各類信息[13]。

      2 植物表型組學(xué)大數(shù)據(jù)研究進(jìn)展

      植物表型組學(xué)大數(shù)據(jù)的研究主要集中在大數(shù)據(jù)的獲取、存儲管理、分析和應(yīng)用4 個方面。其中數(shù)據(jù)獲取主要是利用各類成像技術(shù)、設(shè)備平臺獲取表型數(shù)據(jù);數(shù)據(jù)存儲管理是將數(shù)以Tb 計的表型數(shù)據(jù)進(jìn)行存儲、管理,以便進(jìn)行后續(xù)的數(shù)據(jù)檢索、分析和應(yīng)用;數(shù)據(jù)分析是通過各種技術(shù)手段分析表型數(shù)據(jù),以獲得可用的生物學(xué)、農(nóng)學(xué)知識;數(shù)據(jù)應(yīng)用主要集中在育種方面,包括鑒定各類候選基因和分子標(biāo)記,將表型組數(shù)據(jù)與其他組學(xué)數(shù)據(jù)整合,建立各類育種輔助模型等。

      2.1 植物表型數(shù)據(jù)的獲取

      植物表型數(shù)據(jù)的獲取是指利用包括多光譜成像、高光譜成像、紅外成像、光合熒光成像、CT 掃描和MRI 掃描等技術(shù)在內(nèi)的數(shù)據(jù)采集設(shè)備,從細(xì)胞、器官、植株、群體等不同尺度對表型數(shù)據(jù)進(jìn)行獲取的過程。數(shù)據(jù)采集設(shè)備所搭載的平臺涵蓋了從室內(nèi)到大田,從便攜式表型采集設(shè)備到各類型航空飛行器等多個層面。利用這些方法進(jìn)行數(shù)據(jù)采集的植物主要包括:擬南芥[10]、大麥[11]、玉米[12]、小麥[14]、大豆[15]、水稻[16]等。表1 列舉了高通量植物表型數(shù)據(jù)獲取的平臺、支持的采集技術(shù)、應(yīng)用場景以及優(yōu)缺點等信息。

      目前,植物表型數(shù)據(jù)獲取的研究熱點仍然集中于開發(fā)高通量、高精度、應(yīng)用場景廣泛、使用成本低的大型平臺,此類平臺主要包括能夠應(yīng)用于溫室內(nèi)和田間的傳送帶式和軌道式兩種。田間和溫室傳送帶主要針對能夠在傳送帶上培養(yǎng)的盆栽植物,通過動力傳送至成像區(qū)域進(jìn)行成像,分別以澳大利亞植物表型加速器和德國尤利希植物表型研究中心溫室表型系統(tǒng)為代表。田間和溫室的軌道式平臺用于固定區(qū)域內(nèi)植株群體性狀的采集,應(yīng)用較為廣泛的主要有德國LemnaTec 公司的Field Scanalyzer 采集平臺,主要用于檢測可控環(huán)境中的植物形態(tài)特征,可進(jìn)行高通量植物表型成像分析測量、植物脅迫響應(yīng)成像分析測量、植物生長分析測量、性狀識別及植物生理生態(tài)分析研究等[27]。

      我國在大型表型數(shù)據(jù)采集平臺方面的自主研發(fā)起步相對較晚,開發(fā)出的表型平臺主要針對單一植物或者固定性狀進(jìn)行采集,整體平臺研發(fā)水平與國際先進(jìn)水平仍有一定差距。國內(nèi)使用較為廣泛的自主研發(fā)平臺主要有2014 年華中農(nóng)業(yè)大學(xué)和華中科技大學(xué)聯(lián)合研制的全生育期高通量水稻表型數(shù)據(jù)測量平臺,用于自動采集水稻株高、葉面積、分蘗數(shù)、生物量、產(chǎn)量等15 個參數(shù)的數(shù)據(jù)[30],以及2017 年中國科學(xué)院遺傳與發(fā)育生物學(xué)研究所研制的植物表型組學(xué)研究平臺PPAP[31]。

      表1 高通量植物表型數(shù)據(jù)采集平臺Tab.1 High-throughput plant phenotypic data collection platforms

      2.2 植物表型數(shù)據(jù)的存儲管理

      高通量植物表型數(shù)據(jù)主要分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)兩大類,結(jié)構(gòu)化數(shù)據(jù)主要是指傳統(tǒng)農(nóng)藝性狀、植物抗病抗逆信息、品質(zhì)性狀等數(shù)值型和字符型數(shù)據(jù);非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù)主要來源于各類圖像、光譜、文件等。根據(jù)表型數(shù)據(jù)的特點,在進(jìn)行數(shù)據(jù)存儲利用之前,會依據(jù)最小信息、本體術(shù)語和數(shù)據(jù)格式等3 個原則對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,之后通過文件服務(wù)器存儲數(shù)據(jù)、數(shù)據(jù)庫系統(tǒng)發(fā)布數(shù)據(jù)和提供服務(wù)的方式對表型數(shù)據(jù)進(jìn)行存儲管理。

      目前單一的植物表型組學(xué)數(shù)據(jù)庫較少,大部分?jǐn)?shù)據(jù)庫都涵蓋了包括基因組數(shù)據(jù)在內(nèi)的多個組學(xué)的數(shù)據(jù)。表2 匯總了2015 年以來具有代表性的植物及煙草表型組學(xué)數(shù)據(jù)平臺,包括平臺的簡單介紹、數(shù)據(jù)內(nèi)容和發(fā)布年份等信息。

      應(yīng)用較為廣泛且影響力較大的綜合類表型數(shù)據(jù)有Planteome 數(shù)據(jù)庫和PGP 知識庫。Planteome數(shù)據(jù)庫采用本體術(shù)語(Ontology Terms)作為表型數(shù)據(jù)的唯一和可重復(fù)性注釋,本體術(shù)語主要包括植物本體、植物性狀本體、植物實驗條件本體、表型和屬性本體等。數(shù)據(jù)庫提供了95 個植物分類群的表型數(shù)據(jù),主要包括植物表型、植物性狀、基因功能和表達(dá)數(shù)據(jù)及其本體術(shù)語注釋等,憑借著其較為全面的數(shù)據(jù)和標(biāo)準(zhǔn)的作物本體,其對性狀和表型評分的標(biāo)準(zhǔn)已經(jīng)被多個國際作物育種項目采用[34]。PGP 知識庫是一個用于存儲、分享植物基因組學(xué)和表型組學(xué)研究數(shù)據(jù)的平臺,數(shù)據(jù)庫擁有21 157 個數(shù)據(jù)實體,主要包括來自高通量植物表型的數(shù)據(jù)圖像、未完成的基因型數(shù)據(jù)、用于可視化的形態(tài)植物模型數(shù)據(jù)、質(zhì)譜數(shù)據(jù)以及各類軟件文檔等未正式發(fā)布的跨域?qū)嶒灁?shù)據(jù)集,并提供所有數(shù)據(jù)的發(fā)布和下載功能[38]。

      表2 植物表型組學(xué)數(shù)據(jù)平臺Tab.2 Plant phenomics data platforms

      2.3 植物表型數(shù)據(jù)的分析

      高通量采集設(shè)備獲取的表型數(shù)據(jù)中大部分是非結(jié)構(gòu)化數(shù)據(jù)。植物表型分析和研究主要是通過計算機科學(xué)技術(shù)進(jìn)行分析,例如視覺算法、深度學(xué)習(xí)、數(shù)字圖像處理、數(shù)據(jù)挖掘等技術(shù),提取出數(shù)據(jù)中具有使用價值的生物學(xué)信息,利用這些信息或結(jié)合其他組學(xué)、環(huán)境數(shù)據(jù)再進(jìn)行植物生長發(fā)育的研究。表3 匯總了在表型圖像數(shù)據(jù)分析中主要使用的理論方法、應(yīng)用技術(shù)和已成功應(yīng)用的案例等。

      表3 表型數(shù)據(jù)分析方法分類Tab.3 Classification of phenotypic data analysis methods

      盡管傳統(tǒng)的機器學(xué)習(xí)和圖像處理技術(shù)在特定場景下仍然發(fā)揮著作用,但隨著高通量表型數(shù)據(jù)采集技術(shù)的快速發(fā)展和表型數(shù)據(jù)量的爆炸式增長,利用包括卷積神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)、轉(zhuǎn)移學(xué)習(xí)等在內(nèi)的深度學(xué)習(xí)算法開發(fā)算法架構(gòu),如ResNet[46],VGGNet[46],AlexNet[47],GoogLeNet[47],SegNet[48],SqueezeNet[49],ARIGAN[50]等,以及自動識別及分析圖像數(shù)據(jù)已經(jīng)成為表型數(shù)據(jù)分析一個主要的研究方向,在植物表型尤其在植物脅迫和病害表型的大數(shù)據(jù)圖像處理方面開始廣泛應(yīng)用[44]并且表現(xiàn)出色,如植物表型信息預(yù)測方面的基于葉脈模式的植物識別[51]、植物秸稈數(shù)量和秸稈寬度測量[52]、根和芽的定位和特征檢測[14],植物抗逆抗病檢測分析方面的木薯褐斑病和花葉病檢測[53]、橄欖快速衰退綜合征檢測[54]以及甜瓜黃斑病、黃瓜花葉病等多種作物病害分析[55]等。這些方法能夠利用多類型表型數(shù)據(jù)建立植物組織模型、研究植物表型地域差異、預(yù)測植物表型信息和揭示植物演化規(guī)律等,可為植物表型組的持續(xù)深入研究提供重要的技術(shù)支持。

      2.4 植物表型數(shù)據(jù)在育種方面的應(yīng)用

      育種是植物表型研究,尤其是作物表型研究的重要應(yīng)用目的之一。作物育種經(jīng)歷了以人工篩選為主要方法的第一代、以雜交為主要方法的第二代和以分子標(biāo)記和全基因組關(guān)聯(lián)分析為主要輔助方法的第三代的逐步發(fā)展,目前正在開啟多學(xué)科交叉、多組學(xué)數(shù)據(jù)支持的第四代大數(shù)據(jù)智能輔助育種階段[56]。實現(xiàn)智能化輔助育種需要整合表型組和基因組、轉(zhuǎn)錄組、代謝組等多組學(xué)數(shù)據(jù),通過全基因組關(guān)聯(lián)研究(Genome-Wide Association Studies,GWAS)、數(shù)量性狀位點(Quantitative Trait Loci,QTL)分析等多種技術(shù)手段生成大量候選基因、候選分子標(biāo)記等數(shù)據(jù),建立育種信息模擬、親本選配推薦、育種路徑推薦、育成品種預(yù)測等一批模型,形成最終的智能育種決策體系(圖1)。

      圖1 植物大數(shù)據(jù)智能輔助育種體系Fig.1 Intelligent breeding system assisted by plant big data

      近年來,很多植物都完成了全基因組測序,隨著大規(guī)模植物表型數(shù)據(jù)采集和處理技術(shù)的發(fā)展,植物表型組學(xué)數(shù)據(jù)的持續(xù)積累和完善,利用表型組數(shù)據(jù)進(jìn)行植物基因型選擇鑒定研究的應(yīng)用也日益廣泛。2014 年,Honsdorf 等[57]通過高通量表型平臺Scanalyzer3D,在一組野生大麥滲入系中分別鑒定出了44 個和21 個干旱脅迫QTLs。2015 年,Yang 等[58]使用自行設(shè)計的高通量葉片評分系統(tǒng)(High-throughput Leaf Scoring,HLS)對3 個生長階段的533 份水稻材料進(jìn)行了檢測,對其29 個葉片性狀進(jìn)行了GWAS 分析,從中檢測出了9 個與葉片性狀相關(guān)的基因位點。2019 年,Yano 等[59]對大量水稻表型性狀數(shù)據(jù)進(jìn)行主成分分析,提取具有特定表型性狀的主成分,并將主成分得分與GWAS 結(jié)合起來,鑒定出能夠激活赤霉素(GA)信號的SPINDLY(OsSPY)基因,并證實了GA 信號對水稻結(jié)構(gòu)調(diào)控的影響。將高通量表型數(shù)據(jù)與大規(guī)模QTL 或GWAS 分析技術(shù)相結(jié)合,為植物基因挖掘、基因表征提供了新的方法,為分子育種和智能輔助育種提供了技術(shù)支持。

      相比其他育種方法,第四代智能輔助育種體系有著無可比擬的優(yōu)勢,是育種發(fā)展的必然趨勢。一些擁有較為完善組學(xué)數(shù)據(jù)的作物研究機構(gòu)和高校,已經(jīng)開始將表型組學(xué)大數(shù)據(jù)應(yīng)用于智能育種的方案設(shè)計,提出了初步的智能育種商業(yè)模式[60]。相信在不久的將來,智能輔助育種的各種模型和決策體系將會快速建立起來,推動植物育種進(jìn)入新的時代。

      3 煙草表型組學(xué)大數(shù)據(jù)研究進(jìn)展

      煙草作為茄科植物的一個重要模式物種,憑借著較高的科研價值和經(jīng)濟價值,在宿主與病原體的相互作用以及瞬時蛋白表達(dá)、蛋白功能檢測、亞細(xì)胞蛋白定位研究[61-63]、植物與非生物脅迫響應(yīng)、植物發(fā)育和代謝的功能基因研究[64-65]等多方面必將有著廣泛的應(yīng)用前景。

      3.1 煙草表型組學(xué)數(shù)據(jù)的積累

      早期煙草表型研究的發(fā)展和表型數(shù)據(jù)的積累往往在煙草育種研究的推動下進(jìn)行。20 世紀(jì)70年代,美、日、俄等國家相繼開始收集作物種質(zhì)資源,構(gòu)建相關(guān)的種質(zhì)資源庫,在世界各國煙草品種和種質(zhì)資源的收集整理過程產(chǎn)生了早期的煙草表型數(shù)據(jù),如美國國家植物種質(zhì)資源系統(tǒng),日本的作物種質(zhì)資源信息系統(tǒng),前蘇聯(lián)的農(nóng)作物種質(zhì)資源數(shù)據(jù)庫等。其中,截止到2019 年底,美國國家植物種質(zhì)資源系統(tǒng)共收錄了2 300 余條煙草表型數(shù)據(jù)[66],涵蓋煙草形態(tài)和生物學(xué)特征、化學(xué)成分等兩大類共28 個屬性。

      煙草作為我國農(nóng)業(yè)生產(chǎn)中重要的經(jīng)濟作物之一,科研人員對于煙草表型的研究很關(guān)注,尤其是煙葉的產(chǎn)量質(zhì)量、煙草的抗性、遺傳育種等方面。在傳統(tǒng)農(nóng)業(yè)研究領(lǐng)域中,我國主要的煙草表型相關(guān)數(shù)據(jù)庫有兩個,一個是中國作物種質(zhì)資源信息系統(tǒng),該系統(tǒng)于1986 年我國啟動國家種質(zhì)資源的收集工作時開始構(gòu)建,涵蓋180 種作物,包括38 萬余份種質(zhì)信息,其中收錄了約1 160 余份煙草種質(zhì)的表型數(shù)據(jù)[67];另一個是煙草專業(yè)的種質(zhì)資源數(shù)據(jù)庫“中國煙草種質(zhì)資源信息系統(tǒng)”,該系統(tǒng)在兩次全國大范圍收集煙草種質(zhì)資源數(shù)據(jù)的基礎(chǔ)上,于2010 年開始構(gòu)建,收集了約5 200 份煙草種質(zhì)資源信息,共收錄4 000 余條表型數(shù)據(jù)[68],涵蓋煙草形態(tài)與生物學(xué)特征、品質(zhì)特征及抗逆性三大類的73 個屬性,目前該數(shù)據(jù)庫是我國煙草表型數(shù)據(jù)收錄較全的專業(yè)數(shù)據(jù)庫之一。此外,近年來在地方煙草種質(zhì)資源鑒定和煙草品種培育的過程中,如云南、貴州、湖北等地都持續(xù)有煙草表型數(shù)據(jù)的產(chǎn)出,但這些數(shù)據(jù)多以紙質(zhì)書籍的形式進(jìn)行記錄和發(fā)表[69-71],未能建立有效的電子數(shù)據(jù)庫進(jìn)行數(shù)據(jù)交流和共享,在一定程度上限制了數(shù)據(jù)的高效利用。

      隨著煙草基因組相關(guān)研究的快速發(fā)展,尤其是多個煙草基因組數(shù)據(jù)的發(fā)布,推動了煙草表型性狀相關(guān)功能基因的研究,新基因挖掘和基礎(chǔ)研究取得了明顯進(jìn)展。近年來,一批重要性狀的功能基因,尤其是在煙草優(yōu)質(zhì)、多抗、低害方面的相關(guān)基因被分析鑒定,例如蔗糖合酶基因家族在煙草系統(tǒng)發(fā)育中的表達(dá)模式分析[72],煙草CAMTA基因家族的進(jìn)化和表達(dá)分析研究[73],本氏煙病毒誘導(dǎo)基因沉默研究[35],LcPDS,LcZDS和LcCRTISO基因過表達(dá)對煙草耐鹽性的影響[74],煙草CchGLP基因過表達(dá)對表型和microRNAs 表達(dá)變化的研究[75],烤煙產(chǎn)量相關(guān)性狀的QTL 定位分析[76],不同發(fā)育時期煙草葉數(shù)和葉面積的QTL 動態(tài)分析[77]等。在功能基因研究鑒定的過程中產(chǎn)生了一批煙草表型數(shù)據(jù),部分研究專門建立了煙草基因組和表型組的數(shù)據(jù)庫[35]。

      隨著植物高通量表型數(shù)據(jù)獲取技術(shù)的日益成熟,部分高通量數(shù)據(jù)采集技術(shù)和數(shù)據(jù)分析技術(shù)開始應(yīng)用于煙草,其中應(yīng)用較為廣泛的是小型無人機采集平臺。目前該技術(shù)在煙草上的應(yīng)用領(lǐng)域主要為煙草的生產(chǎn)管理,如煙株數(shù)量統(tǒng)計[78]、烤煙生長狀態(tài)檢測[79]、煙草種植面積評估[80]、煙草含氮化合物估測[81]等;另外在煙草病蟲害檢測方面也有應(yīng)用,如煙草花葉病害高光譜特征研究[82]等。

      通過傳統(tǒng)農(nóng)業(yè)研究、現(xiàn)代育種技術(shù)和高通量技術(shù)等產(chǎn)生的煙草表型數(shù)據(jù)正在日益增長,這些數(shù)據(jù)將逐漸成為煙草表型組學(xué)研究的基礎(chǔ)。

      3.2 我國煙草表型組學(xué)大數(shù)據(jù)的研究進(jìn)展

      為推進(jìn)煙草科學(xué)大數(shù)據(jù)的發(fā)展,2018 年國家煙草專賣局“煙草科研大數(shù)據(jù)”重大專項正式啟動實施,開始進(jìn)行煙草科學(xué)大數(shù)據(jù)平臺的硬件搭建和項目部署,也為煙草表型組學(xué)大數(shù)據(jù)提供了有利的軟、硬件環(huán)境。項目初期進(jìn)行了煙草科學(xué)大數(shù)據(jù)資源體系和標(biāo)準(zhǔn)體系的構(gòu)建,體系中規(guī)劃了現(xiàn)代煙草農(nóng)業(yè)數(shù)據(jù)和生態(tài)基礎(chǔ)數(shù)據(jù)等內(nèi)容,規(guī)范了相關(guān)的數(shù)據(jù)元標(biāo)準(zhǔn)[83-84]。目前首批重大專項項目已經(jīng)有部分?jǐn)?shù)據(jù)和成果產(chǎn)出,如煙葉質(zhì)量大數(shù)據(jù)構(gòu)建及應(yīng)用研究項目產(chǎn)出煙葉相關(guān)的表型數(shù)據(jù),將降維技術(shù)應(yīng)用到煙葉質(zhì)量可視化[85];煙草近紅外大數(shù)據(jù)構(gòu)建及應(yīng)用項目利用近紅外設(shè)備進(jìn)行煙草化學(xué)成分高通量檢測分析;煙草育種大數(shù)據(jù)構(gòu)建及應(yīng)用項目開始建立專業(yè)平臺進(jìn)行煙草表型組、基因組、轉(zhuǎn)錄組等數(shù)據(jù)的收集整理。以上項目的實施,能夠為煙草科學(xué)大數(shù)據(jù)尤其是煙草表型組學(xué)大數(shù)據(jù)提供統(tǒng)一的數(shù)據(jù)存儲管理平臺,解決煙草表型數(shù)據(jù)較為分散的問題。

      目前已有高通量數(shù)據(jù)采集設(shè)備應(yīng)用于煙草表型研究,如采用無人機對群體表型數(shù)據(jù)進(jìn)行采集的方式,高通量數(shù)據(jù)處理分析算法的研究也取得了一定進(jìn)展[78-82]。同時煙草科研大數(shù)據(jù)項目站在大數(shù)據(jù)的角度,開始將三維建模、機器學(xué)習(xí)、人工智能等計算機技術(shù)和生物技術(shù)引入到煙草科學(xué)大數(shù)據(jù)分析中,為煙草表型組學(xué)大數(shù)據(jù)研究打下基礎(chǔ)。但煙草高通量數(shù)據(jù)采集主要集中在群體表型方面,缺乏溫室傳送帶或者軌道式平臺在溫室或田間對煙草整株、局部組織器官和種子等進(jìn)行高通量多光譜的測量。該類數(shù)據(jù)的缺乏將限制相關(guān)數(shù)據(jù)分析算法在煙草上的應(yīng)用,遲滯煙草生長發(fā)育過程監(jiān)測、植株三維模型構(gòu)建等研究的開展。

      分子育種技術(shù)目前是世界煙草育種使用的主要手段[86],我國煙草也處于分子育種的階段,擁有一套較為成熟的分子育種技術(shù)體系[87]。該體系由煙草分子標(biāo)記輔助育種、基因克隆與基因轉(zhuǎn)化等多種技術(shù)組成。煙草方面開展了抗多種病毒?。?8]以及糖酯[89]相關(guān)的分子標(biāo)記開發(fā)、品種創(chuàng)制以及表型驗證等工作,獲取了一批與抗病和品質(zhì)性狀相關(guān)的分子標(biāo)記和基因。雖然有很多煙草基因和分子標(biāo)記被鑒定發(fā)布,但由于缺乏高通量的表型采集設(shè)備和分析軟件,尤其是針對煙草組織、器官和單株等表型的專業(yè)數(shù)據(jù)采集設(shè)備,導(dǎo)致煙草暫未開展高通量表型數(shù)據(jù)與大規(guī)模QTL 或GWAS 分析技術(shù)相結(jié)合的研究工作,也未能開展大規(guī)模、更深入的基因挖掘和基因表征的研究工作。煙草表型數(shù)據(jù)在育種研究中的應(yīng)用也多以分子標(biāo)記和基因的驗證為主,應(yīng)用范圍較為有限。

      煙草表型組學(xué)研究進(jìn)展較為遲緩,高通量數(shù)據(jù)積累較少,已有的數(shù)據(jù)分布零散,多項數(shù)據(jù)標(biāo)準(zhǔn)仍在制定過程中,距推廣應(yīng)用還有一定距離。煙草分子標(biāo)記和基因的數(shù)量相較其他作物仍然較少,仍未能形成統(tǒng)一的煙草表型組學(xué)大數(shù)據(jù)體系,而煙草智能育種體系的構(gòu)建需要煙草表型組大數(shù)據(jù)和煙草基因型大數(shù)據(jù)作為核心驅(qū)動源,在缺少該部分核心大數(shù)據(jù)的前提下,煙草的各類智能化輔助育種模型的構(gòu)建也鮮有報道,煙草表型組學(xué)大數(shù)據(jù)在智能輔助育種方面仍有較長的路要走。

      4 展望

      綜上,相比其他植物的表型研究,煙草高通量表型數(shù)據(jù)采集技術(shù)的應(yīng)用仍然較少,煙草表型組學(xué)相關(guān)大數(shù)據(jù)平臺的建設(shè)也較為遲緩,植物學(xué)、自動化、圖形圖像和計算機科學(xué)等其他科學(xué)領(lǐng)域先進(jìn)的數(shù)據(jù)分析技術(shù)也鮮有使用,使得煙草表型缺少形成大數(shù)據(jù)的基礎(chǔ)條件,無法形成一個有效的科學(xué)系統(tǒng),難以為煙草大數(shù)據(jù)智能化輔助育種提供支持。針對我國煙草表型組學(xué)大數(shù)據(jù)發(fā)展的問題,為快速推進(jìn)我國煙草表型組學(xué)大數(shù)據(jù)的構(gòu)建和發(fā)展,提出以下建議:

      (1)強化高通量表型數(shù)據(jù)采集技術(shù)在煙草上的應(yīng)用

      目前部分煙草抗逆性、基礎(chǔ)農(nóng)藝性狀等表型數(shù)據(jù)的獲取仍然是以人工采集的方式為主,該方法雖然便于實施,但是大規(guī)模數(shù)據(jù)采集的難度較大,準(zhǔn)確性較難保障。高通量的表型數(shù)據(jù)采集設(shè)備和技術(shù)已經(jīng)在煙草上開始應(yīng)用,但相較其他作物仍然不成熟,缺乏高通量的表型數(shù)據(jù)采集設(shè)備和數(shù)據(jù)分析技術(shù),限制了煙草產(chǎn)量預(yù)測、群體性狀檢測、大面積病蟲害監(jiān)測預(yù)警、三維模型構(gòu)建、表型鑒定和分類、整合表型組學(xué)的多組學(xué)研究等多個方面的研究進(jìn)展。高通量表型數(shù)據(jù)采集設(shè)備是獲取高通量植物表型數(shù)據(jù)最有效、最快速的技術(shù)手段,其應(yīng)用水平直接影響到煙草表型組學(xué)大數(shù)據(jù)的發(fā)展。因此,建議加強高通量表型數(shù)據(jù)采集技術(shù)在煙草上的推廣應(yīng)用,加快數(shù)據(jù)采集方式由機器代替人工的轉(zhuǎn)變,為煙草表型組學(xué)大數(shù)據(jù)的發(fā)展奠定數(shù)據(jù)基礎(chǔ)。

      (2)構(gòu)建煙草高通量表型數(shù)據(jù)標(biāo)準(zhǔn)和高通量數(shù)據(jù)庫

      我國的煙草表型研究機構(gòu)較多,但目前尚未制定出煙草高通量表型數(shù)據(jù)標(biāo)準(zhǔn),雖然煙草行業(yè)已經(jīng)開始了煙草科學(xué)大數(shù)據(jù)資源體系和標(biāo)準(zhǔn)體系的構(gòu)建,但在數(shù)據(jù)采集的設(shè)備信息、數(shù)據(jù)采集方法、數(shù)據(jù)圖像格式等一系列元數(shù)據(jù)采集上仍然缺少統(tǒng)一的命名、標(biāo)注和約束條件等數(shù)據(jù)采集標(biāo)準(zhǔn)和規(guī)范。在沒有數(shù)據(jù)采集標(biāo)準(zhǔn)和規(guī)范的前提下采集的表型數(shù)據(jù)往往會造成采集數(shù)據(jù)差異大、數(shù)據(jù)信息不完整、數(shù)據(jù)無法共享通用等一系列問題,最終會遲滯煙草表型組學(xué)大數(shù)據(jù)的快速發(fā)展?,F(xiàn)階段煙草高通量表型數(shù)據(jù)尚未形成規(guī)模,可優(yōu)先建立相關(guān)數(shù)據(jù)標(biāo)準(zhǔn),并在此基礎(chǔ)上,整合開發(fā)適用于煙草表型數(shù)據(jù)的數(shù)據(jù)庫,為煙草表型研究提供統(tǒng)一、通用和共享的資源平臺,促進(jìn)煙草表型組學(xué)大數(shù)據(jù)的發(fā)展。

      (3)加強煙草表型數(shù)據(jù)在煙草育種應(yīng)用方面的研究

      目前煙草高通量表型數(shù)據(jù)主要集中在煙葉生產(chǎn)管理方面,對于煙草育種的應(yīng)用價值有限。有關(guān)煙草育種相關(guān)高通量表型數(shù)據(jù)的采集力度有待進(jìn)一步加強,并在現(xiàn)有高通量數(shù)據(jù)分析技術(shù)的基礎(chǔ)上,結(jié)合生物學(xué)、人工智能和機器學(xué)習(xí)等多個學(xué)科領(lǐng)域的先進(jìn)技術(shù),開發(fā)出適用煙草育種表型大數(shù)據(jù)的數(shù)據(jù)分析挖掘方法。此外,以精準(zhǔn)育種和智能決策為目標(biāo),整合煙草基因型數(shù)據(jù)和表型組大數(shù)據(jù),建立包括煙草親本選配、育成品種預(yù)測等各類模型,構(gòu)建基因型-表型-環(huán)境多位數(shù)據(jù)驅(qū)動的智能育種決策體系,提升煙草表型組學(xué)大數(shù)據(jù)的研究應(yīng)用水平,推動煙草育種技術(shù)的快速發(fā)展。

      猜你喜歡
      高通量組學(xué)表型
      高通量衛(wèi)星網(wǎng)絡(luò)及網(wǎng)絡(luò)漫游關(guān)鍵技術(shù)
      國際太空(2023年1期)2023-02-27 09:03:42
      高通量血液透析臨床研究進(jìn)展
      Ka頻段高通量衛(wèi)星在鐵路通信中的應(yīng)用探討
      口腔代謝組學(xué)研究
      基于UHPLC-Q-TOF/MS的歸身和歸尾補血機制的代謝組學(xué)初步研究
      建蘭、寒蘭花表型分析
      中國通信衛(wèi)星開啟高通量時代
      GABABR2基因遺傳變異與肥胖及代謝相關(guān)表型的關(guān)系
      代謝組學(xué)在多囊卵巢綜合征中的應(yīng)用
      慢性乙型肝炎患者HBV基因表型與血清學(xué)測定的臨床意義
      吉木乃县| 呼图壁县| 临邑县| 武冈市| 勃利县| 三门县| 白银市| 卓资县| 邮箱| 凤台县| 庄浪县| 临沂市| 海晏县| 青州市| 鹤庆县| 体育| 集安市| 延津县| 九龙县| 准格尔旗| 永安市| 梧州市| 赤水市| 绥中县| 黄梅县| 玛曲县| 崇礼县| 枣强县| 宁海县| 商水县| 泸溪县| 罗田县| 孟州市| 海阳市| 双桥区| 罗田县| 海伦市| 沾化县| 江油市| 新兴县| 赤城县|