王元英
(中國(guó)農(nóng)業(yè)科學(xué)院煙草研究所 青島 266101)
基因組(genome)是指生物的全部基因和染色體組成,也就是生物DNA分子所攜帶的全部遺傳信息;基因組學(xué)是研究生物基因組的組成、組內(nèi)各基因的精確結(jié)構(gòu)、相互關(guān)系及表達(dá)調(diào)控的科學(xué)。基因組學(xué)研究一般包括兩方面的內(nèi)容:以全基因組測(cè)序?yàn)槟繕?biāo)的結(jié)構(gòu)基因組學(xué)(structural genomics)和以基因功能鑒定為目標(biāo)的功能基因組學(xué)(functional genomics)。
結(jié)構(gòu)基因組學(xué)是通過(guò)基因作圖、核苷酸序列分析以確定基因組成、基因定位的科學(xué)。染色體不能直接用來(lái)測(cè)序,必須將基因組這一巨大的研究對(duì)象進(jìn)行分解,使之成為較易操作的小結(jié)構(gòu)區(qū)域,這個(gè)過(guò)程就是基因作圖,包括遺傳圖譜、物理圖譜、轉(zhuǎn)錄圖譜以及最終的全序列圖譜。
功能基因組學(xué)又稱為后基因組學(xué)(post-genomics),是利用結(jié)構(gòu)基因組學(xué)研究所獲得的大量數(shù)據(jù)與信息,結(jié)合高通量的實(shí)驗(yàn)、統(tǒng)計(jì)和計(jì)算機(jī)分析技術(shù),研究包括生化功能、細(xì)胞功能、發(fā)育功能、適應(yīng)功能等基因功能的科學(xué)。功能基因組學(xué)的主要工具和方法包括生物信息學(xué)、遺傳分析、基因表達(dá)測(cè)量和基因功能鑒定等。
1980年完成噬菌體Φ-X174基因組(5,368 bp)的測(cè)序,成為第一個(gè)測(cè)序的基因組;1995年完成第一個(gè)原核生物(流感嗜血桿菌,Haemophilus influenzae,1.8 M)基因組的測(cè)序;1997年完成大腸桿菌(Escherichia coli,4.6 M)和第一個(gè)真核生物(啤酒酵母,Saccharomyces cerevisiae,12 M)的完整基因圖譜繪制;1998年完成第一個(gè)多細(xì)胞生物(秀麗線蟲,Caenorhabditis elegans,97 M)基因組的測(cè)序;2000年完成果蠅(Drosophila melanogaster,180 M)和第一個(gè)植物-擬南芥(Arabidopsis thaliana,125 M)的基因組測(cè)序以及人類的基因組草圖;2002年完成水稻(Oryza sativa,466 M)的基因組草圖,小鼠(Mus musculus,2500 M)、瘧原蟲(Plasmodium falciparum,23 M)和按蚊(Anopheles gambiae,280 M)基因組測(cè)序完成;2003年完成人類(Homo sapiens,3000 M)全基因組完整圖譜;2004年完成原雞(Gallus gallus,1200 M)和家蠶(Bombyx mori,360 M)的基因組測(cè)序;2005年完成水稻基因組全序列測(cè)定;2007年首個(gè)中國(guó)人基因組圖譜(又稱“炎黃一號(hào)”)繪制完成(也是第一個(gè)亞洲人、黃種人的全基因序列圖譜)。目前完成基因組框架圖測(cè)序的生物還有大鼠(Rattus norvegicus)、斑馬魚(Brachydanio rerio)、蜜蜂(Apis mellifera)、家豬(Susscrofa domestica)、葡萄(Vitis vinifera)、番木瓜(Carica papaya)、咖啡(Coffea arabica)、玉米(Zea mays)、黃瓜(Cucumis sativus)、大熊貓(Ailuropoda melanoleuca)、馬鈴薯(Solanum tuberosum)及油菜(Brassica campestris)等。正在進(jìn)行測(cè)序的重要植物還有棉花(Gossypium herbaceum)、番茄(Lycopersicon esculentum)、小麥(Triticum aestivum)、沙特椰棗(Phoenix dactylifera)等。
在基因組測(cè)序領(lǐng)域中,由美國(guó)科學(xué)家于 1985年率先提出并在 1990年正式啟動(dòng)的人類基因組計(jì)劃(human genome project,HGP)是一個(gè)標(biāo)志性的研究項(xiàng)目。HGP計(jì)劃投資 30億美元,用 15年的時(shí)間(1990-2005年)揭示人類基因組的全部奧秘。計(jì)劃任務(wù)分兩大階段:繪制基因組結(jié)構(gòu)圖譜和基因組測(cè)序。HGP自實(shí)施以來(lái),不僅進(jìn)展順利,而且還帶動(dòng)了其他生物體基因組研究的蓬勃開展。經(jīng)過(guò)全球科學(xué)家近10年的共同努力,人類基因組“工作框架圖”于2000年6月繪制完成。人類基因組圖譜堪稱人類的“第二張解剖圖”,是人類科學(xué)史上的又一個(gè)里程碑,對(duì)人類疾病基因研究、基因診斷、基因治療、基因工程藥物產(chǎn)業(yè)和社會(huì)經(jīng)濟(jì)產(chǎn)生了巨大影響。
煙草屬于茄科(Solanaceae)煙草屬(Nicotiana)。煙草屬有66個(gè)種,分布廣泛,其中45個(gè)種原產(chǎn)于北美或南美,15種原產(chǎn)于澳大利亞。目前生產(chǎn)上推廣最普遍、經(jīng)濟(jì)價(jià)值最大的栽培種是普通(紅花)煙草(N.tabacum)。一般認(rèn)為,普通煙草是林煙草(N.sylvestris)和絨毛狀煙草(N.tomentosiformis)種間雜交后染色體加倍而產(chǎn)生的。絨毛狀煙草和林煙草均為二倍體(2n=24),栽培種普通煙草為四倍體(2n=48)。煙草具有非常大的基因組,二倍體煙草基因組大小約為23億堿基對(duì)(2300 M),四倍體煙草基因組大小約為45億堿基對(duì)(4500 M),是人類基因組的1.5倍。初步預(yù)測(cè),煙草的基因數(shù)目約為2.5-5萬(wàn)個(gè)。作為典型的大植物基因組,煙草基因組中重復(fù)序列含量很高,可能達(dá)到基因組序列的60%-80%,這給煙草基因組的測(cè)序和拼接造成了一定困難。
“煙草基因組計(jì)劃”是我國(guó)《煙草行業(yè)中長(zhǎng)期科技發(fā)展規(guī)劃綱要(2006-2020年)》中確定的煙草行業(yè)9個(gè)科技重大專項(xiàng)之一。按照規(guī)劃,煙草基因組計(jì)劃將重點(diǎn)開展大規(guī)模煙草基因組測(cè)序,構(gòu)建煙草全基因組序列圖譜、高密度分子標(biāo)記遺傳圖譜、物理圖譜,建立自主知識(shí)產(chǎn)權(quán)的煙草基因信息數(shù)據(jù)庫(kù);開展煙草重要性狀相關(guān)基因定位;克隆與煙堿、有害成分、主要抗性、香氣物質(zhì)、主要礦物質(zhì)吸收利用效率、煙葉成熟和烘烤特性等主要性狀調(diào)控機(jī)制相關(guān)的功能基因等。
實(shí)施煙草基因組計(jì)劃可以全面揭示煙草種質(zhì)資源的遺傳背景,獲得一批具有自主知識(shí)產(chǎn)權(quán)的煙草重要性狀功能基因,提高我國(guó)煙草育種技術(shù)和水平,確立我國(guó)在煙草基因組研究上的核心優(yōu)勢(shì),對(duì)實(shí)現(xiàn)煙草品種的根本性突破、更好地發(fā)揮煙草模式植物的基礎(chǔ)研究作用具有重要意義。