本刊記者 黃雪霜 嚴(yán)永紅
數(shù)納百川 生命流長
——訪中國科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院、國家數(shù)學(xué)與交叉科學(xué)中心李雷研究員
本刊記者 黃雪霜 嚴(yán)永紅
數(shù)學(xué)是一門基礎(chǔ)學(xué)科,很多學(xué)科都是在數(shù)學(xué)的基礎(chǔ)上誕生、發(fā)展成熟的,同時(shí)又推動(dòng)了數(shù)學(xué)的進(jìn)展;如牛頓的經(jīng)典《自然哲學(xué)的數(shù)學(xué)原理》奠定了力學(xué)的基礎(chǔ)、Shannon的經(jīng)典《通信的數(shù)學(xué)理論》開創(chuàng)了信息論的研究。
生物學(xué)是研究生命現(xiàn)象和生物活動(dòng)規(guī)律的科學(xué),而分子生物學(xué)和基因組學(xué)是現(xiàn)代生物學(xué)的重要內(nèi)容。如何分析、計(jì)算分子生物學(xué)和基因組學(xué)中的高通量數(shù)據(jù)、闡明其中的數(shù)學(xué)原理,系統(tǒng)地認(rèn)識(shí)生命是當(dāng)代科學(xué)家面對(duì)的極富挑戰(zhàn)性的問題。李雷從1995年開始,就致力于這一領(lǐng)域的研究,并且成效顯著。
李雷,中國科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院研究員,獲北大學(xué)士和碩士學(xué)位,1998年于美國加州大學(xué)伯克利分校統(tǒng)計(jì)系獲博士學(xué)位,并作為當(dāng)年統(tǒng)計(jì)系唯一的優(yōu)秀畢業(yè)生獲得Evelyn Fix紀(jì)念獎(jiǎng)?wù)隆?000年秋在加利福尼亞大學(xué)洛杉磯分校純粹與應(yīng)用數(shù)學(xué)研究所做博士后。1998-2002年在佛羅里達(dá)州立大學(xué)任助理教授,2002-2010年在南加利福尼亞大學(xué)計(jì)算生物及數(shù)學(xué)系任教并于2005年獲終身職務(wù)。2003年與Michael Waterman教授、Simon Tavare教授等在南加州大學(xué)建立了世界上第一個(gè)計(jì)算生物系。2010年入選中國科學(xué)院“百人計(jì)劃”。作為一名數(shù)學(xué)、生物兩棲科學(xué)家,其研究覆蓋統(tǒng)計(jì)學(xué),信息論,計(jì)算,計(jì)算生物學(xué)、系統(tǒng)生物學(xué),基因組學(xué)和老齡生物學(xué)等領(lǐng)域,獲得若干具有原創(chuàng)性的成果。
李雷在中學(xué)時(shí)就對(duì)數(shù)學(xué)有著濃厚興趣。1984年,他以優(yōu)異成績(jī)考取北京大學(xué)數(shù)學(xué)系,本科畢業(yè)后師從謝忠潔教授從事時(shí)間序列分析的研究。在美國加州大學(xué)伯克利分校攻讀博士期間師從于國際著名統(tǒng)計(jì)學(xué)家、澳大利亞科學(xué)院院士Terence P. Speed教授。這期間李雷充分感受著數(shù)學(xué)的博大精深與美麗,吸收著數(shù)學(xué)、統(tǒng)計(jì)學(xué)的養(yǎng)分。2000年在UCLA做博士后研究期間又得到Wing Wong教授指點(diǎn)。經(jīng)過多年鉆研,他漸漸在科學(xué)實(shí)踐中形成了自己的研究哲學(xué)和風(fēng)格。
在若干經(jīng)典的數(shù)學(xué)問題上,包括最優(yōu)無損失編碼長度問題(Shannon第一定理的經(jīng)驗(yàn)公式)、譜分解、帶正約束的廣義線性反問題、最小截?cái)喾讲罱獾挠?jì)算、“將來”與“過去”之間的交互信息量, 李雷的研究處于世界領(lǐng)先地位。
類似于經(jīng)典統(tǒng)計(jì)學(xué)中的點(diǎn)估計(jì),區(qū)間估計(jì),假設(shè)檢驗(yàn),預(yù)測(cè)等方法,李雷從科學(xué)實(shí)踐中總結(jié)出了一類新的統(tǒng)計(jì)問題:盲反問題。它提供了一個(gè)全新的形而上的應(yīng)用統(tǒng)計(jì)學(xué)概念。基于盲反問題的原理,李雷與Speed教授提出了新的DNA測(cè)序技術(shù)中的光度校正方法,并證明了它的最優(yōu)性。這個(gè)方法已成為新一代Illumina高通量測(cè)序儀的工業(yè)標(biāo)準(zhǔn)。目前世界上規(guī)模首屈一指的測(cè)序機(jī)構(gòu)-中國華大基因研究院的主力測(cè)序儀就是Illumina平臺(tái)。
為了提高DNA測(cè)序精度,李雷對(duì)反卷積這一經(jīng)典應(yīng)用數(shù)學(xué)問題,提出了全新的理論和算法,其中包括參數(shù)反卷積方法。在文獻(xiàn)中,反卷積經(jīng)常被認(rèn)為是不適定問題。李雷通過自己的工作證實(shí)只要spike-convolution模型是現(xiàn)實(shí)問題的良好近似,那么反卷積是適定的統(tǒng)計(jì)問題。
數(shù)學(xué)是開啟其他學(xué)科的鑰匙,而原創(chuàng)的有效的數(shù)學(xué)方法和原理就像是一把新“鑰匙”,不僅為李雷打開了數(shù)學(xué)之門,也打開了一道數(shù)學(xué)和生物學(xué)之間彼此隔離的大門。
20世紀(jì)末,人類自然科學(xué)史上三大工程之一——“國際人類基因組計(jì)劃”的進(jìn)展速度振奮人心。這期間,李雷有幸與Speed教授、計(jì)算生物學(xué)先驅(qū)、美國科學(xué)院院士Michael Waterman教授等世界一流的科學(xué)家等合作,由此踏上了綜合運(yùn)用統(tǒng)計(jì)、概率、計(jì)算等數(shù)學(xué)方法解決分子生物、基因組學(xué)中的科學(xué)問題的交叉研究之路。
DNA測(cè)序是基因組學(xué)研究的基石。李雷研究組給出了基因組學(xué)中評(píng)估DNA測(cè)序精度的完整數(shù)學(xué)模型。此外,包括人類基因組工程在內(nèi),最初發(fā)表的基因組都是由多模本組合而成的。也就是說,DNA的一個(gè)片段來自于一個(gè)模本,另一個(gè)片段可能來自于另一個(gè)模本。李雷研究組為雙倍體的測(cè)序問題建立了一個(gè)完整的統(tǒng)計(jì)模型,提出了構(gòu)造雙倍體DNA的算法和對(duì)結(jié)果的統(tǒng)計(jì)評(píng)估。研究小組利用已有的DNA測(cè)序數(shù)據(jù)給出了第一個(gè)有統(tǒng)計(jì)評(píng)估的雙倍體基因組, 即玻璃海鞘的雙倍體基因組,此工作早于人類的雙倍體基因組的研究成果。
基因組學(xué)和系統(tǒng)分子生物學(xué)中數(shù)學(xué)建模基本問題分為兩類:測(cè)量(包括DNA測(cè)序,基因芯片,光學(xué)映像等)和統(tǒng)計(jì)推斷(包括細(xì)胞活動(dòng),表達(dá)調(diào)控,網(wǎng)絡(luò)重建等)。李雷研究組為主要的生物測(cè)量技術(shù)如基因芯片,光學(xué)映像建立了完整的數(shù)學(xué)模型。
基因的表達(dá)是通過轉(zhuǎn)錄蛋白質(zhì)和其它因子調(diào)控實(shí)現(xiàn)的。如何從基因表達(dá)譜和相關(guān)生物信息中推斷調(diào)控機(jī)制是一個(gè)非常有挑戰(zhàn)性的嶄新的統(tǒng)計(jì)問題。李雷的小組發(fā)展了一套基因調(diào)控的推斷方法,稱為BASE (Binding association with sorted expression differentiation)方法。從概念上,這一統(tǒng)計(jì)推斷方法超越了經(jīng)典的Pearson相關(guān)函數(shù)方法。從實(shí)踐上,他們已發(fā)表了若干成功的案例。
信息技術(shù)的發(fā)展改變了人類的生活方式,而基因工程的突破將幫助人類延年益壽。人類將挑戰(zhàn)生命科學(xué)的極限。對(duì)這項(xiàng)極富意義和挑戰(zhàn)性的工作,李雷表現(xiàn)出了極大的興趣。從2004年起,他與南加州大學(xué)的老齡分子遺傳專家Valter Longo博士合作,以酵母菌為模型,共同研究生命如何健康長壽的問題。利用李雷研究組發(fā)展的基因芯片分析工具,他們探明了若干長壽的機(jī)制。比如,他們發(fā)現(xiàn)在長壽的菌種細(xì)胞中,存在乙醇向甘油的能源轉(zhuǎn)換;在營養(yǎng)減少的過程中,線粒體核糖體基因表達(dá)在野生型細(xì)胞中上調(diào),而在長壽的菌種細(xì)胞中則保持平穩(wěn)。此前,人類已經(jīng)發(fā)現(xiàn)了老化和長壽的一些線索。比如,端粒體理論,free radicals理論,ERC理論。值得一提的是,李雷在此期間完成了自己研究生涯中的一大亮點(diǎn)成果:采用功能性基因組的方法,從分子系統(tǒng)生物學(xué)的角度,發(fā)現(xiàn)長壽的sch9Δ細(xì)胞可以協(xié)調(diào)呼吸(TCA cycle,產(chǎn)生free radicals的主要過程)與rRNA processing及核仁活動(dòng)。這個(gè)發(fā)現(xiàn)第一次將衰老的free radicals 理論與rDNA理論聯(lián)系起來。它們將對(duì)設(shè)計(jì)更科學(xué)的飲食方式和治療方式產(chǎn)生深刻的影響。
“要想在數(shù)學(xué)、計(jì)算和軟件開發(fā),分子生物等多個(gè)學(xué)科中自由穿梭,游刃有余,確實(shí)非常具有挑戰(zhàn)性?!崩罾渍f,在不同學(xué)科之間探討新的科學(xué)道路雖然艱苦,但也充滿探索的快樂。他堅(jiān)信在科學(xué)的發(fā)展方向上,多科學(xué)的交叉領(lǐng)域是很有前途和社會(huì)回報(bào)的。而且還有可能形成新的產(chǎn)業(yè),這對(duì)中國的產(chǎn)業(yè)升級(jí)具有重要意義。因而,如何增強(qiáng)交叉科學(xué)研究和更有效地培養(yǎng)年輕的兩棲及多棲科學(xué)家也是他在不斷思索的一個(gè)問題。他認(rèn)為這是一個(gè)重要的科學(xué)戰(zhàn)略問題,應(yīng)該引起科學(xué)決策者的更多關(guān)注。
值得慶幸的是,國家已經(jīng)意識(shí)到這一戰(zhàn)略要求,2011年底,中科院依托數(shù)學(xué)院成立了國家數(shù)學(xué)與交叉科學(xué)中心,李雷參加了中心下屬的數(shù)學(xué)與生物/醫(yī)學(xué)交叉部,具體參加重大慢性多發(fā)疾病的動(dòng)態(tài)網(wǎng)絡(luò)構(gòu)建的項(xiàng)目。雖然啟動(dòng)時(shí)間不長,但李雷和他的同事們的工作進(jìn)展還算順利。目前他們與北京大學(xué)醫(yī)學(xué)部合作,以小鼠為模型,研究2型糖尿病的發(fā)生發(fā)展機(jī)制,以應(yīng)對(duì)近年來糖尿病高發(fā)對(duì)社會(huì)家庭造成的巨大負(fù)擔(dān)。此外李雷指導(dǎo)學(xué)生繼續(xù)進(jìn)行計(jì)算生物學(xué)中的基礎(chǔ)研究,包括新一代高通量測(cè)序與堿基辨識(shí)中的一些問題,以及癌癥的基因組學(xué)研究等。
李雷也非常希望重拾因回國而中斷的衰老和長壽方面的研究。中國已逐漸進(jìn)入老齡社會(huì),這方面的科學(xué)研究對(duì)國民健康、家庭和諧、醫(yī)療社會(huì)保險(xiǎn)政策的制定都非常有意義。而這也恰好契合了當(dāng)初他選擇應(yīng)用數(shù)學(xué)的初衷:數(shù)學(xué)搬下高閣,飛入尋常百姓家。長壽機(jī)制的研究,使得老百姓的生命有了“細(xì)水長流”的希望。
最后,李雷說他所在的國家數(shù)學(xué)與交叉科學(xué)中心生物/醫(yī)學(xué)交叉部,希望有更多海內(nèi)外有實(shí)力的計(jì)算生物學(xué)家、生物信息學(xué)家、種群遺傳學(xué)家加入到他們的隊(duì)伍中來,多學(xué)科薈萃交融,共筑和諧新世界。他們同時(shí)希望與更多生物學(xué)家、醫(yī)院、醫(yī)生廣泛合作,運(yùn)用他們的數(shù)學(xué)與計(jì)算能力為生命科學(xué)服務(wù),特別是為中國的農(nóng)業(yè)科技和改善人民健康服務(wù)。
book=66,ebook=37