張家昌,史玲玉,郭兆鋮,趙元,徐鵬程,張俊麗
(山東第一醫(yī)科大學(山東省醫(yī)學科學院) 生命科學學院,山東泰安 271016)
萜類化合物(Terpenoids)是植物次生代謝產(chǎn)物中結構和數(shù)量最多的一類天然化合物,目前已知的種類超過50 000種[1]。由于其特殊且復雜多樣的生物活性,萜類化合物在醫(yī)藥、食品、化妝品等領域廣泛應用[2]。生物體中,萜類化合物是以異戊二烯為單位,經(jīng)過環(huán)化、結構重排及碳骨架氧化等一系列反應衍生而來[3]。其中,法尼基焦磷酸作為重要的前體物質(zhì),是由法尼基焦磷酸合酶(Farnesyl Pyrophosphate Synthase,F(xiàn)PPS)催化異戊烯基焦磷酸及其異構體二甲基丙烯基焦磷酸生成[4]。
近年來,隨著合成生物學的發(fā)展,通過構建微生物細胞工廠合成萜類化合物成為研究的熱點[5-6]。在微生物合成次生代謝產(chǎn)物的研究中,關鍵酶編碼基因的分析、克隆、鑒定及功能分析一直是研究重點和難點[7-10],F(xiàn)PPS作為合成途徑中的關鍵酶,其表達量與酶活力對下游萜類化合物合成有重要影響,在代謝工程和合成生物學等領域受到廣泛關注[11]。ANDERSON等[12]闡述了FPPS的特性、結構與功能關系、進化、定位及其作為藥物開發(fā)靶點的研究進展。劉美佳等[13]在克隆、分析珠子參FPPS基因cDNA序列的基礎上,通過調(diào)控皂苷生物合成關鍵酶的表達,成功實現(xiàn)了皂苷的生物合成。李永波等[14]在植物法尼基焦磷酸合酶基因克隆、表達、酶動力學研究等方面闡述了重要觀點。
本研究利用生物信息學方法,選擇不同生物(包括植物、動物、微生物)來源的FPPS,通過分析其理化性質(zhì)、結構、功能及系統(tǒng)演化關系,比較和分析在進化過程中真核生物、原核生物以及不同物種間FPPS的進化差異,以期為采用分子生物學和合成生物學手段,構建生產(chǎn)萜類化合物的微生物細胞工廠奠定基礎。
選取已在NCBI-Genbank數(shù)據(jù)庫中公布的20種生物的FPPS的核苷酸序列及氨基酸序列,序列號如表1所示。
表1 不同物種來源的法尼基焦磷酸合酶的核酸及蛋白質(zhì)序列號
1.2.1 FPPS氨基酸序列分析
通過 ProtParam(https://web.expasy.org/protparam/)獲得20個物種的FPPS氨基酸序列的理化性質(zhì)。
1.2.2 FPPS系統(tǒng)進化分析
運用BioEdit將20個物種的核苷酸及氨基酸序列分別整合成一個Fasta格式的文件,然后利用Clustal Omega在線工具進行多序列比對,結果保存為“.clustal_num”格式的文件,可運用多序列比對結果編輯器如Jalview對其加工美化;系統(tǒng)進化樹的構建和檢驗通過本地軟件MEGA實施時,先將多序列比對結果保存成.meg格式,然后采用鄰接法構建進化樹,使用自展值(Bootstrap)重復檢驗1 000次。
通過在線工具ProtParam對FPPS的氨基酸序列進行研究,分析其氨基酸組成及理化性質(zhì),包括氨基酸數(shù)量、分子量、等電點、帶正負電殘基數(shù)、不穩(wěn)定指數(shù)、脂肪族指數(shù)和蛋白質(zhì)親疏水性(GRAVY)等信息,相關結果如表2所示。
表2 不同物種來源的法尼基焦磷酸合酶氨基酸序列的理化性質(zhì)
從表2可以看出,氨基酸數(shù)量為288~419個不等,等電點在4~7波動,脂肪族指數(shù)為100左右;不穩(wěn)定指數(shù)>40的為不穩(wěn)定類蛋白質(zhì),其中擬南芥、大腸桿菌、黑腹果蠅、牛、蜜蜂、黑猩猩、褐家鼠的FPPS屬于不穩(wěn)定類蛋白質(zhì),其余屬于穩(wěn)定類蛋白質(zhì);GRAVY為負值時,說明氨基酸為親水性的,為正值時說明氨基酸是疏水性的,其絕對值越大則其表示親/疏水性越強,即莢膜紅細菌來源的FPPS為疏水性蛋白質(zhì),其余來源的FPPS為親水性蛋白質(zhì)。
2.2.1 FPPS氨基酸序列比對分析
基因組不同功能區(qū)段在演化過程中面對不同的選擇壓力,重要的區(qū)段不易發(fā)生變化,不重要的區(qū)段易發(fā)生變化。多序列比對在系統(tǒng)發(fā)育分析、基因和蛋白質(zhì)功能分析、突變分析、序列拼接方面都有重要的應用。
通過多序列比對發(fā)現(xiàn),結構域I中除蜜蜂第二位氨基酸殘基為G外,G(1位)、K(2位)和R(5位)在另外19種生物中均為保守氨基酸,其賴氨酸殘基能夠促進FPPS與異戊烯焦磷酸(IPP)的結合。WANG等[15]發(fā)現(xiàn)與其他生物一樣,植物FPPS也具有5個保守結構域,即:結構域Ⅰ(GKXXR)、結構域Ⅱ(EXXXXXXLXXDDXXDXXXXRRG)、結構域Ⅲ(GQXXD)、結構域Ⅳ(KT)和結構域Ⅴ(GXXFQXXDDXXDXXXXXXXXGK XXXDXXXXK)。SZKOPINSKA等[16]發(fā)現(xiàn),F(xiàn)PPS具有2個天冬氨酸富集區(qū),即結構域Ⅱ和Ⅴ中的DDXXD(X代表任意氨基酸)。
2.2.2 FPPS氨基酸序列分子系統(tǒng)進化分析
系統(tǒng)發(fā)育分析用于描述同源序列之間的親緣關系的遠近,為了探索不同物種之間FPPS的親緣關系遠近,利用上述多序列比對結果構建進化樹,結果如圖1所示。
由圖1可知,F(xiàn)PPS蛋白的系統(tǒng)進化樹聚類分為植物、真菌、動物和細菌4個類群,具有較顯著的種族特異性。由上述多序列比對結果可知,蜜蜂FPPS氨基酸序列與其余真核生物FPPS相比,在保守區(qū)域某些位點容易發(fā)生變化,因此,蜜蜂與其余物種親緣關系較遠。而細菌等原核生物在保守位點發(fā)生一些位點的插入或缺失,因此,細菌單獨聚成一支。
本研究以不同物種來源的FPPS核苷酸序列及氨基酸序列為研究對象,分析不同物種FPPS在進化中的差異,尋找它們易發(fā)生突變的位點以及保守序列。這為采用分子生物學技術,定點修飾編碼該酶保守區(qū)中某些重要氨基酸殘基密碼子提高酶催化速率,進而提高次生代謝產(chǎn)物的合成提供一定依據(jù)。