張莉彬 宋凱利
摘要:基因網(wǎng)絡(luò)是一種復(fù)雜的生物網(wǎng)絡(luò),描述了基因與其他作用因子之間的調(diào)控關(guān)系。相同的基因可以和不同的調(diào)控因子通過相關(guān)作用關(guān)系構(gòu)成基因調(diào)控網(wǎng)絡(luò),而miRNA是近年來研究發(fā)現(xiàn)的一種新型基因調(diào)控元件,現(xiàn)已成為基因調(diào)控網(wǎng)絡(luò)的重要組成部分。鑒定與多種癌癥相關(guān)的miRNA及其靶基因,有助于了解基因與癌癥等復(fù)雜疾病的關(guān)系,并為針對泛癌癥的生物藥物研制及靶向治療提供參考。
關(guān)鍵詞:基因;miRNA;癌癥
中圖分類號:TP301.6 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2019)02-0057-02
0 引言
MicroRNA簡稱miRNA,是一類內(nèi)源性非編碼的小RNA分子,它們通過與靶基因相互作用來調(diào)控復(fù)雜疾病的生物過程,尤其在許多癌癥進(jìn)程中起到了關(guān)鍵作用。針對單一基因或miRNA的研究對深入了解癌癥的病發(fā)過程具有一定的局限性,本文則通過研究與泛癌癥相關(guān)的基因和miRNA數(shù)據(jù),對miRNA之間和基因之間做關(guān)聯(lián)分析,提出了一種miRNA-基因雙層調(diào)控網(wǎng)絡(luò)的構(gòu)建方法,解釋了參與調(diào)控多種癌癥過程的重要作用因子之間的合作機(jī)制,為癌癥的風(fēng)險預(yù)測以及生物靶向藥物的研制提供幫助。
1 雙層基因調(diào)控網(wǎng)絡(luò)的構(gòu)建方法流程
1.1 構(gòu)建方法流程圖
構(gòu)建雙層基因調(diào)控網(wǎng)絡(luò)的方法包括:分析網(wǎng)絡(luò)中重要調(diào)控因子miRNA的表達(dá)數(shù)據(jù);利用統(tǒng)計檢驗方法選出與多種癌癥相關(guān)的miRNA;度量miRNA之間的皮爾森相關(guān)性;根據(jù)可調(diào)控癌癥的數(shù)量和相關(guān)性對miRNA進(jìn)行排序,篩選出強(qiáng)相關(guān)的miRNA,獲取其靶基因以及它們之間的相互作用關(guān)系[1]。
1.2 方法構(gòu)建步驟
第一步,預(yù)處理miRNA數(shù)據(jù)集:
(1)去掉原始樣本中有缺失值的數(shù)據(jù),剔除平均表達(dá)值小于10的miRNA以降噪;(2)對每行數(shù)據(jù)進(jìn)行t檢驗夠過濾掉P-value大于 0.5的miRNA;(3)分別計算各組miRNA數(shù)據(jù)集中患病樣本表達(dá)值與正常樣本表達(dá)值之間的Fold Change(FC)值,設(shè)定閾值為2,即FC絕對值大于2時預(yù)示對應(yīng)的miRNA在癌癥中表達(dá)顯著異常;
篩選出的miRNA是影響多種癌癥的生物過程的miRNA。
第二步,根據(jù)T值和C值對miRNA進(jìn)行排序,Ti表示miRNA i在多種癌癥中表達(dá)異常的次數(shù),Ci按照如下公式計算:
;
其中,N為至少在五種癌癥中表達(dá)異常的miRNA組成的集合,n為集合N的元素個數(shù),PCC(i,j)為miRNA i與miRNA j的皮爾森相關(guān)系數(shù)值。選出排序最高的若干miRNA記為重要miRNA。
第三步,使用miRanda、miRDB、RNA22、TargetScan和CancerMiner這五種方法預(yù)測重要miRNA的靶基因,根據(jù)False Discovery Rate(FDR)小于某設(shè)定閾值的條件分別取五種預(yù)測結(jié)果的交集,作為靶基因預(yù)測結(jié)果。FDR設(shè)定閾值為0.01,即選取FDR小于0.01的基因作為相應(yīng)miRNA的候選靶基因,以此降低數(shù)據(jù)內(nèi)部噪聲和提高靶基因鑒定準(zhǔn)確率。
第四步,將各miRNA的五種靶基因結(jié)果做交集之后,利用STRING數(shù)據(jù)庫,通過基因編碼的蛋白質(zhì)評估得到的交集中基因之間的作用關(guān)系。
第五步,綜合重要miRNA之間的聯(lián)系、靶基因之間的聯(lián)系以及miRNA-基因之間的聯(lián)系,構(gòu)建雙層基因調(diào)控網(wǎng)絡(luò)。
2 雙層基因調(diào)控網(wǎng)絡(luò)的構(gòu)建方法實(shí)現(xiàn)流程
2.1 構(gòu)建方法實(shí)現(xiàn)流程
下面結(jié)合實(shí)驗對本文提出的網(wǎng)絡(luò)構(gòu)建方法作詳細(xì)的描述。
利用PanCancer項目中相關(guān)數(shù)據(jù)集構(gòu)建雙層基因調(diào)控網(wǎng)絡(luò):
PanCancer項目中,七組數(shù)據(jù)集有正常樣本作為對照,即七種癌癥的miRNA數(shù)據(jù)集可以使用。這七種癌癥分別是膀胱尿路上皮癌(BLCA)、乳腺浸潤癌(BRCA)、頭頸部鱗狀細(xì)胞癌(HNSC)、腎透明細(xì)胞癌(KIRC)、肺腺癌(LUAD)、肺鱗狀細(xì)胞癌(LUSC)、子宮內(nèi)膜樣腺癌(UCEC)。每組數(shù)據(jù)集中都有1045個miRNA,樣本數(shù)量信息如表1所示。
在上述數(shù)據(jù)集上的具體實(shí)施步驟如下:
(1)對7組miRNA原始數(shù)據(jù)集進(jìn)行預(yù)處理:1)去掉原始樣本中有缺失值的數(shù)據(jù),剔除平均表達(dá)值小于10的miRNA以降噪;2) 對每行數(shù)據(jù)進(jìn)行t檢驗夠過濾掉P-value大于0.5的miRNA;3)分別計算各組miRNA數(shù)據(jù)集中患病樣本表達(dá)值與正常樣本表達(dá)值之間的FC值,設(shè)定閾值為2;
通過以上方法從1045個miRNA中篩選出235個miRNA,可認(rèn)為這些miRNA影響多種癌癥的生物過程。
(2)在選出的miRNA基礎(chǔ)上再篩選出至少在五種癌癥中表達(dá)異常的miRNA,度量這48個miRNA之間的皮爾森相關(guān)性,根據(jù)T值和C值對miRNA進(jìn)行排序,選出排序最高的八個miRNA,分別為miR-590,miR-141,miR-19a,miR-93,miR-96,miR-130b,miR-345,miR-18a。
(3)使用上述五種方法預(yù)測重要miRNA的靶基因,根據(jù)FDR小于0.01的條件分別取五種預(yù)測結(jié)果的交集。再將各miRNA的靶基因結(jié)果做交集,最終得到60個基因,利用STRING數(shù)據(jù)庫通過基因編碼的蛋白質(zhì)評估最終得到的交集中基因之間的作用關(guān)系。
(4)綜合八個miRNA之間的聯(lián)系、48個基因之間的聯(lián)系和miRNA及其靶標(biāo)之間的聯(lián)系,構(gòu)建雙層基因調(diào)控網(wǎng)絡(luò),如圖1所示。
2.2 網(wǎng)絡(luò)分析
該網(wǎng)絡(luò)綜合了多方面信息,有利于全面了解影響泛癌的重要作用因子以及作用因子合作調(diào)控癌癥過程的機(jī)制。以下是對所構(gòu)建網(wǎng)絡(luò)的可靠性分析:
首先,miRNA之間具有強(qiáng)相關(guān)性,其中,mir-130b,mir-19a和mir-93是與泛癌相關(guān)的miRNA家族成員,它們彼此合作共同調(diào)節(jié)相同的癌癥。同時,mir-93和mir-19a被推斷有助于乳腺腫瘤、胃腫瘤、前列腺腫瘤和卵巢腫瘤這些癌癥的發(fā)展。而在過去研究中總被忽略的miR-590,與其他七個miRNA的皮爾森相關(guān)系數(shù)值都超過了閾值,實(shí)際上它會通過與其他幾種常見的致癌miRNA合作來促進(jìn)癌癥的發(fā)展[2]。mir-590可以調(diào)節(jié)其靶腫瘤抑制基因PDCD4和PTEN的表達(dá),其中參與細(xì)胞周期調(diào)節(jié)磷酸酶蛋白質(zhì)產(chǎn)物的表達(dá)而成為腫瘤抑制基因的PTEN,是共調(diào)控模塊中所有miRNA的常見靶標(biāo),可被視為癌癥共有的治療靶標(biāo)。
其次,眾多癌癥過程中都發(fā)生了基因間的相互作用,如MMP2和TIMP3的表達(dá)之間有著強(qiáng)相關(guān)性,MMP2是涉及許多癌癥的蛋白水解酶,TIMP3的特異性組織抑制劑可調(diào)節(jié)細(xì)胞活性,它們的不平衡表達(dá)是肺癌、乳腺癌、結(jié)腸癌等多種癌癥發(fā)展過程中的重要危險因素。E2F1充當(dāng)調(diào)節(jié)RRM2表達(dá)水平的轉(zhuǎn)錄因子,而RRM2的高表達(dá)促使直腸癌腫瘤的生長和侵襲。與正常組織相比,大多數(shù)癌癥組織中兩者的蛋白質(zhì)水平均升高且相互平行[3]。FOXO1可抑制胰腺β細(xì)胞中的TXNIP轉(zhuǎn)錄,在細(xì)胞腫瘤的形成過程中起著關(guān)鍵作用。此外FOXO1還可上調(diào)TXNIP在神經(jīng)元和內(nèi)皮細(xì)胞中的表達(dá),并下調(diào)TXNIP在肝臟中的表達(dá)。
3 結(jié)語
本文基于miRNA與基因之間的調(diào)控關(guān)系以及兩者與癌癥之間的重要聯(lián)系,通過構(gòu)建miRNA-基因調(diào)控網(wǎng)絡(luò)來幫助分析復(fù)雜疾病的機(jī)理?;诋?dāng)前海量的相關(guān)數(shù)據(jù),挖掘多種癌癥中miRNA與miRNA、miRNA與靶基因基、基因與基因間多方位信息,綜合于一體,以雙層網(wǎng)絡(luò)的形式呈現(xiàn)出來,可更直觀地體現(xiàn)出miRNA通過協(xié)作靶向基因調(diào)控泛癌癥的過程。此項研究會為疾病的研究提供更加全面豐富的信息,有助于從系統(tǒng)層面了解疾病的發(fā)病機(jī)制和過程,為診斷和治療疾病提供理論借鑒,將會在未來的生命科學(xué)研究中發(fā)揮關(guān)鍵作用。
參考文獻(xiàn)
[1] 張莉彬.利用miRNA表達(dá)譜構(gòu)建miRNA-基因調(diào)控網(wǎng)絡(luò)[D].西安電子科技大學(xué),2017.
[2] Hongfei Y , Wenhong Z , Wentao Z , et al.Roles of miR-590-5p and miR-590-3p in the development of hepatocellular carcinoma[J]. Journal of Southern Medical University,2013,33(06):804-811.
[3] Zejun F , Chaoju G , Hong L , Xiaomin Z , Lingming M , Mintao S , Lanlan Q , Shuchai L , Zhihua Z , Ronghui Z , Hongqian Gu , Xiang C . E2F1 promote the aggressiveness of human colorectal cancer by activating the ribonucleotide reductase small subunit M2[J]. Biochemical & Biophysical Research Communications, 2015, 464(2):407-415.
Method for Constructing Double-layer Gene Regulation Network
ZHANG Li-bin,SONG Kai-li
(Xi'an Aviation Vocational and Technical College, Xi'an? Shaanxi? 710023)
Abstract:A genetic network is a complex biological network that describes the regulatory relationship between genes and other contributing factors. The same gene can form a gene regulatory network through a related relationship with different regulatory factors. miRNA is a novel gene regulatory element discovered in recent years and has become an important part of the gene regulatory network. Identification of miRNAs and their target genes associated with various cancers can help to understand the relationship between genes and complex diseases such as cancer, and provide reference for biopharmaceutical development and targeted therapy for pan-cancerous diseases.
Key words:gene; miRNA; cancer