• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      LncRNA調(diào)控人類疾病關(guān)系數(shù)據(jù)庫的研究

      2019-07-17 04:46:12楊宵月李建偉
      醫(yī)學(xué)信息 2019年12期
      關(guān)鍵詞:長鏈非編碼RNA生物信息學(xué)

      楊宵月 李建偉

      摘要:人類疾病與長鏈非編碼RNA(LncRNA)的調(diào)控功能異常具有密切關(guān)系。近年來,出現(xiàn)了許多LncRNA-人類疾病關(guān)聯(lián)數(shù)據(jù)庫,為識別LncRNA調(diào)控人類疾病的功能提供了極大便利。本文對多個主流LncRNA調(diào)控人類疾病關(guān)聯(lián)數(shù)據(jù)庫作一綜述,為該領(lǐng)域的進一步研究提供參考。

      關(guān)鍵詞:長鏈非編碼RNA;LncRNA-疾病關(guān)聯(lián)關(guān)系;生物信息學(xué)

      中圖分類號:TP311.131 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? DOI:10.3969/j.issn.1006-1959.2019.12.010

      文章編號:1006-1959(2019)12-0028-03

      Abstract:Human diseases are closely related to the abnormal regulation of long-chain non-coding RNA (LncRNA). In recent years, many LncRNA-human disease association databases have emerged, which have greatly facilitated the recognition of LncRNA regulation of human disease. This article reviews a number of mainstream LncRNA regulatory human disease association databases and provides a reference for further research in this field.

      Key words:Long-chain non-coding RNA;LncRNA-disease association;Bioinformatics

      長鏈非編碼RNA(long non-coding RNA,LncRNA)是一類核苷酸長度大于200的非編碼RNA分子。由于其不能編碼蛋白質(zhì),LncRNA一直被認(rèn)為是基因轉(zhuǎn)錄過程中的副產(chǎn)物[1]。隨著對LncRNA的不斷研究,發(fā)現(xiàn)LncRNA雖不編碼蛋白,但可參與細(xì)胞凋亡、分化、自噬、代謝以及腫瘤發(fā)生的各個階段等多種重要的調(diào)控過程[2]。LncRNA的研究發(fā)展迅速,但絕大部分LncRNA在疾病中的調(diào)控功能仍不明確。大量研究表明[3,4],人類疾病與LncRNAs的調(diào)控功能異常具有密切關(guān)系,明確LncRNAs在疾病中的調(diào)控作用,對在分子水平上理解疾病的產(chǎn)生、發(fā)展機制,對于復(fù)雜疾病的診斷、治療均具有重要意義。目前,研究LncRNA調(diào)控功能的方法主要包括傳統(tǒng)生物實驗方法和現(xiàn)代的生物信息學(xué)計算方法。傳統(tǒng)的生物實驗方法鑒定LncRNAs功能,結(jié)果雖然準(zhǔn)確、可靠,但存在實驗周期時間長、費用較高等問題[5]。隨著高通量測序技術(shù)的不斷發(fā)展,越來越多的LncRNAs被發(fā)現(xiàn),大量的LncRNAs功能需要被明確。傳統(tǒng)的生物實驗方法顯然不能勝任,必須采用快速、高效的計算方法對已發(fā)現(xiàn)的LncRNAs調(diào)控人類疾病關(guān)系進行數(shù)據(jù)挖掘,進而推測LncRNAs功能[6]。本文對多個主流LncRNA調(diào)控人類疾病關(guān)聯(lián)數(shù)據(jù)庫作一綜述,旨在為該領(lǐng)域的進一步研究提供參考。

      1常見LncRNA調(diào)控人類疾病關(guān)系數(shù)據(jù)庫

      近年來,相繼出現(xiàn)了一些收集、整理LncRNA調(diào)控人類疾病關(guān)聯(lián)數(shù)據(jù)庫,為識別LncRNA調(diào)控人類疾病的功能提供了極大便利。常見LncRNA調(diào)控人類疾病關(guān)系數(shù)據(jù)庫(按發(fā)布時間排序)見表1,包括軟件名稱、發(fā)布時間、數(shù)據(jù)庫優(yōu)缺點等,為研究者選擇LncRNA調(diào)控人類疾病關(guān)聯(lián)數(shù)據(jù)庫提供便利,同時有助于研究者快速了解該領(lǐng)域的研究進展。

      2常見LncRNA調(diào)控人類疾病關(guān)系數(shù)據(jù)庫具體介紹

      2.1 LncRNADisease ?2012年,Chen G等[7]收集PubMed數(shù)據(jù)庫中文獻(xiàn)報道的LncRNA調(diào)控人類疾病關(guān)系,開發(fā)了首個LncRNA調(diào)控人類疾病關(guān)系數(shù)據(jù)庫——LncRNADisease。該數(shù)據(jù)庫收集了480個有實驗支持的LncRNA調(diào)控疾病關(guān)系條目,以及478個LncRNA與其他生物分子相互作用的條目,涉及128個人類LncRNAs。LncRNADisease對每個LncRNA-疾病關(guān)聯(lián)數(shù)據(jù)都給出了原始文章的PubMed超鏈接,并標(biāo)注了LncRNA-疾病關(guān)聯(lián)的詳細(xì)信息,包括基因組信息、序列信息、功能失調(diào)類型等。LncRNADisease數(shù)據(jù)庫規(guī)范了LncRNA和疾病的名稱,共涉及166種疾病。LncRNADisease還收集了LncRNA在各種分析分子水平上的調(diào)控對象。此外,還提出一種預(yù)測新LncRNA-疾病關(guān)聯(lián)關(guān)系的生物信息學(xué)方法,并將預(yù)測的1564個LncRNA-疾病關(guān)聯(lián)關(guān)系整合到數(shù)據(jù)庫中。

      2.2 Lnc2Cancer ?Ning S等[8]于2015年建立了專門收集LncRNA-癌癥關(guān)聯(lián)關(guān)系的、且有實驗支持的LncRNA數(shù)據(jù)庫——Lnc2Cancer。該庫中的LncRNA數(shù)據(jù)來源于PubMed數(shù)據(jù)庫中已發(fā)表的1500余篇相關(guān)文獻(xiàn)。通過手工檢索和整理的方式,該數(shù)據(jù)庫在531種LncRNAs和86種人類癌癥范圍內(nèi),共收集了1057個LncRNA-癌癥關(guān)聯(lián)關(guān)系數(shù)據(jù)。庫中每個關(guān)聯(lián)數(shù)據(jù)包括LncRNA與癌癥的名稱、LncRNA序列及位置信息、LncRNA表達(dá)模式、實驗技術(shù)、LncRNA功能描述、PubMed數(shù)據(jù)庫超鏈接和其他注釋信息等。Lnc2Cancer的用戶界面友好,方便用戶檢索和下載數(shù)據(jù),并允許用戶在線提交新驗證的LncRNA-癌癥關(guān)聯(lián)關(guān)系數(shù)據(jù)。用戶通過分析來自Lnc2Cancer的數(shù)據(jù),可進一步挖掘這些數(shù)據(jù)中隱藏的一些重要信息,構(gòu)建LncRNA-癌癥二分網(wǎng)絡(luò),更加系統(tǒng)地分析LncRNAs對癌癥的調(diào)控作用。

      2.3 TANRIC ?TANRIC是2015年由Li J等[9]開發(fā)的研究LncRNAs在癌癥中調(diào)控功能及臨床診療價值的數(shù)據(jù)分析和可視化平臺。它收集并分析了20種癌癥患者中LncRNA表達(dá)譜數(shù)據(jù),共包含8000多個來自于TCGA和其它數(shù)據(jù)集的樣本。TANRIC包括6個模塊:摘要、可視化、下載、My LncRNA、分析所有LncRNA和細(xì)胞系中的LncRNA。TANRIC將LncRNAs表達(dá)數(shù)據(jù)與臨床和基因組數(shù)據(jù)相結(jié)合,使得研究人員能夠在臨床和其他分子數(shù)據(jù)背景下,快速、直觀地分析癌癥的LncRNA特征。TANRIC的開發(fā)者還鑒定了大量具有潛在生物醫(yī)學(xué)標(biāo)記的LncRNAs,其中許多顯示與已明確的治療靶標(biāo)和跨腫瘤類型的生物標(biāo)記,或者跨細(xì)胞系的藥物敏感性強烈相關(guān)。TANRIC極大地促進了與LncRNA相關(guān)的生物學(xué)發(fā)現(xiàn)和臨床應(yīng)用。

      2.4 LnCaNet ?2016年1月,Liu Y等[10]在對LncRNA和非鄰近癌基因之間相互作用進行搜索和分析的基礎(chǔ)上,開發(fā)了一個收錄LncRNA共表達(dá)數(shù)據(jù)的數(shù)據(jù)庫——LnCaNet。LnCaNet共收集了2922個匹配的癌癥基因組圖譜TCGA樣品,包含了來源于9641個LncRNAs和2544個癌癥基因的8494907個有意義的共表達(dá)對。LnCaNet整合了來自公共數(shù)據(jù)庫的10個癌癥基因列表,分別計算了11種TCGA癌癥類型中所有LncRNA的共表達(dá)。基于110個共表達(dá)網(wǎng)絡(luò)的分析結(jié)果,LnCaNet確定了17個與11種癌癥細(xì)胞外空間相關(guān)的常見調(diào)節(jié)對。LnCaNet致力于為LncRNA和癌癥基因建立全面的網(wǎng)絡(luò)資源,包括綜合癌癥基因列表、預(yù)先計算的LncRNA與癌基因之間的共表達(dá)、泛癌LncRNA表達(dá)網(wǎng)、LncRNA-癌癥基因相互作用對。LnCaNet為研究者深入分析LncRNA調(diào)控功能提供了重要參考。

      2.5 LincSNP 2.0 ?LincSNP 2.0是2016年5月由Ning S等[11]開發(fā)的一個數(shù)據(jù)庫,它是首個專門用于存儲和注釋人類LncRNA與其轉(zhuǎn)錄因子結(jié)合位點(TFBSs)中的與疾病關(guān)聯(lián)的單核苷酸多態(tài)性(SNP)數(shù)據(jù),以期幫助用戶確認(rèn)新的與疾病關(guān)聯(lián)的SNP數(shù)據(jù)。LincSNP 1.0[14]創(chuàng)建于2014年5月,LincSNP 2.0是其更新版。LincSNP 2.0中的LncRNA來源于5個數(shù)據(jù)庫,包括Ensembl[15]、LncRBase[16]、NONCODE[17]、LNCipedia[18]和GENCODE[19]。LincSNP 2.0中,含有809451個與疾病相關(guān)的SNP和244545個人類LncRNA,涉及9種類型的LncRNA,包含58個具有實驗支持的SNP-LncRNA-疾病關(guān)聯(lián)。為了方便用戶更好地使用LincSNP 2.0中的數(shù)據(jù),該數(shù)據(jù)庫還為用戶提供了3種在線檢索和分析數(shù)據(jù)的工具,分別為Linc-Mart、Linc-Browse和Linc-Score。

      2.6 Lnc2Catlas ?Lnc2Catlas是一個從不同方面收集并且定量化表示LncRNA-癌癥關(guān)聯(lián)關(guān)系的數(shù)據(jù)庫[12]。該數(shù)據(jù)庫從LncRNA二級結(jié)構(gòu)擾動、LncRNA-蛋白質(zhì)相互作用和共表達(dá)網(wǎng)絡(luò)三個方面數(shù)值化評價LncRNA對癌癥的調(diào)控作用。Lnc2Catlas共收錄27670個具有明確注釋的LncRNAs,包含了247124個LncRNA-SNP關(guān)聯(lián)關(guān)系、超過200萬個LncRNA-蛋白質(zhì)相互作用關(guān)系和6902個共表達(dá)簇數(shù)據(jù)。Lnc2Catlas構(gòu)建相關(guān)LncRNA、SNP和蛋白質(zhì)的調(diào)控關(guān)系網(wǎng)絡(luò),從多角度分析LncRNA與癌癥之間的定量關(guān)系,這使得最終分析結(jié)果更加準(zhǔn)確、可信。

      2.7 LncRNADisease2.0 ?LncRNADisease2.0是LncRNADisease的更新版,由Bao Z等[13]在2018年7月建立。LncRNADisease 2.0記錄了20多萬個LncRNA-疾病關(guān)聯(lián)關(guān)系數(shù)據(jù)。它共收集了來自PubMed的12000余篇文獻(xiàn),包含10564個實驗支持的LncRNA-疾病關(guān)聯(lián)關(guān)系數(shù)據(jù)和1004個實驗支持的circRNA-疾病關(guān)聯(lián)關(guān)系數(shù)據(jù)。數(shù)據(jù)庫中還包含195395個預(yù)測的LncRNA-疾病關(guān)聯(lián)關(guān)系,其中23102個關(guān)聯(lián)關(guān)系至少可被2種算法預(yù)測。相對于第一個版本的LncRNADisease,LncRNADisease 2.0具有明顯的改進:①實驗支持和/或計算支持的LncRNA-疾病關(guān)聯(lián)關(guān)系數(shù)量超過第一版40倍;②提供了LncRNA,mRNA和miRNA之間的轉(zhuǎn)錄調(diào)控關(guān)系;③將疾病名稱映射到MeSH數(shù)據(jù)庫[20],為每個LncRNA-疾病關(guān)聯(lián)關(guān)系提供數(shù)量化的置信度分?jǐn)?shù);④增加了環(huán)狀RNA(circRNAs)與疾病之間的關(guān)聯(lián)關(guān)系數(shù)據(jù)。LncRNADisease 2.0是收集LncRNA-疾病關(guān)聯(lián)關(guān)系數(shù)據(jù)較全的數(shù)據(jù)庫之一。

      3總結(jié)

      本文介紹了7個LncRNA調(diào)控人類疾病關(guān)聯(lián)數(shù)據(jù)庫,每個數(shù)據(jù)庫都有其特點和適用范圍。研究人員需要根據(jù)自己的需求和想法,選擇適合的數(shù)據(jù)庫,才能有助于分析和研究。該類數(shù)據(jù)庫還有很多需要改進和完善發(fā)展的方面:①研究人員搜集了大量的LncRNA-疾病關(guān)聯(lián)數(shù)據(jù),但目前還沒有一個權(quán)威、統(tǒng)一和系統(tǒng)的數(shù)據(jù)庫包含已有的全部LncRNA-疾病關(guān)聯(lián)關(guān)系數(shù)據(jù),大部分?jǐn)?shù)據(jù)庫都在按照自己的組織方式不斷的維護和更新,用戶常常需要分析多個數(shù)據(jù)庫才能得到比較準(zhǔn)確、權(quán)威的結(jié)果;②LncRNA與人類疾病的關(guān)系是一個計較系統(tǒng)復(fù)雜的問題,尚有許多新的LncRNA-疾病關(guān)聯(lián)關(guān)系數(shù)據(jù)屬性沒有被發(fā)現(xiàn),這需要研究人員持續(xù)地探索和研究,不斷更新數(shù)據(jù)的組織方式,并在大量相關(guān)數(shù)據(jù)中發(fā)現(xiàn)新的LncRNA調(diào)控疾病的規(guī)律;③目前建立的LncRNA數(shù)據(jù)庫一般包括LncRNA-miRNA、蛋白質(zhì)結(jié)合互作、相鄰基因共表達(dá)、疾病上下調(diào)等功能分析,但LncRNA的其他多種重要調(diào)節(jié)功能仍沒有被收集,如作為增強子參與調(diào)控基因的表達(dá)、通過修飾染色體參與表觀調(diào)節(jié)等。目前還沒有類似數(shù)據(jù)庫收集LncRNA的這方面數(shù)據(jù),這在一定程度上限制了對LncRNA調(diào)控功能的深入分析。

      隨著越來越多的研究者關(guān)注并且投身到LncRNA調(diào)控人類疾病關(guān)系數(shù)據(jù)庫的研究中,我們相信未來會有更加全面、高效、易用的數(shù)據(jù)庫出現(xiàn),服務(wù)于LncRNA調(diào)控功能研究。

      參考文獻(xiàn):

      [1]Clark MB,Mattick JS.Long noncoding RNAs in cell biology[J].Semin Cell Dev Biol,2011,22(4):366-376.

      [2]Mercer TR,Dinger ME,Mattick JS.Long non-coding RNAs:insights into functions[J].Nat Rev Genet,2009,10(3):155-159.

      [3]周眾.LncRNA-基因調(diào)控關(guān)系的生物信息學(xué)數(shù)據(jù)庫構(gòu)建及分析預(yù)測[D].中國科學(xué)技術(shù)大學(xué),2016.

      [4]林陳勝,阮寧生,張彥定.長鏈非編碼RNA數(shù)據(jù)庫資源[J].中國生物化學(xué)與分子生物學(xué)報,2016,32(6):599-606.

      [5]Moran VA,Perera RJ,Khalil AM.Emerging functional and mechanistic paradigms of mammalian long non-coding RNAs[J].Nucleic Acids Res,2012,40(14):6391-6400.

      [6]夏天,肖丙秀,郭俊明.長鏈非編碼RNA的作用機制及其研究方法[J].遺傳,2013,35(3):269-280.

      [7]Chen G,Wang Z,Wang D,et al.LncRNADisease:a database for long-non-coding RNA-associated diseases[J].Nucleic Acids Res,2013,41(D1):D983-D986.

      [8]Ning S,Zhang J,Wang P,et al.Lnc2Cancer:a manually curated database of experimentally supported LncRNAs associated with various human cancers[J].Nucleic Acids Res,2016,44(D1):D980-D985.

      [9]Li J,Han L,Roebuck P,et al.TANRIC:an interactive open platform to explore the function of LncRNAs in cancer[J].Cancer Res,2015,75(18):3728-3737.

      [10]Liu Y,Zhao M.LnCaNet:pan-cancer co-expression network for human LncRNA and cancer genes[J].Bioinformatics,2016,32(10):1595-1597.

      [11]Ning S,Yue M,Wang P,et al.LincSNP 2.0:an updated database for linking disease-associated SNPs to human long non-coding RNAs and their TFBSs[J].Nucleic Acids Res,2017,45(D1):D74-D78.

      [12]Ren C,An G,Zhao C,et al.Lnc2Catlas:an atlas of long noncoding RNAs associated with risk of cancers[J].Sci Rep,2018,8(1):1909.

      [13]Bao Z,Yang Z,Huang Z,et al.LncRNADisease 2.0:an updated database of long non-coding RNA-associated diseases[J].Nucleic Acids Res,2019,47(D1):D1034-D1037.

      [14]Ning S,Zhao Z,Ye J,et al.LincSNP:a database of linking disease-associated SNPs to human large intergenic non-coding RNAs[J].BMC Bioinformatics,2014,15(1):152.

      [15]Flicek P,Ahmed I,AmodeMR,et al.Ensembl 2013[J].Nucleic Acids Res,2013,41(D1):D48-D55.

      [16]Chakraborty S,Deb A,Maji RK,et al.LncRBase:an enriched resource for LncRNA information[J].PLoS One,2014,9(9):e108010.

      [17]Fang S,Zhang L,Guo J,et al.NONCODEV5:a comprehensive annotation database for long non-coding RNAs[J].Nucleic Acids Res,2018,46(D1):D308-D314.

      [18]Volders PJ,Helsens K,Wang X,et al.LNCipedia:a database for annotated human LncRNA transcript sequences and structures[J].Nucleic Acids Res,2013,41(D1):D246-D251.

      [19]Harrow J,F(xiàn)rankish A,Gonzalez JM,et al.GENCODE:the reference human genome annotation for The ENCODE Project[J].Genome Res,2012,22(9):1760-1774.

      [20]Lipscomb CE.Medical Subject Headings(MeSH)[J].Bull Med Libr Assoc,2000,88(3):265-266.

      收稿日期:2019-3-12;修回日期:2019-3-22

      編輯/杜帆

      猜你喜歡
      長鏈非編碼RNA生物信息學(xué)
      MicroRNA及l(fā)ncRNA在心肌纖維化中的研究進展
      長鏈非編碼RNA在胃癌中作用機制的研究進展
      LncRNAs作為miRNA的靶模擬物調(diào)節(jié)miRNA
      長鏈非編碼RNA與肝癌的關(guān)系及其研究進展
      淺談醫(yī)學(xué)院校生物信息學(xué)專業(yè)青年教師規(guī)范培訓(xùn)模式的建立
      “PBL+E—learning”教學(xué)模式探索
      移動教學(xué)在生物信息學(xué)課程改革中的應(yīng)用
      今傳媒(2016年11期)2016-12-19 11:35:50
      中醫(yī)大數(shù)據(jù)下生物信息學(xué)的發(fā)展及教育模式淺析
      數(shù)據(jù)挖掘技術(shù)在生物信息學(xué)中的應(yīng)用
      生物信息學(xué)課堂危機及對策研究
      科技視界(2016年23期)2016-11-04 10:07:53
      大丰市| 娱乐| 九台市| 隆德县| 岢岚县| 惠安县| 江津市| 遵义县| 宁波市| 肇庆市| 广安市| 平武县| 潼南县| 巴青县| 庆阳市| 叶城县| 洛川县| 赤水市| 吴江市| 额济纳旗| 平武县| 雷州市| 唐山市| 赣榆县| 连南| 甘洛县| 綦江县| 绩溪县| 株洲市| 苍南县| 郯城县| 巨野县| 平遥县| 商洛市| 松溪县| 弋阳县| 黄陵县| 甘肃省| 洪泽县| 泉州市| 黎川县|