• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      生物信息學(xué)方法對(duì)影響肺癌發(fā)生發(fā)展關(guān)鍵基因的初步篩選

      2012-09-11 01:44:24王俊龍石俊杰劉文洲孫宇周華富
      中國(guó)肺癌雜志 2012年11期
      關(guān)鍵詞:基因芯片探針芯片

      王俊龍 石俊杰 劉文洲 孫宇 周華富

      肺癌是最常見(jiàn)的惡性腫瘤之一,對(duì)肺癌的早期診斷和有效治療是全球亟需解決的一個(gè)難題。在腫瘤發(fā)生發(fā)展過(guò)程中,有大量伴隨基因參與癌基因擴(kuò)增過(guò)程,但是它們并不是我們所要找的關(guān)鍵基因。我們考慮通過(guò)探索不同組織類型、不同人群來(lái)源的肺癌組織基因芯片,得到芯片結(jié)果共同改變的部分,有可能篩選出影響肺癌發(fā)生發(fā)展的關(guān)鍵基因。目前已有研究通過(guò)分析基因表達(dá)芯片來(lái)挖掘影響肺癌發(fā)生發(fā)展的通路及基因[1],已識(shí)別出大量差異表達(dá)的基因。但這些差異基因并沒(méi)有進(jìn)行進(jìn)一步討論,各個(gè)基因芯片的分析結(jié)果存在很多不一致性。Mootha等[2]提出基因組富集(gene set enrichment analysis, GSEA)分析,該方法能在病例對(duì)照類型數(shù)據(jù)中,基于基因組系統(tǒng)水平上來(lái)挖掘影響疾病的基因通路。Meta分析可對(duì)同一個(gè)問(wèn)題所發(fā)表相關(guān)研究報(bào)告的結(jié)果進(jìn)行收集、統(tǒng)計(jì)上的整合,以期獲得更準(zhǔn)確或更多的結(jié)果。Rhodes等[3]首先將meta分析引入基因芯片數(shù)據(jù)分析領(lǐng)域。本研究采用GSEA等生物信息學(xué)方法對(duì)6套[4-7]肺癌全基因組表達(dá)芯片數(shù)據(jù)進(jìn)行研究,挖掘出隱藏在芯片數(shù)據(jù)下的生物學(xué)信息,篩選出影響肺癌發(fā)生發(fā)展的關(guān)鍵基因,為對(duì)肺癌靶向治療的研究奠定基礎(chǔ)。

      1 材料與方法

      1.1 研究樣本 肺癌有關(guān)的基因芯片數(shù)據(jù)均來(lái)源于互聯(lián)網(wǎng)開(kāi)放的免費(fèi)數(shù)據(jù)庫(kù):GEO數(shù)據(jù)庫(kù)http://www.ncbi.nlm.nih.gov/geo/中下載。肺癌芯片信息收集在GEO DataSets中以:“l(fā)ung cancer, homo sapiens”為關(guān)鍵詞檢索所有公開(kāi)上傳的芯片數(shù)據(jù)。符合以下標(biāo)準(zhǔn)的數(shù)據(jù)集將納入我們的研究中:①所選數(shù)據(jù)集必須是全基因組的表達(dá)mRNA芯片數(shù)據(jù);②這些數(shù)據(jù)是關(guān)于肺癌患者和正常對(duì)照;③本研究均考慮經(jīng)標(biāo)準(zhǔn)化或者原始數(shù)據(jù)集;④所選數(shù)據(jù)集必須包括超過(guò)3個(gè)樣本以上。最后,有6套芯片數(shù)據(jù)集納入我們的研究中(表1)。

      1.2 數(shù)據(jù)處理 符合我們制定標(biāo)準(zhǔn)的芯片數(shù)據(jù),在GEO中下載基因芯片的CEL數(shù)據(jù)壓縮包;若該芯片未提供CEL數(shù)據(jù)包下載,則下載該數(shù)據(jù)集的TXT格式的原始數(shù)據(jù)。通過(guò)R語(yǔ)言的Bioconductor 2.10.1版本來(lái)對(duì)芯片數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,用軟件包affty中的RMA算法對(duì)affymetrix平臺(tái)的原始數(shù)據(jù)進(jìn)行背景校正、標(biāo)準(zhǔn)化和log2轉(zhuǎn)換。對(duì)每一套數(shù)據(jù)中每個(gè)探針的檢驗(yàn)采用成組t檢驗(yàn)。最后只選取在KEGG中存在的基因進(jìn)行GSEA的分析。剔除變異四分位距<0.5的基因。如果一個(gè)基因?qū)?yīng)幾個(gè)探針,我們只保留變異IQR最高的探針。

      GSEA通過(guò)Bioconductor的Category包進(jìn)行。只有超過(guò)10個(gè)基因的類保留,通過(guò)t檢驗(yàn)對(duì)每一個(gè)通路中的基因進(jìn)行檢驗(yàn)。通過(guò)1,000次循環(huán)的排列組合(permutation)獲得每個(gè)顯著通路的P值[1]。

      將得到的6套數(shù)據(jù)各自上調(diào)下調(diào)的通路進(jìn)行總和比較,發(fā)現(xiàn)緊密連接通路在6套數(shù)據(jù)中都表現(xiàn)為下調(diào)。我們將每套數(shù)據(jù)里這條通路的所含基因進(jìn)行meta分析。運(yùn)用SAS 9.13軟件,通過(guò)t檢驗(yàn)把每套數(shù)據(jù)里緊密連接通路里的每個(gè)探針?biāo)愠鯬值,再通過(guò)下列公式算出每個(gè)基因的χ2值[8]。

      自由度為數(shù)據(jù)集K的2倍,最后保留P<0.05的基因。對(duì)這些基因通路的分析通過(guò)DAVID(http://david.abcc.ncifcrf.gov/)中的KEGG庫(kù)進(jìn)行分析。

      2 結(jié)果

      2.1 GSEA分析結(jié)果 通過(guò)GSEA方法對(duì)6套數(shù)據(jù)集進(jìn)行功能基因富集,分別找出影響這幾個(gè)數(shù)據(jù)集的主要上調(diào)通路和下調(diào)通路。

      GSE10072數(shù)據(jù)集富集出上調(diào)通路50條,下調(diào)通路86條。GSE18842富集出61條上調(diào)通路;78條下調(diào)通路。GSE31548數(shù)據(jù)集富集出上調(diào)通路10條,下調(diào)通路54條。GSE31547數(shù)據(jù)集富集出上調(diào)通路40條,下調(diào)通路79條。GSE3268數(shù)據(jù)集富集出上調(diào)通路39條,下調(diào)通路77條。GSE19804數(shù)據(jù)集富集出上調(diào)通路45條,下調(diào)通路87條。

      6組數(shù)據(jù)中所得通路對(duì)比,下調(diào)通路重疊性較高,共28條(表2);上調(diào)中皆有的通路為氨基酰-tRNA生物合成aminoacyl-tRNA biosynthesis(屬于基因信息分類);嘧啶代謝pyrimidine metabolism(屬于代謝類);生物堿類合成biosynthesis of alkaloids derived from histidine and purine(屬于代謝類)。2.2 Meta分析結(jié)果 緊密連接通路屬于細(xì)胞通訊分類,我們重點(diǎn)研究此條通路。通過(guò)R命令語(yǔ)言,得到6組數(shù)據(jù)集里緊密連接通路各自所含基因探針號(hào)。將探針號(hào)傳至http://david.abcc.ncifcrf.gov/conversion.jsp網(wǎng)站上進(jìn)行官方名稱轉(zhuǎn)換,得到6組數(shù)據(jù)里該通路所含的基因名稱。GSE10072里在緊密連接通路所含差異基因69個(gè),GSE18842含93個(gè),GSE19804含87個(gè),GSE31547含71個(gè),GSE31548含144個(gè),GSE3268含141個(gè)。通過(guò)上步Meta運(yùn)行結(jié)果可得緊密連接通路里差異有統(tǒng)計(jì)學(xué)意義(P<0.05)的基因11個(gè),它們的名稱、P值見(jiàn)表3。篩查這11個(gè)基因,其中部分基因與肺癌表達(dá)關(guān)系密切。

      表1 6套全基因組數(shù)據(jù)集的基本情況Tab 1 Characteristics of datasets selected in the studies

      3 討論

      20世紀(jì)90年代涌出的基因芯片技術(shù)是在固相支持物表面集成大量的分子探針,與標(biāo)記好的樣品雜交然后進(jìn)行檢測(cè)分析,能夠在同一時(shí)間內(nèi)分析大量基因的表達(dá)情況,是一種高效、快速地篩選及檢測(cè)分析基因活性的新方法,此方法的出現(xiàn)對(duì)我們尋找肺癌標(biāo)記物有重要意義。人們發(fā)現(xiàn)單純的分析基因表達(dá)芯片所得數(shù)據(jù)并不理想,主要因?yàn)樯镎{(diào)控網(wǎng)絡(luò)非常復(fù)雜,許多基因不僅局限于發(fā)揮一項(xiàng)生物學(xué)功能。把基因表達(dá)的數(shù)據(jù)與其功能或已知的信號(hào)通路聯(lián)系起來(lái),才能更好地解釋芯片數(shù)據(jù),發(fā)現(xiàn)基因表達(dá)變化的潛在機(jī)制。在代謝進(jìn)程中細(xì)胞中的一部分基因經(jīng)常共同變化,研究這部分共性的基因組成的通路可能比研究單個(gè)基因更有意義。因?yàn)閷?shí)驗(yàn)平臺(tái)、樣本、標(biāo)化方法、分析方法等問(wèn)題的存在,不同實(shí)驗(yàn)室的芯片數(shù)據(jù)有很多的差異。在眾多差異存在的情況下所獲得的共同通路可能是在癌癥發(fā)生發(fā)展過(guò)程中未經(jīng)改變的原始部分[9]。這部分基因?qū)τ谖覀冴U明肺癌的發(fā)病機(jī)制可能更有意義。

      我們選擇在6套基因芯片數(shù)據(jù)中都共同存在下調(diào)的緊密連接通路進(jìn)行研究,這條通路屬于細(xì)胞通訊分類,比其它代謝類的通路更有研究?jī)r(jià)值。有研究[11]表明緊密連接通路在腫瘤抑制方面有重要作用。

      本文通過(guò)Meta分析,篩選出11個(gè)基因,其中PTEN、PRKCB及CASK三個(gè)基因在報(bào)道中與肺癌發(fā)病有重要關(guān)系,它們?cè)谝种萍?xì)胞增殖中有明顯作用,與我們得到的基因處于下調(diào)通路結(jié)果一致。PTEN基因,即重組腺病毒第10號(hào)染色體同源丟失性磷酸酶張力蛋白基因(phosphatase and tensin homology delected on chromosome ten)是迄今發(fā)現(xiàn)的第一個(gè)編碼具有磷酸酶活性蛋白質(zhì)的抑癌基因,在調(diào)控細(xì)胞生長(zhǎng)及細(xì)胞凋亡過(guò)程中起著重要作用[5]。PTEN基因的失活與多種腫瘤的發(fā)生發(fā)展密切相關(guān),在結(jié)直腸癌、乳腺癌、鼻咽癌、胃癌等多種癌組織中都已報(bào)道該基因的缺失或突變。目前有關(guān)其在肺癌中的表達(dá)改變研究近兩年才有報(bào)道。舒紅等[11]認(rèn)為PTEN/PI3K/Akt信號(hào)途徑可能參與了非小細(xì)胞肺癌的發(fā)生及惡性進(jìn)展,而PTEN的表達(dá)情況可作為判斷非小細(xì)胞肺癌預(yù)后的指標(biāo)之一。

      表2 6組數(shù)據(jù)集中重疊的28條下調(diào)通路Tab 2 The overlapping 28 down pathways in the studies

      表3 共同存在于6套數(shù)據(jù)集緊密連接通路里的差異顯著基因meta分析結(jié)果Tab 3 Significance genes of tight junction in meta analysis for six datasets

      PRKCB基因蛋白激酶C(PKC)是基因家族的成員之一。PRKCB的基因功能涉及許多方面,比如,B細(xì)胞活化、誘導(dǎo)細(xì)胞凋亡、內(nèi)皮細(xì)胞增殖以及腸道糖吸收。其中,B細(xì)胞活化以及誘導(dǎo)細(xì)胞凋亡功能提示PRKCB基因可能作為一抑癌基因在肺癌治療中起重要作用。PRKCB抑制劑能夠通過(guò)活化NF-κB信號(hào)通路而促使B細(xì)胞的死亡。此外在功能上,PRKCB可能與抗原受體介導(dǎo)的信號(hào)轉(zhuǎn)換相關(guān)聯(lián)。目前國(guó)內(nèi)外鮮有其與肺癌相關(guān)報(bào)道。

      誘導(dǎo)表達(dá)CASK可導(dǎo)致細(xì)胞周期依賴性激酶抑制因子等表達(dá)上調(diào), 而它們發(fā)揮抑制細(xì)胞增殖功能的方式是導(dǎo)致細(xì)胞G1/S期阻滯,提示CASK可以通過(guò)調(diào)節(jié)細(xì)胞周期調(diào)控因子參與細(xì)胞周期的調(diào)控、抑制細(xì)胞的增殖功能。國(guó)內(nèi)目前無(wú)與肺癌的相關(guān)報(bào)道。因?yàn)楣餐份^多,我們首先選取最有意義的細(xì)胞通訊分類通路進(jìn)行研究,后續(xù)我們將對(duì)這些差異顯著基因進(jìn)行驗(yàn)證。

      猜你喜歡
      基因芯片探針芯片
      出生時(shí)即可預(yù)判發(fā)育潛力 基因芯片精準(zhǔn)篩選肉牛良種
      雙管單色熒光PCR法與基因芯片法檢測(cè)CYP2C19基因多態(tài)性的比較研究
      多通道Taqman-探針熒光定量PCR鑒定MRSA方法的建立
      芯片測(cè)試
      BOPIM-dma作為BSA Site Ⅰ特異性探針的研究及其應(yīng)用
      多通道采樣芯片ADS8556在光伏并網(wǎng)中的應(yīng)用
      應(yīng)用基因芯片技術(shù)檢測(cè)四種結(jié)核藥物敏感試驗(yàn)的研究
      透射電子顯微鏡中的掃描探針裝置
      基于提升小波的基因芯片數(shù)據(jù)的分類預(yù)測(cè)
      74HC164芯片的應(yīng)用
      河南科技(2014年10期)2014-02-27 14:09:18
      呈贡县| 攀枝花市| 尼木县| 吉安市| 临武县| 双峰县| 平山县| 华安县| 墨脱县| 平顺县| 北海市| 嘉峪关市| 翁源县| 庐江县| 阳山县| 大荔县| 凌海市| 枞阳县| 高清| 东安县| 凌海市| 卢湾区| 陕西省| 道真| 霍山县| 海淀区| 姜堰市| 大新县| 仪陇县| 象州县| 崇信县| 大竹县| 汉川市| 临沂市| 沛县| 沙河市| 武功县| 新田县| 阳朔县| 丹阳市| 青州市|