耿輝,田國祥,王亞軍,張勇,馬茂,呂軍
腫瘤浸潤性免疫細(xì)胞在癌癥患者的治療效果和預(yù)后扮演著重要角色[1-3],但腫瘤微環(huán)境中腫瘤細(xì)胞與免疫細(xì)胞常存在動態(tài)調(diào)節(jié)機(jī)制,其過程十分復(fù)雜,使臨床研究充滿困難[4,5]。高通量測序技術(shù)分析mRNA差異表達(dá)是成熟的腫瘤細(xì)胞生物信息學(xué)研究方法,被廣泛應(yīng)用于研究多種癌癥類型的轉(zhuǎn)錄組分析中,但其分析結(jié)果不能直接表明免疫細(xì)胞的組成,需要通過一系列算法評估免疫浸潤,主要方法有兩種:ssGSEA法及反卷積法。ssGSEA法,目的是得到每個樣本的免疫細(xì)胞或免疫功能,免疫通路的活性,根據(jù)免疫活性進(jìn)行分組,繼而進(jìn)行統(tǒng)計分析;反卷積法,目的是從大量已知細(xì)胞樣本的表達(dá)水平推測不同樣本某類型細(xì)胞的表達(dá)值[6,7]。
TIME2.0網(wǎng)站綜合以上系列算法對TCGA數(shù)據(jù)庫或使用者自己提交的腫瘤表達(dá)數(shù)據(jù)估算特定免疫細(xì)胞類型,通過復(fù)雜的計算方法綜合評估免疫浸潤結(jié)果更具可靠性,并對結(jié)果進(jìn)行可視化展示。
2019年學(xué)者Chaoran等通過腫瘤浸潤性免疫細(xì)胞分析平臺TIMER分析了所有腫瘤浸潤性免疫細(xì)胞(TIIC)與NDRG家族之間的相關(guān)性,發(fā)現(xiàn)NDRG2和NDRG3的mRNA高表達(dá)與肝癌發(fā)生相關(guān)[8]。2019年學(xué)者Hao等運(yùn)用TIMER平臺分析出EGFRMUT和EGFR-WT病例免疫細(xì)胞浸潤水平差異,從而得到EGFR的突變表明特定類型免疫細(xì)胞的浸潤增加且使預(yù)后不良的結(jié)論[9]。2019年Liang等用TIMER估計候選基因在免疫細(xì)胞浸潤和臨床參數(shù)之間的潛在關(guān)聯(lián),通過Spearman相關(guān)法計算EMT基因與腫瘤微環(huán)境狀態(tài)之間的相關(guān)性,并在TIMER中進(jìn)行了驗證[10]。2019年Liyan Chen Te通過TIMER評估CTRP1表達(dá)與GBM中腫瘤浸潤巨噬細(xì)胞以及GBM中CTRP1和CCL2之間的mRNA表達(dá)水平的相關(guān)性[11]。2019年Tu等學(xué)者用TIMER平臺分析評估來自TCGA的10897種32種癌癥類型的樣本數(shù)據(jù)中的免疫細(xì)胞浸潤,研究了免疫檢查點分子與典型浸潤性免疫細(xì)胞之間的相關(guān)性[12]。2019年學(xué)者Cai等利用TIMER平臺分析和比較了BTN3A2在32種癌癥的癌癥中的mRNA表達(dá)水平后得到結(jié)果,BTN3A2與預(yù)后結(jié)果呈正相關(guān),可用作臨床預(yù)后效果的獨立診斷基因[13]。2019年學(xué)者Xiao等利用TIMER平臺評估TGFβ2的表達(dá),探索TGFβ2與腫瘤免疫浸潤的相關(guān)性,確定TGFβ2可以作為胃癌預(yù)后的生物標(biāo)志物[14]。2019年學(xué)者Feng等利用TIMER數(shù)據(jù)平臺分析了miRNA差異表達(dá)與MIBC存活之間的相關(guān)性,共檢測到8個與MIBC的存活率相關(guān)miRNA[15]。2019年Xu等利用TIMER數(shù)據(jù)平臺探索CSF2表達(dá)與預(yù)后和免疫應(yīng)答之間的相關(guān)性,得到一種新型的結(jié)直腸癌生物標(biāo)志物[16]。
TIMER2.0數(shù)據(jù)庫能系統(tǒng)評估各種癌癥類型免疫浸潤的綜合數(shù)據(jù)庫,提供多種方法評估免疫浸潤程度,允許科研人員在線動態(tài)生成高質(zhì)量的圖形,以全面探索多種腫瘤的免疫組學(xué)、臨床表現(xiàn)和基因組學(xué)特征。數(shù)據(jù)庫使用流程如圖1所示,登錄TIMER2.0數(shù)據(jù)庫(http://timer.cis-trome.org/),用鼠標(biāo)選擇評估方法、關(guān)注的腫瘤類型、目標(biāo)基因即可算出免疫細(xì)胞的浸潤數(shù)據(jù),并提供一鍵在線可視化。
圖1 TIMER2.0數(shù)據(jù)庫使用流程
TIME2.0數(shù)據(jù)庫主要有三個子模塊:Immune子模塊能夠分析目標(biāo)基因在腫瘤組織與免疫細(xì)胞浸潤之間的相關(guān)性;Exploration子模塊展示了目標(biāo)基因在腫瘤與正常組織之間的差異化表達(dá);Estimation模塊允許科研人員上傳自己的數(shù)據(jù)進(jìn)行免疫浸潤情況評估。
2.1 Immune子模塊應(yīng)用介紹Immune子模塊下共有四個可供選擇的分支模塊,包括:Gene、Mutation、sCNA和Outcome。
Gene模塊允許科研人員自主選擇目標(biāo)基因,分析其表達(dá)量與多種癌癥類型中免疫浸潤水平的相關(guān)性。用戶在“Gene Expression”和“Immune Infiltrates”下拉選框分別選擇目標(biāo)基因及免疫細(xì)胞后,點擊“Submit”按鈕后,將生成一張帶有數(shù)字的熱圖,該熱圖反映了各種癌癥類型中目標(biāo)基因表達(dá)量與免疫浸潤水平的相關(guān)系數(shù),單擊單元格時,將彈出一個散點圖,以顯示浸潤估計值與基因表達(dá)量之間的關(guān)系如圖3所示。
圖2 TIMER2.0數(shù)據(jù)庫主頁示意圖
圖3 Gene子模塊示意圖
Mutation模塊能夠同時分析和可視化基因突變對多種癌癥類型和免疫細(xì)胞浸潤的影響,科研人員通過手動鍵入基因名稱或按突變頻率排序的常見突變基因列表選擇基因,然后指定免疫細(xì)胞類型并單擊提交,TIMER2.0會生成一個熱圖,該熱圖表是輸入基因突變與沒有突變的腫瘤組織之間的免疫浸潤水平變化,單擊熱圖上的數(shù)據(jù)框,可查看突變與腫瘤組織中免疫浸潤分布的小提琴圖。
sCNA模塊用來分析免疫浸潤與體細(xì)胞拷貝數(shù)之間的關(guān)系。對于給定的基因,TIMER2.0將顯示一個堆積的條形圖,顯示所有TCGA癌癥類型改基因不同sCNA狀態(tài)的比例圖, TIMER2.0要求科研人員指定基因的“Deep Deletion”或“High Amplification”的狀態(tài),以與“diploid/normal”狀態(tài)進(jìn)行比較,查詢完成時,TIMER2.0會繪制一個熱圖,以顯示拷貝數(shù)變更組和正常組之間免疫滲透水平變化。通過單擊每個表格,會通過小提琴圖顯示該基因在不同sCNA狀態(tài)之間的免疫滲透分布,以及正常組與每個變更組的對比如圖4所示。
圖4 sCNA子模塊示意圖
Outcome模塊用來分析免疫浸潤與臨床樣本之間的相關(guān)性,同時建立一個COX風(fēng)險模型,協(xié)變量可以是臨床因素或基因,選定變量并運(yùn)行后,TIMER數(shù)據(jù)庫會生成一個熱圖,顯示每個模型的多種癌癥類型浸潤系數(shù),熱圖的每個單元對應(yīng)于一個獨立的Cox模型,單擊該單元格將顯示相應(yīng)免疫浸潤和癌癥類型的Kaplan-Meier曲線,Cox模型的危險比和P值及KM曲線的對數(shù)P值將顯示在KM曲線圖上,點擊按鈕“JPG”或“PDF”會以jpg或pdf格式下載如圖5所示圖片。
2.2 Exploration模塊應(yīng)用簡介Exploration子模塊下有四個可供選擇的分支模塊,包括:Gene_DE、Gene_Outcome、Gene_Mutation和Gene_Corr。
圖5 Immune模塊的COX風(fēng)險模型示意圖
Gene_DE模塊研究TCGA腫瘤中目標(biāo)基因與鄰近正常組織之間的差異表達(dá),通過差值分析(edgeR)計算轉(zhuǎn)錄組測序數(shù)據(jù),用星號標(biāo)注統(tǒng)計顯著性(*:P值<0.05;**:P值<0.01;***:P值<0.001 ),如圖6所示。
圖6 Exploration模塊泛癌結(jié)果示意圖
Gene_Outcome模塊分析基因表達(dá)與臨床樣本之間的相關(guān)性,使用Cox比例風(fēng)險模型評估基因表達(dá)結(jié)果顯著性,可選擇不同臨床因素調(diào)整模型結(jié)果,結(jié)果通過繪制熱圖顯示Cox模型中基因的歸一化系數(shù),單擊如圖中的單元格,會展示每個COX模型的KM曲線。
Gene_Mutation模塊分析比較不同突變狀態(tài)之間的差異基因表達(dá),研究人員在線選擇突變基因后,點擊“Submit”按鈕提交,結(jié)果用熱圖展示每種癌癥類型的基因差異表達(dá)的log2倍數(shù)變化,單擊單元格將顯示詳細(xì)信息。
Gene_Corr模塊用于分析目標(biāo)基因與各種癌癥類型的基因列表之間的相關(guān)性,結(jié)果以熱圖展示基因之間的相關(guān)性。
2.3 Estimation模塊應(yīng)用簡介Estimation模塊支持研究者上傳自己的表達(dá)數(shù)據(jù)進(jìn)行免疫浸潤評估。研究者進(jìn)入Estimation模塊后點擊“Browse”上傳自己的表達(dá)矩陣,可上傳csv和txt等常見格式,物種包含人類和小鼠,“Cancer Type”選項卡下拉選擇腫瘤類型,如選擇“AUTO”選項TIMER數(shù)據(jù)庫將自動根據(jù)評估結(jié)果擬合契合度最高的TCGA癌癥類型,以上選擇完成后點擊“RUN !”運(yùn)行得到評估結(jié)果如圖7~9所示的一表兩圖。
圖7結(jié)果下方表格中列名為不同數(shù)據(jù)庫中的免疫細(xì)胞名稱,行名為樣本名,表格中的數(shù)據(jù)為各樣本的免疫細(xì)胞含量。
圖7 Esimation模塊結(jié)果表1
圖8的柱狀圖表示不同免疫細(xì)胞在不同數(shù)據(jù)庫對應(yīng)樣本中含量的統(tǒng)計圖,行名表示不同免疫細(xì)胞,列名為:TIMER、CIBERSORT、quanTIseq、xCell、MCPCounter、EPIC不同數(shù)據(jù)庫,圖中不同顏色的柱狀圖對應(yīng)不同的樣本,柱的高度表示該免疫細(xì)胞在對應(yīng)樣本中的含量。
圖8 Esimation模塊結(jié)果圖1
圖9的餅狀圖表示不同樣本間免疫細(xì)胞含量的統(tǒng)計圖,行名表示樣本,列名為:CIBERSORT、quanTIseq、EPIC數(shù)據(jù)庫,圖中不同顏色對應(yīng)不同的免疫細(xì)胞,扇形的面積表示該免疫細(xì)胞在對應(yīng)樣本中的含量。
圖9 Esimation模塊結(jié)果圖2
TIMER2.0是一個免費的交互式web服務(wù)數(shù)據(jù)庫,能夠全面、靈活地評估腫瘤浸潤免疫細(xì)胞并可視化,本文詳細(xì)介紹了該數(shù)據(jù)庫的使用方法,TIMER2.0數(shù)據(jù)庫主要有三個部分組成:Immune子模塊分析目標(biāo)基因在腫瘤組織與免疫細(xì)胞浸潤之間的相關(guān)性、Exploration子模塊展示目標(biāo)基因在腫瘤與正常組織之間的差異化表達(dá)、Estimation模塊允許進(jìn)行個性化的免疫浸潤情況評估。三個子模塊均能將通過ssGSEA及反卷積算法評估的免疫細(xì)胞浸潤結(jié)果進(jìn)行可視化展示[17]。
TIMER2.0數(shù)據(jù)庫集成了多種最新算法進(jìn)行免疫浸潤評估,這些算法使科研人員能夠一站式探索癌癥基因組圖譜TCGA數(shù)據(jù)庫中免疫細(xì)胞與腫瘤之間的各種相關(guān)性。TIMER2.0數(shù)據(jù)庫利用immunedeconv[18]R軟件包集成了包括TIMER、xCell、MCP、CIBERSORT、EPIC和quanTIseq等算法,TIMER是唯一一種在估計免疫細(xì)胞數(shù)量時會考慮組織特異性的方法,xCell算法納入了大量不同類型的免疫細(xì)胞,CIBERSORT算法對反卷積計算中更具某種特征的細(xì)胞子集進(jìn)行關(guān)注,EPIC和quanTIseq優(yōu)勢在于直接對輸入樣本對應(yīng)的測序原始數(shù)據(jù)進(jìn)行預(yù)處理,隨之展開免疫細(xì)胞組分預(yù)測,綜合使用以上算法對所有TCGA樣本進(jìn)行統(tǒng)一的預(yù)處理,會使研究人員得出評估的免疫浸潤結(jié)果更加可靠,這些算法均通過了系統(tǒng)的基準(zhǔn)測試[17-19]。因為不同組織中各種癌細(xì)胞所處免疫環(huán)境不同[20-23],故需運(yùn)用多種算法進(jìn)行綜合評估,才能使結(jié)果更具有可靠性,根據(jù)結(jié)果生成的熱圖中,紅色方框表示顯著正相關(guān),藍(lán)色方框表示顯著負(fù)相關(guān),灰色表示不相關(guān),通過熱圖科研人員可直觀識別各種組織樣本之間的重要關(guān)聯(lián),發(fā)現(xiàn)不同癌癥類型之間的共同趨勢以及特定癌癥類型與免疫細(xì)胞之間的關(guān)系。
綜上所述,TIMER2.0數(shù)據(jù)庫對科研人員提供了友好軟件界面和人性化的可視化交互,最大限度方便科研人員進(jìn)行TCGA數(shù)據(jù)庫中的免疫浸潤、基因表達(dá)、突變和生存特征之間的關(guān)聯(lián),豐富了科研人員進(jìn)行腫瘤浸潤性免疫細(xì)胞的研究方法,節(jié)省了科研人員學(xué)習(xí)R語言及數(shù)據(jù)預(yù)處理時間,并且隨著生物信息技術(shù)的蓬勃發(fā)展,毫無疑問,未來的TIMER2.0數(shù)據(jù)庫將納入更多的腫瘤信息數(shù)據(jù)庫使自身更加完善。