葉亮 李慧娟 張方 呂鏜烽 劉紅兵 宋勇
非小細胞肺癌(non-small cell lung cancer, NSCLC)嚴重威脅我國人民健康,是致死率最高的惡性腫瘤之一,給社會造成了巨大的經(jīng)濟負擔[1,2]。雖然近年發(fā)現(xiàn)了許多新的治療方式,但發(fā)現(xiàn)時大多處于中晚期,預后仍未得到顯著改善[3]。從分子水平研究NSCLC發(fā)生發(fā)展的機制有利于發(fā)現(xiàn)新的分子靶點,開發(fā)新的治療手段,對于減少患者痛苦和延長患者生存時間極為重要[4]。
Oncomine數(shù)據(jù)庫是目前全球最大的癌基因芯片數(shù)據(jù)庫和整合數(shù)據(jù)挖掘平臺,旨在挖掘癌癥基因信息。通過大學或研究機構郵箱可以免費注冊使用。迄今為止,該數(shù)據(jù)庫已經(jīng)收集了715個基因表達數(shù)據(jù)集,86,733個癌癥組織和正常組織的樣本數(shù)據(jù)。利用Oncomine數(shù)據(jù)庫可以比較常見癌癥類型和各自正常組織的差異表達分選,也可以探索各種癌癥亞型以及基于臨床和病理學的分析,進行差異表達分選、共表達分析,查找某中癌癥中差異表達的基因,確定目的基因,進而確定研究方向,不僅可以節(jié)省科研成本,而且其信息也更加全面。
驅動蛋白超家族(kinesin family member, KIF)是一類基于微管的分子馬達蛋白,介導多種功能,其異常表達,在腫瘤的發(fā)生發(fā)展過程中扮演重要角色[5,6]。KIF23基因隸屬于KIF家族,研究發(fā)現(xiàn),其在有絲分裂的胞質分離過程中起著重要作用,其表達缺失可導致有絲分裂停滯[7]。盡管既往研究表明KIF23在多種腫瘤組織和細胞中表達增高[8,9],但是在非小細胞肺癌組織中鮮有系統(tǒng)研究。
本研究利用Oncomine數(shù)據(jù)庫和Kaplan-Meier Plotters數(shù)據(jù)庫分析KIF23在NSCLC中的表達和預后,通過二次分析薈萃KIF23和NSCLC可能存在的關系,為進一步研究KIF23在NSCLC發(fā)生發(fā)展的作用機制提供線索和依據(jù),同時也為利用Oncomine數(shù)據(jù)庫挖掘腫瘤基因學數(shù)據(jù)提供良好范例。
1.1 Oncomine數(shù)據(jù)庫提取數(shù)據(jù) Oncomine數(shù)據(jù)庫是一個基于基因芯片的數(shù)據(jù)庫和整合數(shù)據(jù)挖掘平臺,在此數(shù)據(jù)中可根據(jù)自己的需求設定篩選和挖掘數(shù)據(jù)的條件。本研究中,我們設定的篩選條件為:①“Cancer Type: Lung cancer”;②“Gene: KIF23”;③“Data Type: mRNA和DNA copy number”;④“Analysis Type: Cancer vs Normal Analysis”;⑤臨界值設定條件(P value<1E-4, fold change>2, gene rank=top 10%)。選擇柱狀圖展示結果。
1.2 Kaplan-Meier Plotter進行患者生存周期分析 利用Kaplan-Meier Plotter數(shù)據(jù)庫(http://kmplot.com/analysis/)的NSCLC數(shù)據(jù)集進行在線生存分析。篩選條件如下:①“Cancer: Lung Cancer”;②“Gene: KIF23”;③“Survival: OS”。
1.3 統(tǒng)計學方法 正常組織與NSCLC病例組之間KIF23表達的差異采用t檢驗。KIF23表達與NSCLC預后的關系采用Kaplan-Meier模型分析。所有數(shù)據(jù)采用SPSS 16.0進行統(tǒng)計學分析,以雙側P<0.05為差異有統(tǒng)計學意義。
2.1 KIF23在常見腫瘤類型中的表達結果 Oncomine數(shù)據(jù)庫中共收集了447項不同類型的研究結果(圖1),其中關于KIF23表達有統(tǒng)計學差異的研究結果有67項,KIF23表達增高的研究有64項,表達降低的研究有3項。
2.2 KIF23在NSCLC中的表達結果 在Oncomine數(shù)據(jù)庫中我們發(fā)現(xiàn),自2000年開始,共有16項研究涉及KIF23在NSCLC組織和正常組織中的表達(圖2),共有1,189個樣本,包括肺腺癌、鱗癌及大細胞肺癌與正常組織比較。文章分別發(fā)表于Nat Med[10]、Genome Res[11]、Cancer Res[12,13]、PLoS One[14,15]、BMC Genomics[16]、Bioinformatics[17]、Proc Natl Acad Sci U S A[18,19]和Am J Pathol[20]。在Oncomine數(shù)據(jù)庫中薈萃分析16項研究結果發(fā)現(xiàn),與對照組相比,KIF23基因在所有差異表達基因中其中位數(shù)值排名為635.5,P=4.14E-8,提示KIF23在NSCLC中高表達。
2.3 KIF23在不同NSCLC研究芯片中的表達差異 圖3所示為Oncomine數(shù)據(jù)庫中KIF23在不同NSCLC研究芯片中的表達結果。分別在Beer等[10]、Okayaman等[12]、Stearman等[20]、Garber等[18]和Hou等[14]這5項研究中,KIF23在NSCLC中的表達量高于正常組(P均<0.001)。
2.4 KIF23與NSCLC患者預后的關系 Kaplan-Meier Plotter數(shù)據(jù)結果顯示:KIF23表達水平對患者的總生存時間有著顯著影響。與低表達組相比,KIF23高表達組NSCLC患者的總生存時間顯著降低。進一步亞組分析發(fā)現(xiàn),KIF23表達水平對肺腺癌患者預后有顯著影響,而在鱗癌患者中,其表達水平對預后無顯著影響(圖4)。
肺癌是目前全球發(fā)病率和死亡率最高的惡性腫瘤之一。并且流行病學統(tǒng)計發(fā)現(xiàn)肺癌中的肺腺癌發(fā)病率越來越高,已經(jīng)取代肺鱗癌成為發(fā)病率最高的NSCLC[21]。長期以來,NSCLC的預后一直較差,直到近十年來,隨著分子生物學技術的進展,陸續(xù)發(fā)現(xiàn)了EGFR、KARS、ALK等一批肺腺癌驅動基因[22],進而開發(fā)出一些靶向治療藥物,極大地改善了肺腺癌患者的預后[23],然而這些基因的突變僅存在于肺腺癌當中的部分患者中。因此,尋找NSCLC發(fā)生、發(fā)展的關鍵分子或靶點,對于開發(fā)治療肺癌的新的靶向藥物具有重要的理論和臨床意義,一直是國內外研究的熱點。
驅動蛋白(kinesin)是一類能利用ATP水解所釋放的能量驅動自身所攜帶的貨物分子沿微管運動的馬達蛋白,與細胞內物質運輸有關,參與囊泡、細胞器、染色體及RNA結合蛋白等的轉運,在胞內物質轉運及有絲分裂過程中起著重要的作用。到目前為止,在人和小鼠體內共發(fā)現(xiàn)45種驅動蛋白,它們分屬14個蛋白家族,根據(jù)馬達結構域在重鏈上的位置不同,將驅動蛋白劃分為3種類型:馬達結構域在C末端的C-kinesin、馬達結構域在中間的M-kinesin和馬達結構域在N末端的N-kinesin[24],大多數(shù)的驅動蛋白是N-kinesin。KIF23屬于N-kinesin,定位于細胞胞漿和胞核,與細胞的分化增殖能力有關[25]。研究發(fā)現(xiàn),在多種腫瘤如神經(jīng)膠質瘤、乳腺癌及胃癌中均存在KIF23高表達現(xiàn)象。乳腺癌中KIF23過表達與乳腺癌的腫瘤分級、侵襲性及預后顯著相關[6]。腦神經(jīng)膠質瘤細胞KIF23的高表達可能與轉錄激活有關,體內和體外實驗證實,敲除KIF23可以顯著抑制膠質瘤細胞的增殖能力[9]。此外,在胃癌中也發(fā)現(xiàn),KIF23在mRNA水平顯著升高,并且與較差的預后相關[8]。Kato等[26]研究發(fā)現(xiàn),NSCLC組織中,特別是腺癌組織中KIF23表達明顯增高,且高表達患者通常預后比較差。我們通過Oncomine數(shù)據(jù)庫研究,亦同樣發(fā)現(xiàn)KIF23在多種腫瘤中具有表達增高趨勢。
盡管多數(shù)研究發(fā)現(xiàn)KIF23在多種腫瘤包括NSCLC中高表達,但由于獨立研究存在樣本量小易導致抽樣誤差等原因,缺乏較高的可信度。Oncomine數(shù)據(jù)庫是目前全球最大的基因芯片數(shù)據(jù)庫和整合數(shù)據(jù)挖掘平臺,注冊賬戶后可用于挖掘腫瘤相關基因的信息。我們首先通過Oncomine數(shù)據(jù)庫挖掘KIF23基因在結直腸癌、乳腺癌、肺癌等常見腫瘤表達信息,結果發(fā)現(xiàn),在有統(tǒng)計學差異的67項研究中,64項研究表明KIF23在常見腫瘤中處于高表達狀態(tài)。進一步利用Oncomine數(shù)據(jù)庫薈萃分析了肺癌芯片檢測結果,同樣證明,在超過1,000例的標本中,KIF23在NSCLC組織中高表達,尤其是在肺腺癌中高表達。TheKaplan-MeierPlotter數(shù)據(jù)庫(http://kmplot.com/analysis/)是一個目前世界上最廣為接收的預后相關的在線分析數(shù)據(jù)庫,涵蓋了2,437例肺癌樣本,可對54,675個基因進行相關預后分析,并得出真實可信客觀的結果。本文首次通過KM plotter數(shù)據(jù)庫發(fā)現(xiàn)了KIF23在NSCLC中的預后價值。結果顯示,KIF23的表達量與NSCLC總體生存率明確相關,KIF23高表達患者的總生存時間顯著降低。進一步亞組分析發(fā)現(xiàn),KIF23表達水平對肺腺癌患者預后有顯著影響,而在鱗癌患者中,其表達水平對預后無顯著影響。KIF23的高表達可能影響腫瘤的發(fā)生,或許由于驅動蛋白家族表達的過度能夠影響有絲分裂的正常進行,并導致分裂阻滯或異常分裂的發(fā)生,從而產生非整倍體細胞,最終引起腫瘤的發(fā)生。我們的所有數(shù)據(jù)都來自基因芯片,研究方法一致,且包含了迄今為止最大的樣本量,去除了因為樣本量的問題導致的誤差,增加了結論的可信度。
圖1 KIF23在Oncomine數(shù)據(jù)庫中所有腫瘤研究中的表達Fig 1 Expression data for KIF23 in a variety of normal and cancerous human tissues in database Oncomine
圖2 KIF23在Oncomine數(shù)據(jù)庫中非小細胞肺癌中的表達。1-16分別表示16項研究結果,紅色越深表示KIF23基因在該芯片中表達越高。Fig 2 Expression of KIF23 in NSCLC in the studies identified in the Oncomine database. 1-16 represent the 16 studies on the expressions of KIF23 in NSCLC. Darker red indicates higher KIF23 expression in the chips.
圖3 Oncomine 數(shù)據(jù)庫中KIF23在不同NSCLC研究芯片中的表達。*:P<0.05。Fig 3 Expression of KIF23 in NSCLC in different studies identified in the Oncomine database. *: P<0.05.
圖4 KIF23表達與NSCLC預后之間的關系Fig 4 Relationship between the expression of KIF23 and the prognosis of NSCLC
綜上所述,我們通過對NSCLC組織中KIF23相關信息的深入挖掘,提出KIF23在NSCLC組織中高表達,且與NSCLC預后相關。采用數(shù)據(jù)庫進行大樣本分析,可以避免單一研究樣本量過小產生的誤差,對臨床治療提供重要理論依據(jù)。KIF23在NSCLC疾病發(fā)展中的具體作用機制,未來需要進一步的實驗來證明。