魏巍,劉明,許建國,高亞,申采奕,田金徽
結(jié)腸癌是嚴(yán)重威脅人類生命健康的常見惡性腫瘤之一,其發(fā)病率和死亡率都很高[1]。中華醫(yī)學(xué)會內(nèi)分泌學(xué)分會發(fā)布的《肢端肥大癥診治規(guī)范(草案)》指出,肢端肥大癥可能導(dǎo)致結(jié)腸癌等惡性腫瘤的發(fā)生率增加[2]。肢端肥大癥是由分泌生長激素的垂體腺瘤引起的一種骨骼、組織和器官生長不成比例的疾病,臨床上多表現(xiàn)為肢端和面部變化、多汗癥、頭痛、感覺異常、性功能障礙、高血壓、甲狀腺腫和罕見的視野缺損等[3-4]。相關(guān)研究指出,肢端肥大癥致死的主要原因并不是垂體腺瘤,而多是由其引起的多系統(tǒng)并發(fā)癥所致,其中最主要的是心血管系統(tǒng)疾病及呼吸系統(tǒng)疾病[5],另有相關(guān)研究顯示,肢端肥大癥還可能增加部分惡性腫瘤的發(fā)生率[6-7],而且Rokkas等的一項研究[8]結(jié)果顯示肢端肥大癥可能導(dǎo)致結(jié)腸癌的發(fā)病風(fēng)險增加,類似的研究也顯示,相對于健康群體,肢端肥大癥患者的結(jié)腸癌發(fā)病率和死亡率均更高[9-10],但是也有研究表明,肢端肥大癥患者的較高結(jié)腸癌發(fā)病率并不是一個普遍的研究結(jié)果[11]。本研究引入孟德爾隨機化的方法來明確肢端肥大癥與結(jié)腸癌發(fā)病的因果關(guān)系及關(guān)聯(lián)強度。
近年來,孟德爾隨機化在醫(yī)學(xué)研究和實踐中逐漸興起,相關(guān)研究發(fā)現(xiàn)孟德爾隨機化研究近年的發(fā)文量正快速增長,這表明孟德爾隨機化研究已成為流行病學(xué)的研究熱點[11]。相關(guān)研究也完善了孟德爾隨機化研究的報告要點[12]。孟德爾隨機化研究是一種以孟德爾獨立分配定理為基礎(chǔ)的流行病學(xué)研究工具,采用遺傳變異,即單核苷酸多態(tài)性(SNP)作為工具變量來評估復(fù)雜疾病的危險因素的因果關(guān)系,根據(jù)孟德爾定律:配子在形成時遵循等位基因隨機分配的原則,潛在的混雜因素也會被平均分布于兩組,使基因表型的遺傳效應(yīng)不會受到常見混雜因素的干擾,因此,孟德爾隨機化研究可以克服觀察性研究中存在的混雜因素和反向因果關(guān)系等局限性因素,可以作為研究暴露因素與結(jié)局因果關(guān)系的有效手段。
本研究采用兩樣本孟德爾隨機化分析研究肢端肥大癥與結(jié)腸癌風(fēng)險之間的因果關(guān)系。其中將肢端肥大癥作為暴露因素,選擇與肢端肥大癥顯著相關(guān)的單核苷酸多態(tài)性作為工具變量,以結(jié)腸癌作為結(jié)局變量。隨后采用Cochran Q檢驗進行異質(zhì)性檢驗,最后采用“留一法(leave-one-out)”對所獲得的結(jié)果進行敏感性分析以驗證其可靠性。
肢端肥大癥的遺傳數(shù)據(jù)來自于芬蘭數(shù)據(jù)庫(The FinnGen Biobank),遺傳數(shù)據(jù)的人群來源為歐洲,男女不限。結(jié)腸癌的遺傳數(shù)據(jù)來自于UK Biobank數(shù)據(jù)庫(https://www.ukbiobank.ac.uk/),數(shù)據(jù)ID為:ukb-b-20145,遺傳數(shù)據(jù)的人群來源為歐洲,男女不限。數(shù)據(jù)下載時間為2022年10月2日。數(shù)據(jù)詳情見表1。
表1 肢端肥大癥和結(jié)腸癌的遺傳數(shù)據(jù)信息Table 1 Genetic data of acromegaly and colon cancer
孟德爾隨機化工具變量應(yīng)滿足如下要求:(1)工具變量應(yīng)與暴露高度相關(guān),P<5×10-8。(2)工具變量與結(jié)局不直接相關(guān),僅通過暴露影響結(jié)局,即不存在基因多效性。此次研究以MREgger檢驗的截距不為0(即P<0.05)表明不存在基因多效性。從肢端肥大癥的全基因組關(guān)聯(lián)分析(GWAS)匯總數(shù)據(jù)中篩選出有意義的SNP(P<5×10-8),設(shè)定連鎖不平衡系數(shù)r2<0.001,連鎖不平衡區(qū)域?qū)挾葹?0 000 kb,從而保證各個SNP相互獨立。從結(jié)腸癌的GWAS數(shù)據(jù)中提取出按照上述標(biāo)準(zhǔn)篩選出的與肢端肥大癥相關(guān)的SNP。匯總上述兩個數(shù)據(jù)集的信息,剔除暴露因素中與結(jié)腸癌直接相關(guān)的SNP(P<5×10-8)[10]。最后計算所納入SNP的F統(tǒng)計量來評估工具變量的強度[13],F(xiàn)統(tǒng)計量<10表明可能為弱工具變量。計算公式如下:
公式1中: N:GWAS研究的樣本數(shù);K:工具變量的個數(shù);R2:工具變量解釋暴露的程度。公式2中: MAF:最小等位基因頻率;β:SNP對暴露的效應(yīng)量;SD:標(biāo)準(zhǔn)差。公式3中:SE:式2中β的標(biāo)準(zhǔn)誤;N:GWAS研究的樣本數(shù)。
本研究采用R4.2.1進行統(tǒng)計分析,軟件包TwoSampleMR可在GitHub網(wǎng)站上下載。根據(jù)孟德爾隨機化分析的要求,遺傳變異作為工具變量時需要滿足以下三個假設(shè);(1)關(guān)聯(lián)性假設(shè):工具變量與暴露因素(肢端肥大癥)應(yīng)顯著相關(guān);(2)獨立性假設(shè):工具變量應(yīng)與混雜因素?zé)o關(guān);(3)排他性假設(shè):工具變量只能通過暴露因素去影響結(jié)局變量,而不能通過其他途徑。
本研究采用逆方差加權(quán)法(IVW),MR-Egger法,加權(quán)中位數(shù)法(Weight Median)進行統(tǒng)計分析,IVW是一種加權(quán)線性回歸模型,在多種工具變量的MR研究中使用,其首先計算出每個SNP的因果效應(yīng)估計值,隨后利用Meta分析的隨機效應(yīng)模型結(jié)合每個工具變量的因果效應(yīng)估計值,在此基礎(chǔ)上獲得一個總因果效應(yīng)估計值[14]。MR-Egger回歸多用于Meta分析研究,以檢查發(fā)表偏倚、檢測基因多效性,其截距是定向多重性的指標(biāo)[15]。Weight Median是采用加權(quán)中位數(shù)方法來補充MREgger回歸,與MR-Egger回歸相比,加權(quán)中位數(shù)的顯著優(yōu)勢在于即使在50%的SNPs都具有多效性的情況下,仍然可以得出比較準(zhǔn)確的因果估計[16]。在進行孟德爾隨機化研究之前,需要對基因遺傳變異進行多效性評估,本研究采用MR-Egger回歸的方法對工具變量進行基因多效性檢驗,P>0.05為差異無統(tǒng)計學(xué)意義。即工具變量不存在基因多效性的影響。另外,進行孟德爾隨機化后因采用“l(fā)eave-one-out”法進行敏感性分析,用以評價非特異SNP對因果估計結(jié)果的影響大小。
根據(jù)全基因組關(guān)聯(lián)研究中的檢驗水準(zhǔn),以P<5×10-8為標(biāo)準(zhǔn)篩選SNP,經(jīng)篩選,在本研究中所應(yīng)用肢端肥大癥GWAS數(shù)據(jù)中未篩選出可用的SNP,因此調(diào)整P值為1×10-5再次篩選[17],篩選出65個SNP,設(shè)定連鎖不平衡系數(shù)r2為0.001,連鎖不平衡區(qū)域?qū)挾葹?0 000 kb,最終得到6個SNP作為工具變量,見表2。
表2 工具變量在肢端肥大癥遺傳信息中的詳細(xì)信息Table 2 Detailed data of tool variables in genetic information of acromegaly
隨后,找到初步篩選的6個工具變量在兩個數(shù)據(jù)庫結(jié)腸癌遺傳數(shù)據(jù)中對應(yīng)的信息。在UK Biobank數(shù)據(jù)庫結(jié)腸癌遺傳數(shù)據(jù)中有5個工具變量,5個工具變量在結(jié)腸癌GWAS數(shù)據(jù)中均滿足P>1×10-5,見表3。
表3 工具變量在結(jié)腸癌遺傳信息中的詳細(xì)信息Table 3 Details of tool variables in genetic information of colon cancer
對以上數(shù)據(jù)進行整合,結(jié)腸癌遺傳數(shù)據(jù)在整合過程中剔除了一個具有中間等位基因頻率的回文SNP,為rs115617279。整合后見表4??梢娮罱K所篩選得到的4個工具變量滿足兩樣本孟德爾隨機化分析的第一假設(shè)和第二假設(shè):工具變量必須與肢端肥大癥相關(guān)聯(lián),工具變量只通過肢端肥大癥對結(jié)腸癌風(fēng)險產(chǎn)生效應(yīng)。根據(jù)前述公式計算最終獲得的工具變量的F統(tǒng)計量,rs3850694的F值為261.32,rs139960030的F值為20.66,rs79171224的F值為6.99,rs141687430的F值為92.44。
表4 肢端肥大癥與結(jié)腸癌的合并數(shù)據(jù)Table 4 Combined data of acromegaly and colon cancer
本研究采用MR-Egger回歸的方法對工具變量進行基因多效性檢驗。分析結(jié)果顯示:截距=0.0005(P=0.42)。兩組數(shù)據(jù)均無統(tǒng)計學(xué)意義,說明本研究篩選出的工具變量未受到基因多效性的過大影響。
在兩樣本孟德爾隨機化的研究過程中,為了保證研究結(jié)果的準(zhǔn)確性,本研究采用了IVW、MR-Egger、MR-Weighted-Median三種分析方法對肢端肥大癥和結(jié)腸癌風(fēng)險的因果效應(yīng)進行評估,對比分析結(jié)果如下,IVW法:OR=1.00,95%CI=0.999~1.001,P=0.42;MR-Egger法:OR=1.00, 95%CI=0.99~1.001,P=0.42;Weighted-Median法:OR=1.00, 95%CI=1.00~1.001,P=0.03。三種分析方法的研究結(jié)果一致,表明肢端肥大癥不是結(jié)腸癌的獨立危險因素,見表5、圖1。
圖1 三種模型散點圖比較Figure 1 Comparison of scatter plots among three models
表5 三種分析方法的孟德爾隨機化分析結(jié)果Table 5 Results of Mendelian randomized analysis of the three methods
由于數(shù)據(jù)來源于不同的GWAS隊列研究,工具變量之間可能存在異質(zhì)性,本研究采用IVW模型和MR-Egger模型估算異質(zhì)性,研究結(jié)果表明MREgger:Q=3.30,P=0.19, IVW:Q=3.41,P=0.33。兩個不同數(shù)據(jù)庫的結(jié)腸癌GWAS采用不同方法的異質(zhì)性檢驗結(jié)果均顯示P>0.05,表明篩選出的工具變量之間不存在異質(zhì)性。
本研究采用逐一剔除工具變量SNP的方法對研究結(jié)果進行敏感度分析。研究結(jié)果見圖2,可見所有工具變量SNP的置信區(qū)間基本均在原點右側(cè)(其中rs3850694、rs79171224的置信區(qū)間經(jīng)過原點),說明本孟德爾隨機化研究的結(jié)果比較穩(wěn)健。
圖2 “留一法”敏感性分析Figure 2 Sensitivity analysis of “l(fā)eave-one-out”
既往研究顯示,結(jié)腸癌具有多種危險因素[18],而相關(guān)研究表明肢端肥大癥可能引起結(jié)腸癌的發(fā)病率升高[8],其最終納入了3項病例對照研究進行Meta分析,結(jié)果顯示,相對于對照組,肢端肥大癥患者的結(jié)腸癌發(fā)病率是對照組的4.35倍(OR=4.35(1.433~12.354)),該研究所納入的樣本量較少(肢端肥大癥組14/304,對照組8/627),雖然是無異質(zhì)性檢驗且無發(fā)表偏倚,但研究結(jié)果并不是決定性的。另外由于病例對照研究及Meta分析固有的缺陷[19-20],本研究結(jié)論也不一定是可靠的,此外本研究的前期研究也表明該研究質(zhì)量可信度極低[21],因此采用兩樣本孟德爾隨機化對肢端肥大癥與結(jié)腸癌發(fā)病的相關(guān)性進行研究。
Ochiai等研究發(fā)現(xiàn)肢端肥大癥患者結(jié)直腸息肉的發(fā)生率明顯增加,尤其在直腸乙狀結(jié)腸區(qū)域。然而,尚未發(fā)現(xiàn)肢端肥大癥患者比一般人群更容易患結(jié)直腸癌的病理學(xué)證據(jù)。肢端肥大癥由GH和IGF-I水平過高的不適當(dāng)分泌所引起,導(dǎo)致許多全身并發(fā)癥,包括心血管、呼吸和代謝疾病,以及一些腫瘤的潛在風(fēng)險增加。盡管關(guān)于肢端肥大癥和癌癥的研究結(jié)果存在不確定性,但大多數(shù)數(shù)據(jù)表明結(jié)直腸癌在研究人群中發(fā)病率增加。GH-IGF-I軸在結(jié)直腸癌中的確切作用機制尚未完全解釋清楚,但它與GH和IGF-I對結(jié)腸的局部和循環(huán)作用有關(guān),促進血管生成、細(xì)胞增殖、突變風(fēng)險、抑制腫瘤抑制基因表達和凋亡,從而促進腫瘤微環(huán)境的形成[22]。
然而,基于人群的研究結(jié)果對于CRC的發(fā)病率和死亡率存在爭議。孟德爾隨機化分析的有效性依賴于所研究人群的代表性和多樣性。遺傳數(shù)據(jù)的人群來源于歐洲以及結(jié)果的普適性問題,是重要的考慮因素。如果遺傳數(shù)據(jù)僅限于歐洲人,那么該研究的結(jié)果可能在其他人群中的適用性有限。對于肢端肥大癥與結(jié)腸癌的因果關(guān)系,未來的研究可以考慮拓展研究樣本,包括不同人種和地理區(qū)域的人群,以更好地了解這種關(guān)系的普適性。
盡管在肢端肥大癥中進行結(jié)腸鏡篩查和監(jiān)測是所有國際指南和專家共識的共識,但關(guān)于最佳篩查時機尚無一致意見。綜合現(xiàn)有數(shù)據(jù),包括病理生理學(xué)、流行病學(xué)研究及其局限性、結(jié)腸息肉特征、總體癌癥和結(jié)直腸癌發(fā)病率和死亡率、結(jié)腸癌病理生理學(xué)的風(fēng)險因素和指南建議,可以得出結(jié)論認(rèn)為肢端肥大癥和結(jié)直腸癌的發(fā)病關(guān)系尚不明確[23-24]。為了全面評估這種關(guān)聯(lián),需要更大樣本量和跨地區(qū)、跨人種的研究。
孟德爾隨機化的一個基本假設(shè)是:遺傳變異不會通過其他生物途徑影響結(jié)局(即SNP不具有基因多效性)。本研究中對與肢端肥大癥相關(guān)的4個SNP進行多效性檢驗,以評估多效性對因果估計的影響,根據(jù)這些不同的測試發(fā)現(xiàn)本研究的結(jié)果是穩(wěn)健的。最終結(jié)論與之前的Meta分析及相關(guān)對照試驗研究結(jié)果不一致,主要考慮原因如下:(1)既往研究多采用小樣本的隊列研究和病例對照試驗,檢驗效能不強;(2)既往多采用觀察性研究來對暴露因素與結(jié)局的相關(guān)性進行研究,而觀察性研究無法完全控制或者消除潛在的混雜因素,這使得既往的研究結(jié)果未必可靠;(3)已發(fā)表的Meta分析和相關(guān)研究與本研究進行孟德爾隨機化分析的人群來源不同。
總之,采用孟德爾隨機化研究結(jié)果顯示,肢端肥大癥與結(jié)腸癌的發(fā)病并無相關(guān)性,與既往的隊列研究及Meta分析結(jié)論不一致,這就要求研究人員進行進一步的研究,以明確肢端肥大癥是否是結(jié)腸癌發(fā)病的危險因素。
利益沖突聲明:
所有作者均聲明不存在利益沖突。