• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于列線圖的腫瘤風(fēng)險(xiǎn)預(yù)測及其效果評價(jià)*

    2019-05-09 08:24:16李偉棟楊麗鄒興文代伯峰王平張晉昕
    腫瘤預(yù)防與治療 2019年4期
    關(guān)鍵詞:線圖一致性概率

    李偉棟,楊麗,鄒興文,代伯峰,王平,張晉昕

    腫瘤防控已成為世界各國政府的衛(wèi)生戰(zhàn)略重點(diǎn)。在醫(yī)學(xué)研究領(lǐng)域中,腫瘤風(fēng)險(xiǎn)預(yù)測模型被用來預(yù)測某種腫瘤未來的發(fā)病情況。具體來說就是以腫瘤的多病因?yàn)榛A(chǔ),建立使多危險(xiǎn)因素和腫瘤的發(fā)生或預(yù)后確定為一種定量關(guān)系統(tǒng)計(jì)模型。“腫瘤風(fēng)險(xiǎn)預(yù)測模型”用途包括:告知患者發(fā)病或預(yù)后風(fēng)險(xiǎn),篩選高危人群,幫助醫(yī)生臨床決策[1-2]。預(yù)測模型的創(chuàng)建需要考慮足夠的樣本量、較好的數(shù)據(jù)質(zhì)量,并要求模型簡單并有較好的預(yù)測準(zhǔn)確性和區(qū)分度,常見的模型包括Logistic回歸模型、Cox比例風(fēng)險(xiǎn)模型,這些模型在臨床應(yīng)用也較為廣泛[3-4]。

    列線圖(Nomogram)是基于回歸模型對個(gè)體的(陽性)結(jié)局發(fā)生概率進(jìn)行直觀呈現(xiàn)。其基本原理是根據(jù)預(yù)測模型中自變量回歸系數(shù)的大小來制定評分標(biāo)準(zhǔn),給預(yù)測因素的每種取值水平一個(gè)評分,再計(jì)算個(gè)體的總得分,最后通過總得分與結(jié)局概率之間的轉(zhuǎn)換函數(shù)來計(jì)算個(gè)體結(jié)局事件發(fā)生概率[5-6]。目前在臨床發(fā)病及預(yù)后預(yù)測應(yīng)用尤其是腫瘤領(lǐng)域較為廣泛[7-8]。

    列線圖應(yīng)用之前需要對預(yù)測模型的效果進(jìn)行驗(yàn)證,主要評價(jià)模型的區(qū)分度(Discrimination)和一致性(Accuracy)。區(qū)分度(Discrimination)的常用衡量指標(biāo):ROC曲線下面積(area under curve,AUC)和C統(tǒng)計(jì)量(C-index),一致性(Accuracy)可以通過Calibration plot的形式直觀展示腫瘤預(yù)測概率值與實(shí)際概率值的關(guān)系[9-10]。

    本文以乳腺癌患者生存預(yù)測模型為例,介紹R軟件包survival、rms擬合Cox回歸模型的計(jì)算實(shí)現(xiàn),繪制列線圖并評價(jià)預(yù)測效果。

    1 資料與方法

    1.1 資料來源

    乳腺癌生存數(shù)據(jù)來自于SPSS軟件自帶案例數(shù)據(jù)[11],在生存分析和Cox模型的教學(xué)中被應(yīng)用廣泛,數(shù)據(jù)文件含1 207例乳腺癌患者的生存狀態(tài)、生存時(shí)間及相關(guān)影響因素信息,數(shù)據(jù)變量列表見表1。

    1.2 研究方法

    1.2.1 列線圖創(chuàng)建 列線圖基于案例乳腺癌預(yù)后Cox回歸預(yù)測模型。單因素篩選P<0.1的預(yù)測變量經(jīng)逐步法篩選進(jìn)入最終預(yù)測模型,基于預(yù)測模型的回歸系數(shù)借助R軟件的rms、 survival包繪制列線圖[12]。

    1.2.2 列線圖預(yù)測效果評價(jià) 采用bootstrap自抽樣方法用建模數(shù)據(jù)驗(yàn)證建模效果,自抽樣次數(shù)=1000, 一致性指數(shù)(C-index)及95%CI評價(jià)預(yù)測區(qū)分度,其值為0~1,值越接近1,模型對患者區(qū)分性越好;Calibration plot的評估3年、5年、10年列線圖腫瘤預(yù)測概率值與實(shí)際概率值的一致性,散點(diǎn)落在圖形45°對角參考線提示預(yù)測一致性較好。

    表1 乳腺癌生存數(shù)據(jù)變量信息介紹匯總表

    Table 1. Breast Cancer Survival Data Variable Information

    VariableLabelAssignment descriptionStatusSurvival outcome0=“survival”,1=“dead”TimeSurvival time(month)-AgeAge group1=“age<35”2=“35≤age<45”3=“45≤age<55”4=“55≤age<65”5=“65≤age<75”6=“75≤age<90”ErEstrogen receptor status0=“-”,1=“+”PrProgesterone receptor status0=“-”,1=“+”Ln_yesnoLymph node metastasis0=“No”,1=“Yes”PathscatPathology tumor size(grade)1=“<2”2=“2≤pathscat≤5”3=“5

    2 結(jié) 果

    2.1 Cox比例風(fēng)險(xiǎn)預(yù)測模型分析結(jié)果

    1 207例乳腺癌患者經(jīng)10年隨訪后,死亡72例,Cox單因素回歸分析顯示,年齡、雌激素受體狀態(tài)、孕酮受體狀態(tài)、淋巴結(jié)轉(zhuǎn)移、病理學(xué)腫瘤大小為影響患者生存時(shí)間的可能危險(xiǎn)因素,采用前進(jìn)法多因素回歸分析顯示:最終的影響因素為年齡、孕酮受體狀態(tài)、淋巴結(jié)轉(zhuǎn)移、病理學(xué)腫瘤大小,具體結(jié)果見表2。

    表2 1 207例乳腺癌患者預(yù)后危險(xiǎn)因素的Cox回歸分析

    Table 2. Cox Regression Analysis of Prognostic Risk Factors in 1 207 Breast Cancer Patients

    VariableNPercent(%)Univariate analysisMultivariate analysisHR(95%CI)PHR(95%CI)PStatus Dead72 5.97 Survival1135 94.03 Age group(years)0.78(0.65~0.93)0.01 0.73(0.58~0.92)0.007 <3548 3.98 35~20516.98 45~30725.43 55~27923.12 65~25220.88 75~901169.61

    (Table 2 continues on next page)

    (continued from previous page)

    VariableNPercent(%)Univariate analysisMultivariate analysisHR(95%CI)PHR(95%CI)PEstrogen receptor status0.021 0.150 0338 28.00 1.00 1531 44.00 0.52(0.30~0.91) Unknown338 28.00 Progesterone receptor status0.026 0.090 0389 32.23 1.00 1462 38.28 0.53(0.30~0.93) Unknown356 29.49 Lymph node metastasis 0929 77.00 1.00<0.0011.00<0.001 1278 23.00 2.52(1.58~4.02)2.29(1.29~4.05)Pathology tumor size(cm)? <2826 68.40 1.00<0.001 2~5283 23.40 3.52(2.15~5.74)<0.0012.03(1.14~3.62)<0.001 >5121.006.85(1.63~28.75)0.009 3.91(0.90~16.96)0.009 Histological grade 1796.551.00 2514 42.58 2.05(0.49~8.62)0.328 3327 27.09 3.90(0.93~16.40)0.063 4287 23.78 2.13(0.49~9.28)0.312

    *In total, 86 cases (7.1%) of pathological tumor size were missing.

    2.2 Cox比例風(fēng)險(xiǎn)預(yù)測模型預(yù)測因素賦分、列線圖創(chuàng)建及圖使用指引

    2.2.1 Cox比例風(fēng)險(xiǎn)預(yù)測模型預(yù)測因素賦分 基于多因素Cox回歸預(yù)測模型入選變量(年齡、孕酮受體狀態(tài)、淋巴結(jié)轉(zhuǎn)移、病理學(xué)腫瘤大小)自變量回歸系數(shù)做轉(zhuǎn)化后確定預(yù)測因素賦分值,其計(jì)算公式為:預(yù)測因素賦分值=(預(yù)測因素回歸系數(shù)/預(yù)測因素中回歸系數(shù)最大值×100)[5],賦分值可以直接通過軟件計(jì)算,具體結(jié)果見表3。

    表3 預(yù)測因素賦分表

    Table 3. Score of Predictive Factor

    Predictive factorScoreAge group(years) <3510 35~8 45~6 55~4 65~2 75~900 Progesterone receptor status 04 10 Lymph node metastasis 00 16 Pathology tumor size(cm) <20 2~55 >59

    2.2.2 列線圖創(chuàng)建 繪制列線圖-每個(gè)因素刻度尺、刻度尺所對應(yīng)的得分、總得分及3年、5年、10年生存概率,見圖1。

    2.2.3 列線圖使用指引 按患者預(yù)測因素屬性在列線圖中畫上豎線計(jì)算各因素對應(yīng)的得分,將各因素的得分累計(jì)相加得到總得分,總得分畫下豎線與3年、5年、10年生存概率線相交得到該患者的對應(yīng)預(yù)測概率。

    例如,有1例乳腺癌患者變量取值分別為“年齡“45~55歲”、孕酮受體狀態(tài)“陰性”、淋巴結(jié)轉(zhuǎn)移狀態(tài)“轉(zhuǎn)移”、腫瘤大小等級“2~5cm”,在列線圖對應(yīng)的Points分別為6分、4分、6分、5分,總得分(Total Points)=6分+4分+6分+5分=21分,按圖1可預(yù)測該患者的3年生存概率約為0.88、5年生存概率約為0.67、10年生存概率約為0.60。

    2.3 列線圖預(yù)測效果驗(yàn)證

    2.3.1 一致性指數(shù)(C-index) 預(yù)測模型一致性指數(shù):0.71(0.62~0.80),腫瘤患者預(yù)后模型有較好的預(yù)測精度。

    2.3.2 校準(zhǔn)曲線(calibration plots) 校準(zhǔn)曲線原理為:利用列線圖計(jì)算出研究對象的生存概率,將人群按生存概率均分為3組,分別計(jì)算每組研究對象預(yù)測生存概率和相應(yīng)的實(shí)際生存概率的均值,并將兩者結(jié)合起來作圖得到3個(gè)校準(zhǔn)點(diǎn),校準(zhǔn)點(diǎn)連接起來得到預(yù)測校準(zhǔn)曲線,如果預(yù)測校準(zhǔn)曲線越貼近45°對角線,則說明列線圖的預(yù)測能力越好。

    圖1 1 207例乳腺癌患者Cox比例風(fēng)險(xiǎn)預(yù)測模型列線圖

    Figure 1. 1 207 Cases of Breast Cancer Patients

    圖2是3年、5年、10年列線圖校準(zhǔn)曲線,由校準(zhǔn)曲線可知3年、5年、10年的預(yù)測生存概率與實(shí)際生存概率連線、置信區(qū)間與45°對角線有交叉,預(yù)測與實(shí)際關(guān)系基本一致。其中5年預(yù)測風(fēng)險(xiǎn)值與實(shí)際風(fēng)險(xiǎn)值的關(guān)系最一致,散點(diǎn)基本落在45°對角線上,預(yù)測生存率<0.95時(shí),效應(yīng)關(guān)系最佳。同時(shí)部分預(yù)測概率置信區(qū)間很寬,提示尚需增大樣本量進(jìn)行進(jìn)一步的考核。

    圖2 3年、5年、10年列線圖校準(zhǔn)曲線

    Figure 2. Calibration Plot of 3-, 5-, and 10-year Nomogram

    3 討 論

    癌癥是嚴(yán)重威脅人類健康的重大慢性病,是21世紀(jì)中國乃至全球最嚴(yán)重的公共衛(wèi)生問題之一[13]。在醫(yī)學(xué)領(lǐng)域,相比于風(fēng)險(xiǎn)預(yù)測模型復(fù)雜的公式,列線圖優(yōu)勢在于可通過直觀圖形的形式提供更好的個(gè)體化發(fā)病預(yù)后風(fēng)險(xiǎn)評估,在臨床實(shí)踐中有確切的價(jià)值,可為個(gè)體化臨床決策提供參考依據(jù)[14],目前作為腫瘤患者預(yù)測預(yù)后的工具已經(jīng)被廣泛應(yīng)用,比傳統(tǒng)的腫瘤分期更為準(zhǔn)確[15-16]。

    本文以乳腺癌患者生存預(yù)測模型為例,介紹在R軟件繪制基于Cox回歸模型的列線圖并評價(jià)列線圖預(yù)測乳腺癌患者的預(yù)后效果。發(fā)病或預(yù)后列線圖能夠提供影響因素的具體分值,通過計(jì)算列線圖中的各個(gè)因素的分值相加推測結(jié)局概率,預(yù)測效果較公式模型方便、直觀,引用方便,能夠幫助預(yù)后差的患者提前獲得更好的治療方式[17]。

    國內(nèi)學(xué)者董英已介紹Cox模型及預(yù)測列線圖在R軟件中的實(shí)現(xiàn)[6],但其不足是僅介紹圖形繪制,無模型構(gòu)建指導(dǎo)原則、預(yù)測效果評價(jià)及使用注意事項(xiàng)等方面的內(nèi)容,而這些內(nèi)容是預(yù)測模型構(gòu)建和應(yīng)用必須考慮,只有當(dāng)模型的預(yù)測效果得到了明確驗(yàn)證之后,方可對模型制作列線圖,此時(shí)該列線圖才會(huì)有很好的應(yīng)用價(jià)值[12],本文從理論、軟件實(shí)現(xiàn)、結(jié)果解讀對這些內(nèi)容做了詳細(xì)介紹。模型構(gòu)建時(shí)需要考慮人群代表性、模型是否納入了足夠多的影響因素、目前的模型是否比其他應(yīng)用的模型更好、使用的建模統(tǒng)計(jì)方法是否合適;模型預(yù)測效果評價(jià)需提供一致性指數(shù)和校準(zhǔn)曲線評價(jià)模型區(qū)分度和一致性,C統(tǒng)計(jì)量(C-index)和的值為0~1,值越接近1,模型對患者區(qū)分性越好;如果預(yù)測校準(zhǔn)曲線越貼近45°對角線,則說明列線圖的預(yù)測能力越好。

    除了本文介紹的內(nèi)部驗(yàn)證,如果是新模型應(yīng)用效果評價(jià)有外部人群驗(yàn)證更好,即使用另外一組研究對象的數(shù)據(jù)(即外部數(shù)據(jù))去驗(yàn)證模型的預(yù)測準(zhǔn)確性,具體做法是根據(jù)建立的列線圖計(jì)算出驗(yàn)證集每個(gè)患者的總得分,然后將總分作為Cox模型的一個(gè)變量進(jìn)行生存分析,得到一致性指數(shù)和校準(zhǔn)曲線進(jìn)行預(yù)測效果評價(jià)驗(yàn)證。本研究納入預(yù)測因素和國內(nèi)外乳腺癌列線圖模型預(yù)后的預(yù)測變量基本一致,Mazouni等對305例未行輔助治療的淋巴結(jié)陰性乳腺癌患者進(jìn)行分析指出患者年齡、腫瘤大小、PR狀況(孕酮受體狀態(tài))以及PAI-1(纖溶酶原激活物抑制因子1)等可作為獨(dú)立預(yù)測因素[15]。

    本文以SPSS軟件breast cancer survival教學(xué)數(shù)據(jù)為例,主要介紹在R軟件實(shí)現(xiàn)生存概率風(fēng)險(xiǎn)列線圖繪制并評價(jià)預(yù)測效果,希望能夠?yàn)橄嚓P(guān)研究者提供方法學(xué)參考。文中示例程序分析僅對相關(guān)的函數(shù)調(diào)用及繪圖功能作簡要的說明,涉及更多的選項(xiàng)請參照R的幫助文檔。

    附:R分析代碼

    ## 案例數(shù)據(jù)導(dǎo)入

    bcs <-read.table("F:/DM/R/RAW/Breast cancer survival.csv", header=TRUE, sep=",")

    ## 讀取rms等相關(guān)程序包

    library(rms)

    library(survival)

    ##創(chuàng)建Cox比例風(fēng)險(xiǎn)預(yù)測模型

    model1<-cph(Surv(time,status)~agec+er+pr+pathscat+lnyesno+pathscat+histgrad, data=na.omit(bcs), x = T, y = T,surv=T,time.inc=12)

    stepmodel1<-step(model1)

    ##根據(jù)預(yù)測模型,繪制3年、5年、10年生存概率列線圖

    nom <-nomogram(stepmodel1, fun=list(function(x) surv(36, x), function(x) surv(60, x), function(x) surv(120, x)), lp=F, funlabel=c("3-year survival", "5-year survival", "10-year survival"), maxscale=10,fun.at=c(0.1,seq(0.1, 0.9, by=0.1), 0.9))

    plot(nom)

    ##calibration curve(校正曲線)評價(jià)模型預(yù)測準(zhǔn)確性-以3年為例

    f3<-cph(Surv(time,status)~agec+pr+pathscat+ln_yesno,data=na.omit(bcs),x=T,y=T,surv=T,time.inc=36)

    cal3 <-calibrate(stepf3, cmethod="KM", method="boot", u=36, m=300, B=1121)

    plot(cal3)

    作者聲明:本文第一作者對于研究和撰寫的論文出現(xiàn)的不端行為承擔(dān)相應(yīng)責(zé)任;

    利益沖突:本文全部作者均認(rèn)同文章無相關(guān)利益沖突;

    學(xué)術(shù)不端:本文在初審、返修及出版前均通過中國知網(wǎng)(CNKI)科技期刊學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)學(xué)術(shù)不端檢測;

    同行評議:經(jīng)同行專家雙盲外審,達(dá)到刊發(fā)要求。

    猜你喜歡
    線圖一致性概率
    內(nèi)涵豐富的“勾股六線圖”
    關(guān)注減污降碳協(xié)同的一致性和整體性
    公民與法治(2022年5期)2022-07-29 00:47:28
    第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
    第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
    注重教、學(xué)、評一致性 提高一輪復(fù)習(xí)效率
    概率與統(tǒng)計(jì)(一)
    概率與統(tǒng)計(jì)(二)
    IOl-master 700和Pentacam測量Kappa角一致性分析
    基于箱線圖的出廠水和管網(wǎng)水水質(zhì)分析
    東山頭遺址采集石器線圖
    五华县| 油尖旺区| 开化县| 镇原县| 鞍山市| 行唐县| 当涂县| 赤水市| 富裕县| 阿拉善右旗| 德钦县| 安陆市| 漳平市| 滕州市| 象州县| 黄浦区| 潜江市| 南华县| 化州市| 平和县| 濮阳县| 邮箱| 伊吾县| 淮阳县| 鲜城| 迁安市| 沧州市| 遂宁市| 伊宁县| 桓台县| 增城市| 满城县| 凭祥市| 南江县| 叶城县| 青海省| 枣强县| 靖边县| 陆河县| 伊吾县| 新平|