• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于R語言ARIMA模型在慢阻肺急性加重患者發(fā)病預測中的應用

      2017-06-05 14:20:14成都市第三人民醫(yī)院信息部610031
      中國衛(wèi)生統(tǒng)計 2017年2期
      關鍵詞:原始數(shù)據(jù)入院檢驗

      成都市第三人民醫(yī)院信息部(610031)

      郭慧敏 杜 軍△ 黃路非

      基于R語言ARIMA模型在慢阻肺急性加重患者發(fā)病預測中的應用

      成都市第三人民醫(yī)院信息部(610031)

      郭慧敏 杜 軍△黃路非

      目的 建立慢阻肺急性加重入院人次的自回歸積分滑動平均模型(ARIMA),科學預測慢阻肺急性加重入院人次,為該病的診治以及合理利用醫(yī)療資源提供理論依據(jù)。方法 使用R語言(v.3.2.3)做模型的識別、模型的參數(shù)估計與檢驗,建立ARIMA模型,對某院2013-2015年慢阻肺急性加重出院人次進行模型擬合,用2016年1~3月的預測值與實際值作比較,檢驗模型的預測能力,并且預測2016年4-6月慢阻肺急性加重入院人次。結果 經過多次檢驗,確定ARIMA(2,2,1)(1,1,1)12模型預測能力最佳,其殘差序列是白噪聲。用2016年1~3月數(shù)據(jù)來檢驗模型,其MAPE的絕對值均小于10%,說明模型的擬合優(yōu)度相對較好,預測能力可靠,根據(jù)該模型預測2016年4~6月該院慢阻肺急性加重入院人次分別為162、160、159。結論 ARIMA模型能夠很好的擬合慢阻肺急性加重的入院人次并進行短期預測,模型顯示2016年該院的急性支氣管炎的入院人次將有所上升,為醫(yī)院合理利用醫(yī)療資源提供了有力依據(jù)。

      R語言 慢阻肺急性加重 預測 回歸滑動平均混合模型

      慢性阻塞性肺疾病(簡稱慢阻肺)是一種逐漸削弱患者呼吸功能的破壞性慢性肺部疾病,被稱為呼吸道疾病中最“不動聲色”的隱形殺手?;颊咴谌粘!胺€(wěn)定期”時疾病特征不明顯,卻在“急性加重期”時癥狀驟然出現(xiàn)或原有癥狀急劇惡化[1],對患者的生活質量產生巨大影響, 加速肺功能惡化, 也是患者住院和死亡的主要原因。根據(jù)世界衛(wèi)生組織估計,到2020年,慢阻肺將成為全球第三大死亡原因,預防慢阻肺急性加重的重要性正日益得到關注,最新版慢阻肺全球創(chuàng)議(GOLD指南)首次強調了慢阻肺急性加重風險和癥狀的評估[2]。本文建立某院慢阻肺急性加重的自回歸積分滑動平均模型(autoregressive integrated moving average model,簡稱ARIMA),探討慢阻肺急性加重入院人次的變化規(guī)律。

      R語言是一種為統(tǒng)計計算和繪圖而生的語言和環(huán)境,它是一套開源的數(shù)據(jù)分析解決方案,由一個龐大且活躍的全球性研究型社區(qū)維護[3],針對不同的場景和統(tǒng)計功能R語言的用戶貢獻了大量優(yōu)秀的包(package)。本文采用R語言作為統(tǒng)計分析的工具。

      資料與方法

      1.資料來源

      從某院病案首頁信息管理系統(tǒng)中檢索2013-2015年出院第一診斷為慢阻肺急性加重(ICD-10編碼為J44.1)的病人為研究對象[4],以每月的入院人次構成時間序列。

      2.原始數(shù)據(jù)獲取

      R語言通過RODBC包連接數(shù)據(jù)庫[5],并且提取2013-2015年的研究數(shù)據(jù),建立時間序列(stats包中的st函數(shù)),以月為單位繪制原始數(shù)據(jù)的時間序列圖(圖1)。

      圖1 某院慢阻肺急性加重患者住院人次時間序列

      3.ARIMA模型建立

      ARIMA模型主要步驟[6]為:(1)序列平穩(wěn)化:據(jù)圖1,采用季節(jié)性ARIMA(p,d,q)(P,D,Q)12模型,對原始數(shù)據(jù)進行差分并檢驗序列平穩(wěn)性,可以確定d、D;(2)模型識別:對處理后的序列做自相關和偏相關處理,發(fā)現(xiàn)低階的自相關系數(shù)較大,但隨著時滯長度的增加而衰減,可認為處理后的序列符合運用ARIMA模型的條件,并且確定p值和q值;(3)模型參數(shù)估計與檢驗:通過Ljung-Box檢驗等方法檢測模型殘差,判斷模型的適合性;(4)預測:利用該院2016年1~3月的慢阻肺急性加重的實際入院人次,檢驗建立模型的預測效果,并預測2016年4~6月慢阻肺急性加重的入院人次,產生可信區(qū)間。

      4.編程與實現(xiàn)

      用R語言(v.3.2.3)作為統(tǒng)計分析的工具,用RODBC中的函數(shù)提取原始數(shù)據(jù),采用stats包中的函數(shù)對原始數(shù)據(jù)進行時間序列處理,用funitRoot包中的函數(shù)進行單位根檢驗,用forecast包中的函數(shù)進行預測。

      結 果

      1.序列平穩(wěn)化

      對原始數(shù)據(jù)進行一階差分和二階差分(timeSeries包中的diff函數(shù)),經單位根檢驗(fUnitRoot包中的unitrootTest函數(shù))一階差分為非穩(wěn)態(tài)序列,二階差分為穩(wěn)態(tài)序列(P<0.05),同時白噪聲檢驗說明序列不是純隨機性檢驗,序列具有值得我們提取的相關信息。由此得到d=2。

      2.模型識別

      對二階差分處理后的數(shù)據(jù)進行自相關和偏相關(stats包中的acf函數(shù)和pacf函數(shù))處理,得到ACF圖(圖2)和PACF圖(圖3)。觀察圖2得,二階自相關系數(shù)后都未超出±2倍估計標準差,即自相關系數(shù)1階以后截尾,初步確定q=1;觀察圖3得,三階偏相關系數(shù)后都未超過±2倍估計標準差,即偏相關系數(shù)2階以后截尾,初步確定p=2。

      圖2 自相關系數(shù)圖

      圖3 偏相關系數(shù)

      3.模型的參數(shù)估計與檢測

      由以上兩步我們大致可以確定p、d、q的大致范圍,在p、d、q確定的范圍,對模型反復調試和檢驗(stats包中的arima函數(shù)),季節(jié)模型的參數(shù)采取0、1、2從低階到高階逐個嘗試的辦法,根據(jù)模型參數(shù)檢驗結果和參數(shù)間的相關系數(shù)對模型反復調試和檢驗,以赤池信息準則(Akaike Information Criterion,AIC準則)和決定系數(shù)R2作為依據(jù)確定最優(yōu)模型(表1)。

      根據(jù)比較發(fā)現(xiàn)模型ARIMA(2,2,1)(1,1,1)12的AIC=335.78最小并且R2=85.23最大,則我們可以確定模型ARIMA(2,2,1)(1,1,1)12擬合較好,對殘差序列做自相關圖(圖4);圖4表明一階殘差序列的自相關系數(shù)截尾,據(jù)此認為殘差序列是白噪聲。同時做Ljung-Box檢驗(stats包中的Box.test函數(shù)),其統(tǒng)計量無統(tǒng)計學意義(P>0.05)。

      表1 備選ARIMA模型擬合優(yōu)度統(tǒng)計量

      圖4 殘差序列的自相關系數(shù)圖

      4.預測

      利用ARIMA(2,2,1)(1,1,1)12模型對該院慢阻肺急性加重入院人次以及95%可信區(qū)間進行檢驗(forecast包中的forecast.Arima函數(shù)),結果見表2;由表2得,預測值均在95%可信區(qū)間,而且其平均絕對百分誤差(MAPE)也非常小,預測模型精度高。據(jù)此模型外推,可以預測2016年4~6月慢阻肺急性加重入院人次分別為162、160、159,結果見圖5。

      表2 2016年1~3月慢阻肺急性加重入院人次預測值與實際值

      圖5 慢阻肺急性加重入院人次擬合曲線

      討 論

      ARIMA模型是由Box和Jenkins(1970)提出的一種時間序列的建模方法,其預測精確度較高,且不需要知道影響預測變量的相關因素,可將各種因素包括未知因素的綜合效應統(tǒng)一蘊含在時間變量中, ARIMA模型在醫(yī)療衛(wèi)生領域有廣闊的應用前景[7]。

      本文通過對某院的2013-2015年慢阻肺急性加重入院人次建立ARIMA模型,序列經過平穩(wěn)化、模型識別、參數(shù)估計及檢測等步驟發(fā)現(xiàn)ARIMA(2,2,1)(1,1,1)12模型可以有效的擬合每月的入院人次,并且做短期預測;通過對模型的檢驗,其月份的誤差率較低,有一定的實用價值。通過預測可知,2016年4~6月該院的慢阻肺急性加重的入院人次為分別為162、160、159,而且95%可信區(qū)間均包含每月的預測值,同時我們對比歷史數(shù)據(jù)發(fā)現(xiàn),該病種的入院人次呈逐年上升的趨勢,在配置急性支氣管炎的醫(yī)療資源時我們應該參考該預測值,優(yōu)化資源分布,合理利用有限的醫(yī)療資源。

      數(shù)據(jù)顯示,慢阻肺急性加重患者每年都有所增長,筆者認為由于我國經濟不斷發(fā)展,人們的生活環(huán)境污染加劇,該醫(yī)院所處城市空氣質量日漸惡化,呼吸系統(tǒng)疾病的發(fā)病率逐年上升,人們應積極的鍛煉身體,養(yǎng)成良好的生活習慣,戒除香煙或自覺躲避二手煙、霧霾天等污染源,定期做針對性的醫(yī)療檢查,是積極面對這種高發(fā)病率疾病的有效措施。政府應當對環(huán)境治理加大力度,提高國民身體素質。

      [1]Faustini A,Stafoggia M,Colais P,et al.EpiAir Collaborative Group.Air pollution and multiple acute respiratory outcomes.Eur Respir J,2013,42(2):304-313.

      [2]陳亞紅,王辰.2015 年更新版GOLD 慢性阻塞性肺疾病診斷、治療和預防的全球策略簡介.《中國醫(yī)學前沿雜志(電子版)》,2015,7(2):34-39.

      [3]Robert I.Kabacoff著,高濤,肖楠,陳鋼譯.R語言實戰(zhàn).北京:人民郵電出版社,2013:4-5.

      [4]董景五.疾病和有關健康問題的國際統(tǒng)計分類,第1版.人民衛(wèi)生出版社,2008.

      [5]孫振球,徐勇勇.醫(yī)學統(tǒng)計學,第2版.北京:人民衛(wèi)生出版社,2002:351-371.

      [6]郭慧敏,杜軍,練正秋.ARIMA模型應用于臨床懸浮紅細胞用量預測的探討.中國輸血雜志,2014,8(30):829-832.

      [7]熊志斌.基于ARIMA與神經網絡集成的GDP時間序列預測研究.數(shù)理統(tǒng)計與管理,2011,30(2):306-314.

      (責任編輯:劉 壯)

      △通信作者:杜軍,E-mail:yixi_370785@163.com

      猜你喜歡
      原始數(shù)據(jù)入院檢驗
      序貫Lq似然比型檢驗
      GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
      住院醫(yī)師入院教育實踐與效果探索
      受特定變化趨勢限制的傳感器數(shù)據(jù)處理方法研究
      2021年《理化檢驗-化學分冊》征訂啟事
      對起重機“制動下滑量”相關檢驗要求的探討
      全新Mentor DRS360 平臺借助集中式原始數(shù)據(jù)融合及直接實時傳感技術實現(xiàn)5 級自動駕駛
      汽車零部件(2017年4期)2017-07-12 17:05:53
      關于鍋爐檢驗的探討
      作文門診室
      作文門診室
      安岳县| 清镇市| 西城区| 得荣县| 彰化县| 嘉义市| 当阳市| 双峰县| 克拉玛依市| 商水县| 任丘市| 云林县| 老河口市| 于都县| 洪泽县| 嘉定区| 东乌珠穆沁旗| 裕民县| 多伦县| 汝阳县| 邯郸市| 五台县| 筠连县| 阿尔山市| 莒南县| 土默特左旗| 五常市| 天全县| 孝义市| 襄城县| 基隆市| 库伦旗| 安陆市| SHOW| 原平市| 宣城市| 建始县| 临沧市| 佳木斯市| 从江县| 彰武县|