• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      復(fù)雜曲線回歸分析及其應(yīng)用

      2018-01-15 08:13:42谷恒明胡良平
      四川精神衛(wèi)生 2017年6期
      關(guān)鍵詞:曲線擬合回歸方程殘差

      谷恒明,胡良平,2*

      (1.軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計學(xué)咨詢中心,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu812@sina.com)

      復(fù)雜曲線回歸分析及其應(yīng)用

      谷恒明1,胡良平1,2*

      (1.軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計學(xué)咨詢中心,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu812@sina.com)

      本文目的是介紹曲線方程的兩種擬合方法(即直線化法與直接擬合法)之間的區(qū)別。通過對一個實例中散點圖為“S型曲線”的資料采用直線化法與直接擬合法擬合Logistic曲線回歸方程,對所得到的擬合結(jié)果進(jìn)行比較,發(fā)現(xiàn)基于粗估值再采用SAS中的NLIN過程直接擬合Logistic曲線回歸方程,可以得到更精確的擬合效果。

      非線性回歸分析;Logistic曲線回歸方程;迭代計算;相關(guān)指數(shù)

      *Correspondingauthor:HuLiangping,E-mail:lphu812@sina.com)

      1 概 述

      1.1 問題的提出

      本刊本期的前一篇文章《簡單曲線回歸分析及其應(yīng)用》介紹了用曲線直線化的方法實現(xiàn)幾個常用初等函數(shù)曲線的曲線回歸或曲線擬合的方法。然而,人們可能會提出下面兩個問題。問題一:曲線直線化方法與直接進(jìn)行曲線擬合的效果一樣嗎?問題二:是否所有的函數(shù)曲線都可以通過曲線直線化構(gòu)建曲線回歸方程?

      對第二個問題的回答也是否定的。其理由如下:事實上,能夠通過直線化來實現(xiàn)曲線擬合的曲線類型是很少的,絕大多數(shù)函數(shù)曲線是無法通過簡單直線化法來實現(xiàn)曲線擬合的。例如下面的兩個函數(shù)曲線就無法通過直線化法進(jìn)行曲線擬合。

      二項型指數(shù)函數(shù)是由兩個指數(shù)函數(shù)項相加而構(gòu)成的函數(shù)表達(dá)式。此函數(shù)表達(dá)式所描繪出的曲線稱為二項型指數(shù)曲線,見式(1)。

      y=A×eαt+B×e-βt

      (1)

      又例如:三項型指數(shù)函數(shù)是由三個指數(shù)函數(shù)項相加而構(gòu)成的函數(shù)表達(dá)式。此函數(shù)表達(dá)式所描繪出的曲線稱為三項型指數(shù)曲線。此曲線常用于研究三室模型藥物靜脈注射或二室模型藥物血管外給藥后血藥濃度與時間的關(guān)系,見式(2)。

      y=Ne-kx+Le-αx+Me-βx

      (2)

      1.2 解決方案

      SAS軟件提供了NLIN和NLMIXED過程,可用于非線性曲線的擬合。但在擬合時需要讀者給出未知參數(shù)的初始值。若初始值偏離真實值較遠(yuǎn),則可能擬合過程無法收斂或擬合曲線并非最優(yōu)。所以,較為合適的方法是通過曲線直線化求出參數(shù)的粗估值,然后將其作為初始值引入NLIN或NLMIXED過程進(jìn)行迭代計算,以尋找擬合效果更好的曲線回歸方程。然而,對于類似上面的式(1)和(2)那樣無法實施直線化的函數(shù)方程式,估計參數(shù)的粗估值可能就帶有很大的盲目性了。具體如何實現(xiàn),請參見相關(guān)參考文獻(xiàn)[1-2]。

      由于直接進(jìn)行曲線擬合問題難度較大,再考慮到文章篇幅有限,故本文僅介紹一個最常用的曲線擬合的實例。

      2 實例解析

      2.1 問題與數(shù)據(jù)

      【例1】某研究者欲分析某縣瘧疾發(fā)病的季節(jié)性特點,觀測了某縣1961年-1996年瘧疾的月累計發(fā)病率(1/10萬),結(jié)果見表1。試對該資料進(jìn)行曲線擬合。

      表1 某縣瘧疾月累計發(fā)病率

      2.2 如何用SAS實現(xiàn)計算

      【分析與解答】圖1散點圖顯示,資料的趨勢近似S型曲線,故可采用Logistic曲線方程擬合此資料。曲線上限為130,下限為0,上下漸近線之間的垂直間隔為130,SAS程序如下:

      %let ul=130; /*1*/

      dataabc; /*2*/

      do x=1 to 12;

      input y@@;

      z=log((&ul-y)/y);

      output;

      end;

      cards;

      0.555 1.295 2.751 11.116

      24.879 43.476 69.297 97.037

      114.631 121.645 124.412 125.619

      ;

      run;

      ods html;

      proc gplot; /*3*/

      plot y*x/haxis=0 to 12 vaxis=0 to &ul by 10;

      symbol value=dot;

      run;

      proc reg data=abc outest=est(keep=Intercept x);

      model z=x; /*4*/

      run;quit;

      data set1; /*5*/

      set est;

      call symput('a1',exp(Intercept));

      call symput('b1',x);

      run;

      proc nlin data=abc; /*6*/

      parms K=&ul a=&a1 b=&b1;

      model y=K/(1+a*exp(b*x));

      output out=set2 p=yp r=resid;

      run;

      proc sql; /*7*/

      create table set3 (sum num,css

      num);

      insert into set3 select

      1.人力資源配置優(yōu)化。成立區(qū)域檢修公司,通過統(tǒng)一調(diào)度檢修人員,可以解決區(qū)域公司內(nèi)部檢修人員工作量不均衡,同時解決單個企業(yè)檢修維護(hù)部組建人員和技術(shù)力量不足的問題。

      sum(resid**2),css(y) from set2;

      quit;

      data set4; /*8*/

      set set3;

      r2=1-sum/css;

      run;

      proc print data=set2 round; /*9*/

      run;

      proc print data=set4; /*10*/

      run;

      ods html close;

      【程序說明】程序中第1步是設(shè)立宏變量ul,表示曲線的上、下漸近線的垂直間距,其值為130,以便于后面調(diào)用。第2步是創(chuàng)建數(shù)據(jù)集,x表示月份,y表示瘧疾月累計發(fā)病率,z是對y進(jìn)行l(wèi)ogit變換所得的變量,以便后面進(jìn)行曲線直線化分析。第3步是繪制散點圖,以發(fā)現(xiàn)散點分布趨勢,本資料散點趨勢近似S型曲線。第4步對變量z和x進(jìn)行直線回歸分析,將所得直線的截距和斜率保存在數(shù)據(jù)集est中。第5步對數(shù)據(jù)集est進(jìn)行操作,將以自然對數(shù)為底、以截距為指數(shù)的數(shù)值賦給宏變量a1,將斜率賦給宏變量b1。當(dāng)然,也可直接將截距賦給宏變量a1,將斜率賦給宏變量b1,但第6步中model語句給出的曲線方程需改為“y=K/(1+exp(a+b*x))”。第6步是調(diào)用NLIN過程來擬合Logistic曲線,宏變量ul、a1、b1的值分別賦給變量K、a、b作為初值,并將所得曲線對各觀測擬合的預(yù)測值及殘差輸出到數(shù)據(jù)集set2中,預(yù)測值以變量yp表示,殘差以resid表示。第7步將數(shù)據(jù)集set2的內(nèi)容輸出到output窗口。第7步是調(diào)用sql過程,建立一個表set3,包括sum和css兩個變量,然后將數(shù)據(jù)集set2中所有觀測resid的平方和賦給set3中的sum變量,將set2中所有觀測y變量的離均差平方和賦給css。第8步是對數(shù)據(jù)集set3進(jìn)行操作,計算新的變量r2,即相關(guān)指數(shù)。第9步是將數(shù)據(jù)集set2的內(nèi)容輸出到output窗口,round選項用來指定數(shù)據(jù)最多保留兩位小數(shù)。第10步是將數(shù)據(jù)集set4的內(nèi)容輸出到output窗口。

      2.3 SAS輸出結(jié)果及其解釋

      【主要輸出結(jié)果及解釋】

      圖1 y隨x變化的散點圖

      圖1是SAS程序繪制的散點圖??梢钥闯觯Ⅻc近似S型曲線趨勢,上限為130,下限為0。

      AnalysisofVarianceDependentVariable:zSourceDFSumofSquaresMeanSquareFValuePr>FModel1102.44535102.44535658.11<.0001Error101.556660.15567CorrectedTotal11104.00201

      RootMSE0.39455R-Square0.9850DependentMean0.50213AdjR-Sq0.9835CoeffVar78.57356

      ParameterEstimatesVariableDFParameterEstimateStandardErrortValuePr>|t|Intercept16.003770.2428324.72<.0001x1-0.846400.03299-25.65 <.0001

      這是曲線直線化分析的結(jié)果,即變量z與x之間直線回歸分析的結(jié)果。截距為6.00377,斜率為-0.8464,它們與0之間的差異均有統(tǒng)計學(xué)意義,檢驗統(tǒng)計量t值分別為24.72、-25.65,P均<0.0001。直線回歸方程為z=6.00377-0.8464x,轉(zhuǎn)換成y與x的關(guān)系,即為:y=130/(1+e6.00377-0.8464x)。此時,殘差平方和為194.02219,相關(guān)指數(shù)R2=0.99740。

      The NLIN Procedure Dependent Variable y Method: Gauss-Newton

      NOTE: Convergence criterion met

      Note: An intercept was not specified for this model

      這是NLIN過程擬合曲線模型的有關(guān)信息。迭代方法為Gauss-Newton法,以K=130,a=405,b=-0.8464為初始值,迭代了5次,得到了收斂的結(jié)果。

      SourceDFSumofSquaresMeanSquareFValueApproxPr>FModel376037.425345.811770.1<.0001Error919.38072.1534UncorrectedTotal1276056.8

      ParameterEstimateApproxStdErrorApproximate95%ConfidenceLimitsK127.81.0737125.4130.2a394.665.1746247.1542.0b-0.88790.0263-0.9474-0.8284

      ApproximateCorrelationMatrixKabK1.0000000-0.50866920.6148707a-0.50866921.0000000-0.9798514b0.6148707-0.97985141.0000000

      這是NLIN過程擬合模型的結(jié)果。對模型的檢驗結(jié)果為F=11770.1,P<0.0001,說明所擬合的模型是有統(tǒng)計學(xué)意義的。模型的三個參數(shù)取值分別為:K=127.8,a=394.6,b=-0.8879。所以,本資料所擬合的Logistic曲線回歸方程為:

      Obsxyzypresid110.565.450.78-0.23221.304.601.88-0.59332.753.834.49-1.734411.122.3710.380.745524.881.4422.602.286643.480.6943.83-0.357769.30-0.1371.46-2.178897.04-1.0896.500.5399114.63-2.01112.761.871010121.65-2.68121.160.491111124.41-3.10124.99-0.581212140.62-3.36126.64-1.02

      Obssumcssr2119.380730827.910.99937

      這是曲線擬合效果的結(jié)果。首先給出了曲線回歸方程對各觀測的擬合結(jié)果,yp列為曲線對各觀測的預(yù)測值,resid為預(yù)測值與觀測值之間的殘差。然后給出了對擬合整體效果的評價情況,殘差平方和為19.3807,相關(guān)指數(shù)R2=0.99937。

      由此可知,在粗估值基礎(chǔ)上直接進(jìn)行Logistic曲線擬合,可獲得更好的擬合效果。

      [1] 胡良平, 高輝. 非線性回歸分析與SAS智能化實現(xiàn)[M].北京: 電子工業(yè)出版社, 2013: 68-119.

      [2] 胡良平. 科研設(shè)計與統(tǒng)計分析[M].北京: 軍事醫(yī)學(xué)科學(xué)出版社, 2012: 399-426.

      Complexcurveregressionanalysisanditsapplication

      GuHengming1,HuLiangping1,2*

      (1.ConsultingCenterofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,China;2.SpecialtyCommitteeofClinicalScientificResearchStatisticsofWorldFederationofChineseMedicineSocieties,Beijing100029,China

      The purpose of this paper is to introduce the difference between the two fitting methods (linearization and direct fitting) of curve equation. By fitting the Logistic curve regression equation with the linearized method and the direct fitting method for an example in which the scatter plot is "S-shaped curve". Compared the fitting results producing from the two methods mentioned above, it was found that the more accurate fitting result can be gotten by means of providing the crude estimators of the parameters in the regression equation and then directly fitting Logistic curve regression equation through the NLIN procedure in SAS/STAT.

      Nonlinear regression analysis; Logistic curve regression equation; Iteration calculation; Correlation index

      國家高技術(shù)研究發(fā)展計劃課題資助(2015AA020102)

      R195.1

      A

      10.11886/j.issn.1007-3256.2017.06.004

      2017-12-03)

      陳 霞)

      猜你喜歡
      曲線擬合回歸方程殘差
      基于雙向GRU與殘差擬合的車輛跟馳建模
      采用直線回歸方程預(yù)測桑癭蚊防治適期
      線性回歸方程的求解與應(yīng)用
      線性回歸方程要點導(dǎo)學(xué)
      基于殘差學(xué)習(xí)的自適應(yīng)無人機目標(biāo)跟蹤算法
      基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
      走進(jìn)回歸分析,讓回歸方程不再是你高考的絆腳石
      曲線擬合的方法
      價值工程(2017年31期)2018-01-17 00:34:27
      基于曲線擬合的投棄式剖面儀電感量算法
      電子測試(2017年12期)2017-12-18 06:35:46
      Matlab曲線擬合工具箱在地基沉降預(yù)測模型中的應(yīng)用
      禹州市| 鄱阳县| 景德镇市| 临泽县| 阿克陶县| 闵行区| 武穴市| 墨玉县| 锡林浩特市| 沙坪坝区| 鄯善县| 东丽区| 顺昌县| 永泰县| 吉安县| 安义县| 金门县| 七台河市| 葫芦岛市| 海伦市| 桐庐县| 闻喜县| 隆尧县| 巩留县| 贵阳市| 镇平县| 荣昌县| 邹平县| 连城县| 军事| 华池县| 广东省| 孟津县| 彭泽县| 康马县| 泰来县| 屏东县| 胶南市| 安阳市| 于都县| 平邑县|