高 輝 胡良平 鮑曉蕾
目前,擬合三項(xiàng)型指數(shù)曲線常用的方法為殘數(shù)法〔1〕,它是把一條曲線分解成三個(gè)指數(shù)成分,然后通過曲線直線化的方式得到相應(yīng)指數(shù)成分的參數(shù)估計(jì)值。由于曲線直線化是采用最小二乘法使變量轉(zhuǎn)換后所得新結(jié)果變量的離均差平方和最小,并不一定能使原結(jié)果變量的離均差平方和最小,所以其模型的擬合精度仍有提高的空間。
借助SAS軟件中的NLIN過程〔2〕,采用非線性最小二乘法,可以得到擬合效果更好的曲線模型。但該過程需要使用者人工設(shè)置曲線模型中各參數(shù)的初始值,且其對(duì)初始值非常敏感,設(shè)置不合理時(shí)往往無法得到參數(shù)的估計(jì)結(jié)果,故不能盲目地隨意設(shè)定參數(shù)的初始值。
因此,本文以殘數(shù)法和非線性最小二乘法相結(jié)合,即以殘數(shù)法計(jì)算所得的參數(shù)估計(jì)值為初始值,賦給SAS軟件中的NLIN過程,從而得以采用非線性最小二乘法來得到擬合效果更好的曲線模型。此做法不但解決了殘數(shù)法擬合精度不高、非線性最小二乘法不便使用的問題,而且由筆者已編制完成的相應(yīng)的SAS程序,可方便快捷地被實(shí)際研究者使用。
二室模型藥物血管外給藥或三室模型藥物靜脈注射后,其”藥-時(shí)”曲線均為三項(xiàng)型指數(shù)曲線。現(xiàn)以二室模型藥物血管外給藥為例,介紹殘數(shù)法求解模型參數(shù)的過程。
對(duì)于二室模型藥物血管外給藥而言,其“藥-時(shí)”曲線為:
因 ka> >β,α > >β,所以,當(dāng) x充分大時(shí),e-kax和e-αx均趨于 0,上式可簡(jiǎn)化為:
此式代表了“藥-時(shí)”曲線的尾端部分,兩邊取對(duì)數(shù),可得:
作lgy-x圖,自尾端由后向前選取幾個(gè)基本呈直線趨勢(shì)的點(diǎn),然后擬合直線回歸方程。
當(dāng)x為其它點(diǎn)時(shí)(之前所選點(diǎn)以外的點(diǎn),簡(jiǎn)稱外推點(diǎn)),將x值代入式(2)可得相應(yīng)的外推濃度。以外推點(diǎn)的實(shí)際濃度減去其外推濃度,可得第一殘數(shù)濃度,記為y殘1。計(jì)算公式為:
通常,ka> α,當(dāng) x 充分大時(shí),e-kaχ趨于 0。式(4)可簡(jiǎn)化為:
兩邊取對(duì)數(shù),可得:
作lgy殘1-x圖,可得第一條殘數(shù)曲線,在此殘數(shù)曲線尾端由后向前選取幾個(gè)基本呈直線趨勢(shì)的點(diǎn),然后擬合直線回歸方程。其斜率為-α/2.303,截距為lgL,據(jù)此可求出α和L值。
對(duì)此殘數(shù)線進(jìn)一步分解,當(dāng)?shù)谝粭l殘數(shù)線上多數(shù)外推點(diǎn)的外推濃度大于殘數(shù)濃度時(shí),以此殘數(shù)線上各外推點(diǎn)的外推濃度(Le-αx)減去其殘數(shù)濃度(Ne-kax+Le-αx),得第二殘數(shù)濃度,記為 y殘2,其方程為:
兩邊取對(duì)數(shù),可得:
作lgy殘2-x圖,可得第二條殘數(shù)曲線,自尾端由后向前選取若干個(gè)基本呈直線趨勢(shì)的點(diǎn),擬合直線回歸方程。其斜率為-ka/2.303,截距為lg(-N),據(jù)此可求出ka和N值(N<0)。
而當(dāng)?shù)谝粭l殘數(shù)線上多數(shù)外推點(diǎn)的外推濃度小于殘數(shù)濃度時(shí),以此殘數(shù)線上各外推點(diǎn)的殘數(shù)濃度(Ne-kax+Le-αx)減去其外推濃度(Le-αx),得第二殘數(shù)濃度,記為 y殘2,其方程為:
兩邊取對(duì)數(shù),可得:
作lgy殘2-x圖,可得第二條殘數(shù)曲線,自尾端由后向前選取若干個(gè)基本呈直線趨勢(shì)的點(diǎn),擬合直線回歸方程。其斜率為-ka/2.303,截距為lg(N),據(jù)此可求出ka和N值(N>0)。
這樣采用殘數(shù)法,結(jié)合極限的原理,可求得參數(shù)ka、α、β、M、N、L 的值。以此為初值,賦給 SAS 軟件的NLIN過程,進(jìn)而采用非線性最小二乘法得到最終的曲線模型。
如何評(píng)價(jià)曲線方程的擬合效果?若待比較的曲線方程形式相同,可使用殘差平方和〔3〕等指標(biāo)。其計(jì)算公式為:
SS殘?jiān)叫?,說明估計(jì)值與實(shí)際觀察值越接近,曲線擬合效果也就越好。
若待比較的曲線方程形式不同,但具有嵌套關(guān)系,可用式(12)〔4〕檢驗(yàn)不同模型擬合效果之間的差異有無統(tǒng)計(jì)學(xué)意義。
其中,剩余平方和即為殘差平方和,減少誤差的平方和為低次回歸方程的殘差平方和與高次回歸方程的殘差平方和之差,分子自由度為兩個(gè)回歸方程誤差項(xiàng)的自由度之差,各回歸方程誤差項(xiàng)的自由度為樣本例數(shù)與回歸方程中參數(shù)個(gè)數(shù)之差。
資料來源于文獻(xiàn)〔5〕,根據(jù)有關(guān)專業(yè)知識(shí),已知某藥物為二室模型藥物,口服后,測(cè)得各時(shí)間點(diǎn)的血藥濃度結(jié)果見表1。試擬合該藥物的“藥-時(shí)”曲線。
已知此藥物是二室模型藥物,且采用口服,即血管外給藥,所以其“藥-時(shí)”曲線應(yīng)為三項(xiàng)型指數(shù)曲線。具體分析時(shí),可將所有的散點(diǎn)劃分成三部分,分別用來計(jì)算三個(gè)指數(shù)項(xiàng)的參數(shù)。在計(jì)算指數(shù)項(xiàng)參數(shù)的值時(shí),所得回歸直線的斜率和截距對(duì)參數(shù)值的最終確定有重要影響。而回歸直線的斜率和截距依賴于散點(diǎn)的選擇,所以在不同計(jì)算階段,選擇合適的散點(diǎn)個(gè)數(shù)尤為重要。
表1 某藥物靜脈注射后各時(shí)間點(diǎn)的血藥濃度
第一步,繪制不同階段的散點(diǎn)圖,自尾端由后向前選擇近似呈直線趨勢(shì)的若干個(gè)散點(diǎn),并采用直線回歸分析,計(jì)算得到截距項(xiàng)和斜率,并推導(dǎo)出本階段指數(shù)項(xiàng)參數(shù)的值。在散點(diǎn)圖中,橫軸為時(shí)間t,但不同階段時(shí)縱軸含義有所不同:第一階段時(shí),縱軸為血藥濃度的對(duì)數(shù)值lgy;第二階段時(shí),縱軸為第一殘數(shù)濃度的對(duì)數(shù)值;第三階段時(shí),縱軸為第二殘數(shù)濃度的對(duì)數(shù)值lgy殘2。
第二步,將殘數(shù)法所得曲線模型中各參數(shù)的估計(jì)值代入NLIN過程作為初始值,采用非線性最小二乘法繼續(xù)進(jìn)行分析,得到擬合效果更優(yōu)的曲線模型。
具體SAS程序如下。
以下是殘數(shù)法和非線性最小二乘法擬合的曲線回歸方程,它們對(duì)資料的擬合效果見表2。
表2 殘數(shù)法與非線性最小二乘法擬合的曲線回歸方程
同為三項(xiàng)型指數(shù)曲線,擬合方法2所得曲線回歸方程的殘差平方和小于擬合方法1,即以殘數(shù)法得到的參數(shù)估計(jì)值為初始值,再用非線性最小二乘法進(jìn)一步擬合資料,兩法結(jié)合應(yīng)用,所得的三項(xiàng)型指數(shù)曲線回歸方程擬合效果更優(yōu)。同理,在擬合二項(xiàng)型指數(shù)曲線時(shí),擬合方法4所得的二項(xiàng)型指數(shù)曲線回歸方程的擬合效果優(yōu)于擬合方法3。
進(jìn)一步比較擬合方法4和擬合方法2對(duì)資料的擬合效果有無統(tǒng)計(jì)學(xué)差異時(shí),可根據(jù)式(12),計(jì)算F值和P值,得:F=6857.06,P<0.01,說明二者對(duì)資料的擬合效果之間的差異有統(tǒng)計(jì)學(xué)意義。由于擬合方法2的殘差平方和更小,所以擬合方法2對(duì)資料的擬合效果優(yōu)于擬合方法4。故四種方法中,擬合方法2所得曲線回歸方程對(duì)資料的擬合效果要優(yōu)于其他三種方法。
SAS軟件中NLIN過程對(duì)參數(shù)初始值較為敏感,為能夠快速得到一組較優(yōu)的模型估計(jì)值,本文以殘數(shù)法所得的參數(shù)估計(jì)值為初始值,用NLIN過程進(jìn)行非線性最小二乘法估計(jì),得到了優(yōu)化的曲線回歸方程。
應(yīng)用殘數(shù)法時(shí),其結(jié)果依賴于每個(gè)指數(shù)成分參數(shù)估計(jì)時(shí)的散點(diǎn)選擇。需要注意的是,并非所有的散點(diǎn)組合都是可行的,因?yàn)檫x取散點(diǎn)準(zhǔn)備進(jìn)行直線回歸分析時(shí),還需計(jì)算某些變量的對(duì)數(shù)值。若選點(diǎn)不合適,則這些變量的取值可能有正有負(fù),這樣其對(duì)數(shù)值就無法完全計(jì)算了。此時(shí),可根據(jù)正負(fù)值的數(shù)量,選擇數(shù)量較多的散點(diǎn),若該變量正值較多,則對(duì)其取值為正值的散點(diǎn)作相應(yīng)變換后進(jìn)行直線回歸分析;若該變量負(fù)值較多,則求其相反數(shù),然后再對(duì)該變量取值為負(fù)值的散點(diǎn)作相應(yīng)變換后進(jìn)行直線回歸分析。
另外取點(diǎn)的多少,較大程度上影響到斜率和截距的值,取點(diǎn)較少將導(dǎo)致殘數(shù)值誤差較大,所以每一個(gè)計(jì)算階段均應(yīng)選取3個(gè)以上(含3個(gè))的散點(diǎn)。
本文所用資料中已說明藥物為雙室模型藥物,且血管外給藥,由專業(yè)知識(shí)可知其“藥-時(shí)”曲線應(yīng)為三項(xiàng)型指數(shù)曲線。而對(duì)于藥物屬于幾室模型未知的情形,則需分別擬合二項(xiàng)型指數(shù)曲線和三項(xiàng)型指數(shù)曲線,并比較二者的擬合效果,從中選取擬合效果更好的曲線回歸方程。
此外,要正確進(jìn)行曲線擬合,尤其要注意:(1)曲線在理論上能否得到適當(dāng)解釋;(2)資料所具備的特征與觀察點(diǎn)的趨勢(shì)有無矛盾;(3)擬合的曲線本身是否最優(yōu)或較優(yōu)〔7〕。
1.梁文權(quán).生物藥劑學(xué)與藥物動(dòng)力學(xué).第2版.北京:人民衛(wèi)生出版社,2006:164-240.
2.SAS Institute Inc.SAS/STAT 9.2 User's Guide.Cary,NC:SAS Institute Inc.,2008:4261-4336.
3.徐秦,薛茜,徐睿.淺論曲線擬合中的相關(guān)指數(shù)R2.中國(guó)衛(wèi)生統(tǒng)計(jì),1992,9(6):44-45.
4.楊樹勤.中國(guó)醫(yī)學(xué)百科全書(醫(yī)學(xué)統(tǒng)計(jì)學(xué)).上海:上??茖W(xué)技術(shù)出版社,1985:171-176.
5.薛仲三.醫(yī)學(xué)統(tǒng)計(jì)方法和原理(內(nèi)部資料).北京:軍事醫(yī)學(xué)科學(xué)院印,1984:276-287.
6.高輝,胡良平,李長(zhǎng)平,等.二項(xiàng)型指數(shù)曲線在“藥-時(shí)”曲線擬合中的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(5):520-522.
7.郭祖超.醫(yī)用數(shù)理統(tǒng)計(jì)方法.第3版.北京:人民衛(wèi)生出版社,1988:573-610.