• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      無金標(biāo)準(zhǔn)部分核實(shí)數(shù)據(jù)下基于Bootstrap的小樣本齊性檢驗(yàn)

      2021-03-22 04:28:22伏啟翔王黎明邱世芳
      關(guān)鍵詞:核實(shí)限制性樣本量

      伏啟翔,覃 愿,王黎明,邱世芳

      (重慶理工大學(xué) 理學(xué)院,重慶 400054)

      估計(jì)疾病流行率是生物醫(yī)學(xué)研究中的一個重要問題。為收集數(shù)據(jù),價格便宜的篩檢方法常被用來做初步診斷,但由于其分類誤差而導(dǎo)致有誤的分類結(jié)果,進(jìn)而導(dǎo)致基于這些有誤分類數(shù)據(jù)的統(tǒng)計(jì)推斷不太合理。無誤判的金標(biāo)準(zhǔn)通常存在昂貴、耗時等不足,因而常不能用于每個個體的檢驗(yàn)。為此,Tenenbein[1]提出了二重抽樣方法,即從感興趣的總體中抽取的樣本(如N)都接受篩檢檢驗(yàn),然后再隨機(jī)抽取部分個體(如n)再次接受金標(biāo)準(zhǔn)檢驗(yàn)。由于這n個個體同時接受了篩檢檢驗(yàn)和金標(biāo)準(zhǔn)檢驗(yàn),反映了個體的真實(shí)特征。因而通過二重抽樣方法得到的數(shù)據(jù)又稱為部分核實(shí)數(shù)據(jù)[2]。對于有金標(biāo)準(zhǔn)部分核實(shí)數(shù)據(jù)的研究得到了很多學(xué)者的關(guān)注,如Tenenbein等[3-4]將二重抽樣方法推廣到多項(xiàng)分布數(shù)據(jù)的研究,Hochberg[5]推廣到多維數(shù)據(jù)的研究,Geng等[6]發(fā)展了部分核實(shí)數(shù)據(jù)的Bayesian分析方法。對于有序部分核實(shí)數(shù)據(jù),Poon等[7]發(fā)展了一類參數(shù)模型,Qiu等[8]從有序效應(yīng)度角度研究了疾病流行率的等價性評價問題。以上研究都是基于有金標(biāo)準(zhǔn)下的研究,事實(shí)上,臨床診斷中并不一定存在完全無誤判的金標(biāo)準(zhǔn)。當(dāng)2種檢驗(yàn)都有誤判時基于部分核實(shí)數(shù)據(jù)的統(tǒng)計(jì)分析具有重要的現(xiàn)實(shí)意義。為此,Nedelman[9]基于條件獨(dú)立性假定提出了3種模型并研究了疾病流行率、敏感度和特異度的估計(jì)問題,Lie等[10]基于2種二重抽樣模型進(jìn)行了研究。在Nedelman等[9-10]提出的模型基礎(chǔ)上,Qiu等[11-13]基于無金標(biāo)準(zhǔn)部分核實(shí)數(shù)據(jù)研究了假設(shè)檢驗(yàn)、區(qū)間估計(jì)及樣本量確定問題。疾病流行率的研究可能受到年齡、性別等混雜因素的影響,因而將這些混雜因素看成分層變量,研究分層設(shè)計(jì)下的部分核實(shí)數(shù)據(jù)的統(tǒng)計(jì)推斷問題是一種重要的研究問題。在小樣本下基于大樣本漸近分布的檢驗(yàn)過程常常會得到不太令人滿意的結(jié)果,因而在小樣本下研究基于分層設(shè)計(jì)下的部分核實(shí)數(shù)據(jù)對疾病流行率的齊性檢驗(yàn)是一個有意義的研究問題。

      1 統(tǒng)計(jì)模型與參數(shù)估計(jì)

      假設(shè)存在有誤判的2種分類器(初級分類器J和高級分類器S)。從第j層(j=1,2,…,J)總體中隨機(jī)抽取Nj個個體接受初級分類器進(jìn)行檢驗(yàn),Jj=1表示第j層的個體被診斷為陽性,反之,Jj=0;然后再從中隨機(jī)抽取nj(nj<Nj)個個體接受高級分類器的檢驗(yàn),Sj=1表示被診斷為陽性,反之,Sj=0。從而得到如表1所示的部分核實(shí)數(shù)據(jù)。

      設(shè)Dj=1表示第j層中個體患病,反之,Dj=0;令πj=Pr(Dj=1)表示第j層中個體患病的概率,ηj=。為了使模型可識別,不妨假定不存在假陽性。

      表1 第j層部分核實(shí)數(shù)據(jù)

      1.1 模型1及參數(shù)估計(jì)

      表2 模型1下第j層概率結(jié)構(gòu)

      以下為齊性檢驗(yàn):H0:π1=π2=…=πJ=π?H1:至少有一對πi≠πj(i≠j)。

      設(shè)mj=(n11j,n10j,n01j,n00j,xj,yj),π=(π1,…,πJ)′,η=(η1,…,ηJ)′,θ=(θ1,…,θJ)′,則基于m={mj:j=1,2,…,J}的對數(shù)似然函數(shù)為:l1(m;π,η,θ)=,其中

      顯然,πj,ηj,θj的非限制性極大似然估計(jì)是方程組的解。根據(jù)文獻(xiàn)[12]可得,當(dāng)n11jn00j≥n10jn01j時,

      在H0:π1=π2=… =πJ=π下,π,ηj,θj的限制性極大似然估計(jì)是如下方程組的解:,由于無顯表達(dá)式,因而可用牛頓迭代法等求得方程組的解。

      1.2 模型2及參數(shù)估計(jì)

      表3 模型2下第j層概率結(jié)構(gòu)

      基于m={mj∶j=1,2,…,J}對數(shù)似然函數(shù)為,其中:

      則πj,ηj,θj的非限制性極大似然估計(jì)為

      在H0:π1=π2=… =πJ=π下,π,ηj,θj的限制性極大似然估計(jì)通過求解以下兩式:,得到:

      2 齊性檢驗(yàn)統(tǒng)計(jì)量

      2.1 Score檢驗(yàn)統(tǒng)計(jì)量

      根據(jù)Rao[14]所提出的Score檢驗(yàn)的一般理論,在2種模型下,經(jīng)過簡單計(jì)算可得在H0:π1=π2=…=πJ=π成立下的Score檢驗(yàn)統(tǒng)計(jì)量為

      其中Sj是2種模型下的Score函數(shù),

      I11j為第j層Fisher信息陣的逆矩陣的第一主對角元素(見附錄)。當(dāng)Nj→∞(j=1,2,…,J)時,檢驗(yàn)統(tǒng)計(jì)量Tsc漸近服從自由度為J-1的卡方分布[15]。

      2.2 加權(quán)最小二乘估計(jì)檢驗(yàn)統(tǒng)計(jì)量

      根據(jù)研究,可得如下的加權(quán)最小二乘估計(jì)檢驗(yàn)統(tǒng)計(jì)量[16]:

      2.3 基于log變換的加權(quán)最小二乘估計(jì)檢驗(yàn)統(tǒng)計(jì)量

      2.4 基于logit變換的最小二乘估計(jì)檢驗(yàn)統(tǒng)計(jì)量

      式中:漸近服從于自由度為J-1的卡方分布。

      2.5 基于雙對數(shù)變換的最小二乘估計(jì)檢驗(yàn)統(tǒng)計(jì)量

      3 檢驗(yàn)過程

      3.1 漸近的檢驗(yàn)方法

      3.2 基于Bootstrap的檢驗(yàn)方法

      4 模擬研究

      為評價提出方法的有效性,考慮如下的樣本量:①平衡設(shè)計(jì)nj=20,Nj=30(j=1,2,3);②非平衡設(shè)計(jì):(n1,n2,n3,N1,N2,N3)=(10,10,15,20,15,30)和參數(shù)設(shè)置:π=0.10(0.20)0.50;η1=0.50(0.05)0.60,η2=η1+0.05,η3=η1+0.10;θ1=0.70(0.05)0.80,θ2=θ1+0.05,θ3=θ1+0.10研究各種檢驗(yàn)的犯第1類錯誤的概率,模擬結(jié)果列于表4、5。同時,考慮以上2種樣本量下δ=0.10(0.10)0.30和以上參數(shù)設(shè)置各檢驗(yàn)的功效,由于篇幅的限制,本研究只列出了nj=20,Nj=30(j=1,2,3)下的模擬結(jié)果,如表6所示。

      模擬結(jié)果表明,2種模型下基于Bootstrap的小樣本檢驗(yàn)過程優(yōu)于漸近的檢驗(yàn)方法,前者犯第1類錯誤的概率更接近名義水平且具有更高的功效,而后者在小樣本下犯第1類錯誤的概率太保守。特別地,基于Score檢驗(yàn)的Bootstrap檢驗(yàn)過程在2種模型下的犯第1類錯誤的概率最接近名義水平。

      表4 平衡小樣本量nj=20,Nj=30(j=1,2,3)下各檢驗(yàn)統(tǒng)計(jì)量在顯著性水平為α=0.05下犯第1類錯誤的概率(%)

      表5 非平衡小樣本量設(shè)置下(n1=10,n2=10,n3=10;N1=20,N2=15,N3=30)各檢驗(yàn)統(tǒng)計(jì)量在置信水平α=0.05下犯第1類錯誤的模型結(jié)果概率(%)

      表6 平衡小樣本量設(shè)置下(Nj=20,Nj=30,j=1,2,…,3)各檢驗(yàn)統(tǒng)計(jì)量在置信水平α=0.05下的檢驗(yàn)功效(%)

      5 實(shí)例分析

      考慮Nedelman[9]在研究瘧疾流行率時按年齡分層的瘧疾數(shù)據(jù),本研究考慮如表7所示的3個成年組數(shù)據(jù),其中“+”表示被診斷為陽性,“-”表示被診斷為陰性。

      表7 成人組瘧疾數(shù)據(jù)

      基于以上數(shù)據(jù),可得到2個模型下參數(shù)πj、ηj、θj的非限制性和限制性極大似然估計(jì),如表8所示。

      表8 成人組瘧疾數(shù)據(jù)的非限制性極大似然估計(jì)(MLE)與限制性極大似然估計(jì)(CMLE)

      對于假設(shè)檢驗(yàn):H0∶π1=π2=π3?H1∶π1,π2,π3不全相等,各種檢驗(yàn)的漸近p值和Bootstrap檢驗(yàn)p值如表9所示。

      表9 成人組瘧疾數(shù)據(jù)的檢驗(yàn)p值

      由表9可知,2種模型下各種檢驗(yàn)的漸近和Bootstrap檢驗(yàn)p值都大于0.05,因而在顯著性水平0.05下都沒有足夠的理由拒絕原假設(shè)。

      6 結(jié)論

      本研究考慮了分層設(shè)計(jì)下的無金標(biāo)準(zhǔn)部分核實(shí)數(shù)據(jù)對疾病流行率的齊性檢驗(yàn)H0∶π1=π2=… =πJ?H1∶πi,πj不全相等(i≠j),提出了小樣本下基于檢驗(yàn)統(tǒng)計(jì)量Tsc,Twls,Tlog,Tlogit,Tdlog的Bootstrap檢驗(yàn)過程。模擬研究結(jié)果表明,在小樣本下基于Bootstrap的檢驗(yàn)過程犯第1類錯誤的概率更接近顯著性水平,且具有更高的功效。因而,在小樣本下推薦使用Bootstrap的檢驗(yàn)過程。

      附錄

      第j層Fisher信息陣的逆矩陣的第一主對角元素為

      其中,

      在模型1下:

      在模型2下:

      猜你喜歡
      核實(shí)限制性樣本量
      醫(yī)學(xué)研究中樣本量的選擇
      因“限制性條件”而舍去的根
      閱讀理解精練精析
      航空裝備測試性試驗(yàn)樣本量確定方法
      Sample Size Calculations for Comparing Groups with Binary Outcomes
      骨科手術(shù)術(shù)中限制性與開放性輸血的對比觀察
      髁限制性假體應(yīng)用于初次全膝關(guān)節(jié)置換的臨床療效
      中國2012年增速確認(rèn)為7.7%
      自適應(yīng)樣本量調(diào)整中Fisher合并P值法和傳統(tǒng)檢驗(yàn)法的模擬比較
      論房屋承租人優(yōu)先購買權(quán)的限制性保護(hù)
      德格县| 高邮市| 浮山县| 温州市| 庆阳市| 乌鲁木齐市| 石城县| 沙坪坝区| 积石山| 兴城市| 通许县| 南昌市| 奉贤区| 济宁市| 金堂县| 德格县| 青神县| 衡山县| 桦川县| 土默特左旗| 南靖县| 仙居县| 惠安县| 建湖县| 平顺县| 花莲市| 南乐县| 集安市| 方正县| 孝感市| 鹤峰县| 榆树市| 华亭县| 邮箱| 靖远县| 海阳市| 秦皇岛市| 广南县| 黄浦区| 南岸区| 紫阳县|