• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      部分線性工具變量模型中有效工具變量識別及應(yīng)用研究

      2022-07-07 07:36:34趙培信肖仕維李慶
      應(yīng)用數(shù)學 2022年3期
      關(guān)鍵詞:樣本量懲罰調(diào)整

      趙培信, 肖仕維, 李慶

      (1.重慶工商大學數(shù)學與統(tǒng)計學院, 重慶 400067;2.經(jīng)濟社會應(yīng)用統(tǒng)計重慶市重點實驗室, 重慶 400067)

      1.引言

      部分線性模型既含有參數(shù)分量又含有非參數(shù)分量, 具有較強的數(shù)據(jù)適應(yīng)性.目前該模型已被廣泛應(yīng)于社會經(jīng)濟, 生物醫(yī)學及環(huán)境工程等各個領(lǐng)域.具體地, 部分線性模型具有如下結(jié)構(gòu):

      其中β = (β1,··· ,βp)T為p維未知的參數(shù)向量, g(t)為未知的光滑函數(shù), X和t為協(xié)變量, Y 為對應(yīng)的響應(yīng)變量, ε為零均值的模型誤差.當X為外生協(xié)變量, 即協(xié)變量X與模型誤差ε相互獨立時, 基于兩階段最小二乘方法可以得到模型參數(shù)β的相合估計.但當X為內(nèi)生協(xié)變量,即X與ε存在較強的相關(guān)性時, 基于兩階段最小二乘方法對β估計將不再是相合的, 而產(chǎn)生一定的內(nèi)生性偏差.基于工具變量調(diào)整技術(shù)則可以給出β一個相合估計.具體地, 假定X為內(nèi)生協(xié)變量且滿足

      其中Z為q維工具變量, Γ為p×q維的未知參數(shù)矩陣, e為模型誤差.

      近年來對基于工具變量調(diào)整的統(tǒng)計推斷理論已有大量文獻進行了研究.比如CAI和XIONG[1]研究了部分變系數(shù)工具變量模型的估計問題, 并提出了一種三階段估計方法.ZHAO和LI[2]研究了變系數(shù)工具變量模型的變量選擇問題, 并提出了一種基于光滑門限估計方程的變量選擇方法.FAN和LIAO[3]則對高維的線性工具變量模型進行了研究, 并提出了一種基于懲罰的廣義矩估計方法.關(guān)于工具變量模型的更多最新研究參見文[4-8].

      基于工具變量的統(tǒng)計推斷過程中, 選取有效的工具變量是進行統(tǒng)計推斷的關(guān)鍵, 但是上述文獻均是在假定已知有效工具變量的前提下, 研究模型參數(shù)的統(tǒng)計推斷問題.而如何選取有效的工具變量并沒有進行研究.關(guān)于有效工具變量的識別問題, 目前研究的文獻不是太多.而在實際的回歸建模過程中往往需要從大量的指標中選取某些指標作為有效工具變量, 因此對有效工具變量的識別成為內(nèi)生協(xié)變量回歸建模研究中一個重要的課題.基于此, 本文在X為內(nèi)生協(xié)變量, 并且在線性模型結(jié)構(gòu)(1.1)和(1.2)下, 研究工具變量Z的識別問題.

      本文通過構(gòu)造一個輔助回歸模型, 結(jié)合懲罰估計技術(shù), 對模型結(jié)構(gòu)(1.1)和(1.2)中的有效工具變量給出一種識別方法.數(shù)據(jù)模擬研究表明所提出的有效工具變量識別方法行之有效.本文所提出的有效工具變量識別方法允許采集的數(shù)據(jù)含有部分異常值, 因此所提出的識別方法具有較好的穩(wěn)健性.另外, 盡管LIU等[7]也考慮了部分線性工具變量模型中有效工具變量的識別問題, 但該文是在假定協(xié)變量X 和t相互獨立的條件下提出了一種工具變量識別方法.而在實際應(yīng)用中, 假定協(xié)變量X和t相互獨立往往是不切實際且不易驗證的.本文提出的有效工具變量識別方法不需要X和t相互獨立這一條件, 而是允許二者存在相關(guān)性.因此, 本文提出的有效工具變量識別方法是對LIU等[7]所提方法的一種有效改進, 并且兩種方法在模型假定上存在本質(zhì)的區(qū)別.最后, 作為應(yīng)用, 利用本文所提出的方法對中國大陸地區(qū)對外貿(mào)易開放與經(jīng)濟增長的關(guān)系進行了實證分析.研究結(jié)果表明在處理貿(mào)易開放度的內(nèi)生性問題上, 各地區(qū)的國外市場接近度是一個行之有效的工具變量, 并且發(fā)現(xiàn)對外貿(mào)易開放對經(jīng)濟增長有顯著的推動作用.

      2.有效工具變量識別及模型估計過程

      對(1.1)求條件期望可得E(Y|t)=E(X|t)Tβ+g(t), 進而可得

      記Zk為工具變量Z =(Z1,··· ,Zq)T的第k個分量, 注意到E(ε|Z)=0, 則結(jié)合(2.2)式可得

      3.迭代計算

      在這一節(jié), 考慮工具變量識別以及模型參數(shù)估計方法的迭代計算問題.首先討論最小化目標函數(shù)Q(θ)的計算方法.結(jié)合ZOU和LI[12]提出的線性逼近方法, (2.5)式中的懲罰函數(shù)pλ(|θk|)可以漸近表示為

      注意到(3.3)式為經(jīng)典的最小一乘估計目標函數(shù), 因此可以通過已有的統(tǒng)計軟件(如R軟件、SPSS軟件等)進行求解.另外在求解(3.3)式的過程中, 調(diào)整參數(shù)λ需要指定, 并且參數(shù)向量θ需要給出一個初始估計.首先我們可以通過最小化如下不帶懲罰項的絕對偏差目標函數(shù)來得到θ的一個初始估計

      另外類似文[13], 本文建議用BIC準則對調(diào)整參數(shù)λ估計.具體地, 我們通過最小化如下BIC準則函數(shù)來得到λ的估計.

      其中dλ表示中非零元素的個數(shù).在實際應(yīng)用中, 我們可以通過格子點法來求解(3.5)式.具體地講, 我們在一個相對較大的閉區(qū)間, 比如在區(qū)間[0,5]上以步長0.01取均勻的格子點, 并在每一個格子點上通過(3.5)式計算BIC的值, 那么最小的BIC值對應(yīng)的格子點則為所選擇的最優(yōu)調(diào)整參數(shù)λ.

      接下來, 我們給出有效工具變量識別以及模型參數(shù)估計過程的具體迭代算法如下:

      第1步 最小化(3.4)式得初始估計量θ0;

      第3步 利用有效工具變量Z?, 并結(jié)合(2.6)式給出內(nèi)生協(xié)變量X的工具變量調(diào)整形式X?=;

      第4步 基于工具變量調(diào)整后的協(xié)變量X?, 并利用最小化(2.7)式給出模型參數(shù)β的穩(wěn)健估計, 并基于核估計法給出非參數(shù)函數(shù)g(t)的估計(t).

      4.數(shù)值模擬研究

      為實施模擬, 我們從如下模型產(chǎn)生數(shù)據(jù)

      其中Γ = (3,1.5,1,0.5,0,··· ,0)為1×10維參數(shù)矩陣, β = 2, g(t) = sin(2πt), 對應(yīng)的工具變量Zk~N(1,1.5), k = 1,··· ,10.由Γ的前三個元素非零, 其他元素均為零可知Z1, Z2和Z3為三個有效的工具變量, 而Z4,··· ,Z10均為無效工具變量.協(xié)變量t由區(qū)間[0,1]上的均勻分布產(chǎn)生, 響應(yīng)變量Y 以及內(nèi)生協(xié)變量X均由模型產(chǎn)生, 其中模型誤差ε ~N(0,0.5)并且e = 0.5ε.該數(shù)據(jù)產(chǎn)生方法保證了E(Xε)0, 即X為內(nèi)生協(xié)變量.在模擬過程中, 樣本容量n分別取200,400和600 三種情況, 懲罰函數(shù)pλ(·)分別取Lasso懲罰[9], SCAD懲罰[10]以及Adaptive-Lasso懲罰[14]三種情況.另外為驗證本文所提出方法的穩(wěn)健性, 對樣本容量的每一種情況, 我們對響應(yīng)變量Y 和內(nèi)生協(xié)變量X人為設(shè)置部分異常點.在模擬過程中, 我們考慮異常值占數(shù)據(jù)的10%和20% 兩種情況.對每一種情況, 異常值通過模型誤差取為ε ~N(0,3)進行產(chǎn)生.

      關(guān)于有效工具變量識別的模擬結(jié)果見表4.1和表4.2, 其中“C”表示基于1000次重復(fù)實驗把真實無效工具變量正確估計為無效工具變量的平均個數(shù), “I”表示基于1000次重復(fù)實驗把真實有效工具變量錯誤估計為無效工具變量的平均個數(shù).另外, 表4.1和表4.2還給出了選擇有效工具變量的錯誤選擇率(FSR), 其定義為FSR=IN/TN, 其中IN表示基于1000次重復(fù)實驗把無效工具變量估計為有效工具變量的平均個數(shù), TN表示基于1000次重復(fù)實驗選擇為有效工具變量的平均個數(shù).由表4.1 和表4.2, 我們可以得到如下結(jié)論:

      表4.1 異常值占10%時,基于不同懲罰函數(shù)選擇有效工具變量的結(jié)果

      表4.2 異常值占20%時,基于不同懲罰函數(shù)選擇有效工具變量的結(jié)果

      (i)隨著樣本量n的增加, 基于三種懲罰方法的有效工具變量錯誤識別率均逐漸趨于0, 并且對無效工具變量的識別也逐漸趨于無效工具變量的實際個數(shù)6.這表明本文提出的有效工具變量的選擇方法是行之有效的;

      (ii)對任意給定的樣本量n, 在不同異常值數(shù)量下的模擬結(jié)果是類似的, 即異常值對模擬結(jié)果沒有明顯的影響.這表明本文提出的工具變量選擇方法具有較好的穩(wěn)健性;

      (iii)對任意給定的樣本量n, 基于Lasso, Adaptive-Lasso和SCAD三種懲罰方法所得出的模擬結(jié)果也是類似的.

      接下來我們給出關(guān)于模型參數(shù)β的模擬結(jié)果.因此在接下來的模擬過程中, 用Lasso懲罰選擇有效工具變量, 其他情況下的模擬結(jié)果是類似的, 為此我們不再重復(fù)展示.另外作為比較, 我們還給出了關(guān)于β的樸素(naive)估計結(jié)果, 即不經(jīng)過工具變量調(diào)整, 直接利用內(nèi)生協(xié)變量X并通過最小化目標函數(shù)來得到β的估計.

      基于1000次重復(fù)實驗, 圖4.1和圖4.2給出了估計絕對偏差||在各種樣本量情況下的箱線圖(Box-plot), 其中“AE”表示本文提出的基于工具變量調(diào)整的估計方法所給出的模擬結(jié)果,“NE”表示基于樸素(naive)估計過程所給出的模擬結(jié)果.由圖4.1和圖4.2可以看出, 隨著樣本量的增加, 基于本文提出的方法所給出的絕對偏差逐漸減小, 而基于樸素(naive)估計過程給出的絕對偏差即使n增加時仍相對較大.這就表明忽略協(xié)變量內(nèi)生性的樸素估計過程將會產(chǎn)生一定的估計偏差, 而本文提出的工具變量調(diào)整的估計過程可以有效地消除協(xié)變量內(nèi)生性的影響, 從而給出了模型參數(shù)的相合估計.另外, 我們還可以看出對任意給定的樣本量n, 在不同異常值數(shù)量下, 基于本文提出方法的模擬結(jié)果是類似的.這表明本文提出的基于工具變量調(diào)整的估計方法對模型參數(shù)的估計同樣具有較好的穩(wěn)健性.

      圖4.1 異常值占10%時, 模型參數(shù)β估計量絕對偏差的箱線圖

      圖4.2 異常值占20%時, 模型參數(shù)β估計量絕對偏差的箱線圖

      另外圖4.3給出了在樣本量n=400, 異常值占20%時的情況下, 非參數(shù)函數(shù)估計?g(t)的模擬結(jié)果, 其中點虛線為沒經(jīng)過工具變量調(diào)整的naive估計結(jié)果, 長虛線為基于本文方法有效工具變量調(diào)整后的估計結(jié)果, 實線為真實曲線.從圖4.3可以看出基于本文的工具變量調(diào)整方法給出的估計曲線非常接近于真實曲線, 而基于naive過程的估計曲線則有相對較大的偏差.這主要是因為基于naive過程對參數(shù)分量β的估計是有偏估計, 從而導(dǎo)致對g(t)的估計也產(chǎn)生較大的偏差.

      圖4.3 樣本量n=400, 異常值占20%時, 非參數(shù)函數(shù)g(t)的估計曲線

      5.實際案例分析

      本文基于中國大陸地區(qū)31個省, 自治區(qū)和直轄市2010–2019年的各省相關(guān)數(shù)據(jù), 對貿(mào)易開放度與中國經(jīng)濟增長的關(guān)系進行實證分析研究.本文所涉及的數(shù)據(jù)均來自國家統(tǒng)計局網(wǎng)站《中國統(tǒng)計年鑒》.首先, 參考已有文獻, 我們對各變量的設(shè)定和對應(yīng)數(shù)據(jù)的計算方法進行簡單說明.響應(yīng)變量Y:采用以2009年為基期, 各省, 自治區(qū)和直轄市的實際GDP來代表各省, 自治區(qū)和直轄市的經(jīng)濟發(fā)展水平.協(xié)變量X: 采用各省, 自治區(qū)和直轄市的進出口總額與該地區(qū)生產(chǎn)總值的比值來衡量各省, 自治區(qū)和直轄市的對外貿(mào)易開放度.另外我們從就業(yè), 教育和地理位置三個方面選擇三個指標作為工具變量.具體地, Z1表示各省, 自治區(qū)和直轄市與國外市場的接近度, 類似文[15], 其計算方法為各省, 自治區(qū)和直轄市省會城市到海岸線距離的倒數(shù)(乘100倍)乘以人民幣對美元的名義匯率; Z2表示各省, 自治區(qū)和直轄市的年底從業(yè)人員數(shù);Z3表示各省, 自治區(qū)和直轄市的人力資本存量, 其用各省6歲及以上人口的平均受教育年限來衡量.因此, 可建立模型為

      其中t表示年份.

      在接下來的模擬過程中, 懲罰函數(shù)仍考慮SCAD懲罰, Lasso懲罰以及Adaptive- Lasso懲罰三種情況, 并對所有數(shù)據(jù)進行自然對數(shù)變換.關(guān)于有效工具變量識別的模擬結(jié)果見表5.1.從表5.1可以看出, 基于三種處罰方法給出的模擬結(jié)果是非常類似的, 這也進一步驗證了上一節(jié)數(shù)值模擬得出結(jié)論.并且從系數(shù)γ1的估計值不為零, 而系數(shù)γ2和γ3的估計值均為零可知“Z1: 國外市場接近度”為識別出的有效工具變量, 而“Z2: 從業(yè)人員數(shù)”和“ Z3: 人力資本存量”則為無效工具變量.

      表5.1 基于不同懲罰方法系數(shù)γ1 ?γ3的估計結(jié)果

      對參數(shù)分量β的估計, 我們同時給出基于工具變量調(diào)整的估計(AE)以及未經(jīng)過工具變量調(diào)整的樸素估計(NE), 具體模擬結(jié)果見表5.2.由表5.2可以看出,對β的估計, 基于工具變量調(diào)整給出的估計值大于未經(jīng)過工具變量調(diào)整的估計值.這就表明對外貿(mào)易開放度對當?shù)氐慕?jīng)濟增長存在顯著的正影響效應(yīng), 并且如果忽略對外貿(mào)易開放度的內(nèi)生性, 則會低估外貿(mào)易開放度在經(jīng)濟增長中發(fā)揮的作用.

      表5.2 參數(shù)分量β的估計結(jié)果

      圖5.1給出了基于本文所提出的方法對非參數(shù)函數(shù)g(t)的估計曲線, 該曲線反映了我國GDP隨著時間的變化趨勢.從圖5.1可以看出2010年以來我國的GDP是逐年增長的,但2016年以后增長速度有所放緩.

      圖5.1 非參數(shù)函數(shù)g(t)的估計曲線

      研究結(jié)果表明在處理貿(mào)易開放度的內(nèi)生性問題上, 各地區(qū)的國外市場接近度是一個行之有效的工具變量, 并且發(fā)現(xiàn)對外貿(mào)易開放對經(jīng)濟增長有著顯著的推動作用.目前我國正處在改革開放的攻堅期和深水區(qū), 全球性市場, 技術(shù)和資源等要素的競爭日趨激烈.因此, 在“一帶一路”的倡議下, 各省, 自治區(qū)和直轄市需要全方位, 寬領(lǐng)域地實行對外貿(mào)易的開放, 積極地推進對外貿(mào)易的發(fā)展.

      猜你喜歡
      樣本量懲罰調(diào)整
      醫(yī)學研究中樣本量的選擇
      夏季午睡越睡越困該如何調(diào)整
      工位大調(diào)整
      意林(2020年10期)2020-06-01 07:26:37
      神的懲罰
      小讀者(2020年2期)2020-03-12 10:34:06
      Jokes笑話
      航空裝備測試性試驗樣本量確定方法
      懲罰
      趣味(語文)(2018年1期)2018-05-25 03:09:58
      滬指快速回落 調(diào)整中可增持白馬
      Sample Size Calculations for Comparing Groups with Binary Outcomes
      真正的懲罰等
      库尔勒市| 定陶县| 昌乐县| 红桥区| 城固县| 青海省| 桂阳县| 无极县| 镇雄县| 五大连池市| 寿宁县| 梧州市| 洛隆县| 宝山区| 双牌县| 喜德县| 上林县| 衡阳县| 孟村| 东光县| 康定县| 铜川市| 卓尼县| 兴文县| 永年县| 女性| 永嘉县| 尖扎县| 太白县| 南陵县| 郧西县| 阳东县| 新乡市| 大足县| 长汀县| 丹寨县| 黄陵县| 彭水| 吉林省| 衡山县| 清苑县|