• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    隱馬爾可夫多元線性回歸模型及其貝葉斯估計

    2019-04-22 11:22:58劉鶴飛
    統(tǒng)計與決策 2019年6期
    關(guān)鍵詞:馬爾可夫后驗先驗

    劉鶴飛

    (曲靖師范學(xué)院 數(shù)學(xué)與統(tǒng)計學(xué)院,云南 曲靖 655011)

    0 引言

    回歸模型是最經(jīng)典的統(tǒng)計學(xué)模型,其廣泛應(yīng)用于經(jīng)濟(jì)學(xué)、管理學(xué)、心理學(xué)、教育學(xué)、醫(yī)學(xué)等領(lǐng)域。從最簡單的一元線性回歸到多元線性回歸,再到非線性回歸、廣義線性回歸,眾多研究者對回歸模型進(jìn)行了深入的研究、探索和各種改進(jìn)。

    隱馬爾可夫模型是一種基于隨機(jī)過程的統(tǒng)計模型。近年來,隱馬爾可夫模型在各個領(lǐng)域都得到了廣泛的應(yīng)用和發(fā)展。在經(jīng)濟(jì)管理領(lǐng)域,利用隱馬爾可夫模型處理異質(zhì)面板數(shù)據(jù),在生物醫(yī)學(xué)領(lǐng)域,利用隱馬爾可夫模型對DNA序列的分布進(jìn)行推斷[1];在人工智能領(lǐng)域,利用隱馬爾可夫模型進(jìn)行語音識別[2]、圖像處理等。

    隱馬爾可夫模型是由兩個隨機(jī)過程構(gòu)成[3]。一個是狀態(tài)轉(zhuǎn)移序列,它是一條單純的馬爾可夫鏈,另一條是與狀態(tài)對應(yīng)的觀測序列。在實際問題中,我們只能看到觀測變量的集合,無法看到觀測狀態(tài)序列的集合。隱馬爾可夫模型的研究內(nèi)容就是根據(jù)可觀測的序列集合去推斷不可觀測的狀態(tài)轉(zhuǎn)移特征以及每個狀態(tài)下的分布信息[4]。

    本文將隱馬爾可夫模型與回歸模型相結(jié)合,提出隱馬爾可夫回歸模型的概念。這種模型在許多領(lǐng)域都有實際的應(yīng)用,例如,在經(jīng)濟(jì)領(lǐng)域,由于股票指數(shù)與經(jīng)濟(jì)增速、CPI指數(shù)、銀行利率等指標(biāo)都有線性相關(guān)關(guān)系,并且可以建立這幾個自變量與因變量(股票價格指數(shù))之間的多元線性回歸模型。但是,股票市場處于牛市和熊市的不同狀態(tài)時,因變量和自變量之間的回歸關(guān)系是不同的。此外,不同狀態(tài)之間也是可以相互轉(zhuǎn)化的,研究者還想了解不同的狀態(tài)之間相互轉(zhuǎn)化的關(guān)系。隱馬爾可夫多元線性回歸模型就是研究不同狀態(tài)之間的相互轉(zhuǎn)化規(guī)律以及每個狀態(tài)下因變量和自變量之間回歸關(guān)系的模型。

    本文將以多元線性回歸模型為例,詳細(xì)介紹隱馬爾可夫多元線性回歸模型的數(shù)學(xué)定義,推導(dǎo)用貝葉斯方法對模型的參數(shù)進(jìn)行估計的理論過程。最后利用MCMC算法模擬參數(shù)的后驗,用后驗均值作為參數(shù)的估計值,并與模型參數(shù)的真值進(jìn)行比較,檢驗該方法估計的可靠性。

    1 模型描述

    假設(shè)隱狀態(tài)的轉(zhuǎn)移過程滿足以下馬爾可夫鏈的條件:

    其中u=1,2,…,K;s=1,2,…,K;t=2,3,…,T。

    這里,aus是從前一個時間點的隱狀態(tài)u向后一個時間點的隱狀態(tài)s的轉(zhuǎn)移概率。我們稱所有可能的隱狀態(tài)轉(zhuǎn)移概率構(gòu)成的矩陣為隱狀態(tài)轉(zhuǎn)移概率矩陣,記為:

    在給定隱狀態(tài)的條件下,描述自變量與因變量關(guān)系的多元線性回歸模型定義為:

    其中,β是P維回歸系數(shù)向量,εk是模型的誤差,且:

    2 貝葉斯推斷原理

    將隱狀態(tài)轉(zhuǎn)移概率矩陣記為A;將多元線性回歸模型中的參數(shù)(βk,)記為θ;將隱狀態(tài)向量記為Z。則該模型的貝葉斯推斷問題為,其中D=(Y,X)。

    馬爾可夫鏈蒙特卡洛算法模擬過程的具體步驟如下:

    (1)更新隱狀態(tài)Z;

    (2)更新潛變量A;

    (3)更新模型參數(shù)θ。

    其中,更新模型參數(shù)θ又可以分為兩小步:

    (1)更新正態(tài)分布的方差;

    (2)更新多元線性回歸系數(shù)βk。

    每一步更新參數(shù),都是借助于Gibbs抽樣[6]和MH算法[7]。這需要對每個參數(shù)設(shè)定其先驗分布,并推導(dǎo)出后驗分布。

    3 先驗分布

    貝葉斯理論認(rèn)為,每一個參數(shù)都是一個隨機(jī)變量[8]。因此,在進(jìn)行貝葉斯推斷時,必須事先為每一個參數(shù)都選擇一個合適的先驗分布。Robert[9]在研究隱馬爾可夫正態(tài)模型時,選擇對稱的狄尼克萊分布作為轉(zhuǎn)移概率矩陣每一行的先驗分布。Minka[10]在研究線性回歸模型參數(shù)的貝葉斯估計時,選擇多元正態(tài)分布和倒伽瑪分布作為線性回歸模型參數(shù)的先驗分布。借鑒以上經(jīng)驗,本文為模型中所有參數(shù)選擇的先驗分布如下:

    其中,Ak表示轉(zhuǎn)移概率矩陣的第k行,D表示狄尼克萊分布,α是狄尼克萊分布的超參數(shù);μ0k,Λ0k是多元正態(tài)分布中的超參數(shù),Inv-Gamma表示倒伽瑪分布,是倒伽瑪分布中的超參數(shù)。

    4 后驗推斷

    貝葉斯后驗推斷的主要任務(wù)是利用樣本的觀測信息和參數(shù)的先驗信息推導(dǎo)出參數(shù)的后驗信息[11]。對于本文的隱馬爾可夫多元線性回歸模型來說,即也就是要根據(jù)觀測變量集合和模型參數(shù)的先驗分布去推斷模型的隱狀態(tài)、概率轉(zhuǎn)移矩陣、多元回歸模型的參數(shù)。其中,轉(zhuǎn)移概率矩陣A、多元回歸模型的系數(shù)β是隱馬爾可夫多元線性回歸模型中的參數(shù),是需要進(jìn)行估計的對象。由于這個分布的復(fù)雜性,本文使用了MCMC方法來進(jìn)行后驗?zāi)M,用后驗均值作為相關(guān)參數(shù)的估計。這就需要相關(guān)參數(shù)的全條件后驗分布。

    其中,πk是在轉(zhuǎn)移概率矩陣A的作用下,隱狀態(tài)達(dá)到穩(wěn)定時,隱狀態(tài)k的穩(wěn)定概率;是觀測變量在隱狀態(tài)k下的似然函數(shù)。

    下面推導(dǎo)在隱狀態(tài)確定的條件下,多元線性回歸模型參數(shù)(βk,)的全條件后驗分布。

    記所有隱狀態(tài)為k的觀測數(shù)據(jù)集合為Dk,所有隱狀態(tài)為k的因變量集合記為Yk,所有隱狀態(tài)為k的自變量的集合為Xk。

    在此記法下,Yk的似然函數(shù)可以表示為:

    根據(jù)條件概率的計算公式可得:

    于是,可以把參數(shù)(βk,的后驗分布看成一個多元正態(tài)分布和一個倒伽瑪分布的乘積,它的具體形式為:

    為簡單起見,可將該后驗分布看成如下兩部分:

    則βk和這兩個參數(shù)的后驗分布分別為N,即參數(shù)為μn和的多元正態(tài)分布和參數(shù)為an和bn的倒伽瑪分布。其中:

    5 實證模擬

    為了檢驗上文所推導(dǎo)的模型參數(shù)的貝葉斯估計方法,這里將事先給定模型參數(shù)A和θ的真實值。根據(jù)概率轉(zhuǎn)移矩陣A生成一個隱狀態(tài)序列集合,再根據(jù)每個觀測點的隱狀態(tài)取值和對應(yīng)于該隱狀態(tài)的多元線性模型參數(shù)的值,生成每一個觀測時間點的觀測向量。然后利用所有的觀測變量集合,根據(jù)所推導(dǎo)的后驗分布,用MCMC算法對模型的參數(shù)進(jìn)行后驗?zāi)M。取后驗均值作為模型中參數(shù)的估計值。最后將參數(shù)的貝葉斯估計結(jié)果與事先給定的真實值進(jìn)行比較,觀察估計的效果。

    取隱狀態(tài)的個數(shù)K=2,則隱狀態(tài)的概率轉(zhuǎn)移矩陣是一個二階方陣,令:

    設(shè)每個隱狀態(tài)下的多元線性回歸模型都有3個自變量,具體為:

    模型中,取觀測時間點總數(shù)T=200,則生成的觀測變量集合是一個4×200的二維數(shù)組。先驗分布中超參數(shù)的取值分別為:,其中I3表示三階單位矩陣

    使用MCMC算法進(jìn)行后驗?zāi)M時,取迭代總次數(shù)為5000,去掉前面3000次的迭代結(jié)果,用后面2000次的后驗均值作為參數(shù)的估計。各參數(shù)的真實值與估計值如表1所示。

    表1 模型參數(shù)的真值與估計值

    6 結(jié)論

    本文介紹了隱馬爾可夫線性回歸模型,推導(dǎo)了隱馬爾可夫多元線性回歸模型參數(shù)的貝葉斯估計方法。并且通過實證模擬,將模型參數(shù)的貝葉斯估計結(jié)果與事先設(shè)定的模型參數(shù)的真實值進(jìn)行比較,發(fā)現(xiàn)估計效果良好,這說明本文給出的模型參數(shù)的貝葉斯估計方法是可靠的??梢杂秒[馬爾可夫多元線性回歸模型來研究含有多個狀態(tài)的自變量與因變量的關(guān)系模型,分析不同狀態(tài)之間的轉(zhuǎn)化關(guān)系,以及每個狀態(tài)下多個自變量與因變量之間的線性回歸關(guān)系。

    本文僅以簡單的多元線性回歸模型為例介紹了隱馬爾可夫線性回歸模型,未來還可以研究隱馬爾可夫非線性回歸模型等更復(fù)雜的模型。此外,還可以研究隱狀態(tài)個數(shù)未知情形下的隱馬爾可夫回歸模型,利用貝葉斯因子、可逆跳躍MCMC算法等方法對隱狀態(tài)個數(shù)進(jìn)行模型選擇。

    猜你喜歡
    馬爾可夫后驗先驗
    基于對偶理論的橢圓變分不等式的后驗誤差分析(英)
    基于無噪圖像塊先驗的MRI低秩分解去噪算法研究
    貝葉斯統(tǒng)計中單參數(shù)后驗分布的精確計算方法
    基于自適應(yīng)塊組割先驗的噪聲圖像超分辨率重建
    一種基于最大后驗框架的聚類分析多基線干涉SAR高度重建算法
    保費隨機(jī)且?guī)в屑t利支付的復(fù)合馬爾可夫二項模型
    基于平滑先驗法的被動聲信號趨勢項消除
    基于SOP的核電廠操縱員監(jiān)視過程馬爾可夫模型
    先驗的廢話與功能的進(jìn)路
    應(yīng)用馬爾可夫鏈對品牌手機(jī)市場占有率進(jìn)行預(yù)測
    巴中市| 南召县| 扶沟县| 屏东县| 灵寿县| 天水市| 乌拉特中旗| 昌都县| 博兴县| 织金县| 辛集市| 甘谷县| 博野县| 鹰潭市| 河池市| 宽甸| 海淀区| 策勒县| 本溪市| 德保县| 揭阳市| 绿春县| 内丘县| 富宁县| 定边县| 渭南市| 哈密市| 纳雍县| 肥乡县| 当阳市| 无为县| 甘南县| 榆社县| 富顺县| 昌乐县| 都江堰市| 北宁市| 徐汇区| 曲靖市| 靖西县| 临西县|