• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    時(shí)間序列平穩(wěn)性分類識(shí)別研究

    2016-08-01 06:13:07管河山鄒清明羅智超
    統(tǒng)計(jì)與信息論壇 2016年4期
    關(guān)鍵詞:時(shí)間序列平穩(wěn)性特征提取

    管河山 ,鄒清明 ,羅智超

    (1.南華大學(xué) 經(jīng)濟(jì)管理學(xué)院,湖南 衡陽(yáng)421001;2.廈門大學(xué) 王亞南經(jīng)濟(jì)研究院,福建 廈門361005)

    ?

    時(shí)間序列平穩(wěn)性分類識(shí)別研究

    管河山1,鄒清明1,羅智超2

    (1.南華大學(xué) 經(jīng)濟(jì)管理學(xué)院,湖南 衡陽(yáng)421001;2.廈門大學(xué) 王亞南經(jīng)濟(jì)研究院,福建 廈門361005)

    摘要:平穩(wěn)性檢驗(yàn)是時(shí)間序列回歸分析的一個(gè)關(guān)鍵問題,已有的檢驗(yàn)方法在處理海量時(shí)間序列數(shù)據(jù)時(shí)顯得乏力,檢驗(yàn)準(zhǔn)確率有待提高。采用分類技術(shù)建立平穩(wěn)性檢驗(yàn)的新方法,可以有效地處理海量時(shí)間序列數(shù)據(jù)。首先計(jì)算時(shí)間序列自相關(guān)函數(shù),構(gòu)建一個(gè)充分非必要的判定準(zhǔn)則;然后建立序列收斂的量化分析方法,研究收斂參數(shù)的最優(yōu)取值,并提取平穩(wěn)性特征向量;最后采用k-means聚類建立平穩(wěn)性分類識(shí)別方法。采用一組模擬數(shù)據(jù)和股票數(shù)據(jù)進(jìn)行分析,將ADF檢驗(yàn)、PP檢驗(yàn)、KPSS檢驗(yàn)進(jìn)行對(duì)比,實(shí)證結(jié)果表明新方法的準(zhǔn)確率較高。

    關(guān)鍵詞:時(shí)間序列;平穩(wěn)性;特征提?。环诸?/p>

    一、引 言

    時(shí)間序列是一類典型的隨機(jī)數(shù)據(jù),基于隨機(jī)變量的歷史和現(xiàn)狀推測(cè)其未來需要假設(shè)隨機(jī)變量的歷史和現(xiàn)狀具有代表性或可延續(xù)性,樣本時(shí)間序列展現(xiàn)了隨機(jī)變量的歷史和現(xiàn)狀;隨機(jī)變量基本形態(tài)維持不變也就是要求樣本數(shù)據(jù)的本質(zhì)特征仍能延續(xù)到未來,稱這些統(tǒng)計(jì)量(均值、方差、協(xié)方差)的取值在未來仍能保持不變的樣本時(shí)間序列具有平穩(wěn)性[1]668-685。平穩(wěn)性分析是時(shí)間序列回歸分析中的共性問題,是經(jīng)典回歸分析賴以實(shí)施的基本假設(shè);如果數(shù)據(jù)非平穩(wěn),則作為大樣本下統(tǒng)計(jì)推斷基礎(chǔ)的“一致性”要求便被破壞,基于非平穩(wěn)時(shí)間序列的預(yù)測(cè)也就失效。已有的平穩(wěn)性檢驗(yàn)方法可以歸納為主觀分析方法和客觀分析方法兩大類。

    主觀分析方法包括時(shí)間路徑圖法、自相關(guān)函數(shù)、偏自相關(guān)函數(shù)、逆自相關(guān)函數(shù)等各種圖形分析方法[2],這類方法的主觀判定性較強(qiáng),可用于平穩(wěn)性的粗略判定。以自相關(guān)函數(shù)分析為例,如果時(shí)間序列的自相關(guān)函數(shù)迅速收斂到0,則判定為平穩(wěn)的,反之,則判定為非平穩(wěn)的[1]668-685。然而,快速收斂到0是一種主觀的判定方式,不但收斂參數(shù)選取困難(尚缺少一個(gè)“經(jīng)驗(yàn)取值”),而且“快速收斂”缺乏量化分析的依據(jù),研究者通常是根據(jù)自相關(guān)函數(shù)收斂情況進(jìn)行主觀判斷。在面臨海量的時(shí)間序列數(shù)據(jù)時(shí),如果采取這種方法進(jìn)行逐個(gè)分析,其工作量是十分巨大的,而且這種主觀判定的結(jié)果因人而異,難以得到一致的判定結(jié)果。因此,在平穩(wěn)性檢驗(yàn)的實(shí)踐中,這類主觀分析方法一般僅用于分析小批量的數(shù)據(jù),且只能得到一個(gè)粗略的判定結(jié)果。

    客觀分析方法包括單位根檢驗(yàn)(DF檢驗(yàn)和ADF檢驗(yàn))、PP檢驗(yàn)和KPSS檢驗(yàn) 、LLC檢驗(yàn)、Block Bookstrap檢驗(yàn)、LR檢驗(yàn) 和Perron檢驗(yàn)等方法[3-11]。這些研究本質(zhì)上是采用了統(tǒng)計(jì)分布的概念,因其完善的理論體系、較高的準(zhǔn)確率以及客觀的分析方式,此類方法得到了廣泛的應(yīng)用,成為現(xiàn)有平穩(wěn)性檢驗(yàn)實(shí)踐中的主流方法。以DF檢驗(yàn)方法為例,編譯相關(guān)的宏變量(循環(huán)語(yǔ)句),DF檢驗(yàn)方法是可以處理海量的時(shí)間序列數(shù)據(jù),這種借助統(tǒng)計(jì)分布和臨界表的判定方式,其本質(zhì)是給出統(tǒng)計(jì)意義上的某種近似結(jié)果;DF檢驗(yàn)檢驗(yàn)時(shí)需要對(duì)三種模型(均值項(xiàng)、趨勢(shì)項(xiàng)的選取)進(jìn)行綜合判定分析,其分析的結(jié)果帶有一定的經(jīng)驗(yàn)性。因此,在平穩(wěn)性檢驗(yàn)的實(shí)踐中,這類客觀分析方法的準(zhǔn)確率仍值得探究。劉田從樣本長(zhǎng)度的視角分析了單位根檢驗(yàn)方法的準(zhǔn)確性,發(fā)現(xiàn)單位根檢驗(yàn)方法對(duì)模擬數(shù)據(jù)(基于AR模型的分析)的檢驗(yàn)準(zhǔn)確率有較大的差異[12]。本文實(shí)證也表明這些客觀檢驗(yàn)方法的準(zhǔn)確性仍不夠理想。

    隨著計(jì)算機(jī)技術(shù)的發(fā)展和數(shù)據(jù)采集能力的提升,金融、經(jīng)濟(jì)、醫(yī)學(xué)、工程監(jiān)控等領(lǐng)域的大量時(shí)間序列數(shù)據(jù)被收集,給時(shí)間序列研究提供了豐富的數(shù)據(jù)資源和廣闊的應(yīng)用空間。如何實(shí)現(xiàn)海量時(shí)間序列數(shù)據(jù)的平穩(wěn)性分析是一件值得挑戰(zhàn)的工作。本文主要是針對(duì)海量時(shí)間序列數(shù)據(jù)(時(shí)間長(zhǎng)度大于500)的平穩(wěn)性分析展開,在自相關(guān)函數(shù)分析的基礎(chǔ)上,借助數(shù)據(jù)挖掘中的分類技術(shù),構(gòu)建平穩(wěn)性檢驗(yàn)的新方法。新方法不是對(duì)自相關(guān)函數(shù)的簡(jiǎn)單改良,而是通過引進(jìn)分類技術(shù)(無監(jiān)督的分類技術(shù))為平穩(wěn)性檢驗(yàn)提供一個(gè)全新的檢驗(yàn)方式,突破傳統(tǒng)檢驗(yàn)方法對(duì)統(tǒng)計(jì)分布和臨界表的依賴,為海量時(shí)間序列數(shù)據(jù)的平穩(wěn)性檢驗(yàn)提供一種新的途徑。

    二、平穩(wěn)性分類識(shí)別

    平穩(wěn)性檢驗(yàn)方法的研究?jī)?nèi)容主要包括平穩(wěn)性特征提取和檢驗(yàn)方式兩大部分。比如,主觀分析方法中的自相關(guān)函數(shù)是提取自相關(guān)函數(shù)序列作為平穩(wěn)性特征,并根據(jù)其收斂程度來進(jìn)行判定(檢驗(yàn)方式);客觀分析方法中的DF檢驗(yàn)是構(gòu)建DF檢驗(yàn)統(tǒng)計(jì)量作為平穩(wěn)性特征,并根據(jù)臨界表來進(jìn)行判定(檢驗(yàn)方式)。因此,要解決時(shí)間序列平穩(wěn)性檢驗(yàn)問題,需要在平穩(wěn)性特征提取和檢驗(yàn)方式上進(jìn)行深入研究,這正是本研究的出發(fā)點(diǎn)。

    (一)平穩(wěn)性特征提取

    (1)

    (2)

    (3)

    從表面上看,式(3)只是做了簡(jiǎn)單的反余弦轉(zhuǎn)換,但實(shí)際上與后文的平穩(wěn)性分類密切相關(guān)的。進(jìn)行非線性轉(zhuǎn)換主要原因有兩方面:一方面,轉(zhuǎn)換可以放大時(shí)間序列樣本平穩(wěn)性特征之間的差異,自相關(guān)函數(shù)的取值區(qū)間為[-1,1],經(jīng)過反余弦函數(shù)轉(zhuǎn)換,θm的取值區(qū)間為[0,π],這表明,通過反余弦函數(shù)的轉(zhuǎn)換,可以放大平穩(wěn)性的特征,而這一過程,也是一個(gè)等價(jià)的非線性轉(zhuǎn)換過程,這有利于下一步的平穩(wěn)性分類(類屬性不同的樣本之間的差異越明顯,越有利于提高分類的準(zhǔn)確率);另一方面,轉(zhuǎn)換后,序列θ收斂是自相關(guān)函數(shù)序列收斂的“充分非必要”條件,因此,判定準(zhǔn)則將更加高效。具體證明如下:

    |θm-θm-1|

    平穩(wěn)性判定的新準(zhǔn)則:對(duì)任意一個(gè)時(shí)間序列樣本,計(jì)算其特征向量θ;如果向量元素θm快速收斂到0,則可以判定該樣本是平穩(wěn)的;反之,則判定該樣本是非平穩(wěn)的。

    得到的新準(zhǔn)則仍然是一種主觀的判定方式,尚無法對(duì)海量數(shù)據(jù)進(jìn)行處理,因此需要對(duì)判定準(zhǔn)則展開量化分析和計(jì)算。下面從收斂參數(shù)的確定和特征空間的構(gòu)建兩個(gè)角度展開探討。

    2.序列收斂參數(shù)的確定。無論是傳統(tǒng)的自相關(guān)函數(shù)分析方法,還是本文所提出的新準(zhǔn)則,都是從分析序列收斂狀態(tài)來判定時(shí)間序列的平穩(wěn)性特征,此時(shí)參數(shù)m的確定仍缺少一個(gè)客觀的方式。傳統(tǒng)的自相關(guān)函數(shù)分析淡化了序列收斂的客觀判定方式,這使得判斷仍停留在主觀判定的層面。

    根據(jù)數(shù)列收斂的定義可知,如果向量元素θm快速收斂到0,則給定的閾值ε1和ε2(正數(shù)),則存在一個(gè)正整數(shù)N,對(duì)所有的正整數(shù)m≥N,應(yīng)滿足式(4)。對(duì)平穩(wěn)時(shí)間序列而言,元素θm將快速收斂到0,容易滿足式(4);對(duì)非平穩(wěn)時(shí)間序列而言,將趨向于不滿足式(4)。因此,可以對(duì)平穩(wěn)性特征向量θ的收斂狀況進(jìn)行分析,探討滿足式(4)的樣本所占百分比,進(jìn)一步給出參數(shù)m的最優(yōu)經(jīng)驗(yàn)取值。

    (4)

    r=max (r1-r2)

    (5)

    采用大量的模擬數(shù)據(jù)進(jìn)行實(shí)驗(yàn)(見表3和表4,采取時(shí)間長(zhǎng)度為500、600、700、800、900、1 000六種模擬數(shù)據(jù)進(jìn)行分析,每種時(shí)間長(zhǎng)度取值、每個(gè)模型都模擬生成1 000個(gè)樣本)。閾值ε1和ε2取值越大,則滿足式(4)的樣本所占百分比越多,但是考慮到“快速收斂”的原則,本文將對(duì)0.1、0.2和0.3三種取值進(jìn)行分析,分別統(tǒng)計(jì)出滿足式(4)的平穩(wěn)樣本比(r1)和非平穩(wěn)樣本比(r2),并計(jì)算兩者之差,如式(5)所示。求得差值最大時(shí)參數(shù)m的取值,計(jì)算結(jié)果如表1所示。

    表1 參數(shù)m的經(jīng)驗(yàn)取值

    由表1可知,當(dāng)給定的收斂閾值較大時(shí),平穩(wěn)時(shí)間序列將容易滿足式(4),此時(shí)r1取值較大,參數(shù)m取值較?。环粗?,r1值較小,參數(shù)m取值較大。從表1和式(4)分析,當(dāng)收斂閾值取值為0.1時(shí),對(duì)“收斂到0”特征的滿足程度較高,而且平穩(wěn)樣本滿足收斂的百分比為0.874 58,r取值為0.862 95,均大于85%;相反,當(dāng)收斂閾值為0.2和0.3時(shí),盡管平穩(wěn)樣本滿足收斂的百分比超過95%,然而此時(shí)“收斂到0”特征的滿足程度卻較低。因此,一方面考慮到“收斂到0”的特征要求,另一方面使得兩類樣本滿足收斂條件的樣本百分比之差(r)最大化的原則,將收斂參數(shù)m的最優(yōu)經(jīng)驗(yàn)值定為m0=37。實(shí)驗(yàn)時(shí),為了分析收斂參數(shù)m對(duì)實(shí)驗(yàn)結(jié)果的影響,對(duì)三種收斂閾值下的最優(yōu)取值都進(jìn)行了分析。在此,給出了某種收斂程度下的經(jīng)驗(yàn)值分析,而采用經(jīng)驗(yàn)值分析也是研究中常用的方式,這將為下一步的平穩(wěn)性分類識(shí)別做好鋪墊。

    3.平穩(wěn)性特征空間的構(gòu)建。從上述分析可知,本文研究得到參數(shù)m的最優(yōu)經(jīng)驗(yàn)取值m0,此時(shí),每個(gè)時(shí)間序列將可以提取相應(yīng)的特征向量θ={θ1,θ2,…,θm0}。值得指出的是,采取自相關(guān)函數(shù)對(duì)平穩(wěn)性進(jìn)行主觀判定時(shí),側(cè)重于“快速收斂到0”的探討,淡化了“元素θm正負(fù)取值”的影響,因此將對(duì)特征向量θ取絕對(duì)值轉(zhuǎn)換,具體如下:

    (6)

    (二)時(shí)間序列平穩(wěn)性分類識(shí)別

    分類技術(shù)是數(shù)據(jù)挖掘研究中的一個(gè)重要內(nèi)容,聚類分析是研究樣品(或指標(biāo))分類問題的一種統(tǒng)計(jì)分析方法。分類研究主要包括三個(gè)部分:一是樣本數(shù)據(jù)的特征提取,二是相似性度量函數(shù)的構(gòu)建,三是分類的算法。這些研究中,前兩者的研究居多,而分類算法大部分都是采用分類(有監(jiān)督的分類)和聚類(無監(jiān)督的分類)兩大方式。本文采用聚類技術(shù)來探討時(shí)間序列的平穩(wěn)性檢驗(yàn),以求建立一種客觀的平穩(wěn)性判定方式。

    (三)平穩(wěn)性分析方法的對(duì)比

    本文提出的平穩(wěn)性分類識(shí)別(SCI)方法,是在傳統(tǒng)的自相關(guān)函數(shù)(ACF)分析方法基礎(chǔ)上進(jìn)行改進(jìn)的,記為SCI-ACF方法。它通過等價(jià)轉(zhuǎn)換提出了序列收斂判定的充分條件,并在此基礎(chǔ)上研究收斂參數(shù)的最優(yōu)取值,然后采用分類技術(shù)建立一種新的檢驗(yàn)方式,使之能處理海量數(shù)據(jù)。兩者之間的關(guān)系如表2所示。

    表2 方法的對(duì)比分析表

    三、 實(shí)驗(yàn)結(jié)果及分析

    本文將采用模擬數(shù)據(jù)和股票數(shù)據(jù)進(jìn)行分析。傳統(tǒng)的自相關(guān)函數(shù)無法處理海量時(shí)間序列數(shù)據(jù),ADF檢驗(yàn)、KPSS檢驗(yàn)和PP檢驗(yàn)方法可以通過編譯宏變量,實(shí)現(xiàn)對(duì)海量時(shí)間序列數(shù)據(jù)的平穩(wěn)性判定,本文采用這三種方法進(jìn)行對(duì)比實(shí)驗(yàn)。其他的檢驗(yàn)方法大多是針對(duì)特定的數(shù)據(jù)類型展開分析的,在此不做過多分析。實(shí)驗(yàn)采用了SAS軟件(SCI-ACF方法)和MATLAB軟件(ADF檢驗(yàn)、KPSS檢驗(yàn)和PP檢驗(yàn))進(jìn)行編程處理。

    (一)仿真數(shù)據(jù)分析

    1.仿真實(shí)驗(yàn)數(shù)據(jù)。生成6組非平穩(wěn)時(shí)間序列數(shù)據(jù)和6組平穩(wěn)時(shí)間序列數(shù)據(jù)進(jìn)行實(shí)驗(yàn)分析[2,15]。在模型參數(shù)的選擇上,盡量使得生成的時(shí)間序列樣本難以區(qū)分,即難以判定時(shí)間序列的平穩(wěn)性與非平穩(wěn)性。具體模擬生成函數(shù)如表3、表4所示:

    表3 模擬非平穩(wěn)時(shí)間序列

    表4 模擬平穩(wěn)時(shí)間序列

    其中,et為服從標(biāo)準(zhǔn)正態(tài)分布的偽隨機(jī)函數(shù)。模擬數(shù)據(jù)的時(shí)間長(zhǎng)度分別取500、600、700、800、900、1 000和1 500,每組模擬時(shí)間序列各生成1 000個(gè)時(shí)間序列樣本,模擬共計(jì)生成8.4萬個(gè)時(shí)間序列樣本。

    2.實(shí)驗(yàn)結(jié)果及分析。第一,采用ADF方法進(jìn)行檢驗(yàn),統(tǒng)計(jì)檢驗(yàn)準(zhǔn)確率如表5所示(計(jì)算結(jié)果保留1位小數(shù)點(diǎn))。從表5可看出,對(duì)7種時(shí)間長(zhǎng)度的時(shí)間序列數(shù)據(jù)而言,ADF檢驗(yàn)方法的準(zhǔn)確率都在97%以上,但都低于98%,這一實(shí)驗(yàn)結(jié)果說明ADF方法長(zhǎng)期以來成為平穩(wěn)性檢驗(yàn)主流方法的原因。另外,由表5可知,PP檢驗(yàn)的準(zhǔn)確率超過97%,檢驗(yàn)準(zhǔn)確率比較高,KPSS檢驗(yàn)的準(zhǔn)確率低于70%。綜上所述,在三種傳統(tǒng)的檢驗(yàn)方法中,ADF檢驗(yàn)呈現(xiàn)出較好的性能。

    表5 檢驗(yàn)準(zhǔn)確率(單位:%)

    第二,采用平穩(wěn)性分類識(shí)別方法(SCI-ACF)進(jìn)行分析,統(tǒng)計(jì)得到平穩(wěn)性檢驗(yàn)的準(zhǔn)確率,如表5所示。從表5容易看出:對(duì)7種時(shí)間長(zhǎng)度的時(shí)間序列數(shù)據(jù)而言,平穩(wěn)性分類識(shí)別方法得到的準(zhǔn)確率較高,明顯高于ADF檢驗(yàn)、PP檢驗(yàn)和KPSS檢驗(yàn)三種方法的準(zhǔn)確率;當(dāng)序列時(shí)間長(zhǎng)度較大時(shí)(大于600時(shí)),平穩(wěn)性分類識(shí)別方法的準(zhǔn)確率都超過了99%。進(jìn)一步,考慮到最優(yōu)參數(shù)m的選取是跟收斂閾值相關(guān)的,本文對(duì)其他兩種收斂閾值所對(duì)應(yīng)的最優(yōu)收斂參數(shù)也進(jìn)行了分析。分別統(tǒng)計(jì)出m0等于22、29和37時(shí)平穩(wěn)性分類識(shí)別方法的準(zhǔn)確率結(jié)果,記為C22、C29和C37,并與ADF檢驗(yàn)方法的準(zhǔn)確率進(jìn)行對(duì)比,如圖1。顯然,三種收斂閾值所對(duì)應(yīng)的最優(yōu)參數(shù)m0,其分析的準(zhǔn)確率都優(yōu)于ADF檢驗(yàn)方法,因此從仿真實(shí)驗(yàn)結(jié)果來看,平穩(wěn)性分類識(shí)別的準(zhǔn)確率較高。

    圖1 平穩(wěn)性分類識(shí)別與ADF的對(duì)比分析圖

    第三,對(duì)模擬數(shù)據(jù)采用自相關(guān)函數(shù)方法進(jìn)行分析,其主觀分析的工作量十分巨大。假定繪制一個(gè)時(shí)間序列樣本的自相關(guān)函數(shù)圖形,并進(jìn)行主觀判定的時(shí)間為1分鐘,則8.4萬個(gè)樣本分析,共需要1 400個(gè)小時(shí),而且判定的結(jié)果將隨個(gè)人差異而有所不同,因此本文不做詳細(xì)探究。

    (二)股票數(shù)據(jù)分析

    1.股票數(shù)據(jù)。選擇中國(guó)上證交易所股票的日價(jià)格數(shù)據(jù)(收盤價(jià))和日收益率數(shù)據(jù)(考慮分紅的日收益率),數(shù)據(jù)來自CSMAR數(shù)據(jù)庫(kù),時(shí)間取樣長(zhǎng)度為1 000(2009/7/6-2013/9/5),剔除數(shù)據(jù)不完整的股票樣本,選取100個(gè)股票數(shù)據(jù)(價(jià)格數(shù)據(jù)和收益率數(shù)據(jù)分別100個(gè)),共計(jì)200個(gè)樣本用于分析。

    2.實(shí)驗(yàn)結(jié)果及分析。基于仿真實(shí)驗(yàn)的準(zhǔn)確率分析結(jié)果,選取準(zhǔn)確率較高的兩種方法(ADF檢驗(yàn)和平穩(wěn)性分類識(shí)別方法)進(jìn)行分析,統(tǒng)計(jì)出兩種方法的檢驗(yàn)結(jié)果,如表6所示。由表6可以看出:ADF檢驗(yàn)方法將91個(gè)價(jià)格數(shù)據(jù)判定為非平穩(wěn)的,而將其中9個(gè)價(jià)格數(shù)據(jù)判定為平穩(wěn)的,SCI-ACF方法將全部?jī)r(jià)格數(shù)據(jù)判定為非平穩(wěn)的;ADF檢驗(yàn)將100個(gè)收益率數(shù)據(jù)判定為平穩(wěn)的,SCI-ACF方法也將100個(gè)收益率數(shù)據(jù)判定為平穩(wěn)的。這表明,中國(guó)上證市場(chǎng)的股票日價(jià)格數(shù)據(jù)呈現(xiàn)出明顯的非平穩(wěn)性特征,而收益率數(shù)據(jù)呈現(xiàn)出明顯的平穩(wěn)性特征。

    表6 股票數(shù)據(jù)的平穩(wěn)性檢驗(yàn)結(jié)果表

    由于股票數(shù)據(jù)的平穩(wěn)性特征事先是未知的,因此無法統(tǒng)計(jì)平穩(wěn)性檢驗(yàn)的準(zhǔn)確率,在此有必要借助圖形進(jìn)行主觀分析。繪制兩種方法檢驗(yàn)結(jié)果不一致的9個(gè)股票樣本的圖形,分別編號(hào)為S1~S9,如圖2所示。不難發(fā)現(xiàn),9個(gè)股票樣本數(shù)據(jù)呈現(xiàn)出比較明顯的遞增(或遞減)趨勢(shì),而非水平波動(dòng)。因此,樣本判定為非平穩(wěn)是比較合理的,這表明SCI-ACF方法的檢驗(yàn)結(jié)果是比較合理的。

    圖2 股票數(shù)據(jù)的走勢(shì)圖

    四、結(jié)論

    本文針對(duì)海量時(shí)間序列數(shù)據(jù)(且時(shí)間長(zhǎng)度大于500)進(jìn)行平穩(wěn)性檢驗(yàn)研究,提出了平穩(wěn)性分類識(shí)別的新方法。主要研究工作有三個(gè)方面:第一,在提取自相關(guān)函數(shù)特征的基礎(chǔ)上,采用反余弦函數(shù)轉(zhuǎn)換放大時(shí)間序列樣本平穩(wěn)性特征之間的差異,得到平穩(wěn)性判定的一個(gè)“充分非必要條件”,形成一個(gè)新的判定準(zhǔn)則;第二,重點(diǎn)探究序列快速收斂到0的量化分析,給出了收斂參數(shù)m的確定方式,構(gòu)建出平穩(wěn)性特征空間,為量化分析和計(jì)算提供了依據(jù);第三,采用k-means聚類算法建立平穩(wěn)性模式分類和識(shí)別的方法。仿真實(shí)驗(yàn)表明新方法的準(zhǔn)確率比ADF方法提高大約1~2個(gè)百分點(diǎn)(盡管ADF方法準(zhǔn)確率已經(jīng)比較理想)。本文提出的平穩(wěn)性檢驗(yàn)的新方法,拓展了時(shí)間序列數(shù)據(jù)挖掘技術(shù)在平穩(wěn)性檢驗(yàn)中的應(yīng)用研究,也打破了傳統(tǒng)ADF檢驗(yàn)的“應(yīng)用壟斷”局面。

    本研究不是對(duì)自相關(guān)函數(shù)的簡(jiǎn)單改良,而是引進(jìn)數(shù)據(jù)挖掘中的分類技術(shù),建立了平穩(wěn)性分析的新模式,從平穩(wěn)性特征提取和檢驗(yàn)方式兩個(gè)角度同時(shí)展開探究,所建立的新方法可以有效處理海量時(shí)間序列數(shù)據(jù)。這種新的檢驗(yàn)方法突破了傳統(tǒng)檢驗(yàn)方法(ADF檢驗(yàn)、PP檢驗(yàn)和KPSS檢驗(yàn)等)對(duì)統(tǒng)計(jì)分布和臨界表的依賴。此外,本研究主要是針對(duì)時(shí)間長(zhǎng)度較大的時(shí)間序列數(shù)據(jù)展開,而對(duì)時(shí)間長(zhǎng)度較短的時(shí)間序列數(shù)據(jù),由于其樣本量較少,可能造成平穩(wěn)性特征不明顯,這使得平穩(wěn)性分析方法的性能偏差。對(duì)時(shí)間長(zhǎng)度較短的時(shí)間序列數(shù)據(jù)平穩(wěn)性檢驗(yàn)將是下一步研究的重點(diǎn)。

    參考文獻(xiàn):

    [1]J D Hamilton.Time Series Analysis[M].New Jersey:Princeton University Press,1994.

    [2]C Jorge,C Nuno,P Daniel.A Periodogram-based Metric for Time Series Classification[J].Computational Statistics &Data Analysis,2006,50(10).

    [3]D A Dickey.Estimation and Testing of Nonstationary Time Series[D].Ames:Iowa State University,1976.

    [4]D A Dickey,W A Fuller.Distribution of the Estimators for Autoregressive Time Series with a Unit Root[J],Journal of American Statistical Association,1979,74(366).

    [5]Westerlund Joakim.The Effect of Recursive Detrending on Panel Unit Root Tests[J].Journal of Econometrics,2015,185(2).

    [6]鄧露.最優(yōu)滯后長(zhǎng)度與ADF檢驗(yàn)性質(zhì)研究及其應(yīng)用[J].統(tǒng)計(jì)與信息論壇,2010,25(9).

    [7]周敏,藺富明.小樣本PP檢驗(yàn)統(tǒng)計(jì)量的分布特征[J].西南大學(xué)學(xué)報(bào),2015,37(5).

    [8]馮蕾,聶巧平.結(jié)構(gòu)突變對(duì)KPSS檢驗(yàn)水平與檢驗(yàn)功效的影響——基于有限樣本情形的模擬及實(shí)證研究,統(tǒng)計(jì)研究,2009,26(9).

    [9]Levin A,C F Lin,C S J Chu.Unit Root Tests in Panel Data :Asymptotic and Finite-sample Properties [J].Journal of Econometrics,2002,108(1).

    [10]張華節(jié),黎實(shí).面板數(shù)據(jù)單位根似然比檢驗(yàn)研究[J].統(tǒng)計(jì)研究,2015,32(4).

    [11]莫揚(yáng),張捷.帶結(jié)構(gòu)突變的確定趨勢(shì)的單位根檢驗(yàn)方法[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2012(2).

    [12]劉田.單位根檢驗(yàn)中樣本長(zhǎng)度的選擇[J].數(shù)理統(tǒng)計(jì)與管理,2013,32(4).

    [13]R C morim, B Mirkin,Minkowski Metric.Feature Weighting and Anomalous Cluster Initializing in K-Means Clustering[J].Pattern Recognition,2012,45 (3).

    [14]管河山,鄒清明,鄧靈斌.時(shí)間序列平穩(wěn)性分析的自動(dòng)機(jī)制研究[J].南華大學(xué)學(xué)報(bào),2010,11(3).

    (責(zé)任編輯:張愛婷)

    收稿日期:2015-11-18;修復(fù)日期:2015-12-10

    基金項(xiàng)目:教育部青年基金項(xiàng)目《海量金融時(shí)間序列數(shù)據(jù)平穩(wěn)性檢驗(yàn)方法研究》(13YJCZH044)

    作者簡(jiǎn)介:管河山,男,湖南衡陽(yáng)人,理學(xué)博士,副教授,研究方向:時(shí)間序列數(shù)據(jù)挖掘;

    中圖分類號(hào):O211.61∶F830.91

    文獻(xiàn)標(biāo)志碼:A

    文章編號(hào):1007-3116(2016)04-0003-06

    Study on Classification and Identification of Time Series Stationarity

    GUAN He-shan1,ZOU Qing-ming1,LUO Zhi-chao2

    (1.School of Economics and Management,University of South China,Hengyang 421001,China;2.Wang Yanan Institute for Studies in Economics,Xiamen University,Xiamen 361005,China)

    Abstract:Stationarity test is a key problem of time series regression analysis,existing methods of stationarity test can hardly deal with the massive data,the test accuracy needs to be improved.Based on the analysis of classification,this paper would build a new method for stationarity test,which could effectively deal with massive time series data.Firstly,it calculates the autocorrelation function and then construct a fully and non-necessary criterion; secondly,establish a kind of quantitative analysis of sequence convergence,the optimal value of the sequence convergent parameter is given out,and then take out the characteristic of stationarity; finally,the k-means clustering algorithm is used to establish stationarity classification and recognition method.This paper makes empirical analysis with a set of simulated data and a group of stock data,which results show that our method's accuracy is not only higher than that of the ADF test,and than that of KPSS test and PP test.

    Key words:time series; stationarity; feature extraction; classification

    鄒清明,男,湖南衡陽(yáng)人,經(jīng)濟(jì)學(xué)博士,副教授,研究方向:多元統(tǒng)計(jì);

    羅智超,男,福建廈門人,高級(jí)工程師,研究方向:計(jì)量經(jīng)濟(jì)。

    【統(tǒng)計(jì)理論與方法】

    猜你喜歡
    時(shí)間序列平穩(wěn)性特征提取
    基于非平穩(wěn)性度量的數(shù)字印章信息匹配
    基于遞歸量化分析的振動(dòng)信號(hào)非平穩(wěn)性評(píng)價(jià)
    基于Daubechies(dbN)的飛行器音頻特征提取
    電子制作(2018年19期)2018-11-14 02:37:08
    Bagging RCSP腦電特征提取算法
    高重合度齒輪傳動(dòng)的平穩(wěn)性分析及試驗(yàn)
    基于時(shí)間序列的我國(guó)人均GDP分析與預(yù)測(cè)
    商(2016年32期)2016-11-24 16:20:57
    基于線性散列索引的時(shí)間序列查詢方法研究
    軟件工程(2016年8期)2016-10-25 15:43:57
    基于組合模型的能源需求預(yù)測(cè)
    公眾預(yù)期與不良貸款
    商情(2016年11期)2016-04-15 20:25:31
    信貸資源配置與我國(guó)經(jīng)濟(jì)發(fā)展平穩(wěn)性
    八宿县| 凤翔县| 钟祥市| 安西县| 滨海县| 南陵县| 阿荣旗| 浦江县| 香格里拉县| 滁州市| 榆林市| 额尔古纳市| 双桥区| 图木舒克市| 永春县| 江津市| 和静县| 安吉县| 乐平市| 唐河县| 靖安县| 平阴县| 松溪县| 沭阳县| 梨树县| 扬中市| 阳城县| 宁武县| 体育| 库尔勒市| 门头沟区| 务川| 白城市| 横峰县| 双辽市| 宜州市| 德清县| 中西区| 集安市| 湘乡市| 河津市|