楊佳鵬 俎毓偉 潘旭陽
摘要:上市公司的經(jīng)營狀況和市場的認(rèn)可度可以由上市公司的股價變化直接反映。由于股價既有趨勢因素又有隨機(jī)因素,使股票價格的建模和預(yù)測始終是一個棘手的問題。根據(jù)股價變化的特點,可知股票市場是一個非常典型的非線性復(fù)雜系統(tǒng),可以用混沌理論來建立股票價格模型。同時我們選取了三只股票來進(jìn)行建模先利用股價波動是介于隨機(jī)和確定性之間的混沌現(xiàn)象這一原理對數(shù)據(jù)進(jìn)行平穩(wěn)性分析,對于能否對股票進(jìn)行預(yù)測,需要依靠這個時間序列模型是否具有“慣性”,能夠更加直觀地對這三只股票進(jìn)行數(shù)據(jù)分析。最后結(jié)果得出這三只股票可以預(yù)測的結(jié)論。進(jìn)一步基于混沌理論,結(jié)合三只股票的日序列進(jìn)行參數(shù)計算和實證分析建立股價趨勢和隨機(jī)性的數(shù)學(xué)模型。并且利用python對這三只股票進(jìn)行建立ARIMA混沌模型。最后預(yù)測出每只股票最近20天的股價。
關(guān)鍵詞:混沌模型;非線性;PYTHON;ARIMA;機(jī)器學(xué)習(xí)
1背景介紹
隨著經(jīng)濟(jì)的發(fā)展,越來越多的上市公司涌現(xiàn)出來,而上市公司的經(jīng)營狀況和市場的認(rèn)可度可以由上市公司的股價變化直接反映。但是,由于股價既有趨勢因素又有隨機(jī)因素,使股票價格的建模和預(yù)測始終是一個棘手的問題。根據(jù)股價變化的特點,股票市場是一個非常典型的非線性復(fù)雜系統(tǒng)就變得顯而易見。股票具有很強(qiáng)的隨機(jī)性,就是因為各種因素的干擾。在一個較短的時間里,股票的變化具有非常豐富的結(jié)構(gòu),有很強(qiáng)的規(guī)律性,是一種介于隨機(jī)性和確定性之間的現(xiàn)象,這就是股票中的混沌現(xiàn)象。
2模型的建立與求解
2.1股票數(shù)據(jù)分析
數(shù)據(jù)是千奇百怪的,只有數(shù)據(jù)有規(guī)律可循,我們才可以對數(shù)據(jù)進(jìn)行預(yù)測,而對于一個時間序列來說,如果這個時間序列數(shù)據(jù)具有一種“慣性”,這種“慣性”能夠讓我們利用短期時間的歷史值預(yù)測當(dāng)前值,那么我們就稱作這個時間序列數(shù)據(jù)具有平穩(wěn)性。首先我們在上面的數(shù)據(jù)分析中已經(jīng)對三只股票的每日,每周和每月進(jìn)行了分析,也已經(jīng)知道了600519這只股票不夠平穩(wěn)且波動較大,而其他的兩只股票較為平緩,那么如果我們想要預(yù)測不平穩(wěn)的股票,我們就需要讓這只股票變“平穩(wěn)”,所以我們采取對數(shù)據(jù)進(jìn)行一階差分。從以上的圖中對比我們都能很明顯的看出600519這只股票的波動性很大,不易預(yù)測,具有很強(qiáng)的隨機(jī)性,然而其它兩只的股票較為穩(wěn)定。與此同時,這三只股票整體上都呈現(xiàn)出上升的趨勢。我們可以在一階差分的定義中很明顯地發(fā)現(xiàn)一階差分就是離散函數(shù)中連續(xù)相鄰兩項之差,體現(xiàn)的一個前后兩個數(shù)據(jù)的聯(lián)系。000400和002281兩只股票波動較小已經(jīng)很平穩(wěn)了,600519這只股票整體上波動較大,但是在每一個時間短內(nèi),波動較小,也就是說我們想要預(yù)測當(dāng)前值,我們不需要2018年之前的數(shù)據(jù)了,因為波動與2018年之后的不相符,而我們要預(yù)測的是2020年10月后的數(shù)據(jù),從2018年到2020年之間,整體波動較小,我們可以認(rèn)為2018年至現(xiàn)在是具有“慣性”的。綜上所述,這三只股票可以預(yù)測。
2.2模型的ARIMA構(gòu)建
在建立模型[6]之前我們已經(jīng)對時間序列進(jìn)行了預(yù)處理操作。時間序列的預(yù)處理包括兩個方面的檢驗,平穩(wěn)性檢驗和白噪聲檢驗。對數(shù)據(jù)的平穩(wěn)性進(jìn)行檢驗是時間序列分析的重要步驟,我們通過相關(guān)圖來檢驗時間序列的平穩(wěn)性。自相關(guān)圖即自相關(guān)和偏自相關(guān)函數(shù)圖相對復(fù)雜但是結(jié)果更加準(zhǔn)確。本文先用時序圖進(jìn)行直觀的判斷再利用相關(guān)圖進(jìn)行更進(jìn)一步的檢驗。對于非平穩(wěn)時間序列中若存在增長或下降趨勢,則需要進(jìn)行差分處理然后進(jìn)行平穩(wěn)性檢驗直至平穩(wěn)為止。其中,差分的次數(shù)就是模型ARIMA(p,d,q)的階數(shù),理論上說,差分的次數(shù)越多,對時序信息的非平穩(wěn)確定性信息的提取越充分,但是從理論上說,差分的次數(shù)并非越多越好,每一次差分運算,都會造成信息的損失,所以應(yīng)當(dāng)避免過分的差分,一般在應(yīng)用中,差分的階數(shù)不超過2。在進(jìn)行股價的一階差分后,我們利用ACF圖和PACF圖進(jìn)行對p和d的判斷[7],如下表1所示。
3測試模型
模型的參數(shù)已經(jīng)通過ACF和PACF進(jìn)行了判斷,接下來我們開始利用模型去預(yù)測,最終結(jié)果,如圖1、圖2、圖3所示。
以上的三張圖中,藍(lán)色代表的是預(yù)測最近20天的股價曲線,橙色是當(dāng)天對應(yīng)的股價真實值,我們通過觀察可以分析出預(yù)測值很好的體現(xiàn)了未來的股價趨勢,同時當(dāng)預(yù)測曲線出現(xiàn)折點時,真實值也會相應(yīng)的出現(xiàn)轉(zhuǎn)折點,不過不能很好的預(yù)測上下浮動的程度。
4結(jié)論
我們對三只股票進(jìn)行數(shù)據(jù)分析后,能夠清楚的了解到三只股票在不同周期具有豐富的層次結(jié)構(gòu),并且具有很強(qiáng)的隨機(jī)性。在進(jìn)行一階差分之后,三只股票的時間序列數(shù)據(jù)整體更加平緩,最后在建立ARIMA模型之前,我們需要對這三只股票進(jìn)行參數(shù)的選擇,通過ACF和PACF選擇相對性的自回歸項和移動平均項,最后調(diào)用參數(shù),開始預(yù)測,從而得到了最近20天的預(yù)測結(jié)果。綜上所述,在進(jìn)行了一系列的分析和模型的建立與求解之后,我們對非線性的時間序列進(jìn)行預(yù)測的模型有了進(jìn)一步的了解,同時對混沌模型和混沌理論有了深刻的認(rèn)識,并通過實踐去分析和解決了以上的兩個問題。
參考文獻(xiàn):
[1]Python金融量化.使用Python對股價的HeikinAshi蠟燭圖進(jìn)行可視化.CSDN,2019-10-01.
[2]于仁業(yè).一階差分.中航工業(yè)哈爾濱飛機(jī)工業(yè)集團(tuán)有限責(zé)任公司,2020-09-29.
[3]趙云.中國股市的非線性動力學(xué)特征與可預(yù)測性研究[D].燕山大學(xué),2019.