邢偉琛
摘 要:我國(guó)股票市場(chǎng)經(jīng)過(guò)30多年的發(fā)展,逐漸形成了一個(gè)龐大的股票信息數(shù)據(jù)庫(kù),隨著時(shí)間的積累,數(shù)據(jù)庫(kù)中包含了大量的股票數(shù)據(jù)信息。當(dāng)前,大數(shù)據(jù)應(yīng)用得到了蓬勃發(fā)展,大數(shù)據(jù)技術(shù)也得到了較廣泛的普及。為股票所產(chǎn)生的歷史數(shù)據(jù)進(jìn)行收集,整理,分析提供了便利,為通過(guò)探究歷史數(shù)據(jù)對(duì)股票未來(lái)價(jià)格預(yù)測(cè)提供了可能。本文通過(guò)對(duì)大量的股票歷史數(shù)據(jù)進(jìn)行分析,利用MATLAB軟件所帶的BP(back propagation)神經(jīng)網(wǎng)絡(luò)模型對(duì)股票數(shù)據(jù)進(jìn)行處理并分析。旨在為廣大的股票投資者提供更科學(xué)、更理性的建議。
關(guān)鍵詞:大數(shù)據(jù) ?股票 ?BP神經(jīng)網(wǎng)絡(luò)
中圖分類(lèi)號(hào):F830.9 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-0298(2020)02(a)--02
隨著股票市場(chǎng)的不斷發(fā)展,產(chǎn)生了大量的股票數(shù)據(jù)。但這些歷史數(shù)據(jù)往往被人們所忽略它們的價(jià)值或者在對(duì)歷史數(shù)據(jù)進(jìn)行分析的過(guò)程中,難以深層次的挖掘出真正的對(duì)人們有用的價(jià)值,信息的利用率較低。并且股票市場(chǎng)向來(lái)“陰晴不定”,股價(jià)的高低起伏很大,而股票的價(jià)格變化又與每一位股票投資者的切身利益有著密切的聯(lián)系。因此,要充分利用好大數(shù)據(jù)技術(shù)所帶來(lái)的優(yōu)勢(shì),結(jié)合神經(jīng)網(wǎng)絡(luò)算法,對(duì)股票的歷史數(shù)據(jù)進(jìn)行分析,盡可能有效地挖掘出隱藏在股票大量數(shù)據(jù)中的規(guī)律,找出股票的價(jià)格走勢(shì)。
1 大數(shù)據(jù)的相關(guān)概念及發(fā)展
當(dāng)前,信息技術(shù)和互聯(lián)網(wǎng)技術(shù)得到了快速的發(fā)展,大數(shù)據(jù)也應(yīng)運(yùn)而生。大數(shù)據(jù)是指在一定時(shí)間內(nèi),通過(guò)常規(guī)軟件或者是人工無(wú)法對(duì)涉及的規(guī)模巨大的數(shù)據(jù)量進(jìn)行截取、管理、處理,并整理成為人類(lèi)所能解讀的信息[1]。大數(shù)據(jù)概括來(lái)講具有以下五個(gè)基本特征,我們也常常稱(chēng)做“5V”:一是體量(Volume)大;二是速度(Velocity)快;三是多樣性(Variety);四是價(jià)值(Value)密度低;五是真實(shí)性(Veracity)。
近年來(lái),國(guó)家相繼出臺(tái)推動(dòng)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的相關(guān)政策,涉及與數(shù)據(jù)相關(guān)的各個(gè)領(lǐng)域,完善大數(shù)據(jù)人才培養(yǎng)模式,加快大數(shù)據(jù)人才培養(yǎng)速度與質(zhì)量。2016年“十三五規(guī)劃”中明確提出實(shí)施大數(shù)據(jù)戰(zhàn)略,把大數(shù)據(jù)資源作為戰(zhàn)略發(fā)展的基石,加快推動(dòng)數(shù)據(jù)資源的開(kāi)發(fā)和共享,推動(dòng)多項(xiàng)產(chǎn)業(yè)的轉(zhuǎn)型升級(jí)[2]。圖1為我國(guó)大數(shù)據(jù)產(chǎn)業(yè)市場(chǎng)規(guī)模圖[3]。
2 我國(guó)股票市場(chǎng)的發(fā)展現(xiàn)狀
我國(guó)股票市場(chǎng)從1989年開(kāi)始試運(yùn)行,經(jīng)過(guò)30多年的發(fā)展,經(jīng)歷了從無(wú)到有,從少到多的重大跨越。起初,由于缺乏股票發(fā)展的相關(guān)經(jīng)驗(yàn),一點(diǎn)點(diǎn)的摸索前進(jìn),直到現(xiàn)在股票市場(chǎng)已經(jīng)發(fā)展成為中國(guó)經(jīng)濟(jì)發(fā)展不可或缺的重要組成部分。我國(guó)股票市場(chǎng)在取得重大進(jìn)步的同時(shí)也存在著一些潛在的問(wèn)題。股票的價(jià)格會(huì)因?yàn)楦鞣N各樣的因素而產(chǎn)生較大波動(dòng),比如:有較多的內(nèi)幕交易在股票市場(chǎng)中出現(xiàn),在退市的規(guī)則執(zhí)行中力度稍顯不足,股票市場(chǎng)中相關(guān)的法律法規(guī)未能及時(shí)制定等,以至于有一部分股民蒙受較大損失。并且我國(guó)股票市場(chǎng)還有“政策市”的特點(diǎn),政府出臺(tái)的相關(guān)政策也會(huì)影響到我國(guó)股票市場(chǎng)個(gè)股的股票價(jià)格,因此,一種去除噪聲的科學(xué)合理的股票預(yù)測(cè)方法對(duì)于每一位股民來(lái)說(shuō)就顯得很有必要了。
3 通過(guò)整理大數(shù)據(jù)信息對(duì)股票進(jìn)行預(yù)測(cè)分析
3.1 BP神經(jīng)網(wǎng)絡(luò)基本介紹
股票市場(chǎng)自身具有高噪聲、非線性的特點(diǎn),而B(niǎo)P神經(jīng)網(wǎng)絡(luò)可以較好的克服這些缺陷來(lái)對(duì)個(gè)股股票進(jìn)行分析。BP神經(jīng)網(wǎng)絡(luò),是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),也稱(chēng)之為誤差反向傳播神經(jīng)網(wǎng)絡(luò)[4],其構(gòu)造的基本思路是:由信號(hào)的正向和反向傳播兩部分構(gòu)成了一個(gè)完整的學(xué)習(xí)過(guò)程。信號(hào)樣本值先從輸入層輸入,經(jīng)過(guò)隱含層時(shí)按照制定的規(guī)則進(jìn)行處理,再?gòu)妮敵鰧訉⑿盘?hào)輸出,若輸出的樣本值與期望值存在較大差異,則進(jìn)行反向傳播,通過(guò)調(diào)節(jié)各個(gè)參數(shù)的權(quán)重重新進(jìn)行訓(xùn)練學(xué)習(xí),如此循環(huán)往復(fù),直到滿足預(yù)期的標(biāo)準(zhǔn)為止。
3.2 BP神經(jīng)網(wǎng)絡(luò)模型的參數(shù)確定及預(yù)測(cè)
首先,對(duì)神經(jīng)網(wǎng)絡(luò)模型的參數(shù)進(jìn)行選擇,主要通過(guò)獲取股票的收盤(pán)價(jià)和開(kāi)盤(pán)價(jià)等指標(biāo)來(lái)對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練。其次,由于各個(gè)股票的數(shù)據(jù)存在數(shù)量級(jí)的差別,為了減少因數(shù)量級(jí)差別而造成的非主要因素誤差,因此,對(duì)數(shù)據(jù)進(jìn)行歸一化處理。再次,要對(duì)隱含層節(jié)點(diǎn)數(shù)的數(shù)量進(jìn)行確定,隱含層的節(jié)點(diǎn)數(shù)的個(gè)數(shù)與網(wǎng)絡(luò)模型預(yù)測(cè)股票指標(biāo)的精度之間關(guān)系密切。數(shù)量過(guò)多或者過(guò)少,都將會(huì)對(duì)預(yù)測(cè)精度產(chǎn)生重大影響。本文經(jīng)過(guò)多次調(diào)試試驗(yàn),最終確定最佳的隱含層節(jié)點(diǎn)數(shù)數(shù)量為20。然后,就是對(duì)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行確定。以MATLAB 2014a版本中所帶的BP神經(jīng)網(wǎng)絡(luò)工具箱進(jìn)行仿真實(shí)驗(yàn)。用newff函數(shù)來(lái)創(chuàng)建BP神經(jīng)網(wǎng)絡(luò),BP神經(jīng)網(wǎng)絡(luò)神經(jīng)元的傳遞函數(shù)和輸出層神經(jīng)元的傳遞函數(shù)用tansig函數(shù),使用trainlm作為訓(xùn)練函數(shù),最大訓(xùn)練次數(shù)為1000次,學(xué)習(xí)率為0.1次,目標(biāo)精度為10~12次。最后,就是對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行選取,為了最大限度的體現(xiàn)普適性,選取了四支股票進(jìn)行預(yù)測(cè),分別是中國(guó)石油(601857),中國(guó)平安(601318),中國(guó)聯(lián)通(600050),中國(guó)中鐵(601390)。通過(guò)大數(shù)據(jù)的收集和整理,選取2017年1月3日至2019年4月30日共492個(gè)交易日記錄為實(shí)驗(yàn)基礎(chǔ),其中,選擇462組交易數(shù)據(jù)對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,剩下30組數(shù)據(jù)待輸出結(jié)果后與實(shí)際值進(jìn)行對(duì)比。以下圖2~圖5是經(jīng)過(guò)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)之后,預(yù)測(cè)的30組數(shù)據(jù)輸出值與實(shí)際值相對(duì)比所產(chǎn)生的四支股票收盤(pán)價(jià)的相對(duì)誤差圖。
3.3 對(duì)預(yù)測(cè)結(jié)果進(jìn)行分析
通過(guò)對(duì)中國(guó)石油(601857),中國(guó)平安(601318),中國(guó)聯(lián)通(600050),中國(guó)中鐵(601390)這四支股票的歷史數(shù)據(jù)在BP神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行學(xué)習(xí)訓(xùn)練,得出了30組經(jīng)過(guò)學(xué)習(xí)之后輸出的預(yù)測(cè)值,然后預(yù)測(cè)值與實(shí)際值相對(duì)比,我們進(jìn)一步得出了這四支股票的相對(duì)誤差圖。通過(guò)看圖我們不難發(fā)現(xiàn),中國(guó)石油和中國(guó)中鐵這兩支股票的相對(duì)誤差控制在2.5%以內(nèi),而中國(guó)聯(lián)通和中國(guó)平安這兩支股票的相對(duì)誤差大致在4%以內(nèi),考慮到由于企業(yè)的內(nèi)在性質(zhì)不同,導(dǎo)致中國(guó)石油和中國(guó)中鐵這兩支股票在相對(duì)誤差方面優(yōu)于另外兩支,但總體來(lái)說(shuō),整個(gè)相對(duì)誤差在4%以內(nèi),已經(jīng)能夠較好的對(duì)股票的收盤(pán)價(jià)的價(jià)格以及趨勢(shì)進(jìn)行預(yù)測(cè),可以實(shí)現(xiàn)通過(guò)對(duì)大數(shù)據(jù)的分析整理,利用BP神經(jīng)網(wǎng)絡(luò)模型來(lái)對(duì)股票進(jìn)行指導(dǎo)性預(yù)測(cè),實(shí)現(xiàn)了為廣大股民提供科學(xué)、理性投資的目的。
4 結(jié)語(yǔ)
本文首先對(duì)大數(shù)據(jù)進(jìn)行了相關(guān)介紹,再利用大數(shù)據(jù)技術(shù)對(duì)股票的歷史數(shù)據(jù)進(jìn)行收集和整理,再將這些歷史數(shù)據(jù)輸入到BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練并進(jìn)一步預(yù)測(cè),我們從各個(gè)股票的收盤(pán)價(jià)這一指標(biāo)進(jìn)行分析,產(chǎn)出了四支股票的相對(duì)誤差圖,從圖中我們可以非常直觀的看出該神經(jīng)網(wǎng)絡(luò)模型在對(duì)股票進(jìn)行預(yù)測(cè)的過(guò)程以及結(jié)果具有較高的精確度,結(jié)果較為理想。因此,在大數(shù)據(jù)背景下,以大數(shù)據(jù)技術(shù)和大數(shù)據(jù)分析為依托,能夠?yàn)閺V大股票投資者選擇出更加科學(xué)、理性,適合自己的股票。
參考文獻(xiàn)
吉泉燁.產(chǎn)能過(guò)剩與商業(yè)銀行信貸風(fēng)險(xiǎn)的防范措施探討[J].全國(guó)流通經(jīng)濟(jì),2018.
我國(guó)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展展望[J].軟件和集成電路,2017.
2018—2024年中國(guó)大數(shù)據(jù)行業(yè)發(fā)展趨勢(shì)及投資戰(zhàn)略研究報(bào)告[DB/OL].http://www.chyxx.com.
王磊,王汝涼,曲洪峰,等.BP神經(jīng)網(wǎng)絡(luò)算法改進(jìn)及應(yīng)用[J].軟件導(dǎo)刊,2016(5).