• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      Keras神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)大樂(lè)透彩票的實(shí)現(xiàn)

      2022-04-20 11:15:10高楷程
      微型電腦應(yīng)用 2022年3期
      關(guān)鍵詞:大樂(lè)透個(gè)球彩票

      高楷程

      (東北石油大學(xué),計(jì)算機(jī)與信息技術(shù)學(xué)院,黑龍江,大慶 163000)

      0 引言

      隨著大樂(lè)透彩票的普及,彩民的購(gòu)買(mǎi)熱情越來(lái)越高,反映非常熱烈。在該玩法受歡迎的同時(shí), 各種預(yù)測(cè)的方法都出現(xiàn)了。目前, 出現(xiàn)預(yù)測(cè)方法都是基于統(tǒng)計(jì)理論提出的, 如奇偶比、遺漏期K值、區(qū)段出號(hào)碼數(shù)字、數(shù)字頻率的次數(shù)等。因?yàn)椴捎玫氖墙y(tǒng)計(jì)方法, 具有一定的偶然性,其結(jié)果并不完全可靠。本文采用Keras神經(jīng)網(wǎng)絡(luò)搭建預(yù)測(cè)模型,進(jìn)行訓(xùn)練之后預(yù)測(cè)下一期的號(hào)碼,從結(jié)果上來(lái)說(shuō)提高了中獎(jiǎng)的概率。

      1 預(yù)測(cè)

      首先,大樂(lè)透的中獎(jiǎng)序列為35選5+12選2,每個(gè)球的選取是隨機(jī)的,因此,想使用機(jī)器學(xué)習(xí)精準(zhǔn)地預(yù)測(cè)出獲獎(jiǎng)序列是很難的??梢灶?lèi)比于機(jī)器學(xué)習(xí)選股票。目前有很多機(jī)器學(xué)習(xí)應(yīng)用在股票選擇上的例子,并能夠?qū)崿F(xiàn)盈利[1-3]。但機(jī)器學(xué)習(xí)選股和選彩票有幾點(diǎn)顯著差異:股票的漲跌存在各種因子、K線、輿情等參數(shù)用于評(píng)估和訓(xùn)練,但彩票的中獎(jiǎng)序列是隨機(jī)產(chǎn)生的,可供參考的可能僅有時(shí)間上的序列的概率分布。

      所謂的概率分布指的是,假設(shè)彩票的中獎(jiǎng)序列是完全隨機(jī)產(chǎn)生的,序列中每一個(gè)球在一次開(kāi)獎(jiǎng)過(guò)程中出現(xiàn)的概率應(yīng)該是相同的(前區(qū)和后區(qū)要分開(kāi)算),并且從時(shí)間序列上來(lái)看,連續(xù)的多次開(kāi)獎(jiǎng)中,每一個(gè)球的出現(xiàn)與否也應(yīng)當(dāng)滿足某種規(guī)律(當(dāng)然,這是宏觀上講,實(shí)際上肯定不會(huì)嚴(yán)格滿足,但能夠體現(xiàn)某種趨勢(shì)或傾向)[4-6]。

      2 數(shù)據(jù)

      2.1 獲取數(shù)據(jù)

      在江蘇體彩網(wǎng)獲取數(shù)據(jù),文件格式為csv。如圖1所示。

      2.2 處理數(shù)據(jù)

      雖然數(shù)據(jù)已經(jīng)獲取到了,但顯然這個(gè)數(shù)據(jù)無(wú)法直接應(yīng)用于訓(xùn)練。需要對(duì)數(shù)據(jù)做一下簡(jiǎn)單的處理。

      本文為中獎(jiǎng)序列中的數(shù)字(或者說(shuō)球)編號(hào),從前往后它們的編號(hào)分別為1到7,其中1~5是前區(qū)的5個(gè)球,6~7是后區(qū)的2個(gè)球。

      同理,對(duì)于給定的課題,假如我們有近一年以來(lái)的氣溫?cái)?shù)據(jù),需要預(yù)測(cè)明天的氣溫,一般的思路是用循環(huán)神經(jīng)網(wǎng)絡(luò)做序列的預(yù)測(cè)。假設(shè)按順序給這近一年來(lái)的氣溫分別編號(hào)為1~365,其中t1表示第一天的氣溫,t365表示今天的氣溫。

      氣溫的變化應(yīng)該是有規(guī)律的(一般情況下),讓機(jī)器來(lái)學(xué)習(xí)這種規(guī)律。選定一個(gè)合適的時(shí)間長(zhǎng)度,比如30天,然后將這30天的連續(xù)數(shù)據(jù)作為輸入(x),將接下來(lái)一天的氣溫?cái)?shù)據(jù)作為輸出(y),就構(gòu)成了一條數(shù)據(jù)。然后使用長(zhǎng)度為31天的掃描框,對(duì)一年的數(shù)據(jù)進(jìn)行一次遍歷,就得到了一組數(shù)據(jù)集。用它進(jìn)行訓(xùn)練,完成后,輸入30天前到今天的氣溫序列,即可預(yù)測(cè)明天的氣溫。

      本文的課題和預(yù)測(cè)氣溫差不多,使用連續(xù)若干期的球1數(shù)據(jù)來(lái)預(yù)測(cè)下期球1的分布概率,球2~球7都是同樣的方法。單從輸入輸出看來(lái)就是這樣,實(shí)際上實(shí)現(xiàn)起來(lái)肯定會(huì)有更多的處理和優(yōu)化[7-9]。

      和預(yù)測(cè)氣溫的例子不同,氣溫預(yù)測(cè)時(shí)只有一種因子參與,就是當(dāng)天的氣溫值。而在這個(gè)例子里,輸入的是7個(gè)球,輸出的也是7個(gè)概率分布,所以這是個(gè)多輸入、多輸出的模型。

      3 編寫(xiě)模型

      模型示意圖如圖2所示。

      圖2 模型示意圖

      使用連續(xù)若干期的球1數(shù)據(jù)來(lái)預(yù)測(cè)下期球1的分布概率,球2~球7都是同樣的方法,但因?yàn)檫@些球本身并不獨(dú)立,比如球1開(kāi)出了3,球2~球5就不可能再開(kāi)出3,而是在剩下的里面選。所以我們?cè)陬A(yù)測(cè)最后的概率之前,對(duì)球1~球5的中間層進(jìn)行了拼接,再分別預(yù)測(cè),這樣模型可能會(huì)學(xué)習(xí)到每一期中前區(qū)的球之間的某種關(guān)系。對(duì)于球6和球7,也做了類(lèi)似操作。

      球1~球5在前區(qū),球6~球7在后區(qū),兩者沒(méi)什么關(guān)系,所以這兩部分之間沒(méi)有進(jìn)行拼接。

      最后的輸出預(yù)測(cè)層選擇了Softmax,嚴(yán)格來(lái)說(shuō),Softmax對(duì)于這個(gè)問(wèn)題來(lái)說(shuō),并不是一個(gè)很好的選擇,因?yàn)殚_(kāi)球應(yīng)該是條件概率,比如球1開(kāi)了5之后,開(kāi)球2的概率計(jì)算應(yīng)該是球1=5條件下的條件概率,球3~球5同理。但最終還是選擇了Softmax,原因一是Softmax實(shí)現(xiàn)起來(lái)更加簡(jiǎn)單,二是模型輸出本身設(shè)計(jì)的就不是預(yù)測(cè)頭等獎(jiǎng)的完全正確序列,而是盡可能多地選中球。

      4 工具方法

      4.1 訓(xùn)練

      數(shù)據(jù)和模型都已經(jīng)準(zhǔn)備完畢,可以進(jìn)行訓(xùn)練了。但這個(gè)模型不同于一般的分類(lèi)模型,因此選擇回測(cè)方法評(píng)估模型的效果。

      劃分一部分?jǐn)?shù)據(jù)(比如90%)作為訓(xùn)練集的訓(xùn)練模型,剩下的10%作為測(cè)試集。劃分是按照時(shí)間順序劃分的,保證后面10%的數(shù)據(jù)絕不出現(xiàn)在訓(xùn)練集的結(jié)果數(shù)據(jù)或過(guò)程數(shù)據(jù)中。在使用訓(xùn)練集完成模型的訓(xùn)練后,對(duì)測(cè)試集進(jìn)行預(yù)測(cè),并按照預(yù)測(cè)結(jié)果購(gòu)買(mǎi)彩票,計(jì)算支出和獎(jiǎng)金,以最終的凈收入的多少來(lái)衡量模型效果[10-13]。

      按照訓(xùn)練集∶測(cè)試集=9∶1的比例劃分?jǐn)?shù)據(jù)集,在訓(xùn)練集上訓(xùn)練模型,并使用測(cè)試集回測(cè)。訓(xùn)練60輪,每一輪訓(xùn)練完成后都會(huì)保存模型的參數(shù),并進(jìn)行回測(cè)。在訓(xùn)練結(jié)束后,將所有回測(cè)結(jié)果按時(shí)間順序繪制出折線圖和趨勢(shì)線,如圖3所示。

      圖3 預(yù)測(cè)趨勢(shì)圖

      多次運(yùn)行的結(jié)果可能差距明顯,其原因分析如下。

      (1)訓(xùn)練數(shù)據(jù)的原因

      彩票選號(hào)其實(shí)是沒(méi)有嚴(yán)格的規(guī)律可言的,否則,哪怕只有極少數(shù)一批人能穩(wěn)定猜中,這個(gè)游戲也沒(méi)法長(zhǎng)期運(yùn)行。如果非要強(qiáng)行說(shuō)個(gè)規(guī)律出來(lái),那也只有長(zhǎng)期下來(lái)的概率分布能勉強(qiáng)湊合。但首先大樂(lè)透也只開(kāi)了1 000多期,數(shù)據(jù)有限,其次概率這種東西從字面上來(lái)看,就知道它不是固定的(哪怕出現(xiàn)的概率最高,也不一定會(huì)出現(xiàn))。這樣,當(dāng)模型的隨機(jī)初始權(quán)重不同,訓(xùn)練數(shù)據(jù)又很難找到特別清晰的規(guī)律時(shí),模型學(xué)習(xí)到的東西也會(huì)產(chǎn)生相應(yīng)的區(qū)別,它們分別傾向到了概率分布的不同表現(xiàn)形式。

      (2)回測(cè)時(shí)選擇彩票號(hào)碼的原因

      選擇號(hào)碼時(shí),同樣不是一定選擇出現(xiàn)概率最大的球,只是出現(xiàn)概率越大,被選中的概率就越大,這樣保證了結(jié)果的多樣性。

      兩者綜合起來(lái),兩次的運(yùn)行結(jié)果可能天差地別,但從多次運(yùn)行的整體來(lái)看,還是有一定規(guī)律的。

      訓(xùn)練一定次數(shù)之后,虧損金額大多分布在[-1 200,-900]左右,少數(shù)情況下在(-900,-400],極少數(shù)甚至還有盈余。

      大部分都滿足“隨著訓(xùn)練次數(shù)的增加,損失逐步減少”的規(guī)律,即圖中擬合的一次函數(shù)(一條斜直線)因?yàn)榛販y(cè)的隨機(jī)性,單點(diǎn)結(jié)果是會(huì)出現(xiàn)起伏波動(dòng)的,所以使用趨勢(shì)來(lái)衡量整體結(jié)果會(huì)更加合適。

      綜上,模型應(yīng)該起到了一定作用。

      4.2 基線模型

      基線模型指的是一個(gè)最基礎(chǔ)、最簡(jiǎn)單的模型,它是從概率的角度上來(lái)說(shuō)隨機(jī)性最強(qiáng)的一個(gè)模型。

      一般基線模型都是完全隨機(jī)的。從前區(qū)選出5個(gè)球,后區(qū)選出2個(gè)球,每個(gè)球都隨機(jī)選擇,這就是基線模型。類(lèi)似于彩票中心的機(jī)選方案。

      模擬多次購(gòu)買(mǎi)彩票來(lái)實(shí)現(xiàn)基線模型的預(yù)測(cè)虧損,模擬結(jié)果如圖4所示。

      圖4 基線模型預(yù)測(cè)結(jié)果

      多次運(yùn)行可以發(fā)現(xiàn),最后的平均值絕大多數(shù)落在[-1 400,-1 200]之間,其中又以-1 250左右最多。少數(shù)虧得更少或更多,極少數(shù)能夠小賺。

      5 預(yù)測(cè)下期彩票序列

      如果準(zhǔn)備利用模型買(mǎi)彩票,可以分為2種情況。

      (1)選擇在上一步訓(xùn)練好的某個(gè)模型參數(shù),加載這個(gè)參數(shù),輸入倒數(shù)第MAX_STEPS期到最近一期的數(shù)據(jù)序列,預(yù)測(cè)下一期序列。

      (2)使用完整數(shù)據(jù)集作為訓(xùn)練集,重新訓(xùn)練模型并保存。然后和第一種情況一樣,加載模型參數(shù),輸入倒數(shù)第MAX_STEPS期到最近一期的數(shù)據(jù)序列,預(yù)測(cè)下一期序列。

      兩者的區(qū)別在于:

      第一種情況,有回測(cè)數(shù)據(jù),在選擇訓(xùn)練好的參數(shù)時(shí)有一定的參考;第二種情況,使用了完整數(shù)據(jù)集來(lái)訓(xùn)練,就沒(méi)有回測(cè)數(shù)據(jù)可參考了。

      第一種情況的訓(xùn)練數(shù)據(jù)少于第二種的訓(xùn)練數(shù)據(jù)。按理說(shuō)更多的訓(xùn)練數(shù)據(jù)通常會(huì)產(chǎn)生更好的效果。

      運(yùn)行一下,模型輸出如圖5所示。

      6 總結(jié)

      本文通過(guò)神經(jīng)網(wǎng)絡(luò)算法來(lái)進(jìn)行大樂(lè)透彩票預(yù)測(cè)實(shí)驗(yàn),從概率的角度說(shuō)明預(yù)測(cè)的可能性,分別介紹了數(shù)據(jù)的獲取、模型的搭建以及進(jìn)行實(shí)驗(yàn)網(wǎng)絡(luò)的訓(xùn)練實(shí)驗(yàn)。

      將算法應(yīng)用在大樂(lè)透預(yù)測(cè)上,并且獲取最近100期開(kāi)獎(jiǎng)記錄作為樣本數(shù)據(jù),通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)能在一定概率上提高中獎(jiǎng)率。對(duì)其他彩票建立預(yù)測(cè)模型也有一定的參考價(jià)值。

      猜你喜歡
      大樂(lè)透個(gè)球彩票
      鄭州購(gòu)彩者火速領(lǐng)取大樂(lè)透九百一十八萬(wàn)元
      少林與太極(2023年4期)2023-07-14 07:48:20
      丟失的中獎(jiǎng)彩票
      踢你個(gè)球
      踢你個(gè)球
      踢你個(gè)球
      嚕嚕豬買(mǎi)彩票
      踢你個(gè)球(1)
      彩票呀,你該飛向哪
      彩票攤
      辰溪县| 湘潭市| 淮安市| 长治市| 拉孜县| 新田县| 康定县| 安宁市| 隆回县| 罗源县| 衡水市| 西畴县| 南京市| 德州市| 霍邱县| 八宿县| 崇州市| 亚东县| 松桃| 房产| 大理市| 邵武市| 房产| 荣成市| 临猗县| 广南县| 阳新县| 搜索| 多伦县| 商南县| 房山区| 项城市| 大英县| 都昌县| 陆良县| 辰溪县| 蒙城县| 济宁市| 襄樊市| 济南市| 洪江市|