• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于模糊灰色關(guān)聯(lián)分析法的足球比賽影響因素分析研究*

    2023-07-11 07:32:04姜海富于化龍
    計算機與數(shù)字工程 2023年3期
    關(guān)鍵詞:客隊主隊足球比賽

    姜海富 于化龍 韋 磊

    (江蘇科技大學(xué)計算機學(xué)院 鎮(zhèn)江 212114)

    1 引言

    隨著大數(shù)據(jù)數(shù)據(jù)量越來越多,給各行各業(yè)帶來無限想象力和商業(yè)應(yīng)用價值,尤其是在體育領(lǐng)域。足球比賽作為體育領(lǐng)域熱門的項目,伴隨國內(nèi)足球氛圍不斷濃厚,足球領(lǐng)域內(nèi)的各個細分領(lǐng)域也快速發(fā)展,足球比賽大數(shù)據(jù)就是其中之一[1]。目前存在大量熱愛足球的群眾對下一場比賽的結(jié)果進行預(yù)測,并且通常個人預(yù)測對所支持的球隊進行支持。但足球比賽結(jié)果因為其的不確定性,即使專家也很難能夠預(yù)測下一場比賽勝負[2]。從足球比賽體育大數(shù)據(jù)的挖掘中發(fā)現(xiàn),足球比賽對于賽果預(yù)測的困難,主要是由于足球比賽的結(jié)果含有眾多影響因素,例如團隊合作、個人技能、天氣、主場優(yōu)勢等,很難預(yù)料足球比賽的實際結(jié)果[3]。即使比賽沒有任何傷害或沒有加時發(fā)生,運氣也可能是影響足球比賽結(jié)果的一個因素,因此強隊并不一定會贏弱隊。也正是由于足球比賽影響因素多種多樣,比賽情況紛繁復(fù)雜,給足球比賽關(guān)聯(lián)分析更多研究的價值,也給商業(yè)界更多的興趣、體育界更多的精力去探索沒有接觸到的特征信息。

    當(dāng)前針對足球比賽預(yù)測研究方法眾多,但是對于賽后影響因素分析相對較少,且多見于傳統(tǒng)、簡單統(tǒng)計分析,不能夠從多角度多方面比較價值影響因素[4]。Marcelino R[5]等通過多變量分析中評估賽前因素的組合及其與賽果(贏/輸)的關(guān)系,采用預(yù)測性機器學(xué)習(xí)模型(ML)對澳大利亞足球聯(lián)賽比賽(AFL)結(jié)果預(yù)測分析,表明使用ML 方法能提供最大限度地提高獲勝機會的預(yù)測變量層次,還能夠預(yù)測AFL比賽的結(jié)果,為比賽關(guān)聯(lián)分析提供了一種新的方案啊。吳鍵等[6]使用Ologit(Ordinal logit)建立一種關(guān)聯(lián)模型將球員的基本能力成績與比賽成績關(guān)聯(lián),提出球員的個人技能與賽果之間存在年齡和組別球員變現(xiàn)呈現(xiàn)不相同的現(xiàn)象。通過對球員的客觀定量描述能夠及時有效的判斷球隊的問題并針對性做出改變。在預(yù)測模型上Koppman[7~8]前后分別提出了一種新的動態(tài)多元模型,用于分析和預(yù)測國家聯(lián)賽的足球比賽結(jié)果,實際結(jié)果對于足球比賽預(yù)測有著良好的效果。足球比賽賽場上每時每刻都在產(chǎn)生數(shù)據(jù),這些數(shù)據(jù)都存在重要的利用價值,盡管國內(nèi)外嘗試了大量的研究從球員自身,或者動態(tài)調(diào)整預(yù)測模型,但針對比賽影響因素的深度挖掘還是未能深入展開。

    本文采集大量足球比賽數(shù)據(jù),包含西班牙甲級聯(lián)賽,德國甲級聯(lián)賽,意大利甲級聯(lián)賽,法國甲級聯(lián)賽和葡萄牙足球超級聯(lián)賽五個賽季(2014-2019)完整比賽數(shù)據(jù)。針對足球比賽影響因素的多樣性、不確定性、模糊性等問題,以及在計算經(jīng)典灰色關(guān)聯(lián)度時無法對比不同觀測序列中多種因素對特征空間的影響。針對此問題提出一種采用模糊、灰色關(guān)聯(lián)理論配合提出模糊灰色關(guān)聯(lián)分析模型。通過本文方法得到的高貢獻度的特征,按照貢獻度大小進行排序分析,用一種相對科學(xué)的足球比賽結(jié)果預(yù)測估計模型(LightGBM 模型)對提取特征進行結(jié)果預(yù)測分析[9~10]。經(jīng)過對模型效果的充分檢驗,反復(fù)迭代對模型中各指標(biāo)進行統(tǒng)計篩選,指出了不同影響因素的重要程度特體現(xiàn),發(fā)現(xiàn)既能夠得到高貢獻度特征同時又能在特征分析提取后仍能夠得到高準確率預(yù)測的方法,而且在具體的特征分析得到價值一直的判斷,最后針對性的提出足球比賽過程中應(yīng)當(dāng)重點考慮的問題。

    2 研究方法

    2.1 模糊隸屬度以及灰度關(guān)聯(lián)模型

    針對足球比賽結(jié)果分析存在的問題,本文將模糊數(shù)學(xué)理論和灰色理論用于比賽影響因素分析中是一種創(chuàng)新的解決方案。目前在關(guān)聯(lián)分析與評價領(lǐng)域,模糊綜合評判法和灰色關(guān)聯(lián)法被廣泛提及,由于其特定的問題,存在一定的局限性。因素之間模糊性的主要原因在于各種因素在區(qū)別不同的過程中存在中間過渡的判斷,包含著彼此包含的聯(lián)系。但是在彼此包含的過程中仍然存在這客觀的區(qū)別,更進一步的對比能夠明顯得出在上一階段的彼此包含的關(guān)系中的信息,在下一階段可能并不是包含有很強烈的聯(lián)系[11]。

    隸屬度函數(shù)作為模糊理論中評價事務(wù)模糊性的重要評價方式,同時是關(guān)聯(lián)分析法主要構(gòu)成組件[12]。本文基于斯皮爾曼相關(guān)性系數(shù)模型與相近性原理的鄧氏灰色關(guān)聯(lián)分析模型,利用位移差來分別不同列之間的重要程度,根據(jù)計算出的關(guān)聯(lián)度分析出關(guān)聯(lián)序列,從而對根據(jù)關(guān)聯(lián)序列對不同因素的關(guān)聯(lián)程度進行研判[13]。

    2.1.1 原始數(shù)據(jù)處理

    數(shù)據(jù)標(biāo)準化處理能夠顯著減少由于變量的量綱不同導(dǎo)致模型預(yù)測產(chǎn)生數(shù)據(jù)誤差,產(chǎn)生。針對傳統(tǒng)的灰色關(guān)聯(lián)分析法常采用初值化或單一均值化進行數(shù)據(jù)處理,本文引用數(shù)據(jù)區(qū)間無量綱轉(zhuǎn)換跟傳統(tǒng)的模糊聚類中的極差變換相似也就是,對比較序列Xi(i=1,2,…,n)中的數(shù)據(jù)采用如Min-max normalization進行無量綱處理。

    2.1.2 模糊隸屬度與灰度關(guān)聯(lián)度計算

    為了保證模型包容所有信息,能夠減少數(shù)據(jù)線性比例關(guān)系的影響,本文選用統(tǒng)計學(xué)上常用的斯皮爾曼相關(guān)性法建立模糊相似矩陣的數(shù)學(xué)模型,也就用它來衡量兩個變量的依賴性的非參數(shù)指標(biāo),利用單調(diào)方程評價兩個統(tǒng)計變量的相似程度,而且對于數(shù)據(jù)錯誤和極端值的反應(yīng)不敏感[14]。其表現(xiàn)形式為

    其中xi,yi分別是影響因素i 取值的等級,xˉ,yˉ分別是變量x,y的評價等級,N是影響因素的總數(shù)量。

    針對比較序列Xi對參照序列Yi在i=k時的關(guān)聯(lián)系數(shù)ξij(k)可由下面的公式確定:其中Δmin,Δmax分別為Yi與Xi中分別是影響因素中的極大值與極小值的絕對值大小。 Δij(k)為Yi與Xi在第K 個點的絕對值差。ρ為判別系數(shù),也就是對極大值與極小值的權(quán)重,需要滿足干擾性與關(guān)聯(lián)度的一致性。對極大值與極小值的絕對值絕對值差值的均值進行計算,其次根據(jù)Δ 與Δmax的比值確定ρ的取值區(qū)間。其計算法公式如下:

    由于關(guān)聯(lián)系數(shù)的計算方式會導(dǎo)致計算結(jié)果眾多,為了能夠便于對比和分析本次將各關(guān)聯(lián)系數(shù)集中展示在一個值的效果上,即灰色關(guān)聯(lián)度。由于足球比賽影響因素眾多,本文根據(jù)對原始的灰色關(guān)聯(lián)度公式進行簡化可得:

    2.2 足球比賽模糊灰色關(guān)聯(lián)分析法

    根據(jù)2.1.2 節(jié)中模糊隸屬度ρ與灰色關(guān)聯(lián)度ξij就計算出一種足球比賽影響因素的一個判斷綜合評價指標(biāo),也就是本文提及的模糊灰色關(guān)聯(lián)度Rij其公式如下:

    對初始數(shù)據(jù)處理進行特征構(gòu)造并對缺失數(shù)據(jù)進行合理補充。提取的七類特征數(shù)據(jù)共計43 個特征采用模糊灰色關(guān)聯(lián)分析進行重要度分析,提取具有強關(guān)聯(lián)的特征集合。最后帶入到?jīng)Q策算法中進行實際的足球比賽預(yù)測,如算法1所示。

    算法1.模糊灰度關(guān)聯(lián)分析算法描述輸入 比賽數(shù)據(jù)x,實際比賽結(jié)果y;

    輸出 灰色關(guān)聯(lián)分析后的特征數(shù)據(jù)集合c

    procedure Xi=(xi1,xi2,…,xip),(i=1,2,3,…,n)

    1)collect the initial s instances as Xi

    2)[F1~Fs,G1~Gs]=Fuzzy_membership(Xi),Grey_relational_degree(Xi)

    3)[c1~cs]=algorithm(Fi,Gi)

    4)P=LightGBM(Ci)

    5) while max(P)

    6) find ω which is the best prediction accuracy P

    7) tune cjaccording to Eq.(4)

    8)end procedure

    3 實驗數(shù)據(jù)收集

    本次實驗采用的數(shù)據(jù)集來自球探網(wǎng)數(shù)據(jù)(http://zq.win007.com/info/index_cn.htm),通過爬蟲程序從此網(wǎng)站提取歐洲主流六個聯(lián)賽(西班牙甲級聯(lián)賽,德國甲級聯(lián)賽,意大利甲級聯(lián)賽,法國甲級聯(lián)賽和葡萄牙足球超級聯(lián)賽)五個賽季(2014-2019)共10661 場完整比賽數(shù)據(jù)作為實驗的基礎(chǔ)數(shù)據(jù)構(gòu)建數(shù)據(jù)集,其詳細信息如表1~2所示。

    表1 球隊最近比賽情況

    表2 球員最近比賽狀況數(shù)據(jù)

    由于足球比賽包含人為因素和自然因素和現(xiàn)實因素相關(guān)關(guān)聯(lián),通過對文獻以及足球比賽的了解。本文對提取到的初始足球比賽數(shù)據(jù)進行數(shù)據(jù)預(yù)處理,后對初始數(shù)據(jù)進行深入挖掘從積分差距、主客場及近期狀態(tài)、輪次相關(guān)、體能狀況、賠率狀況、兩隊交鋒歷史狀況和主客場攻守狀況方面提取7 個維度的特征數(shù)據(jù)進行下一步的關(guān)聯(lián)分析,詳細特征介紹如圖1所示。

    圖1 七大類別比賽特征數(shù)據(jù)

    在對比賽特征進行提取完成后,發(fā)現(xiàn)部分數(shù)據(jù)存在一部分缺失存在,如“主隊客隊近五場失球和”,因為對于原始數(shù)據(jù)本文可以理解為本年度賽季的比賽在時間軸上的確實沒有最近五場比賽的數(shù)據(jù),因此為了公平起見對于缺失的數(shù)據(jù)本文采用平局的方式對于球隊主客場進行打分。

    4 實驗結(jié)果及討論

    由于足球比賽結(jié)果預(yù)測本身相當(dāng)復(fù)雜,本文根據(jù)每場比賽后的實際比賽結(jié)果歸納得出的特征能夠盡可能地還原足球比賽實際預(yù)測結(jié)果中。經(jīng)過對初始數(shù)據(jù)的清洗和處理得到七個維度的特征序列,需要對得到的特征進行下一步的模糊灰色關(guān)聯(lián)分析。首先設(shè)足球比賽實際結(jié)果特征結(jié)合為對照序列Y,其中眾多的比賽結(jié)果影響因素構(gòu)成對比序列X。將對比序列X 經(jīng)過歸一化計算,得到一組標(biāo)準化的足球比賽影響因素矩陣。將標(biāo)準化的影響因素矩陣帶入式(1)得到影響因素的模糊隸屬度。將標(biāo)準化系數(shù)矩陣帶入式(2)得到,Δmin=0 、Δmax=1。通過約減計算均值求出ρ的取值范圍為0.3202 ≤ρ≤0.4803,求出灰色關(guān)聯(lián)系數(shù)矩陣。

    將灰色關(guān)聯(lián)系數(shù)矩陣帶入式(4)能夠得出對足球比賽賽果影響的加權(quán)灰色關(guān)聯(lián)程度,本文將模糊灰色關(guān)聯(lián)加權(quán)關(guān)聯(lián)度帶入式(5)也就計算得出足球比賽結(jié)果影響因素的模糊灰色關(guān)聯(lián)度如表3 所示,其中兩種計算方式差異如圖2 所示。其中本文針對所有特征:主優(yōu)勢、平均平率、主隊主場優(yōu)勢、分場平均平率、主隊近五場得分、客隊近五場得分,主隊主場近五場得分、客隊客場近五場得分、主對客對得分差、主隊主場客隊客場的分差、積分差小于3、積分差大于3但是小于6、輪次大于0.8積分小于3、輪次大于0.9 積分小于3、休息比,休息強度,負勝率、看平率、主賠率可信度、客賠率可信度、除去本場兩隊實力比、兩隊主對主場客隊客場實力比、兩隊最近一次交鋒比、兩隊最近一次主客交鋒比、主隊客隊進球比、主隊主場客隊客場進球比,主隊客隊進失球和、主隊客隊近五場進失球和、主隊主場客隊客場最近一場進失球和、主隊主場客隊客場近五場進失球和、不包含本場的主隊客隊最近一場凈勝球、不包含本場的主隊客隊近五場凈勝球、主隊主場客隊客場凈勝球、主隊主場客隊客場近五場凈勝球、WilliamHill 勝初賠、WilliamHill 平初賠、WilliamHill 負初賠、bet365 勝初賠、bet365 平初賠、bet365 負初賠、LiBo 勝初賠、LiBo 平初賠和LiBo 負初賠分別用X1,X2,…X43表示。本文余下部分將用符號代替特征名。

    圖2 不同灰色關(guān)聯(lián)度值測定折線圖

    表3 不同灰度計算方式關(guān)聯(lián)度表

    經(jīng)過實驗發(fā)現(xiàn)提取部分特征如X1、X10、X17、X20、X23、X24、X28、X32、X35、X37、X38、X40、X41、X43與比賽結(jié)果具有很高的關(guān)聯(lián)度??梢岳斫庠谧闱虮荣惍?dāng)中球隊主場優(yōu)勢以及最近主客交戰(zhàn)情況在現(xiàn)實情況上能一定程度上反應(yīng)兩隊比賽結(jié)果影響。對于歐賠的初賠,也可以發(fā)現(xiàn)盡管初賠是建立在給體育競技一種可以量化的直觀的數(shù)據(jù)體驗上,但是仍舊對于足球比賽賽果具有一定的聯(lián)系,反映了賠率機構(gòu)對于足球比賽的強有力分析。因此通過模糊灰色階關(guān)聯(lián)分析的方法能夠更好地將各種特征進行一個數(shù)據(jù)上的量化,方便與更好地對影響因素進行分析統(tǒng)計,便于下一步的實際結(jié)果預(yù)測。

    本文選用LightGBM 模型,它是一個梯度Boosting 框架,是2017 年微軟亞洲研究院發(fā)布的一種基于決策樹算法,其具有訓(xùn)練速度快、運行內(nèi)存低、準確率高、支持并行學(xué)習(xí)、可處理大規(guī)模數(shù)據(jù)的優(yōu)點,特別是在工業(yè)界具有很高的利用價值[15~16]。通過提取影響因素具有高貢獻度的特征,將提取到的特征變量帶入到LightGBM 決策算法對提取的足球比賽影響因素進行實際的足球比賽預(yù)測。

    本實驗將數(shù)據(jù)分為訓(xùn)練集和驗證集按9∶1 的比例進行數(shù)據(jù)拆分,調(diào)節(jié)LightGBM 決策模型參數(shù),同時對預(yù)測結(jié)果進行十折交叉驗證。實驗對比全部特征與提取關(guān)聯(lián)度最高的特征預(yù)測對比如表4所示。

    表4 全部特征與關(guān)聯(lián)度高的特征預(yù)測對比表

    根據(jù)表4 實驗發(fā)現(xiàn)本文提出的方法采用Light-GBM 決策算法對足球比賽的勝利預(yù)測準確率為73.01%,此方法在在相同數(shù)據(jù)源和數(shù)據(jù)填充處理方式的基礎(chǔ)上能夠在影響因素減少67.5%的情況下仍然沒有損失比賽預(yù)測實際精度,而且在計算速度上得到極大的提升。對于足球比賽這種含有眾多影響因素的關(guān)聯(lián)分析具有很好的效果,而且能夠發(fā)掘出與實際比賽結(jié)果最有用的特征,對于比賽預(yù)測具有很好的預(yù)測效果。

    5 結(jié)語

    基于模糊灰色關(guān)聯(lián)分析,建立了一個對足球比賽多因素關(guān)聯(lián)的模型。對足球比賽的多因素進行了定量的判定和分析,聚量化突出了不同因素對比賽結(jié)果影響程度,最大程度的抱著保證了分析的準確性和影響因素的可解釋性。本文方法從統(tǒng)計與數(shù)據(jù)挖掘的角度上進行分析了比賽數(shù)據(jù)的探索,從比賽數(shù)據(jù)的特征構(gòu)建,再到篩選后的比賽結(jié)果預(yù)測,不僅從海量的比賽數(shù)據(jù)探尋數(shù)據(jù)本身存在的價值,而且賦予體育比賽的數(shù)據(jù)分析一種新的探索方法。對于相關(guān)其他體育賽事比賽結(jié)果影響因素評定的研究具有一定的影響力,為體育比賽結(jié)果的分析與預(yù)測提供了參考科學(xué)有效參考。

    猜你喜歡
    客隊主隊足球比賽
    精彩的足球比賽
    “幽靈賽場”凸顯出球迷對于裁判的心理影響
    足球比賽
    啟蒙(3-7歲)(2018年9期)2018-08-30 08:55:58
    足球比賽里的“排兵布陣”(七)
    主隊
    足球周刊(2016年17期)2016-11-10 20:12:47
    2014—2015年中國女子籃球職業(yè)聯(lián)賽單節(jié)得失分與比賽結(jié)果相關(guān)性分析
    足球比賽
    裁判員對中國男子籃球職業(yè)聯(lián)賽主場優(yōu)勢影響的實證研究
    裁判員對我國女子籃球聯(lián)賽中比賽勝負影響的實證研究*
    體育科技(2010年4期)2010-01-02 00:59:34
    理塘县| 天长市| 阜南县| 太仆寺旗| 额尔古纳市| 彰化市| 汝城县| 大洼县| 新龙县| 满洲里市| 潮安县| 美姑县| 沈丘县| 西和县| 荣成市| 成都市| 邹城市| 鹿泉市| 九台市| 尖扎县| 同仁县| 旬邑县| 烟台市| 津南区| 礼泉县| 徐州市| 姜堰市| 大宁县| 临漳县| 和田市| 汶上县| 鹤壁市| 武汉市| 合山市| 塘沽区| 安义县| 井冈山市| 萝北县| 郁南县| 青浦区| 轮台县|