• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    大數據時代下體育科研的變革①

    2017-02-02 09:34:50樊花梅
    當代體育科技 2017年34期
    關鍵詞:樣本預測時代

    樊花梅

    (廣東醫(yī)科大學體育教學部 廣東湛江 524023)

    大數據時代無聲無息悄然來臨,在全球范圍內,大數據地來臨帶來信息技術的革命性變革,大數據不但和云計算、物聯網聯系緊密,更有自己獨特的特點和優(yōu)點,分分秒秒影響著社會生活、社會生產和人類生存生活方式[1]。如今,世界各國已經把大數據技術地研究和產業(yè)發(fā)展上升為國家戰(zhàn)略重點推進。對于整個國家而言,能否真正抓住大數據發(fā)展機遇,快速形成自己的核心技術和成果應用,參與到全球化競爭的隊伍,是決定未來國家科技力量格局的最重要的內容,是決定一個民族能否昂首挺胸與世界民族前列的核心技術成果應用。數據產生的變革無處不在,數據產生的變革如此影響巨大,數據產生的變革如此滲透力強,那么我們生活、工作、研究的步伐不得不考慮改變傳統(tǒng)策略和方法,盡快走上大數據的優(yōu)化時代。體育研究是對與體育相關的各個層面進行的價值挖掘和探討其因果關系,得到預想的科研成果。那么在大數據時代,體育科研又要開辟什么樣的道路呢?

    1 體育科研方法的改變

    傳統(tǒng)的體育科研方面有文獻資料法、訪談法、問卷調查法、統(tǒng)計法、實驗法等,這些方法都是在有限的數據條件下隨機抽取一定的樣本,按照因果關系盡量去解釋已經出現的問題。大數據時代對這些方法已經提出了徹底的革命性的挑戰(zhàn)和要求舞臺更換。

    1.1 研究對象的改變

    過去,我們在做科研的時候因為收集數據的局限性和處理數據能力的限制,在科學研究中我們通常采用隨機從全集數據中抽樣進行問卷調查、訪談,試驗等,然后通過對隨機性樣本數據的分析來推斷全部數集的總體特征,就此而言,我們所研究對象的范圍比真正的數據范圍小很多,我們是在我們自己能夠控制研究過程的前提下來讓分析盡量變得簡單?,F在,我們迎來的大數據時代,我們面對的是海量的數據,已經不是以前對千字節(jié)(KB)或者兆字節(jié)(MB)進行刪減取其有效準確數據進行分析研究,而是面對拍字節(jié)(PB),甚至艾字節(jié)(EB)這種海量數據的處理和分析。這些非結構化數據的大量產生來源于物聯網的飛速發(fā)展,它們構成了生物大數據、交通大數據、電信大數據、金融大數據、醫(yī)療大數據、科研大數據、教育大數據等。這些數據存在的特點就是結構性數據和非結構性數據混合存在,有效數據和模糊數據混合存在,我們根本不能從中看到價值取向。于是,大數據技術提供了海量數據的儲存和分析:分布式文件系統(tǒng)和分布式數據庫技術提供了無限制的數據儲存能力,分布式并行變成框架MapReduce提供了強大的數據處理能力。因此,在這些技術支持的前提下,我們對全體數據的分析完全可以在短時間內迅速得到結果,速度之快超乎想象。

    統(tǒng)計學家們曾反復證明:采樣分析的精確性隨著采樣隨機性的增加而大幅度的提高,但與樣本數量的增加關系不大[2]。他們還認為:樣本選擇的隨機性比樣本數量更重要[2]。他們的這種觀點,確實可以通過隨機收集樣本,用很低的代價做出高精度的判斷,在過去的時代里取得了很大的成就,是那個時代測量領域的主心骨,但是,這條捷徑是在數據不可收集和無法分析全部數據的情況下不可挑剔的最佳選擇,它本身存在很多很多固有的缺陷。祝建華教授在一次討論中明確指出:如果抽樣隊形更復雜,根本找不到最佳抽樣對象,那么,我們就不能從隨機抽樣中得到反映總體的結構性數據[3]。就此而言,我們就根本無法從事一些研究,比如,我們在網絡中調查人們對于體育運動項目選擇性喜好時,我們根本無法確定我們隨機得到的樣本是否是我們真正需要的、真正有研究意義的樣本,或許,你抽取的樣本剛好是一個區(qū)域的數據!或許,你的抽樣代表了一定階層的體育運動者的喜好!又或許,我們再進行深層次細分領域的研究時,隨機抽取的樣本根本不可取,因為,宏觀領域起作用的方法,在微觀領域就失去了價值功能。所以,我們需要大數據,我們需要大數據的儲存和處理分析,我們需要的樣本就是“總體”,我們才能有更客觀的成果反映。

    1.2 研究結果的改變

    在過去的抽樣分析中,我們追求分析結果的準確性,隨機采取樣本需要可行的、有效的、嚴密的布置和實施,選擇好比較恰當的關聯物,然后通過理論指導從收集到的數據來進行相關分析,最后從相關結果的有效性得到自己事先所設想的問題和需要解決的問題的比較精確的答案,所以整個過程是在假設條或預想中開展,整個數據的分析目的就是為解決現有的懷疑和問題。比如,我們要分析優(yōu)秀跳遠運動員在起跳過程中擺動腿的擺動角度對跳遠成績的影響,我們搜集一定樣本的數據,對樣本中優(yōu)秀運動員整個起跳過程中擺動腿的擺動角度進行分析總結,我們發(fā)現,運動員擺動腿控制在一定的角度內,會出現同級別的運動員跳遠成績更理想的情況。在同樣情況下,我們只能從這些樣本數據中解決我們自己提出的問題,這些數據不會再回答你突然意識到的新問題。我們可以肯定地說,這種樣本分析方法是一個解決問題的有效方法,但是它只僅僅是一個有限制和范圍的路徑,它不能適用于新情況新現象,我們在體育運動發(fā)展到現在這個水平上,已經不僅僅是只解決一個事先設計好的問題,我們需要從數據中得到更有價值,更有延展性的實實在在的信息,能得到我們沒有料想到的,我們計劃之外的,具有時代意義的分析結果。那么,精確性就只能在小樣本時代存在,而在大數據時代,我們追求的是實時分析結果(因為有些數據是秒級響應,否則會失去價值)和更多的數據自己說出來的不能預料的有效價值,那么,我們進行數據分析就需要的是效率,需要的是新價值,它們成為數據分析的核心。

    大數據時代,我們傳統(tǒng)的體育統(tǒng)計小樣本量基礎上實驗結果關聯物有精確相關性的方法要慢慢淡出歷史舞臺,我們不再需要人工耗時耗材去選擇可行的樣本和關聯物去分析預想和假設的問題了。其實更有很多假設同時也帶有個人偏見的,僅僅只為找到線性關系,也很容易導致錯誤,所以精確度已經屬于個別事物的小數據現象了[4]?,F在,我們擁有如此宏大的數據庫,擁有如此高效率分析的現代化機器計算能力,這些現代化的信息和技術為我們提供了一系列新的視野和有效的預測,我們能看到以前我們根本不曾注意到的聯系,還能夠掌握以前無法理解的復雜運動技術、運動動態(tài)、運動現象、運動黑幕和其他相關的體育世界。我們不再去刻意去得到精確的數據發(fā)現關聯,因為大數據優(yōu)劣互摻,紛繁復雜,形式多樣,我們在如此海量的數據中不能去刨根問底,而是要去尋找相關關系,要去從大體上把握發(fā)展方向,當然,我們不是放棄精確度,只是我們不再沉迷于此,我們適當放棄微觀上層面上的精確度會讓我們在宏觀層面有更為寬廣的觀察力。自然,要求精確已經轉變到尋找相關了。

    1.3 研究核心的轉變

    過去,我們要在研究中要去努力發(fā)現因果關系,發(fā)現導致一種現象的原因,比如一場體育賽事的收入顯著偏低,那么,我們就要從廣告、門票、轉播、贊助等方面收集樣本數據,然后分析得出導致這種結果的原因,我們是在找原因,找因果關系。大數據時代開辟了一場尋找無聲無息的游戲,開辟了一場挖掘寶藏的游戲,而人們對于數據的看法以及相關關系釋放出的潛在價值正是這場演出的關鍵所在。大數據不需要去建立假設,不需要去找問題的結果,大數據的核心是從相關關聯基礎上去預測,比如,2014年巴西世界杯期間,大數據預測已經成為關注的焦點,百度、谷歌、微軟和高盛等巨頭都競相利用大數據預測比賽結果,期間,百度預測最為亮眼,預測淘汰賽準確率竟然為94%。百度的做法就是收集到過去5年內全世界987支球隊的3.7萬場比賽數據,同時,搜索外圍相關的數據。建立了一個囊括199972名球員和1.2億條數據的預測模型,并在此基礎上進行數據處理發(fā)現相關關系進行預測[4]。再如,芝加哥大學的一位經濟學家使用11年中超過64000場摔跤比賽的記錄發(fā)現了非法操縱比賽結果的實時現象,從而正確的預測到未來一場比賽的非法操縱的可能性,有效遏制了體育比賽的丑陋現象[2]。事實上,大數據之于全球體育領域的重要性,正在不斷升級,諸如Amisco、OPTA、SAP、以及Prozone這樣的數據公司,已經成為足球界必不可少的數據細分環(huán)節(jié),細分技術就是對相關關系的搜索[1]。2016年樂視和搜達的合作,開辟了互聯網大數據最具價值的第四極,成為消費者和互聯網的新連接點。另外,“創(chuàng)冰科技”已經成為中國體育產業(yè)的大數據公司之一,專注于體育賽事分析和賽事預測[5]??梢?,大數據時代已經不是刻意的去尋求因果關系,而是發(fā)現數據的相關關系,從相關關系中有效的預測會發(fā)生的事件。這就是大數據時代最為影響力的時代產物。我們在做一種運動的時候大數據相關分析會預測你還會做另外一種事情,但為什么要做這種事情,大數據不會告訴你原因,只是在分析關聯中的一種預測。所以,我們在做科研時需要在大數據中挖掘縱橫交錯的相關關系,在相關關系中我們去處理我們需要做的事情,預測未來可能發(fā)生的事情,積極推進有利的可能,努力預防有害的現象。

    2 體育科研關鍵技術的變化

    我們談及大數據時,已經不是單指數據的本身,而是大數據和大數據技術兩者的協同,也就是說,在存在海量數據的前提下,我們要有實施大數據的采集、儲存、分析和應用的技術,是一系列使用非傳統(tǒng)的工具來對大量的結構化、半結構化和非結構化數據進行處理,從而獲得分析和預測結果的一系列數據處理和分析技術。

    我們在討論數據處理時,首先要了解數據處理的基本流程,其實也就是采集、儲存、分析和結果展示。數據無處不在,足球比賽、籃球比賽、門票收入、廣告展示、場地面積、技術動作錄像、觀眾意見,還有一些傳感器信息,個人微信、個人微博信息等,大量的分散數據從各個層面各個角度、各個地方涌現。這就需要有相應的軟件進行采集數據,采集后的數據無法直接用于后續(xù)的數據分析,因為這些數據類型多樣,來源廣泛,還有數不盡的殘缺數據和模糊不清的數據,所以要有采取一定的措施把這些數據預處理變成一個集合,這個集合里面的數據呈可用狀態(tài)。處理后的數據放進數據庫系統(tǒng)中儲存管理,然后采用數據挖掘工具對數據進行處理分析,最后呈現給我們的是挖掘出來的科研寶藏,我們在寶藏指導下進行有意義的體育工作。在整個數據技術過程中,還要注意隱私保護和安全問題,具體如表1所示。

    表1 大數據技術的幾個層面和功能

    3 結語

    大數據已經是無處不在,包括電信、能源、教育、醫(yī)療、金融等社會的各行各業(yè),它同物質資源、人力資源一樣成為國家的重要戰(zhàn)略資源,影響著國家和社會的安全、穩(wěn)定與發(fā)展。在大數據發(fā)展的背景下,我們體育科研工作已經不能再遵循傳統(tǒng)的科研方法了,傳統(tǒng)是在一定條件限制下所形成的優(yōu)化研究方法,隨著科技的飛速發(fā)展和科研成果的轉化應用,我們的科研方法也走在了非變不可的重要時刻,我們要抓住機遇,緊跟大數據時代的全球性科研方法的更新和轉變,把我們的體育科研工作切實的更上一層樓。

    [1]維克托.邁爾-舍恩伯格.大數據時代[M].杭州:浙江人民出版社,2016.

    [2]林子雨.大數據技術原理與應用[M].北京:人民郵電出版社,2017.

    [3]徐子沛.正在到來的數據革命[M].南寧:廣西師范大學出版社,2015.

    [4]朱潔.大數據架構詳解:從數據獲取到深度學習[M].南寧:電子工業(yè)出版社,2016.

    [5]楊百會.體育大數據的資本狂潮[J].企業(yè)觀察家,2016(10):78-79.

    猜你喜歡
    樣本預測時代
    無可預測
    黃河之聲(2022年10期)2022-09-27 13:59:46
    選修2-2期中考試預測卷(A卷)
    選修2-2期中考試預測卷(B卷)
    用樣本估計總體復習點撥
    推動醫(yī)改的“直銷樣本”
    HANDS OFF THE WHEEL
    不必預測未來,只需把握現在
    隨機微分方程的樣本Lyapunov二次型估計
    e時代
    足球周刊(2016年14期)2016-11-02 10:56:23
    e時代
    足球周刊(2016年15期)2016-11-02 10:55:36
    武夷山市| 达尔| 达州市| 垣曲县| 汉川市| 盘锦市| 邯郸县| 重庆市| 西安市| 宁阳县| 阿拉尔市| 佛教| 阿勒泰市| 丰城市| 阳朔县| 麟游县| 丹棱县| 西峡县| 金秀| 岳池县| 抚宁县| 苏州市| 蒲江县| 延吉市| 三亚市| 莆田市| 靖边县| 仲巴县| 磴口县| 汾阳市| 丹江口市| 惠州市| 黄平县| 乐东| 铜川市| 涟源市| 五华县| 甘洛县| 新巴尔虎右旗| 太湖县| 金昌市|