(上海財經(jīng)大學(xué)浙江學(xué)院,浙江金華321013)
(上海財經(jīng)大學(xué)浙江學(xué)院,浙江金華321013)
“大數(shù)據(jù)”(Big data)研究機構(gòu)Gartner定義?!按髷?shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。統(tǒng)計學(xué)在大數(shù)據(jù)的研究中存在一定的應(yīng)用,表現(xiàn)在將“大數(shù)據(jù)”變成“小數(shù)據(jù)”,對海量數(shù)據(jù)的搜索、聚類和分類依賴于統(tǒng)計學(xué)的一般方法,因而大數(shù)據(jù)的研究繼承了統(tǒng)計學(xué)科的一些特點。但大數(shù)據(jù)尚未被統(tǒng)計學(xué)完全吸納和應(yīng)用,這主要是由于大數(shù)據(jù)與統(tǒng)計學(xué)存在兩個很關(guān)鍵的差別。為此,在大數(shù)據(jù)時代背景下,應(yīng)用統(tǒng)計學(xué)專業(yè)的人才素質(zhì)的培養(yǎng)及課程設(shè)置如何改革等方面,是應(yīng)用型本科院校值得并迫切思考的重要問題。
大數(shù)據(jù);應(yīng)用統(tǒng)計學(xué);改革
眾所周知,統(tǒng)計學(xué)自古至今就是一門以研究數(shù)據(jù)為主的學(xué)科,至今已經(jīng)形成了較為成熟的數(shù)據(jù)研究體系與框架。統(tǒng)計學(xué)專業(yè)的學(xué)生的主要就業(yè)方向是銀行、會計師事務(wù)所、市場調(diào)查公司或其它企事業(yè)單位。因此目前統(tǒng)計學(xué)教育的主要目的是能夠培養(yǎng)出獨立完成問卷設(shè)計、數(shù)據(jù)收集、應(yīng)用模型進行數(shù)據(jù)分析的高級統(tǒng)計人才,其主要專業(yè)課程包括:高等概率論與數(shù)理統(tǒng)計、應(yīng)用回歸、多元統(tǒng)計、市場調(diào)查實務(wù)、時間序列分析、金融計算等,這些課程仍然是傳統(tǒng)的課程設(shè)置,并不符合大數(shù)據(jù)時代數(shù)據(jù)科學(xué)家的專業(yè)知識構(gòu)成。因此,在大數(shù)據(jù)時代背景下對應(yīng)用型本科院校應(yīng)用統(tǒng)計學(xué)專業(yè)的培養(yǎng)模式和教學(xué)改革的思考是非常有必要的。
2012年3月29日,美國在倡議書中指出,美國將應(yīng)用收集巨大、復(fù)雜數(shù)據(jù)的挖掘能力,加速科學(xué)與工程學(xué)科的創(chuàng)新腳步,改革學(xué)生培養(yǎng)模式。北京師范大學(xué)邱東教授探討了面對大數(shù)據(jù)潮流人們應(yīng)持有的科學(xué)態(tài)度,從大數(shù)據(jù)的概念功能、統(tǒng)計學(xué)與數(shù)據(jù)科學(xué)的關(guān)系、大數(shù)據(jù)潮流對統(tǒng)計學(xué)產(chǎn)生的影響等4個方面論述了大數(shù)據(jù)對統(tǒng)計學(xué)的挑戰(zhàn)[1]。英國學(xué)者維克托·邁爾·舍恩伯格認為大數(shù)據(jù)的精髓在于分析信息時的3個轉(zhuǎn)變:一是可以分析和處理更多甚至是全部的數(shù)據(jù),不再依賴隨機抽樣;二是研究數(shù)據(jù)如此之多,以致于人們不再追求精確度;三是人們不再熱衷于尋找因果關(guān)系[2]。為適應(yīng)大數(shù)據(jù)時代對數(shù)據(jù)處理人才更高綜合素質(zhì)的要求,統(tǒng)計學(xué)科教師與專業(yè)教育應(yīng)在知識結(jié)構(gòu)、教育內(nèi)容、教育方式和人才培養(yǎng)模式等方面,主動進行與時俱進的充實、調(diào)整及變革[3]。文章擬從數(shù)據(jù)挖掘與統(tǒng)計分析的聯(lián)系與區(qū)別、大數(shù)據(jù)對統(tǒng)計教育及統(tǒng)計人才的機遇與挑戰(zhàn)的新形勢下從政府、企業(yè)和人才等多個角度進行展開調(diào)查,對于應(yīng)用型本科院校培養(yǎng)順應(yīng)時代發(fā)展的應(yīng)用統(tǒng)計學(xué)專業(yè)的高層次人才提供相應(yīng)的建議。
統(tǒng)計分析是指運用統(tǒng)計方法及與分析對象有關(guān)的知識,從定量與定性的結(jié)合上進行的研究活動。
統(tǒng)計分析過程:描述要分析的數(shù)據(jù)的性質(zhì),研究基礎(chǔ)群體的數(shù)據(jù)關(guān)系,創(chuàng)建一個模型,總結(jié)數(shù)據(jù)與基礎(chǔ)群體的聯(lián)系,證明(或否定)該模型的有效性,采用預(yù)測分析來預(yù)測將來的趨勢。
統(tǒng)計分析方法:(1)描述統(tǒng)計:將研究中所得的數(shù)據(jù)加以整理、歸類、簡化或繪制成圖表,以此描述和歸納數(shù)據(jù)的特征及變量之間的關(guān)系的方法。集中趨勢、離散程度、相關(guān)強度等、指標有平均數(shù)、標準差、相關(guān)系數(shù)等;(2)推斷統(tǒng)計:用概率形式來決斷數(shù)據(jù)之間是否存在某種關(guān)系及用樣本統(tǒng)計值來推測總體特征的一種重要的統(tǒng)計方法??傮w參數(shù)估計、假設(shè)檢驗、Z檢驗、T檢驗、卡方檢驗等數(shù)據(jù)挖掘是從龐大的數(shù)據(jù)中分析出有目標數(shù)據(jù)群,篩選出利于決策的有效信息。數(shù)據(jù)挖掘的數(shù)據(jù)量極大,注重數(shù)據(jù)查詢分析的可行性。數(shù)據(jù)挖掘是著眼于預(yù)測未來,從大量的數(shù)據(jù)中尋找某些規(guī)律。
數(shù)據(jù)挖掘過程:(1)定義問題:分析業(yè)務(wù)需求、定義問題的范圍、定義計算模型所使用的度量、定義數(shù)據(jù)挖掘項目的特定目標等;(2)準備數(shù)據(jù):刪除錯誤數(shù)據(jù)或插入缺失值、查找數(shù)據(jù)中的隱含相關(guān)性、標識最準確的數(shù)據(jù)源、確定哪些列最適合用于分析;(3)瀏覽數(shù)據(jù):計算最小值和最大值、計算平均偏差和標準偏差、查看數(shù)據(jù)的分布;(4)部署和更新模型:根據(jù)實際數(shù)據(jù)部署、更新模型;(5)瀏覽和驗證模型:測試模型的性能、需要使用不同配置創(chuàng)建多個模型,并對所有這些模型進行測試,查看哪個模型為最佳;(6)生成模型:通過創(chuàng)建挖掘結(jié)構(gòu)定義要使用的數(shù)據(jù)列、將挖掘結(jié)構(gòu)鏈接到數(shù)據(jù)源,但只有對挖掘結(jié)構(gòu)進行處理后,該結(jié)構(gòu)才會實際包含數(shù)據(jù)。
表1統(tǒng)計分析與數(shù)據(jù)挖掘的區(qū)別
從上可以看出大數(shù)據(jù)雖與統(tǒng)計學(xué)密切相關(guān),但二者也在研究目的、數(shù)據(jù)處理對象和技術(shù)工具上有著諸多差異。大數(shù)據(jù)的興起不僅在分析手段、工作重心和價值理念上給統(tǒng)計學(xué)帶來了重大影響,而且也使擔(dān)負著培養(yǎng)現(xiàn)代統(tǒng)計工作和數(shù)據(jù)分析之人才的統(tǒng)計教育面臨嚴峻挑戰(zhàn)。
根據(jù)2014年大數(shù)據(jù)應(yīng)用現(xiàn)狀和趨勢展開的調(diào)研分析,被調(diào)查者最關(guān)注的大數(shù)據(jù)技術(shù)中,排在前三位的分別是數(shù)據(jù)分析(統(tǒng)計分析與數(shù)據(jù)挖掘等)(25.5%)、數(shù)據(jù)采集(19.9%)、數(shù)據(jù)處理(18.5%)。企業(yè)數(shù)據(jù)管理面臨的挑戰(zhàn):缺乏專業(yè)的大數(shù)據(jù)人才(26.95%)成為企業(yè)面臨的最大挑戰(zhàn),其次是非結(jié)構(gòu)化數(shù)據(jù)的分析和處理(26.65%)、傳統(tǒng)技術(shù)難以處理大數(shù)據(jù)(25.27%)以及新技術(shù)門檻過高(21.13%)。根據(jù)2015年2月Forrest報告,很多企業(yè)都在努力挖掘其擁有的大量數(shù)據(jù),包括結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)等,探索對數(shù)據(jù)的深入利用。從國內(nèi)企業(yè)大數(shù)據(jù)應(yīng)用的現(xiàn)狀和規(guī)劃來看,已經(jīng)部署大數(shù)據(jù)應(yīng)用的企業(yè)所占比例達到21.89%,計劃1年內(nèi)部署的企業(yè)占27.92%,計劃2年內(nèi)部署的企業(yè)占14.34%,沒有相關(guān)計劃和不確定的企業(yè)分別占11.32%和24.53%。大數(shù)據(jù)相關(guān)人才的欠缺將會成為影響大數(shù)據(jù)市場發(fā)展的一個重要因素。據(jù)Gartner預(yù)測,到2016年,全球?qū)⑿略?40萬個與大數(shù)據(jù)相關(guān)的工作崗位,且會有25%的組織設(shè)立首席數(shù)據(jù)官職位。大數(shù)據(jù)的相關(guān)職位需要的是復(fù)合型人才,能夠?qū)?shù)學(xué)、統(tǒng)計學(xué)、數(shù)據(jù)分析、機器學(xué)習(xí)和自然語言處理等多方面知識綜合掌控。
根據(jù)學(xué)院統(tǒng)計學(xué)不同方向等專業(yè)的學(xué)生、老師、專家以及政府范圍工作人員等進行訪問調(diào)查的結(jié)果,然后結(jié)合現(xiàn)如今大數(shù)據(jù)時代企業(yè)和政府對人才的需求,最終制定應(yīng)用型人才培養(yǎng)方案分別如下:
(一)深化課程教學(xué)內(nèi)容改革
1.更新教學(xué)內(nèi)容,緊跟時代發(fā)展——大數(shù)據(jù)、互聯(lián)網(wǎng)金融、國民經(jīng)濟統(tǒng)計、貨幣銀行、經(jīng)濟預(yù)測與決策;2.強化統(tǒng)計基礎(chǔ),提高實踐操作——統(tǒng)計方法、軟件實現(xiàn)、貝葉斯統(tǒng)計、非參數(shù)估計、統(tǒng)計軟件、數(shù)據(jù)挖掘;3.強調(diào)專業(yè)導(dǎo)向,拓寬就業(yè)方向-選修、考證;金融類、經(jīng)濟類、管理類、會計類;統(tǒng)計從業(yè)資格證書。
最終根據(jù)學(xué)院不同方向統(tǒng)計學(xué)專業(yè)設(shè)置專業(yè)核心課如下:
(1)應(yīng)用統(tǒng)計學(xué):主要專業(yè)課調(diào)整為:概率論、數(shù)理統(tǒng)計、統(tǒng)計學(xué)、回歸分析、時間序列分析、多元統(tǒng)計分析,抽樣技術(shù)、數(shù)據(jù)挖掘、貝葉斯統(tǒng)計、計量經(jīng)濟學(xué)、統(tǒng)計軟件、非參數(shù)統(tǒng)計、統(tǒng)計調(diào)查等;(2)應(yīng)用統(tǒng)計學(xué)(金融統(tǒng)計):主要專業(yè)課調(diào)整為:概率論、數(shù)理統(tǒng)計、統(tǒng)計學(xué)、回歸分析、時間序列分析、多元統(tǒng)計分析,抽樣技術(shù)、數(shù)據(jù)挖掘、金融計量學(xué)、風(fēng)險管理、保險學(xué)、非壽險精算、統(tǒng)計軟件、國民經(jīng)濟核算、統(tǒng)計調(diào)查等;(3)經(jīng)濟統(tǒng)計學(xué):主要專業(yè)課調(diào)整為:概率論、數(shù)理統(tǒng)計、統(tǒng)計學(xué)、回歸分析、時間序列分析、多元統(tǒng)計分析,抽樣技術(shù)、數(shù)據(jù)挖掘、國民經(jīng)濟核算、風(fēng)險管理、保險學(xué)、非壽險精算、統(tǒng)計軟件、金融計量學(xué)、統(tǒng)計調(diào)查等。
(二)重視教學(xué)方法改革
1.教師教學(xué)理念——單向灌輸式轉(zhuǎn)向引導(dǎo)探究式、教學(xué)案例能貼近實際問題(體測數(shù)據(jù)、大學(xué)生婚戀、手機);2.鼓勵學(xué)生參與各類項目——科研、調(diào)研、方案設(shè)計、抽樣調(diào)查、統(tǒng)計調(diào)查、學(xué)科競賽、教師課題(分解子課題);3.注重綜合能力提升——表達、協(xié)作、創(chuàng)新、研究報告、PPT展示等。
(三)建立完善的實踐教學(xué)系統(tǒng)
1.基本知識技能實驗——理論教學(xué)的課內(nèi)實驗,大一、二:數(shù)學(xué)類;大二、大三(上):專業(yè)基礎(chǔ);2.綜合性實踐教學(xué)——綜合性數(shù)據(jù)的采集、處理、分析,大三(下)、四(上):數(shù)據(jù)挖掘、統(tǒng)計軟件、統(tǒng)計調(diào)查;3.探索性實踐教學(xué)——社會調(diào)查、畢業(yè)實習(xí)、畢業(yè)論文,大四(下)。
(四)改革課程考試方式
1.基本知識(理論)+實驗報告(平時)+綜合實驗(期末)數(shù)學(xué)類;專業(yè)基礎(chǔ)課程;2.方案設(shè)計、調(diào)研報告、抽樣調(diào)查、統(tǒng)計調(diào)查;3.綜合實驗,數(shù)據(jù)挖掘、統(tǒng)計軟件。
最終學(xué)院統(tǒng)計系下設(shè)兩個教研室和一個研究中心,即基礎(chǔ)統(tǒng)計教研室、專業(yè)統(tǒng)計教研室和大數(shù)據(jù)統(tǒng)計科學(xué)應(yīng)用研究中心。秉承和依托母體學(xué)?!虾X斀?jīng)大學(xué)的辦學(xué)宗旨和學(xué)術(shù)底蘊。在全校統(tǒng)計學(xué)公共課教學(xué)方面,針對學(xué)生的特點,課程教學(xué)采用課堂教學(xué)、調(diào)查實踐與統(tǒng)計調(diào)查大賽相結(jié)合的教學(xué)方式與形式。也采取和校外企業(yè)、單位等合作項目老師指導(dǎo)學(xué)生參與的形式,這樣既提高學(xué)生的實踐能力又加強了師生之間的交流。在這樣邊學(xué)理論邊實踐的過程中也讓學(xué)生足夠了解現(xiàn)在企業(yè)所需人才的類型、找到自己的不足再補充理論方面的知識,然后學(xué)生還可以向?qū)W校反饋信息,這樣最終形成一個學(xué)院專業(yè)始終跟得上經(jīng)濟的發(fā)展形勢,不斷地改革和完善教學(xué)內(nèi)容,爭取培養(yǎng)出在各級政府機關(guān)、銀行、證券以及上市公司、企業(yè)集團、跨國公司等企事業(yè)單位和經(jīng)營管理機構(gòu)從事統(tǒng)計、市場調(diào)研、市場預(yù)測與決策、信息咨詢、可行性研究和綜合評價等實際工作以及科研單位從事研究工作的應(yīng)用型人才。
[1]邱東.大數(shù)據(jù)時代對統(tǒng)計學(xué)的挑戰(zhàn)[J].統(tǒng)計研究,2014(1):16-122.
[2][英]維克托·邁爾·舍恩伯格.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].袁杰譯.杭州:浙江人民出版社,2013:11-13.
[3]李衛(wèi)東.大數(shù)據(jù)對統(tǒng)計學(xué)科的影響[J].統(tǒng)計與決策,2014(13):F002.
[4]陶海映,李治國.淺談統(tǒng)計學(xué)基本問題[J].商業(yè)時代,2007(26):282.
[5][日]城田真琴.大數(shù)據(jù)的沖擊[M].周自恒譯.北京:人民郵電出版社,2013:223-224.
[6]李林杰,顧六寶,董正信.我國的統(tǒng)計學(xué)向何處去[J].統(tǒng)計研究,2000(2):33-37.
[7]李金昌.大數(shù)據(jù)與統(tǒng)計新思維[J].統(tǒng)計研究,2014(1):10-16.
大數(shù)據(jù)時代背景下對應(yīng)用統(tǒng)計學(xué)專業(yè)的思考*
孔曉瑞 劉夢玲 靳俊嬌
"Big data"is defined by Gartner,a research institute."Big data"is massive and diversified information assets that can grow at high rate and is with stronger decision-making ability,insight and the ability to optimize process with the help of new processing mode.Statistics can be applied in the research of big data,turning big data into small data.The search,clustering and classification of huge amounts of data depend on the general method of statistics,so researches on big data inherit some characteristics of the statistics.But big data has not been completely absorbed and applied by statistics,which is mainly due to two essential differences between big data and statistics. Therefore,under the background of big data,the cultivation quality of talents from applied statistics and how to re原form curriculum setting are important problems that applied undergraduate colleges and universities need to think.
big data;applied statistics;reform
C8文獻標志碼:A文章編號:2096-000X(2016)18-0041-03
2015年度上海財經(jīng)大學(xué)浙江學(xué)院院級課題
孔曉瑞(1989,01-),女,民族:漢,籍貫:河南周口,碩士研究生,助教,上海財經(jīng)大學(xué)浙江學(xué)院,大數(shù)據(jù)應(yīng)用研究中心主任,研究方向:經(jīng)濟統(tǒng)計、金融統(tǒng)計。
劉夢玲(1990,01-),女,民族:漢,籍貫:河南南陽,碩士研究生,助教,上海財經(jīng)大學(xué)浙江學(xué)院,統(tǒng)計系專業(yè)教研室主任,研究方向:經(jīng)濟統(tǒng)計、應(yīng)用統(tǒng)計。
靳俊嬌(1988,09-),女,民族:漢,籍貫:河南開封,碩士研究生,助教,研究方向:經(jīng)濟統(tǒng)計。