趙麗琴
(山西財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院,山西 太原 030006)
多元統(tǒng)計(jì)分析方法是處理多維數(shù)據(jù)不可缺少的統(tǒng)計(jì)方法。隨著大數(shù)據(jù)規(guī)模和數(shù)據(jù)類型等特點(diǎn)的不斷升級(jí)變化,對(duì)多維數(shù)據(jù)分析提出了更高的要求,意味著在大數(shù)據(jù)浪潮下,作為大數(shù)據(jù)思維前提的《多元統(tǒng)計(jì)分析》課程,有必要進(jìn)行系統(tǒng)性地綜合改革。
多元統(tǒng)計(jì)分析是統(tǒng)計(jì)類專業(yè)的核心課程,大數(shù)據(jù)技術(shù)是由計(jì)算機(jī)人開(kāi)發(fā)的借鑒了多元思想的面向大數(shù)據(jù)的一系列算法。二者存在著很強(qiáng)的聯(lián)系,但基于數(shù)據(jù)的不同,也有區(qū)別之處。
多元統(tǒng)計(jì)分析方法主要有聚類分析、判別分析、主成分分析、因子分析、相應(yīng)分析、典型相關(guān)分析、多維標(biāo)度法、可視化技術(shù)等。依據(jù)各個(gè)方法的主要原理將這些方法的功能分為五類:分類與分組、數(shù)據(jù)的結(jié)構(gòu)化簡(jiǎn)、依賴關(guān)系研究、預(yù)測(cè)、假設(shè)的構(gòu)造與檢驗(yàn)。
大數(shù)據(jù)技術(shù)是根據(jù)特定目標(biāo),進(jìn)行數(shù)據(jù)收集與存儲(chǔ)、數(shù)據(jù)篩選、算法分析與預(yù)測(cè)、數(shù)據(jù)分析結(jié)果展示,從而幫助做出正確的抉擇。常見(jiàn)的大數(shù)據(jù)算法有:分類和預(yù)測(cè)、關(guān)聯(lián)分析、聚類、異常值探測(cè)、序列模式挖掘。
1.聯(lián)系
兩類技術(shù)的功能有很多相同之處:都是為了發(fā)現(xiàn)數(shù)據(jù)中的結(jié)構(gòu)和模式;都具有分類和預(yù)測(cè)功能;都能描述變量或現(xiàn)象間的相關(guān)和關(guān)聯(lián)性;很多方法的數(shù)學(xué)和統(tǒng)計(jì)基礎(chǔ)相同。
2.區(qū)別
基于對(duì)數(shù)據(jù)和計(jì)算機(jī)能力要求的不同,二者也存在著很多的不同之處:對(duì)數(shù)據(jù)量的大小和類型要求不一樣;學(xué)科基礎(chǔ)有不同之處;目標(biāo)和任務(wù)及其分析邏輯上存在差異。
結(jié)合本校的研究生課程設(shè)置特點(diǎn),針對(duì)大數(shù)據(jù)背景下的課程改革要求,進(jìn)行為期約3年的教學(xué)實(shí)踐。共有8次課32課時(shí)的內(nèi)容。前3次課,在大數(shù)據(jù)背景下對(duì)已學(xué)內(nèi)容進(jìn)行梳理和總結(jié);后面4次課有針對(duì)性地介紹幾種大數(shù)據(jù)挖掘方法;最后一次課,進(jìn)行交流和心得體會(huì)。
在教學(xué)實(shí)踐思想指導(dǎo)下,在近3年的實(shí)踐中,課程教學(xué)改革取得了一些成效。
關(guān)于大數(shù)據(jù)和利用多元統(tǒng)計(jì)方法進(jìn)行分析的文章逐年增多。2015年后半年本課程正在嘗試進(jìn)行改革,相關(guān)論文只有2篇,2016年和2017年,課程改革已過(guò)兩年多,分別增長(zhǎng)到4篇和10篇,在當(dāng)年畢業(yè)生人數(shù)中占到約30%的比重(2017年),絕對(duì)量和相對(duì)數(shù)得到明顯提升。
學(xué)生在課下利用網(wǎng)絡(luò)課程等方式自主學(xué)習(xí)軟件,并嘗試編程,使得軟件編程能力有所提高。不僅限于R軟件的學(xué)習(xí),有的還學(xué)習(xí)了Python、Hadoop、Java、SAS等其他軟件。
通過(guò)老師拋磚引玉地提供知識(shí)點(diǎn)和前沿領(lǐng)域信息,學(xué)生能夠根據(jù)興趣,利用互聯(lián)網(wǎng)查閱和學(xué)習(xí)相關(guān)知識(shí),逐漸形成了較強(qiáng)的自主學(xué)習(xí)能力,在線搜索能力和在大量雜亂信息中獲取有效知識(shí)的能力也不斷得到增強(qiáng)。
鼓勵(lì)學(xué)生嘗試用Python軟件、R或者八爪魚等軟件在開(kāi)放的平臺(tái)或相關(guān)的互聯(lián)網(wǎng)端口獲取有用的數(shù)據(jù)。如畢業(yè)論文《基于社交網(wǎng)絡(luò)平臺(tái)的股市信息傳遞特征研究—以新浪微博為例》、《互聯(lián)網(wǎng)個(gè)人信用評(píng)估研究——基于不平衡樣本視角》、《有限關(guān)注和媒體輿論導(dǎo)向?qū)善苯灰子绊懷芯俊?,分別要在新浪微博、互聯(lián)網(wǎng)平臺(tái)、社交平臺(tái)的端口來(lái)采集數(shù)據(jù)。
經(jīng)過(guò)第一個(gè)階段的數(shù)學(xué)推導(dǎo)訓(xùn)練,大部分學(xué)生的數(shù)學(xué)基礎(chǔ)進(jìn)一步牢固,數(shù)理推導(dǎo)能力顯著提升,看文獻(xiàn)時(shí)輕松多了;搞清楚數(shù)學(xué)原理后,編程也沒(méi)那么難了。
當(dāng)前全國(guó)各大高校都在重新制定人才培養(yǎng)方案,培養(yǎng)目標(biāo)明確導(dǎo)向“加強(qiáng)大數(shù)據(jù)的采集與分析與市場(chǎng)需求緊密聯(lián)系的課程教育”。在大數(shù)據(jù)浪潮下,能在教學(xué)中主動(dòng)將傳統(tǒng)課程結(jié)合大數(shù)據(jù)進(jìn)行改革是有意義的。希望通過(guò)改革,能培養(yǎng)出更多的適應(yīng)社會(huì)需求的統(tǒng)計(jì)人才!