陳蕾蕾
(西北民族大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,甘肅 蘭州 730000)
由于目前高校在數(shù)學(xué)建模教學(xué)過程中[1],仍普遍存在教學(xué)方式古板、單一、純理論的現(xiàn)象,學(xué)生們單單掌握理論還不夠,需要?jiǎng)?chuàng)新教學(xué)方式,理論知識(shí)的實(shí)踐化更適應(yīng)社會(huì)科學(xué)技術(shù)的變化。知識(shí)儲(chǔ)存不足,學(xué)生在課堂上無法接觸到更多的知識(shí),這使得學(xué)生的自學(xué)能力變得尤其重要。學(xué)生缺乏應(yīng)用能力,將數(shù)學(xué)建模融入教學(xué)中,將理論知識(shí)和實(shí)際生活中的問題有機(jī)結(jié)合,在兩者之間構(gòu)造了一座橋梁,激發(fā)學(xué)生的興趣,學(xué)生自發(fā)的學(xué)習(xí)擴(kuò)展,引導(dǎo)培養(yǎng)學(xué)生的探討應(yīng)用能力。在各類數(shù)學(xué)建模競賽中,可以鍛煉和發(fā)展學(xué)生的數(shù)學(xué)建模能力。
在對現(xiàn)實(shí)中的社會(huì)、經(jīng)濟(jì)、生產(chǎn)等現(xiàn)象的認(rèn)識(shí)及解讀時(shí),由于現(xiàn)象的發(fā)生不僅僅被一種指標(biāo)所控制,大多數(shù)的各類現(xiàn)象具有多維特征。所以經(jīng)常需要用多個(gè)指標(biāo)進(jìn)行描述、測量和分析現(xiàn)象的特征和狀態(tài)。
理論上,多個(gè)變量分開,一次研究一個(gè)變量或者兩兩進(jìn)行研究之間的關(guān)系,雖然簡單,但它的缺點(diǎn)也很明顯,沒有考慮到變量之間的相互關(guān)系,分開研究會(huì)導(dǎo)致變量之間的相互關(guān)系在處理一開始就丟失了,會(huì)對最終模型的精度影響極大。因此,采取多個(gè)變量合在一起研究的方法,多元統(tǒng)計(jì)分析方法就十分有效,揭示了變量之間的內(nèi)在相互關(guān)系,經(jīng)過檢驗(yàn),這種分析結(jié)果通常有效,也比較典型。
多元數(shù)據(jù)的處理[2]也是構(gòu)建模型的關(guān)鍵,它極大可能影響數(shù)學(xué)建模的結(jié)果和精度,也是引起誤差的重要原因之一。數(shù)據(jù)處理常見的有數(shù)據(jù)的初步處理,即對數(shù)據(jù)進(jìn)行排序,按類匯總,計(jì)算頻數(shù)、方差、標(biāo)準(zhǔn)差等,甚至可以利用SPSS對數(shù)據(jù)繪制散點(diǎn)圖、曲線圖、折線圖、直方圖、雙軸圖、面積圖等,觀察數(shù)據(jù)的發(fā)展趨勢;在競賽中還經(jīng)常用的方法有插值和擬合的思想,插值思想一般可分為拉格朗日插值、分段插值、樣條插值等,不同的插值方式,得到的插值數(shù)據(jù)以及曲線的光滑程度是不一樣的,如何選擇就是關(guān)鍵。而擬合一般可以分為線性擬合、多項(xiàng)式擬合和曲線擬合。而在SPSS操作中,可以選用關(guān)于多種擬合參數(shù)的模型,來實(shí)現(xiàn)擬合度對比,以便尋找到最優(yōu)擬合參數(shù)曲線模型。
(1)提出問題和確定目標(biāo)。由于實(shí)際問題的錯(cuò)綜復(fù)雜,變量數(shù)量之多、變量之間的關(guān)系復(fù)雜,因而需要在復(fù)雜的數(shù)量關(guān)系中確定問題的目標(biāo)。
(2)選取和設(shè)置指標(biāo)。需要查閱文獻(xiàn),需要相關(guān)理論的支持,指標(biāo)體系的選取一定程度上決定模型的精度。指標(biāo)的選取還是基于統(tǒng)計(jì)數(shù)據(jù)的數(shù)學(xué)特性,對數(shù)據(jù)進(jìn)行描述,基于推論,運(yùn)用分析策略構(gòu)建模型。
(3)搜集、整理、處理統(tǒng)計(jì)數(shù)據(jù)。多元統(tǒng)計(jì)分析模型的建立是在指標(biāo)變量的樣本統(tǒng)計(jì)數(shù)據(jù),選取的指標(biāo)數(shù)據(jù)質(zhì)量決定了模型的作用。在整理、處理數(shù)據(jù)時(shí),大致有剔除異常數(shù)據(jù)、對指標(biāo)數(shù)據(jù)進(jìn)行規(guī)格化、標(biāo)準(zhǔn)化等數(shù)據(jù)處理,以便后續(xù)模型的建立。數(shù)據(jù)處理時(shí)有一些常見的錯(cuò)誤,由于缺乏對實(shí)際問題領(lǐng)域知識(shí)的理解,會(huì)出現(xiàn)大量的錯(cuò)誤,辛普森悖論,以偏概全,抽樣過程中,樣本無法代表總體的真實(shí)情況。
(4)根據(jù)問題及數(shù)據(jù)的特征,選擇合適的多元統(tǒng)計(jì)分析方法,構(gòu)造理論模型。若研究多變量之間的關(guān)系,可采用因子分析、主成分分析、回歸分析、典型相關(guān)分析等方法,若研究的是事物分類,則可選用聚類分析、判別分析等工具。
(5)利用SPSS等計(jì)算軟件,對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)計(jì)算,參數(shù)估算模型。
(6)模型的檢驗(yàn)與調(diào)試。對模型的檢驗(yàn)是必不可少的,如果檢驗(yàn)不達(dá)標(biāo),就需要對模型調(diào)試直至得到相對滿意的模型。
(7)模型的應(yīng)用。
SPSS在數(shù)學(xué)建模應(yīng)用中發(fā)揮著重要的作用[3],尤其是在多元統(tǒng)計(jì)分析策略中的模型的構(gòu)建、求解、檢驗(yàn),并且SPSS操作簡單,容易上手。SPSS的數(shù)據(jù)編輯器、輸出等界面,通過現(xiàn)有的菜單和對話框操作,圖表類型的輸出,操作者幾乎可以完全自動(dòng)的對自變量數(shù)據(jù)進(jìn)行預(yù)處理、篩選、模型優(yōu)化、檢驗(yàn)等工作,使得在分析數(shù)據(jù)和建模的過程中,變得更為直觀。
多元回歸分析主要應(yīng)用為預(yù)測、控制分析,尋找多變量之間的關(guān)系,在各個(gè)領(lǐng)域都能看到這種處理手段,構(gòu)建多元回歸模型時(shí),首先要找到相關(guān)性強(qiáng)的變量,尋找變量通常采用逐步回歸法,對其數(shù)據(jù)進(jìn)行無量綱化,即數(shù)據(jù)的標(biāo)準(zhǔn)化,選入變量,修正參數(shù)以至達(dá)到要求,對變量采用F檢驗(yàn),決定該變量是否應(yīng)該剔除;然后利用最小二乘法對參數(shù)進(jìn)行估計(jì)時(shí),定下假定,目的是最終的參數(shù)的表達(dá)是唯一的。多元回歸模型的檢驗(yàn),只要是進(jìn)行擬合優(yōu)度檢測、方差顯著性檢驗(yàn)、參數(shù)顯著性檢驗(yàn);模型的預(yù)測或控制。
模型的優(yōu)化,可以從自變量出發(fā),變量之間的關(guān)系可能還存在多重共線性問題、異方差問題、自相關(guān)問題,確定發(fā)生的問題,對存在的問題進(jìn)行分類的處理,由此提出了一些可以優(yōu)化的模型建立思路。SPSS成非統(tǒng)計(jì)專業(yè)的學(xué)生就解決數(shù)據(jù)分析的數(shù)學(xué)建模競賽問題的有力工具。
簡單來講,就是對數(shù)據(jù)進(jìn)行可視化處理,即繪制圖標(biāo),可以是散點(diǎn)圖或折線圖等,繪制成圖表后,數(shù)據(jù)的趨勢和聯(lián)系就可以由圖可得,實(shí)際應(yīng)用中散點(diǎn)圖更為廣泛,因?yàn)樯Ⅻc(diǎn)圖去除了時(shí)間維度的影響。單一圖表相關(guān)分析往往是缺乏說服力和可信度,所以需要對相關(guān)關(guān)系進(jìn)行度量,因此需要使用協(xié)方差及協(xié)方差矩陣分析。
通過計(jì)算協(xié)方差和協(xié)方差矩陣,度量變量之間的相關(guān)性。協(xié)方差是衡量兩個(gè)變量的總體誤差,如果協(xié)方差為正值0,說明兩個(gè)變量正相關(guān),變化的趨勢一致,如果協(xié)方差為負(fù)值,說明兩個(gè)變量是負(fù)相關(guān),若協(xié)方差為0,說明兩個(gè)變量相互獨(dú)立。涉及3個(gè)變量,即x,y,z,使用協(xié)方差矩陣計(jì)算,互相兩兩變量之間的協(xié)方差矩陣構(gòu)成協(xié)方差矩陣。
相關(guān)系數(shù)是反應(yīng)變量之間密切程度的統(tǒng)計(jì)指標(biāo),以下是相關(guān)系數(shù)的計(jì)算關(guān)系:
其中:rxy是樣本的相關(guān)系數(shù),Sxy表示總體樣本的協(xié)方差,Sx表示樣本為X的標(biāo)準(zhǔn)差,Sy表示為樣本為Y的標(biāo)準(zhǔn)差。
相關(guān)系數(shù)越靠近0相關(guān)性越弱,而越靠近1相關(guān)性越強(qiáng)。
數(shù)學(xué)模型是基礎(chǔ)到深入,粗略到高精度,不斷優(yōu)化的過程,這就需要不斷學(xué)習(xí)和研究,提前將這種數(shù)據(jù)建模思想融入高等教學(xué)中,雖然是一個(gè)任重而道遠(yuǎn)的任務(wù),但是可以在潛移默化中提高學(xué)生們的建模能力,思考問題的能力,鍛煉了學(xué)生們的邏輯能力以及書寫學(xué)術(shù)論文的能力,積累經(jīng)驗(yàn),激發(fā)學(xué)生的創(chuàng)新建模能力。
數(shù)學(xué)建模是一種解決實(shí)際問題的過程,頭腦風(fēng)暴,通過問題的數(shù)據(jù)、性質(zhì)、機(jī)理,對實(shí)際問題的求解及優(yōu)化的過程,亦是一種理論的實(shí)踐化過程,對數(shù)據(jù)信息的處理過后,通過抽象假設(shè)、引進(jìn)變量,通過數(shù)學(xué)理論知識(shí)表達(dá)實(shí)際問題、求解實(shí)際問題。針對理論與實(shí)踐的一種思維的培養(yǎng),在高等教育中,開設(shè)數(shù)學(xué)建模和模型賞析的課程對培養(yǎng)學(xué)生的各方面能力有極大的提升作用。
在日常教學(xué)過程中可以滲透建模的模型知識(shí)以及建模的方法,體會(huì)數(shù)學(xué)的強(qiáng)應(yīng)用性,對數(shù)學(xué)建模乃至數(shù)學(xué)產(chǎn)生興趣以及積極性,突出學(xué)生的主動(dòng)性,掌握數(shù)學(xué)建模的思想和方法。
在高校可以鼓勵(lì)參加數(shù)學(xué)建模競賽,成立教師教學(xué)研究和指導(dǎo)團(tuán)隊(duì),加強(qiáng)教學(xué)能力和宣傳力度,提高學(xué)生的參與感,在競賽中不僅鍛煉了能力,還提升了研究學(xué)術(shù)上的能力。
對于數(shù)學(xué)建模競賽中大數(shù)據(jù)的賽題,基本上都能通過多元統(tǒng)計(jì)分析構(gòu)建和求解模型,并得到進(jìn)一步優(yōu)化的模型。在高等教育中,也要將數(shù)學(xué)建模的思想應(yīng)用在課堂教學(xué)上,激發(fā)學(xué)生們的創(chuàng)新能力,培養(yǎng)他們理論知識(shí)的實(shí)踐能力,也提升高等教育的教學(xué)效果。