陸峰 王愛(ài)軍
我們正處于一個(gè)信息爆炸的時(shí)代,每天都會(huì)被各種各樣的“大數(shù)據(jù)”包圍著,面對(duì)著紛繁冗雜的各種數(shù)據(jù),具備“數(shù)據(jù)分析”能力就顯得尤為重要,“數(shù)據(jù)分析”是指從研究對(duì)象獲得相關(guān)數(shù)據(jù),運(yùn)用統(tǒng)計(jì)分析等數(shù)學(xué)方法對(duì)數(shù)據(jù)中的有用信息進(jìn)行分析和推斷,形成知識(shí)的過(guò)程,主要包括:收集數(shù)據(jù),整理數(shù)據(jù),提取信息,構(gòu)建模型對(duì)信息進(jìn)行分析、推斷,獲得結(jié)論,數(shù)據(jù)分析是大數(shù)據(jù)時(shí)代數(shù)學(xué)應(yīng)用的主要方法,已經(jīng)深入到現(xiàn)代社會(huì)生活和科學(xué)研究的各個(gè)方面,在數(shù)據(jù)分析核心素養(yǎng)的形成過(guò)程中,要求我們要提升數(shù)據(jù)處理的能力,增強(qiáng)基于數(shù)據(jù)表達(dá)現(xiàn)實(shí)問(wèn)題的意識(shí),養(yǎng)成通過(guò)數(shù)據(jù)思考問(wèn)題的習(xí)慣,積累依托數(shù)據(jù)探索事物本質(zhì)、關(guān)聯(lián)和規(guī)律的活動(dòng)經(jīng)驗(yàn)。
一、直觀感知數(shù)據(jù),“初加工”后嘗試進(jìn)行“毛估"
毛估是一種快速的近似估算,它的基本特點(diǎn)是對(duì)數(shù)值作擴(kuò)大或縮小,從而對(duì)運(yùn)算結(jié)果確定出一個(gè)范圍或作出一個(gè)估計(jì),更本質(zhì)地看毛估,它應(yīng)該是直覺(jué)基礎(chǔ)上的一種數(shù)學(xué)意識(shí),是在蜂擁而來(lái)的眾多信息面前,迅速捕捉一批有用或關(guān)鍵信息的那種數(shù)學(xué)素質(zhì)。
二、慧眼看待數(shù)據(jù),勿讓數(shù)據(jù)蒙蔽了我們的雙眼
對(duì)于同一個(gè)數(shù)據(jù),不同的人往往有不同的解讀,這是由于為了論述自己的論點(diǎn)是正確的,不少人總喜歡從自己的角度帶有感情色彩地看待手中的數(shù)據(jù),這時(shí)你怎么辦?是人云亦云、鸚鵡學(xué)舌嗎?當(dāng)然不能!借用那英的歌詞:給我給我一雙慧眼吧,讓我把這紛擾看個(gè)清清楚楚明明白白真真切切,
例3(2016年第19屆北京高中數(shù)學(xué)知識(shí)應(yīng)用競(jìng)賽第3題)2015年11月4日,某媒體北京報(bào)道:在2013年3月13日曾經(jīng)報(bào)道過(guò)京城“菜籃子”,記者在一個(gè)菜市場(chǎng)調(diào)查,用10元錢可以買3.3斤油麥菜,或者10斤胡蘿卜,或者4根大蔥;現(xiàn)在記者又來(lái)到菜市場(chǎng)調(diào)查,用10元錢買同樣的三種蔬菜,可以買3.3斤油麥菜,或者5斤胡蘿卜,或者10根大蔥,記者由此給出結(jié)論:現(xiàn)在京城“菜籃子”物價(jià)水平與兩年前變化不大。
嚴(yán)同學(xué)看到上述信息,指出:這樣的結(jié)論不可靠,(1)你同意嚴(yán)同學(xué)的觀點(diǎn)嗎?為什么?(2)如果同意嚴(yán)同學(xué)的觀點(diǎn),請(qǐng)你為“某媒體”作出2015年11月4日?qǐng)?bào)道新方案,并對(duì)“菜籃子”物價(jià)水平作出可靠分析,
(注:“斤”為舊的市制質(zhì)量單位,1斤=0.5千克)
解(1)同意,原因是以下兩方面:①蔬菜是季節(jié)性商品,不同季節(jié)的物價(jià)差異很大,2013年3月13日是冬末春初,而2015年11月4日為秋末冬初,這兩個(gè)季節(jié)的蔬菜價(jià)格沒(méi)可比性;②報(bào)道中作出的結(jié)論只依據(jù)了10元錢購(gòu)買三種蔬菜價(jià)格變化情況,品種太少,權(quán)威部門的蔬菜價(jià)格指數(shù)涉及到近20個(gè)蔬菜品種,可見(jiàn)用三種蔬菜不足以說(shuō)明問(wèn)題,
(2)為了作出“現(xiàn)在”(2015年11月4日)的京城“菜籃子”物價(jià)水平與兩年前比較的可靠的結(jié)論報(bào)道,要分以下幾步來(lái)做,
第一步:直接采集官方公布的2013年11月初的某一天和2015年11月初的某一天的多種蔬菜價(jià)格數(shù)據(jù),由于權(quán)威部門的蔬菜價(jià)格指數(shù)涉及到近20個(gè)蔬菜品種,所以這里數(shù)據(jù)涉及的品種也要十幾種才能說(shuō)明一些問(wèn)題,下面是來(lái)自中國(guó)好鮮生網(wǎng)WWW,guoshul23,cn新發(fā)的農(nóng)產(chǎn)品有限公司在2013年11月3日16種蔬菜的中間批發(fā)價(jià)數(shù)據(jù),單位為元/斤。
第三步:計(jì)算16種蔬菜的平均變化率P.P=-29.6%。
第四步:得出結(jié)論,2015年11月3日的物價(jià)(批發(fā)價(jià))水平比兩年前同期下降了約29.6%。
需要說(shuō)明的是,蔬菜價(jià)格數(shù)據(jù)應(yīng)當(dāng)是某一個(gè)具有代表性的農(nóng)貿(mào)市場(chǎng)的零售價(jià)格,或是多個(gè)農(nóng)貿(mào)市場(chǎng)的零售價(jià)格的平均值,現(xiàn)在的數(shù)據(jù)可以通過(guò)市場(chǎng)調(diào)查得到,但是,一般人想拿到兩年前的相關(guān)數(shù)據(jù)很困難,所以這里采用了可以查到的批發(fā)價(jià)格。
按照批發(fā)價(jià)的數(shù)據(jù)表,油麥菜和大蔥的兩年價(jià)格基本相當(dāng),而除了這兩種蔬菜,其他14種蔬菜降幅百分比都是兩位數(shù),平均降幅為33%。
而在查找數(shù)據(jù)時(shí),發(fā)現(xiàn)2015年11月3日有“胡蘿卜(洗)”的中間批發(fā)價(jià)為0.85元/斤,價(jià)格顯然比“胡蘿卜”的高很多,也比兩年前的“胡蘿卜”高,而在2013年11月5日的資料中沒(méi)見(jiàn)“胡蘿卜(洗)”這個(gè)品種,如果不注意胡蘿卜是否“洗”過(guò),就會(huì)出現(xiàn)價(jià)格誤解。
由此可見(jiàn),即便使用兩年11月初(同期)油麥菜和大蔥的價(jià)格比較來(lái)評(píng)價(jià)整體物價(jià)水平,也是不對(duì)的,它們的價(jià)格水平變化不具有代表性!“某媒體”對(duì)京城“菜籃子”的價(jià)格水平比較方法是錯(cuò)誤的,而且結(jié)論也是錯(cuò)誤的。
三、實(shí)際收集數(shù)據(jù),學(xué)會(huì)分析其中蘊(yùn)涵的規(guī)律
現(xiàn)實(shí)生活中與我們密切相關(guān)的數(shù)據(jù)有很多,有時(shí)候直接采集會(huì)有困難,但我們可以從資料上收集,并進(jìn)行整理、分析,尤其要關(guān)注社會(huì)熱點(diǎn)問(wèn)題,在數(shù)據(jù)中我們可以進(jìn)一步探究其中蘊(yùn)涵的規(guī)律性的東西,積累依托數(shù)據(jù)探索事物本質(zhì)、關(guān)聯(lián)和規(guī)律的活動(dòng)經(jīng)驗(yàn),以下這道與“環(huán)?!毕嚓P(guān)的問(wèn)題就很有現(xiàn)實(shí)意義。
例4某化工企業(yè)每月收入為80萬(wàn)元,從今年起,若不改善生產(chǎn)環(huán)境,則在生產(chǎn)過(guò)程中產(chǎn)生的污水由污水廠處理,每月上交定額5萬(wàn)元的治污費(fèi),如果該企業(yè)從今年1月份起投資300萬(wàn)元增加回收凈化設(shè)備以改善生產(chǎn)環(huán)境,降低企業(yè)生產(chǎn)成本,已知該設(shè)備每月的運(yùn)轉(zhuǎn)費(fèi)用是0.2萬(wàn)元,問(wèn):經(jīng)過(guò)多少個(gè)月,投資開(kāi)始見(jiàn)效,即投資改造后的月累計(jì)純收入多于不改造時(shí)的月累計(jì)純收入?
因此在短時(shí)間內(nèi),企業(yè)采取節(jié)能減排措施需要的投資是一筆不小的數(shù)目,甚至?xí)?duì)企業(yè)資金的周轉(zhuǎn)產(chǎn)生一定的影響,故一些企業(yè)不愿積極主動(dòng)采取措施,但從長(zhǎng)遠(yuǎn)來(lái)看,若企業(yè)采取了節(jié)能減排措施,不但改善了生產(chǎn)環(huán)境,而且還為企業(yè)帶來(lái)了更大的經(jīng)濟(jì)效益和更強(qiáng)的市場(chǎng)競(jìng)爭(zhēng)力,應(yīng)值得推廣。
5.模型的評(píng)價(jià)與改進(jìn),
模型最大優(yōu)點(diǎn)在于對(duì)原始數(shù)據(jù)擬合時(shí),采用多種方法進(jìn)行,使之愈來(lái)愈完善,具有很高的擬合精度,但沒(méi)有考慮眾多的實(shí)際因素的影響,只是出于一種相對(duì)理想的狀態(tài)下進(jìn)行分析求解,可能投入現(xiàn)實(shí)中達(dá)不到預(yù)想的結(jié)果,若考慮由于原材料價(jià)格變化,以及設(shè)備老化而產(chǎn)生的維修費(fèi)用等眾多的實(shí)際因素的影響,并采用整個(gè)行業(yè)平均數(shù)據(jù)作為樣本進(jìn)行建模,所得模型可能更具有代表性。