鐘勁松
● R軟件介紹
R是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng),它是免費(fèi)的自由軟件,有UNIX,Linux,MacOS和Windows版本,都可以免費(fèi)下載和使用。R具有豐富的資源,在官方網(wǎng)站上可以下載安裝程序,各種外掛程序和幫助文檔;具有良好的擴(kuò)展性,用戶可以編寫函數(shù)或者程序包,可以方便地載入程序包,如常見的圖形包graphics、統(tǒng)計(jì)包stats等。
1.界面介紹
R軟件界面簡單,由操作界面和輸出界面組成,如圖1所示。
2.工具欄和菜單欄介紹
菜單欄包括文件(輸入R代碼、建立新的程序腳本、打開程序腳本、顯示文件、載入工作空間、保存工作空間、載入歷史、保存歷史、改變當(dāng)前目錄、打印、保存文件、退出等),編輯(復(fù)制、粘貼、選擇一切、清除控制臺(tái)、數(shù)據(jù)編輯器等),其他(中斷目前的計(jì)算、緩沖輸出、列出目標(biāo)對(duì)象、刪除所有的目標(biāo)對(duì)象、列出查找路徑),程序包(載入程序包、設(shè)定CRAN鏡像、選擇存放處、安裝程序包、更新程序包等),幫助(控制臺(tái)、關(guān)于R的FAQ、手冊
工具欄主要是把一些常用的菜單命令做成按鈕。
● 制作各種統(tǒng)計(jì)圖
R是“命令行”驅(qū)動(dòng)軟件,即輸入命令,即可得到相應(yīng)的結(jié)果,功能非常強(qiáng)大,繪制統(tǒng)計(jì)圖是其主要功能之一。教師只要掌握幾個(gè)命令即可繪制所需的統(tǒng)計(jì)圖。下面用R命令制作中學(xué)階段常見的統(tǒng)計(jì)圖。
1.制作扇形統(tǒng)計(jì)圖
例1:已知某市2012年3月份晴天12天,陰天11天,雨天8天,用扇形統(tǒng)計(jì)圖描述天氣構(gòu)成。利用R軟件制作扇形統(tǒng)計(jì)圖的命令如下:
x<-c(11,12,8)
y<-x/sum(x)
names(y)<-c(“cloudy”,”sunny”,”rainny”)
pie(y,col=c(“green”,”red”,”brown”))
程序段的第一行是把數(shù)組(11,12,8)賦值給x,第二行sum(x)是計(jì)算數(shù)組中數(shù)字和,x/sum(x)計(jì)算的x的構(gòu)成,第三行給每一個(gè)構(gòu)成賦名,第四行是制圖命令行,其中函數(shù)pie( )為制作扇形統(tǒng)計(jì)圖命令,需要的參數(shù)為兩個(gè),第二個(gè)參數(shù)為扇形圖每個(gè)部分的顏色。
2.繪制散點(diǎn)圖
例2:在某地區(qū)的12~30歲居民中抽取10個(gè)樣本,其身高和體重如下:
繪制散點(diǎn)圖命令如下:
c(143,156,159,172,165,171,177,161,164,
160)->x
c(41,49,61,79,68,69,74,69,68,54)->y
plot(x,y)
plot( )函數(shù)具有豐富的作圖功能,既可以作散點(diǎn)圖,也可以作某個(gè)給定函數(shù)在某一區(qū)間的函數(shù)圖像。輸入help(plot)命令,彈出幫助文檔窗口,對(duì)plot函數(shù)的詳細(xì)的用法進(jìn)行說明。當(dāng)樣本數(shù)據(jù)量較少時(shí),可以從控制臺(tái)直接輸入,當(dāng)樣本數(shù)據(jù)量較大時(shí),可以從外部txt文件讀取。
3.繪制莖葉圖
對(duì)于沒有分段的數(shù)據(jù)可以用莖葉圖展示它們的特征,從數(shù)據(jù)的莖葉圖可以看出數(shù)據(jù)的分布形狀及數(shù)據(jù)是否對(duì)稱,是否集中分布等特征。
例3:下面是某市2012年7月11日至2012年8月1日空氣中可吸入顆粒物的監(jiān)測數(shù)據(jù)。(85 85 66 71 62 52 55 59 52 62 59 70 80 96 97 94 62 51 57 67 96 93)
其圖示如圖2,命令如下。
c(85,85,66,71,62,52,55,59,52,62,59,
70,80,96,97,94,62,51,57,67,96,93)->klw
stem(klw)
如果規(guī)定0~50之間為優(yōu),51~100之間為良,101~150之間為輕度污染,則能夠輕易從莖葉圖中獲得有多少天空氣質(zhì)量為優(yōu),多少天為良,多少天空氣輕度污染等信息。
4.繪制直方圖
R軟件繪制直方圖的命令為hist( ),其中直方圖中縱坐標(biāo)有兩種形式,其縱坐標(biāo)分別為頻數(shù)和頻率,橫坐標(biāo)表示各段的端點(diǎn)。
例4:下面是某城市公共圖書館在一年中通過隨機(jī)抽樣調(diào)查得到的60天的讀者借書數(shù),數(shù)據(jù)如下(已經(jīng)從小到大排列),繪制直方圖。
213 230 239 289 291 301 308 310 311 312 318 318 337 343 344 348 349 351 360 362 368 372 374 379 383 385 390 393 396 399 400 404 406 425 429 430 436 438 440 441 444 446 450 453 456 458 471 473 475 483 484 495 498 498 521 524 549 556 568 584
類似地,把60個(gè)數(shù)組成的數(shù)組賦值給某個(gè)變量,然后使用繪制直方圖命令hist( )繪制直方圖。命令如下:
u<-c(213, 230, 239, 289, 291, 301, 308, 310, 311, 312, 318, 318, 337, 343, 344, 348, 349, 351, 360, 362, 368, 372, 374, 379, 383, 385, 390, 393, 396, 399, 400, 404, 406, 425, 429, 430, 436, 438, 440, 441, 444, 446, 450, 453, 456, 458, 471, 473, 475, 483, 484, 495, 498, 498, 521, 524, 549, 556, 568, 584)
hist(u)
運(yùn)行上述兩行后在輸出界面會(huì)出現(xiàn)如圖3所示,其縱坐標(biāo)默認(rèn)為頻數(shù)(frequency),分成()=8個(gè)區(qū)間段,其中為樣本量。
繪制直方圖時(shí),一般用陰影填充每個(gè)小矩形,如果對(duì)應(yīng)的命令為hist(u,density=20),則其中20表示陰影線的密度,數(shù)值越大,陰影越密。同樣還可以設(shè)置矩形的填充顏色。
在繪制直方圖時(shí),根據(jù)需要縱坐標(biāo)有時(shí)為“頻率(density)”,其對(duì)應(yīng)的命令為hist(u,prob=TRUE),如下頁圖4所示。還可以把每個(gè)區(qū)間的樣本數(shù)量顯示在對(duì)應(yīng)的矩形上,對(duì)應(yīng)的命令為hist(u,labels=TRUE)。
hist( )函數(shù)中有很多可選參數(shù),既可以設(shè)置圖形橫軸和縱軸表示的實(shí)際意義的文本標(biāo)題及整個(gè)圖形的標(biāo)題,還可以根據(jù)需要設(shè)置分段的個(gè)數(shù)。參看更多的幫助,可輸入命令help(hist),即可獲得hist( )函數(shù)的幫助文檔。
● 與統(tǒng)計(jì)有關(guān)的計(jì)算
1.計(jì)算平均數(shù)
如例3中klw的平均值,其命令為:mean(klw),結(jié)果顯示為:[1]71.40909。
2.計(jì)算標(biāo)準(zhǔn)差
計(jì)算klw的標(biāo)準(zhǔn)差,其命令為:sd(klw),結(jié)果顯示為:[1]16.36465。
3.計(jì)算方差
計(jì)算klw的方差,其命令為:var(klw),結(jié)果顯示為:[1]264.5390。
4.計(jì)算一元線性回歸方程
如求例2中數(shù)據(jù)的回歸直線,其命令為:
x<-c(143,156,159,172,165,171,177,161,
164,160)
y<-c(41,49,61,79,68,69,74,69,68,54)
lm(y-x)
其顯示結(jié)果為:-119.13 1.12。
即一元線性回歸直線為y=1.12x-119.13。
● 結(jié)語
使用專業(yè)統(tǒng)計(jì)軟件R可以進(jìn)行各種統(tǒng)計(jì)計(jì)算和制作統(tǒng)計(jì)圖,既形象又直觀。熟練掌握R,教師可以花更多的時(shí)間進(jìn)行數(shù)據(jù)分析,讓學(xué)生體會(huì)數(shù)據(jù)中蘊(yùn)含的信息。