潘偉權(quán) 李麗潔 羅小青
摘要:本文通過構(gòu)建Shiny程序,以統(tǒng)計學(xué)教學(xué)中的重難點(diǎn)知識,假設(shè)檢驗(yàn)和區(qū)間估計為案例進(jìn)行可視化交互式教學(xué),利用交互式的程序,幫助學(xué)生更好的理解與掌握這兩個重要概念。這兩個案例表明,將Shiny運(yùn)用到統(tǒng)計學(xué)的課堂教學(xué)中,有助于將抽象的知識直觀化,能激發(fā)學(xué)生學(xué)習(xí)興趣,加深學(xué)生在重難點(diǎn)知識上的理解。
關(guān)鍵詞:Shiny;可視化;交互式;假設(shè)檢驗(yàn)
1引言
Shiny[1]是一種基于web的可視化交互式應(yīng)用程序,是R Studio開發(fā)的一種技術(shù)。它是R軟件的web應(yīng)用框架,將現(xiàn)有的R腳本轉(zhuǎn)換成Shiny的應(yīng)用程序并不困難,用戶不需要學(xué)習(xí)R語言語法,也不需要在R源代碼中進(jìn)行更改就可以使用并繪制圖形[2]。本文將使用Shiny應(yīng)用程序?qū)y(tǒng)計學(xué)中的假設(shè)檢驗(yàn)與區(qū)間估計的知識點(diǎn)進(jìn)行統(tǒng)計教學(xué),所生成的程序允許學(xué)生操作方程中的變量,通過圖像直觀展示結(jié)果,從而更好地理解這些變量之間的關(guān)系,將假設(shè)檢驗(yàn)中的一些概念理解得更為透徹。
2案例一
假設(shè)檢驗(yàn)不僅是一種定量分析的重要方法,也是大學(xué)階段統(tǒng)計學(xué)課程教學(xué)的重點(diǎn)之一[3],現(xiàn)實(shí)生活中有大量的實(shí)例可以歸結(jié)為假設(shè)檢驗(yàn)的問題。在講解之前,同學(xué)們需要了解假設(shè)檢驗(yàn)是立足于小概率,給定很小的顯著性水平去檢驗(yàn)對總體參數(shù)的假設(shè)是否成立。
當(dāng)原假設(shè)與備擇假設(shè)互斥時,肯定原假設(shè),意味著放棄備擇假設(shè);否定原假設(shè),意味著接受備擇假設(shè)。
利用Shiny繪制出服從正態(tài)分布的假設(shè)檢驗(yàn)的示意圖并設(shè)置好相應(yīng)用于互動的參數(shù)范圍,學(xué)生可以指定不同的顯著性水平,觀察檢驗(yàn)圖會有怎樣的變化,熟悉檢驗(yàn)圖的構(gòu)造。在這里需要注意的是顯著性水平和置信水平不是同一概念。在圖1中,顯示的是顯著性水平的單側(cè)檢驗(yàn)示意圖,圖中的紅線所在的位置表示的是臨界值,紅線的左側(cè)區(qū)域我們把它稱作拒絕域,正如圖1所標(biāo)示的位置。當(dāng)觀察結(jié)果落入拒絕域中表示拒絕了原假設(shè),此時犯了第Ⅰ類錯誤,雖然這類錯誤發(fā)生的概率非常小,但是無法避免。圖中紅線的外側(cè)面積大小表示著的大小。而紅線的右側(cè)區(qū)域,我們稱作接受域,即接受提出的原假設(shè)。
我們了解了檢驗(yàn)示意圖的基本構(gòu)成以后,我們再利用雙側(cè)檢驗(yàn)示意圖來觀察在不同顯著性水平的情況下是怎樣變化的。學(xué)生通過操作左側(cè)下拉按鈕選擇不同的顯著性水平,其中圖2、3分別選擇的是在、時的雙側(cè)檢驗(yàn)圖,對比觀察到隨著顯著性水平的提高,拒絕域就會越大。
3案例二
由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間就稱為置信區(qū)間[5]。置信區(qū)間是一個估算值,它具有多個組件,包括點(diǎn)估計、樣本量、標(biāo)準(zhǔn)誤差和置信度。這些組件是理解其中的關(guān)鍵,改變置信區(qū)間的多個組件可以提供更深入的了解??偠灾P(guān)鍵是學(xué)生要學(xué)會辨識置信區(qū)間的細(xì)微差別,以及它們在確定置信區(qū)間時所扮演的角色。下面通過把一電影票房數(shù)據(jù)的置信區(qū)間及自行生成的多個樣本數(shù)據(jù)可視化,以便說明Shiny在這一過程中的應(yīng)用。
很明顯在圖4中求了出31部電影平均首周票房的95%的置信區(qū)間為(2096.56,3569.15)。在圖片的左側(cè)是學(xué)生可以操作的模塊,學(xué)生可根據(jù)不同置信水平來觀察確定置信區(qū)間的變化,其中系數(shù)設(shè)置有0.01、0.025、0.05、0.1等,分別對應(yīng)的置信水平為98%、95%、90%、80%。而右側(cè)部分的線圖則是Shiny應(yīng)用程序的結(jié)果顯示。學(xué)生通過點(diǎn)擊下拉按鈕選擇不同的置信系數(shù),可以得到發(fā)生改變的置信區(qū)間。圖4中顯示的下限是通過從點(diǎn)估計中減去誤差來計算的,教師需要先進(jìn)行例題示范教學(xué),然后就可以讓學(xué)生自行操作了。
圖5是顯示90%置信水平下的區(qū)間,建立圖5是為了與圖4形成對比,比較在不同的置信水平下的置信區(qū)間是怎樣改變的。當(dāng)樣本量給定時,置信區(qū)間的寬度隨著置信水平的提高而增大。
在教科書中,學(xué)生大多是通過靜態(tài)圖像來接觸這些主題,而往往很少使用動態(tài)的交互式工具進(jìn)行探索。在Shiny程序中,學(xué)生可以通過自己“動手”操作,發(fā)現(xiàn)其中的規(guī)律變化,加上教師的講解以及鼓勵可以激起學(xué)生的學(xué)習(xí)興趣,還能引發(fā)學(xué)生更深層次的思考,將統(tǒng)計概念理解透徹,為后面學(xué)習(xí)統(tǒng)計分析奠定基礎(chǔ)。
我們知道在實(shí)際問題中,進(jìn)行估計往往只抽取一個樣本,此時構(gòu)造的是與該樣本相聯(lián)系的相應(yīng)的置信水平下的置信區(qū)間。因?yàn)檫@個區(qū)間不再是一個隨機(jī)區(qū)間,所以無法知道這個樣本所產(chǎn)生的區(qū)間是否包含了總體參數(shù)的真實(shí)值[4]。因此我們建立了圖6來說明樣本量對置信區(qū)間的影響,我們選擇的是重復(fù)構(gòu)造出的的10個置信區(qū)間(數(shù)據(jù)均為隨機(jī)生成)。 圖6中的每一條線段表示的是每一個估計區(qū)間,而紅色的線段則表示不包含真實(shí)值的區(qū)間。圖中可以看出10個區(qū)間中的第2個和第10個區(qū)間沒有落在中間的黑線上,即表示包含總體均值。圖6展示的是置信度為90%的置信區(qū)間,說明了最后有10%的區(qū)間沒有包含。
在圖6的左側(cè),有兩個選擇鍵,其中sample size表示的是樣本容量,Number of alpha是置信系數(shù),圖6、圖7構(gòu)建的意義是為了比較在保持置信水平不變的情況下,增加或減少樣本大小的影響對其影響范圍的置信區(qū)間是如何改變。它將提供學(xué)生關(guān)于什么是直觀的信息,引導(dǎo)學(xué)生操作結(jié)果展示圖中左側(cè)的按鈕,這樣的教學(xué)方式可以引發(fā)學(xué)生自主思考,還有利于培養(yǎng)學(xué)生的觀察能力。
不僅如此,還可以通過給定樣本量為30時,將系數(shù)選擇為0.01,即置信度為98%時得到圖8,用來說明置信度與真實(shí)覆蓋率的關(guān)系。圖7與圖8的對比結(jié)果相當(dāng)明顯,可得到結(jié)論:當(dāng)置信度越高時,區(qū)間包含真實(shí)值的概率也就越大。學(xué)生使用Shiny程序進(jìn)行學(xué)習(xí),不僅改變了被動接受知識的狀態(tài),還充分調(diào)動了學(xué)生學(xué)習(xí)的積極性,教師可以發(fā)現(xiàn)教學(xué)效果得到顯著的提高。
4結(jié)語
通過Shiny構(gòu)建了一個交互式的、動態(tài)的、用戶友好的、可視化的教學(xué)案例。 教師或者學(xué)生可根據(jù)自己的需要,去修改代碼完成自己想要展示的圖形。而且Shiny應(yīng)用程序有一個重要優(yōu)勢是,它可以部署在服務(wù)器上,接著就可以通過web瀏覽器在線訪問它[5]。不僅如此,學(xué)生們可以在不需要了解任何編程的情況下,自己嘗試使用該應(yīng)用程序。他們只需要知道如何啟動web瀏覽器。因此,Shiny能為統(tǒng)計教學(xué)帶來極大的提升。
參考文獻(xiàn):
[1]Winston Chang,Joe Cheng,JJ Allaire.Shiny:Web Application Framework for R[M].SpellPress,2017.
[2]鄧強(qiáng)庭,欒嘉,張維,等.基于R-Shiny的Cox回歸模型列線圖繪制工具的開發(fā)實(shí)現(xiàn)[J].現(xiàn)代預(yù)防醫(yī)學(xué),2018(24):4417-4422+4434.
[3]施國強(qiáng).淺析如何在假設(shè)檢驗(yàn)中建立原假設(shè)與備擇假設(shè)——基于本科生統(tǒng)計學(xué)教學(xué)實(shí)踐[J].科教文匯(中旬刊),2018(05):53-54.
[4]賈俊平,何曉群,金勇進(jìn).統(tǒng)計學(xué)(第六版)[M].北京:中國人民大學(xué)出版社,2015.
[5]Williams I J,Williams K K .Using an R Shiny to enhance the learning experience of confidence intervals[J].Teaching Statistics,2017.