李娜娜 熊正友 莫尊理
摘要:化學學科核心素養(yǎng)的培養(yǎng)與發(fā)展是中學化學教育的主要目標,學生化學實驗認知能力的提升是其關鍵所在。本研究選取西北地區(qū)1049名高一學生作為被試樣本,采用改編測試工具對學生的實驗認知能力進行測查,借助Winsteps軟件進行單維Rasch模型運算結果表明,該地區(qū)化學實驗教學現(xiàn)狀不容樂觀,學生化學實驗認知能力水平處于1-2之間。根據(jù)研究結果對化學實驗教學中存在的問題進行探討并提出對策,以期西北地區(qū)學生的實驗認知能力得到更好的發(fā)展。
關鍵詞:實驗認知能力;Rasch模型;西北地區(qū);測評分析
文章編號:1008-0546(2020)04-0007-07
中圖分類號:G632.41
文獻標識碼:B
doi: 10.3969/j.issn. 1008-0546.2020.04.002
化學實驗能力是對化學實驗的認識和探究化學物質(zhì)的組成、結構、性質(zhì)及其變化規(guī)律的能力,包含操作、觀察和認知等成分。其中化學實驗認知能力是學生運用表象和概念進行推理、分析、綜合,抽象、概括、判斷等認識活動的過程[1]?!镀胀ǜ咧谢瘜W課程標準》(2017年版)中明確提出,讓學生認識到化學實驗是研究和學習物質(zhì)及其變化的基本方法,是科學探究的重要途徑之一[2]。為了了解西北地區(qū)化學實驗教學現(xiàn)狀、檢驗學生化學實驗認知水平,本研究在項目反應理論的基礎上,結合威爾森(Wilson,2008)開發(fā)的四基石模型[3],對西北地區(qū)學生進行化學實驗認知能力測評,用Winsteps軟件對原始數(shù)據(jù)進行單維Rasch模型分析。根據(jù)研究結果得出相關結論揭示該地區(qū)學生化學實驗認知能力水平現(xiàn)狀、探索影響化學實驗認知能力水平的因素并提出相應的對策,對西部地區(qū)學生實驗認知能力的發(fā)展提供借鑒和參考。
一、測評對象和內(nèi)容
1.測評對象
本研究共進行了三次測驗,第一次小樣本測試目的是檢測測試工具的質(zhì)量。測查對象來源于甘肅省天水市秦安縣的H中學86名高一學生和隴南市成縣的G中學98名高一學生,共計184人。根據(jù)Rasch模型分析測量結果后,修改優(yōu)化測試工具趨于質(zhì)量良好,進行第二次大樣本測驗。選取西北地區(qū)不同層次5所學校的1049名高一學生為測試樣本。被測高一學生已經(jīng)學完人教版化學必修(1.2)化學實驗相關內(nèi)容。最后采用編制的問卷,對西北地區(qū)不同所學校的50名高中化學教師及參加化學奧賽的不同學校各個年級的156名高中生進行隨機抽樣調(diào)查。
2.測評內(nèi)容
結合普通高中化學課程標準及中學生認知發(fā)展特點,制定了如表l所示的化學實驗認知能力學習進程。
二、測評工具的開發(fā)
1.測評工具的開發(fā)流程
如圖1所示[4]。
2.開發(fā)測評工具
基于Rasch模型原理,威爾森提出了測量建構“四基石模型”。四基石模型包括如圖2所示的四個流程,如表2所示。
基于Wilson的測量建構“四基石”框架,結合2017年版《普通高中化學課程標準》及實驗認知能力學習進程,在第一輪測試中,本研究共開發(fā)了18道單項選擇題和2道反應建構題,共計26個項目。單項選擇題,每道題有4個選項,且只有一個選項符合題意。采用SOLO分類評價法對反應建構題進行賦分。項目與能力水平對應關系如表3所示。
3.基于Rasch模型的測評工具質(zhì)量檢測
常用的測驗理論主要有兩種,分別為經(jīng)典測驗理論(Classical Tesl Theory,簡稱CTT)和項目反應理論(Item Response Theory,簡稱ERT)。ERT在心理學界和教育測量與評價中應用廣泛,因為CTT存在兩大不可彌補的缺陷:一是樣本依賴(Sample-dependent),二是測驗工具依賴(Test-dependent)。當我們把相同的測評工具分給兩組能力水平截然不同的被試去測時,會得出差別很大的難度指標(水平高的學生認為測試工具沒有難度,而水平低的學生會覺得項目難度太大)。ERT能有效克服上述兩種缺陷,它主要指導項目篩選和測驗編制。ERT假設被試的心理結構中具有某種“潛在特質(zhì)”,教育研究者可以通過編制相應的項目問卷來測查被試的這種潛在特質(zhì),利用被試在測驗中所獲的分數(shù)來解釋、預測被試在項目上的反應。
本研究運用的單維Rasch模型采用項目難度這一參數(shù)。單維RasCh模型能將測驗的原始分數(shù)值轉化成Logic值,將學生的化學實驗認知能力水平與試題難度放在同一把尺子上進行比較[5]。第一輪測試的總體結果如表4所示。
由表4可知,學生的Rasch分值為1.32>0,說明學生的能力水平整體上高于項目的難度。項目的分離度與信度分別為5.39和0.97,均在良好的范圍內(nèi);被試的分離度為1.01,說明測查工具未能很好地將不同能力水平的學生分離開,被試信度為0.50,需要提升。誤差反映了參數(shù)估計的精確性,被試能力估計的標準誤差為0.57,而項目難度估計誤差較小,為0.26。項目的ENFET MNSQ和OUTFET MNso值均在0.5~1.7之間,處于可接受的范圍之內(nèi);項目ENFET ZSTD值和OUTFET ZSTD值大部分在-2~+2之間,但EOI、E07、E15、E22和E24這幾個項目的取值超出了范圍,需要修訂,尤其是EOI和E02這兩個項目,大部分統(tǒng)計量均遠離了合理的取值范圍。此外,在項目難度估計方面,有幾個項目的“異常性”較為突出,以E14和E20為例,E14應屬于實驗認知能力的第三水平,但其難度估計值卻比第四水平的E15大;E20屬于第三水平,其難度估計值卻和第一水平的E3相當。因此,接下來的研究中需要對項目加以修訂??偟膩碚f,大部分項目的擬合統(tǒng)計量都在可接受的范圍內(nèi),反映了測評工具具有較好的信效度。
三、測評過程及數(shù)據(jù)分析
1.測評過程
對第一輪測試中質(zhì)量不佳的項目進行優(yōu)化,選定20個項目作為最終的測試題目。在第二輪大樣本測試中,選擇了西北地區(qū)重點高中418和非重點高中631共計1049名學生作為被試,進行測評。
選擇測驗水平1、4的兩個項目進行示例分析。
例I(E2)下列對事故的處理方法中,不正確的是()
A.在實驗室中如遇到電線著火,我們應先關掉電閘
B.不小心將稀鹽酸濺到眼睛里,應立刻用大量水沖洗,邊洗邊眨眼睛
C.不慎將少量濃硫酸濺到皮膚上,應立即用水沖洗,然后涂抹10%的NaOH溶液
D.發(fā)現(xiàn)實驗室中有大量的可燃性氣體泄漏時,應立刻開窗通風
說明:這道題屬于水平1,即學生對實驗室中常見安全事故的應對能力。在實驗室中如不慎將少量濃硫酸濺到皮膚上,應立即用大量清水沖洗,然后應該涂抹的是3%~5%的NaHCO3溶液,而非10%的NaOH溶液,主要考查對實驗中的事故處理,化學實驗安全的理解。
例2(E20)三草酸合鐵酸鉀晶體K3[Fe(C204)3].3H20可用于攝影和藍色印刷。某小組將無水三草酸合鐵酸鉀在一定條件下加熱分解,對所得氣體產(chǎn)物和固體產(chǎn)物進行實驗探究。請利用實驗室常用儀器、用品和以下限選試劑完成驗證和探究過程。限選試劑:Imol/L硝酸、濃硫酸、20% KSCN、O.lmol/L CuSO4、O.lmol/L KI、3% H202、O.lmol/L NaOH、O.lmol/L鹽酸、澄清石灰水、蒸餾水、氧化銅。
(1)各小組同學查閱資料后發(fā)現(xiàn)固體產(chǎn)物中,鐵元素不可能以三價形式存在,而鹽只有K2CO3。如何驗證固體物質(zhì)中有鉀元素的存在并解釋實驗現(xiàn)象。
(2)固體產(chǎn)物中鐵元素存在形式的探究。
①提出合理假設:假設1:假設2:假設3:
②設計實驗方案驗證假設
說明:本題屬于水平4,即測查學生實驗方案的設計、評價與優(yōu)化能力。實驗認知能力的最高要求是學生具備一定的實驗設計能力,即能夠依據(jù)實驗原理及實驗目的做合理的假設,選擇不同的試劑,設計不同的實驗方案驗證鐵元素的存在形式。本題開放性較強,測查學生高層次的化學實驗認知思維,能夠區(qū)分不同學生實驗能力水平狀況,實驗認知能力越高的學生,做出假設和設計實驗方案的能力越強。
2.數(shù)據(jù)分析
(1)評分者信度
在對非選擇題進行賦分時,可能會摻雜評分者的主觀性。采用Kappa系數(shù)考查評分者的一致性,當Kappa系數(shù)在0.75~1之間時,表明不同的評分者在賦分時有著較好的一致性。表5的數(shù)據(jù)反映了不同評分者在對同一道題目賦分時具有較高的一致性,說明本研究對于學生在非選擇題上的評分是可靠的。
(2)大樣本測試的總體結果
第二輪大樣本測試的總體結果如表6所示。
由表6可知,學生的Rasch分值為-1.41<0,表明測試T具的難度高于學生的能力水平;項目誤差為0.05小于被試誤差,說明模型對于項目難度的估計是可靠的;四項擬合指標均在規(guī)定范圍內(nèi)。被試的分離度1.86,接近2,信度為0.79;項目的分離度為13.04,與之對應的項目信度為0.99,遠遠大于2。這些數(shù)據(jù)表明本研究使用的測試工具有良好的信度,能夠有效測查西北地區(qū)高中學生化學實驗認知能力的水平。
(3)項目一被試對應情況
Rasch模型可以將原始分值轉化為Logit分,將被試能力水平與項目難度放在同一量尺上比較。項目一被試對應圖稱為懷特圖(Wright map),通過懷特圖[6],可以清晰地知道項目難度與學生能力水平的對應情況(如圖3所示)。
圖3中間的豎線是Logit刻度尺,刻度尺左側表示被試能力水平分布情況,圖中每個“#”代表12個被試,每個“.”代表1-11個被試,被試能力水平從下到上逐漸上升;刻度尺右側表示項目難度分布情況,項目難度從上到下逐漸降低。由圖3可知,EOI難度最低,E20難度最大,大部分項目都有被試與之相對應(項目與被試相對應時,表明被試學生正確回答該道題目的的概率為50%),有小部分項目其難度相對被試而言較大,沒有被試與之對應。
(4)項目單維性情況
單維性是RasCh模型的基本假設之一,其反映的是某一項目是否只測查被試的某種單一“潛在特質(zhì)”,本研究中的“潛在特質(zhì)”即實驗認知能力[7]。項目的單維性越高,說明測查工具有著較好的信效度。由圖4可知,大部分項目的標準殘差相關系數(shù)值(Standard-ized Residual Contrast Loading)在-0.4~+0.4之間,具有較好單維性,能夠有效測查該地區(qū)高中學生的化學實驗認知能力。但有幾個項目(A-E20,B-E14,C-E5,a-EI,h-E7)的標準殘差相關系數(shù)值在-0.4~+0.4之外,說明這幾道題目可能除了測查學生的實驗認知能力以外,還測查了其它化學學科能力。
以E14為例:下圖是4種碳架的烴,其中判斷正確的是()
A.a和d不是同分異構體
B.b和c中所有的原子都在一個平面上
C.a和d都能發(fā)生加成反應
D.bcd都能發(fā)生取代反應
此題屬于E3(理解實驗原理進行實驗操作)維度下的測查,要求學生通過搭建球棍模型學習有機物分子結構的性質(zhì)及規(guī)律。測試后進行學生訪談,得知在作答這道題目時,他們不僅考慮了如何搭建相應的球棍模型對4物質(zhì)進行分析,還考慮了“同分異構體”“加成反應”等具體概念性知識,有的學生在作答這道題目時,習慣性地思考了球棍模型所代表的分子式等,這些因素都可能導致該題目的單維性不佳。
(5)項目擬合、標準誤差及點一測量相關性情況
第二輪大樣本測試的項目擬合、標準誤差及點一測量相關性情況如表7所示。20個項目的難度范圍在-1.24~I.OOLogit之間,E20難度最大(對應的Mea-sure值為1.00),EOI難度最?。∕easure值為-1.24)。標準誤差在0.04~0.07之間,都在0.10以下,反映了項目的難度是可靠的。分析具體項目與模型的擬合情況時,以Infit MNso作為主要參考。除了EOI、E02、E03、E20外,大多數(shù)項目的Infit MNSQ值在0.7~1.3之間,對應的Infit ZSTD值在-2~+2之間,其中EOI和E20這兩道題目的Infit MNso值及Infit ZSTD值均遠離合理的取值范圍,可能是學生在作答過程中出現(xiàn)猜測行為,使得能力水平較低的學生答對了難度較大的題目,與模型不符合[8],而能力水平較高的學生在作答時可能因為粗心,概念模糊等原因,將題目答錯。整體測評數(shù)據(jù)與模型有較高的擬合度,點一測量相關性系數(shù)在0.07~0.73之間,沒有負值,且大部分數(shù)值大于0.3,反映了項目與模型之間具有良好的一致性。
由單維性數(shù)據(jù)、數(shù)據(jù)一模型擬合檢驗及點一測量相關性系數(shù)等因素分析,該測評工具具有較好的信效度。表8是各個水平層級的Measure均值,當學生的Measure分值小于等于-0.624時,可推測該學生處于實驗認知能力的第一水平之下;當學生的Measure分值在-0.624~-0.13時,可推斷該學生處于實驗認知能力的第一水平;當學生的Measure分值在-0.13~-0.07之間時,可推知該學生處于實驗認知能力的第二水平;當學生的Measure分值在-0.07~0.638之間時,可推知該學生處于實驗認知能力的第三水平;當學生的Measure分值高于0.638時,可推斷該學生處于實驗認知能力的第四水平。由表8可知,四種水平層級對應的Measure均值從Levell到Measure4逐漸增加,說明了本研究所確定的水平層級是科學的、可行的。
(6)總體分析
根據(jù)化學實驗認知能力劃分標準,統(tǒng)計西北地區(qū)1049名高一學生的化學實驗認知水平的總體表現(xiàn)如圖5所示。
從圖5可以得,被測學生的化學實驗認知水平處于水平1及以下(38.32%)和水平2(30.58%)學生較多,即學生對實驗儀器及基本操作的辨別和描述能力較高,基本具備了實驗事實的綜合分析與加工處理的能力。15.76%的學生處于第3水平,即能夠理解實驗原理進行實驗操作,10.34%的學生處于第4水平,即具備了一定的實驗方案的設計、評價與優(yōu)化的能力??傮w來看,大部分學生“理解實驗原理進行實驗操作”和“實驗方案的設計、評價與優(yōu)化”的能力薄弱。
四、西北地區(qū)高中化學實驗教學現(xiàn)狀的調(diào)查分析
1.問卷調(diào)查的目的
為了進一步說明當前西北地區(qū)化學實驗教學的現(xiàn)狀和學生的化學實驗認知水平,并對測查的結果進一步追因調(diào)查。采用編制的學生和教師問卷進行隨機抽樣調(diào)查。調(diào)查對象為甘肅省參加化學奧林匹克競賽的不同學校各年級156名高中生生和50名帶隊化學老師。
2.問卷的調(diào)查結果分析
教師問卷調(diào)查結果分析表明,多數(shù)老師意識到化學實驗教學的重要性和必要性(63.8%的教師認為做化學實驗是必須的)。但由于課時不足(40.5%)、實驗器材缺少(30.2%)、精力不夠(10.8%)、領導重視不足(18.5%)等原因,化學實驗教學開展不順利,學生實驗素養(yǎng)提高緩慢。同時目前對實驗的評價測評方式單一,大多數(shù)停留在紙筆測驗(51.0%),考查知識技能,忽視能力與核心素養(yǎng)的培養(yǎng)和測評。
學生問卷調(diào)查結果表明,大多數(shù)同學(58.8%)認為實驗操作的考查有利于激發(fā)學習興趣,提升實驗認知能力,少數(shù)學生(10.6%)不希望考實驗操作,因為做實驗麻煩,操作時會緊張。調(diào)查發(fā)現(xiàn)學生的實驗能力各不相同,實驗認知能力較弱的是設計實驗方案的能力(95.5%)和分析數(shù)據(jù)、解釋現(xiàn)象的能力(96.3%),較強的能力是收集實驗資料(93.4%),合作與交流的能力(92.5%)。對于實驗測評方式,常采用為筆試和口試,這與教師問卷的結果十分吻合。目前西北地區(qū)化學高考中還沒有考查學生的實驗操作技能,將實驗操作納入高考考查范圍內(nèi),是提升學生化學實驗認知能力的有力抓手,當前的實驗考查方式有待完善。
五、結論與啟示
(l)本認知能力測評和調(diào)查研究能有效地了解高中生化學實驗認知能力狀況。西北地區(qū)高中生實驗認知能力水平總體不容樂觀,第二輪大樣本測試研究結果表明,學生的Rasch分值為-1.41小于0,學生的能力水平明顯低于項目難度,重點中學學生的化學實驗認知能力高于普通學校學生,整體處于第1-2水平之間。反映出學生化學實驗知識薄弱,動手操作的機會較少,沒能很好地激發(fā)學生的學習動機和養(yǎng)成良好的實驗素養(yǎng);學校的實驗設施條件不佳,化學教師難以正常開展實驗教學,實驗教學手段過于單一,有待提升學生實驗探究的興趣。
(2)本測評和調(diào)查研究為化學實驗認知能力提供對策。首先,學生要夯實化學學科基礎知識,完善自身知識結構,明確實驗內(nèi)容、目的和要求,形成良好的實驗習慣。其次,教師要研究化學實驗課堂和學生實驗探究心理,改進教學方法和手段,強化學生的認知結構,有針對性的實驗教學,提高學生的化學實驗認知技能。最后,學校要不斷更新、完善實驗儀器設備,為化學教師開展實驗教學創(chuàng)造條件,增設化學實驗探究課程,加強化學教師的實驗素養(yǎng),實施合理的化學實驗考核方式,將課改要求落到實處。學校、教師及學生自身都是影響高中生實驗認知能力發(fā)展的重要因素。學生的主動性是其實驗認知能力提升的內(nèi)因;教師和學校是影響學生實驗認知能力發(fā)展的外因,只有內(nèi)因和外因相互融合才能更加有效地培養(yǎng)高中生的化學實驗認知能力。
(3)本測評和調(diào)查研究對改進化學實驗教學方法,發(fā)展學生化學學科核心素養(yǎng)有一定啟示。從問卷調(diào)查中可以得出,高中化學教學中普遍存在重理論知識輕實驗創(chuàng)新的弊端,有關實驗內(nèi)容多以滿堂灌、畫實驗、背實驗、幻燈片式實驗的教學方式呈現(xiàn),忽視了化學實驗教學價值。通過測試學生實驗認知能力和問卷調(diào)查,既可以讓學生了解自身的不足,也為化學實驗教學方式的改進提供了理論依據(jù)。
當然,本研究存在的局限性有待進一步思考和解決,首先,部分項目的單唯性不佳,數(shù)據(jù)與模型擬合度有待提高。其次,任務情境的真實性不夠,要保證測評的有效性,設計的項目任務必須能測出評價的目標。最后,化學實驗認知能力的測試對象單一,今后對西北地區(qū)如西藏、新疆、青海、寧夏等地區(qū)學生的化學實驗認知能力需做進一步分析研究。
參考文獻
[l]王祖浩,楊玉琴.基于Rasch模型的“化學實驗認知能力”測驗工具編制及測評研究[J].化學教育,2012(9):99
[2] 中華人民共和國教育部.普通高中化學課程標準(2017年版)[M].北京:人民教育出版社,2018
[3]M.Wilsom.Cognitive Diagnosis using IRT[J].Journal of Psy-chology,2008, 216(2): 74-88
[4]趙景方,杜斌,韓波,閆春更,周青.高中生化學學科核心素養(yǎng)的測評研究——以“宏觀辨識與微觀探析”為例[J]化學教學,2019(5):17-21+38
[5]王磊,支瑤.化學學科能力及其表現(xiàn)研究[J].教育學報,2016,12(4):46-56
[6]郭習佩,薛亮,古麗茹·吐爾遜,馮玨.基于Rasch模型對學生推理能力進行測評的研究[J].化學教學,2019(4):18-24
[7] 王磊.基于學生核心素養(yǎng)的化學學科能力研究[M].北京:北京師范大學出版社,2017
[8]王桂桃.高中學生的化學平衡學習進階研究[D].西安:陜西師范大學碩士學位論文,2017