摘要:“互聯(lián)網(wǎng)+”時(shí)代,為提高高校英語教學(xué)效果,開拓大學(xué)英語課程線上線下混合式教學(xué)模式創(chuàng)新研究的思路,該文將著重關(guān)注如何有效地挖掘多個(gè)互聯(lián)網(wǎng)教學(xué)平臺(tái)的數(shù)據(jù),與外語教學(xué)的特殊性結(jié)合,做針對(duì)性研究,從而制訂有效的混合式精準(zhǔn)教學(xué)實(shí)施方案,并通過數(shù)據(jù)融合方案全面地了解和指導(dǎo)學(xué)生的英語學(xué)習(xí)。該文介紹了方案實(shí)施工具Python與Anaconda,以及方案實(shí)施策略,其中包括數(shù)據(jù)的讀取與保存、數(shù)據(jù)的篩選處理、分析結(jié)果的可視化展示和相關(guān)性分析4個(gè)部分,并通過示例呈現(xiàn)了如何利用Python來實(shí)施混合式英語教學(xué)數(shù)據(jù)融合。
關(guān)鍵詞:數(shù)據(jù)融合??Python??英語教學(xué)??混合式??精準(zhǔn)教學(xué)??實(shí)施方案
中圖分類號(hào):H319.3;G434文獻(xiàn)標(biāo)識(shí)碼:A???文章編號(hào):1672-3791(2022)06(b)-0000-00
Implementation?of?Data?Fusion?in?Blended?English?Teaching?Based?on?Python
WANG?Jiehua
(Nanjing?University?Jinling?College,?Nanjing,?Jiangsu?Province,?210089?China)
Abstract:?In?the?“Internet?+”?era,?in?order?to?enhance?the?teaching?efficiency?of?college?English?courses,?and?explore?a?new?innovative?approach?for?the?online-offline?blended?teaching?mode,?the?paper?emphasizes?how?to?effectively?utilize?the?data?from?multiple?online?teaching?platforms,?and?carries?out?a?corresponding?study?by?combining?data?mining?with?the?particularity?of?language?teaching,?and?thereby?formulates?an?implementation?program?for?the?effective?blended?precision?teaching,?through?which?teachers?can?comprehensively?understand?and?instruct?English?learning?of?college?students.?This?paper?introduces?Python?and?Anaconda?as?the?development?tools,?and?the?implementation?strategies?including?data?reading?and?saving,?data?filter?and?processing,?visualization?display?and?relativity?analysis,?and?demonstrates?how?to?implement?data?fusion?in?blended?English?teaching?based?on?Python?by?way?of?illustration.
Key?Words:Data?fusion;Python;English?teaching;Blended;Precision?teaching;Implementation
大數(shù)據(jù)與多元智能的融合可以更為準(zhǔn)確地判斷學(xué)生的個(gè)性、學(xué)習(xí)程度、學(xué)習(xí)特長等,從而為學(xué)生提供精準(zhǔn)教學(xué)、個(gè)性化學(xué)習(xí),提高教學(xué)質(zhì)量和效率[1]。在《大學(xué)英語教學(xué)指南》(教育部?2017?年最新版)建議將信息技術(shù)有效地應(yīng)用于教學(xué)當(dāng)中,鼓勵(lì)教師實(shí)施基于課堂和在線課程的翻轉(zhuǎn)課堂等混合式教學(xué)模式的大背景下,許多高校英語課程展開了線上線下混合式教學(xué)的實(shí)踐[2]。
在此,該文將著重研究如何挖掘多個(gè)互聯(lián)網(wǎng)教學(xué)平臺(tái)的數(shù)據(jù),并通過數(shù)據(jù)融合方案全面地了解和指導(dǎo)學(xué)生的英語學(xué)習(xí),從而實(shí)現(xiàn)更加精準(zhǔn)的教學(xué),開拓大學(xué)英語課程線上線下混合式教學(xué)模式創(chuàng)新研究的思路[3]。
由于該研究涉及各類數(shù)據(jù)來源的訪問、大量的數(shù)據(jù)處理以及分析結(jié)果的可視化展示,綜合考慮各個(gè)備選方案后,Python因其獨(dú)特的優(yōu)勢(shì)被選為了方案實(shí)施的編程語言。在數(shù)據(jù)科學(xué)領(lǐng)域,一般問題的解決過程都包括4個(gè)主要的步驟:數(shù)據(jù)收集和清洗、數(shù)據(jù)探索、數(shù)據(jù)建模和數(shù)據(jù)可視化,而Python可以在整個(gè)流程中提供必要有效的處理工具。Python數(shù)據(jù)工具箱中既有Python內(nèi)置函數(shù)和標(biāo)準(zhǔn)庫,又有第三方庫和工具。該課題主要用到了Pandas、NumPy和Matplotlib。Pandas是一個(gè)用于數(shù)據(jù)分析的開源Python庫,它讓Python能處理電子表格等數(shù)據(jù),提供了數(shù)據(jù)快速加載、操作、對(duì)齊與合并等功能。NumPy也是?Python?語言的一個(gè)擴(kuò)展程序庫,支持大量的維度數(shù)組與矩陣運(yùn)算,此外也針對(duì)數(shù)組運(yùn)算提供大量的數(shù)學(xué)函數(shù)庫。Matplotlib?是?Python?的繪圖庫,它可與?NumPy?一起使用,提供了一種有效的?MatLab?開源替代方案[4]。
該研究選擇安裝了Anaconda作為工具平臺(tái)。因?yàn)锳naconda是專注于數(shù)據(jù)分析的Python發(fā)行版本,包含了大量科學(xué)包及其依賴項(xiàng),是數(shù)據(jù)科學(xué)的利器。在Anaconda的包管理器conda中安裝Jupyter作為Python程序開發(fā)環(huán)境,Jupyter最大的優(yōu)勢(shì)在于能夠合理高效地展示數(shù)據(jù),提高了項(xiàng)目研究的效率。
2?方案實(shí)施策略介紹
2.1?數(shù)據(jù)的讀取與保存
該研究中將數(shù)據(jù)細(xì)分能力測(cè)試數(shù)據(jù)[5]和學(xué)習(xí)過程數(shù)據(jù)兩大類。線上學(xué)習(xí)過程數(shù)可以從各個(gè)在線教學(xué)平臺(tái)直接導(dǎo)出,在導(dǎo)出格式的選擇上,考慮數(shù)據(jù)的兼容性,建議統(tǒng)一選擇excel格式。能力測(cè)試數(shù)據(jù)(如英語四六級(jí)考試和期末考試的成績(jī))則可以從學(xué)校教務(wù)處等相關(guān)部門獲得,這些信息一般也都以Excel格式保存。
該研究中需要對(duì)多個(gè)平臺(tái)的數(shù)據(jù)進(jìn)行融合處理,由于所有的數(shù)據(jù)來源均統(tǒng)一為了Excel格式,Python中的Pandas庫是最適合對(duì)這些數(shù)據(jù)文件進(jìn)行讀取與保存的。
例如:當(dāng)教師開學(xué)前拿到了所教班級(jí)的學(xué)生名冊(cè)后,可以到全校歷次英語四六級(jí)成績(jī)表中,將所教學(xué)生按時(shí)間順序由近及遠(yuǎn)依次做搜索查詢,保留每名學(xué)生最近一次的有效英語四六級(jí)成績(jī)作為初始能力數(shù)據(jù)。
Pandas讀取Excel數(shù)據(jù)文件后,會(huì)將數(shù)據(jù)保存在表格型的數(shù)據(jù)結(jié)構(gòu)Dataframe中。為了提高在Dataframe中搜索數(shù)據(jù)的效率,可以在Dataframe中增加索引項(xiàng)。在索引項(xiàng)的選擇上,要考慮該項(xiàng)數(shù)據(jù)的唯一性和普適性。比如:在全校英語四六級(jí)考試的成績(jī)文檔中,學(xué)生的信息項(xiàng)有姓名、證件號(hào)、學(xué)號(hào)、筆試報(bào)名號(hào)和準(zhǔn)考證號(hào)等信息;而在教師拿到的學(xué)生名冊(cè)中,學(xué)生的信息有姓名、學(xué)號(hào)和所在班級(jí)等信息。通過比對(duì)可以發(fā)現(xiàn)學(xué)號(hào)信息是具有唯一性和普適性的,因此在該研究中均將學(xué)號(hào)信息作為Dataframe的索引項(xiàng)。需要提醒的是,學(xué)生學(xué)號(hào)在全校歷次英語四六級(jí)考試的成績(jī)表單搜索過程中,除了要檢查學(xué)號(hào)是否存在,還要對(duì)成績(jī)的有效性進(jìn)行核查。有的學(xué)生雖然報(bào)名了某次四六級(jí)考試,但是可能出現(xiàn)缺考的情況,反映到成績(jī)表單中該學(xué)生的成績(jī)項(xiàng)可能為空,或者值為0。檢測(cè)到這種情況時(shí),本次成績(jī)會(huì)被判為無效,要繼續(xù)搜索該名學(xué)生在之前考試中的有效成績(jī)。在當(dāng)前班級(jí)所有學(xué)生的有效四六級(jí)成績(jī)讀取完成后,為了以后查閱方便,可以將Dataframe中的關(guān)鍵數(shù)據(jù)過濾保存為Excel文檔。
2.2?數(shù)據(jù)的篩選處理
該研究中要對(duì)根據(jù)學(xué)生的初始能力數(shù)據(jù)來實(shí)施精準(zhǔn)教學(xué)[6]。以英語聽力為例,即使在分層教學(xué)的班級(jí),學(xué)生的聽力水平仍然會(huì)存在一定的差距,因此教師需將聽力能力薄弱的學(xué)生篩選出來以制訂更有針對(duì)性的教學(xué)計(jì)劃。
該研究中參考最近一次的有效英語四級(jí)考試成績(jī)進(jìn)行篩選。英語四級(jí)考試成績(jī)表是有分項(xiàng)數(shù)據(jù)的,讀取到Dataframe后可以得到如聽力得分、閱讀得分、翻譯得分、作文得分和筆試總得分等數(shù)據(jù),通過索引項(xiàng)學(xué)號(hào)定位到每位學(xué)生的行數(shù)據(jù)后,便可綜合判斷該生聽力單項(xiàng)得分率(聽力實(shí)得分/聽力總分)和聽力得分占比(聽力實(shí)得分/筆試總實(shí)得分)。目前英語四級(jí)聽力總分248.5,卷面分值占比為35%,該研究中若某學(xué)生聽力聽力單項(xiàng)得分率低于50%,或者聽力得分占比低于28%(35%*80%),則判定該生的聽力為薄弱項(xiàng)。在實(shí)施過程中,對(duì)于上述評(píng)判閾值50%和80%,教師可根據(jù)班上學(xué)生的實(shí)際情況做相應(yīng)的調(diào)整,在程序中設(shè)計(jì)接口到指定的配置文件中讀取相關(guān)參數(shù)。
2.3?分析結(jié)果的可視化展示
制作提供信息的可視化是數(shù)據(jù)分析中最重要的任務(wù)之一,Python中的Matplotlib模塊功能十分強(qiáng)大,可用于創(chuàng)建折線圖、直方圖、散點(diǎn)圖、條形圖、圓餅圖等。在混合式英語精準(zhǔn)教學(xué)中,教師也需要借助可視化的圖像來分析教學(xué)效果。
該研究中將班上的學(xué)生按照學(xué)期前英語四級(jí)成績(jī)劃分為兩個(gè)對(duì)照組,成績(jī)490以上的為Group?A,490以下的為Group?B。該學(xué)期教師安排了線上線下混合式教學(xué),通過繪制的散點(diǎn)圖(圖2)可以反映出兩個(gè)對(duì)照組英語期末考試成績(jī)隨在線學(xué)習(xí)表現(xiàn)分變化的大致趨勢(shì)。散點(diǎn)圖中X軸為在線學(xué)習(xí)表現(xiàn)分,其綜合了簽到、課前練習(xí)、課堂練習(xí)等多種因素[5],總分為253分;y軸為英語期末考試成績(jī),滿分為100分。通過圖2可以看出,對(duì)于英語基礎(chǔ)較弱的Group?B的學(xué)生,總體而言呈現(xiàn)出在線學(xué)習(xí)表現(xiàn)分越高則英語期末考試成績(jī)?cè)胶玫内厔?shì)。
2.4?相關(guān)性分析
該研究中需要對(duì)學(xué)生在線學(xué)習(xí)的表現(xiàn)與英語期末考試中各個(gè)分項(xiàng)做量化的相關(guān)性分析。將英語期末考試的成績(jī)表讀入Pandas的Dataframe后,每個(gè)分項(xiàng)成績(jī)?yōu)镾eries數(shù)據(jù),轉(zhuǎn)換為Numpy的ndarray數(shù)據(jù)后,即可調(diào)用Numpy中的相關(guān)性函數(shù)進(jìn)行計(jì)算。
本研究中相關(guān)性系數(shù)選擇皮爾森相關(guān)性系數(shù),其計(jì)算公式為:
其中x數(shù)列為學(xué)生在線學(xué)習(xí)的表現(xiàn)分,y數(shù)列為期末考試各個(gè)分項(xiàng)的成績(jī),n為班級(jí)的學(xué)生人數(shù)。需要注意的是每個(gè)分項(xiàng)的相關(guān)系數(shù)都要進(jìn)行獨(dú)立計(jì)算。該研究中,2019級(jí)某法語班學(xué)生在線學(xué)習(xí)的表現(xiàn)與英語期末考試中各個(gè)分項(xiàng)的相關(guān)系數(shù)如表2所示。
從表2中可以看出,仔細(xì)閱讀和詞匯詞組兩個(gè)單項(xiàng)與在線學(xué)習(xí)表現(xiàn)的相關(guān)性較強(qiáng)。另外,該學(xué)期的教學(xué)方式采用的是混合式教學(xué),在線教學(xué)的課時(shí)占比為1/4。如果在線教學(xué)的課時(shí)占比提高后,可以預(yù)期相關(guān)系數(shù)的值還會(huì)有一定的提升。
3?結(jié)語
Python包含了許多強(qiáng)大的統(tǒng)計(jì)學(xué)和數(shù)學(xué)工具,通過上述示例可以看出,Anaconda/Python平臺(tái)對(duì)于本研究進(jìn)行英語教學(xué)數(shù)據(jù)融合處理提供了很好的支撐。教師利用數(shù)據(jù)融合的結(jié)果,可以更有的放矢地對(duì)學(xué)生實(shí)施精準(zhǔn)化教學(xué),因此該文提到的基于Python的英語教學(xué)數(shù)據(jù)融合處理方案在高校英語教學(xué)中有較高的推廣價(jià)值。
參考文獻(xiàn)
[1] 許曉川,王愛芬.大數(shù)據(jù)與多元智能在教育教學(xué)中的深度融合[J].教育理論與實(shí)踐,2017,37(25):32-35.
[2] 賈振霞.?大學(xué)英語混合式教學(xué)中的有效教學(xué)行為研究[D].上海:上海外國語大學(xué),2019.
[3] 王劼華,劉光源.基于數(shù)據(jù)融合的英語混合式精準(zhǔn)教學(xué)可行性研究[J].科教文匯,2020(12):167-168.
[4] Wes?McKinney.利用Python進(jìn)行數(shù)據(jù)分析[M].北京:機(jī)械工業(yè)出版署,2018:9-16.
[5] 黃濤,趙媛,耿晶,等.數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化學(xué)習(xí)評(píng)價(jià)機(jī)制與方法[J].現(xiàn)代遠(yuǎn)程教育研究,2021,33(1):3-12.
[6] 趙濤.智慧技術(shù)支持下混合式學(xué)習(xí)模式建構(gòu)與實(shí)踐研究[J].中國電化教育,2021(9):137-142.