• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于決策樹(shù)的英語(yǔ)專(zhuān)業(yè)學(xué)業(yè)影響因素的關(guān)聯(lián)規(guī)則挖掘

      2010-01-16 08:10:58滕廣青張良軍
      關(guān)鍵詞:外語(yǔ)類(lèi)績(jī)點(diǎn)考試成績(jī)

      滕廣青,張良軍,張 凡

      (浙江外國(guó)語(yǔ)學(xué)院,浙江 杭州 310012)

      基于決策樹(shù)的英語(yǔ)專(zhuān)業(yè)學(xué)業(yè)影響因素的關(guān)聯(lián)規(guī)則挖掘

      滕廣青,張良軍,張 凡

      (浙江外國(guó)語(yǔ)學(xué)院,浙江 杭州 310012)

      利用決策樹(shù)數(shù)據(jù)挖掘技術(shù)對(duì)英語(yǔ)專(zhuān)業(yè)學(xué)生相關(guān)數(shù)據(jù)信息開(kāi)展了實(shí)驗(yàn)研究,提出了基于實(shí)驗(yàn)數(shù)據(jù)集的決策樹(shù)挖掘模型,并據(jù)此提取了英語(yǔ)專(zhuān)業(yè)學(xué)業(yè)影響因素的關(guān)聯(lián)規(guī)則.

      數(shù)據(jù)挖掘;決策樹(shù);英語(yǔ)專(zhuān)業(yè);關(guān)聯(lián)規(guī)則

      1 引 言

      “數(shù)據(jù)挖掘 (DataMining,DM)”這一術(shù)語(yǔ)目前在學(xué)術(shù)界還沒(méi)有一個(gè)公認(rèn)的、權(quán)威的定義,但我們一般可以簡(jiǎn)單的認(rèn)為數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在而有用的信息和知識(shí)的過(guò)程[1].數(shù)據(jù)挖掘所探尋的是一種已有的、只是隱藏在數(shù)據(jù)中、暫時(shí)沒(méi)有被發(fā)現(xiàn)的知識(shí).數(shù)據(jù)挖掘技術(shù)是近年來(lái)發(fā)展最快、應(yīng)用最為廣泛的前沿性技術(shù)之一,其基礎(chǔ)理論日臻成熟,應(yīng)用范圍越來(lái)越廣泛.研究重點(diǎn)逐漸從發(fā)現(xiàn)方法等理論研究轉(zhuǎn)向系統(tǒng)應(yīng)用研究,注重多種發(fā)現(xiàn)策略和技術(shù)的集成,以及多種學(xué)科之間的相互滲透.作為處理海量數(shù)據(jù)的有效方法,數(shù)據(jù)挖掘被越來(lái)越多地應(yīng)用到教育領(lǐng)域的研究中來(lái).國(guó)外最早將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教育管理中的學(xué)生注冊(cè)、教學(xué)設(shè)施管理、聽(tīng)課管理等方面[2].近年來(lái),國(guó)內(nèi)部分學(xué)者也開(kāi)始嘗試?yán)脭?shù)據(jù)挖掘技術(shù)探索教育領(lǐng)域中的一些問(wèn)題,如優(yōu)化多媒體教學(xué)策略[3]、提取網(wǎng)絡(luò)學(xué)習(xí)關(guān)聯(lián)規(guī)則[4]、建立教育決策支持系統(tǒng)[5]、編程語(yǔ)言的選擇[6]、課程與成績(jī)的依存性[7]、教學(xué)評(píng)價(jià)[8]等等,并取得了一些進(jìn)展.本研究采用決策樹(shù)數(shù)據(jù)挖掘技術(shù),探尋英語(yǔ)專(zhuān)業(yè)學(xué)業(yè)影響因素的關(guān)聯(lián)規(guī)則,從技術(shù)應(yīng)用的層面對(duì)利用信息技術(shù)研究英語(yǔ)專(zhuān)業(yè)教育領(lǐng)域相關(guān)問(wèn)題進(jìn)行了嘗試.

      2 針對(duì)英語(yǔ)專(zhuān)業(yè)學(xué)生數(shù)據(jù)信息的決策樹(shù)數(shù)據(jù)挖掘

      2.1 數(shù)據(jù)源管理

      對(duì)于大學(xué)本科英語(yǔ)專(zhuān)業(yè)的學(xué)業(yè)影響因素而言,人們往往會(huì)有一些習(xí)慣性的認(rèn)識(shí),例如:(1)高考成績(jī)好的學(xué)生,人們往往認(rèn)為其大學(xué)四年平均學(xué)分績(jī)點(diǎn)會(huì)高;(2)部分地區(qū)的方言也許會(huì)影響外語(yǔ)學(xué)習(xí);(3)由外語(yǔ)類(lèi)學(xué)校升入大學(xué)的學(xué)生,似乎在大學(xué)的相應(yīng)外語(yǔ)專(zhuān)業(yè)會(huì)有較大的優(yōu)勢(shì);(4)一般而言,英語(yǔ)等級(jí)考試成績(jī)與學(xué)生的學(xué)業(yè)成績(jī)沒(méi)有必然聯(lián)系等.

      由此,本研究選擇國(guó)內(nèi)某 211高校英語(yǔ)專(zhuān)業(yè) 2002級(jí) 108名本科畢業(yè)生 (50%的數(shù)據(jù)用于挖掘試驗(yàn),50%的數(shù)據(jù)用于驗(yàn)證)相關(guān)數(shù)據(jù)作為數(shù)據(jù)源,同時(shí)選擇表 1中所列示的字段作為數(shù)據(jù)挖掘字段,以每個(gè)畢業(yè)生的平均學(xué)分績(jī)點(diǎn)作為學(xué)生的學(xué)業(yè)水平指標(biāo)進(jìn)行挖掘.

      表1 用于數(shù)據(jù)挖掘的字段及說(shuō)明

      2.2 數(shù)據(jù)預(yù)處理

      由于學(xué)生的相關(guān)教育信息來(lái)自于不同操作平臺(tái)的不同數(shù)據(jù)庫(kù),操作平臺(tái)與數(shù)據(jù)庫(kù)管理系統(tǒng)的異構(gòu),數(shù)據(jù)結(jié)構(gòu)與數(shù)據(jù)類(lèi)型、字段長(zhǎng)度的異構(gòu),以及數(shù)據(jù)污染、數(shù)據(jù)缺失等問(wèn)題都給數(shù)據(jù)挖掘帶來(lái)很大障礙.因此,在數(shù)據(jù)挖掘之前必須對(duì)數(shù)據(jù)進(jìn)行預(yù)處理.

      在進(jìn)行數(shù)據(jù)預(yù)處理時(shí)一般要考慮以下幾個(gè)方面的問(wèn)題:(1)數(shù)據(jù)清洗 現(xiàn)實(shí)系統(tǒng)中的數(shù)據(jù)往往是不“干凈”的.例如,來(lái)自學(xué)生管理系統(tǒng)和教務(wù)管理系統(tǒng)的不同數(shù)據(jù)表中學(xué)生的生源所在地信息中可能會(huì)出現(xiàn)江西、江西省等這樣一些名詞.這些名詞代表的是同一個(gè)生源所在地,但計(jì)算機(jī)并不理解.因此,必須對(duì)數(shù)據(jù)進(jìn)行清洗,從而解決一致性問(wèn)題.(2)數(shù)據(jù)缺失 數(shù)據(jù)的取值過(guò)程中會(huì)發(fā)生缺失現(xiàn)象.在我國(guó)現(xiàn)行高等教育體制下,可能會(huì)由于高考補(bǔ)錄、入學(xué)一年后轉(zhuǎn)專(zhuān)業(yè)、休學(xué)等原因造成數(shù)據(jù)缺失.而有些數(shù)據(jù)挖掘方法要求被挖掘數(shù)據(jù)是完整的數(shù)據(jù)記錄,這樣就很難從中得到有用的信息,或以此為依據(jù)進(jìn)行預(yù)測(cè).

      此外,在進(jìn)行數(shù)據(jù)預(yù)處理的過(guò)程中,還需要注意一些特殊字段的取舍.通常情況下類(lèi)似姓名這樣的字段和在數(shù)據(jù)表中具有不重復(fù) (唯一)的值的字段往往被數(shù)據(jù)挖掘?qū)<胰サ?否則挖掘的結(jié)果可能會(huì)得到“平均學(xué)分績(jī)點(diǎn)在 3.5以上的學(xué)生都是姓張的學(xué)生”這樣的結(jié)論.盡管對(duì)于訓(xùn)練集這可能是一個(gè)事實(shí),但顯然這一結(jié)論并不具備任何現(xiàn)實(shí)意義.

      2.3 數(shù)據(jù)挖掘

      本研究采用MicrosoftAnalysis Services提供的決策樹(shù) (Decision Tree)數(shù)據(jù)挖掘引擎對(duì)上述數(shù)據(jù)源進(jìn)行挖掘,最終得到可視化的挖掘結(jié)果見(jiàn)圖 1和圖 2.

      Microsoft的決策樹(shù)算法是基于分類(lèi)的概念.該算法構(gòu)建了一個(gè)決策樹(shù),根據(jù)訓(xùn)練集中各列的取值預(yù)測(cè)某一列值.因此,樹(shù)中的每個(gè)節(jié)點(diǎn)代表了該列的特殊情況.樹(shù)的分叉節(jié)點(diǎn)的位置設(shè)定由該算法作出決定,不同深度的節(jié)點(diǎn)可能代表每列不同的情況[9].決策樹(shù)挖掘模型的圖形像一株放倒的樹(shù),左邊是樹(shù)根,右邊是樹(shù)枝.圖 1是根據(jù)訓(xùn)練集產(chǎn)生的英語(yǔ)專(zhuān)業(yè)學(xué)業(yè)影響因素的決策樹(shù)數(shù)據(jù)挖掘模型 (Data MiningModel),用于顯示數(shù)據(jù)是如何在樹(shù)型結(jié)構(gòu)里分類(lèi)和組織的.這是一種由“IF T H E N”規(guī)則創(chuàng)建的分層,可以用來(lái)對(duì)信息分層.決策樹(shù)的優(yōu)點(diǎn)之一就是用直觀的規(guī)則來(lái)描述節(jié)點(diǎn).每一個(gè)節(jié)點(diǎn)用顏色來(lái)表示節(jié)點(diǎn)中事例的密度,顏色越深,對(duì)應(yīng)節(jié)點(diǎn)中包含的事例數(shù)就越多,屬性值就越大.樹(shù)中每一個(gè)節(jié)點(diǎn)和分支都包含有該節(jié)點(diǎn)或分支的主要屬性特征,可以得到其所包含事例的更多信息.圖 1中的模型顯示,學(xué)生畢業(yè)時(shí)的“平均學(xué)分績(jī)點(diǎn)”(PointAverage of Credit)的屬性決定于二年級(jí)時(shí)的“專(zhuān)業(yè)四級(jí)考試成績(jī)等級(jí)”(Grade)的屬性,即根據(jù)專(zhuān)業(yè)四級(jí)成績(jī)等級(jí)分為兩個(gè)分支“優(yōu)秀”(Grade=1)和“非優(yōu)秀”(Grade≠1).當(dāng)“專(zhuān)業(yè)四級(jí)考試成績(jī)等級(jí)”(Grade)不等于“1”(優(yōu)秀)時(shí),又取決于高考時(shí)的“考生類(lèi)別”(Category)的屬性,即根據(jù)考生類(lèi)別分為“外語(yǔ)類(lèi)”考生和“非外語(yǔ)類(lèi)”考生.在樹(shù)的每一個(gè)層級(jí)上,MicrosoftAnalysis Services的決策樹(shù)數(shù)據(jù)挖掘引擎都依據(jù)產(chǎn)生小于先驗(yàn)熵的最小條件熵的因素進(jìn)行分叉.

      圖1 英語(yǔ)專(zhuān)業(yè)學(xué)業(yè)影響因素的決策樹(shù)挖掘模型

      圖2 英語(yǔ)專(zhuān)業(yè)學(xué)業(yè)影響因素相關(guān)性網(wǎng)絡(luò)

      圖2是英語(yǔ)專(zhuān)業(yè)學(xué)生學(xué)業(yè)影響因素相關(guān)性網(wǎng)絡(luò) (DependencyNetwork),它能夠反映數(shù)據(jù)挖掘模型中對(duì)象間的相關(guān)性和從屬性.在相關(guān)性網(wǎng)絡(luò)中,數(shù)據(jù)挖掘模型被描述成屬性的網(wǎng)絡(luò).通過(guò)模型的相關(guān)屬性可以識(shí)別數(shù)據(jù)的相關(guān)性和預(yù)測(cè)性.相關(guān)性網(wǎng)絡(luò)通過(guò)不同與決策樹(shù)數(shù)據(jù)挖掘模型的視角顯示了決策樹(shù)模型中各因素的粗粒度的關(guān)聯(lián)關(guān)系,能夠指導(dǎo)進(jìn)一步提取細(xì)粒度的關(guān)聯(lián)規(guī)則.圖 2中的兩個(gè)箭頭表明“專(zhuān)業(yè)四級(jí)考試成績(jī)等級(jí)”(Grade)和“考生類(lèi)別”(Category)屬性預(yù)測(cè)了“平均學(xué)分績(jī)點(diǎn)”(Point Average of Credit)屬性,即英語(yǔ)專(zhuān)業(yè)畢業(yè)生最終的學(xué)分績(jī)點(diǎn) (學(xué)業(yè)成績(jī))主要與“專(zhuān)業(yè)四級(jí)考試成績(jī)等級(jí)”和“考生類(lèi)別”發(fā)生關(guān)聯(lián),或者說(shuō)受二者影響.相反,人們所熟悉的高考成績(jī)、地域方言 (生源地)等屬性則沒(méi)有對(duì)“平均學(xué)分績(jī)點(diǎn)”產(chǎn)生預(yù)測(cè),即在實(shí)驗(yàn)數(shù)據(jù)集中,高考成績(jī)、地域方言等不會(huì)影響學(xué)業(yè)成績(jī).

      3 英語(yǔ)專(zhuān)業(yè)學(xué)業(yè)影響因素關(guān)聯(lián)規(guī)則的提取

      挖掘結(jié)果將畢業(yè)生平均學(xué)分績(jī)點(diǎn)分為 2.495、3.325、3.625、3.915四個(gè)有效層級(jí),并針對(duì)模型中的各個(gè)節(jié)點(diǎn)產(chǎn)生出各層級(jí)詳細(xì)信息,如表 2所示.

      表2 決策樹(shù)挖掘模型各節(jié)點(diǎn)相關(guān)信息

      表2中“Grade=1”列的數(shù)據(jù)對(duì)應(yīng)實(shí)驗(yàn)數(shù)據(jù)源中“專(zhuān)業(yè)四級(jí)考試成績(jī)?yōu)閮?yōu)秀”(Grade=1)的節(jié)點(diǎn).對(duì)該列數(shù)據(jù)進(jìn)行分析可以得到:“專(zhuān)業(yè)四級(jí)考試成績(jī)?yōu)閮?yōu)秀者”(Grade=1)這一組中51.85%的學(xué)生的平均學(xué)分績(jī)點(diǎn)接近于 3.915;29.63%的學(xué)生的平均學(xué)分績(jī)點(diǎn)接近于 3.625;只有少數(shù)學(xué)生平均學(xué)分績(jī)點(diǎn)偏低.或者說(shuō),如果某個(gè)學(xué)生在二年級(jí)時(shí)專(zhuān)業(yè)四級(jí)考試成績(jī)?yōu)閮?yōu)秀,則有 51.85%的可能性其畢業(yè)時(shí)的平均學(xué)分績(jī)點(diǎn)會(huì)是接近于 3.915;有 29.63%的可能性其畢業(yè)時(shí)的平均學(xué)分績(jī)點(diǎn)接近于 3.625.提取關(guān)聯(lián)規(guī)則為:

      IF學(xué)生在二年級(jí)時(shí)的專(zhuān)業(yè)四級(jí)考試成績(jī)?yōu)閮?yōu)秀;

      THEN畢業(yè)時(shí)有 51.85%的概率其平均成績(jī)會(huì)接近 89分 (平均學(xué)分績(jī)點(diǎn) 3.9);同時(shí)有超過(guò) 29.63%的概率其平均成績(jī)會(huì)接近 86分 (平均學(xué)分績(jī)點(diǎn) 3.6);只有少數(shù)學(xué)生平均成績(jī)偏低.

      表2中“Grade≠1”列的數(shù)據(jù)對(duì)應(yīng)決策樹(shù)挖掘模型 (圖 1)中的第二個(gè)子節(jié)點(diǎn)“專(zhuān)業(yè)四級(jí)考試成績(jī)非優(yōu)秀者”(Grade≠1)的節(jié)點(diǎn).該節(jié)點(diǎn)主要集中了平均學(xué)分績(jī)點(diǎn)相對(duì)較低者,平均學(xué)分績(jī)點(diǎn)接近于 3.325的占 39.13%,平均學(xué)分績(jī)點(diǎn)接近于 2.495的占 36.96%.

      在“專(zhuān)業(yè)四級(jí)考試成績(jī)非優(yōu)秀者”(Grade≠1)節(jié)點(diǎn),模型依據(jù)學(xué)生參加高考時(shí)的“考生類(lèi)別”(Category)是否等于“外語(yǔ)”進(jìn)一步產(chǎn)生分叉.表 2中“Category=外語(yǔ)”列的數(shù)據(jù)對(duì)應(yīng)實(shí)驗(yàn)數(shù)據(jù)源中“考生類(lèi)別為外語(yǔ)類(lèi)考生”(Category=外語(yǔ))的節(jié)點(diǎn).對(duì)該列數(shù)據(jù)進(jìn)行分析可以得到:“考生類(lèi)別為外語(yǔ)類(lèi)考生”(Category=外語(yǔ))這一組中 66.67%的學(xué)生的平均學(xué)分績(jī)點(diǎn)接近于 2.495;13.33%的學(xué)生的平均學(xué)分績(jī)點(diǎn)接近于 3.325;只有少數(shù)學(xué)生平均學(xué)分績(jī)點(diǎn)略高.或者說(shuō),如果某個(gè)學(xué)生在二年級(jí)時(shí)專(zhuān)業(yè)四級(jí)考試成績(jī)不為優(yōu)秀 (包括良好、合格、不合格,此條件由“Grade≠1”上層節(jié)點(diǎn)產(chǎn)生),且參加高考時(shí)的“考生類(lèi)別”為外語(yǔ)類(lèi)考生 (Category=外語(yǔ)),則有 66.67%的可能性其畢業(yè)時(shí)的平均學(xué)分績(jī)點(diǎn)會(huì)是接近于 2.495;有 13.33%的可能性其畢業(yè)時(shí)的平均學(xué)分績(jī)點(diǎn)接近于 3.325.提取關(guān)聯(lián)規(guī)則為:

      IF學(xué)生在二年級(jí)時(shí)的專(zhuān)業(yè)四級(jí)考試成績(jī)不為優(yōu)秀;

      AND高考時(shí)考生類(lèi)別為外語(yǔ)類(lèi)考生;

      THEN畢業(yè)時(shí)有 66.67%的概率其平均成績(jī)會(huì)在 75分 (平均學(xué)分績(jī)點(diǎn) 2.5)左右.有13.33%的概率其平均成績(jī)會(huì)在 83分 (平均學(xué)分績(jī)點(diǎn) 3.3)左右;只有少數(shù)學(xué)生平均成績(jī)略高.

      表2中“Category≠外語(yǔ)”列的數(shù)據(jù)對(duì)應(yīng)實(shí)驗(yàn)數(shù)據(jù)源中“考生類(lèi)別為非外語(yǔ)類(lèi)考生”(Category≠外語(yǔ),包括理工、文史、普通等)的節(jié)點(diǎn).對(duì)該列數(shù)據(jù)進(jìn)行分析可以得到:“考生類(lèi)別為非外語(yǔ)類(lèi)考生”(Category≠外語(yǔ))這一組中 22.22%的學(xué)生的平均學(xué)分績(jī)點(diǎn)接近于 2.495;47.22%的學(xué)生的平均學(xué)分績(jī)點(diǎn)接近于 3.325;16.67%的學(xué)生的平均學(xué)分績(jī)點(diǎn)接近于 3.625;11.11%的學(xué)生的平均學(xué)分績(jī)點(diǎn)接近于 3.915.或者說(shuō),如果某個(gè)學(xué)生在二年級(jí)時(shí)專(zhuān)業(yè)四級(jí)考試成績(jī)不為優(yōu)秀 (包括良好、合格、不合格,此條件由“Grade≠1”上層節(jié)點(diǎn)產(chǎn)生),且參加高考時(shí)的“考生類(lèi)別”為非外語(yǔ)類(lèi)考生 (Category≠外語(yǔ)),則有 47.22%的可能性其畢業(yè)時(shí)的平均學(xué)分績(jī)點(diǎn)會(huì)是接近于 3.325;有 22.22%的可能性其畢業(yè)時(shí)的平均學(xué)分績(jī)點(diǎn)接近于 2.495;有16.67%的可能性其畢業(yè)時(shí)的平均學(xué)分績(jī)點(diǎn)接近于 3.625;有 11.11%的可能性其畢業(yè)時(shí)的平均學(xué)分績(jī)點(diǎn)接近于 3.915.提取關(guān)聯(lián)規(guī)則為:

      IF學(xué)生在二年級(jí)時(shí)的專(zhuān)業(yè)四級(jí)考試成績(jī)不為優(yōu)秀;

      AND高考時(shí)考生類(lèi)別為非外語(yǔ)類(lèi) (包括理工、文史、普通等)考生;

      THEN四年級(jí)畢業(yè)時(shí)有 47.22%的概率其平均成績(jī)會(huì)在 83分 (平均學(xué)分績(jī)點(diǎn) 3.3)左右,有 22.22%的概率其平均成績(jī)會(huì)在 75分 (平均學(xué)分績(jī)點(diǎn) 2.5)左右,有 16.67%的概率其平均成績(jī)會(huì)在 86分 (平均學(xué)分績(jī)點(diǎn) 3.6)左右,有 11.11%的概率其平均成績(jī)會(huì)在 89分 (平均學(xué)分績(jī)點(diǎn) 3.9)左右.

      對(duì)以上挖掘結(jié)果使用校驗(yàn)集的數(shù)據(jù)進(jìn)行驗(yàn)證,彌合率達(dá)到 90%以上.

      4 挖掘結(jié)果的現(xiàn)實(shí)意義

      通過(guò)以上基于教育信息的數(shù)據(jù)挖掘項(xiàng)目研究,可以得到以下結(jié)論,對(duì)于同一批次錄取的英語(yǔ)專(zhuān)業(yè)學(xué)生而言:(1)高考成績(jī)、生源所在地等因素并不決定或直接影響大學(xué)英語(yǔ)專(zhuān)業(yè)學(xué)生最終的平均學(xué)分績(jī)點(diǎn);(2)大學(xué)本科段以前在外語(yǔ)類(lèi)學(xué)校畢業(yè)的學(xué)生 (外語(yǔ)類(lèi)考生),在大學(xué)的相應(yīng)外語(yǔ)專(zhuān)業(yè)中并不一定具有優(yōu)勢(shì);(3)英語(yǔ)專(zhuān)業(yè)的專(zhuān)業(yè)四級(jí)考試成績(jī)能夠?qū)W(xué)生最終的學(xué)業(yè)成績(jī)產(chǎn)生預(yù)測(cè).

      從表面來(lái)看,上述結(jié)論有些出乎意料,一定程度上超越了人們目前對(duì)英語(yǔ)專(zhuān)業(yè)學(xué)業(yè)影響因素的認(rèn)識(shí)范疇.因此需要對(duì)這些信息進(jìn)行分析.

      作為第一條結(jié)論,性別和生源地對(duì)學(xué)業(yè)成績(jī)不產(chǎn)生影響一般能夠被普遍接受,但也許有相當(dāng)一部分人還是相信高考成績(jī)會(huì)影響學(xué)業(yè)成績(jī)的.事實(shí)上,我國(guó)目前高中段主要完成的是基礎(chǔ)教育,進(jìn)入大學(xué)后進(jìn)行的則是專(zhuān)業(yè)教育,二者在本質(zhì)上有很大區(qū)別.進(jìn)入大學(xué)后,大部分學(xué)生處于同一起跑線(xiàn) (錄取分?jǐn)?shù)檔次差距不大).大學(xué)中的許多專(zhuān)業(yè)在一定程度上受學(xué)生在某一領(lǐng)域中天賦和努力情況的影響程度要高于受基本文化素質(zhì)的影響程度 (除非在基本文化素質(zhì)方面?zhèn)€體差異較大).加之學(xué)生入學(xué)前由于生理、情緒等諸多原因可能造成高考成績(jī)沒(méi)有真實(shí)反映學(xué)生實(shí)際水平,而入學(xué)后由于學(xué)習(xí)環(huán)境、生活經(jīng)歷、課程內(nèi)容、學(xué)習(xí)方法等變化會(huì)在心理上產(chǎn)生不同程度的影響,因此高考成績(jī)并不決定或直接影響學(xué)生最終的平均學(xué)分績(jī)點(diǎn)也就不足為奇了.

      最出乎意料的應(yīng)該是第二條結(jié)論.按常規(guī)理解,在大學(xué)前就特別注重外語(yǔ)學(xué)習(xí),進(jìn)入大學(xué)后又從事外語(yǔ)專(zhuān)業(yè)學(xué)習(xí)的這類(lèi)學(xué)生,應(yīng)該比其他普通高中畢業(yè)生至少在外語(yǔ)學(xué)習(xí)方面具有較大的優(yōu)勢(shì).但事實(shí)是由于過(guò)早的專(zhuān)業(yè)化有可能使這部分學(xué)生在綜合文化素質(zhì)方面產(chǎn)生缺陷,而普通高中畢業(yè)生原本并不存在的綜合文化素質(zhì)優(yōu)勢(shì)則有可能成為相對(duì)于外語(yǔ)類(lèi)考生的相對(duì)優(yōu)勢(shì).而且現(xiàn)在外語(yǔ)學(xué)習(xí)環(huán)境較若干年前已發(fā)生了很大變化,從前外語(yǔ)學(xué)習(xí)資源相對(duì)匱乏的情況下,外語(yǔ)類(lèi)考生由于較早進(jìn)入專(zhuān)門(mén)化學(xué)校學(xué)習(xí)具有一定優(yōu)勢(shì).而今外語(yǔ)學(xué)習(xí)資源極大豐富,除了錄音磁帶、影像光盤(pán),還有網(wǎng)上 BBC、CNN在線(xiàn)直播,連幼兒外語(yǔ)學(xué)習(xí)班中都隨時(shí)可見(jiàn)外籍教師的身影.這一切使得外語(yǔ)類(lèi)考生原本存在的早期專(zhuān)業(yè)優(yōu)勢(shì)被逐漸淡化了.因此,就目前情況看,過(guò)早的專(zhuān)業(yè)化分科并不一定利于外語(yǔ)的學(xué)習(xí).

      第三條結(jié)論在目前非英語(yǔ)專(zhuān)業(yè)大學(xué)英語(yǔ)四級(jí)考試已與畢業(yè)資格脫鉤的情況下似乎顯得不合時(shí)宜.然而,應(yīng)該看到非英語(yǔ)專(zhuān)業(yè)普通大學(xué)英語(yǔ)四級(jí)考試與英語(yǔ)專(zhuān)業(yè)四級(jí)考試之間的本質(zhì)區(qū)別.前者與學(xué)生所學(xué)專(zhuān)業(yè)知識(shí)的聯(lián)系程度有限,因此非英語(yǔ)專(zhuān)業(yè)的大學(xué)英語(yǔ)四級(jí)考試成績(jī)與學(xué)生的學(xué)業(yè)成績(jī)沒(méi)有必然聯(lián)系是容易理解的.但英語(yǔ)專(zhuān)業(yè)的等級(jí)考試的考核內(nèi)容與專(zhuān)業(yè)知識(shí)結(jié)合緊密,特別是近年來(lái)在原有著重對(duì)語(yǔ)言技能考核的基礎(chǔ)上增加了對(duì)知識(shí)性?xún)?nèi)容的考核.因此,英語(yǔ)專(zhuān)業(yè)的專(zhuān)業(yè)四級(jí)考試成績(jī)能夠?qū)W(xué)生最終的學(xué)業(yè)成績(jī)產(chǎn)生預(yù)測(cè).

      5 結(jié) 語(yǔ)

      以上的分析僅僅是決策樹(shù)數(shù)據(jù)挖掘技術(shù)在英語(yǔ)教學(xué)領(lǐng)域中應(yīng)用的一次嘗試.隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展和教育領(lǐng)域信息化建設(shè)的不斷深入,基于數(shù)據(jù)挖掘的相關(guān)教育問(wèn)題的研究也會(huì)越來(lái)越引起人們的重視.盡管數(shù)據(jù)挖掘原本是作為一項(xiàng)技術(shù)出現(xiàn)的,但由于數(shù)據(jù)挖掘本身獨(dú)有的理念給人們處理解決各類(lèi)問(wèn)題都提供了一個(gè)新的思路和方法,在這一點(diǎn)上數(shù)據(jù)挖掘一定程度上等同于一種方法論[10],數(shù)據(jù)挖掘技術(shù)的應(yīng)用將會(huì)為數(shù)字時(shí)代的高等教育相關(guān)領(lǐng)域的研究提供一條新的途徑.

      [1]Han J W,Micheline K.DataMining:Concepts and Techniques[M].San Francisco:Morgan Kauf mann,2001:5.

      [2]Ralph K,Margy R.TheDataWarehouse Toolkit:the Complete Guide to DimensionalModeling[M].New York:JohnW iley&Sons,2002:247-252.

      [3]劉飛兵.運(yùn)用數(shù)據(jù)挖掘技術(shù)優(yōu)化大學(xué)英語(yǔ)多媒體教學(xué)[J].外語(yǔ)電化教學(xué),2006(10):72-74.

      [4]孫玉榮,羅立宇,黃慧華.數(shù)據(jù)挖掘在網(wǎng)絡(luò)教學(xué)中的應(yīng)用 [J].現(xiàn)代教育技術(shù),2009,19(6):104-106.

      [5]張德新,崔巍,蔣天發(fā).基于數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘的教育決策支持系統(tǒng) [J].武漢大學(xué)學(xué)報(bào):工學(xué)版,2003,36(4):129-131.

      [6]陳登科,胡翠華.數(shù)據(jù)挖掘技術(shù)在遠(yuǎn)程教育中的應(yīng)用[J].情報(bào)科學(xué),2003,21(4):445-448.

      [7]李蕓,瞿偉,張文.數(shù)據(jù)挖掘技術(shù)在研究生教育管理工作中的應(yīng)用 [J].西安建筑科技大學(xué)學(xué)報(bào):社會(huì)科學(xué)版 ,2009,28(4):70-74.

      [8]楊永斌.數(shù)據(jù)挖掘技術(shù)在教育中的應(yīng)用研究[J].計(jì)算機(jī)科學(xué),2006,33(12):284-286.

      [9]MicrosoftDecision Trees[EB/OL].[2010-06-06].http://msdn.microsoft.com/en-us/library/aa178242%28SQL.80%29.aspx.

      [10]滕廣青,毛英爽.國(guó)外數(shù)據(jù)挖掘應(yīng)用研究與發(fā)展分析[J].統(tǒng)計(jì)研究,2005(12):68-70.

      Associ ation RulesM i ni ng about Factors on EnglishMajor Based on Decision Tree

      TENG Guangqing,ZHANG Liangjun,ZHANG Fan
      (Zhejiang International StudiesUniversity,Hangzhou 310012,China)

      This paper processes the experimental reseach about data infor mation on English major by decision tree data mining. It proposes the decision tree data mining model based on experimental dataset,and extracts the association rules about English teaching.

      data mining;decision tree;English major;association rules

      TP331

      A

      1671-6574(2010)04-0097-06

      2010-06-16

      滕廣青 (1970-),男,吉林長(zhǎng)春人,浙江外國(guó)語(yǔ)學(xué)院國(guó)際工商管理學(xué)院副教授,管理學(xué)碩士;張良軍 (1970-),男,黑龍江齊齊哈爾人,浙江外國(guó)語(yǔ)學(xué)院外國(guó)語(yǔ)學(xué)院副教授,文學(xué)碩士;張凡(1963-),女,江西南昌人,浙江外國(guó)語(yǔ)學(xué)院圖書(shū)館助理館員.

      猜你喜歡
      外語(yǔ)類(lèi)績(jī)點(diǎn)考試成績(jī)
      外語(yǔ)類(lèi)應(yīng)用型創(chuàng)新人才培養(yǎng)模式研究——以青島工學(xué)院應(yīng)用實(shí)踐小學(xué)期為例
      考試成績(jī)轉(zhuǎn)換成偏態(tài)分布量化成績(jī)的算法
      基于完全學(xué)分制下的獨(dú)立院校的平均績(jī)點(diǎn)計(jì)算方法
      外語(yǔ)類(lèi)院校全口徑PGT英語(yǔ)學(xué)習(xí)模式研究報(bào)告
      世界家苑(2018年1期)2018-04-27 11:42:06
      構(gòu)建外語(yǔ)類(lèi)慕課質(zhì)量評(píng)價(jià)量表分析
      建立高校外語(yǔ)類(lèi)慕課質(zhì)量評(píng)價(jià)體系的必要性分析
      考試成績(jī)
      因子分析法在高中地理考試成績(jī)分析中的應(yīng)用
      國(guó)內(nèi)高校學(xué)分制績(jī)點(diǎn)度量模式的比較與研究
      江蘇高教(2014年2期)2014-09-04 06:15:18
      學(xué)分制下績(jī)點(diǎn)設(shè)定形式探討
      塔河县| 舞阳县| 蚌埠市| 德昌县| 沁阳市| 卢湾区| 鄱阳县| 齐齐哈尔市| 扶沟县| 眉山市| 怀集县| 志丹县| 浦县| 樟树市| 西青区| 迁安市| 阆中市| 嘉义县| 临泽县| 锦屏县| 平江县| 华亭县| 安福县| 霍邱县| 搜索| 安平县| 潼南县| 横山县| 福贡县| 吕梁市| 分宜县| 邳州市| 施秉县| 夹江县| 江城| 临猗县| 威海市| 朝阳区| 济南市| 龙州县| 平武县|