譚 芳
(哈爾濱理工大學(xué),哈爾濱 150040)
【責(zé)任編輯孫 穎】
高?;A(chǔ)階段通用英語課堂話語語料庫的生成*
譚 芳
(哈爾濱理工大學(xué),哈爾濱 150040)
雖然語料庫以其信息存儲(chǔ)量大、資料真實(shí)、檢索快捷準(zhǔn)確的優(yōu)勢(shì)日益受到各個(gè)領(lǐng)域?qū)W者的青睞,但是耗時(shí)費(fèi)力、程序復(fù)雜的口語語料庫建設(shè)卻不多。迄今,專文詳述中國(guó)國(guó)內(nèi)高校英語課堂話語語料庫建庫的論文尚未見。本文介紹歷時(shí)3年建成的高?;A(chǔ)階段通用英語課堂話語語料庫,首先說明該口語語料庫研究項(xiàng)目的、研究背景及選題緣起,然后回顧國(guó)內(nèi)外代表性課堂話語語料庫的建設(shè),最后介紹高校基礎(chǔ)階段通用英語課堂話語語料庫的語料收集過程和處理方法等,討論該庫的特點(diǎn)、功能及其對(duì)高校英語教育改革的意義。
高校;基礎(chǔ)階段;通用英語;課堂話語;口語語料庫
隨著語料庫研究視域日益寬泛,基于語料庫的課堂話語“語篇分析、會(huì)話分析、社會(huì)建構(gòu)學(xué)習(xí)理論的應(yīng)用和批評(píng)性話語分析”逐漸受到重視(O’Keeffe et al.2007:244)。國(guó)內(nèi)也涌現(xiàn)出一些基于語料庫的課堂話語研究,但主要集中在初、中等教育階段的英語課堂(何安平 2003, 劉永兵 張會(huì)平 2011),高校英語課堂研究仍舊主要采用量表、問卷或個(gè)案話語分析等常規(guī)研究方法(許宏晨 田野 常洪艷 2004)。這在一定程度上會(huì)影響高校英語課堂話語研究,高校英語課堂改革難于形成規(guī)模效應(yīng)。
口語語料庫最能直接真實(shí)反映語言本質(zhì),具有寶貴的研究?jī)r(jià)值(Kennedy 1998),但是其建設(shè)耗力、耗時(shí)、耗資且構(gòu)建程序復(fù)雜,在數(shù)量上遠(yuǎn)不及筆語語料庫多;已有的口語語料庫又以學(xué)習(xí)者語料庫居多,課堂話語語料庫并不多見。課堂話語語料庫能夠?yàn)檎n堂話語研究提供具有概括性的檢索與量化統(tǒng)計(jì),適應(yīng)以教育改革為目的的課堂話語規(guī)模化研究需求。因此,建立高校英語課堂話語語料庫十分必要。它是本土化外語教育改革必不可少的重要組成部分,也是高校英語教育改革治標(biāo)、治本的重要事實(shí)依據(jù),對(duì)于中國(guó)高校英語教育的改革與發(fā)展具有重要現(xiàn)實(shí)意義。
國(guó)外的語料庫建設(shè)起步雖早,但是迄今為止,建成的課堂話語語料庫并不多,特別是作為外語的英語課堂話語語料庫更為少見。較具代表性的課堂話語語料庫包括:(1)Biber等人建立的“TOEFL 2000口筆語學(xué)術(shù)語言語料庫”(TOEFL 2000 Spoken and Written Academic Language,簡(jiǎn)稱T2K-SWAL)的課堂話語子語庫,語料源自美國(guó)的大學(xué)課堂,涵蓋商學(xué)、教育、工程、人類學(xué)、自然科學(xué)和社會(huì)科學(xué)6大學(xué)科,容量約125萬詞次(Biber et al.2006)。(2) TalkBank國(guó)際數(shù)據(jù)庫的“ClassBank語料庫”,創(chuàng)建于2004年。其英語語料大多源自美國(guó)、澳大利亞和日本等國(guó)家和中國(guó)香港,涵蓋小學(xué)、中學(xué)和大學(xué),包括數(shù)學(xué)、醫(yī)學(xué)和科學(xué)等課堂話語,由James Stigler, Rich Lehrer和Elizabeth Warren等錄制并轉(zhuǎn)寫,容量40余萬詞次。(3)“弗倫斯堡英語課堂語料庫”(Flensburg English Classroom Corpus,簡(jiǎn)稱FLECC),由J?kel于2003-2007年創(chuàng)建,語料源自高級(jí)英語學(xué)習(xí)者在學(xué)校實(shí)習(xí)時(shí)授課的課堂,包括德國(guó)北部的小學(xué) (Grundschule)、職業(yè)預(yù)校(Hauptschule)、實(shí)科中學(xué)(Realschule)和綜合中學(xué)(Gesamtschule),共39節(jié)完整英語課的課堂話語語料,容量逾56,000詞次(J?kel 2010)。(4)“新加坡教育語料庫”(Singapore Corpus of Research in Education,簡(jiǎn)稱SCoRE)課堂話語子語庫,由洪華清于2004-2009年主持建設(shè),其英語語料源自英語授課的數(shù)學(xué)、科學(xué)、社會(huì)學(xué)和英語課堂,包括新加坡小學(xué)和中學(xué)122位教師一個(gè)單元的完整授課,共455節(jié),時(shí)長(zhǎng)565小時(shí),容量逾230萬詞次(Doyle 2009)。
我國(guó)英語課堂話語語料庫主要有3個(gè):(1)何安平主持建設(shè)的“英語教育教學(xué)語料庫”中的“課堂教學(xué)實(shí)況語庫”,容量105萬詞次。其中,中國(guó)英語教師教學(xué)語料庫自20世紀(jì)90年代末開始創(chuàng)建,容量逾96萬詞次,(小學(xué)英語教師教學(xué)語料庫8.4萬詞次、初中英語教師教學(xué)語料庫33.7萬詞次、高中英語教師教學(xué)語料庫27萬詞次),大學(xué)英語教師教學(xué)語料庫27.3萬詞次 (何安平2012)。(2)“英語師范生課堂話語語料庫”收集南京師范大學(xué)2005屆教學(xué)實(shí)習(xí)過程中的實(shí)習(xí)生課堂話語語料建成,首批40,000詞次 (劉學(xué)惠 2006)。(3)劉永兵主持建設(shè)的“中學(xué)英語課堂話語語料庫”,2007-2010年收集東北10個(gè)市縣21所中學(xué) (初中和高中),57個(gè)單元276節(jié)英語課的課堂語料,容量逾14萬詞次 (劉永兵 林正軍 王冰 2010)。
國(guó)內(nèi)英語課堂話語語料庫建設(shè)主要集中于初、中等教育階段,“課堂教學(xué)實(shí)況語庫”中,初中英語課堂話語語料最多,其中優(yōu)質(zhì)課語料又占相當(dāng)大的比例(何安平 2012),而優(yōu)質(zhì)課反映近年來中國(guó)內(nèi)地較為優(yōu)秀的英語課堂話語面貌 (何安平 2003)。“中學(xué)英語課堂話語語料庫”的英語話語量、詞匯量和詞匯復(fù)雜度等較為有限。英語師范生課堂話語語料庫由于授課者不是在職教師,不能完全反映高校英語課堂的真實(shí)會(huì)話情況。如果建成一個(gè)大規(guī)模的高校英語課堂話語語料庫,將能展現(xiàn)給研究者高校英語課堂話語的真實(shí)面貌,能為相關(guān)研究提供持續(xù)不斷的數(shù)據(jù)支持,更可避免一次或幾次小規(guī)模取樣而導(dǎo)致研究結(jié)果的片面性與局限性。
在大規(guī)模課堂話語語料收集正式開始前,我們?cè)诤邶埥图謨墒∈占?節(jié)高校通用英語課的課堂錄音,進(jìn)行先導(dǎo)性研究。根據(jù)研究結(jié)果,在規(guī)模性語料收集工作正式開始前,改進(jìn)調(diào)查工具和數(shù)據(jù)收集過程,設(shè)備使用、實(shí)際方式和文本處理等更趨合理。由于篇幅所限,此處僅介紹調(diào)查點(diǎn)及樣本確定、語料收集、語料庫生成和語料庫描述。
3.1調(diào)查點(diǎn)及樣本的確定
在調(diào)查點(diǎn)取樣過程中,我們最關(guān)心樣本的典型性,影響樣本典型性的主要因素是高校的地理分布和高校類型。我國(guó)幅員遼闊,各地英語課堂教學(xué)受區(qū)域經(jīng)濟(jì)、地方文化等因素影響而差異較大。黑龍江和吉林兩省地處東北老工業(yè)基地,兩省經(jīng)濟(jì)發(fā)展水平相當(dāng),地方文化相近,因此調(diào)查點(diǎn)集中于兩省的高校。高校類型則涉及所選取調(diào)查樣本中的學(xué)生語言水平、教師教育背景和教學(xué)經(jīng)歷等,關(guān)涉語料信度。為了盡可能保證語料的代表性,本研究采集樣本的覆蓋面包括黑龍江和吉林兩省教育部直屬985或 (及) 211高校、省屬高校、獨(dú)立學(xué)院3種類型 (以前兩種類型為主)。
取樣過程中,項(xiàng)目組成員嚴(yán)格按照取樣論證時(shí)制定的取樣準(zhǔn)則取樣,未加任何人工干預(yù)。調(diào)查點(diǎn)高校共12所,涵蓋理工類、師范類、財(cái)經(jīng)類、醫(yī)學(xué)類及綜合類,包括教育部直屬985或 (及) 211高校3所 (黑龍江1所、吉林2所)、省屬高校8所 (黑龍江6所、吉林2所)、獨(dú)立學(xué)院1所 (吉林1所)。其中,黑龍江省 (哈爾濱6所、綏化1所) 共7所,吉林省 (長(zhǎng)春4所、吉林1所) 共5所。
本項(xiàng)目針對(duì)高?;A(chǔ)階段 (一、二年級(jí)) 的通用英語課堂話語進(jìn)行采樣,對(duì)高校英語專業(yè)的基礎(chǔ)英語和非英語專業(yè)的大學(xué)英語課堂話語進(jìn)行錄音。入庫樣本的篩選遵循4條原則:(1)錄音清晰可識(shí)別:這為轉(zhuǎn)寫提供方便,也保證語料庫包含盡可能多的話語量;(2)一個(gè)完整單元 (unit) 的授課錄音:這保證反映課堂會(huì)話的全貌;(3)英文授課時(shí)長(zhǎng)累計(jì)1/2以上的錄音:本研究調(diào)查英語課堂話語,暫不將漢語納入研究范圍,為避免浪費(fèi)時(shí)間,只轉(zhuǎn)寫有效錄音樣本,教師英文授課時(shí)長(zhǎng)達(dá)到總授課時(shí)長(zhǎng)1/2以上的錄音樣本方可采用;(4)師生的許可:語料庫建設(shè)應(yīng)該得到作者許可,再把文本轉(zhuǎn)換成電子版形式(Mc-Enery, Hardie 2012)。本項(xiàng)目計(jì)劃入庫20位英語教師的課堂錄音轉(zhuǎn)寫語料,為防止個(gè)別樣本不符合上述篩選原則,我們按超出預(yù)計(jì)入庫樣本總數(shù)約25%的比例進(jìn)行語料收集,對(duì)于收集到的錄音語料“多則轉(zhuǎn)寫,少則補(bǔ)充”。
3.2 語料收集
國(guó)內(nèi)有些研究針對(duì)英語優(yōu)質(zhì)課的課堂話語展開(何安平 2003),但是這種條件下師生的課堂表現(xiàn)受許多因素干擾,無法體現(xiàn)英語課堂會(huì)話的真實(shí)情況。為呈現(xiàn)自然狀態(tài)下高?;A(chǔ)階段通用英語課堂話語的全貌,本項(xiàng)目采用自然調(diào)查法,收集常態(tài)下的自然、真實(shí)英語課堂話語語料,而不是內(nèi)省語料或誘導(dǎo)式語料(Meyer, Nelson 2006; Xiao 2009)。為避免“霍桑效應(yīng)”,將課堂干擾降至最低,盡可能使語料呈現(xiàn)自然狀態(tài)下的英語課堂師生話語,本項(xiàng)目使用高清錄音筆對(duì)高校基礎(chǔ)階段的通用英語課堂話語錄音。錄音筆由授課教師帶入課堂,放在教室前方講臺(tái)上較隱蔽的地方,英語課堂話語在完全自然狀態(tài)下被錄音,學(xué)生未被提前告知課堂話語要錄音,教師也并未被要求特別配合本研究而改變各自常規(guī)教學(xué)方式及專門注意自己的授課語言。
自2011年6月至2014年6月,本項(xiàng)目共對(duì)26位教師的英語課授課實(shí)況進(jìn)行錄音。經(jīng)過篩選,刪除4位教師的授課錄音文件,其中兩位教師的授課錄音由于錄音設(shè)備出現(xiàn)故障,每節(jié)課只收錄課堂前十幾分鐘的話語錄音,另外兩位教師的授課錄音均因教師上課半數(shù)以上時(shí)間使用漢語授課,22個(gè)有效樣本來自9所高校(黑龍江省5所和吉林省4所),其中10個(gè)源自教育部直屬985 或 (及) 211高校,11個(gè)源自省屬高校,1個(gè)源自獨(dú)立學(xué)院。
截至2014年6月項(xiàng)目結(jié)項(xiàng),入庫語料包括22位高校英語教師 (黑、吉兩省各11位) 講授一個(gè)單元教學(xué)內(nèi)容的完整課堂錄音。其中,英語專業(yè)和公共英語教師各11位,兩位為男性,其余皆為女性,教師平均年齡約32歲,平均教齡約7年半;其中1位教師獲得英語語言文學(xué)專業(yè)博士學(xué)位,兩位教師為英語語言文學(xué)專業(yè)在讀博士,1位教師正在攻讀英語教育碩士,其余18位教師都已獲得文學(xué)碩士學(xué)位 (此信息以課堂錄音時(shí)為準(zhǔn))。
3.3 語料庫的生成
我們對(duì)收集的錄音語料進(jìn)行數(shù)據(jù)儲(chǔ)存、文本轉(zhuǎn)寫、校對(duì)、清理、切分、標(biāo)記、詞性標(biāo)注和人工糾誤,初步建立起一個(gè)高?;A(chǔ)階段通用英語課堂話語語料庫(UFS-EGPCDC)。
限于篇幅,此處簡(jiǎn)要介紹本項(xiàng)目的語料轉(zhuǎn)寫、文本整理、清潔與命名及語料庫的標(biāo)記與標(biāo)注。
(1)語料轉(zhuǎn)寫
轉(zhuǎn)寫規(guī)范與研究者的研究問題、理論立場(chǎng)及分析方法密切相關(guān),它將影響其后分析和結(jié)果闡釋(Lapadat 2000)。高?;A(chǔ)階段通用英語課堂話語語料庫在外語對(duì)話課堂理論(譚芳 2014, 2015)指導(dǎo)下,從微觀、中觀、宏觀層面入手,研究高校通用英語課堂話語的語言使用、語篇結(jié)構(gòu)與從中折射的社會(huì)行為和意識(shí)形態(tài)的重要組成部分(譚芳 2015)。在設(shè)計(jì)語料轉(zhuǎn)寫規(guī)范時(shí),轉(zhuǎn)寫設(shè)計(jì)改編自Dressler和Kreuz (2000) 的轉(zhuǎn)寫模型,包括3個(gè)范疇:①語碼轉(zhuǎn)換:包括中英語碼轉(zhuǎn)換、中法語碼轉(zhuǎn)換、未知語言語碼轉(zhuǎn)換等,②聲音和言語事件:包括背景噪音、笑聲、掌聲、口吃、無法分辨或完全聽不清的詞、短語和句子等,③臨時(shí)事件:包括停頓、重疊等。同時(shí),轉(zhuǎn)寫規(guī)范設(shè)計(jì)遵循兩條原則:①易用性原則:將轉(zhuǎn)寫符號(hào)盡可能減少;②關(guān)聯(lián)性原則:轉(zhuǎn)寫符號(hào)均與研究問題相關(guān) (Lahlali 2003:92)。
此外,課堂內(nèi)閑話包括在轉(zhuǎn)寫范圍內(nèi),但是課休時(shí)英文對(duì)話不納入轉(zhuǎn)寫范圍。錄音中的數(shù)字、年代按照口語產(chǎn)出時(shí)的讀法轉(zhuǎn)寫。對(duì)英國(guó)英語和美國(guó)英語拼寫不同的單詞,如centre/center,neighbour/neighbor,fulfil/fulfill,favour/favor等,采用英式拼寫轉(zhuǎn)寫。Er和hmm等填充詞按猶豫、懷疑等不同話語功能區(qū)別處理。避免OK和HK等縮寫或是sb,sth一類的簡(jiǎn)寫,按照口語產(chǎn)出時(shí)的讀法轉(zhuǎn)寫成okay,Hong Kong, somebody,somethin等。遇到 can’t,cannot 縮略式與非縮略式讀音相同的情況,統(tǒng)一按縮略式can’t 轉(zhuǎn)寫,等等。
(2)文本的整理、清潔與命名
在文本整理過程中,按教師開始講課到宣布下課為止生成一個(gè)文檔。一般而言,一課時(shí) (lesson) 為40至50分鐘,高校通用英語課多為一次課兩課時(shí),課間休息10分鐘,調(diào)查點(diǎn)的高校中有一所高校進(jìn)行課改,通用英語課一次授課僅一課時(shí) (40分鐘),還有個(gè)別高校通用英語課兩課時(shí)中間無休息,教師將兩課時(shí)合并授課。因此,在生成獨(dú)立文檔時(shí),我們以教師宣布一堂課結(jié)束為界。在對(duì)文本進(jìn)行包括格式轉(zhuǎn)換、非法字符替換、糾錯(cuò)等一系列清潔整理工作后,采用對(duì)漢英混排文本非常經(jīng)濟(jì)的UTF-8編碼存儲(chǔ)語料庫的轉(zhuǎn)寫文本。
文檔命名均被賦予特定代碼,代碼的順序?yàn)椋菏》?城市-學(xué)校類別-學(xué)校名稱-專業(yè)/公外-年級(jí)-教師性別-教師姓名-文件代號(hào)。省份包含兩個(gè)代碼:H(黑龍江)、J(吉林),城市名按拼音首字母縮寫,如HRB(哈爾濱)、CC(長(zhǎng)春);學(xué)校類別包括3個(gè)代碼:1代表教育部直屬985或 (及) 211高校、2代表省屬高校、3代表獨(dú)立學(xué)院;學(xué)校名稱采用從1至9的代碼分別代表目前入庫語料來源的9所高校;專業(yè)/公外代碼分別為:E(英語專業(yè))和N(非英語專業(yè));年級(jí)代碼用1和2分別表示大一和大二;教師性別用F表示女,M表示男;教師姓名采用姓和名首字母縮合;文件代號(hào)為從1起的阿拉伯?dāng)?shù)字,代號(hào)順序與教師完成一個(gè)單元的授課順序一致。但為保護(hù)調(diào)查點(diǎn)及授課教師隱私,在實(shí)際研究中 (如在后文的索引行示例時(shí))文檔命名代碼會(huì)稍做處理。
(3)語料庫標(biāo)記與標(biāo)注
對(duì)文本進(jìn)行分詞處理后,我們把文本存儲(chǔ)為兩份:一份轉(zhuǎn)換為成品文本,為下一步標(biāo)記和標(biāo)注做準(zhǔn)備;另一份作為原始語料備份,以供未來研究需要源文本時(shí)隨時(shí)調(diào)出。我們先在轉(zhuǎn)寫文本的頭部對(duì)錄音時(shí)間、授課教師姓名、性別、年齡、授課時(shí)長(zhǎng)和課程名稱等元信息進(jìn)行標(biāo)注;同時(shí),為使庫容統(tǒng)計(jì)和相關(guān)信息分析相對(duì)準(zhǔn)確與方便,我們對(duì)語料庫中每位講話者的身份、話輪順序、話輪起止和學(xué)生姓名等都做標(biāo)記。雖然語料庫標(biāo)注可在語音、形態(tài)、詞匯、句法和語篇等多層面進(jìn)行,但是使用最為廣泛的是詞性標(biāo)注,本項(xiàng)目使用TreeTagger軟件對(duì)課堂話語的文本語料在詞匯層面進(jìn)行詞性標(biāo)注。在標(biāo)記和(詞性) 標(biāo)注后,進(jìn)行人工復(fù)查和糾誤。針對(duì)其它層面,如話步等不能實(shí)現(xiàn)全自動(dòng)標(biāo)注的信息,根據(jù)不同研究目的設(shè)計(jì)與之相對(duì)應(yīng)的標(biāo)注系統(tǒng),未來我們將結(jié)合具體研究問題完成相應(yīng)標(biāo)注,并將標(biāo)注后的文本導(dǎo)入數(shù)據(jù)庫,利用數(shù)據(jù)庫強(qiáng)大技術(shù)支持,對(duì)課堂話語語料進(jìn)行綜合處理,以服務(wù)于多角度、深層次的課堂話語分析。
3.4 語料庫描述
(1)容量:該項(xiàng)目前期準(zhǔn)備始于2011年初,項(xiàng)目設(shè)計(jì)期限為3年,2011年6月正式啟動(dòng)。截止2014年6月,已將黑、吉兩省4個(gè)城市9所大學(xué)22位英語教師講授一個(gè)教學(xué)單元的通用英語課的課堂錄音全部轉(zhuǎn)寫完畢并建庫。轉(zhuǎn)寫記錄每節(jié)英語課中教師的獨(dú)白話語、教師與全班 (或某一組) 學(xué)生的對(duì)話,教師與單個(gè)學(xué)生的對(duì)話以及兩名或多名學(xué)生之間的當(dāng)眾對(duì)話。入庫語料總時(shí)長(zhǎng)4,958分鐘,約82.6個(gè)小時(shí),我們將語料庫中的漢語去除后,利用AntConc 3.2.4w計(jì)算庫容,語料庫容量為英文類符8,902個(gè),型符 284,523個(gè)。
(2)特點(diǎn)與功能:本項(xiàng)目建立的高?;A(chǔ)階段通用英語課堂話語語料庫不同于大型、通用語料庫,它是中小型專門語料庫,為英語教師專業(yè)發(fā)展、二語習(xí)得、應(yīng)用語言學(xué)等研究提供事實(shí)依據(jù);可以服務(wù)于多方面研究:1)課堂教學(xué)分析,包括分析課堂教學(xué)的話語模式、知識(shí)建構(gòu)方法和教師教學(xué)策略等;2)課堂話語分析,課堂話語分析是多層面、多角度的,僅以句法層面的分析為例,可從語用角度分析課堂話語,如研究課堂中的禮貌、情態(tài)和師生權(quán)勢(shì)關(guān)系等;3)中介語研究,英語在中國(guó)屬于外語,課堂中師生的英語產(chǎn)出均是中介語,該語料庫可為中介語研究提供語言特征和會(huì)話互動(dòng)特征等多方面例證;4)外語教學(xué)理論與實(shí)踐分析,課堂是中國(guó)學(xué)生學(xué)習(xí)英語的主要場(chǎng)所,因此真實(shí)自然的英語課堂話語語料為驗(yàn)證不斷涌現(xiàn)的外語教學(xué)理論提供客觀事實(shí)與數(shù)據(jù)支持。
為展示高?;A(chǔ)階段通用英語課堂話語語料庫的部分特點(diǎn)與功能,此處僅以功能詞of為節(jié)點(diǎn)詞對(duì)本語料庫進(jìn)行檢索,概括并列舉索引行中of短語使用錯(cuò)誤。其中,較具代表性的錯(cuò)誤包括:
① N1+of+N2結(jié)構(gòu)中,本應(yīng)是復(fù)數(shù)的N2卻用作單數(shù)形式。如:
<034>
<033>
或者本應(yīng)是復(fù)數(shù)的N1用作單數(shù),如:
<100>
② of的冗余,如:
<018>
<015>
③ of 的濫用,導(dǎo)致語義不清,如:
<068>
濫用的of短語實(shí)則為本族語者在口筆語中皆少用或不用的短語,如:
<125>
其中的the same of,在美國(guó)楊百翰大學(xué) BNC 語料庫(BYU-BNC: The British National Corpus)中的頻數(shù)僅為33次,其中1例還是...not exactly the sameofcourseer partly because we...如果不算這例,the same of 的頻數(shù)僅為32次;而我們熟悉的the same as在BYU-BNC中的頻數(shù)則是2,548次。
④ of 的誤用,如:
<145>
其中本應(yīng)用in卻用of <023>
這些索引行示例使我們直觀、清晰地發(fā)現(xiàn)英語課堂話語中of短語的一些不易發(fā)現(xiàn)也很少提及的使用錯(cuò)誤,體現(xiàn)本語料庫中介語語料庫的特點(diǎn)與功能。
目前,高校基礎(chǔ)階段通用英語課堂話語語料庫的數(shù)據(jù)查詢還只能在離線狀態(tài)下進(jìn)行。研究人員利用一些第三方查詢工具查詢數(shù)據(jù)進(jìn)行統(tǒng)計(jì)。后續(xù)階段,我們將建立網(wǎng)絡(luò)檢索平臺(tái),在解決虛擬空間、語料庫版權(quán)和后臺(tái)服務(wù)器等問題后計(jì)劃將語料庫與網(wǎng)絡(luò)相連,供更多研究者使用。
高?;A(chǔ)階段通用英語課堂話語語料庫建立在自然語料基礎(chǔ)上,是國(guó)內(nèi)少有的常規(guī)教學(xué)狀態(tài)下的高校英語課堂話語語料庫。該庫的調(diào)查點(diǎn)及采樣相對(duì)集中,能夠提供給研究者高?;A(chǔ)階段通用英語課堂教學(xué)和課堂會(huì)話等最新實(shí)況,有利于研究者取得客觀、可供檢測(cè)的結(jié)論。目前,該口語語料庫的擴(kuò)建工作正在圍繞兩個(gè)方面進(jìn)行:(1)在樣本內(nèi)容上,正在收集高校英語專業(yè)3、4年級(jí)的高級(jí)英語課堂話語錄音,將建成包括大學(xué)英語、基礎(chǔ)英語和高級(jí)英語3個(gè)子語庫的高校通用英語課堂話語語料庫;(2)在采樣范圍上,正在收集并整理遼寧省高校英語課堂話語的錄音語料,預(yù)計(jì)再用3年左右可建立東北3省高校通用英語課堂話語語料庫。
何安平.基于語料庫的英語教師話語分析[J].現(xiàn)代外語, 2003 (2).
何安平.華南師范大學(xué)外國(guó)語言文化學(xué)院英語教育教學(xué)語料庫 (CEEC) 使用手冊(cè)[OL].http://www.docin.com/p-398932537.html, 2012.
劉學(xué)惠.英語師范生課堂話語的建庫、分析和應(yīng)用[J].外語電化教學(xué), 2006 (5).
劉永兵 林正軍 王 冰.基礎(chǔ)英語課堂話語語料庫的建構(gòu)與研究功能[J].當(dāng)代外語研究, 2010 (8).
劉永兵 張會(huì)平.中學(xué)英語教師課堂話語語法復(fù)雜度——一項(xiàng)基于課堂話語語料庫的對(duì)比研究[J].外語電化教學(xué), 2011 (3).
譚 芳.對(duì)話與課堂——回顧、反思與重構(gòu)[J].外語學(xué)刊, 2014 (4).
譚 芳.巴赫金理論視域下的外語對(duì)話課堂理論探究[M].長(zhǎng)春:吉林大學(xué)出版社, 2015.
許宏晨 田 野 常洪艷.一次對(duì)多媒體輔助外語教學(xué)態(tài)度的調(diào)查分析[J].外語電化教學(xué), 2004 (2).
Biber, D., Conard, S., Reppen, R., Byrd, P., Helt, M.The Spoken and Written Academic Language (T2K-SWAL) Corpus[A].In: Biber, D.(Ed.),UniversityLanguage:ACorpus-basedStudyofSpokenandWrittenRegisters[C].Amsterdam: John Benjamins Publishing Company, 2006.
Doyle, P.Language Development in Singapore Classrooms: A Corpus-based Description of the ‘School Variety’[A].In: Silver, R.E., Goh, C.C.M., Alsagoft, L.(Eds.),LanguageLearninginNewEnglishContexts:StudiesofAcquisitionandDevelopment[C].London: Continuum, 2009.
Dressler, R.A., Kreuz, R.J., Transcribing Oral Discourse: A Survey and a Model System [J].DiscourseProcesses, 2000(1).
J?kel, O.Working with Authentic ELT Discourse Data: The Flensburg English Classroom Corpus [A].In: Vogel, R., Sahel, S.(Eds.),NLKProceedings[C].Bielefeld: Bielefeld University, 2010.
Kennedy, G.AnIntroductiontoCorpusLinguistics[M].London: Longman, 1998.
Lahlali, E.M.Moroccan Classroom Discourse and Critical Discourse Analysis: The Impact of Social and Cultural Practice[D].The University of Leeds, 2003.
Lapadat, J.C.Problematizing Transcription: Purpose, Paradigm and Quality[J].InternationalJournalofSocialResearchMethodology, 2000(3).
McEnery, T., Hardie, A.CorpusLinguistics:Method,TheoryandPractice[M].Cambridge: Cambridge University Press, 2012.
Meyer, C., Nelson, G.Data Collection[A].In: Aarts, B., McMahon, A.(Eds.),TheHandbookofEnglishLinguistics[C].Oxford: Blackwell Publishing, 2006.
O’Keeffe, A.McCarthy, M., Carter, P.FromCorpustoClassroom:LanguageUseandLanguageTeaching[M].Cambridge: Cambridge University Press, 2007.
Xiao, R.Theogardry-driven Corpus Research: Using Corpora to Inform Aspect Theory[A].In: Lüdeling, A., Kyt?, M.(Eds.),CorpusLinguistics:AnInternationalHandbook[C].Berlin: Mouton de Gruyter, 2009.
TheCompilationofUFS-EGPCDC
Tan Fang
(Harbin University of Science and Technology, Harbin 150040, China)
Corpus is increasingly favoured by researchers of different fields due to its advantages such as the huge storage, real data and fast search.However, few numbers of spoken corpus have been built because of its high cost, technical complication and time-consuming process.Until now, no publication has specified the construction of English classroom discourse corpus of tertiary education in the domestic academic circle.This paper briefly introduces the compilation of EGP Classroom Discourse Corpus of the university fundamental stage (UFS-EGPCDC) over the past three years.After an overview of the research background, this paper reviews the construction of the typical classroom discourse corpus both at home and abroad, and then focuses on the research methodology of data collection, data processing et cetera, as well as the discussion about the features and functions of this corpus together with its implications for the English education reformation of higher education in China.
university; fundamental stage; EGP; classroom discourse; spoken corpus
定稿日期:2015-06-21
H030
A
1000-0100(2015)05-0042-5
* 本文系國(guó)家留學(xué)基金項(xiàng)目“高校通用英語課堂話語的現(xiàn)狀調(diào)查與多維分析”(2011823149)、黑龍江省人文社科研究項(xiàng)目“社會(huì)認(rèn)知視域下外語對(duì)話課堂的構(gòu)建——基于黑龍江、吉林兩省英語課堂語料庫的研究”(12512047)和黑龍江省社科基金項(xiàng)目“高校通用英語課堂話語的現(xiàn)狀調(diào)查與多維分析”(15YYD04)的階段性成果。
10.16263/j.cnki.23-1071/h.2015.05.009