魏瓊?cè)A
摘 要:隨著語(yǔ)音識(shí)別技術(shù)的應(yīng)用,出現(xiàn)了一種新的可能性,即在與英美外籍人士交流時(shí),可以使用語(yǔ)音識(shí)別技術(shù)對(duì)話的同時(shí)在手機(jī)顯示對(duì)應(yīng)的英文文本,這將顯著減小交流的障礙。本文將這種新的模式應(yīng)用于大學(xué)英語(yǔ)聽(tīng)力教學(xué)中并進(jìn)行定量評(píng)估,通過(guò)實(shí)驗(yàn)證明基于語(yǔ)音識(shí)別的大學(xué)英語(yǔ)聽(tīng)力教學(xué)模式可以更有效提高學(xué)生的英語(yǔ)聽(tīng)力成績(jī),這有助于學(xué)生樹(shù)立信心,提高學(xué)習(xí)興趣,達(dá)到良好的學(xué)習(xí)效果。
關(guān)鍵詞:語(yǔ)音識(shí)別;大學(xué)英語(yǔ);聽(tīng)力教學(xué)
中圖分類(lèi)號(hào):H319.9 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-3866(2020)24-0-02
近年來(lái),以深度學(xué)習(xí)為代表的人工智能飛速發(fā)展,各種軟件和功能不斷出現(xiàn)。其中不少深度學(xué)習(xí)的應(yīng)用和英語(yǔ)教學(xué)密切相關(guān)。在聽(tīng)的方面,語(yǔ)音識(shí)別已經(jīng)取得了長(zhǎng)足的進(jìn)展,準(zhǔn)確率不斷提高。說(shuō)的方面則更為簡(jiǎn)單,語(yǔ)音合成技術(shù)已經(jīng)非常成熟,除了有時(shí)有語(yǔ)調(diào)或者斷句之類(lèi)的小問(wèn)題,根據(jù)文本的自動(dòng)語(yǔ)音合成效果已經(jīng)可以和真人比擬。使用深度學(xué)習(xí)的翻譯機(jī)則表現(xiàn)了讀寫(xiě)方面的能力,在注意力機(jī)制出現(xiàn)之前,RNN曾經(jīng)取得了不少令人矚目的結(jié)果,在注意力機(jī)制和BERT出現(xiàn)之后,翻譯水平進(jìn)一步提高。不僅如此,人工智能也可以用來(lái)做文甚至寫(xiě)詩(shī),還出現(xiàn)了能夠看圖做文的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)[1]。這些成果都表明,過(guò)去需要枯燥學(xué)習(xí)和長(zhǎng)期積累才能獲得的語(yǔ)言能力,可以使用人工智能輕易地獲得。這將給英語(yǔ)教學(xué)帶來(lái)天翻地覆的變化。
不過(guò),盡管人工智能已經(jīng)取得了豐碩的成果,但是其不同領(lǐng)域的表現(xiàn)仍存在差異,特別是在機(jī)器翻譯方面,由于語(yǔ)言可以被用來(lái)表述不同專(zhuān)業(yè)領(lǐng)域的知識(shí),使用語(yǔ)言時(shí)可能還有暗喻/典故/傾向/背景等很多因素的影響,所以機(jī)器翻譯還難以在所有領(lǐng)域代替人工翻譯。這一問(wèn)題在可預(yù)見(jiàn)的將來(lái)(數(shù)十年內(nèi))應(yīng)該也不會(huì)改變。相比之下,語(yǔ)音識(shí)別的表現(xiàn)則略勝一籌,其誤差主要來(lái)自背景噪音。在信噪比較高的場(chǎng)合,語(yǔ)音識(shí)別的正確率可以相當(dāng)高??紤]到中國(guó)學(xué)生的英語(yǔ)能力有一個(gè)突出的特點(diǎn),就是讀寫(xiě)較好而聽(tīng)說(shuō)卻差強(qiáng)人意,所以在需要和英美人士交流的場(chǎng)合出現(xiàn)一種新的可能性:語(yǔ)音識(shí)別軟件將英語(yǔ)語(yǔ)音轉(zhuǎn)換為英語(yǔ)文本并顯示給國(guó)人,從而方便一個(gè)方向的交流。當(dāng)然,語(yǔ)音識(shí)別對(duì)反向的交流沒(méi)有幫助(外籍人士不可能閱讀中文文本),但語(yǔ)言交流的另外一個(gè)特點(diǎn)是,母語(yǔ)人士會(huì)很輕易地理解非母語(yǔ)人士說(shuō)出的話。所以反向交流障礙會(huì)小很多?;谶@些特點(diǎn),將出現(xiàn)全新的涉外交流模式。
隨著社會(huì)國(guó)際化的不斷發(fā)展,在大學(xué)英語(yǔ)教學(xué)中,各高校越來(lái)越重視學(xué)生聽(tīng)說(shuō)能力的培養(yǎng),但是實(shí)際的教學(xué)效果不容樂(lè)觀,因而,本文將通過(guò)具體的實(shí)證研究,對(duì)將語(yǔ)音識(shí)別應(yīng)用于大學(xué)英語(yǔ)聽(tīng)力教學(xué)的效果進(jìn)行探討和評(píng)價(jià)。
一、語(yǔ)音識(shí)別技術(shù)
語(yǔ)音識(shí)別的本質(zhì)是一種基于語(yǔ)音特征參數(shù)的模式識(shí)別,即通過(guò)學(xué)習(xí),系統(tǒng)能夠把輸入的語(yǔ)音按一定模式進(jìn)行分類(lèi),進(jìn)而依據(jù)判定準(zhǔn)則找出最佳匹配結(jié)果。語(yǔ)音識(shí)別技術(shù)已經(jīng)經(jīng)過(guò)了幾十年的發(fā)展,曾經(jīng)使用過(guò)的技術(shù)包括支持向量機(jī)、BP人工神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長(zhǎng)短時(shí)記憶模塊(LSTM)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)等[2]。其中,LSTM、CNN ?等技術(shù)都基于深度學(xué)習(xí)技術(shù)。深度學(xué)習(xí)技術(shù)自 2009 年興起之后,已經(jīng)取得了長(zhǎng)足進(jìn)步,語(yǔ)音識(shí)別的準(zhǔn)確率也隨之同步提高。目前,語(yǔ)音識(shí)別的精度和速度取決于實(shí)際應(yīng)用環(huán)境,但在安靜環(huán)境、標(biāo)準(zhǔn)口音、常見(jiàn)詞匯場(chǎng)景下的語(yǔ)音識(shí)別率已經(jīng)超過(guò) 95%,意味著具備了與人類(lèi)相仿的語(yǔ)言識(shí)別能力。隨著技術(shù)的發(fā)展,現(xiàn)在口音、方言、噪聲等場(chǎng)景下的語(yǔ)音識(shí)別也達(dá)到了可用狀態(tài),特別是遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別已經(jīng)隨著智能音箱的興起成為全球消費(fèi)電子領(lǐng)域應(yīng)用最為成功的技術(shù)之一。
當(dāng)然,當(dāng)前技術(shù)還存在很多不足,如對(duì)于強(qiáng)噪聲、超遠(yuǎn)場(chǎng)、強(qiáng)干擾、多語(yǔ)種、大詞匯等場(chǎng)景下的語(yǔ)音識(shí)別還需要很大的提升;不過(guò),在需要和外籍人士交流的場(chǎng)合,一般都可以保證相對(duì)安靜的環(huán)境和較高的信噪比,不會(huì)有太大的干擾,所以這些障礙一般不會(huì)表現(xiàn)出來(lái)。
二、實(shí)驗(yàn)方案與結(jié)果
(一)研究假設(shè)與對(duì)象
本研究的主要目的是檢驗(yàn)語(yǔ)音識(shí)別是否能夠?qū)邆湎喈?dāng)英語(yǔ)讀寫(xiě)能力的學(xué)生提高聽(tīng)力水平,能夠提高多少。研究對(duì)象為河南中醫(yī)藥大學(xué)2018級(jí)非英語(yǔ)專(zhuān)業(yè)本科生80人,由于考慮到英語(yǔ)成績(jī)太差的學(xué)生看字幕可能有困難,而成績(jī)優(yōu)秀的學(xué)生語(yǔ)音識(shí)別作用不明顯,選取的80位同學(xué)在2019年春季期末英語(yǔ)考試成績(jī)均在60分至75分之間,將這80人隨機(jī)分成實(shí)驗(yàn)組和對(duì)照組,兩組均為40人。
(二)研究步驟
本文實(shí)驗(yàn)具體方法:選定聽(tīng)力語(yǔ)料,對(duì)實(shí)驗(yàn)組和對(duì)照組進(jìn)行聽(tīng)力測(cè)試,統(tǒng)計(jì)考試成績(jī)進(jìn)行分析。實(shí)驗(yàn)組和對(duì)照組的聽(tīng)力語(yǔ)料相同,實(shí)驗(yàn)區(qū)別在于,實(shí)驗(yàn)組聽(tīng)力測(cè)試的同時(shí)在學(xué)生前面的顯示器上顯示語(yǔ)音識(shí)別的英文文本。實(shí)驗(yàn)結(jié)束后,對(duì)兩組成績(jī)核對(duì)分布、方差齊性,再進(jìn)行獨(dú)立樣本t檢驗(yàn)。
在實(shí)驗(yàn)中,首先確定實(shí)現(xiàn)語(yǔ)音識(shí)別的接口。目前,百度和科大訊飛等公司都提供了中文語(yǔ)音識(shí)別接口,但是這些公司更多地關(guān)注中文。相比之下,Google云提供的語(yǔ)音識(shí)別引擎不僅提供流式語(yǔ)音識(shí)別,還能通過(guò)提供提示來(lái)定制語(yǔ)音識(shí)別功能,以轉(zhuǎn)錄特定領(lǐng)域的術(shù)語(yǔ)和生僻字詞,并提高特定字詞或短語(yǔ)的轉(zhuǎn)錄準(zhǔn)確率。所以是我們實(shí)驗(yàn)中選用Google云的引擎。
本文測(cè)試選用的語(yǔ)料則為大學(xué)外語(yǔ)題庫(kù)中的聽(tīng)力測(cè)試題目,按照常規(guī)考試安排,包含對(duì)話理解(60分)和短篇理解(40分)。其中對(duì)話理解的難度較低,而短篇理解來(lái)自大四聽(tīng)力考試的題庫(kù)。所有題目語(yǔ)音識(shí)別的結(jié)果均來(lái)自Google云服務(wù)。需要注意的是,盡管Google語(yǔ)音識(shí)別的速度很快,但是流式語(yǔ)音識(shí)別畢竟要搜集到一段話后才能結(jié)合上下文給出語(yǔ)音識(shí)別結(jié)果,表現(xiàn)為語(yǔ)音識(shí)別給出的文本會(huì)滯后于語(yǔ)音發(fā)生時(shí)刻,這一時(shí)延一般在5-10秒之間(有時(shí)為網(wǎng)絡(luò)延遲),為真實(shí)計(jì),在給學(xué)生顯示語(yǔ)音識(shí)別結(jié)果時(shí),也同時(shí)精確地體現(xiàn)這一時(shí)延。這延時(shí)正好可以讓學(xué)生評(píng)價(jià)自己所聽(tīng)到的內(nèi)容,并且跟隨后的語(yǔ)音識(shí)別提供的文本進(jìn)行對(duì)比,找出聽(tīng)力的不足。此外,語(yǔ)音識(shí)別偶然會(huì)出錯(cuò),對(duì)應(yīng)的錯(cuò)誤文本也不加修改向?qū)W生展示。