語(yǔ)音識(shí)別應(yīng)用于大學(xué)英語(yǔ)聽(tīng)力教學(xué)的實(shí)證研究

2020-12-11 22:46:47魏瓊?cè)A

傳播力研究 2020年24期

關(guān)鍵詞：語(yǔ)音識(shí)別聽(tīng)力教學(xué)大學(xué)英語(yǔ)

魏瓊?cè)A

摘要：隨著語(yǔ)音識(shí)別技術(shù)的應(yīng)用，出現(xiàn)了一種新的可能性，即在與英美外籍人士交流時(shí)，可以使用語(yǔ)音識(shí)別技術(shù)對(duì)話的同時(shí)在手機(jī)顯示對(duì)應(yīng)的英文文本，這將顯著減小交流的障礙。本文將這種新的模式應(yīng)用于大學(xué)英語(yǔ)聽(tīng)力教學(xué)中并進(jìn)行定量評(píng)估，通過(guò)實(shí)驗(yàn)證明基于語(yǔ)音識(shí)別的大學(xué)英語(yǔ)聽(tīng)力教學(xué)模式可以更有效提高學(xué)生的英語(yǔ)聽(tīng)力成績(jī)，這有助于學(xué)生樹(shù)立信心，提高學(xué)習(xí)興趣，達(dá)到良好的學(xué)習(xí)效果。

關(guān)鍵詞：語(yǔ)音識(shí)別;大學(xué)英語(yǔ);聽(tīng)力教學(xué)

中圖分類(lèi)號(hào)：H319.9 文獻(xiàn)標(biāo)識(shí)碼：A 文章編號(hào)：2096-3866（2020）24-0-02

近年來(lái)，以深度學(xué)習(xí)為代表的人工智能飛速發(fā)展，各種軟件和功能不斷出現(xiàn)。其中不少深度學(xué)習(xí)的應(yīng)用和英語(yǔ)教學(xué)密切相關(guān)。在聽(tīng)的方面，語(yǔ)音識(shí)別已經(jīng)取得了長(zhǎng)足的進(jìn)展，準(zhǔn)確率不斷提高。說(shuō)的方面則更為簡(jiǎn)單，語(yǔ)音合成技術(shù)已經(jīng)非常成熟，除了有時(shí)有語(yǔ)調(diào)或者斷句之類(lèi)的小問(wèn)題，根據(jù)文本的自動(dòng)語(yǔ)音合成效果已經(jīng)可以和真人比擬。使用深度學(xué)習(xí)的翻譯機(jī)則表現(xiàn)了讀寫(xiě)方面的能力，在注意力機(jī)制出現(xiàn)之前，RNN曾經(jīng)取得了不少令人矚目的結(jié)果，在注意力機(jī)制和BERT出現(xiàn)之后，翻譯水平進(jìn)一步提高。不僅如此，人工智能也可以用來(lái)做文甚至寫(xiě)詩(shī)，還出現(xiàn)了能夠看圖做文的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)[1]。這些成果都表明，過(guò)去需要枯燥學(xué)習(xí)和長(zhǎng)期積累才能獲得的語(yǔ)言能力，可以使用人工智能輕易地獲得。這將給英語(yǔ)教學(xué)帶來(lái)天翻地覆的變化。

不過(guò)，盡管人工智能已經(jīng)取得了豐碩的成果，但是其不同領(lǐng)域的表現(xiàn)仍存在差異，特別是在機(jī)器翻譯方面，由于語(yǔ)言可以被用來(lái)表述不同專(zhuān)業(yè)領(lǐng)域的知識(shí)，使用語(yǔ)言時(shí)可能還有暗喻/典故/傾向/背景等很多因素的影響，所以機(jī)器翻譯還難以在所有領(lǐng)域代替人工翻譯。這一問(wèn)題在可預(yù)見(jiàn)的將來(lái)（數(shù)十年內(nèi)）應(yīng)該也不會(huì)改變。相比之下，語(yǔ)音識(shí)別的表現(xiàn)則略勝一籌，其誤差主要來(lái)自背景噪音。在信噪比較高的場(chǎng)合，語(yǔ)音識(shí)別的正確率可以相當(dāng)高?？紤]到中國(guó)學(xué)生的英語(yǔ)能力有一個(gè)突出的特點(diǎn)，就是讀寫(xiě)較好而聽(tīng)說(shuō)卻差強(qiáng)人意，所以在需要和英美人士交流的場(chǎng)合出現(xiàn)一種新的可能性：語(yǔ)音識(shí)別軟件將英語(yǔ)語(yǔ)音轉(zhuǎn)換為英語(yǔ)文本并顯示給國(guó)人，從而方便一個(gè)方向的交流。當(dāng)然，語(yǔ)音識(shí)別對(duì)反向的交流沒(méi)有幫助（外籍人士不可能閱讀中文文本），但語(yǔ)言交流的另外一個(gè)特點(diǎn)是，母語(yǔ)人士會(huì)很輕易地理解非母語(yǔ)人士說(shuō)出的話。所以反向交流障礙會(huì)小很多?；谶@些特點(diǎn)，將出現(xiàn)全新的涉外交流模式。

隨著社會(huì)國(guó)際化的不斷發(fā)展，在大學(xué)英語(yǔ)教學(xué)中，各高校越來(lái)越重視學(xué)生聽(tīng)說(shuō)能力的培養(yǎng)，但是實(shí)際的教學(xué)效果不容樂(lè)觀，因而，本文將通過(guò)具體的實(shí)證研究，對(duì)將語(yǔ)音識(shí)別應(yīng)用于大學(xué)英語(yǔ)聽(tīng)力教學(xué)的效果進(jìn)行探討和評(píng)價(jià)。

一、語(yǔ)音識(shí)別技術(shù)

語(yǔ)音識(shí)別的本質(zhì)是一種基于語(yǔ)音特征參數(shù)的模式識(shí)別，即通過(guò)學(xué)習(xí)，系統(tǒng)能夠把輸入的語(yǔ)音按一定模式進(jìn)行分類(lèi)，進(jìn)而依據(jù)判定準(zhǔn)則找出最佳匹配結(jié)果。語(yǔ)音識(shí)別技術(shù)已經(jīng)經(jīng)過(guò)了幾十年的發(fā)展，曾經(jīng)使用過(guò)的技術(shù)包括支持向量機(jī)、BP人工神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）、長(zhǎng)短時(shí)記憶模塊（LSTM）、卷積神經(jīng)網(wǎng)絡(luò)（CNN）等[2]。其中，LSTM、CNN ?等技術(shù)都基于深度學(xué)習(xí)技術(shù)。深度學(xué)習(xí)技術(shù)自 2009 年興起之后，已經(jīng)取得了長(zhǎng)足進(jìn)步，語(yǔ)音識(shí)別的準(zhǔn)確率也隨之同步提高。目前，語(yǔ)音識(shí)別的精度和速度取決于實(shí)際應(yīng)用環(huán)境，但在安靜環(huán)境、標(biāo)準(zhǔn)口音、常見(jiàn)詞匯場(chǎng)景下的語(yǔ)音識(shí)別率已經(jīng)超過(guò) 95%，意味著具備了與人類(lèi)相仿的語(yǔ)言識(shí)別能力。隨著技術(shù)的發(fā)展，現(xiàn)在口音、方言、噪聲等場(chǎng)景下的語(yǔ)音識(shí)別也達(dá)到了可用狀態(tài)，特別是遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別已經(jīng)隨著智能音箱的興起成為全球消費(fèi)電子領(lǐng)域應(yīng)用最為成功的技術(shù)之一。

當(dāng)然，當(dāng)前技術(shù)還存在很多不足，如對(duì)于強(qiáng)噪聲、超遠(yuǎn)場(chǎng)、強(qiáng)干擾、多語(yǔ)種、大詞匯等場(chǎng)景下的語(yǔ)音識(shí)別還需要很大的提升;不過(guò)，在需要和外籍人士交流的場(chǎng)合，一般都可以保證相對(duì)安靜的環(huán)境和較高的信噪比，不會(huì)有太大的干擾，所以這些障礙一般不會(huì)表現(xiàn)出來(lái)。

二、實(shí)驗(yàn)方案與結(jié)果

（一）研究假設(shè)與對(duì)象

本研究的主要目的是檢驗(yàn)語(yǔ)音識(shí)別是否能夠?qū)邆湎喈?dāng)英語(yǔ)讀寫(xiě)能力的學(xué)生提高聽(tīng)力水平，能夠提高多少。研究對(duì)象為河南中醫(yī)藥大學(xué)2018級(jí)非英語(yǔ)專(zhuān)業(yè)本科生80人，由于考慮到英語(yǔ)成績(jī)太差的學(xué)生看字幕可能有困難，而成績(jī)優(yōu)秀的學(xué)生語(yǔ)音識(shí)別作用不明顯，選取的80位同學(xué)在2019年春季期末英語(yǔ)考試成績(jī)均在60分至75分之間，將這80人隨機(jī)分成實(shí)驗(yàn)組和對(duì)照組，兩組均為40人。

（二）研究步驟

本文實(shí)驗(yàn)具體方法：選定聽(tīng)力語(yǔ)料，對(duì)實(shí)驗(yàn)組和對(duì)照組進(jìn)行聽(tīng)力測(cè)試，統(tǒng)計(jì)考試成績(jī)進(jìn)行分析。實(shí)驗(yàn)組和對(duì)照組的聽(tīng)力語(yǔ)料相同，實(shí)驗(yàn)區(qū)別在于，實(shí)驗(yàn)組聽(tīng)力測(cè)試的同時(shí)在學(xué)生前面的顯示器上顯示語(yǔ)音識(shí)別的英文文本。實(shí)驗(yàn)結(jié)束后，對(duì)兩組成績(jī)核對(duì)分布、方差齊性，再進(jìn)行獨(dú)立樣本t檢驗(yàn)。

在實(shí)驗(yàn)中，首先確定實(shí)現(xiàn)語(yǔ)音識(shí)別的接口。目前，百度和科大訊飛等公司都提供了中文語(yǔ)音識(shí)別接口，但是這些公司更多地關(guān)注中文。相比之下，Google云提供的語(yǔ)音識(shí)別引擎不僅提供流式語(yǔ)音識(shí)別，還能通過(guò)提供提示來(lái)定制語(yǔ)音識(shí)別功能，以轉(zhuǎn)錄特定領(lǐng)域的術(shù)語(yǔ)和生僻字詞，并提高特定字詞或短語(yǔ)的轉(zhuǎn)錄準(zhǔn)確率。所以是我們實(shí)驗(yàn)中選用Google云的引擎。

本文測(cè)試選用的語(yǔ)料則為大學(xué)外語(yǔ)題庫(kù)中的聽(tīng)力測(cè)試題目，按照常規(guī)考試安排，包含對(duì)話理解（60分）和短篇理解（40分）。其中對(duì)話理解的難度較低，而短篇理解來(lái)自大四聽(tīng)力考試的題庫(kù)。所有題目語(yǔ)音識(shí)別的結(jié)果均來(lái)自Google云服務(wù)。需要注意的是，盡管Google語(yǔ)音識(shí)別的速度很快，但是流式語(yǔ)音識(shí)別畢竟要搜集到一段話后才能結(jié)合上下文給出語(yǔ)音識(shí)別結(jié)果，表現(xiàn)為語(yǔ)音識(shí)別給出的文本會(huì)滯后于語(yǔ)音發(fā)生時(shí)刻，這一時(shí)延一般在5-10秒之間（有時(shí)為網(wǎng)絡(luò)延遲），為真實(shí)計(jì)，在給學(xué)生顯示語(yǔ)音識(shí)別結(jié)果時(shí)，也同時(shí)精確地體現(xiàn)這一時(shí)延。這延時(shí)正好可以讓學(xué)生評(píng)價(jià)自己所聽(tīng)到的內(nèi)容，并且跟隨后的語(yǔ)音識(shí)別提供的文本進(jìn)行對(duì)比，找出聽(tīng)力的不足。此外，語(yǔ)音識(shí)別偶然會(huì)出錯(cuò)，對(duì)應(yīng)的錯(cuò)誤文本也不加修改向?qū)W生展示。