覃劍永 朱明增 陳極萬(wàn) 周素君
[摘? ? 要]在社會(huì)生產(chǎn)、人們的生活中,電力系統(tǒng)所起到的作用越來(lái)越明顯,尤其是隨著能源轉(zhuǎn)型,電能在社會(huì)發(fā)展中的作用更為明顯,而支持大部分電能傳輸與能量轉(zhuǎn)化實(shí)現(xiàn)的電網(wǎng)則成為電力系統(tǒng)正常運(yùn)行不可或缺的重要部分。由于電網(wǎng)承擔(dān)著傳輸、調(diào)度電能的重要職責(zé),平時(shí)電網(wǎng)運(yùn)行壓力大,容易出現(xiàn)停電事故等。而停電事故發(fā)生之后,勢(shì)必會(huì)對(duì)生活與生產(chǎn)產(chǎn)生不利影響,故提高電網(wǎng)管控水平具有十分重要的意義。近年來(lái)隨著人工智能等技術(shù)的不斷發(fā)展,一些先進(jìn)的智能化技術(shù)在電網(wǎng)管理中逐漸得到應(yīng)用,為電網(wǎng)調(diào)度等管控質(zhì)量提供助力。文章基于人耳聽(tīng)覺(jué)特性,分析在電網(wǎng)運(yùn)維中語(yǔ)音識(shí)別預(yù)處理相關(guān)技術(shù)及應(yīng)用設(shè)計(jì),以進(jìn)一步助推電網(wǎng)管控智能化發(fā)展。
[關(guān)鍵詞]語(yǔ)音識(shí)別;人耳聽(tīng)覺(jué)特性;預(yù)處理;電網(wǎng)管控
[中圖分類(lèi)號(hào)]TN912.34 [文獻(xiàn)標(biāo)志碼]A [文章編號(hào)]2095–6487(2021)09–0–03
[Abstract]In social production, life and other activities, the role of the power system is becoming more and more obvious, especially with the energy transition, the role of electric energy in social development is more obvious, and most of the power transmission and energy conversion are supported The realized grid has become an important part of the normal operation of the power system. As the power grid bears the important responsibility of transmitting and dispatching electric energy, the power grid is under high pressure in normal operation, and it is prone to power outages. After a power outage occurs, it will inevitably have an adverse impact on life and production, so it is of great significance to improve the level of power grid management and control. In recent years, with the continuous development of artificial intelligence and other technologies, some advanced intelligent technologies have gradually been applied in power grid management, providing assistance to the quality of power grid dispatching and other management and control. Based on the characteristics of human hearing, analyze the related technology and application design of speech recognition preprocessing in power grid operation and maintenance to further promote the intelligent development of power grid management and control.
[Keywords]speech recognition; human hearing characteristics; preprocessing; power grid control
電網(wǎng)管控的主要內(nèi)容涉及電網(wǎng)調(diào)度、電網(wǎng)維護(hù)等,其中電網(wǎng)調(diào)度是電網(wǎng)管控中最為重要的內(nèi)容,提高電網(wǎng)調(diào)度管理智能化水平,對(duì)于推動(dòng)整個(gè)電網(wǎng)管控智能化發(fā)展具有積極意義。當(dāng)前語(yǔ)音識(shí)別技術(shù)在電網(wǎng)調(diào)度智能化管控中應(yīng)用較為廣泛,給電網(wǎng)智能化調(diào)度提供保障。電網(wǎng)調(diào)度領(lǐng)域同其他領(lǐng)域相比有很高的特殊性,一般電網(wǎng)調(diào)度指令交互可靠性要求較高,且存在區(qū)域性口音問(wèn)題,為語(yǔ)音的正確識(shí)別增加了難度,因此研究一種可以準(zhǔn)確識(shí)別語(yǔ)音并進(jìn)行科學(xué)預(yù)處理的語(yǔ)音識(shí)別語(yǔ)言模型,可有效識(shí)別調(diào)度員在下達(dá)指令時(shí)的口誤或者漏步,提升電網(wǎng)智能化管控質(zhì)量。
1 基于人耳聽(tīng)覺(jué)特性的語(yǔ)音識(shí)別與預(yù)處理模型的初步構(gòu)建
為構(gòu)建科學(xué)的語(yǔ)音識(shí)別預(yù)處理模型,則需要模仿人耳,確保語(yǔ)言識(shí)別可以更加貼近真實(shí)人耳聽(tīng)到的內(nèi)容,確保指令傳達(dá)的準(zhǔn)確性,避免由于語(yǔ)言識(shí)別同人耳出入過(guò)大,影響電網(wǎng)調(diào)度等相關(guān)指令的正確傳達(dá)。基于人耳聽(tīng)覺(jué)特性構(gòu)建的語(yǔ)音識(shí)別模型主要由以下幾個(gè)部分組成。
1.1 仿人耳聲音信號(hào)接收、分離、處理
當(dāng)人耳接收到聲音信息后,會(huì)對(duì)聲音信號(hào)進(jìn)行預(yù)處理,提取其中重要的語(yǔ)音信號(hào),之后通過(guò)對(duì)提取的語(yǔ)音信號(hào)進(jìn)行端點(diǎn)檢測(cè)—加窗—分幀等處理后,提取其中的MFCC參數(shù),并建立相關(guān)聲學(xué)模型,確保語(yǔ)音識(shí)別得以實(shí)現(xiàn)。
構(gòu)建的語(yǔ)音識(shí)別與預(yù)處理模型仿照人耳結(jié)構(gòu),將預(yù)處理模型分為耳蝸基底膜模型、提取語(yǔ)音信息、腦下丘細(xì)胞模型等,不同的模型組成部分在語(yǔ)音識(shí)別與預(yù)處理中發(fā)揮的作用不同,其中耳蝸基底膜模型可以實(shí)現(xiàn)將接收到的各類(lèi)語(yǔ)言信號(hào)劃分為不同的通道,之后利用相應(yīng)的橄欖模型(同側(cè)內(nèi)側(cè)、同側(cè)外側(cè))對(duì)經(jīng)過(guò)分類(lèi)的語(yǔ)言信號(hào)進(jìn)行提取處理,對(duì)信號(hào)預(yù)處理過(guò)程進(jìn)行管控,確保信號(hào)預(yù)處理質(zhì)量。
1.2 耳蝸基底膜模型
仿照人耳設(shè)計(jì)的耳蝸基底膜模型可以實(shí)現(xiàn)對(duì)各類(lèi)語(yǔ)音信息的處理,根據(jù)語(yǔ)音信號(hào)的不同將語(yǔ)音進(jìn)行分類(lèi),并從中提取重要的語(yǔ)音信號(hào),實(shí)現(xiàn)對(duì)語(yǔ)音信息的分離處理,為下一步信號(hào)處理等提供必要技術(shù)支持??紤]到聽(tīng)覺(jué)神經(jīng)特性,為更為真實(shí)地實(shí)現(xiàn)語(yǔ)言識(shí)別,選擇16個(gè)信號(hào)通道,對(duì)收集到的語(yǔ)言信號(hào)進(jìn)行分離,一般頻率范圍設(shè)置在100 Hz~4 kHz之間,實(shí)現(xiàn)對(duì)雙耳聲音通道(左耳、右耳)語(yǔ)音信號(hào)的全面分解,便于通過(guò)設(shè)計(jì)的耳蝸基底膜模型實(shí)現(xiàn)信號(hào)的科學(xué)處理。
1.3 信息提取與識(shí)別
(1)信息的提取是語(yǔ)音識(shí)別最為重要的環(huán)節(jié),此環(huán)節(jié)語(yǔ)音識(shí)別的結(jié)果將直接影響下一步的語(yǔ)言信息處理。
①考慮到電網(wǎng)調(diào)度領(lǐng)域語(yǔ)言特殊性,采用詞向量等設(shè)計(jì),實(shí)現(xiàn)對(duì)電網(wǎng)調(diào)度中專(zhuān)業(yè)性比較強(qiáng)的詞匯等進(jìn)行科學(xué)處理,以準(zhǔn)確確定語(yǔ)音信號(hào)傳達(dá)的真正含義,確保語(yǔ)言識(shí)別與預(yù)處理模型的質(zhì)量。
②采用Word2vec技術(shù)實(shí)現(xiàn)對(duì)專(zhuān)業(yè)語(yǔ)言信號(hào)的識(shí)別與處理。Word2vec技術(shù)可以將離散的語(yǔ)言信號(hào)轉(zhuǎn)變?yōu)橛?jì)算技術(shù)可以處理的數(shù)值向量,將原本無(wú)法進(jìn)行計(jì)算的語(yǔ)言轉(zhuǎn)化為可以計(jì)算的語(yǔ)言向量信息,便于語(yǔ)言之后的處理。Word2vec技術(shù)運(yùn)用中,詞向量的出現(xiàn)需要依賴(lài)一定的語(yǔ)料庫(kù)。
③由于當(dāng)前語(yǔ)言模型語(yǔ)料庫(kù)并不完備,因此利用循環(huán)神經(jīng)與深度學(xué)習(xí)相關(guān)技術(shù),構(gòu)建智能化語(yǔ)料庫(kù),為語(yǔ)音信息提取提供相應(yīng)的語(yǔ)料庫(kù)。采用的詞向量生成方法為可以對(duì)詞典中任意詞指定固定的定值向量,詞向量是對(duì)詞典中的任意指定一個(gè)固定長(zhǎng)度的實(shí)值向量v(W)∈Rm,W的詞向量用v(W)表示,m維的實(shí)數(shù)向量空間采用Rm表示,之后利用已經(jīng)編輯好的計(jì)算機(jī)學(xué)習(xí)算法對(duì)語(yǔ)音進(jìn)行處理與識(shí)別,實(shí)現(xiàn)自然語(yǔ)言處理。
(2)在此環(huán)節(jié)語(yǔ)言識(shí)別中,需要構(gòu)建相應(yīng)的向量庫(kù),以通過(guò)向量庫(kù)詞匯的運(yùn)用實(shí)現(xiàn)深度學(xué)習(xí),提升系統(tǒng)語(yǔ)音識(shí)別能力。采用Word2vec技術(shù),考慮到調(diào)度業(yè)務(wù)語(yǔ)句語(yǔ)境與調(diào)度詞匯具體情況,參照下述流程構(gòu)建詞匯庫(kù)。
①語(yǔ)料庫(kù)信息收集。電網(wǎng)調(diào)度相關(guān)信息的全面收集包括事故預(yù)案、調(diào)度規(guī)程、運(yùn)行方式、歷史調(diào)度日志等非結(jié)構(gòu)化數(shù)據(jù)文檔信息的收集,并構(gòu)成相應(yīng)全面的歷史語(yǔ)料庫(kù),該語(yǔ)料庫(kù)屬于開(kāi)放式語(yǔ)料庫(kù),可以持續(xù)性存儲(chǔ)豐富內(nèi)容。
②語(yǔ)料庫(kù)信息預(yù)處理。對(duì)已經(jīng)構(gòu)成的語(yǔ)料庫(kù)數(shù)據(jù)進(jìn)行處理,處理內(nèi)容包括對(duì)歷史語(yǔ)料庫(kù)中的數(shù)據(jù)進(jìn)行去除停用詞、去除標(biāo)點(diǎn)符號(hào)、中文分詞等處理,形成電網(wǎng)調(diào)度領(lǐng)域語(yǔ)言識(shí)別與預(yù)處理的初始詞典。
③調(diào)度詞匯訓(xùn)練。當(dāng)初始調(diào)度詞典構(gòu)建完成后,可以通過(guò)調(diào)度詞匯相關(guān)搜索,鎖定相應(yīng)搜索的詞匯在詞典中的位置,同時(shí)進(jìn)行One-Hot編碼,并結(jié)合歷史詞典的實(shí)際情況,將形成的語(yǔ)料送入Word2vec模型中進(jìn)行深度學(xué)習(xí),獲得更多詞向量,對(duì)當(dāng)前調(diào)度語(yǔ)料庫(kù)進(jìn)行持續(xù)性更新,為電網(wǎng)調(diào)度相關(guān)語(yǔ)音信息的識(shí)別與處理提供支持。
④詞向量評(píng)估。當(dāng)詞料庫(kù)經(jīng)過(guò)更新之后,需要采用詞向量之間的計(jì)算、詞匯之間夾角余弦值來(lái)衡量詞匯之間的相似程度等方式對(duì)詞匯向量進(jìn)行評(píng)估,確定詞向量的合理性及簡(jiǎn)單詞匯之間的邏輯關(guān)系。
1.4 語(yǔ)音預(yù)處理模型——腦下丘細(xì)胞模型
待信息識(shí)別結(jié)束后,通過(guò)語(yǔ)音預(yù)處理系統(tǒng)對(duì)已經(jīng)獲取的語(yǔ)音進(jìn)行處理,確保相關(guān)語(yǔ)音指令執(zhí)行,確保智能化電網(wǎng)語(yǔ)音識(shí)別與處理模型可以真正發(fā)揮出效用。
語(yǔ)音處理模型與電網(wǎng)調(diào)度智能系統(tǒng)相連,通過(guò)預(yù)處理的語(yǔ)音信息,直接轉(zhuǎn)變?yōu)殡娋W(wǎng)調(diào)度系統(tǒng)的操作指令,由電網(wǎng)智能操作系統(tǒng)輸入端口輸入,實(shí)現(xiàn)電網(wǎng)調(diào)度系統(tǒng)的智能化管控。
在語(yǔ)音預(yù)處理上,采用Onsetcell模型,該模型包括兩個(gè)狀態(tài),一個(gè)狀態(tài)為激活狀態(tài),一個(gè)狀態(tài)為非激活狀態(tài)。此模型設(shè)計(jì)類(lèi)似于突觸模型的神經(jīng)元,通過(guò)激活與非激活狀態(tài)實(shí)現(xiàn)信息的處理。
在該模型設(shè)計(jì)上對(duì)雙耳信號(hào)輸入無(wú)限制,當(dāng)接收到信號(hào)時(shí)模型進(jìn)入激活狀態(tài),反之信號(hào)進(jìn)入非激活狀態(tài),通過(guò)激活實(shí)現(xiàn)信息的傳遞與處理。Onsetcell模型的具體工作原理如圖1所示。
2 基于電網(wǎng)調(diào)度語(yǔ)音識(shí)別與交互系統(tǒng)設(shè)計(jì)
為了進(jìn)一步提高語(yǔ)音識(shí)別技術(shù)在電網(wǎng)調(diào)度中應(yīng)用的價(jià)值,延伸語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì),完善整個(gè)電網(wǎng)調(diào)度語(yǔ)音識(shí)別與交互系統(tǒng)。
在現(xiàn)有語(yǔ)音識(shí)別與預(yù)處理模型的基礎(chǔ)上,增加交互系統(tǒng)設(shè)計(jì),實(shí)現(xiàn)相關(guān)調(diào)度人員通過(guò)語(yǔ)音文件錄入、麥克風(fēng)即時(shí)錄入等方式,實(shí)現(xiàn)對(duì)電網(wǎng)調(diào)度的科學(xué)控制。
交互系統(tǒng)設(shè)計(jì)時(shí),主要涉及電網(wǎng)調(diào)度語(yǔ)音識(shí)別與預(yù)處理系統(tǒng)、語(yǔ)音輸入系統(tǒng)。在語(yǔ)音輸入系統(tǒng)上采用計(jì)算機(jī)相關(guān)軟件實(shí)現(xiàn),相關(guān)調(diào)度工作人員借助語(yǔ)音輸入或者麥克風(fēng)語(yǔ)音輸入的方式,便可以將語(yǔ)音信息輸入到電網(wǎng)調(diào)度語(yǔ)音識(shí)別與預(yù)處理系統(tǒng),被輸入的語(yǔ)音信號(hào)進(jìn)入語(yǔ)音識(shí)別與處理程序后,感覺(jué)語(yǔ)音識(shí)別與處理結(jié)果進(jìn)行相應(yīng)指令操作。
設(shè)計(jì)的電網(wǎng)調(diào)度語(yǔ)音控制系統(tǒng),除了可以進(jìn)行單個(gè)語(yǔ)音控制外,還可以實(shí)現(xiàn)調(diào)度后臺(tái)指令的實(shí)時(shí)播報(bào),及時(shí)將語(yǔ)音十倍于預(yù)處理結(jié)果告知電網(wǎng)調(diào)度管控人員,便于管控人員可以全面、快速地掌握電網(wǎng)運(yùn)用具體狀態(tài),實(shí)現(xiàn)對(duì)電網(wǎng)的全方位管控,提高電網(wǎng)調(diào)度質(zhì)量。
3 基于人耳聽(tīng)覺(jué)特性的語(yǔ)音識(shí)別預(yù)處理模型測(cè)試
從基礎(chǔ)的語(yǔ)料庫(kù)中選取左轉(zhuǎn)、前進(jìn)、后退、停止、右轉(zhuǎn)等單詞各125個(gè)樣本,作為訓(xùn)練樣本,訓(xùn)練樣本的環(huán)境設(shè)置分別為0 dB、5 dB、10 dB、15 dB、20 dB的噪聲環(huán)境下對(duì)人耳聽(tīng)覺(jué)特性、語(yǔ)音增強(qiáng)、譜減法等情況進(jìn)行觀察,利用預(yù)處理語(yǔ)音識(shí)別與處理模型,對(duì)數(shù)萬(wàn)條重復(fù)指令進(jìn)行試驗(yàn),試驗(yàn)結(jié)果顯示人耳聽(tīng)覺(jué)特性0 dB、5 dB、10 dB、15 dB、20 dB的噪聲環(huán)境下語(yǔ)音識(shí)別準(zhǔn)確率明顯高出語(yǔ)音增強(qiáng)、譜減法的方式。如表1所示。
在噪聲的環(huán)境下,人耳聽(tīng)覺(jué)特性語(yǔ)音識(shí)別與處理的語(yǔ)音識(shí)別準(zhǔn)確性依舊很高,0 ~20 dB下,語(yǔ)音識(shí)別準(zhǔn)確率在94.23%~97.86%之間,說(shuō)明此種方式具有很好的語(yǔ)音識(shí)別與處理能力,且受噪聲干擾識(shí)別率下將較為緩慢,說(shuō)明此種語(yǔ)音識(shí)別方式具有更好的魯棒性。
為了進(jìn)一步提高該模型電網(wǎng)調(diào)度語(yǔ)音識(shí)別與處理的效率與質(zhì)量,對(duì)當(dāng)前模型進(jìn)行進(jìn)一步優(yōu)化,采用高質(zhì)量語(yǔ)音輸入設(shè)備,確保語(yǔ)音接收質(zhì)量。
4 結(jié)束語(yǔ)
綜上所述,基于人耳聽(tīng)覺(jué)特性的語(yǔ)音識(shí)別預(yù)處理模型設(shè)計(jì),可以更為真實(shí)模仿人耳結(jié)構(gòu),形成科學(xué)的全面的語(yǔ)音識(shí)別與預(yù)處理模型,為電網(wǎng)調(diào)度的智能化控制提供必要技術(shù)支持。且在采用基于人耳聽(tīng)覺(jué)特性的語(yǔ)音識(shí)別預(yù)處理模型基礎(chǔ)上,可以進(jìn)一步對(duì)調(diào)度人員交互系統(tǒng)進(jìn)行設(shè)計(jì),輔助糾正調(diào)度員在口述操作票時(shí)產(chǎn)生的人為失誤,實(shí)現(xiàn)電網(wǎng)智能化調(diào)度,促進(jìn)電網(wǎng)管控效率與質(zhì)量的提高。
參考文獻(xiàn)
[1] 史燕燕,白靜.融合CFCC和Teager能量算子倒譜參數(shù)的語(yǔ)音識(shí)別[J].計(jì)算機(jī)科學(xué),2019,46(5):286-289.
[2] 周琳,趙一良,朱竑諭,等.基于雙耳語(yǔ)音分離和丟失數(shù)據(jù)技術(shù)的魯棒語(yǔ)音識(shí)別算法[J].聲學(xué)技術(shù),2019,38(5):67-75.
[3] 張延琛.基于人耳聽(tīng)覺(jué)特性瞬態(tài)信號(hào)的提取方法研究[J].礦山機(jī)械,2019,47(7):58-63.