王凱
(中國民用航空中南地區(qū)空中交通管理局 廣東省廣州市 510000)
跑道安全一直是民航安全管理的重中之重,國際民航組織(International Civil Aviation Organization,ICAO)2006年發(fā)布的《防止跑道侵入手冊》及中國民航局發(fā)布的《民用航空器事故癥候》將跑道侵入明確定義為:在機(jī)場內(nèi)任何航空器、車輛、人員錯(cuò)誤的出現(xiàn)或存在指定用于航空器著陸或起飛的地面保護(hù)區(qū)情況[1,2]。目前,國內(nèi)外學(xué)者在如何保障跑道安全上做出了許多研究。中國民用航空管理局也針對(duì)如何防止跑道侵入發(fā)布眾多規(guī)范性文件[3-5]。分別從人、機(jī)、環(huán)、管多角度防止跑道侵入的發(fā)生。在國外,美國聯(lián)邦航空管理局(Federal Aviation Administration,F(xiàn)AA)在1999年啟動(dòng)了國家跑道安全計(jì)劃,主要是加強(qiáng)場面監(jiān)視能力建設(shè)。先后建設(shè)了基于場面監(jiān)視雷達(dá)、多點(diǎn)定位、ADS-B(Automatic Dependent Surveillance-Broadcast)等監(jiān)視源的場面監(jiān)視系統(tǒng)。為空中交通管制員提供場面監(jiān)視能力。而歐洲航空安全組織(Eurocontrol)主要通過高級(jí)場面引導(dǎo)與控制系統(tǒng)(Advanced Surface Movement Guidance and Control Systems,A-SMGCS)為管制員提供相應(yīng)的監(jiān)視能力。美國和歐洲均通過提高場面的監(jiān)視能力來避免跑道沖突的發(fā)生,但是,這種單一基于監(jiān)視數(shù)據(jù)的告警模式,其告警時(shí)機(jī)一般較晚,即兩架航空器到了非常接近的位置才提供告警,留給管制員處理的時(shí)間很少。近年來,以深度學(xué)習(xí)為代表的人工智能技術(shù)在語音識(shí)別(Automatic speech Recognition)、自然語言處理(Natural Language Processing)等領(lǐng)域得到巨大進(jìn)步,使得基于語音識(shí)別技術(shù)防止跑道侵入的設(shè)想成為可能。本文提出了一種基于語音識(shí)別技術(shù),通過對(duì)管制員與飛行員的實(shí)時(shí)通話進(jìn)行語音識(shí)別,分析其指令意圖,結(jié)合監(jiān)視系統(tǒng)[6]提供的監(jiān)視數(shù)據(jù)進(jìn)行融合判斷來防止跑道侵入的技術(shù)方案。當(dāng)系統(tǒng)判斷存在跑道侵入風(fēng)險(xiǎn)時(shí),及時(shí)提醒管制員采取措施。相比基于單一監(jiān)視數(shù)據(jù)的告警模式,基于語音和監(jiān)視數(shù)據(jù)結(jié)合的告警模式其告警時(shí)機(jī)相對(duì)更加提前,留給管制員充足的時(shí)間進(jìn)行調(diào)配,達(dá)到安全關(guān)口前移目的。
圖1:系統(tǒng)架構(gòu)圖
圖2:系統(tǒng)流程圖
圖3:機(jī)組復(fù)誦缺失
圖4:進(jìn)跑道指令沖突驗(yàn)證
圖5:穿越指令沖突驗(yàn)證
圖6:落地指令沖突驗(yàn)證
語音識(shí)別是一門綜合性學(xué)科,涉及聲學(xué)、語言學(xué)、信號(hào)處理、概率統(tǒng)計(jì)、信息論、模式識(shí)別和深度學(xué)習(xí)等學(xué)科。其發(fā)展主要分為三個(gè)階段。第一階段模式匹配階段。它主要通過利用動(dòng)態(tài)時(shí)間規(guī)整(Dynamic Time Warping DTW)[7,8]將不同長度的語音在時(shí)間軸上對(duì)齊,然后通過模板匹配算法達(dá)到語音識(shí)別的目的。該階段在對(duì)單一詞匯的識(shí)別應(yīng)用上有很好的表現(xiàn)。第二階段統(tǒng)計(jì)模型階段。以GMM-HMM 為主,它主要通過利用對(duì)語音狀態(tài)的轉(zhuǎn)移概率和觀察值概率進(jìn)行建模達(dá)到語音識(shí)別的目的[9]。在一定時(shí)間內(nèi)該方法一直是主流語音識(shí)別方法。識(shí)別率可達(dá)到80%左右。第三階段深度學(xué)習(xí)階段。以CNN-HMM 為主,它主要通過對(duì)深度置信網(wǎng)絡(luò)[10]的“預(yù)訓(xùn)練”過程,得到神經(jīng)網(wǎng)絡(luò)權(quán)值的近似最優(yōu)解,之后通過反向傳播算法使整個(gè)網(wǎng)絡(luò)得到訓(xùn)練優(yōu)化,實(shí)現(xiàn)對(duì)語音進(jìn)行識(shí)別。是目前主流的語音識(shí)別技術(shù)。本文采用的是基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和隱形馬爾科夫模型(Hidden Markov Model,HMM)組建的神經(jīng)網(wǎng)絡(luò)。由于航空語音相比自然語音在發(fā)音及語言上有一定的差異性,故模型采用廣州白云塔臺(tái)2020年第一季度中英文語音數(shù)據(jù)進(jìn)行標(biāo)注及訓(xùn)練。其中80%數(shù)據(jù)用于模型訓(xùn)練,20%數(shù)據(jù)進(jìn)行模型測試。從而得到相應(yīng)的語音識(shí)別引擎,通過詞錯(cuò)誤率(Word Error Rate,WER)進(jìn)行評(píng)估,模型中、英文識(shí)別準(zhǔn)確率均達(dá)到90%以上。其計(jì)算公式如(1):
其中Nref表示測試集所有的詞匯量,Ndel表示識(shí)別結(jié)果相對(duì)于實(shí)際標(biāo)注發(fā)生的刪除錯(cuò)誤的此數(shù)量,Nsub表示發(fā)生替換錯(cuò)誤的詞匯量,Nins表示發(fā)生插入錯(cuò)誤的詞匯量。
自然語言處理是計(jì)算機(jī)領(lǐng)域與人工智能領(lǐng)域的一個(gè)重要方向,其主要就是開發(fā)出能夠理解人類語言的應(yīng)用程序或服務(wù)。通常它的輸入是真實(shí)文本信息,輸出為對(duì)文本信息的深層的理解。最簡單的應(yīng)用就是通過對(duì)一段影評(píng)文本的學(xué)習(xí),輸出該文本是對(duì)電影的積極評(píng)論還是消極評(píng)論。本系統(tǒng)通過對(duì)語音識(shí)別引擎識(shí)別結(jié)果進(jìn)行意圖分析,針對(duì)意圖進(jìn)行了相關(guān)場景分類。分別劃分為:航空器進(jìn)跑道意圖、起飛意圖、落地意圖、穿越跑道意圖、航空器跑道外等待意圖、航空器跑道外滑行等。通過對(duì)意圖的分析輔助對(duì)跑道的沖突檢測。
空管監(jiān)視系統(tǒng)一般指通過監(jiān)視設(shè)備,如:雷達(dá)、多點(diǎn)定位、ADS-B 等,將場面或空中的運(yùn)動(dòng)目標(biāo)(航空器、車輛),通過應(yīng)答機(jī)二次代碼(SSR)或航班號(hào)等信息進(jìn)行關(guān)聯(lián)而達(dá)到對(duì)目標(biāo)的監(jiān)控。本系統(tǒng)需要接入機(jī)場場面的監(jiān)視數(shù)據(jù)以及機(jī)場15 公里半徑空中的監(jiān)視數(shù)據(jù)。本系統(tǒng)采用廣州白云機(jī)場場面監(jiān)視系統(tǒng)輸出的Cat011[11]格式,通過對(duì)該數(shù)據(jù)的解析,可以得到航空器、車輛的當(dāng)前位置、高度、速度、動(dòng)方向等信息。通過對(duì)監(jiān)視數(shù)據(jù)的處理可以得知該航空器是否在一定時(shí)間內(nèi)對(duì)跑道的占用情況,從而輔助跑道沖突檢測目的。
本模塊通過接收處理監(jiān)視數(shù)據(jù)以及分析后的意圖信息,在管制員發(fā)布跑道相關(guān)指令后,判斷場面態(tài)勢是否與該條指令有沖突。本系統(tǒng)研究的內(nèi)容包括:進(jìn)跑道意圖與落地航空器運(yùn)動(dòng)狀態(tài)的沖突、起飛意圖與穿越跑道航空器運(yùn)動(dòng)狀態(tài)的沖突、落地意圖與穿越跑道或起飛的航空器運(yùn)動(dòng)狀態(tài)的沖突、穿越意圖與起飛或落地的航空器運(yùn)動(dòng)狀態(tài)的沖突。
根據(jù)高內(nèi)聚、低耦合的設(shè)計(jì)原則,系統(tǒng)各功能模塊應(yīng)相互獨(dú)立,通過消息總線進(jìn)行數(shù)據(jù)交互。外部數(shù)據(jù)源為語音記錄儀輸出的實(shí)時(shí)語音數(shù)據(jù),通過3.5mm 同軸音頻插頭接入到語音采集服務(wù)器,然后將音頻數(shù)據(jù)接入到語音識(shí)別引擎進(jìn)行語音識(shí)別,將識(shí)別結(jié)果輸出到消息總線供其他模塊進(jìn)行分析處理。自然語言處理通過讀取消息總線的識(shí)別結(jié)果,通過對(duì)結(jié)果的意圖分析,將結(jié)果分解為航空器呼號(hào)、指令意圖、跑道號(hào)三大要素。并將其結(jié)果發(fā)送至消息總線供融合判斷模塊進(jìn)行處理。監(jiān)視數(shù)據(jù)處理模塊主要用于接收和處理監(jiān)視數(shù)據(jù),解析監(jiān)視數(shù)據(jù)中包含的位置、高度、速度等信息,并將相關(guān)信息送到融合判斷模塊。融合判斷模塊通過接收處理自然語言處理模塊輸出的語音意圖信息以及監(jiān)視數(shù)據(jù)處理模塊輸出的監(jiān)視信息。結(jié)合相應(yīng)的跑道沖突邏輯進(jìn)行跑道沖突檢測,當(dāng)系統(tǒng)判斷可能會(huì)造成跑道侵入事件發(fā)生時(shí),及時(shí)將預(yù)警信息提供給前端顯示,以提醒管制員及時(shí)采取措施,防止跑道侵入事件的發(fā)生。系統(tǒng)的整體架構(gòu)如圖1所示。
由于飛行員對(duì)管制員指令的復(fù)誦是否正確,與跑道侵入事件也密切相關(guān)。系統(tǒng)除了提供跑道侵入的檢測以外,還會(huì)對(duì)飛行員復(fù)誦的內(nèi)容進(jìn)行檢查。根據(jù)航班號(hào)、指令意圖、跑道號(hào)三要素,系統(tǒng)針對(duì)上述要素的復(fù)誦超時(shí)、復(fù)誦要素不全、復(fù)誦不一致多項(xiàng)告警,從多角度驗(yàn)證了跑道是否安全。其系統(tǒng)的主要流程圖如圖2所示。
本系統(tǒng)已經(jīng)完成相關(guān)設(shè)計(jì)開發(fā)工作,部署在廣州白云塔臺(tái)進(jìn)行測試驗(yàn)證。根據(jù)測試結(jié)果統(tǒng)計(jì),在有關(guān)跑道相關(guān)指令時(shí),機(jī)組需要正確復(fù)誦指令意圖、跑道號(hào)和呼號(hào)。目前有部分航空公司的飛行員并未遵守相關(guān)規(guī)定。如圖3所示為管制員給航班發(fā)布了01 號(hào)跑道落地的指令,而飛行員的復(fù)誦內(nèi)容只復(fù)誦和指令信息和航班號(hào)信息,未對(duì)跑道號(hào)進(jìn)行復(fù)誦,不符合空中交通無線電通話用語規(guī)定[12]。
在跑道沖突探測方面,目前針對(duì)進(jìn)跑道指令,若同跑道有即將落地的航班,則會(huì)造成跑道沖突,如圖4所示。當(dāng)管制員通過語音發(fā)布進(jìn)跑道指令,系統(tǒng)會(huì)檢查場面監(jiān)視數(shù)據(jù)中是否相同跑道有即將要落地的航班,一定參數(shù)范圍內(nèi),若存在,則進(jìn)行提醒,若不存在,則該條語音指令是安全指令。同理還有起飛語音指令與穿越航班的沖突,圖5所示、落地指令與起飛航班的沖突,圖6所示。
本文基于防跑道侵入的需求,在語音識(shí)別深度學(xué)習(xí)的背景下,結(jié)合機(jī)場的監(jiān)視數(shù)據(jù),提出多角度跑道沖突檢測的技術(shù)方案,并得以實(shí)現(xiàn)及驗(yàn)證?;隍?yàn)證結(jié)果,此技術(shù)是可行的。該技術(shù)的應(yīng)用可以彌補(bǔ)現(xiàn)有防跑道侵入技術(shù)的不足,提前跑道侵入的告警時(shí)間,能有效提高民航安全水平。
同時(shí),為了提高告警的準(zhǔn)確性,下一步研究的重點(diǎn)是:
(1)加大語音識(shí)別引擎的訓(xùn)練數(shù)據(jù),進(jìn)一步提升語音識(shí)別準(zhǔn)確率。
(2)結(jié)合實(shí)際運(yùn)行情況,對(duì)部分告警參數(shù)進(jìn)行調(diào)優(yōu),使告警與實(shí)際運(yùn)行情況保持一致。
(3)引入多源數(shù)據(jù),例如融合塔臺(tái)運(yùn)行管理系統(tǒng)電子進(jìn)程信息、智能圖像視頻信息,擴(kuò)充告警類型。