王銘 ,鄒捷源,張國(guó)才,林同塵,劉俊杰,洪麗敏,李潔瑩
(北京理工大學(xué)珠海學(xué)院 數(shù)理與土木工程學(xué)院,廣東 珠海 519088)
聲源定位技術(shù)具有非常大的潛在應(yīng)用價(jià)值,隨著科技的飛速發(fā)展,聲源定位技術(shù)已應(yīng)用于軍事、工業(yè)、民用等多方面、全覆蓋領(lǐng)域[1]。如在直升機(jī)聲探測(cè)系統(tǒng)、探測(cè)航空器的噪聲源、機(jī)器故障診斷、智能機(jī)器人聽覺系統(tǒng)、安防系統(tǒng)、鳴笛抓拍系統(tǒng)、視頻會(huì)議、戶外搜救等諸多系統(tǒng)中的應(yīng)用,有效利用了聲源信號(hào),實(shí)現(xiàn)對(duì)聲源位置的實(shí)時(shí)追蹤[2]。
在現(xiàn)實(shí)生活中,每年的自然災(zāi)害都會(huì)造成無(wú)數(shù)的人命傷亡,所以搜救時(shí)必須爭(zhēng)分奪秒[3]。在地震、樓房坍塌、火災(zāi)、森林搜救等急需高效搜救的情況下,提高從開始搜救到完成搜救的效率是很有必要的。因此,需要一個(gè)能實(shí)時(shí)檢測(cè)出受害者位置的聲源定位程序。在該想法下,本文研究設(shè)計(jì)一種麥克風(fēng)三維球面陣結(jié)構(gòu)裝置,采用廣義互相關(guān)函數(shù)的時(shí)延估計(jì)算法(GCC-PHAT)[4],實(shí)現(xiàn)聲源空間三維實(shí)時(shí)定位識(shí)別,以便搜尋被困于倒塌物下或被埋于瓦礫中的幸存者,快速鎖定被困者位置,加速救援行動(dòng),在有限時(shí)間內(nèi)拯救更多生命。
系統(tǒng)由三維球面陣麥克風(fēng)陣列、數(shù)據(jù)采集模塊、LabVIEW 系統(tǒng)組成,系統(tǒng)架構(gòu)如圖1 所示。由麥克風(fēng)陣列收集到的6 路信號(hào),經(jīng)過NI-USB-6363 數(shù)據(jù)采集卡收集,將六通道輸入信號(hào)輸入到LabVIEW 系統(tǒng)上。軟件部分基于LabVIEW 系統(tǒng)開發(fā),實(shí)現(xiàn)了對(duì)聲音的實(shí)時(shí)定位。
圖1 聲源定位系統(tǒng)整體架構(gòu)
實(shí)驗(yàn)采集系統(tǒng)是選用NI-USB-6363 數(shù)據(jù)采集卡,可以高性能地進(jìn)行NI 信號(hào)讀寫,并且有30 個(gè)模擬輸入通道、6 路模擬輸出[5],能夠?qū)崿F(xiàn)高級(jí)定時(shí)與觸發(fā),和對(duì)實(shí)時(shí)信號(hào)的收集。NI 數(shù)據(jù)采集卡通過數(shù)據(jù)線與上位機(jī)相連。本文采用6 通道的數(shù)據(jù)采集,設(shè)置20 000 個(gè)采樣點(diǎn)數(shù),44.1 kHz 采樣頻率進(jìn)行同步采樣。
本實(shí)驗(yàn)搭建球面陣聲源定位裝置,高50 cm,由六個(gè)麥克風(fēng)組成球面陣[6],兩兩麥克風(fēng)之間固定距離設(shè)置為13.9 cm,小巧輕便。實(shí)驗(yàn)室噪聲信號(hào)為高斯白噪聲,信噪比約為20 dB,聲源為脈沖信號(hào)以及連續(xù)信號(hào)。聲源定位裝置實(shí)物圖如圖2 所示。其中,直流恒壓源用于給數(shù)據(jù)采集卡提供15 V 的電壓。Ni-USB-6363 數(shù)據(jù)采集卡用于采集麥克風(fēng)球面陣收集到的聲源信號(hào)數(shù)據(jù)并上傳至PC 機(jī)(上位機(jī))中做處理顯示。
圖2 聲源定位裝置實(shí)物圖
LabVIEW 是一款圖形化編程語(yǔ)言,其自身還具有優(yōu)異的性能。數(shù)據(jù)傳輸至上位機(jī)后,用LabVIEW 自帶的語(yǔ)言進(jìn)行數(shù)據(jù)預(yù)處理以及濾波降噪處理,并在前面板中進(jìn)行聲源定位的可視化,程序前面板如圖3 所示。圖中:左上角為二維平面的空間定位,箭頭指向是平面聲源的角度;左下角是6 個(gè)輸入信號(hào)的波形,該波形接收信號(hào)靈敏但含有一定噪聲;右上角為三維空間聲源定位,以X軸指向?yàn)槠矫娼嵌?°,Z軸下半面為俯仰角0°,綠色的點(diǎn)為空間聲源點(diǎn),可以清楚地對(duì)聲源進(jìn)行三維定位;右下角為調(diào)節(jié)閾值旋鈕,與安靜條件下相比,設(shè)置閾值可以讓超過一定范圍的聲音信號(hào)被捕捉并保持下去,這樣可以降低微小噪聲所帶來(lái)的干擾。
圖3 LabVIEW 程序前面板
系統(tǒng)的軟件采用LabVIEW 2018 編程,軟件程序流程如圖4 所示[7]。
圖4 系統(tǒng)軟件流程
通過NI-USB-6363 數(shù)據(jù)采集卡與LabVIEW 內(nèi)置DAQ助手,獲取到6 路麥克風(fēng)傳感器信號(hào)。該信號(hào)中除了所需的聲源信號(hào),還包含現(xiàn)實(shí)背景的各種高低頻段的噪聲。因此,還需要對(duì)所接收到的聲源信號(hào)進(jìn)行濾波。LabVIEW 程序內(nèi)置的butterworth濾波模塊可以通過參數(shù)調(diào)節(jié)有效保留所需頻段的聲源信號(hào),去除高低頻段的噪聲[8-9]。振幅的平方對(duì)頻率公式為:
式中:n為濾波器的階數(shù),階數(shù)越大通帶和阻帶的近似性越好,過渡帶也越陡;ωc為截止頻率;ωp為通頻帶邊緣頻率。
在聲源定位算法中,基于到達(dá)時(shí)間差的定位技術(shù)(TDOA)在定位準(zhǔn)確性上得到了良好的驗(yàn)證,被廣泛應(yīng)用,而準(zhǔn)確的時(shí)延估計(jì)是該技術(shù)實(shí)現(xiàn)的前提。在眾多時(shí)延估計(jì)算法中,廣義互相關(guān)(GCC)算法因其較低的運(yùn)算復(fù)雜度和易于實(shí)現(xiàn)的特點(diǎn)得到了廣泛的應(yīng)用[10]。
在廣義互相關(guān)函數(shù)的時(shí)延估計(jì)算法流程中,首先通過接收信號(hào)x1(t)和x2(t)計(jì)算互功率譜,其次對(duì)互功率譜進(jìn)行加權(quán)計(jì)算,最后進(jìn)行傅里葉變換,得到廣義的互相關(guān)函數(shù)。首先計(jì)算互功率譜,有:
式中:X1(·)和X2(·)為接收信號(hào)x1(t)和x2(t)的濾波函數(shù);X2*(·)為X2(·)取共軛函數(shù)。
加權(quán)函數(shù)對(duì)時(shí)延估計(jì)精度有著不錯(cuò)的提高[11]。本文主要基于相位變化(PHAT)的加權(quán)函數(shù)進(jìn)行研究。PHAT 函數(shù)的表達(dá)式為:
由式(3)可知,相位變換加權(quán)函數(shù)可以使信號(hào)間互功率譜更加平滑,從而銳化廣義互相關(guān)函數(shù)的峰值。
最后,對(duì)加權(quán)后的互功率譜進(jìn)行傅里葉變換,得到廣義互相關(guān)函數(shù),有:
由式(4)可知,通過廣義互相關(guān)函數(shù)計(jì)算會(huì)使兩個(gè)相關(guān)信號(hào)存在一個(gè)最大峰值,該點(diǎn)最大峰值處與采樣數(shù)的差值即為相位差。
在聲源定位系統(tǒng)中,往往需要一個(gè)線性麥克風(fēng)陣列才可以更好地得到聲源傳輸?shù)禁溈孙L(fēng)之間的角度及距離關(guān)系,而對(duì)于一個(gè)線性排列的麥克風(fēng)陣列[12],聲音到達(dá)不同麥克風(fēng)的時(shí)間總會(huì)有先后順序[13]。
圖5 為球面陣麥克風(fēng)陣列聲源角度原理圖。其中,利用線性麥克風(fēng)陣列可以使得三維空間中聲源與線性麥克風(fēng)陣列接收信號(hào)時(shí)間存在一定關(guān)系,如下:
圖5 球面陣麥克風(fēng)陣列聲源角度原理
式中:τ12為2個(gè)麥克風(fēng)y1(k)、y2(k)接收同一聲源s(k)的時(shí)延值;d為2 個(gè)麥克風(fēng)y1(k)、y2(k)之間的距離;θ為入射角;c為聲速,取340 m/s。
通過時(shí)延GCC 算法得到不同空間位置的麥克風(fēng)時(shí)差τ12,從而得到聲音波束相對(duì)于2 個(gè)麥克風(fēng)的角度θ。通過以上算法可基本實(shí)現(xiàn)聲源定位功能。
根據(jù)以上原理,通過編寫程序?qū)崿F(xiàn)角度轉(zhuǎn)換算法[8],角度轉(zhuǎn)換算法如圖6 所示。
圖6 編寫程序?qū)崿F(xiàn)角度轉(zhuǎn)換算法
本系統(tǒng)采用頻率為44.1 kHz,采集點(diǎn)數(shù)為2×104,利用廣義互相關(guān)算法得出2 個(gè)麥克風(fēng)傳感器之間GCC 最大峰值所在點(diǎn)數(shù)。根據(jù)定義,用采樣點(diǎn)數(shù)減去GCC 最大峰值所在點(diǎn)數(shù),即可得到2 個(gè)麥克風(fēng)對(duì)聲音接收的相位差值,通過頻率換算獲得單位時(shí)間,將其相乘得到的就是2 個(gè)麥克風(fēng)的時(shí)間差。麥克風(fēng)到兩個(gè)點(diǎn)距離的差值如下:
式中:x為相對(duì)接收距離;t為2 個(gè)麥克風(fēng)接收到同一信號(hào)的時(shí)間差。利用x相對(duì)接收距離再除以2 個(gè)麥克風(fēng)之間的直線距離,得到余弦角度θ的數(shù)值,進(jìn)行反余弦計(jì)算得到θ,在LabVIEW 系統(tǒng)中此時(shí)得到的為弧度制,最后進(jìn)行角度制轉(zhuǎn)換,得到2 個(gè)麥克風(fēng)關(guān)于聲源的平面角度。
本文著重測(cè)試該模型對(duì)連續(xù)信號(hào)的識(shí)別作用,所以選用在安靜的環(huán)境下進(jìn)行測(cè)試,這樣可以有效地避免噪聲對(duì)測(cè)試結(jié)果的影響并測(cè)試其性能,以手機(jī)播放的音樂作為聲源,在測(cè)試范圍內(nèi)不斷移動(dòng),涵蓋方位角30°~330°,一共11 個(gè)數(shù)據(jù)點(diǎn),每個(gè)聲源位置測(cè)試10 次,得出的數(shù)據(jù)取平均值。一共獲取110 組數(shù)據(jù)測(cè)量點(diǎn),并記錄聲源角度數(shù)據(jù)。
通過實(shí)時(shí)的聲音采集對(duì)其進(jìn)行誤差分析。圖7 為系統(tǒng)連續(xù)信號(hào)誤差分析圖,從中可以直觀地看出連續(xù)信號(hào)的一個(gè)誤差范圍。經(jīng)過分析,該程序能較好地識(shí)別出聲音的實(shí)時(shí)定位,將得到的110 組數(shù)據(jù)進(jìn)行擬合,可以得到擬合曲線范圍為[1.7,2],并且P值為0.025 21<0.05。一般可以認(rèn)為P≤0.05時(shí)(一般選擇這個(gè)顯著水平),該數(shù)據(jù)得出的結(jié)果不存在偶然性,該程序的結(jié)果可靠。誤差偏移值控制在2°左右,產(chǎn)生該誤差的原因有:麥克風(fēng)硬件及系統(tǒng)性能的限制,噪聲信號(hào)無(wú)法最大化去除連續(xù)聲音信號(hào)誤差;除此之外,還可能是系統(tǒng)在高頻率響應(yīng)下無(wú)法及時(shí)分析,返回正確的角度值。
圖7 連續(xù)信號(hào)誤差分析
本文基于GCC-PHAT 算法、LabVIEW 軟件平臺(tái)開發(fā)了一套六通道球面陣列聲源定位系統(tǒng),詳細(xì)介紹了該系統(tǒng)的各硬件構(gòu)成、軟件程序模塊及實(shí)驗(yàn)操作流程。本文對(duì)連續(xù)信號(hào)方位角進(jìn)行多點(diǎn)多次測(cè)量,對(duì)所得實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析,歸納總結(jié)了聲源定位精度的變化趨勢(shì),并分析了主要誤差來(lái)源。實(shí)驗(yàn)結(jié)果表明該系統(tǒng)有良好的連續(xù)信號(hào)聲源定位效果。本文的設(shè)計(jì)思路及程序算法實(shí)現(xiàn)可為聲源定位儀器開發(fā)人員提供一定的參考。
物聯(lián)網(wǎng)技術(shù)2023年10期