袁馳,黃波
(南京郵電大學(xué)通信與信息工程學(xué)院,江蘇 南京 210003)
超寬帶(UWB,Ultra Wide Band)信號具有低功耗、高時(shí)間分辨率和高精度等優(yōu)勢,在室內(nèi)定位中具有十分廣闊的應(yīng)用前景。
在基于UWB 的室內(nèi)定位系統(tǒng)中,非視距傳播(NLOS,Non Line of Sight)環(huán)境對定位有著十分重要的影響。NLOS情形將直接導(dǎo)致信號產(chǎn)生衍射、散射、反射以及一些信號不規(guī)則損耗,使得定位信號發(fā)生不可知的變化,極大程度上影響最終定位精度[1]。因此,NLOS環(huán)境的識別一直是超寬帶定位領(lǐng)域的一個重要方向。
NLOS環(huán)境識別的目的是判斷信號收發(fā)之間是否存在障礙,從而緩解信號傳播誤差。NLOS識別方法主要有統(tǒng)計(jì)學(xué)方法、幾何關(guān)系判決法和機(jī)器學(xué)習(xí)方法等[2]。
文獻(xiàn)[3]中使用了一種殘差檢驗(yàn)法,可以確定和識別NLOS環(huán)境,算法使用TOA(Time Of Arrival)測距,殘差是估計(jì)值和真實(shí)位置之間的平方差,用方差進(jìn)行歸一化,得到的隨機(jī)變量的方差是統(tǒng)一的,使用測距結(jié)果和測距中使用的前兩個節(jié)點(diǎn)可以判斷節(jié)點(diǎn)之間是否處于LOS環(huán)境的。文獻(xiàn)[4]中使用誤差統(tǒng)計(jì)法識別NLOS環(huán)境,提出了一種分布式多輸入多輸出雷達(dá)定位運(yùn)動目標(biāo)的代數(shù)封閉式解,利用兩階段加權(quán)最小二乘算法估計(jì)目標(biāo)的位置和速度,使用誤差項(xiàng)征識別可以判別目標(biāo)節(jié)點(diǎn)是否處于NLOS環(huán)境中。文獻(xiàn)[5]在非視距識別的基礎(chǔ)上,提出了一種基于能量檢測器的歸一化閾值算法。利用接收能量塊值的最大旋度和標(biāo)準(zhǔn)差來確定NLOS環(huán)境和不同信噪比下的歸一化閾值,構(gòu)造了接收能量塊值的混合參數(shù)判別目標(biāo)節(jié)點(diǎn)是否處于NLOS環(huán)境中。文獻(xiàn)[6]提出一種非封閉檢查算法解決稀疏場景下的NLOS識別問題。
隨著機(jī)器學(xué)習(xí)在無線通信領(lǐng)域的廣泛應(yīng)用,越來越多的學(xué)者利用機(jī)器學(xué)習(xí)的方法來識別非視距信號。SVM(Support Vector Machine,支持向量機(jī))[7~8]、SVDD(Support Vector Data Description,支持向量數(shù)據(jù)描述算法)[9]、KNN(K-NearestNeighbor,K近鄰算法)[10]、IVM(Import Vector Machine,導(dǎo)入向量機(jī))[11]、CNN(Convolutional Neural Network,卷積神經(jīng)網(wǎng)絡(luò))[12~13]、決策樹(Decision Tree)[14]等方法被運(yùn)用到室內(nèi)定位領(lǐng)域中判別NLOS環(huán)境,均有較好的識別效果。文獻(xiàn)[15]提出一種基于SVM的方法來識別NLOS信號。文獻(xiàn)[16]提出一種基于加權(quán)K近鄰(WKNN,Weighted K-Nearest Neighbor)非視距識別方法。文獻(xiàn)[17]提出一種基于CNN的NLOS識別方法,該算法可直接運(yùn)用于未經(jīng)處理的信號通道脈沖響應(yīng)(CIR,Channel Impulse Response)信號,從而減少提取特征的過程。文獻(xiàn)[18]提出了一種基于CNN的大規(guī)模MIMO(Multiple-in Multiple-out,多輸入多輸出)系統(tǒng)識別算法。
XGBoost(Extreme Gradient Boosting)算法是陳天齊博士在GBDT(Gradient Boosting Decision Tree)算法基礎(chǔ)上提出的一種并行梯度提升模型[19],模型采用集成思想,持續(xù)不斷產(chǎn)生新樹,去擬合前面的樹模型的殘差,減少損失。對比原始的GBDT模型,XGBoost算法在實(shí)際應(yīng)用上的模型速度和準(zhǔn)確率均比傳統(tǒng)的GBDT算法提高很多[20]。相比于常用于室內(nèi)定位的其他機(jī)器學(xué)習(xí)算法,XGBoost算法具有更高的準(zhǔn)確率、更好的泛化能力。另外XGBoost算法有很好的數(shù)據(jù)適應(yīng)性和輸入數(shù)據(jù)不變性,相比于風(fēng)靡于工業(yè)界的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法,XGBoost算法更適宜處理表格數(shù)據(jù),同時(shí)它還具有更強(qiáng)的可解釋性[21]。
基于此,本文采用XGBoost來識別UWB定位中的NLOS信號,并基于兩組不同的數(shù)據(jù)源,一組是基于通道脈沖響應(yīng)CIR數(shù)據(jù),另一組是基于統(tǒng)計(jì)特征參量。數(shù)據(jù)采集使用DecaWave公司的DW1000芯片,采樣環(huán)境為辦公環(huán)境,采樣12 000個,長度為1 024,包括1 016個信號脈沖響應(yīng)和是否標(biāo)注為NLOS等。
為了建立一個基于XGBoost的LOS和NLOS信道分離的分類模型,需要一個代表這兩個類的廣泛數(shù)據(jù)集。因此設(shè)計(jì)實(shí)驗(yàn)采集數(shù)據(jù),實(shí)驗(yàn)使用DecaWave公司的DW1000芯片,它符合IEEE802.15.4-2011 UWB標(biāo)準(zhǔn),標(biāo)簽使用可充電移動標(biāo)簽。DW1000的消息報(bào)頭和有效載荷部分使用脈沖重復(fù)頻率(PRF,pulse repetition frequency)的頻率,以超窄的脈沖來發(fā)送,脈沖重復(fù)頻率可以從16 MHz和64 MHz中選擇;支持6個頻率波段,頻率波段從3.5 GHz到6.5 GHz。實(shí)驗(yàn)時(shí)選擇的脈沖重復(fù)頻率為64 MHz,頻率波段為3.5 GHz。
圖1為測量數(shù)據(jù)的真實(shí)場景,圖中圈出部分為定位節(jié)點(diǎn);圖2為可無線充電的標(biāo)簽,在標(biāo)簽移動時(shí),定位標(biāo)簽可每秒發(fā)送3~4個脈沖數(shù)據(jù)包,標(biāo)簽靜止時(shí),標(biāo)簽每隔5秒左右發(fā)送一個脈沖數(shù)據(jù)包。
圖1 真實(shí)測量環(huán)境
圖2 定位標(biāo)簽設(shè)備
實(shí)驗(yàn)環(huán)境為辦公環(huán)境,辦公室的長寬分別為6.73 m和5.21 m,四個錨點(diǎn)坐標(biāo)分別為(0.170,0.255),(6.568,0.296),(0.273,4.507),(6.575,4.073)。實(shí)驗(yàn)共采樣12 000個,數(shù)據(jù)長度為1 024,包括1 016個信號脈沖響應(yīng)和是否標(biāo)注為NLOS等。
首先,在沒有障礙遮擋的情況下進(jìn)行6 000次測量,然后在相同的環(huán)境下收集NLOS條件下的6 000個測量值。為確保收集到的測量值始終符合在信號信道狀態(tài)下,一個人手持定位標(biāo)簽在定位范圍中移動,另一個人LOS信道條件下跟蹤兩個UWB節(jié)點(diǎn)的天線之間的視覺鏈接,確保定位標(biāo)簽處于LOS定位;在NLOS環(huán)境下,一個人手持障礙物遮擋定位節(jié)點(diǎn),并確保NLOS測量情況下節(jié)點(diǎn)之間沒有視覺連接,另一個人手持定位標(biāo)簽在定位范圍中移動。
NLOS識別的目的是判斷定位時(shí)測量數(shù)據(jù)時(shí)信號發(fā)送端和信號接收端之間是否存在NLOS環(huán)境的影響,從而對測量數(shù)據(jù)進(jìn)行傳播誤差的緩解[8]。在判斷NLOS情形時(shí),需要考慮到整體信號的衰減、直接到達(dá)路徑信號的減少、障礙物折射率不同導(dǎo)致的飛行時(shí)間誤差。
UWB技術(shù)是通過作用在天線上的基帶脈沖傳輸數(shù)據(jù),窄帶脈沖產(chǎn)生較大的信號帶寬。CIR信道脈沖響應(yīng)是由DW1000對最近接收到的幀檢測到的發(fā)射機(jī)和接收機(jī)之間的通信信道的脈沖響應(yīng)。當(dāng)信號發(fā)射機(jī)和接收機(jī)之間存在障礙時(shí),信號從發(fā)射端到達(dá)接收端,中間經(jīng)過障礙物,產(chǎn)生高噪聲和時(shí)間延遲,接收到的CIR信號比非NLOS環(huán)境下接收到的更雜亂[9]。
圖3圖4為LOS脈沖信號和NLOS脈沖信號的一個實(shí)例,分別描述了一個152個CIR的NLOS和LOS信號示例的可視化。在一個CIR累加器中,大約152個CIR信號中包含了關(guān)于環(huán)境中傳播特性的大部分可用信息,因此選擇152個CIR作為輸入即可判定出是否為NLOS信號。
圖3 LOS環(huán)境下CIR信號
圖4 NLOS環(huán)境下CIR信號
DW1000 CIR累加器中的信道脈沖響應(yīng)數(shù)據(jù)CIR時(shí)間是可變的。DW1000通過一個內(nèi)置的專有算法來檢測并確定信號的起始索引,在處理期間很容易地訪問它。在學(xué)習(xí)和分類過程中,使用前152個CIR信號,起始位置從內(nèi)部算法檢測到的第一個路徑索引開始。
XGBoost算法是陳天齊博士在GBDT算法基礎(chǔ)上提出的一種并行梯度提升模型,模型采用集成思想,持續(xù)不斷產(chǎn)生新樹,去擬合前面的樹模型的殘差,減少損失。算法的目標(biāo)函數(shù)中定義了正則項(xiàng)控制模型復(fù)雜度,其中包括控制正則化權(quán)重和控制樹是否分叉的參數(shù),控制訓(xùn)練過程中生成的每棵樹的模型復(fù)雜度,防止過擬合;同時(shí)算法支持并行化,極大提高了模型的訓(xùn)練速度;選擇參數(shù)時(shí),XGBoost算法支持交叉驗(yàn)證,方便參數(shù)的選擇。對比原始的GBDT模型,XGBoost算法在實(shí)際應(yīng)用上的模型速度和準(zhǔn)確率均比傳統(tǒng)的GBDT 算法提高很多。與一度風(fēng)靡工業(yè)界得的深度學(xué)習(xí)算法相比,XGBoost不適宜處理高維數(shù)據(jù)如文本、語音、圖像等,但對于本文中用到的這種表格數(shù)據(jù),它具有獨(dú)特的優(yōu)勢,同時(shí)還擁有一些深度神經(jīng)網(wǎng)絡(luò)所沒有的特性,例如可解釋性、輸入數(shù)據(jù)的不變性。
基于XGBoost和通道脈沖響應(yīng)數(shù)據(jù)的NLOS識別過程如圖5所示。數(shù)據(jù)集中提取出需要的CIR信號,輸入XGBoost模型,模型不停地增加分類樹進(jìn)行特征分裂,實(shí)際上是在模型中增加新函數(shù)fk,使模型的損失函數(shù)越來越?。环至堰^程中給每棵樹打分,每棵樹上不同的葉子結(jié)點(diǎn)對應(yīng)不同的分?jǐn)?shù),不同結(jié)點(diǎn)特征對應(yīng)不同分?jǐn)?shù)權(quán)重,根據(jù)相應(yīng)的決策條件劃分。
圖5 NLOS識別過程
每產(chǎn)生一個分類樹,就是學(xué)習(xí)一個新的目標(biāo)函數(shù),擬合上一棵樹預(yù)測產(chǎn)生的殘差,目的是讓分類的結(jié)果更加接近真實(shí)值。模型訓(xùn)練完后,得到不同的分類樹,最終的預(yù)測結(jié)果就是前面的樹的模型相加結(jié)果,輸出是否NLOS信號。
XGBoost目標(biāo)函數(shù)由損失函數(shù)和正則項(xiàng)式組成,定義如下:
其中,n是生成第k棵樹的數(shù)據(jù)總量,K代表建立的樹的個數(shù);yi是數(shù)據(jù)的真實(shí)值,是模型的預(yù)測值,損失函數(shù)l代表模型預(yù)測值和真實(shí)值之間的差異;正則項(xiàng)控制模型復(fù)雜度,是對迭代t次生成的t棵樹的復(fù)雜程度的加和,控制訓(xùn)練過程中生成的每棵樹的模型復(fù)雜度,防止過擬合。
迭代t次的樹模型表示為:其中i表示數(shù)據(jù)集中第i個樣本,fk表示第k棵樹,為第xi次的預(yù)測值。
模型根據(jù)決策樹定義目標(biāo)函數(shù),其中,決策樹由樹的分支和每個葉子節(jié)點(diǎn)的權(quán)重組成;每棵樹上不同的葉子結(jié)點(diǎn)對應(yīng)不同的分?jǐn)?shù),不同結(jié)點(diǎn)特征對應(yīng)不同分?jǐn)?shù)權(quán)重,根據(jù)相應(yīng)的決策條件劃分。
決策樹的復(fù)雜度判斷是根據(jù)每棵樹的葉子節(jié)點(diǎn),目標(biāo)函數(shù)的正則項(xiàng)由葉子節(jié)點(diǎn)數(shù)目和其權(quán)重而決定的。決策樹的復(fù)雜度定義如式(4)所示:
γ和λ為模型訓(xùn)練前設(shè)置的參數(shù),γ參數(shù)控制訓(xùn)練中模型的樹是否分叉,λ參數(shù)決定正則化的權(quán)重,在建立模型時(shí)根據(jù)情況設(shè)定;T是葉子總數(shù),wj是葉子節(jié)點(diǎn)權(quán)重,即葉子節(jié)點(diǎn)分?jǐn)?shù)。
例如,分類時(shí)模型根據(jù)脈沖通道響應(yīng)范圍進(jìn)行第一次特征分裂,根據(jù)接收信號功率進(jìn)行第二次分裂...不斷進(jìn)行特征分裂,形成一棵樹;根據(jù)不同索引號的CIR值和特征,分裂形成第二棵樹、第三棵樹……最終生成了K棵樹,每棵樹生成時(shí)都是在增加新函數(shù)擬合殘差,使損失越來越?。环至褬溆蓸涞姆种Ш腿~子結(jié)點(diǎn)權(quán)重組成,決策樹的復(fù)雜度判斷是根據(jù)每棵樹的葉子節(jié)點(diǎn),目標(biāo)函數(shù)的正則項(xiàng)由葉子節(jié)點(diǎn)數(shù)目和其權(quán)重而決定的。最終這K棵樹的權(quán)重就是每個樣本的預(yù)測分?jǐn)?shù),K棵樹結(jié)果的加和就是每個樣本的最終預(yù)測結(jié)果。
算法實(shí)現(xiàn)過程中使用python 中的numpy 和pandas庫處理數(shù)據(jù)。首先根據(jù)源數(shù)據(jù)中第一路徑索引開始截取連續(xù)的152 條CIR 信號,索引號是DW1000 內(nèi)置專有算法檢測出來的;所有數(shù)據(jù)處理完后得到12 000 條長度為152 的數(shù)據(jù)集,作為一個輸入數(shù)組,是訓(xùn)練模型的多列特征,將事先標(biāo)記的是否為NLOS 信號作為輸出,按照80%和20%的比例分成訓(xùn)練集和測試集。
XGBoost算法的實(shí)現(xiàn)使用原生接口,訓(xùn)練過程中使用字典的方式存儲參數(shù),算法的參數(shù)分為三類,通用參數(shù)、boost參數(shù)和學(xué)習(xí)目標(biāo)參數(shù)。模型訓(xùn)練時(shí)引入網(wǎng)格搜索法設(shè)定參數(shù),結(jié)合交叉驗(yàn)證法,將不同參數(shù)的可能組成網(wǎng)格,對網(wǎng)格中可能的參數(shù)進(jìn)行網(wǎng)格搜索,避免不確定性選擇參數(shù)浪費(fèi)大量運(yùn)算時(shí)間。
在NLOS識別問題中,接收到來自節(jié)點(diǎn)信號,信號中包含NLOS和LOS信號,將節(jié)點(diǎn)信號經(jīng)過計(jì)算后得到數(shù)據(jù)作為輸入,使用XGBoost模型識別信號。采用的參數(shù)包括:第一路徑錯誤識別可能性、脈沖通道響應(yīng)動態(tài)范圍、第一路徑信號功率和接收信號功率。
在復(fù)雜情況下進(jìn)行UWB定位時(shí),需要考慮信號被遮擋的情況,故可以采用CIR通道信息來區(qū)分是否NLOS信號。常用的特征值有上升時(shí)間、峰值時(shí)間、信號梯度、最大振幅、信號總能量、接收信號功率、均方根誤差等。本文中采用未識別到的早期路徑的可能性、脈沖通道響應(yīng)動態(tài)范圍、第一路徑信號功率和接收信號功率等特征。
(1)未識別到第一路徑的可能性
如果第一個路徑被嚴(yán)重衰減,反射路徑將會被識別成第一路徑,導(dǎo)致接收到的CIR信號上升時(shí)間與峰值時(shí)間無法正確判斷[10]。如圖6所示,可以看到第一路徑不被正確識別的場景,在噪聲門限以下存在實(shí)際上的第一路徑。如果檢測到峰值出現(xiàn)在確定的第一個路徑之前,那么就能判斷存在一個未檢測到的第一個路徑的可能性,就能來判斷是否存在NLOS信號。
圖6 第一路徑識別錯誤的場景
(2)脈沖通道響應(yīng)動態(tài)范圍
累加器的增長速率受到脈沖數(shù)量的限制,導(dǎo)致高信號水平的失真,令分辨不同高功率信號變得十分困難。因此,脈沖通道響應(yīng)動態(tài)范圍可以識別是否NLOS信號。
(3)第一路徑信號功率和接收信號功率
通道脈沖響應(yīng)估計(jì)噪聲值的標(biāo)準(zhǔn)偏差與第一路徑振幅值進(jìn)行比較。噪聲值的標(biāo)準(zhǔn)偏差越高,意味著接收信號質(zhì)量越差,也就是信號收發(fā)端之間存在阻礙。高噪聲會引起真正的第一條路徑淹沒在噪聲中,將噪聲與第一路徑振幅相比較,可以知道第一路徑測量是否準(zhǔn)確[25]。因此,第一路徑信號功率和接收信號功率可以確定是否NLOS信號。
(1)未識別到的第一路徑
確定第一個路徑前累加器產(chǎn)生峰值的數(shù)目[24]如步驟①~⑤:
①計(jì)算獲取噪聲門限[24]如公式(5):
其中,NT為新噪聲門限,T為原來的噪聲門限值。設(shè)定新噪聲門限,有可能檢測到原噪聲門限下未識別的第一路徑,即路徑開始第一個索引位置有峰值存在,如圖4所示。
②形成分析窗口:從第一個路徑位置的整數(shù)部分路徑位置,形成一個從該索引向前的16個樣本的分析窗口。
③檢測所有可能的峰值,即PN_NT。
④找到振幅高于在步驟①中計(jì)算出的新的低噪聲閾值的峰值:一旦確定了出現(xiàn)在已確定的第一條路徑之前的峰值的數(shù)量,就可以評估有未被檢測到的第一條路徑的可能性。
⑤計(jì)算未檢測到的早期路徑的可能性值Luep如公式(6)、(7):其中PN_NT為新閾值下的峰值數(shù)目,PN_AW為分析窗口下的最大峰值數(shù)目,L為分析窗口的長度。
一旦確定了出現(xiàn)在已確定的第一條路徑之前的峰值的數(shù)量,就可以評估有未被檢測到的第一條路徑的可能性,從而判斷是否處于NLOS環(huán)境。
(2)脈沖通道響應(yīng)和動態(tài)范圍
累加器的增長速率受到脈沖數(shù)量的限制,這將導(dǎo)致高信號水平的失真,使得分辨不同高功率信號變得十分困難。這表現(xiàn)為高功率射線對累加器的飽和。定義這種飽和程度為Mc[24],則計(jì)算如下公式:
其中fpAmpl1、fpAmpl2、fpAmpl3是第一路徑周圍的第一、第二和第三振幅,max決定了最大值;pkAmpl是峰值振幅。
(3)第一路徑信號功率
可以使用公式(10)估算第一路徑功率[25]:
其中fpAmpl1、fpAmpl2、fpAmpl3是第一路徑周圍的第一、第二和第三振幅;A是常數(shù);對于脈沖重復(fù)頻率為16 MHz時(shí)A為113.77,對于脈沖重復(fù)頻率為64 MHz時(shí)A為121.74;N為無線電頻率幀信息寄存器中的累積計(jì)數(shù)值。
(4)接收信號功率
使用公式(11)計(jì)算接收功率[25]:
其中,C為脈沖通道響應(yīng)功率;A是常數(shù),對于脈沖重復(fù)頻率為16 MHz時(shí)A為113.77,對于脈沖重復(fù)頻率為64 MHz時(shí)A為121.74;N為無線電頻率幀信息寄存器中的累積計(jì)數(shù)值。
為了評估模型的性能,計(jì)算了一些基于混淆矩陣的標(biāo)準(zhǔn)度量標(biāo)準(zhǔn),準(zhǔn)確率(Accuracy)、召回率(Recall)和F1分?jǐn)?shù)。在混淆矩陣中,行表示實(shí)際類示例,列表示在分類過程中被分配的類。所得到的分配可分為四類,稱為真陽性(TP)、真陰性(TN)、假陽性(FP)和假陰性結(jié)果(FN)。下式分別為準(zhǔn)確率、精確率、召回率和F1分?jǐn)?shù)計(jì)算式:
精確度衡量的是陽性結(jié)果中真陽性的比率,召回率是真陽性在與該類實(shí)際樣本數(shù)之比,F(xiàn)1分?jǐn)?shù)是前兩者的調(diào)和平均。
實(shí)驗(yàn)一使用基于CIR采集數(shù)據(jù)的XGBoost模型,分別與K近鄰(KNN,K-NearestNeighbor)、支持向量機(jī)(SVM,Support Vector Machine)、邏輯回歸(LR,Logistic Regression)、決策樹(DT,Decision Tree)模型在相同的輸入下進(jìn)行對比,輸入數(shù)據(jù)為CIR采集數(shù)據(jù)。將數(shù)據(jù)集按照80%和20%的比例隨機(jī)分成訓(xùn)練集和測試集,分類指標(biāo)如表1所示:
表1 實(shí)驗(yàn)一分類指標(biāo)
由表1可知,實(shí)驗(yàn)一中基于CIR采集數(shù)據(jù)的XGBoost模型識別結(jié)果準(zhǔn)確率和召回率均為0.91,F(xiàn)1分?jǐn)?shù)為0.90,效果最好;邏輯回歸和支持向量機(jī)模型識別結(jié)果準(zhǔn)確率、召回率和F1分?jǐn)?shù)均在0.84到0.85,效果次之;基于CIR采集數(shù)據(jù)k近鄰、決策樹模型識別結(jié)果相差不大,準(zhǔn)確率、召回率和F1分?jǐn)?shù)在0.82到0.84之間。結(jié)果表明,基于CIR采集數(shù)據(jù)的XGBoost模型能顯著提高識別NLOS信號的準(zhǔn)確率,具有較高的實(shí)時(shí)性,且省去了特征提取的過程。
實(shí)驗(yàn)二使用基于關(guān)鍵信號特征的XGBoost模型,分別與KNN、SVM、LR、DT模型在相同的輸入下進(jìn)行對比,輸入數(shù)據(jù)為關(guān)鍵統(tǒng)計(jì)參數(shù)。數(shù)據(jù)集按照80%和20%的比例隨機(jī)分成訓(xùn)練集和測試集,分類指標(biāo)如表2所示:
表2 實(shí)驗(yàn)二分類指標(biāo)
表2中基于關(guān)鍵信號特征的XGBoost模型識別結(jié)果準(zhǔn)確率、召回率和F1分?jǐn)?shù)均為0.92;k近鄰和決策樹模型識別結(jié)果準(zhǔn)確率、召回率和F1分?jǐn)?shù)均在0.88到0.89,效果次之;支持向量機(jī)和邏輯回歸型識別結(jié)果準(zhǔn)確率、召回率和F1分?jǐn)?shù)均在0.70到0.89之間,不同指標(biāo)分?jǐn)?shù)差別較大。結(jié)果表明,基于關(guān)鍵信號特征的XGBoost模型效果最好,對比其他模型,XGBoost模型顯著提高了NLOS信號識別的準(zhǔn)確率。
從實(shí)驗(yàn)結(jié)果來看,相對于其他模型,XGBoost模型擁有更高的準(zhǔn)確率。這是由于XGBoost算法在計(jì)算損失函數(shù)時(shí),使用二階泰勒展開,完成了大量損失函數(shù)的近似,實(shí)現(xiàn)了損失函數(shù)的自定義,提高了模型精度。
實(shí)驗(yàn)一和實(shí)驗(yàn)二對五種不同的機(jī)器學(xué)習(xí)算法在兩組不同的數(shù)據(jù)集中對NLOS信號判別。實(shí)驗(yàn)一采用的未經(jīng)處理的CIR信號,模型能直接在CIR波形中識別到信號特征,省去了特征處理的過程,具有更高的實(shí)時(shí)性。實(shí)驗(yàn)二是基于關(guān)鍵特征的NLOS判別模型,提取了一些定位過程中的關(guān)鍵信息,模型運(yùn)行速度更快結(jié)果更精準(zhǔn)。
XGBoost模型能將成百上千個低識別率的模型進(jìn)行組合,形成一個準(zhǔn)確率高的高識別率模型,能夠準(zhǔn)確識別NLOS環(huán)境。XGBoost算法在兩組實(shí)驗(yàn)中表現(xiàn)很好,準(zhǔn)確率、召回率和F1分?jǐn)?shù)都有相對程度的提高。這表明相對于其他模型,不論是在原始的CIR信號還是經(jīng)過處理的關(guān)鍵信號特征的輸入下,XGBoost模型都擁有更高的準(zhǔn)確率,能有效提高NLOS識別率。
文中基于XGBoost算法對UWB NLOS場景進(jìn)行識別,構(gòu)建了基于CIR采集數(shù)據(jù)的XGBoost模型和基于關(guān)鍵信號特征的XGBoost模型,并采用實(shí)測數(shù)據(jù)和其他幾種常用的機(jī)器學(xué)習(xí)NLOS識別算法進(jìn)行對比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,在兩種不同的數(shù)據(jù)集情況下,文中提出的算法都能顯著提高識別NLOS準(zhǔn)確率。