潘維蔚,康 凱,張武雄,王海峰
(1.中國科學(xué)院上海高等研究院,上海 201210; 2.中國科學(xué)院大學(xué) 電子電氣與通信工程學(xué)院,北京 100049;3.上海科技大學(xué) 信息科學(xué)與技術(shù)學(xué)院,上海 201210; 4.中國科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所,上海 200050)
隨著信息社會的不斷發(fā)展,人們對定位服務(wù)的需求日益增多,對室內(nèi)環(huán)境而言,由于信號的嚴(yán)重衰減和多徑效應(yīng)[1-2],通用的室外定位設(shè)施并不能在建筑物內(nèi)有效地進(jìn)行工作,因此人們需要更精密準(zhǔn)確的定位方法。無線保真(Wireless Fidelity,WiFi)[3]作為基礎(chǔ)定位設(shè)施成為研究人員首先考慮的方法。另外的一些技術(shù),如無線射頻識別(Radio Frequency Identification,RFID)[4]、超聲波、激光等,也可以實(shí)現(xiàn)室內(nèi)定位,但是這些技術(shù)在真實(shí)環(huán)境中的實(shí)用性較低,同時(shí)存在額外搭建網(wǎng)絡(luò)設(shè)施導(dǎo)致的安裝和工作成本增加的問題。
對WiFi定位算法而言[5],由于WiFi的接收信號強(qiáng)度(Received Signal Strength,RSS)獲取比較簡單,不受信號帶寬的影響,因此RSS是廣泛應(yīng)用于WiFi定位中的信號特征。WiFi定位最普遍應(yīng)用的算法是指紋定位算法[6],目前已有大量高準(zhǔn)確率的改進(jìn)算法被提出,經(jīng)典算法有貝葉斯算法[7-9]、EZ算法[10]等,文獻(xiàn)[11]提出一種新的高斯過程回歸模型,以估計(jì)室內(nèi)環(huán)境的非均勻RSS分布,但是誤差在2 m以內(nèi)占比僅60%,1 m以內(nèi)占比僅20%。
除經(jīng)典算法外,運(yùn)用機(jī)器學(xué)習(xí)進(jìn)行匹配的算法也被大量運(yùn)用在WiFi室內(nèi)定位領(lǐng)域。文獻(xiàn)[12]引入一種相似度度量信號趨勢指數(shù),使得定位精度平均達(dá)到2 m~3.5 m,但是誤差在2 m以內(nèi)的占比仍不超過60%。文獻(xiàn)[13]對離線指紋進(jìn)行稀疏表示,但是結(jié)果與采樣點(diǎn)自身RSS變動規(guī)律嚴(yán)重沖突,同時(shí)波動性太大,標(biāo)準(zhǔn)差達(dá)到1.91 m。一般而言,定位算法的采樣點(diǎn)間距(網(wǎng)格)僅為1 m~2 m,因此上述算法50%以上數(shù)據(jù)將被誤定位成相鄰網(wǎng)格,嚴(yán)重影響定位精度。實(shí)際上,無論是傳統(tǒng)算法還是運(yùn)用機(jī)器學(xué)習(xí)的算法都存在在低于2 m的誤差范圍內(nèi)定位累計(jì)準(zhǔn)確率過低的問題。特別是當(dāng)相鄰網(wǎng)格指代完全不同的信息時(shí),如在室內(nèi)環(huán)境中智能手機(jī)使用者是生活區(qū)的某家餐廳內(nèi)還是門外的走廊,此時(shí)定位問題轉(zhuǎn)化為了二分類問題,在低于2 m的誤差范圍內(nèi)過低的準(zhǔn)確率會造成客觀事實(shí)的嚴(yán)重錯(cuò)誤。目前相鄰網(wǎng)格問題的研究較少,文獻(xiàn)[14]利用Adaboost算法反復(fù)迭代和合并弱學(xué)習(xí)者的結(jié)果最終將定位數(shù)據(jù)分為室內(nèi)和室外,屬于二分類問題,并且沒有研究相鄰網(wǎng)格。
本文將室內(nèi)場景下的相鄰網(wǎng)格定位問題,轉(zhuǎn)化為對無線訪問接入點(diǎn)(Access Point,AP)收集到的高維RSS數(shù)據(jù)進(jìn)行0、1判決的問題,為使判決具有有效性和穩(wěn)定性,提出一種去異常值的線性判別低維組合算法,根據(jù)信號強(qiáng)度數(shù)據(jù)的自身特征對數(shù)據(jù)進(jìn)行處理,并運(yùn)用線性判別低維組合算法對數(shù)據(jù)進(jìn)行約束,以滿足WiFi室內(nèi)定位的高精度要求。
WiFi室內(nèi)定位算法通常采用基于RSS的指紋定位算法,指紋定位算法在離線訓(xùn)練階段將室內(nèi)區(qū)域劃分為網(wǎng)格(間距1 m~2 m),使用接收設(shè)備對網(wǎng)格采樣點(diǎn)逐個(gè)進(jìn)行采樣,每個(gè)網(wǎng)格對應(yīng)一個(gè)獨(dú)特的指紋,這個(gè)指紋可以是單維或多維的,是接收信息或信號的一個(gè)特征或多個(gè)特征,通??捎涗浽擖c(diǎn)位置、所獲取的RSS及AP地址等,對指紋數(shù)據(jù)進(jìn)行處理(濾波、均值等),在大量的已知位置上建立一個(gè)細(xì)粒度的指紋數(shù)據(jù)庫。在線定位階段用戶持移動設(shè)備在定位區(qū)域移動,實(shí)時(shí)獲取當(dāng)前RSS及AP地址,將該信息上傳到服務(wù)器進(jìn)行匹配。其中,待定位設(shè)備的信號強(qiáng)度d與固定信號發(fā)射源的距離q符合如下傳播模型:
(1)
其中,E為發(fā)射端和接收端相隔1 m時(shí)的信號強(qiáng)度,q為環(huán)境衰減因子。本文選取的室內(nèi)場景如圖1所示,圖1中環(huán)境區(qū)域被劃為不同網(wǎng)格(am×bm),虛線為網(wǎng)格邊界,總共有k個(gè)AP(k≥4),其中AP用圓形表示,特別地,有4個(gè)AP分別為AP1、AP2、AP3、AP4,用 1、2、3、4標(biāo)注。同一時(shí)刻k個(gè)AP對應(yīng)收集的k維RSS數(shù)據(jù)為m=[RSS1,RSS2,…,RSSk]=M,這里M為m組成的數(shù)據(jù)集合,M分為由離線階段收集的數(shù)據(jù)m1組成的集合M1(訓(xùn)練集和驗(yàn)證集集合)和在線訓(xùn)練階段收集的數(shù)據(jù)m2組成的集合M2(測試集)。
圖1 室內(nèi)場景
本文的目的是通過對離線階段收集的數(shù)據(jù)m1和對應(yīng)的標(biāo)簽進(jìn)行學(xué)習(xí)得到映射f,從而判斷在線訓(xùn)練階段收集的數(shù)據(jù)m2輸出的標(biāo)簽所對應(yīng)的網(wǎng)格,假設(shè)輸出的標(biāo)簽為集合L={0,1,…,T},分別對應(yīng)T個(gè)網(wǎng)格,室內(nèi)定位問題即變成多分類問題,數(shù)學(xué)形式如下:
f:M2→L
(2)
由于目前存在在低于2 m的誤差范圍內(nèi)定位累計(jì)準(zhǔn)確率過低導(dǎo)致誤判為相鄰網(wǎng)格的問題,因此選擇一對相鄰網(wǎng)格作為研究對象,特別地,圖1中A和B兩點(diǎn)分別代表門內(nèi)網(wǎng)格和門外網(wǎng)格,對應(yīng)的標(biāo)簽為0或1這2個(gè)值,集合為G={0,1},離線學(xué)習(xí)得到模型g,多分類問題轉(zhuǎn)變?yōu)槎诸悊栴},如現(xiàn)實(shí)場景中具有較高實(shí)際價(jià)值的門內(nèi)門外狀態(tài),數(shù)學(xué)形式轉(zhuǎn)變?yōu)?
g:M2→G
(3)
對于WiFi室內(nèi)定位算法,人們采用度量遷移學(xué)習(xí)(Metric Transfer Learning,MTL)、主成分分析(Principal Component Analysis,PCA)、隨機(jī)森林(Random Forest,RF)算法、稀疏表達(dá)(Sparse Presentation,SP)等算法得到估算位置[15-17],然而這些算法都是從整體區(qū)域的大尺度分類角度進(jìn)行匹配,最終的分類結(jié)果為適用于誤差可允許范圍在2 m以上的場景,并不適合處理相鄰網(wǎng)格的數(shù)據(jù)。因此,本文引入線性判別分析(Linear Discriminant Analysis,LDA)算法[18],首先處理異常值,并且對LDA算法在低維情況下進(jìn)行排列組合,通過概率求和對在線訓(xùn)練數(shù)據(jù)進(jìn)行新的約束,最終確定智能手機(jī)使用者具體的二分類狀態(tài)(如門內(nèi)或門外)。
LDA算法是將高維的模式(多個(gè)AP樣本,不同AP對應(yīng)不同維度)投影到最佳鑒別矢量空間,以達(dá)到抽取分類信息和壓縮特征空間維數(shù)的效果,使投影后模式樣本的類間散布矩陣最大,同時(shí)類內(nèi)散布矩陣最小,保證投影后在新的空間中有最小的類內(nèi)距離和最大的類間距離,即相鄰網(wǎng)格的高維數(shù)據(jù)在該空間中有最佳的可分離性。區(qū)分方法為:首先獲取每類高維數(shù)據(jù)的均值(中心點(diǎn))ui,其中,w是投影方向,n為投影值,n=wTm,投影值n被劃分為2個(gè)集合。ti是所有被判定為i(i為0或1)的n的集合,對應(yīng)地,集合si是判定為i的所有m的集合,Ni是所有被判定為i且屬于集合M1點(diǎn)的個(gè)數(shù)。可以求得高維數(shù)據(jù)中心點(diǎn)ui為:
(4)
由m通過投影w后的樣本點(diǎn)均值為vi:
(5)
投影后的均值即為樣本中心點(diǎn)的投影,則類間距離為J(w),可表示為:
J(w)=|v1-v2|=|wT(u1-u2)|
(6)
(7)
則最大化目標(biāo)函數(shù)為:
(8)
最終得到映射關(guān)系,并根據(jù)映射關(guān)系w得到預(yù)測值:
(9)
在WiFi室內(nèi)定位場景中,本文選擇LDA算法的原因是只要AP不是緊鄰被測相鄰網(wǎng)格,就可以得到室內(nèi)相鄰網(wǎng)格(如門內(nèi)門外)數(shù)據(jù)在各自網(wǎng)格內(nèi)近似方差相等,區(qū)分相鄰網(wǎng)格主要與均值有關(guān),以證明以門內(nèi)門外網(wǎng)格為例,如果AP緊鄰被測相鄰網(wǎng)格,根據(jù)式(1),相鄰網(wǎng)格信號強(qiáng)度差異巨大,此時(shí)定位準(zhǔn)確率本身就很高,不是本文以及所有WiFi室內(nèi)定位相關(guān)論文的討論范圍,本文討論的是普遍存在的一般定位研究中出現(xiàn)的在低于2 m的誤差范圍內(nèi)定位累計(jì)準(zhǔn)確率過低的問題。因此,從理論上確立一個(gè)邊界,此邊界可廣泛適用于室內(nèi)WiFi定位場景。WiFi信號傳播示意圖如圖2所示。
圖2 WiFi信號傳播示意圖
在圖2中任意選擇一個(gè)AP,AP用圓形表示,門內(nèi)門外的相鄰網(wǎng)格分別用2個(gè)網(wǎng)格表示,2條實(shí)線分別代表WiFi信號傳播到門內(nèi)的中心點(diǎn)和邊緣點(diǎn)的2條視線傳輸?shù)穆窂?路徑的距離分別用d1、c1表示,2條虛線分別代表傳播到門外的中心點(diǎn)和邊緣點(diǎn)的2條視線傳輸?shù)穆窂?路徑的距離分別用d2、c2,橫向雙箭頭所示距離為x,縱向雙箭頭所示距離為y,門內(nèi)的中心點(diǎn)和邊緣點(diǎn)的信號強(qiáng)度值為rrss1、rrss2,則根據(jù)信號強(qiáng)度與距離式(1),有:
(10)
(11)
從而可以得到:
(12)
其中,Δrss1、Δrrss2分別是圖2所示門內(nèi)、門外點(diǎn)在各自網(wǎng)格的角與中心的信號強(qiáng)度差值,根據(jù)大小關(guān)系可知RSS同號。網(wǎng)格為a、b的格子形,通過對下面等式做變換:
(13)
(14)
由于網(wǎng)格的邊長a、b一般都在1 m到2 m之間(網(wǎng)格邊長等于相鄰網(wǎng)格的中心距離,而低于2 m的誤差范圍內(nèi)是相鄰網(wǎng)格的中心距離,即本文所研究的距離區(qū)分度),距離比較小,記:a2(y2-ax-by)+ax(-ax-by)為R,式(14)可近似為:
(15)
任意AP需滿足如下條件:
x2+y2∈(4amax(a,b),∞)
(16)
對式(15)中的R進(jìn)行縮放,可以得到:
-2amax(a,b)(x2+y2)≤
-amax(a,b)(x+y)2≤-(a2+ax)(ax+by)≤R
R≤a2(y2-x2)≤a2(x2+y2)
(17)
從而比較式(15)分子分母,近似可得:
(18)
不等式(18)兩端邊界均在式(16)的下確界取得,因而對式(18)進(jìn)行邊界處理,由式(12)得:
(19)
上述推導(dǎo)過程證明了網(wǎng)格的角符合信號強(qiáng)度差值幾乎相等的結(jié)論,網(wǎng)格其他邊界的點(diǎn)與上述推導(dǎo)過程類似,網(wǎng)格內(nèi)部的點(diǎn)到AP距離差值較小,而信號強(qiáng)度值差值則更小,由于任何在內(nèi)網(wǎng)格的兩點(diǎn)位置相對空間關(guān)系,都可以找到對應(yīng)向右(或者相鄰方向)平移a的外網(wǎng)格的相對空間關(guān)系,因此因空間位置改變的信號強(qiáng)度值在各自網(wǎng)格內(nèi)方差幾乎相同。相鄰網(wǎng)格數(shù)據(jù)的方差主要分為空間位置σ1和自身能量波動σ2兩部分,而自身能量波動主要受發(fā)射點(diǎn)能量變化和到達(dá)時(shí)間變化決定,因而對同一個(gè)AP發(fā)射點(diǎn)可認(rèn)為在相鄰網(wǎng)格自身能量波動σ2近似,從而一維數(shù)據(jù)方差近似,k維數(shù)據(jù)方差由于獨(dú)立性是一維數(shù)據(jù)方差的簡單代數(shù)相加,因此k維數(shù)據(jù)在各自網(wǎng)格內(nèi)方差近似,所以LDA算法用以突出類間距離對于處理中心距離低于2 m以內(nèi)的相鄰網(wǎng)格是合理的。
圖3 異常值對結(jié)果影響的示意圖
如果運(yùn)用Ransac算法,則無法設(shè)定閾值。本文的處理方法是將離線訓(xùn)練的k維數(shù)據(jù)代入離線訓(xùn)練集自身,尋找歐幾里得距離最近的N0個(gè)點(diǎn),用歐幾里得距離直接判斷,當(dāng)檢測任意的m0為k維數(shù)據(jù)異常點(diǎn)時(shí),m′是異于m0的其他點(diǎn),歐幾里得距離表達(dá)公式如下:
(20)
如果最近的N0個(gè)點(diǎn)中至少有一半以上的點(diǎn)與對應(yīng)的網(wǎng)格一致,則認(rèn)為不是異常點(diǎn);否則視為異常點(diǎn)。
采用LDA算法對k維數(shù)據(jù)進(jìn)行0、1判決,等價(jià)于0概率是否為0.5的判斷,實(shí)際上可以在數(shù)據(jù)的判斷方面進(jìn)行更嚴(yán)格的約束,以提升判決準(zhǔn)確率,因而本文提出一種可以嚴(yán)約束的低維組合算法進(jìn)行低維排列組合,對所得的若干個(gè)概率值求和,并設(shè)置門限。
算法描述分為訓(xùn)練驗(yàn)證和測試,本文已經(jīng)證明滿足給定條件的任意AP均完全適用LDA算法。
訓(xùn)練驗(yàn)證階段步驟如下:
1)對k個(gè)AP產(chǎn)生的時(shí)序校準(zhǔn)過的一維訓(xùn)練數(shù)據(jù)集分別進(jìn)行歸一化。
2)對歸一化后的數(shù)據(jù)進(jìn)行異常值處理。
3)對進(jìn)行異常值處理后的數(shù)據(jù)運(yùn)用LDA算法構(gòu)建模型h。
4)排列組合k個(gè)AP,并分為k組,每組依次去除一個(gè)AP(一維),得到k-1維數(shù)據(jù),對k組k-1維數(shù)據(jù)運(yùn)用LDA算法,分別得到輸出的預(yù)測值為0的概率P1,P2,…,Pk,則對應(yīng)預(yù)測值為1的概率分別為(1-P1),(1-P2),…,(1-Pk)。
5)設(shè)置約束門限,點(diǎn)m如果滿足下式,則m判決值取0:
P1+P2+…+Pk≥kλ
(21)
6)對應(yīng)地,如果滿足下式,則m判決值取1:
P1+P2+…+Pk≤k(1-λ)
(22)
7)如果概率和不在步驟4)和步驟5)范圍,則認(rèn)為步驟2)的預(yù)測值是對的,其中,λ∈(0.5,1)。
測試階段步驟如下:
1)對k個(gè)AP產(chǎn)生的時(shí)序校準(zhǔn)過的每一維在線訓(xùn)練數(shù)據(jù)分別進(jìn)行歸一化。
2)用模型h預(yù)測k維歸一化后的在線訓(xùn)練數(shù)據(jù),得到預(yù)測值(0或1)。
3)重復(fù)訓(xùn)練驗(yàn)證階段的步驟4)~步驟7)。
實(shí)驗(yàn)選用華為手機(jī)NEM-10作為接收設(shè)備,其中手機(jī)內(nèi)置有WiFi模塊,辦公室內(nèi)放置有4個(gè)AP,通過HL-340 USB串行口分別與4臺個(gè)人計(jì)算機(jī)相連。在測試前對AP內(nèi)核寫入程序并充分調(diào)試,使AP在接收到手機(jī)反向的應(yīng)答信號時(shí),將RSS信息、手機(jī)的MAC地址、收到應(yīng)答信號的時(shí)刻通過串行口輸出到個(gè)人計(jì)算機(jī)上,并進(jìn)行同時(shí)性校準(zhǔn)。測試時(shí)個(gè)人計(jì)算機(jī)保存記錄并整合4臺個(gè)人計(jì)算機(jī)的信息。
實(shí)驗(yàn)所用的真實(shí)環(huán)境為辦公室環(huán)境(見圖1),其中辦公室所在的門內(nèi)網(wǎng)格和走廊所在的門外格點(diǎn)用A、B標(biāo)注,4個(gè)AP位置分別是AP1、AP2、AP3、AP4所在的位置,選取的相鄰格點(diǎn)是門內(nèi)以門為邊界線的內(nèi)網(wǎng)格和門外對應(yīng)的外網(wǎng)格(本文網(wǎng)格為1 m×1 m的正方形,即相鄰網(wǎng)格中心距離可以充分保證算法處理的數(shù)據(jù)低于2 m誤差范圍,實(shí)現(xiàn)網(wǎng)格區(qū)分度最小時(shí)的準(zhǔn)確率提升,同時(shí)為使準(zhǔn)確率提升更具有一般性,門內(nèi)門外沒有門的阻隔,這樣相鄰網(wǎng)格信號強(qiáng)度差異本身更小,網(wǎng)格之間區(qū)分難度更大),實(shí)驗(yàn)時(shí)實(shí)驗(yàn)人員攜帶手機(jī)在室內(nèi)室外網(wǎng)格的時(shí)間相等,實(shí)驗(yàn)人員每6 min輪換網(wǎng)格(這樣可以保證訓(xùn)練數(shù)據(jù)的均衡性),共分3個(gè)時(shí)間段進(jìn)行3次不同真實(shí)辦公室環(huán)境(如辦公室內(nèi)物體的擺放以及人員的變化)的實(shí)驗(yàn)。具體而言,該辦公室環(huán)境內(nèi)外人員和物體(如人員的背包、筆記本等放置的位置)具有一定的流動性和進(jìn)行社會活動的特征,3次實(shí)驗(yàn)環(huán)境的人數(shù)在8人到13人之間波動,同時(shí)辦公室外的走廊上也會有行人經(jīng)過。對辦公室內(nèi)部署的4個(gè)AP而言,有2個(gè)AP部署在附近(約一個(gè)小網(wǎng)格尺度)較為空曠的地方,其信號會被流動人員的活動(比如行走聚集等)隨機(jī)干擾;另有2個(gè)AP部署在兩張有人持續(xù)使用的的辦公桌上,其信號不僅被隨機(jī)干擾,還會被辦公設(shè)施具體使用者頻繁干擾(如翻閱文件、變換坐姿等)。這樣可以保證3次實(shí)驗(yàn)環(huán)境的不同,對應(yīng)地可以分別獲取3種在真實(shí)變動環(huán)境(實(shí)際環(huán)境中存在人員和物體相對無變化的環(huán)境,真實(shí)變動環(huán)境要求算法泛化能力更強(qiáng))的不同數(shù)據(jù)集。第1種環(huán)境共收集2 383組的4維數(shù)據(jù),第2種環(huán)境總共收集535組的4維數(shù)據(jù),第3種環(huán)境總共收集957組的4維數(shù)據(jù),計(jì)算機(jī)總計(jì)收集到3 875組的4維數(shù)據(jù)。
根據(jù)實(shí)驗(yàn)設(shè)備得到的數(shù)據(jù),對數(shù)據(jù)處理后的去異常值的LDA低維組合算法與LDA算法、支持向量機(jī)(Support Vector Machine,SVM)算法進(jìn)行比較研究[20],其中文獻(xiàn)[21]運(yùn)用SVM算法通過基站確定全球移動通信系統(tǒng)(GSM)制式手機(jī)位置,具有較好的魯棒性,并具備泛化能力強(qiáng)的特征。
對去異常值的LDA低維組合算法的λ分別取0.7、0.8、0.9,N0分別取50、75、100,結(jié)果表明,去異常值的LDA低維組合算法本身對于λ和N0這2個(gè)參數(shù)不敏感,當(dāng)λ比較大而N0不是太小時(shí),去異常值的LDA低維組合算法在各種環(huán)境下總的判斷準(zhǔn)確的數(shù)據(jù)個(gè)數(shù)波動始終在2個(gè)以內(nèi),對測試集準(zhǔn)確率影響忽略不計(jì),原因在于算法準(zhǔn)確率提高,對參數(shù)依賴性比較低。
本文首先對每種相同環(huán)境劃分為訓(xùn)練集、驗(yàn)證集和測試集3個(gè)部分。如環(huán)境1自身被隨機(jī)分為3個(gè)部分,即測試集也來自于環(huán)境1,同理環(huán)境2、環(huán)境3自身內(nèi)部也被隨機(jī)地劃分為3個(gè)部分,分別得到各自在3種算法下的測試集準(zhǔn)確率,如表1所示。
表1 不同環(huán)境下3種算法測試集準(zhǔn)確率比較
從表1可以看出,去異常值的LDA低維組合算法在同一種環(huán)境下,能準(zhǔn)確地區(qū)分出多維數(shù)據(jù)位于相鄰網(wǎng)格的哪一側(cè),相對于LDA算法、SVM算法有比較明顯的提升。
利用任一環(huán)境下的數(shù)據(jù)集作為訓(xùn)練集進(jìn)行3種算法的訓(xùn)練和驗(yàn)證,在實(shí)驗(yàn)中表示一次離線數(shù)據(jù)收集過程,用其他環(huán)境下的實(shí)測數(shù)據(jù)集的任一實(shí)測數(shù)據(jù)作為測試集進(jìn)行測試,獲得測試集的準(zhǔn)確率,如環(huán)境1作為訓(xùn)練驗(yàn)證集,其他環(huán)境作為測試集,用來驗(yàn)證算法的泛化能力,以檢驗(yàn)算法在一次離線采集基礎(chǔ)上對不同環(huán)境下相鄰網(wǎng)格的分辨能力。
表2為去異常值的LDA低維組合算法、LDA算法、SVM算法在辦公室不同環(huán)境下對完整的訓(xùn)練集進(jìn)行學(xué)習(xí)的準(zhǔn)確率,可以看出去異常值的LDA低維組合算法對比另外2種算法,在每一種狀態(tài)下準(zhǔn)確率都有提高。這是由于去異常值的LDA低維組合算法根據(jù)相鄰網(wǎng)格點(diǎn)RSS數(shù)據(jù)特征進(jìn)行了合理的處理,并且低維組合的思想通過概率和和門限的設(shè)置,進(jìn)行了對數(shù)據(jù)的約束。在上述方法的應(yīng)用下,在環(huán)境1中,LDA的準(zhǔn)確率為65%,SVM的準(zhǔn)確率為72%,去異常值的LDA低維組合有至少4%的提升;在環(huán)境2中,LDA的準(zhǔn)確率為74%,SVM的準(zhǔn)確率為77%,去異常值的LDA低維組合為79%;在環(huán)境3中,LDA的準(zhǔn)確率為63%,SVM的準(zhǔn)確率為77%,去異常值的LDA低維組合為83%,具有顯著提升。3種環(huán)境下的實(shí)驗(yàn)結(jié)果表明了本文算法的正確性和有效性。
表2 不同環(huán)境下3種算法訓(xùn)練集準(zhǔn)確率比較
對于不同的環(huán)境,3種算法的準(zhǔn)確率具有比在相同環(huán)境下區(qū)分相鄰網(wǎng)格有顯著下降,這符合信號強(qiáng)度受外界因素變化較大的現(xiàn)實(shí)情況,表明室內(nèi)Wifi定位的準(zhǔn)確率在低于2 m的誤差范圍內(nèi)過低的問題確實(shí)存在,文獻(xiàn)[6-8]的準(zhǔn)確率與本文實(shí)際測試的LDA算法、SVM算法準(zhǔn)確率結(jié)果是一致的,這也表明本文算法是有效的。
圖4是在不同辦公室環(huán)境下,訓(xùn)練集抽取不同數(shù)量的數(shù)據(jù)對去異常值的LDA降維組合算法的準(zhǔn)確率,從圖中可以看出,在相同的辦公室狀態(tài)下,環(huán)境1要隨機(jī)抽取250個(gè)數(shù)據(jù),訓(xùn)練達(dá)到測試集準(zhǔn)確率的上限0.93,在實(shí)際訓(xùn)練過程中抽取200個(gè)點(diǎn)時(shí),準(zhǔn)確率雖然平均達(dá)到0.92,但是隨著抽取的隨機(jī)狀態(tài)不同而波動,表明隨機(jī)抽取200個(gè)點(diǎn)數(shù)據(jù)具有局限性而容易過擬合,訓(xùn)練集至少需要250個(gè)點(diǎn);環(huán)境2要隨機(jī)抽取300個(gè)數(shù)據(jù),訓(xùn)練達(dá)到準(zhǔn)確率的上限0.90,環(huán)境3要隨機(jī)抽取300個(gè)數(shù)據(jù),訓(xùn)練達(dá)到準(zhǔn)確率的上限0.89,在實(shí)際訓(xùn)練過程中抽取250個(gè)點(diǎn)時(shí),環(huán)境2、環(huán)境3準(zhǔn)確率雖然平均達(dá)到0.89、0.88,但也會隨著抽取的隨機(jī)狀態(tài)不同而波動,表明隨機(jī)抽取250個(gè)點(diǎn)數(shù)據(jù)具有局限性而容易過擬合,至少需要300個(gè)點(diǎn),因而實(shí)施算法所需的訓(xùn)練集至少要有300個(gè)點(diǎn)。同時(shí),在實(shí)際訓(xùn)練過程中,只要訓(xùn)練集抽取超過300個(gè)點(diǎn),無論選擇何種環(huán)境,去異常值的LDA低維組合算法的準(zhǔn)確率不隨抽取的隨機(jī)狀態(tài)而改變,這表明該算法具有魯棒性。
圖4 不同辦公室環(huán)境下LDA降維組合算法的準(zhǔn)確率
從表1、表2、圖4的結(jié)果可以看出,去異常值的LDA低維組合算法可以有效提高本文所述二分類(如門內(nèi)門外狀態(tài))的判決準(zhǔn)確率,具有正確性和魯棒性。
本文提出一種去異常值的線性判別低維組合算法。通過對室內(nèi)WiFi定位的信號強(qiáng)度數(shù)據(jù)自身特征的研究,完成LDA適用性和去異常值的理論分析,并利用線性判別算法在低維情況下進(jìn)行排列組合,對所得的若干個(gè)概率值求和,通過門限的設(shè)置對數(shù)據(jù)進(jìn)行額外的約束。實(shí)驗(yàn)結(jié)果表明,該算法能滿足企業(yè)和用戶對基于位置的定位服務(wù)的需求。本文方法主要用于小網(wǎng)格,下一步將研究傳統(tǒng)大尺度粗略分類與小尺度精確定位的聯(lián)合算法,以及WiFi定位與其他定位方法的聯(lián)合判決來提高定位準(zhǔn)確率。