劉琳嵐,高聲榮,舒堅(jiān)
(1. 南昌航空大學(xué)信息工程學(xué)院,江西 南昌 330063;2. 南昌航空大學(xué)軟件學(xué)院,江西 南昌 330063)
無(wú)線傳感器網(wǎng)絡(luò)(WSN, wireless sensor network)是一種由各種具有感知能力、計(jì)算能力和通信能力的廉價(jià)微型傳感器節(jié)點(diǎn)通過(guò)無(wú)線通信的方式以自組織形式構(gòu)成的網(wǎng)絡(luò)[1]。由于被監(jiān)測(cè)區(qū)域的復(fù)雜性和不確定性[2],如果數(shù)據(jù)分組在低質(zhì)量鏈路上進(jìn)行傳輸,當(dāng)節(jié)點(diǎn)之間進(jìn)行通信時(shí)就容易丟失數(shù)據(jù),從而引發(fā)消息重傳,雖有重傳機(jī)制保證數(shù)據(jù)分組的完整性,但這易導(dǎo)致傳輸效率的下降和能耗的增加。通過(guò)鏈路質(zhì)量預(yù)測(cè)選擇高質(zhì)量鏈路進(jìn)行通信,不僅可以保障數(shù)據(jù)的可靠傳輸,還可以降低節(jié)點(diǎn)的能耗,延長(zhǎng)網(wǎng)絡(luò)壽命。因此,降低節(jié)點(diǎn)能耗、提高能源利用率的關(guān)鍵在于提高節(jié)點(diǎn)間通信效率。
在通信過(guò)程中,準(zhǔn)確的鏈路質(zhì)量預(yù)測(cè)是保證上層協(xié)議(數(shù)據(jù)鏈路層的MAC協(xié)議、網(wǎng)絡(luò)層的路由協(xié)議、網(wǎng)絡(luò)管理層的拓?fù)淇刂频龋┬阅艿幕A(chǔ),對(duì)路由協(xié)議的設(shè)計(jì)者而言至關(guān)重要[3]。因此,建立一個(gè)良好的WSN鏈路質(zhì)量預(yù)測(cè)機(jī)制,進(jìn)而動(dòng)態(tài)地調(diào)整路由協(xié)議,保證數(shù)據(jù)正確傳輸顯得十分必要[4]。本文研究鏈路質(zhì)量預(yù)測(cè)方法,為上層路由選擇提供參考。
無(wú)線傳感器網(wǎng)絡(luò)由于節(jié)點(diǎn)移動(dòng)、多徑衰落、噪聲和干擾等因素影響導(dǎo)致無(wú)線鏈路動(dòng)態(tài)變化,實(shí)時(shí)、準(zhǔn)確的鏈路質(zhì)量預(yù)測(cè)面臨巨大挑戰(zhàn),吸引了國(guó)內(nèi)外學(xué)者的廣泛關(guān)注和深入研究。目前,主要有基于鏈路特性、基于概率估計(jì)理論和基于智能學(xué)習(xí)的方法。
此類(lèi)方法主要是采用硬件參數(shù)接收信號(hào)強(qiáng)度指示(RSSI, received signal strength indicator)、鏈路質(zhì)量指示(LQI, link quality indicator)、信噪比(SNR,signal to noise ratio)對(duì)鏈路質(zhì)量進(jìn)行預(yù)測(cè)。文獻(xiàn)[5]使用一種幀計(jì)數(shù)器 meter,能夠在低功率無(wú)線傳感器網(wǎng)絡(luò)中實(shí)現(xiàn)精確和實(shí)時(shí)的鏈路評(píng)估,當(dāng)存在信道競(jìng)爭(zhēng)和共存干擾時(shí),使用分布式輕量級(jí)方法統(tǒng)計(jì)損壞的數(shù)據(jù)幀數(shù),并將其應(yīng)用到 4-Bit評(píng)估器中,實(shí)驗(yàn)結(jié)果表明,該方法能夠提高鏈路質(zhì)量評(píng)估的準(zhǔn)確性和實(shí)時(shí)性。文獻(xiàn)[6]為了解決輸電檢測(cè)系統(tǒng)中對(duì)上層通信網(wǎng)絡(luò)的鏈路質(zhì)量問(wèn)題,通過(guò)分析WSN的網(wǎng)絡(luò)特征,同時(shí)依據(jù)跳數(shù)、網(wǎng)絡(luò)環(huán)境,在路由建立階段選擇最優(yōu)下一跳節(jié)點(diǎn)。文獻(xiàn)[7]提出了一種簡(jiǎn)單、準(zhǔn)確、低成本的鏈路質(zhì)量估計(jì)技術(shù),適用于資源受限的WSN場(chǎng)景,并通過(guò)卡爾曼濾波和模糊邏輯優(yōu)化了低成本下RSSI和LQI對(duì)鏈路質(zhì)量的影響,最后在鍋爐廠的實(shí)驗(yàn)場(chǎng)景中,以2種不同的速率實(shí)現(xiàn)流式傳輸,實(shí)驗(yàn)結(jié)果表明,該方法以較小時(shí)延為代價(jià)實(shí)現(xiàn)了無(wú)差錯(cuò)傳輸。文獻(xiàn)[8]提出了一種綜合性的鏈路質(zhì)量度量方法——三角度量(Triangle),利用幾何學(xué)的方法,結(jié)合分組接收率(PRR, packet reception rate)、LQI和SNR信息來(lái)衡量鏈路質(zhì)量,能通過(guò)較少的鏈路探測(cè)分組快速且可靠地評(píng)估鏈路質(zhì)量。
此類(lèi)方法主要是通過(guò)發(fā)送大量的探測(cè)分組,計(jì)算接收端的分組接收率。文獻(xiàn)[9]基于常用的對(duì)數(shù)正態(tài)路徑損耗模型,將由 SNR表征的無(wú)線鏈路質(zhì)量分解為具有不同特性的2個(gè)部分:時(shí)變非線性部分和非平穩(wěn)隨機(jī)部分。通過(guò)對(duì)這2個(gè)部分的分別處理,提出了一種新的鏈路質(zhì)量估計(jì)方法——WNN-LQE,獲得鏈路質(zhì)量的置信區(qū)間。文獻(xiàn)[10]將指數(shù)加權(quán)移動(dòng)平均(EWMA, exponentially weighted moving average)數(shù)學(xué)模型應(yīng)用到鏈路質(zhì)量評(píng)估中,解決數(shù)據(jù)分組傳輸速率的不穩(wěn)定問(wèn)題,實(shí)驗(yàn)結(jié)果表明,通過(guò)在EWMA模型中建立相關(guān)參數(shù),可以調(diào)節(jié)評(píng)估結(jié)果的靈敏性和穩(wěn)定性,以達(dá)到特定環(huán)境下的要求。文獻(xiàn)[11]中的 4-Bit采用期望傳輸次數(shù)(ETX,expected transmission count)作為指標(biāo)的評(píng)估器,使用 4-Bit刻畫(huà)物理層、鏈路層和網(wǎng)絡(luò)層的狀況,選擇RSSI、LQI指標(biāo),同時(shí)考慮了鏈路的非對(duì)稱性,實(shí)驗(yàn)結(jié)果表明,該評(píng)估方法可以在大幅度減少能量消耗的同時(shí)提高準(zhǔn)確性。然而,重傳數(shù)據(jù)分組數(shù)并未將信道質(zhì)量與平穩(wěn)性考慮在內(nèi)。
此類(lèi)方法主要采用機(jī)器學(xué)習(xí)[12]和模式匹配等智能學(xué)習(xí)方法進(jìn)行建模。文獻(xiàn)[13]采用一種基于支持向量機(jī)的多分類(lèi)鏈路質(zhì)量評(píng)估機(jī)制,選擇 RSSI和LQI作為評(píng)估參數(shù),根據(jù)PRR將鏈路質(zhì)量分為5個(gè)等級(jí),該模型可以使用較少數(shù)量的探測(cè)數(shù)據(jù)分組準(zhǔn)確地估計(jì)出當(dāng)前的鏈路質(zhì)量。文獻(xiàn)[14]使用一種基于模式匹配的方法來(lái)預(yù)測(cè)鏈路質(zhì)量變化,將鏈路的SNR值存儲(chǔ)到鄰居節(jié)點(diǎn),以獲得SNR的時(shí)間序列,當(dāng)需要對(duì)鏈路的未來(lái)狀態(tài)進(jìn)行預(yù)測(cè)時(shí),節(jié)點(diǎn)使用互相關(guān)函數(shù)查找過(guò)去與當(dāng)前時(shí)刻相匹配的SNR,但文中只使用了SNR來(lái)度量鏈路質(zhì)量,并不能反映出鏈路的真實(shí)情況,且實(shí)驗(yàn)只與線性預(yù)測(cè)模型進(jìn)行對(duì)比,也不能很好地反映出模型的性能。
上述研究為解決鏈路質(zhì)量預(yù)測(cè)問(wèn)題提供了相關(guān)的經(jīng)驗(yàn)和思路。其中,基于鏈路特性的方法主要是使用物理層參數(shù)預(yù)測(cè)鏈路質(zhì)量,其所需的參數(shù)獲取簡(jiǎn)單,可以直接從節(jié)點(diǎn)中讀取,但節(jié)點(diǎn)本身存在校準(zhǔn)誤差;基于概率估計(jì)理論的方法需要發(fā)送大量的探測(cè)分組,對(duì)鏈路的長(zhǎng)期度量較為準(zhǔn)確,但對(duì)鏈路的短期變化不敏感;基于智能學(xué)習(xí)的方法通過(guò)數(shù)據(jù)驅(qū)動(dòng)能夠挖掘出數(shù)據(jù)之間潛在的特征,是未來(lái)研究的一個(gè)趨勢(shì)。
本文采用無(wú)監(jiān)督聚類(lèi)高斯混合模型(GMM,Gaussian mixed model)劃分鏈路質(zhì)量等級(jí),作為鏈路質(zhì)量的評(píng)價(jià)指標(biāo);采用零相位分量分析(ZCA,zero-phase component analysis)白化方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,去除樣本間的相關(guān)性;應(yīng)用隨機(jī)森林分類(lèi)(RFC, random forest classifier)算法評(píng)估鏈路質(zhì)量等級(jí);通過(guò)鏈路質(zhì)量的時(shí)序信息,應(yīng)用隨機(jī)森林回歸(RFR, random forest regression)算法預(yù)測(cè)下一時(shí)刻的鏈路質(zhì)量等級(jí)。
根據(jù)不同距離下鏈路PRR分布的不同,將鏈路的通信范圍劃分為3個(gè)不同的區(qū)域,分別為連通區(qū)、過(guò)渡區(qū)和不連通區(qū)。傳統(tǒng)方法中評(píng)判鏈路質(zhì)量的優(yōu)劣是通過(guò)計(jì)算PRR值,而不同的文獻(xiàn)中劃分的等級(jí)數(shù)不同,劃分等級(jí)的標(biāo)準(zhǔn)也不同。本文應(yīng)用 GMM無(wú)監(jiān)督聚類(lèi)方法,將PRR值劃分為5個(gè)等級(jí),等級(jí)劃分的標(biāo)準(zhǔn)由GMM學(xué)習(xí)得到。
GMM 根據(jù)高斯概率密度函數(shù)來(lái)判斷樣本是否屬于該高斯模型,每個(gè)高斯模型都對(duì)應(yīng)著一種類(lèi)別,通過(guò)樣本的輸入計(jì)算出概率密度,與設(shè)定好的閾值相比較,從而確定樣本所屬的類(lèi)別。由于GMM具有多個(gè)模型,劃分更為精細(xì),適用于多類(lèi)別的劃分。樣本集的高斯混合分布和概率密度函數(shù)分別為
其中,式(1)為高斯混合分布,該分布由k個(gè)混合高斯模型組成,jΣ為協(xié)方差矩陣,ui為第i個(gè)高斯模型均值向量,jα為混合系數(shù),且式(2)為第j個(gè)高斯模型的概率密度函數(shù)。
似然函數(shù)的求解采用最大期望(EM, expectation maximum)算法進(jìn)行迭代,具體的步驟如下。
步驟 1 初始化高斯混合分布的模型參數(shù){(αj,
步驟2 E步:依據(jù)當(dāng)前模型參數(shù),計(jì)算PRRi各混合成分的后驗(yàn)概率,即
步驟4 重復(fù)步驟2和步驟3,直到每一個(gè)高斯分布的均值和方差收斂,再將樣本劃入相應(yīng)的等級(jí)中。
采用 ZCA白化方法去除冗余樣本,采用Bootstrap重抽樣方法生成不同的數(shù)據(jù)集;對(duì)數(shù)據(jù)集進(jìn)行訓(xùn)練,生成多棵鏈路質(zhì)量決策樹(shù),組合構(gòu)成RFC模型,評(píng)估鏈路質(zhì)量。
傳感器節(jié)點(diǎn)收集到的物理層數(shù)據(jù)(RSSI、LOI、SNR)和鏈路層數(shù)據(jù)(PRR)之間存在著相關(guān)性。文獻(xiàn)[15]指出,PRR較高的鏈路中,其RSSI也較高的概率為95%,RSSI與PRR是相關(guān)的;文獻(xiàn)[16]指出,LQI與PRR具有較強(qiáng)的相關(guān)性,由LQI可以估計(jì)PRR值。由于樣本數(shù)據(jù)各特征之間存在著相關(guān)性,若直接將樣本數(shù)據(jù)用于訓(xùn)練會(huì)存在冗余現(xiàn)象,因此本節(jié)采用白化的方法降低樣本數(shù)據(jù)之間的相關(guān)性,經(jīng)白化處理后的數(shù)據(jù)特征之間相關(guān)性降低,且所有特征具有相同的方差。
常用的白化處理方法包括主成分分析(PCA,principal component analysis)白化和ZCA白化。PCA白化是將數(shù)據(jù)進(jìn)行 PCA處理,使處理后數(shù)據(jù)的協(xié)方差矩陣為單位矩陣;ZCA白化是在PCA白化的基礎(chǔ)上進(jìn)行一個(gè)選擇操作,通過(guò)將 PCA處理后的旋轉(zhuǎn)矩陣左乘特征矩陣,將數(shù)據(jù)旋轉(zhuǎn)回去,保留數(shù)據(jù)的所有特征,使 ZCA白化后的數(shù)據(jù)更接近原始數(shù)據(jù),ZCA白化的具體步驟如下。
步驟1 計(jì)算數(shù)據(jù)集的協(xié)方差矩陣Σ為
其中,m為數(shù)據(jù)集樣本的個(gè)數(shù),(i)x 為物理層參數(shù)特征組成的向量。
步驟2 求出數(shù)據(jù)集的協(xié)方差矩陣Σ后,計(jì)算出協(xié)方差矩陣Σ的特征向量,按列排放組成矩陣U,即
其中,u1是最大的特征值對(duì)應(yīng)的特征向量,n是特征的個(gè)數(shù),特征值越大,代表著該特征包含的信息越多。
步驟3 將向量u組成新基,得到數(shù)據(jù)集旋轉(zhuǎn)后的結(jié)果xrot為
步驟4 對(duì)數(shù)據(jù)集進(jìn)行PCA白化,如式(11)所示。經(jīng) PCA白化后,數(shù)據(jù)所有特征具有相同的方差,其中,iλ是xrot協(xié)方差矩陣中對(duì)角元素的值。
步驟5 將PCA處理后的旋轉(zhuǎn)矩陣左乘特征矩陣,得到ZCA白化,如式(12)所示。ZCA白化保留了數(shù)據(jù)的所有特征,使 ZCA白化后的數(shù)據(jù)更加接近原始數(shù)據(jù)。
上述獲得的樣本空間中,應(yīng)用 ZCA白化去除了樣本之間的相關(guān)性,并用GMM無(wú)監(jiān)督聚類(lèi)算法得到了鏈路質(zhì)量等級(jí)。由于鏈路質(zhì)量是由多個(gè)因素共同決定的,而鏈路質(zhì)量等級(jí)能夠很好地反映出鏈路的好壞,通過(guò)鏈路質(zhì)量等級(jí)的確定可以實(shí)現(xiàn)鏈路質(zhì)量的評(píng)估。因此,鏈路質(zhì)量評(píng)估是根據(jù)多個(gè)因素確定鏈路質(zhì)量等級(jí)的,其實(shí)質(zhì)就是一個(gè)多分類(lèi)問(wèn)題。本文利用RFC算法在分類(lèi)問(wèn)題上的優(yōu)勢(shì),且不容易出現(xiàn)過(guò)擬合的特點(diǎn),構(gòu)建鏈路質(zhì)量評(píng)估模型。首先通過(guò)Bootstrap重抽樣方法構(gòu)建不同的數(shù)據(jù)集,對(duì)每一個(gè)數(shù)據(jù)集分別訓(xùn)練生成鏈路質(zhì)量決策樹(shù),然后對(duì)決策樹(shù)的結(jié)果進(jìn)行組合投票產(chǎn)生最優(yōu)分類(lèi),最終得到鏈路質(zhì)量等級(jí)。模型將鏈路物理層的參數(shù)組成的向量作為輸入,將評(píng)估出來(lái)的鏈路質(zhì)量等級(jí)值作為輸出,輸入向量 I nputi的組成為
在生成決策樹(shù)的過(guò)程中,由于采用 Bootstrap重抽樣方法從原始數(shù)據(jù)中抽取訓(xùn)練集,有63%的數(shù)據(jù)會(huì)被重復(fù)抽取,而37%的數(shù)據(jù)從未抽取,未抽取的數(shù)據(jù)叫作袋外數(shù)據(jù)(OOB, out of bag)。用OOB來(lái)檢驗(yàn)決策樹(shù)的分類(lèi)效果,得到的誤差為袋外數(shù)據(jù)誤差(OOBE, out of bag error)[17]。袋外數(shù)據(jù)誤差用于計(jì)算決策樹(shù)的平均誤分率,可以得到 OOB誤差估計(jì)。將w棵決策樹(shù)的誤差估計(jì)值取平均,可以得到隨機(jī)森林的泛化誤差估計(jì)值,OOBE越小,隨機(jī)森林算法的分類(lèi)性能越好。
RFC通過(guò)構(gòu)造訓(xùn)練集之間的差異增加分類(lèi)模型間的差異性,從而提高組合模型的泛化能力。通過(guò)w輪訓(xùn)練,得到w棵決策樹(shù)分類(lèi)模型序列最后組合成一個(gè)多分類(lèi)模型系統(tǒng)?;赗FC的評(píng)估模型,最終的輸出結(jié)果采用投票方式產(chǎn)生。
其中,H(x)表示組合分類(lèi)模型;hi(x)表示第i棵決策樹(shù)分類(lèi)模型;Y表示輸出變量,即鏈路質(zhì)量等級(jí)值;I(?)表示示性函數(shù)。
采用RFR算法對(duì)各個(gè)實(shí)際場(chǎng)景構(gòu)建模型,建模過(guò)程如圖1所示。
圖1 基于隨機(jī)森林回歸算法的鏈路質(zhì)量預(yù)測(cè)過(guò)程
利用 Bootstrap方法從訓(xùn)練樣本集Sk(k=1,… ,n)中進(jìn)行w次抽樣,組成w個(gè)樣本子集,每個(gè)子集中的元素都不完全相同,對(duì)每個(gè)樣本子集分別構(gòu)建回歸樹(shù),并在測(cè)試集中對(duì)模型進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果需要w棵回歸樹(shù)共同決定。
RFC評(píng)估模型的輸出為鏈路質(zhì)量等級(jí)值lv = { lv1, lv2,… ,l vn},其中,lvn為第n個(gè)時(shí)刻評(píng)估模型輸出的等級(jí)值。利用滑動(dòng)窗口將lv變換成樣本集,其中,為預(yù)測(cè)模型的輸入,yk= l vk+n-1為標(biāo)簽值,k為樣本集的序號(hào),n為滑動(dòng)窗口的大小,窗口的滑動(dòng)步長(zhǎng)為1。
回歸樹(shù)的生成就是遞歸地構(gòu)建二叉樹(shù)的過(guò)程,對(duì)回歸樹(shù)采用平方誤差最小化原則,利用分類(lèi)與回歸樹(shù)(CART, classification and regression tree)中的回歸樹(shù)算法生成一棵回歸樹(shù),共生成w棵回歸樹(shù),從而形成“森林”。為了保證回歸樹(shù)的多樣性,降低樹(shù)之間的相似性,從而保證隨機(jī)森林模型不容易產(chǎn)生過(guò)擬合問(wèn)題。在回歸樹(shù)的構(gòu)建過(guò)程中,從M個(gè)影響鏈路質(zhì)量等級(jí)的特征中隨機(jī)選取m個(gè)作為隨機(jī)特征變量,用來(lái)構(gòu)建回歸樹(shù),m在模型中是一個(gè)超參數(shù),對(duì)最終的結(jié)果有一定的影響。隨機(jī)森林中回歸樹(shù)數(shù)量w也是模型的一個(gè)超參數(shù),超參數(shù)之間的組合會(huì)對(duì)最終的預(yù)測(cè)效果產(chǎn)生重要的影響。在不同的實(shí)驗(yàn)場(chǎng)景中,最優(yōu)組合也是不同的,根據(jù)經(jīng)驗(yàn)值所構(gòu)建的隨機(jī)森林并不適合每個(gè)實(shí)驗(yàn)場(chǎng)景。因此,本文采用網(wǎng)格搜索算法對(duì)超參數(shù)進(jìn)行優(yōu)化,網(wǎng)格搜索算法將會(huì)遍歷所有變量可能的取值,計(jì)算出每種可能性對(duì)應(yīng)的目標(biāo)值,從而選出變量最優(yōu)的組合?;貧w樹(shù)生成算法如算法1所示。
算法1 回歸樹(shù)生成算法
輸入 訓(xùn)練數(shù)據(jù)集D
輸出 回歸樹(shù)f(x)
步驟1 選擇最優(yōu)切分變量j與切分點(diǎn)s,求解
步驟 2 用選定的(j,s)劃分區(qū)域并確定相應(yīng)的輸出值為
步驟3 繼續(xù)對(duì)2個(gè)子區(qū)域調(diào)用步驟1和步驟2,直到子區(qū)域不能繼續(xù)劃分,生成葉子節(jié)點(diǎn)。
步驟 4 將輸入空間劃分為M個(gè)區(qū)域R1,R2,… ,RM,生成回歸樹(shù)為
當(dāng)w棵回歸樹(shù)模型構(gòu)建完成后,采用測(cè)試集數(shù)據(jù)對(duì)鏈路質(zhì)量進(jìn)行預(yù)測(cè)。將測(cè)試集中的6個(gè)物理層參數(shù)作為鏈路質(zhì)量預(yù)測(cè)模型的輸入,分別為得到各回歸樹(shù)模型預(yù)測(cè)的等級(jí)序列?;赗FR算法的預(yù)測(cè)模型最終輸出的鏈路質(zhì)量等級(jí)值是各回歸樹(shù)模型的均值。
其中,Yk為鏈路質(zhì)量組合預(yù)測(cè)模型,fi(xk)為第i棵回歸樹(shù)預(yù)測(cè)模型。
本文采用五折交叉驗(yàn)證法將樣本數(shù)據(jù)集劃分為5個(gè)大小相似的子集,每個(gè)子集在劃分的過(guò)程中保持?jǐn)?shù)據(jù)分布的一致性。在訓(xùn)練過(guò)程中,將4個(gè)子集的并集作為訓(xùn)練集,剩下的作為測(cè)試集,進(jìn)行 5次訓(xùn)練,對(duì)5次預(yù)測(cè)的結(jié)果取均值作為最終的預(yù)測(cè)結(jié)果。采用均方誤差(MSE, mean square error)評(píng)價(jià)預(yù)測(cè)模型的優(yōu)劣,即
其中,lvk為模型的預(yù)測(cè)值,yk為測(cè)試集中的真實(shí)值。MSE越小,模型的預(yù)測(cè)值與真實(shí)值的差異越小,模型的性能越好。
在數(shù)據(jù)收集過(guò)程中,選用美國(guó) Crossbow公司的Telos B節(jié)點(diǎn),并采用如圖2所示的無(wú)線傳感器網(wǎng)絡(luò)鏈路質(zhì)量測(cè)試平臺(tái)對(duì)收集到的數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)的預(yù)處理和模型的構(gòu)建通過(guò)使用服務(wù)器上的Python平臺(tái)實(shí)現(xiàn)。
圖2 無(wú)線傳感器網(wǎng)絡(luò)鏈路質(zhì)量測(cè)試平臺(tái)
實(shí)驗(yàn)場(chǎng)景的設(shè)置主要從 WSN的常用場(chǎng)景出發(fā),考慮了在真實(shí)的環(huán)境中可能會(huì)遇到的干擾,例如無(wú)線電波、障礙物、鄰近信道等。因此本文設(shè)定了4個(gè)實(shí)驗(yàn)場(chǎng)景,有校園廣場(chǎng)、校園室內(nèi)走廊、校園小樹(shù)林和校園停車(chē)場(chǎng),具體的實(shí)驗(yàn)場(chǎng)景分別如圖3~圖6所示,在每個(gè)場(chǎng)景都部署了一個(gè)小型的星型WSN網(wǎng)絡(luò)。其中,校園廣場(chǎng)、校園小樹(shù)林和校園停車(chē)場(chǎng)部署了9個(gè)節(jié)點(diǎn),一個(gè)為Sink節(jié)點(diǎn),8個(gè)為感知節(jié)點(diǎn);校園室內(nèi)走廊部署了 5個(gè)節(jié)點(diǎn),一個(gè)為 Sink節(jié)點(diǎn),4個(gè)為感知節(jié)點(diǎn);節(jié)點(diǎn)間距均為10 m。校園廣場(chǎng)、校園小樹(shù)林和校園停車(chē)場(chǎng)按照如圖7所示的星型網(wǎng)絡(luò)部署實(shí)驗(yàn)節(jié)點(diǎn),校園室內(nèi)走廊按照如圖8所示的位置部署實(shí)驗(yàn)節(jié)點(diǎn),實(shí)驗(yàn)參數(shù)設(shè)置如表1所示。
圖3 校園廣場(chǎng)實(shí)驗(yàn)場(chǎng)景
圖4 校園室內(nèi)走廊實(shí)驗(yàn)場(chǎng)景
圖5 校園小樹(shù)林實(shí)驗(yàn)場(chǎng)景
圖6 校園停車(chē)場(chǎng)實(shí)驗(yàn)場(chǎng)景
圖7 星型網(wǎng)絡(luò)部署
圖8 室內(nèi)走廊部署
表1 實(shí)驗(yàn)參數(shù)設(shè)置
為了保證數(shù)據(jù)的多樣性與可靠性,本文通過(guò)連續(xù)幾天的測(cè)量獲得不同場(chǎng)景下的PRR,其部分結(jié)果分別如圖9~圖12所示。
圖9 校園廣場(chǎng)節(jié)點(diǎn)1的PRR
圖10 校園室內(nèi)走廊節(jié)點(diǎn)2的PRR
圖11 校園小樹(shù)林4個(gè)節(jié)點(diǎn)的PRR
圖12 校園停車(chē)場(chǎng)節(jié)點(diǎn)6的PRR
校園廣場(chǎng)場(chǎng)景中比較空曠且干擾源較少,在相同的距離下鏈路整體表現(xiàn)近似,因此選用節(jié)點(diǎn)1描述該場(chǎng)景的鏈路質(zhì)量。由圖9可知,校園廣場(chǎng)實(shí)驗(yàn)場(chǎng)景的PRR大部分都在0.8以上,鏈路質(zhì)量處于較高水平,且穩(wěn)定性較好,這是由于廣場(chǎng)比較空曠且干擾源較少。選用節(jié)點(diǎn)2描述校園室內(nèi)走廊場(chǎng)景的鏈路質(zhì)量,由圖10可知,在0~25 s鏈路呈現(xiàn)較高的波動(dòng)性和突發(fā)性,之后鏈路趨于平穩(wěn),這是因?yàn)樵摃r(shí)段有人員的走動(dòng)對(duì)鏈路產(chǎn)生了干擾。由圖 11可知,鏈路質(zhì)量整體波動(dòng)較大,節(jié)點(diǎn)7和節(jié)點(diǎn)8的PRR在0.1~0.5之間波動(dòng),鏈路質(zhì)量處于較差水平,這是因?yàn)樵搱?chǎng)景中的主要干擾源是樹(shù)木,且分布無(wú)規(guī)律,容易產(chǎn)生干擾,節(jié)點(diǎn) 1和節(jié)點(diǎn) 2距離 Sink節(jié)點(diǎn)的距離相同,但處于不同的方向,其PRR也呈現(xiàn)出不同的波動(dòng)情況,這是由于不同方向上樹(shù)木的遮擋情況不同。選用節(jié)點(diǎn)6描述校園停車(chē)場(chǎng)場(chǎng)景的鏈路質(zhì)量,由圖12可知,鏈路的PRR在0~0.9之間波動(dòng),鏈路有著較大的波動(dòng)性和突發(fā)性,這是因?yàn)樵搱?chǎng)景中有建筑物和車(chē)輛的遮擋,且時(shí)常有車(chē)輛進(jìn)出停車(chē)場(chǎng),車(chē)輛上移動(dòng)設(shè)備所產(chǎn)生的無(wú)線信號(hào)會(huì)對(duì)鏈路產(chǎn)生干擾。
為了進(jìn)一步驗(yàn)證RFR模型的預(yù)測(cè)性能,在4種實(shí)驗(yàn)場(chǎng)景下,將RFR模型與EWMA模型、Triangle模型、支持向量回歸機(jī)(SVR, support vector regression)模型和線性回歸(LR, linear regression)模型進(jìn)行對(duì)比,其中,EWMA和Triangle為傳統(tǒng)學(xué)習(xí)方法,LR和SVR為常見(jiàn)的機(jī)器學(xué)習(xí)方法。各個(gè)場(chǎng)景下的預(yù)測(cè)值與真實(shí)值的對(duì)比分別如圖 13~圖 16所示,從圖13、圖14和圖16可知,鏈路大部分時(shí)間都是處于1、2等級(jí)鏈路,鏈路質(zhì)量較好,5個(gè)模型都能預(yù)測(cè)出鏈路的狀況,但是當(dāng)鏈路發(fā)生突變時(shí),RFR模型能夠預(yù)測(cè)出鏈路的突變情況,模型的準(zhǔn)確性較好;從圖15可知,此時(shí)的鏈路主要是在4、5等級(jí)波動(dòng),鏈路質(zhì)量較差,但 RFR模型仍能捕捉到鏈路的變化,模型的準(zhǔn)確性好,并能夠適應(yīng)環(huán)境的變化。
圖13 校園廣場(chǎng)的實(shí)驗(yàn)預(yù)測(cè)結(jié)果
圖14 校園室內(nèi)走廊的實(shí)驗(yàn)預(yù)測(cè)結(jié)果
圖15 校園小樹(shù)林的實(shí)驗(yàn)預(yù)測(cè)結(jié)果
圖16 校園停車(chē)場(chǎng)的實(shí)驗(yàn)預(yù)測(cè)結(jié)果
為進(jìn)一步精確對(duì)比預(yù)測(cè)模型的預(yù)測(cè)效果,計(jì)算了預(yù)測(cè)模型在不同實(shí)驗(yàn)場(chǎng)景下的MSE,其結(jié)果如表2所示。
表2 4種實(shí)驗(yàn)場(chǎng)景下的MSE
由表2可知,在4種實(shí)驗(yàn)場(chǎng)景中,EWMA模型的MSE最大,有著較大的預(yù)測(cè)誤差,Triangle模型和 EWMA模型的預(yù)測(cè)效果均不如機(jī)器學(xué)習(xí)模型。校園停車(chē)場(chǎng)、校園室內(nèi)走廊和校園廣場(chǎng)實(shí)驗(yàn)場(chǎng)景中,RFR模型的預(yù)測(cè)性能均明顯優(yōu)于EWMA模型、Triangle模型、SVR模型和LR模型,其中,校園室內(nèi)走廊和校園廣場(chǎng)是較為穩(wěn)定的實(shí)驗(yàn)場(chǎng)景,Triangle模型、SVR模型和LR模型均具有較高的預(yù)測(cè)準(zhǔn)確性,但是在校園停車(chē)場(chǎng)實(shí)驗(yàn)場(chǎng)景中,由于車(chē)輛的運(yùn)動(dòng)和車(chē)載無(wú)線設(shè)備的干擾,鏈路出現(xiàn)了一定程度的波動(dòng),且呈現(xiàn)出突發(fā)性,導(dǎo)致SVR模型和LR模型的預(yù)測(cè)效果均不理想,但RFR模型卻能及時(shí)地預(yù)測(cè)出鏈路的波動(dòng)情況,有著更好的抗干擾能力。和其他場(chǎng)景相比,校園廣場(chǎng)和校園室內(nèi)走廊場(chǎng)景中 RFR模型的MSE均較小,取得了較好的預(yù)測(cè)效果,尤其是在校園廣場(chǎng)場(chǎng)景中,RFR模型的 MSE最小,其預(yù)測(cè)效果優(yōu)于校園室內(nèi)走廊場(chǎng)景。這是因?yàn)樵谛@室內(nèi)走廊中,會(huì)有人員來(lái)回走動(dòng),對(duì)鏈路造成干擾,導(dǎo)致鏈路不穩(wěn)定。在校園小樹(shù)林場(chǎng)景中,由于受到樹(shù)木的直接遮擋和多徑效應(yīng)的影響,鏈路質(zhì)量處于較差的水平,相比其他3個(gè)實(shí)驗(yàn)場(chǎng)景,各預(yù)測(cè)模型的預(yù)測(cè)誤差均有增加,但RFR模型的MSE最小,有著更好的預(yù)測(cè)效果。
在不同的時(shí)間段設(shè)計(jì)了4種實(shí)驗(yàn)場(chǎng)景,通過(guò)收集不同干擾源下的鏈路質(zhì)量測(cè)試模型性能。實(shí)驗(yàn)結(jié)果表明,RFR預(yù)測(cè)模型在4種場(chǎng)景中表現(xiàn)良好,均有較高的預(yù)測(cè)準(zhǔn)確性,體現(xiàn)出模型擁有良好的泛化能力。
在校園廣場(chǎng)實(shí)驗(yàn)場(chǎng)景中驗(yàn)證模型的預(yù)測(cè)時(shí)間,5個(gè)模型的平均預(yù)測(cè)時(shí)間如表3所示。
表3 5個(gè)模型的平均預(yù)測(cè)時(shí)間
由表3可知,EWMA模型的預(yù)測(cè)時(shí)間最小,其為傳統(tǒng)模型,計(jì)算量最少。RFR模型通過(guò)構(gòu)造多棵回歸樹(shù),保證了模型的預(yù)測(cè)準(zhǔn)確性,但并未大量增加平均預(yù)測(cè)時(shí)間,和 SVR模型處于一個(gè)量級(jí)上,就鏈路質(zhì)量預(yù)測(cè)問(wèn)題而言,增加的時(shí)間處于可接受范圍。
本文采用GMM劃分鏈路質(zhì)量等級(jí),用于評(píng)價(jià)鏈路質(zhì)量;運(yùn)用ZCA白化去除樣本之間的冗余性,經(jīng)白化處理后的數(shù)據(jù)之間相關(guān)性較低,且所有特征具有相同的方差;基于 RFC構(gòu)建鏈路質(zhì)量評(píng)估模型,使用Bootstrap重抽樣方法生成不同的數(shù)據(jù)集,訓(xùn)練后生成多棵鏈路質(zhì)量決策樹(shù),組合構(gòu)成RFC模型;通過(guò)鏈路質(zhì)量的時(shí)序信息,應(yīng)用RFR構(gòu)建預(yù)測(cè)模型,預(yù)測(cè)下一時(shí)刻的鏈路質(zhì)量等級(jí),采用 MSE評(píng)價(jià)預(yù)測(cè)模型的優(yōu)劣。4種真實(shí)實(shí)驗(yàn)場(chǎng)景中的預(yù)測(cè)結(jié)果表明,與 EWMA模型、Triangle模型、SVR模型和LR模型相比,RFR模型具有較高的預(yù)測(cè)準(zhǔn)確性和較良好的泛化性能。