• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于分段線性回歸的傳感器網(wǎng)絡數(shù)據(jù)壓縮傳輸方法研究*

    2015-11-19 04:57:36張瑞瑞杜尚豐陳立平
    傳感技術學報 2015年4期
    關鍵詞:分段線性基站

    張瑞瑞,杜尚豐,陳立平,闞 杰,徐 剛

    (1.中國農(nóng)業(yè)大學信息與電氣工程學院,北京 100083;2.北京農(nóng)業(yè)智能裝備技術研究中心,北京 100097;3.國家農(nóng)業(yè)智能裝備工程技術研究中心,北京 100097;4.首都師范大學信息工程學院,北京 100048;)

    基于分段線性回歸的傳感器網(wǎng)絡數(shù)據(jù)壓縮傳輸方法研究*

    張瑞瑞1,2,3,杜尚豐1,陳立平2,3*,闞 杰4,徐 剛2,3

    (1.中國農(nóng)業(yè)大學信息與電氣工程學院,北京 100083;2.北京農(nóng)業(yè)智能裝備技術研究中心,北京 100097;3.國家農(nóng)業(yè)智能裝備工程技術研究中心,北京 100097;4.首都師范大學信息工程學院,北京 100048;)

    無線傳感器網(wǎng)絡通信帶寬等十分有限,難以實現(xiàn)較大量數(shù)據(jù)傳輸。針對多參數(shù)傳感器網(wǎng)絡,通過提取基準參數(shù)數(shù)據(jù)集,并分段構建線性回歸方程的方法,設計了一種適合多參數(shù)、較大數(shù)據(jù)量傳感器網(wǎng)絡網(wǎng)內(nèi)數(shù)據(jù)的壓縮傳輸算法。以某基地實際采樣環(huán)境溫度、空氣相對濕度、土壤溫度數(shù)據(jù)為研究對象,對算法壓縮效率和數(shù)據(jù)恢復效果進行了分析。結果表明:對于空氣相對濕度和土壤溫度,恢復數(shù)據(jù)與原始數(shù)據(jù)均方根誤差RMSE分別為3.87%、0.49℃時,整體數(shù)據(jù)壓縮率可達51.9%,有效降低了數(shù)據(jù)傳送量。

    傳感器網(wǎng)絡;數(shù)據(jù)融合;線性回歸;相關分析

    無線傳感器網(wǎng)絡WSN(Wireless Sensor Network)是以感知、采集和處理網(wǎng)絡覆蓋區(qū)域中被感知對象的信息為目的,利用大量傳感器節(jié)點以無線、多跳、自組織方式構成的數(shù)據(jù)協(xié)同處理網(wǎng)絡[1-2]。如何有效減少數(shù)據(jù)傳送量,延長網(wǎng)絡生命周期,是當前WSN能耗控制研究重點[3-4]。數(shù)據(jù)壓縮傳輸技術是解決上述問題的有效方法之一[5-6]。

    Deligiannakis A等[7]提出了一種基于分段線性回歸模型的WSN數(shù)據(jù)估計算法。算法通過對數(shù)據(jù)分段處理,從中選出基礎信號數(shù)據(jù),并傳送基于以段為單位的線性回歸運算得出的回歸方程系數(shù),有效地減低了傳感器網(wǎng)絡的網(wǎng)內(nèi)數(shù)據(jù)傳送量。王玲等[8-10]從數(shù)據(jù)時間相關性分析層面考慮,基于線性回歸模型構建了不同的數(shù)據(jù)壓縮算法。楊圣洪等[11]針對數(shù)據(jù)時間、空間相關性特征,提出了一種基于環(huán)模型的分布式時-空小波數(shù)據(jù)壓縮算法。李楊[12]等提出了一種基于小波分段常值壓縮的數(shù)據(jù)收集算法,利用壓縮采樣理論和分段化方法降低數(shù)據(jù)傳輸量。Deepak Ganesa等[13-14]提出了一種基于小波壓縮層次系統(tǒng),基于時空相關性,在節(jié)點層對數(shù)據(jù)時間序列上相關性進行分析,在聚合節(jié)點上對不同節(jié)點進行空間相關性分析,通過兩次處理降低數(shù)據(jù)冗余。侯鑫、楊永健等[15-17]基于神經(jīng)網(wǎng)絡、卡爾曼濾波等算法模型構建了傳感器網(wǎng)絡數(shù)據(jù)融合算法。

    考慮到非實時多參數(shù)WSN節(jié)點環(huán)境監(jiān)測應用背景下,網(wǎng)內(nèi)參數(shù)間表現(xiàn)出強相關、大冗余特點,以及傳感器網(wǎng)絡節(jié)點對數(shù)據(jù)融合算法的簡單、易實現(xiàn)等特殊要求,本文提出了一種基于相關性分析的節(jié)點-基站分離式的分段線性回歸數(shù)據(jù)壓縮傳輸算法PWLR(Piece-Wise Linear Regression)。算法通過挖掘參數(shù)間相關性,減少網(wǎng)內(nèi)數(shù)據(jù)量,延長WSN生命周期。

    1 算法的模型描述

    傳感器節(jié)點采集數(shù)據(jù)可以描述為矩陣結構,如式(1)所示。式中行向量表示單個參數(shù)在時間序列上采樣數(shù)據(jù)集。n×m矩陣表示當前最新樣本數(shù)據(jù),n表示節(jié)點有n個監(jiān)測參數(shù),m表示節(jié)點已采樣周期數(shù)(假設各參數(shù)具有相同的采樣周期)。

    對于強相關性參數(shù)(如空氣溫度和土壤溫度),利用標準線性回歸估計模型建立參數(shù)間數(shù)學關系方程,如(2)所示,并基于最小二乘法確定擬合方程擬合誤差RMSE最小時的回歸系數(shù)(a,b)。傳感器網(wǎng)絡節(jié)點將Yj作為基準數(shù)據(jù)集BD(Base Data)發(fā)送至基站,對于Yi數(shù)據(jù)集的傳送則可以通過只發(fā)送擬合方程回歸系數(shù)(a,b)實現(xiàn)。

    然而,對整個時間序列進行線性回歸會產(chǎn)生較大誤差,主要原因在于:①參數(shù)在不同時間段表現(xiàn)的相關程度不同。例如環(huán)境溫度在一天的正午時段變化率較小,而傍晚時分變化率較大。②不同參數(shù)的相互影響在時間維度上具有滯后性。當某個參數(shù)改變時其他相關參數(shù)的相應變化會延遲發(fā)生。例如環(huán)境溫度與土壤溫度的相互影響。

    本文提出一種分段線性回歸映射方法,將時間序列上的樣本數(shù)據(jù)劃分成段,以段為單位進行線性回歸計算,并以自定義結構化精簡集S的形式進行特征描述,如定義1。

    定義1:結構化精簡集S由以下部分組成

    ·l:段長度;

    ·start:段在行上的開始坐標,例如該段在行i上的區(qū)間可表示為Yi[start,start+l]

    ·migration:該段做線性回歸運算時在基準數(shù)據(jù)集上的起始偏移量,例如可表示為BD[migration,migration+l]

    ·a,b,err:a,b為分段線性回歸方程的回歸系數(shù),err為均方根誤差(err用于分段搜索時可不用傳輸,見2.2節(jié))

    當n×m個樣本數(shù)據(jù)采集完畢后,傳感器網(wǎng)絡節(jié)點首先選取基準數(shù)據(jù)集(設為Yj,見2.1節(jié)),并將行i分成「m/l]段(「m/l]表示對m/l的計算值做上取整運算)。每段以長度l搜索Yj上對應的線性回歸運算最優(yōu)數(shù)據(jù)區(qū)間,并將結果以結構化形式發(fā)送給基站?;鶞蕯?shù)據(jù)集整體直接發(fā)送給基站作為數(shù)據(jù)恢復依據(jù)。每行完成分段回歸運算后,該行可用結構化精簡集Sk(Sk?m,k=「m/l])代替,精簡集作為行i的特征描述,用以在基站進行數(shù)據(jù)恢復。假設Yj是基準數(shù)據(jù)集,則Yi中的某段數(shù)據(jù)Yi[start,start+l]可表示為:

    a·Yj[migration,migration+l]+b

    此時節(jié)點數(shù)據(jù)傳輸量為:

    Data={基準數(shù)據(jù)集,精簡集S}

    假設傳感器采集參數(shù)數(shù)據(jù)表示與結構化精簡集S成員參數(shù)的數(shù)據(jù)表示占用相同存儲空間,則數(shù)據(jù)壓縮率可簡化表示為:

    式中:li是第i個參數(shù)的分段長度,n是傳感器網(wǎng)絡節(jié)點的監(jiān)測參數(shù)種類數(shù),m是節(jié)點已采樣周期數(shù)。

    2 算法實現(xiàn)

    算法包括建立和運行維護兩個階段。在能量充足的基站端,算法通過分析歷史數(shù)據(jù),挖掘單節(jié)點多參數(shù)間相關性,定義參數(shù)相關性貢獻評價模型,選取基準數(shù)據(jù)集,并建立最佳分段方式和動態(tài)分段線性映射模型,并將模型參數(shù)發(fā)送給節(jié)點。節(jié)點根據(jù)基站的配置參數(shù)做融合計算,并將基準數(shù)據(jù)集和精簡集S發(fā)送基站,基站做恢復運算,得到節(jié)點傳送數(shù)據(jù)?;靖鶕?jù)已接收到的數(shù)據(jù)動態(tài)分析并適時更改模型參數(shù),并定時對節(jié)點相應配置更新。由于算法復雜的參數(shù)選取過程在基站完成,節(jié)點只需進行簡單的數(shù)據(jù)映射操作,因此如果忽略基站的能耗,該算法對網(wǎng)絡的能量消耗較小。

    2.1 算法的建立

    2.1.1 基準數(shù)據(jù)集選取

    基站對收集到的感知數(shù)據(jù)樣本進行相關性計算,從中選取一個相關性最高的樣本。如式(1)所示,單一節(jié)點具有n個感知參數(shù),t時刻第i個參數(shù)采集數(shù)據(jù)表示為yit,時間序列上的傳感器數(shù)據(jù)集描述為矩陣X。為了便于選取,對每行參數(shù)建立如下基準數(shù)據(jù)集評價模型:

    ①計算樣本相關系數(shù)rij。rij表示第i個參數(shù)樣本與第j個參數(shù)樣本之間的相關系數(shù),采用簡單樣本相關系數(shù)計算方法,rij定義為樣本間協(xié)方差與樣本各自方差的商,如式(5):

    ②計算所有行相關系數(shù)和benefit(i),對其進行排序,選擇排序最高行作為回歸模型基準數(shù)據(jù)集。

    2.1.2 分段線性回歸計算。

    表1 分段線性回歸搜索函數(shù)

    算法以段為單位進行數(shù)據(jù)集線性回歸映射操作,不同的分段數(shù)會給算法帶來不同的表現(xiàn)。理論上當分段數(shù)較小時,算法誤差下降速率較大,隨著分段數(shù)的增加誤差將緩慢下降,當分段數(shù)無限增加時,算法誤差將趨于0。然而,當段數(shù)增加時,每段進行回歸估計的數(shù)據(jù)量減少,這可能導致線性回歸的估計誤差不減反增,即此時的分段數(shù)超過了算法局部最優(yōu)選擇,同時算法壓縮率也隨之增大。由于壓縮率隨著分段數(shù)的增加線性增長,繼續(xù)增加分段數(shù)反而會降低算法的性能。實際中應該根據(jù)需求綜合考慮誤差和壓縮率兩方面因素??梢赃x擇算法的局部最優(yōu)分段,或當誤差滿足需求閾值時的分段方式。由于不能給出理論上合理的分段方法,將從實驗中得出最佳分段方式。

    表2 標準線性回歸函數(shù)

    2.2 算法執(zhí)行與維護流程

    基站以一定的周期動態(tài)更新基準數(shù)據(jù)集,提高數(shù)據(jù)估計精度。同樣,基站將以一定周期進行最佳分段的更新操作,提高數(shù)據(jù)估計精度。算法執(zhí)行與維護流程如圖1所示。

    圖1 算法執(zhí)行與維護流程圖

    3 實驗分析

    以北京市小湯山國家精準農(nóng)業(yè)示范基地2013 年5月2日~5月11日實際采樣數(shù)據(jù)為實驗樣本,其中包含環(huán)境溫度、空氣濕度、土壤溫度3個參數(shù),參數(shù)采樣周期為10 min,其中5月2日~5月6日共5天數(shù)據(jù)進行基站算法初始化參數(shù)計算,5月7日~5月11日數(shù)據(jù)進行節(jié)點實驗,為了及時感知監(jiān)測參數(shù)變化,基站的算法參數(shù)更新周期設為5天。算法數(shù)據(jù)恢復精度以式(6)所示均方根誤差(RMSE)作為衡量標準,并與ISDT算法進行對比[9]。根據(jù)三參數(shù)的貢獻值如表3所示。選取環(huán)境溫度為基準數(shù)據(jù)集。

    表3 仿真參數(shù)貢獻值

    為了進行樣本最優(yōu)分段,實驗以不同段數(shù)為變量,以算法RMSE誤差為輸出,分別對空氣濕度,土壤溫度進行算法仿真,實驗設置分段范圍為1~30,結果如圖2所示??梢钥闯?,當節(jié)點對兩種數(shù)據(jù)不進行分段,直接以數(shù)據(jù)樣本整體進行線性回歸計算時,雖然此時數(shù)據(jù)壓縮率最好為33.78%(每行參數(shù)只需用一個精簡集描述),但其誤差達到最大值,分別達到1.8和12.2%。當對數(shù)據(jù)進行分段線性回歸后,開始時算法RMSE降低速率較快,當增加某個值時(實驗中土壤溫度為16,空氣相對濕度為18),算法誤差達到局部最優(yōu)值,此時的分段數(shù)使得數(shù)據(jù)相關性達到局部最佳。當分段數(shù)繼續(xù)增加時,誤差開始增加,這是由于樣本數(shù)據(jù)總數(shù)不變,隨著分段數(shù)的增加,每段進行回歸估計計算的數(shù)據(jù)減少。此后算法RMSE變化趨于平緩,繼續(xù)增加分段數(shù)將不會帶來算法表現(xiàn)的明顯提升,反而導致壓縮率的增加。本文采用局部最優(yōu)解的方式選取分段數(shù)。

    圖2 不同分段下算法均方根誤差

    通過分析均方根誤差和壓縮率變化關系進行算法比較,結果如圖3和圖4所示。圖3可以看出,當壓縮率較小時,壓縮的數(shù)據(jù)足夠描述參數(shù)的變化特征,基于時間序列分段線性化的ISDT算法能夠獲得較小的壓縮誤差,隨著壓縮誤差增加,壓縮率超過70%時,ISDT算法壓縮誤差超過PWLR算法,此時壓縮數(shù)據(jù)量較少,PWLR算法能夠更加準確的還原數(shù)據(jù)。圖4所示的空氣濕度數(shù)據(jù)具有類似的特點,當數(shù)據(jù)壓縮率超過60%時,PWLR算法壓縮誤差明顯小于ISDT算法。從中可以看出,PWLR算法能夠在高壓縮率的需求下獲得更加準確的壓縮效果。相比于ISDT,PWLR算法更加適合于大數(shù)據(jù)、高壓縮比、高精度的應用需求下。

    圖3 土壤溫度數(shù)據(jù)均方誤差與壓縮率關系

    圖4 空氣濕度數(shù)據(jù)均方誤差與壓縮率關系

    當土壤溫度數(shù)據(jù)集分為16段,空氣相對溫度分為18段,進行回歸運算時,基站根據(jù)精簡集對數(shù)據(jù)恢復效果如圖5和圖6所示。

    圖5 土壤溫度恢復數(shù)據(jù)與原始數(shù)據(jù)對比

    圖6 空氣相對濕度恢復數(shù)據(jù)與原始數(shù)據(jù)對比

    可以看出算法能夠根據(jù)基準數(shù)據(jù)集準確給出融合數(shù)據(jù)的特征描述。對于土壤溫度和空氣相對濕度,恢復數(shù)據(jù)與原始數(shù)據(jù)均方根誤差RMSE分別為0.49℃、3.87%,此時整體數(shù)據(jù)壓縮率可達59.1%。

    4 結論

    分布密集的眾多節(jié)點使得傳感器網(wǎng)絡內(nèi)部產(chǎn)生了巨大的數(shù)據(jù)傳輸量。如何對數(shù)據(jù)進行有效壓縮以應對WSN資源受限的現(xiàn)狀是WSN應用研究中一項具有挑戰(zhàn)性的課題。針對監(jiān)測參數(shù)間相關性特點,本文給出了一種基于分段線性回歸的多參數(shù)WSN數(shù)據(jù)融合算法PWLR。仿真實驗表明,算法以基準數(shù)據(jù)集為自變量,對分段數(shù)據(jù)進行最優(yōu)線性回歸搜索,最小化回歸方程誤差,從而在高壓縮率的條件下保證數(shù)據(jù)融合質量,較原始傳輸策略顯著降低數(shù)據(jù)傳輸量。

    [1] Akyildiz I F,Su W,Sankarasubramaniam Y,et al.A Survey on Sensor Networks[J].IEEE Communication Magazine,2002,40 (8):102-114.

    [2] Yick J,Mukherjee B,Ghosal D.Wireless Sensor Network Survey [J].Computer Networks,2008,52(12):2292-2330.

    [3] 林蔚,韓麗紅.無線傳感器網(wǎng)絡的數(shù)據(jù)壓縮算法綜述[J].小型微型計算機系統(tǒng),2012,33(9):2043-2048.

    [4] 陳正宇,楊庚,陳蕾,等.無線傳感器網(wǎng)絡數(shù)據(jù)融合技術研究綜述[J].計算機應用研究,2011,28(5):1601-1604.

    [5] 康健,左憲章,唐力偉,等.無線傳感器網(wǎng)絡數(shù)據(jù)融合技術[J].計算機科學,2010,37(4):31-35.

    [6] Nakamura E F,Loureiro A A F,F(xiàn)rery A C.Information Fusion for Wireless Sensor Networks:Methods,Models,and Classifications [C]//ACM Comput.2007,39:9.

    [7] DeligiannakisA,KotidisY,RoussopoulosN.Compressing Historical Information in Sensor Networks.In Proceedings of ACM SIGMOD Conference,2004.

    [8] 王玲,石為人,石欣,等.基于時間相關性的無線傳感器網(wǎng)絡數(shù)據(jù)壓縮與優(yōu)化算法[J].計算機應用,2013,33(12):3453-3456.

    [9] 王舉,房鼎益,陳曉紅,等.文物監(jiān)測中無線傳感器網(wǎng)絡數(shù)據(jù)壓縮算法[J].西安電子科技大學學報,2012,39(1):157-162.

    [10]宋欣,王翠榮.基于線性回歸的無線傳感器網(wǎng)絡分布式數(shù)據(jù)采集優(yōu)化策略[J].計算機學報,2012,35(3):568-580.

    [11]楊圣洪,賈焰,周四望.無線傳感器網(wǎng)絡基于虛擬節(jié)點的小波壓縮算法[J].軟件學報,2013,24(3):557-563.

    [12]李楊,郭龍江,李金寶,等.傳感器網(wǎng)絡基于小波分段常值壓縮的數(shù)據(jù)收集研究[J].儀器儀表學報,2013,34(1):119-127.

    [13]Deepak Ganesan,Deborah Estrin,John Heidemann.DIMENSIONS:Why do We Need a New Data Handling Architecture for Sensor Networks?[C]//Proceedings of the ACM HotNets,ACM,2002:143-148.

    [14]Ganesan D,Greenstein B,Perelyubskiy D,et al.An Evaluation of Multi-Resolution Search and Storage in Resource-Constrained Sensor Networks[C]//Proceedings of the First ACM Conference on Embedded Networked Sensor Systems(SenSys),2003.

    [15]侯鑫,張文東,鐘鳴.基于事件驅動和神經(jīng)網(wǎng)絡的無線傳感器網(wǎng)絡數(shù)據(jù)融合算法研究[J].傳感技術學報,2014,27(1):142-148.

    [16]楊永健,劉帥.基于SOFM神經(jīng)網(wǎng)絡的無線傳感器網(wǎng)絡數(shù)據(jù)融合算法[J].傳感技術學報,2013,26(12):1757-1763.

    [17]Olfati-Saber R.Distributed Kalman Fltering for Sensor Networks [C]//Proc 46th IEEE Conf Decision and Control,New Orleans,LA,2007.

    張瑞瑞(1983-),男,博士生,國家農(nóng)業(yè)智能裝備工程技術研究中心助理研究員,主要從事傳感器網(wǎng)絡、傳感器智能化技術研究,Rui7986@126.com;

    陳立平(1973-),女,國家農(nóng)業(yè)智能裝備工程技術研究中心研究員、博士生導師,主要從事農(nóng)業(yè)智能裝備技術與系統(tǒng)研究,Chenliping@iea.ac.cn。

    杜尚豐(1961-),男,中國農(nóng)業(yè)大學信電學院教授、博士生導師,主要從事復雜系統(tǒng)建模與控制,無線傳感器網(wǎng)絡理論,機器人控制技術研究,Ca800@ 263.net;

    Data Compression Method with Piece-Wise Linear Regression in WSN*

    ZHANG Ruirui1,2,3,DU Shangfeng1,CHEN Liping2,3*,KAN Jie4,XU Gang2,3
    (1.College of Information and Electrical Engineering,China Agriculture University,Beijing 100083,China;2.Beijing Research Center of Intelligent Equipment for Agriculture,Beijing Academy of Agriculture and Forestry Sciences,Beijing 100097,China;3.National Engineering Research Center of Intelligent Equipment for Agriculture,Beijing 100097,China;4.College of Information Engineering,Capital Normal University,Beijing 100048,China)

    Suffering from the limitation of bandwidth,WSN is confronting the challenge of big data transmission.By obtaining Base-data and constructing piece-wise linear regression equation,this paper proposed a data compression transmission algorithm for WSN with large data volume and strong correlation and redundancy multi-parameter.Taking environment temperature,relative air humidity and soil temperature data obtained by a WSN system located in Beijing Xiao Tangshan national demonstration base of precision agriculture as research object,we tested the compression and data recovery efficiency of the algorithm.Results show that data compression ratio is as high as 51.9% when the RMSE between restored data and raw data are 3.87%and 0.49℃,which brings an enormous reduction of the amount of data transmission.

    WSN;data fusion;linear regression;correlation analysis EEACC:7230

    TP391.9

    A

    1004-1699(2015)04-0531-06

    10.3969/j.issn.1004-1699.2015.04.014

    項目來源:北京市自然科學基金項目(4121001);北京市農(nóng)林科學院青年科研基金項目(QNJJ201217);國家863高技術研究發(fā)展計劃項目(2012AA101901)

    2014.11.6 修改日期:2014.12.24

    猜你喜歡
    分段線性基站
    漸近線性Klein-Gordon-Maxwell系統(tǒng)正解的存在性
    一類連續(xù)和不連續(xù)分段線性系統(tǒng)的周期解研究
    線性回歸方程的求解與應用
    分段計算時間
    二階線性微分方程的解法
    可惡的“偽基站”
    探索科學(2017年4期)2017-05-04 04:09:47
    3米2分段大力士“大”在哪兒?
    太空探索(2016年9期)2016-07-12 10:00:04
    基于GSM基站ID的高速公路路徑識別系統(tǒng)
    小基站助力“提速降費”
    移動通信(2015年17期)2015-08-24 08:13:10
    基站輻射之爭亟待科學家發(fā)聲
    虞城县| 永年县| 新沂市| 娄烦县| 阿勒泰市| 松原市| 穆棱市| 青海省| 漳平市| 明溪县| 乾安县| 屯门区| 临泉县| 马龙县| 岱山县| 六枝特区| 绥德县| 博野县| 高清| 岳池县| 漳浦县| 方山县| 平谷区| 怀柔区| 咸丰县| 文安县| 玛纳斯县| 长岭县| 咸宁市| 万州区| 苍梧县| 区。| 青川县| 万全县| 马关县| 乌兰县| 巩留县| 西峡县| 紫云| 昌邑市| 启东市|