楊星 舒磊 黃凱 李凱亮 霍志強 王彥飛 王心怡 盧巧玲 張亞成
摘要: 太陽能殺蟲燈物聯(lián)網(wǎng)(SIL-IoTs)是一種基于農(nóng)業(yè)場景與物聯(lián)網(wǎng)技術(shù)的新型物理農(nóng)業(yè)蟲害防治工具,通過無線傳輸太陽能殺蟲燈組件狀態(tài)數(shù)據(jù),用戶可后臺實時查看太陽能殺蟲燈運行狀態(tài),具有殺蟲計數(shù)、蟲害區(qū)域定位、輔助農(nóng)情監(jiān)測等功能。但隨著SIL-IoTs快速發(fā)展與廣泛應用,故障診斷難和維護難等矛盾日益突出。基于此,本研究首先闡述了SIL-IoTs的結(jié)構(gòu)和研究現(xiàn)狀,分析了故障診斷的重要性,指出了故障診斷是保障其可靠性的主要手段。接著介紹了目前太陽能殺蟲燈節(jié)點自身存在的故障及其在無線傳感網(wǎng)絡(WSNs)中的體現(xiàn),并進一步對WSNs中的故障進行分類,包括基于行為、基于時間、基于組件以及基于影響區(qū)域的故障四類。隨后討論了統(tǒng)計方法、概率方法、層次路由方法、機器學習方法、拓撲控制方法和移動基站方法等目前主要使用的WSNs故障診斷方法。此外,還探討了SIL-IoTs故障診斷策略,將故障診斷從行為上分為主動型診斷與被動型診斷策略,從監(jiān)測類型上分為連續(xù)診斷、定期診斷、直接診斷與間接診斷策略,從設備上分為集中式、分布式與混合式策略。在以上故障診斷方法與策略的基礎(chǔ)上,介紹了后臺數(shù)據(jù)異常、部分節(jié)點通信異常、整個網(wǎng)絡通信異常和未診斷出異常但實際存在異常四種故障現(xiàn)象下適用的WSNs故障診斷調(diào)試工具,如Sympathy、Clairvoyant、SNIF和Dustminer。最后,強調(diào)了SIL-IoTs的特性對故障診斷帶來的潛在挑戰(zhàn),包括部署環(huán)境復雜、節(jié)點任務沖突、連續(xù)性區(qū)域節(jié)點無法傳輸數(shù)據(jù)和多種故障診斷失效等情形,并針對這些潛在挑戰(zhàn)指出了合理的研究方向。由于SIL-IoTs為農(nóng)業(yè)物聯(lián)網(wǎng)中典型應用,因此本研究可擴展至其它農(nóng)業(yè)物聯(lián)網(wǎng)中,并為這些農(nóng)業(yè)物聯(lián)網(wǎng)的故障診斷提供參考。
關(guān)鍵詞: 太陽能殺蟲燈;無線傳感網(wǎng)絡;農(nóng)業(yè)物聯(lián)網(wǎng);故障診斷;蟲害
中圖分類號: S237;TP206+.3 文獻標志碼: A 文章編號: 202005-SA002
引文格式:楊星, 舒磊, 黃凱, 李凱亮, 霍志強, 王彥飛, 王心怡, 盧巧玲, 張亞成. 太陽能殺蟲燈物聯(lián)網(wǎng)故障診斷特征分析及潛在挑戰(zhàn)[J]. 智慧農(nóng)業(yè)(中英文), 2020, 2(2): 11-27.
Citation:YANG Xing, SHU Lei, HUANG Kai, LI Kailiang, HUO Zhiqiang, WANG Yanfei, WANG Xinyi, LU Qiaoling, ZHANG Yacheng. Characteristics analysis and challenges for fault diagnosis in solar insecticidal lamps Internet of Things[J]. Smart Agriculture, 2020, 2(2): 11-27.
1 引 ?言
農(nóng)業(yè)是支撐國民經(jīng)濟建設與發(fā)展的第一基礎(chǔ)產(chǎn)業(yè)。然而農(nóng)業(yè)蟲害,尤其是遷飛性害蟲,如草地貪夜蛾、稻縱卷葉螟和甜菜葉蛾等,對農(nóng)業(yè)的正常生產(chǎn)造成了極大的負面影響[1]。目前蟲害防治的主要手段是施用農(nóng)藥,但長期大量使用農(nóng)藥,不僅降低了農(nóng)產(chǎn)品的品質(zhì),污染了自然環(huán)境,而且還提高了害蟲的抗藥性,不利于中國農(nóng)業(yè)的可持續(xù)發(fā)展[2]。
在國家實行化肥農(nóng)藥雙減政策背景下,太陽能殺蟲燈(Solar Insecticidal Lamps,SIL)作為一種通過太陽能供電、利用遷飛性害蟲趨光性引誘害蟲撲燈從而起到殺蟲作用的物理防治工具,已逐漸成為中國害蟲防治與植物保護方面的研究熱點[3]。由于太陽能殺蟲燈部署于野外,受環(huán)境影響較大,容易出現(xiàn)故障;而且因其多懸掛于較高的金屬桿上,且有高壓金屬網(wǎng),因此檢修和維護較為困難,無法長期發(fā)揮殺蟲作用。傳統(tǒng)太陽能殺蟲燈 不包含物聯(lián)網(wǎng)功能,一般未設有故障診斷功能。部分有故障診斷功能的產(chǎn)品通過內(nèi)置傳感器檢測電壓與電流的異常變化。當出現(xiàn)異常時,通過亮起故障警報燈的方式等待維護人員發(fā)現(xiàn)異常。維護人員通過現(xiàn)場觀察、測電筆檢測進行經(jīng)驗式故障診斷,無法滿足快速殺蟲計數(shù)、故障診斷、蟲害區(qū)域判斷等農(nóng)業(yè)生產(chǎn)需求。
隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,無線傳感網(wǎng)絡(Wireless Sensor Networks, WSNs)被廣泛應用于溫室大棚[4]、植保無人機[5]、植物表型平臺[6]等智慧農(nóng)業(yè)場景。太陽能殺蟲燈物聯(lián)網(wǎng)(Solar Insecticidal Lamps Internet of Things, SIL-IoTs)正是WSNs與SIL結(jié)合的產(chǎn)物。SIL-IoTs通過無線通信模塊(如ZigBee和LoRa)將殺蟲計數(shù)、太陽能殺蟲燈組件狀態(tài)信息等上傳到云平臺與用戶移動端,或直接在節(jié)點端進行在線狀態(tài)監(jiān)測,以滿足用戶實時獲取設備故障信息需求。用戶通過后臺發(fā)送調(diào)整工作時長等命令來遠程控制并管理SIL-IoTs,如利用已知坐標信息的SIL-IoTs節(jié)點進行實時殺蟲計數(shù),快速判定蟲害區(qū)域,提升太陽能殺蟲燈實驗的效率,進而輔助農(nóng)藥施用決策。此外SIL-IoTs還可擴展土壤墑情、溫濕度等模塊,以滿足不同農(nóng)業(yè)場景下的具體需求,實現(xiàn)農(nóng)情輔助監(jiān)測功能[7],提升農(nóng)業(yè)生產(chǎn)管理效率[8]。
基于此,企業(yè)紛紛研制SIL-IoTs產(chǎn)品,但仍存在一定的局限性。主要體現(xiàn)在:1)目前市場上的產(chǎn)品均基于蜂窩移動網(wǎng)絡進行數(shù)據(jù)傳輸。這種方式不僅增加了殺蟲燈節(jié)點的維護成本(需要一直繳納流量費用),且不適用于部分網(wǎng)絡信號質(zhì)量較差的農(nóng)村區(qū)域。2)目前產(chǎn)品殺蟲計數(shù)均基于高壓電網(wǎng)放電次數(shù)進行計數(shù),當多只害蟲同時碰撞高壓電網(wǎng)時,電網(wǎng)只進行一次放電,記為殺蟲一次;或蟲子粘在高壓電網(wǎng)上持續(xù)性放電時,有蟲子撞擊電網(wǎng),也不進行計數(shù)。這些情況導致殺蟲計數(shù)結(jié)果不可信,可能誤導故障的診斷。3)WSNs采用的是節(jié)點多跳傳輸至基站的方法,基于蜂窩移動網(wǎng)絡的后臺故障診斷方法(較低延遲與通信代價)不適用于SIL-IoTs。因此使用ZigBee等低成本、自組網(wǎng)通信方式,通過節(jié)點間互相通信以及節(jié)點與基站通信的方式實時監(jiān)測太陽能殺蟲燈組件狀態(tài),對SIL-IoTs的長期運行更加有利。并且基于節(jié)點自診斷、鄰居節(jié)點互相監(jiān)督等方法,后臺能及時發(fā)現(xiàn)組件存在故障,通過重啟等手段消除系統(tǒng)故障。
本文在介紹SIL-IoTs結(jié)構(gòu)和研究現(xiàn)狀的基礎(chǔ)上,闡述了SIL-IoTs故障診斷的重要性,分析了SIL-IoTs故障診斷的特征,并進一步展望了其部署環(huán)境與工作特性給故障診斷帶來的潛在挑戰(zhàn)。
2 SIL-IoTs及其故障診斷重要性
2.1 SIL-IoTs結(jié)構(gòu)及研究進展
目前,應用中主要使用的傳統(tǒng)太陽能殺蟲燈是太陽能頻振式殺蟲燈和太陽能風吸式殺蟲燈。這兩種殺蟲燈均利用誘蟲光源吸引害蟲至殺蟲燈附近,頻振式殺蟲燈通過高壓電網(wǎng)放電殺滅害蟲,風吸式殺蟲燈通過風扇吸入害蟲,使其風干。SIL-IoTs在硬件結(jié)構(gòu)上比傳統(tǒng)太陽能殺蟲燈多了無線通信設備與天線,如圖1所示,用于節(jié)點間通信或與基站通信。其中無線通信設備通過蓄電池供電,而蓄電池通過太陽能板充電,因此相較于節(jié)點能量有限的傳統(tǒng)WSNs,SIL-IoTs是一種能量采集-無線傳感網(wǎng)絡(Energy-Harvesting WSNs,EH-WSNs)。EH-WSNs是一種通過采集外界能量(如無線充電、太陽能、風能)為傳感器電池充電的新興WSNs形式。它極大地延長了節(jié)點與網(wǎng)絡壽命,使傳感器節(jié)點突破能量的束縛,進而支持通信范圍更廣、計算能力更強的邊緣計算節(jié)點。將故障診斷方法部署在邊緣計算節(jié)點可以有效降低診斷信息延遲,通過自恢復的方法恢復部分故障,而不必將故障信息傳輸?shù)胶笈_后再恢復,提高了SIL-IoTs的可靠性。
從系統(tǒng)結(jié)構(gòu)上,依據(jù)WSNs的定義,可將SIL-IoTs分為感知層、傳輸層、邊緣層以及應用層,如圖2所示。感知層通過多種傳感器完成數(shù)據(jù)采集任務,并利用傳輸層的無線通信設備上傳采集到的數(shù)據(jù)。對于計算量小、實時性要求高的任務,可在本地設備進行數(shù)據(jù)處理并發(fā)送控制命令至執(zhí)行器。當區(qū)域性蟲害爆發(fā)時,若將蟲害數(shù)據(jù)上傳至云端再由云端將控制命令傳回至執(zhí)行器,較大的時延可能導致殺蟲任務調(diào)整總是落后于實際蟲情變化。而應用層可將云平臺或邊緣層處理后的數(shù)據(jù)或決策信息發(fā)送至Web站點或用戶手機,便于用戶實時查看或幫助用戶做出更正確的決策。
目前科研人員已經(jīng)開展了部分研究,Lam等[9]將誘蟲燈與WSNs結(jié)合,通過感知誘蟲燈中的害蟲重量識別害蟲種類,利用星型拓撲結(jié)構(gòu)和時分控制的方式傳輸數(shù)據(jù),建立了用于實時監(jiān)測越南湄公河三角洲地區(qū)褐飛虱的監(jiān)控網(wǎng)絡。Eliopoulos等[10]提出了一種基于生物聲學技術(shù)的糧倉蟲害密度估計方法,通過分析壓電傳感器的振動記錄對區(qū)域內(nèi)谷物侵染嚴重程度進行判別。Lopez等[11]提出了一種基于低成本圖像傳感器的蟲害監(jiān)控系統(tǒng),可部署于溫室大棚或大田中,通過單跳或多跳傳播的形式上傳蟲害數(shù)據(jù),通過圖像識別算法檢測害蟲。Yang等[12]提出了一種基于分區(qū)結(jié)構(gòu)的SIL-IoTs節(jié)點部署策略,利用農(nóng)田天然的分區(qū)結(jié)構(gòu),將SIL-IoTs的節(jié)點部署問題轉(zhuǎn)化為二次分配問題,并采用遺傳算法對該問題求解。該策略在保證全覆蓋的約束下,顯著降低了節(jié)點的部署數(shù)量,可用于復雜的農(nóng)業(yè)環(huán)境中。
2.2 SIL-IoTs故障診斷重要性
由于SIL-IoTs在日常應用中承擔著較重的殺蟲任務以及輔助蟲害觀測任務,當SIL-IoTs出現(xiàn)故障時,不僅無法殺滅害蟲,而且可能誤導農(nóng)民對蟲害的估計情況,從而導致農(nóng)藥用量偏差,進一步影響作物的品質(zhì)與產(chǎn)量。特別地,當誘蟲光源能正常工作但殺蟲組件出現(xiàn)故障時,周圍害蟲被吸引至太陽能殺蟲燈附近卻又無法殺蟲,將造成局部地區(qū)害蟲爆發(fā)性增長。此類情形不僅對作物產(chǎn)生危害,還會使用戶認為SIL-IoTs將其他區(qū)域的害蟲吸引到自己農(nóng)田中,進而影響SIL-IoTs的推廣與應用。因此對SIL-IoTs故障進行快速、準確的診斷非常重要。
目前市場上使用的基于蜂窩移動網(wǎng)絡的SIL-IoTs產(chǎn)品主要通過維護人員經(jīng)驗式故障診斷,以及當運行狀態(tài)數(shù)據(jù)跳變或不在合理范圍內(nèi)時判定故障[7]。當移動蜂窩網(wǎng)絡出現(xiàn)通信問題時,除了自帶的故障診斷警報燈外,后臺只能獲取節(jié)點網(wǎng)絡連接失敗的信息,無法對其進行遠程故障診斷。與移動蜂窩網(wǎng)絡直連基站不同的是,在WSNs中,殺蟲燈部分故障診斷策略可在本地節(jié)點或邊緣計算節(jié)點執(zhí)行,從而達到自診斷與自恢復效果。
太陽能殺蟲燈與物聯(lián)網(wǎng)技術(shù)的結(jié)合在帶動害蟲防治技術(shù)發(fā)展同時,也帶來了新的挑戰(zhàn),包括多約束條件下SIL-IoTs節(jié)點部署、SIL-IoTs工作時長自適應策略、蟲害爆發(fā)區(qū)域快速精準定位以及嚴重蟲害時高壓放電數(shù)據(jù)抗干擾[7]。這些挑戰(zhàn)都建立在SIL-IoTs可靠性得到保證的前提下,且與之相輔相成。如果SIL-IoTs無法得到保障,故障未被及時排查將導致部署策略失效;SIL-IoTs節(jié)點損壞,無法工作,工作時長自適應無意義;蟲害爆發(fā)區(qū)域錯誤定位,網(wǎng)絡拓撲結(jié)構(gòu)錯誤調(diào)整導致整個網(wǎng)絡崩潰等。因此,可靠性是保障SIL-IoTs產(chǎn)品能否長期穩(wěn)定運行的關(guān)鍵性問題。而故障診斷通過各類算法在節(jié)點或后端處檢測并分類出SIL-IoTs 中存在的故障,是保障可靠性的前提。研究針對SIL-IoTs的故障診斷方法,及時發(fā)現(xiàn)SIL-IoTs故障,對于減少農(nóng)業(yè)生產(chǎn)受蟲害侵襲造成的經(jīng)濟損失尤為重要。
3 SIL-IoTs故障診斷特征分析
有效的故障診斷方法依賴于對研究背景的特征分析,因此有必要進行SIL-IoTs的故障診斷特征分析。
3.1 SIL-IoTs故障分類
SIL-IoTs是一種含有殺蟲及太陽能充電功能的WSNs,其中太陽能殺蟲燈組件、傳感器模塊以及無線通信模塊為SIL-IoTs的整體組件構(gòu)成,基于此借助傳統(tǒng)WSNs的故障分類及診斷方法對SIL-IoTs的故障診斷進行特征分析。
WSNs是一種自組網(wǎng)絡,通過部署在不同應用場景下的大量傳感器采集數(shù)據(jù),傳輸?shù)揭粋€或多個基站,最終傳輸?shù)皆破脚_或移動端[13]。檢驗WSNs可靠性最重要的指標就是檢測基站是否收到正確的感知數(shù)據(jù),未收到所有的數(shù)據(jù)或收到不正確的數(shù)據(jù)即可判斷WSNs存在故障。依據(jù)不同的特征,可將WSNs故障分為四種類型,分別是基于行為、基于時間、基于組件以及基于影響區(qū)域的故障[14],如圖3所示,其中紅色外框故障為較難診斷的故障。
3.1.1 基于行為
當WSNs中存在故障時,傳感器節(jié)點表現(xiàn)行為包括無法發(fā)送數(shù)據(jù)、發(fā)送錯誤數(shù)據(jù)或間斷性地發(fā)送數(shù)據(jù)?;诖藢⒐收戏譃橛补收虾蛙浌收稀S补收现競鞲衅髂K組件完全損壞,因而無法與其他傳感器通信[15]。損壞的組件可能但不限于通信模塊或收發(fā)模塊故障、電池損壞、集成電路受雨水侵蝕以及超出通訊半徑[16]。當傳感器仍處于激活狀態(tài),但發(fā)送不正確數(shù)據(jù)或時常不能發(fā)送數(shù)據(jù)則表明WSNs處于軟故障狀態(tài)[17],如發(fā)送異常的殺蟲計數(shù)數(shù)據(jù)或間斷的發(fā)送殺蟲計數(shù)數(shù)據(jù)。
3.1.2 基于時間
從故障的持續(xù)時間分析,可將故障分為永久性故障、間歇性故障和暫時性故障[18,19]。永久性故障通常與硬故障同時發(fā)生,例如電池故障時,SIL-IoTs節(jié)點無法接入網(wǎng)絡,不僅無法上傳數(shù)據(jù),而且無法殺蟲。當傳感器節(jié)點或網(wǎng)絡在無故障與有故障狀態(tài)之間不停切換時,表明目前其正處于間歇性故障中,如SIL-IoTs燈管頻繁啟動。暫時性故障則是短時間內(nèi)發(fā)生的間歇性故障,會自我恢復,通常是由于外部環(huán)境變化等導致,難以診斷。
3.1.3 基于組件
SIL-IoTs由硬件(多種傳感器、傳統(tǒng)太陽能殺蟲燈組件、無線通信模塊)和軟件(協(xié)議棧、后臺控制程序、傳感器驅(qū)動文件)組件組成。當組件故障時,會導致正常工作的SIL-IoTs行為發(fā)生變化,進而造成硬故障或軟故障?;诮M件的故障可分為節(jié)點故障、網(wǎng)絡故障、基站故障以及后端故障。節(jié)點故障指傳感器節(jié)點與太陽能殺蟲燈組件發(fā)生故障,其中傳感器節(jié)點主要包括傳感器單元、數(shù)據(jù)處理單元、無線收發(fā)器和電源[20]。電池電量不足極易造成節(jié)點故障,因此需要良好的能量管理方式,防止部分關(guān)鍵節(jié)點能量下降過快而導致整個網(wǎng)絡故障[21]。根據(jù)第2節(jié)中的組成結(jié)構(gòu),太陽能殺蟲燈節(jié)點組件可能發(fā)生的部分故障如表1所示,大部分故障都源于生產(chǎn)工藝不足或硬件老化問題[22,23]。傳感器節(jié)點通過通信鏈路互相連接,當鏈路出現(xiàn)故障時,節(jié)點消息無法被發(fā)出或具有較大的延遲。路由決定了消息的傳遞路徑,當路由出現(xiàn)軟件故障時,消息可能發(fā)送到不正確的目的地,甚至造成局部區(qū)域鏈路擁塞或發(fā)包沖突?;矩撠煂⑹占降臄?shù)據(jù)聚合并通過網(wǎng)關(guān)發(fā)送到應用層,當基站出現(xiàn)故障時,整個網(wǎng)絡的信息可能全部丟失,造成嚴重后果。此外,局部地區(qū)的擁塞可能擴散至基站,影響基站接收其他節(jié)點的數(shù)據(jù)。后端故障主要源于軟件故障或黑客入侵。黑客入侵時,后端決策系統(tǒng)接收到錯誤的指令,造成整個網(wǎng)絡的故障。需要采取相應的安全措施來預防黑客入侵。
3.1.4 基于區(qū)域
基于故障所影響的區(qū)域可分為局部故障與全局故障。局部故障表現(xiàn)為一個或多個節(jié)點受到故障影響。關(guān)鍵節(jié)點受到影響并進一步影響到整個網(wǎng)絡時,即稱為全局故障。如果沒有采取適當?shù)墓收显\斷與故障恢復措施,局部故障可能演變成全局故障。如區(qū)域性蟲害爆發(fā)導致區(qū)域內(nèi)SIL-IoTs節(jié)點網(wǎng)絡故障,如果不快速調(diào)整網(wǎng)絡拓撲結(jié)構(gòu),蟲害爆發(fā)區(qū)域鄰居節(jié)點可能受到鏈路擁塞、多節(jié)點重復發(fā)包等影響,導致能量快速下降,再擴散至更大范圍,最后迫使SIL-IoTs全局故障。
實際故障類型往往不是用這四種特征下的某一個故障類型描述的,而是基于這四種特征進行精準地描述。例如,某SIL-IoTs節(jié)點A電池損壞,由于其具有組件損壞及永久無法發(fā)送數(shù)據(jù)的特征,可將其稱為永久性節(jié)點硬故障。如果沒有好的拓撲控制方法及備份路由,A節(jié)點的上一跳節(jié)點B 重復的向故障節(jié)點A發(fā)包,但是A節(jié)點無法成功收包,此時節(jié)點B與節(jié)點A之間又存在網(wǎng)絡故障。由于短時間能耗異常,當B節(jié)點電量耗盡時,其狀態(tài)也為永久性節(jié)點硬故障。若B節(jié)點的鄰居節(jié)點C原本通過B節(jié)點發(fā)送數(shù)據(jù)包,但當B節(jié)點出現(xiàn)故障時暫時未能發(fā)送成功,隨后通過其他無故障節(jié)點成功發(fā)送數(shù)據(jù)包,則C節(jié)點為暫時性軟故障。此外,若A節(jié)點和B節(jié)點負責多個節(jié)點的數(shù)據(jù)轉(zhuǎn)發(fā)時,則此時與A節(jié)點和B節(jié)點關(guān)聯(lián)區(qū)域存在局部網(wǎng)絡故障。進一步影響全局時,則為全局網(wǎng)絡故障。
上述提到的是單個原因(某SIL-IoTs節(jié)點A電池損壞)造成的多種故障(節(jié)點A、B以及C均存在故障),還存在多種原因造成的多種故障,如復合型故障。復合型故障是多種故障同時發(fā)生的特殊故障,也是WSNs故障診斷的難點。在SIL-IoTs中,復合型故障包括但不限于:節(jié)點網(wǎng)絡故障以及蟲害爆發(fā)導致的臨時性區(qū)域節(jié)點無法傳輸數(shù)據(jù),兩種故障導致的結(jié)果類似,同時發(fā)生時難以診斷;節(jié)點軟故障與網(wǎng)絡故障同時發(fā)生,此時部分存在軟故障的節(jié)點因為網(wǎng)絡故障無法將數(shù)據(jù)傳輸?shù)胶笈_,因而只能檢測出網(wǎng)絡故障;太陽能殺蟲燈燈管、高壓電網(wǎng)或風扇故障時,若同時發(fā)生節(jié)點軟故障導致殺蟲數(shù)據(jù)異常,此時需要利用不同組件對不同參數(shù)進行診斷,否則難以診斷故障類型。因此,調(diào)研目前WSNs中現(xiàn)有的故障診斷方法以判斷其是否適用于以及如何應用于SIL-IoTs尤為重要。
3.2 WSNs故障診斷研究方法
WSNs故障診斷一般分為四步:檢測、孤立、鑒別和恢復[24],這四步也適用于SIL-IoTs故障診斷。首先檢測SIL-IoTs是否存在故障。當存在故障時,需要使用診斷方法定位故障位置并鑒別故障類型。隨后將故障節(jié)點或故障鏈路孤立以保證無故障部分正常運行。最后依據(jù)故障類型進行針對性故障恢復,保證SIL-IoTs正常運行。此外,在發(fā)生故障時,一般會采取故障容錯機制,快速隔離故障保證WSNs的正常運行[25]?;诠收显\斷的觸發(fā)方式可將其分為主動與被動兩類。主動觸發(fā)是一種節(jié)點或基站會定期檢測網(wǎng)絡狀態(tài)的故障診斷方式,而被動觸發(fā)則是一種當節(jié)點或網(wǎng)絡狀態(tài)不符合預設情況時再觸發(fā)故障診斷方法的診斷方式?;谶@兩種觸發(fā)方式和不同的應用背景及約束條件,如網(wǎng)絡密度、時效性要求、能耗要求、節(jié)點計算能力等,目前已研究出多種類型的WSNs故障診斷方法。根據(jù)這些方法的特性,將其分為以下6類方法:統(tǒng)計方法、概率方法、層次路由方法、機器學習方法、拓撲控制方法和移動基站方法。表2為近年經(jīng)典故障診斷研究方法的分類情況。
3.2.1 統(tǒng)計方法
統(tǒng)計方法通過建立模型,運用統(tǒng)計指標對數(shù)據(jù)進行檢驗,當結(jié)果不符合檢驗時,標記為故障樣本,并進一步根據(jù)故障樣本的離群程度、方差和標準差指標等對其進行故障分類。Panda和Khilar[28]提出了一種基于改進三西格瑪(3sigma)故障自診斷方法,每個節(jié)點收集一跳鄰居節(jié)點的數(shù)據(jù)并通過3sigma檢驗觀察自身是否存在硬故障或永久性故障。此方法通過節(jié)點自身進行故障診斷,因此要求節(jié)點有一定的存儲與計算能力。當節(jié)點數(shù)量較少時,此種方法不適用。Jiang[26]提出了一種改進的分布式故障診斷方法。當超過一半的鄰居節(jié)點與目標節(jié)點數(shù)據(jù)的差值超過閾值時,將節(jié)點標記為可能故障,用同樣的方法標記網(wǎng)絡中所有節(jié)點。然后判斷目標節(jié)點中初始檢測狀態(tài)為正常的鄰居節(jié)點是否有一半超過閾值,如果是則確定目標節(jié)點故障。當目標節(jié)點附近沒有鄰居節(jié)點或所有鄰居節(jié)點均標記為可能故障時,如果目標節(jié)點初始檢測狀態(tài)為可能故障,則目標節(jié)點標記為故障。此方法降低了統(tǒng)計方法對鄰居節(jié)點的依賴性,可用于節(jié)點稀疏的WSNs中。但是此類方法為主動診斷方法,會造成較高的能量損耗。因此,Jin等[29]提出了一種基于自回歸模型與Kuiper檢驗的被動故障診斷方法?;诋斈硹l路徑中的節(jié)點故障時,其他節(jié)點會選擇新的路徑并且通信時間會增加的特點,通過Kuiper檢驗來檢測異常,從而判斷是否存在故障。
統(tǒng)計方法大多依據(jù)目標節(jié)點與鄰居節(jié)點值的差異進行診斷,是一種基于節(jié)點的分布式故障診斷方案。當節(jié)點處于邊緣地區(qū),沒有足夠的鄰居節(jié)點參與計算,或是鄰居節(jié)點也存在故障時,此類故障診斷方法的正確性無法得到保證。此外,此類方法大多基于節(jié)點進行故障診斷,權(quán)衡節(jié)點能量消耗與故障診斷率是另一大挑戰(zhàn)。由于SIL-IoTs電池可充電、有一定計算和存儲能力,因此部署于節(jié)點處的統(tǒng)計方法十分適用,特別是節(jié)點暫時性與間歇性等依靠數(shù)據(jù)長期波動趨勢進行分析的故障。
3.2.2 概率方法
概率方法將故障診斷問題當作一個分類概率模型。Lau等[27]提出了一種基于樸素貝葉斯框架的集中式硬件故障檢測方法。在基站分析收集到的端到端傳輸時間數(shù)據(jù),判斷故障概率是否大于正常概率。如果是,則判定原路徑有節(jié)點故障,再選取近期多次數(shù)據(jù)傳輸時間數(shù)據(jù)進行評估。此方法在無擁塞網(wǎng)絡中可以有效監(jiān)測網(wǎng)絡故障,并給出可疑故障節(jié)點,但無法檢測邊緣地區(qū)的節(jié)點。Peng和Chow[30]提出了一種鄰域隱藏條件隨機域法來確定傳感器間的隱藏狀態(tài)。這種方法利用信號強度與信號延遲來估計不同故障后驗概率,以此確定WSNs的健康狀況。此方法可用于不同通信條件與節(jié)點數(shù)量場景中。Liu等[35]將工業(yè)WSNs中的故障節(jié)點識別問題轉(zhuǎn)化為軌跡提取問題。通過概率模型的在線學習,將感知節(jié)點分布變成概率值分布模式。根據(jù)生成的概率值分布軌跡,進行模式匹配與時空約束檢查,以識別故障節(jié)點。
概率方法大多不能鑒別故障的類別。此外,因為主要使用信號強度、信號延遲等參數(shù)進行故障診斷,因此難以獲取故障節(jié)點的數(shù)量,只能判斷存在故障的路徑及估計路徑丟失節(jié)點的情況。與統(tǒng)計方法類似,部署于節(jié)點的概率方法也適用于SIL-IoTs故障診斷,特別是前期的故障檢測與孤立。
3.2.3 層次路由方法
層次路由是一種將節(jié)點分為多個簇,每個簇的簇頭節(jié)點(Cluster Head node,CH)收集簇內(nèi)節(jié)點的信息,通過CH直接上傳數(shù)據(jù)到基站或多跳CH上傳數(shù)據(jù)到基站的數(shù)據(jù)傳輸方式[40,41]。層次路由故障診斷方法也是通過CH對簇內(nèi)成員進行診斷[42]。Jassbi和Moridi[34]采用混合節(jié)能分布式層次路由方法(Hybrid Energy-Efficient Distributed clustering,HEED)進行分簇,采用加權(quán)中值法對簇內(nèi)節(jié)點進行檢測。當CH出現(xiàn)故障時,使用提前選取的簇內(nèi)備份CH進行數(shù)據(jù)傳輸與故障檢測工作。Moridi等[39]提出一種基于簇的多路徑故障容錯算法,對WSNs中的節(jié)點分簇后,選擇一個備份節(jié)點提高CH節(jié)點容錯性。當簇內(nèi)數(shù)據(jù)傳輸時,通過假設檢驗和簇內(nèi)投票的方式檢測節(jié)點的故障。最后根據(jù)剩余能量、跳數(shù)、傳播速度和可靠性參數(shù)選擇最優(yōu)傳輸路徑。該方法可以有效降低丟包率,提升數(shù)據(jù)準確性。
層次路由方法比其他通過普通節(jié)點進行自診斷的方法更加簡單有效,在診斷故障后還可通過改變網(wǎng)絡路由保障WSNs的可靠性。但是,由于多輪的CH選取,層次路由方法增加了WSNs的通信與能量開銷。此外,由于CH依然通過鄰居節(jié)點數(shù)據(jù)判斷目標節(jié)點故障狀態(tài),當簇內(nèi)大多數(shù)節(jié)點出現(xiàn)故障導致數(shù)據(jù)異常時,正常節(jié)點反而可能被誤診為故障節(jié)點。層次路由方法適用于較大規(guī)模的SIL-IoTs部署情況,其分簇進行故障診斷的方式能快速檢測節(jié)點軟故障與硬故障。此外,層次路由方法亦適用于SIL-IoTs故障容錯方案設計,保障其在發(fā)生故障時不受影響。
3.2.4 機器學習方法
監(jiān)督學習方法是機器學習方法在WSNs故障診斷領(lǐng)域中主要的應用。監(jiān)督學習方法通過大量有標簽的歷史數(shù)據(jù)訓練故障診斷模型,利用目標函數(shù)不斷地調(diào)整模型參數(shù),直到模型能有效地檢測并分類故障。Zhao等[36]采用半監(jiān)督學習方法對故障傳感器節(jié)點進行分類,還引入了一種基于局部核密度估計的標簽傳播機制。此方法考慮到基站收集的數(shù)據(jù)會出現(xiàn)丟包現(xiàn)象,用半監(jiān)督核密度估計方法估計丟包數(shù)據(jù)的類標簽,以此分類故障并構(gòu)造訓練集。Javaid等[37]根據(jù)數(shù)據(jù)特征將故障分為偏移故障(傳感器校準不佳)、增益故障(在特定時間段內(nèi)數(shù)據(jù)變化率不符合規(guī)律)、卡死故障(數(shù)據(jù)長期為0)和超過范圍(有正常讀數(shù)但超出正常范圍),提出了一種基于信任函數(shù)的決策融合算法,通過增強支持向量機、增強K近鄰、增強極限學習機和增強遞歸極限學習機進行組合運算,以此分類故障。
機器學習方法需要設備具有較高的計算性能,因此大多在基站或后臺運行,是一種集中式處理方案。盡管此類方法在故障診斷上有良好的檢測率,但其在后臺運行的特點導致不能快速的發(fā)現(xiàn)故障并進行恢復。此外,該方法依賴于大量數(shù)據(jù)建立模型,獲得較精確的分類結(jié)果,因此多用于間歇性與暫時性節(jié)點故障中。對于SIL-IoTs而言,機器學習方法可部署于基站或部署輕量級算法于節(jié)點處,結(jié)合統(tǒng)計方法檢測節(jié)點間歇性與暫時性故障,利用新數(shù)據(jù)不斷更新模型,對SIL-IoTs的野外環(huán)境變化有較大的容忍度。
3.2.5 拓撲控制方法
WSNs中的故障有可能改變網(wǎng)絡的拓撲結(jié)構(gòu)。如節(jié)點剩余能量較低無法承擔數(shù)據(jù)轉(zhuǎn)發(fā)任務時,在平面路由中其他節(jié)點將尋找別的傳播路徑,在層次路由中簇內(nèi)會喚醒備份節(jié)點替代此節(jié)點繼續(xù)執(zhí)行任務。O?ner等[31]提出了一種基于拓撲結(jié)構(gòu)的故障定位方法。通過基站將網(wǎng)絡拓撲以圖形表示,包含WSNs內(nèi)的故障信息?;诖私o每個節(jié)點分配一個可疑度得分,得分越高,故障概率越大。Sulieman和Gitlin[33]提出了一種基于分集技術(shù)與三角網(wǎng)編碼組合的WSNs網(wǎng)絡故障診斷策略。該方法通過構(gòu)建冗余路徑,快速替代發(fā)生鏈路故障的路徑,可以有效地節(jié)省能量消耗并快速的調(diào)整拓撲結(jié)構(gòu)。但k個目標節(jié)點中發(fā)生n個鏈路故障時,至少需要kn+n個冗余鏈路。
拓撲控制方法的目的是降低故障發(fā)生時WSNs的能量消耗與帶寬損失。拓撲控制方法在網(wǎng)絡故障與故障定位方面有較好的性能表現(xiàn),對于其他故障暫未有相關(guān)性研究。在SIL-IoTs中,拓撲控制方法可以有效診斷網(wǎng)絡故障并重構(gòu)路由,是SIL-IoTs不可缺少的故障診斷策略。
3.2.6 移動基站方法
數(shù)據(jù)從節(jié)點傳輸?shù)交居幸欢ǖ臅r延性,因此WSNs節(jié)點數(shù)量較大時故障診斷與故障恢復效率降低。此外,由網(wǎng)絡故障導致的拓撲結(jié)構(gòu)變化也為網(wǎng)絡故障診斷增加了難度。Chanak等[32]提出了一種基于移動基站的分布式故障診斷方法。移動基站是一種配備無線收發(fā)器的移動機器人或車輛,其移動到網(wǎng)絡中的不同區(qū)域通過單跳通信的方式來診斷附近傳感器的軟硬件狀態(tài),有效提高了網(wǎng)絡的故障檢測精度。Fissaoui等[38]提出了一種基于故障容錯與能量有效性的分布式WSNs數(shù)據(jù)融合算法。該方法利用移動代理在傳感器節(jié)點間的遷移進行數(shù)據(jù)收集,規(guī)劃移動代理的路徑與節(jié)點失效時的備用路徑,降低了節(jié)點能耗與數(shù)據(jù)傳輸時延。
移動基站方法能夠有效地提高網(wǎng)絡的故障檢測精度,提高故障檢測與恢復的實時性,降低節(jié)點的能量消耗。目前移動基站的主要研究問題在于檢測區(qū)域劃分與檢測路徑優(yōu)化。此外,由于移動基站方法需要自主移動的機器人或車輛,并且提前規(guī)劃好路徑,因此對應用場景的要求較高。在SIL-IoTs中,可作為移動基站的有無人收割機、植保無人機等具有移動作業(yè)特性的農(nóng)機裝備。盡管移動基站方法在故障檢測率、時延性方面均有較好效果,但SIL-IoTs故障診斷受無人收割機、植保無人機等作業(yè)路徑、工作時長、作業(yè)區(qū)域等影響較大,能否有效結(jié)合是一個未知數(shù)。
如圖4所示,SIL-IoTs應用于大田農(nóng)業(yè)、禽畜養(yǎng)殖、茶園種植等場景中(以藍色字體表示),在不同場景中可能存在多種無線傳感設備與SIL-IoTs相連(以紅色字體表示),通過無線通信設備進行數(shù)據(jù)傳輸(以橙色虛線表示)。在此種復雜的SIL-IoTs場景中,使用單種故障診斷方法難以取得良好效果。對于部署在后臺的故障診斷方法(如概率方法、機器學習方法、拓撲控制方法,通過后臺分析接收到的全局信息進行故障診斷),由于后臺強大的計算與存儲能力,以及從SIL-IoTs節(jié)點將數(shù)據(jù)經(jīng)過多跳鏈路傳輸?shù)胶笈_存在時延的特點,因此更適用于處理時效性要求不高、較難診斷的故障。對于部署在SIL-IoTs節(jié)點的故障診斷方法(如統(tǒng)計方法、層次路由方法,通過節(jié)點自身時間相關(guān)性與鄰居節(jié)點空間相關(guān)性進行故障診斷),由于節(jié)點有限的計算與存儲能力,以及不需要多跳傳輸數(shù)據(jù)的特點,因此更適用于時效性要求較高、較易診斷的故障。其中故障診斷的時效性指故障出現(xiàn)到故障解決的時間。
移動基站方法可以綜合部署于后臺及部署于節(jié)點的故障診斷方法的優(yōu)點,但對作為基站的載體要求較高。此外,衛(wèi)星遙感數(shù)據(jù)、無人機數(shù)據(jù)等可用于故障診斷輔助決策或驗證故障診斷正確性。如某殺蟲燈殺蟲計數(shù)值持續(xù)較低,通過無人機航拍數(shù)據(jù)可觀測實際蟲情,借此輔助判斷是燈管故障或是節(jié)點軟故障。
3.3 SIL-IoTs故障診斷策略
對于SIL-IoTs而言,合適的故障診斷策略直接關(guān)系到故障診斷的準確率與效率,因此選擇合適的故障診斷策略十分重要。
從行為方面,可將故障診斷分為主動型診斷與被動型診斷策略。主動型診斷通過用戶提出診斷指令,或WSNs定期執(zhí)行相關(guān)診斷程序,多基于基站進行,可精細地排查SIL-IoTs中潛在的故障。被動型診斷通過預設參數(shù)閾值等,在CH、中繼節(jié)點或邊緣計算節(jié)點等進行診斷,多基于節(jié)點自身,可及時檢測出SIL-IoTs中影響較大的故障。
從監(jiān)測類型方面,可將故障診斷分為連續(xù)診斷、定期診斷、直接診斷與間接診斷。連續(xù)診斷即進行實時性診斷,需要消耗較多能量,但能及時檢測故障,適用于產(chǎn)值較高的場景,如茶園或畜牧養(yǎng)殖。定期診斷即設定故障診斷周期,達到觸發(fā)條件時即開始診斷,隨后休眠直至達到下一個觸發(fā)條件,適用于絕大多數(shù)SIL-IoTs場景。直接診斷即通過現(xiàn)場觀測方式進行經(jīng)驗性評估,如維護人員現(xiàn)場觀察、測電筆檢測方式。間接診斷即通過相關(guān)性較強的數(shù)據(jù)等信息判斷是否存在故障,基于WSNs的故障診斷均為間接診斷。
此外,根據(jù)故障診斷方法在SIL-IoTs系統(tǒng)結(jié)構(gòu)中不同層中執(zhí)行的特點,可將故障診斷分為集中式、分布式以及混合式三種策略。其中集中式策略將數(shù)據(jù)包傳輸至后臺,由后臺對所有節(jié)點及鏈路進行故障診斷,具有全局檢錯率高、時延高的特點。由于后臺收集到的歷史數(shù)據(jù)充足,因此概率方法、機器學習方法等對數(shù)據(jù)有較高依賴的方法更為適用。此外,由于集中式策略能獲得全局拓撲信息,因此也適用于拓撲控制方法,根據(jù)路由變化情況快速定位故障。分布式策略則將故障診斷方法部署于SIL-IoTs節(jié)點或邊緣節(jié)點端,通過節(jié)點自身或鄰居節(jié)點互相監(jiān)聽的方式進行故障診斷,具有局部檢錯率高、時延低的特點。統(tǒng)計方法可有效利用節(jié)點自身數(shù)據(jù)的時間相關(guān)性與鄰居節(jié)點之間的空間相關(guān)性進行統(tǒng)計檢驗。此外,層次路由方法利用簇頭整合簇內(nèi)節(jié)點信息的機制,采用簇內(nèi)投票等方式可檢測簇內(nèi)節(jié)點故障,因此也屬于分布式方法?;旌鲜浇Y(jié)合了集中式與分布式的特點,是一種更為有效的故障診斷策略。如移動基站方法可在基站移動過程中對所在區(qū)域一跳鄰居節(jié)點進行分布式故障診斷,又可利用在移動路徑中已獲得的節(jié)點信息進行集中式故障診斷。多種故障診斷策略與方法關(guān)系如圖5所示。
基于SIL-IoTs各種故障類型在WSNs中表現(xiàn),應當采取的故障診斷策略如表3所示。WSNs主要通過數(shù)據(jù)異常及網(wǎng)絡通信異常檢測故障,所以對于后臺數(shù)據(jù)異常、部分節(jié)點異常、整個網(wǎng)絡通信異常,均可通過現(xiàn)有WSNs故障診斷方法對SIL-IoTs進行故障檢測與故障分類,繼而進行故障恢復。對于硬故障或長時間未恢復的軟故障,如燈管兩端發(fā)紅但不亮,需要安排維護人員及時現(xiàn)場檢修。
在相應的故障診斷方法與策略的基礎(chǔ)上,選擇合適的軟件工具對SIL-IoTs進行調(diào)試也十分重要。目前已有很多學者研發(fā)了WSNs故障診斷的調(diào)試工具,這些工具監(jiān)控的對象包括流量狀態(tài)、節(jié)點狀態(tài)以及全局狀態(tài)[43]。流量監(jiān)控多使用機器學習算法來分析并跟蹤數(shù)據(jù)包,以此檢測網(wǎng)絡故障;節(jié)點狀態(tài)監(jiān)控工具通過收集每個節(jié)點的信息(如狀態(tài),事件跟蹤)以及節(jié)點間交互影響,幫助用戶分析故障;全局狀態(tài)監(jiān)控結(jié)合多個節(jié)點的信息以發(fā)現(xiàn)于診斷故障。對于表3中不同的故障現(xiàn)象,如后臺數(shù)據(jù)異常,可利用Ramanathan等[44]提出的可檢測并定位網(wǎng)絡中節(jié)點崩潰、重啟、無線路由、鄰居缺失和路由失效的故障監(jiān)測工具Sympathy進行調(diào)試。對于部分節(jié)點通信異??衫肶ang等[45]提出的綜合源代碼級無線網(wǎng)絡調(diào)試器Clairvoyant調(diào)試。開發(fā)人員通過無線連接到WSNs,通過終端、步進、監(jiān)視、回溯等命令檢測WSNs中的節(jié)點通信故障。對于整個網(wǎng)絡通信異??墒褂肦ingwald等[46]提出的一種可檢測節(jié)點意外重啟、孤立節(jié)點、分區(qū)網(wǎng)絡故障的故障檢測工具SNIF進行調(diào)試。對于未診斷出異常但卻實際存在異常情況,可考慮Khan等[47]提出的一種解決用于多個組件交互產(chǎn)生的復合故障的診斷工具Dustminer。此工具通過記錄WSNs中多種不同類型的事件,能自動分析日志并提取導致故障的事件序列。針對能量采集模塊,可有效診斷由于電量的間歇性變化導致的系統(tǒng)重置等間歇性故障的Energy-interference-free Debugger[48]亦可用于SIL-IoTs這種EH-WSNs中。
4 SIL-IoTs故障診斷潛在挑戰(zhàn)
李凱亮等[7]提出了四個SIL-IoTs關(guān)鍵問題,包括多約束條件下SIL節(jié)點部署、保障殺蟲燈基本工作時間的能量自適應控制策略、蟲害爆發(fā)區(qū)域精準定位技術(shù)和嚴重蟲害情況下殺蟲燈密集放電時段網(wǎng)絡數(shù)據(jù)抗干擾傳輸。這些關(guān)鍵問題可以概述為應用場景的特性,針對這些特性開展SIL-IoTs故障診斷研究存在以下挑戰(zhàn)。
(1) 殺蟲燈節(jié)點部署環(huán)境復雜。太陽能殺蟲燈被廣泛地應用于農(nóng)業(yè)的各種場景中,且在不同場景中有不同的數(shù)據(jù)采集和部署需求。根據(jù)實際需求部署的殺蟲燈節(jié)點數(shù)量與密度不一,這也增加了SIL-IoTs故障診斷的困難。然而目前尚未出現(xiàn)SIL-IoTs場景下的故障診斷方法研究,亟需研究出針對不同農(nóng)情的SIL-IoTs故障診斷方法。
此外,SIL-IoTs屬于能量采集-無線傳感網(wǎng)絡,基于能量有限的WSNs故障診斷與故障容錯技術(shù)不再適用,目前只有少量研究基于EH-WSNs的故障診斷與故障容錯方法[49,50],使用方法為層次路由與拓撲控制。當SIL-IoTs節(jié)點部署在丘陵山地時,所有節(jié)點的太陽能板單位時間采集到的能量存在差異,這也是SIL-IoTs故障診斷必須要解決的問題。只有不均等能量采集條件下的異構(gòu)WSNs故障診斷問題得到有效解決時,才能保證SIL-IoTs的可靠性。
(2) 節(jié)點任務沖突。SIL-IoTs不僅需要執(zhí)行殺蟲任務,同時還可能需要執(zhí)行采集并傳輸環(huán)境數(shù)據(jù)、土壤墑情、苗情等任務,一般情況下殺蟲任務優(yōu)先級最高。已驗證頻振式殺蟲燈高壓電網(wǎng)放電會對數(shù)據(jù)傳輸產(chǎn)生干擾,實驗場景如圖6所示[51]。當高壓電網(wǎng)頻繁放電時數(shù)據(jù)采集及傳輸任務勢必受到影響。除了通過硬件及外觀設計避免干擾之外,設計防止誤判的故障診斷策略,以及基于故障容錯策略(將執(zhí)行殺蟲任務的節(jié)點看作暫時性節(jié)點故障)的路由協(xié)議對保證數(shù)據(jù)傳輸實時性及保障基礎(chǔ)殺蟲任務尤為重要。
(3) 連續(xù)性區(qū)域節(jié)點無法傳輸數(shù)據(jù)。當區(qū)域性蟲害爆發(fā)時,一個或多個區(qū)域內(nèi)SIL-IoTs節(jié)點在不可控時間內(nèi)將處于無法傳輸數(shù)據(jù)狀態(tài)。一方面,殺蟲燈將優(yōu)先執(zhí)行殺蟲任務,區(qū)域性節(jié)點受到高壓電網(wǎng)放電干擾,難以完成數(shù)據(jù)傳輸任務。另一方面,蟲害爆發(fā)時,殺蟲燈持續(xù)執(zhí)行殺蟲任務,勢必消耗大量電量,蟲害過后,較低的電池電量易造成各種類型的WSNs故障。因此,需要在蟲害尚未大規(guī)模爆發(fā)時,通過被動故障診斷策略快速定位失效節(jié)點。同時對爆發(fā)區(qū)域周圍節(jié)點打分,在其低于一定閾值時,將節(jié)點標記為失效節(jié)點,選擇備用路由路徑?;诖吮U蟂IL-IoTs在惡劣環(huán)境下的可靠性。根據(jù)其需要檢驗及概率預測特性,可用統(tǒng)計方法與概率方法解決此類問題。
(4) 故障診斷方法失效。受到特殊因素的擾動,本來可正常工作的故障診斷方法可能無法有效的檢測本應檢測出的故障,或?qū)o故障情況診斷為有故障,造成故障診斷方法失效。如偶發(fā)性復合故障。在實際場景中,很難檢測出有所的故障,為發(fā)生概率極低且影響不大的故障專門設置診斷方法價值不高。發(fā)生概率低但影響較大的故障,則需要針對性的故障診斷策略來應對。如網(wǎng)絡故障的同時蟲害爆發(fā)導致區(qū)域性節(jié)點失效,此種情況需要監(jiān)測蟲害爆發(fā)區(qū)域鄰居節(jié)點的殺蟲統(tǒng)計數(shù)據(jù)、網(wǎng)絡拓撲結(jié)構(gòu)變化是否異常等信息來排查故障。
在非自診斷方法中,關(guān)鍵節(jié)點硬故障或網(wǎng)絡故障,且無備份節(jié)點能代替其在通信鏈路中的作用時故障診斷方法亦會失效。通過關(guān)鍵節(jié)點轉(zhuǎn)發(fā)數(shù)據(jù)的其他節(jié)點無法與基站連通,即使能在本地進行故障診斷,也無法將故障信息發(fā)送到后臺。如平面路由協(xié)議中,蟲害爆發(fā)區(qū)域在基站周圍時,靠近基站的關(guān)鍵節(jié)點優(yōu)先執(zhí)行殺蟲任務。此時外圍節(jié)點無法將數(shù)據(jù)傳輸?shù)交?,只能通過自診斷自恢復方式維持SIL-IoTs的正常運行。
此外,節(jié)點受惡意攻擊也會導致故障診斷方法失效。由于SIL-IoTs部署于野外,部署范圍大、難于監(jiān)管,SIL-IoTs易受到軟件與硬件的攻擊。其中軟件攻擊即黑客入侵SIL-IoTs節(jié)點,通過泛洪攻擊、女巫攻擊等方式使SIL-IoTs出現(xiàn)異常,進而無法工作。此類惡意攻擊方式會誤導SIL-IoTs故障診斷的判斷。如惡意節(jié)點導致拜占庭故障(存在部分難以檢測的惡意節(jié)點發(fā)送錯誤數(shù)據(jù)或指令),有效的故障容錯機制與安全機制可以保證網(wǎng)絡不受惡意節(jié)點影響,做出錯誤的判斷。硬件攻擊指SIL-IoTs節(jié)點中價值較高的組件(如太陽能板、電池)被盜或被破壞,此時后臺報此SIL-IoTs節(jié)點硬故障,但組件已被偷竊或破壞,故障診斷方法失去意義。
在這些故障診斷方法失效情形下,進行遠程故障診斷難以得到較好結(jié)果,特別是在不確定太陽能殺蟲燈組件故障還是傳感器節(jié)點硬故障時,需要維護人員現(xiàn)場檢修以排查故障。
5 總 ?結(jié)
SIL-IoTs是一種結(jié)合農(nóng)業(yè)場景與物聯(lián)網(wǎng)技術(shù)的新型物理農(nóng)業(yè)蟲害防治措施,而故障診斷方法則是保障SIL-IoTs可靠性、數(shù)據(jù)傳輸實時性、殺蟲效果的重要手段。本文介紹了太陽能殺蟲燈的研究現(xiàn)狀,探討了SIL-IoTs故障類型,分析了多種故障診斷方法在SIL-IoTs下的適用性,討論了SIL-IoTs場景下的故障診斷策略,并介紹了多種故障現(xiàn)象下適用的故障診斷工具,指出需要多種類型的故障診斷方法才能滿足SIL-IoTs場景下故障診斷需求。最后強調(diào)了SIL-IoTs場景下故障診斷存在的四個潛在挑戰(zhàn),這四個挑戰(zhàn)是開展SIL-IoTs故障診斷工作的主要難點,需要更多的學者關(guān)注此類問題,開展相關(guān)性研究。此外,由于SIL-IoTs為農(nóng)業(yè)物聯(lián)網(wǎng)典型應用,因此本研究可擴展至其它農(nóng)業(yè)物聯(lián)網(wǎng)中,并為這些農(nóng)業(yè)物聯(lián)網(wǎng)故障診斷提供參考。
參考文獻:
[1] 黃文江, 師越, 董瑩瑩, 等. 作物病蟲害遙感監(jiān)測研究進展與展望[J]. 智慧農(nóng)業(yè), 2019, 1(4): 1-11.
HUANG W, SHI Y, DONG Y, et al. Progress and prospects of crop diseases and pests monitoring by remote sensing[J]. Smart Agriculture, 2019, 1(4): 1-11.
[2] 陳昊楠, 徐翔, 鄧曉悅, 等. 單波長殺蟲燈對草地貪夜蛾誘殺效果初步評價[J]. 四川農(nóng)業(yè)科技, 2020(2): 41-42.
CHEN H, XU X, DENG X, et al. Preliminary evaluation of trapping effect of single long wave insecticidal lamp on Noctuidae in grassland[J]. Sichuan Agricultural Science and Technology, 2020(2): 41-42.
[3] 王向東. 改進型太陽能殺蟲燈對涼山州害蟲誘殺效果研究[J]. 西昌學院學報(自然科學版), 2020, 34(1): 9-13, 92.
WANG X. Study on effect of improved solar pest-killing lamp on trapping and killing field pests in liangshan[J]. Journal of Xichang University(Natural Science Edition), 2020, 34(1): 9-13, 92.
[4] 孫康, 王靜秋, 冷晟, 等. 基于物聯(lián)網(wǎng)的溫室環(huán)境監(jiān)控系統(tǒng)[J]. 測控技術(shù), 2019, 38(9): 118-121.
SUN K, WANG J, LENG S, et al. Monitoring and management system of greenhouse based on IoT[J]. Measurement & Control Technology, 2019, 38(9): 118-121.
[5] 黃蕊, 郭樹強, 趙紅茹. 基于無線傳感網(wǎng)絡的無人機噴藥沉積效果檢測[J]. 農(nóng)機化研究, 2019, 41(5): 206-209.
HUANG R, GUO S, ZHAO H. Detection of UAV spray deposit effect based on wireless sensor network[J]. Journal of Agricultural Mechanization Research, 2019, 41(5): 206-209.
[6] 徐凌翔, 陳佳瑋, 丁國輝, 等. 室內(nèi)植物表型平臺及性狀鑒定研究進展和展望[J]. 智慧農(nóng)業(yè), 2020, 2(1): 23-42.
XU L, CHEN J, DING G, et al. Indoor phenotyping platforms and associated trait measurement: Progress and prospects[J]. Smart Agriculture, 2020, 2(1): 23-42.
[7] 李凱亮, 舒磊, 黃凱, 等. 太陽能殺蟲燈物聯(lián)網(wǎng)研究現(xiàn)狀與展望[J]. 智慧農(nóng)業(yè), 2019, 1(3): 13-28.
LI K, SHU L, HUANG K, et al. Research and prospect of solar insecticidal lamps Internet of Things[J]. Smart Agriculture, 2019, 1(3): 13-28.
[8] 張磊. 殺蟲燈主要技術(shù)的發(fā)展分析[J]. 四川農(nóng)業(yè)農(nóng)機, 2016(4): 32-33.
ZHANG L. Development analysis of main technology of insecticidal lamp[J]. Sichuan Agriculture and Agricultural Machinery, 2016(4): 32-33.
[9] LAM B H, PHAN T T, VUONG L H, et al. Designing a brown planthoppers surveillance network based on wireless sensor network approach[J]. Computer Science, 2013.
[10] ELIOPOULOS P A, POTAMITIS I, KONTODIMAS D C. Estimation of population density of stored grain pests via bioacoustic detection[J]. Crop Protection, 2016, 85: 71-78.
[11] LOPEZ O, RACH M O, MIGALLON H, et al. Monitoring pest insect traps by means of low-power image sensor technologies[J]. Sensors, 2012, 12(11): 15801-15819.
[12] YANG F, SHU L, HUANG K, et al. A partition-based node deployment strategy in solar insecticide lamp internet of things[J]. IEEE Internet of Things Journal, 2020. doi: 10.1109/JIOT.2020.2996514.
[13] CHOUIKHI S, KORBI I E, GHAMRIDOUDANE Y, et al. A survey on fault tolerance in small and large scale wireless sensor networks[J]. Computer Communications, 2015, 69(69): 22-37.
[14] MORIDI E, HAGHPARAST M, HOSSEINZADEH M, et al. Fault management frameworks in wireless sensor networks: A survey[J]. Computer Communications, 2020, 155: 205-226.
[15] SWAIN R R, DASH T, KHILAR P M. A complete diagnosis of faulty sensor modules in a wireless sensor network[J]. Ad Hoc Networks, 2019, 93: 101924-101944.
[16] CHESSA S, SANTI P. Crash faults identification in wireless sensor networks[J]. Computer Communications, 2002, 25(14): 1273-1282.
[17] PANDA M, KHILAR P M. Distributed soft fault detection algorithm in wireless sensor networks using statistical test[C]// IEEE International Conference on Parallel Distributed & Grid Computing. Piscataway, New York, USA: IEEE, 2012.
[18] ELSAYED W, ELHOSENY M, SABBEH S, et al. Self-maintenance model for wireless sensor networks[J]. Computers and Electrical Engineering, 2017, 7: 99-812.
[19] HE W, QIAO P, ZHOU Z, et al. A new belief-rule-based method for fault diagnosis of wireless sensor network[J]. IEEE Access, 2018, 6: 9404-9419.
[20] PARADIS L, HAN Q. A survey of fault management in wireless sensor networks[J]. Journal of Network and Systems Management, 2007, 15(2): 171-190.
[21] YU M, MOKHTAR H, MERABTI M. A survey on fault management in wireless sensor networks[J]. IEEE Wireless Communications, 2008, 14(6): 13-19.
[22] 李昌熾, 王志勇. 佳多牌頻振式殺蟲燈的使用注意事項與維修方法[J]. 植物醫(yī)生, 2012, 25(6): 51-52.
LI C, WANG Z. Attention and maintenance of Jiaduo Frequency Vibration insecticidal lamp[J]. Plant Doctor, 2012, 25(6): 51-52.
[23] 宋文海, 李田澤, 喬家振, 等. TCT結(jié)構(gòu)光伏陣列故障檢測方法研究[J]. 電源技術(shù), 2019, 43(7): 1164-1167.
SONG W, LI T, QIAO J, et al. Research on fault detection method of TCT structured photovoltaic array[J]. Chinese Journal of Power Sources, 2019, 43(7): 1164-1167.
[24] BAE J, LEE M, SHIN C. A data-based fault-detection model for wireless sensor networks[J]. Sustainability, 2019, 11(21): ID 6171.
[25] SI S, WANG J, YU C, et al. Energy-efficient and fault-tolerant evolution models based on link prediction for large-scale wireless sensor networks[J]. IEEE Access, 2018, 6: 73341-73356.
[26] JIANG P. A new method for node fault detection in wireless sensor networks[J]. Sensors, 2009, 9(2): 1282-1294.
[27] LAU B C P, MA E W M, CHOW T W S. Probabilistic fault detector for Wireless Sensor Network[J]. Expert Systems With Applications, 2014, 41(8): 3703-3711.
[28] PANDA M, KHILAR P M. Distributed self fault diagnosis algorithm for large scale wireless sensor networks using modified three sigma edit test[J]. Ad Hoc Networks, 2015, 25: 170-184.
[29] JIN X, CHOW T W S, SUN Y, et al. Kuiper test and autoregressive model-based approach for wireless sensor network fault diagnosis[J]. Wireless Networks, 2015, 21(3): 829-839.
[30] PENG T, CHOW T W S. Wireless sensor-networks conditions monitoring and fault diagnosis using neighborhood hidden conditional random field[J]. IEEE Transactions on Industrial Informatics, 2016, 12(3): 933-940.
[31] O?NER C, BUCHMANN E, B?HM K. Identifying defective nodes in wireless sensor networks[J]. Distributed and Parallel Databases, 2016, 34(4): 591-610.
[32] CHANAK P, BANERJEE I, SHERRATT R S. Mobile sink based fault diagnosis scheme for wireless sensor networks[J]. Journal of Systems and Software, 2016, 119: 45-57.
[33] SULIEMAN N I, GITLIN R D. Ultra-reliable and energy efficient wireless sensor networks[C]// Wireless and Microwave Technology Conference. Piscataway, New York, USA: IEEE, 2018.
[34] JASSBI S J, MORIDI E. Fault tolerance and energy efficient clustering algorithm in wireless sensor networks: FTEC[J]. Wireless Personal Communications, 2019, 107(1): 373-391.
[35] LIU L, HAN G, HE Y, et al. Fault-tolerant event region detection on trajectory pattern extraction for industrial wireless sensor networks[J]. IEEE Transactions on Industrial Informatics, 2020, 16(3): 2072-2080.
[36] ZHAO M, TIAN Z, CHOW T W S. Fault diagnosis on wireless sensor network using the neighborhood kernel density estimation[J]. Neural Computing and Applications, 2019, 31(8): 4019-4030.
[37] JAVAID A, JAVAID N, WADUD Z, et al. Machine learning algorithms and fault detection for improved belief function based decision fusion in wireless sensor networks[J]. Sensors, 2019, 19(6): ID 1334.
[38] FISSAOUI M E, BENI-HSSANE A, SAADI M. Energy efficient and fault tolerant distributed algorithm for data aggregation in wireless sensor networks[J]. Journal of Ambient Intelligence and Humanized Computing, 2019, 10(2): 569-578.
[39] MORIDI E, HAGHPARAST M, HOSSEINZADEH M, et al. Novel fault-tolerant clustering-based multipath algorithm (FTCM) for wireless sensor networks[J]. Telecommunication Systems, 2020, 174: 411-424.
[40] HEINZELMAN W R. Energy-efficient communication protocol for wireless microsensor networks[C]// IEEE Computer Society. Piscataway, New York, USA: IEEE, 2000.
[41] LIN J, CHELLIAH P R, HSU M, et al. Efficient fault-tolerant routing in IoT wireless sensor networks based on bipartite-flow graph modeling[J]. IEEE Access, 2019, 7: 14022-14034.
[42] SWAIN R R, KHILAR P M, DASH T. Fault diagnosis and its prediction in wireless sensor networks using regressional learning to achieve fault tolerance[J]. International Journal of Communication Systems, 2018, 31(14): 3769-3786.
[43] RODRIGUES A, CAMILO T, SILVA J S, et al. Diagnostic tools for wireless sensor networks: A comparative survey[J]. Journal of Network and Systems Management, 2013, 21(3): 408-452.
[44] RAMANATHAN N, CHANG K, KAPUR R, et al. Sympathy for the sensor network debugger[C]// International Conference on Embedded Networked Sensor Systems. New York, NY, USA: ACM, 2005.
[45] YANG J, SOFFA M L, SELAVO L, et al. Clairvoyant: A comprehensive source-level debugger for wireless sensor networks[C]// International Conference on Embedded Networked Sensor Systems. New York, NY, USA: ACM, 2007.
[46] RINGWALD M, ROMER K, VITALETTI A, et al. Passive inspection of sensor networks[C]// Distributed Computing in Sensor Systems. Heidelberg, Berlin, Germany: Springer, 2007.
[47] KHAN M M, LE H K, AHMADI H, et al. Dustminer: Troubleshooting interactive complexity bugs in sensor networks[C]// International Conference on Embedded Networked Sensor Systems. New York, NY, USA: ACM, 2008.
[48] COLIN A, HARVEY G, LUCIA B, et al. An Energy-interference-free hardware-software debugger for intermittent energy-harvesting systems[C]// Architectural Support for Programming Languages and Operating Systems. New York, USA: ACM, 2016.
[49] YIN Z, LI F, SHEN M, et al. Fault-tolerant topology for energy-harvesting heterogeneous wireless sensor networks[C]// International Conference on Communications. Piscataway, New York: IEEE, 2015.
[50] ZHANG X, YAO G, DING Y, et al. An improved immune system-inspired routing recovery scheme for energy harvesting wireless sensor networks[J]. Soft Computing, 2017, 21(20): 5893-5904.
[51] video “Demo.” High voltage discharge exhibits severe effect on ZigBee-based device in solar insecticidal lamps Internet of Things[EB/OL]. (2020-01-13) [2020-06-08]. http://nljrc.pk.njau.edu.cn/index.php/demo-interference-sil_iots/.
Abstract: Solar insecticidal lamps Internet of Things (SIL-IoTs) is a novel physical agricultural pest control implement, which is an emerging paradigm that extends Internet of Things technology towards Solar Insecticidal Lamp (SIL). SIL-IoTs is composed of SIL nodes with functions of preventing and controlling of agricultural migratory pests with phototaxis feature, which can be deployed over a vast region for the purpose of ensuring pests outbreak area location, reducing pesticide dosage and monitoring agricultural environmental conditions. SIL-IoTs is widely used in agricultural production, and a number of studies have been conducted. However, in most current research projects, fault diagnosis has not been taken into consideration, despite the fact that SIL-IoTs faults have an adverse influence on the development and application of SIL-IoTs. Based on this background, this research aims to analyze the characteristics and challenges of fault diagnosis in SIL-IoTs, which naturally leads to a great number of open research issues outlined afterward. Firstly, an overview and state-of-art of SIL-IoTs were introduced, and the importance of fault diagnosis in SIL-IoTs was analyzed. Secondly, faults of SIL nodes were listed and classified into different types of Wireless Sensor Networks (WSNs) faults. Furthermore, WSNs faults were classified into behavior-based, time-based, component-based, and area affected-based faults. Different types of fault diagnosis algorithms (i.e., statistic method, probability method, hierarchical routing method, machine learning method, topology control method, and mobile sink method) in WSNs were discussed and summarized. Moreover, WSNs fault diagnosis strategies were classified into behavior-based strategies (i.e., active type and positive type), monitoring-based strategies (i.e., continuous type, periodic type, direct type, and indirect type) and facility-based strategies (i.e., centralized type, distributed type and hybrid type). Based on above algorithms and strategies, four kinds of fault phenomena: 1) abnormal background data, 2) abnormal communication of some nodes, 3) abnormal communication of the whole SIL-IoTs, and 4) normal performance with abnormal behavior actually were introduced, and fault diagnosis tools (i.e., Sympathy, Clairvoyant, SNIF and Dustminer) which were adapted to the mentioned fault phenomena were analyzed. Finally, four challenges of fault diagnosis in SIL-IoTs were highlighted, i.e., 1) the complex deployment environment of SIL nodes, leading to the fault diagnosis challenges of heterogeneous WSNs under the condition of unequal energy harvesting, 2) SIL nodes task conflict, resulting from the interference of high voltage discharge, 3) signal loss of continuous area nodes, resulting in the regional link fault, and 4) multiple failure situations of fault diagnosis. To sum up, fault diagnosis plays a vital role in ensuring the reliability, real-time data transmission, and insecticidal efficiency of SIL-IoTs. This work can also be extended for various types of smart agriculture applications and provide fault diagnosis references.
Key words: solar insecticidal lamp; Wireless Sensor Networks; agricultural Internet of Things; fault diagnosis; insect disaster