劉 倩,張向飛,丁永生,2,郝礦榮,2
(1.東華大學信息科學與技術學院,上海 201620;2.數(shù)字化紡織服裝技術教育部工程研究中心,上海 201620)
物聯(lián)網是通過射頻識別、全球定位系統(tǒng)、激光掃描器等信息傳感設備,按約定協(xié)議,把任何物品與互聯(lián)網連接起來,進行信息交換和通信,以實現(xiàn)智能化識別、定位、跟蹤、監(jiān)控和管理的一種網絡[1-3]。物聯(lián)網為農田信息獲取提供了嶄新的思路,將傳感器節(jié)點布設于農田等目標區(qū)域,網絡節(jié)點大量實時、精確地采集溫度、濕度、光照、氣體濃度等環(huán)境信息,這些信息在數(shù)據匯聚節(jié)點匯集,網絡對匯集的數(shù)據進行分析,幫助生產者有針對性地投放農業(yè)生產資料等,從而更好地實現(xiàn)耕地資源的合理高效利用和農業(yè)現(xiàn)代化精準管理,推進農業(yè)生產的高效管理,提升農業(yè)生產效能[4-5]。面向農業(yè)物聯(lián)網的多環(huán)境信息融合的監(jiān)測判別就是在此基礎上的一次實踐。
信息融合是利用已有的知識經驗來處理從未知世界得到的來自不同領域的數(shù)據,強調通過分析來自多個傳感器或多個數(shù)據源的信息對目標進行識別估計或做出某種綜合判斷。數(shù)據挖掘主要是通過統(tǒng)計或人工智能的方法從大量原始數(shù)據集合中推測尋找數(shù)據間復雜的潛在關系或蘊涵的模型。本文采用模糊推理方法對采集的環(huán)境信息進行決策級的融合分類,并引入由關聯(lián)規(guī)則挖掘所得的知識庫,定量地分析多種環(huán)境信息的協(xié)調關系,從而進行多環(huán)境信息融合的監(jiān)測判別,這不僅是監(jiān)測農業(yè)環(huán)境的有效手段,而且可為動態(tài)地控制環(huán)境的各項指標提供依據。
基于多環(huán)境信息融合的監(jiān)測判別關鍵是采用合適的分類融合算法,將采集來的多種環(huán)境信息與知識庫中的典型關聯(lián)規(guī)則相結合,進行決策級融合分類以反映農田環(huán)境的狀態(tài),同時建立和諧的人機交互環(huán)境,從而對農田的環(huán)境狀況進行監(jiān)測控制。
圖1為面向農業(yè)物聯(lián)網的多環(huán)境信息融合的監(jiān)測判別模型框架,通過分布在農田的環(huán)境信息傳感器采集各種環(huán)境信息,將之與從數(shù)據庫等媒介中挖掘出的典型關聯(lián)規(guī)則傳輸?shù)街醒胩幚砟K進行信息融合,最后將監(jiān)測結果送到用戶交互界面。
圖1 多環(huán)境信息融合監(jiān)測判別模型框架
關聯(lián)規(guī)則的挖掘問題可形式化地描述如下:設I= {i1,i2,…,im}是項集合,T= {t1,t2,…,tm}是事務集合,其中Ati∈I(1≤i≤n)。A?B稱為T中的關聯(lián)規(guī)則,其中A?I,B?I,A∩B=C。在事務集合T中,包含A∪B的事務占全部事務的百分比稱為T中關聯(lián)規(guī)則A?B的支持度記為support(A?B)=P(A∪B);包含A∪B事務占包含A事務的百分比稱為T中關聯(lián)規(guī)則A?B的置信度,記為 confidence(A?B)=P(A|B)。設min_sup是最小支持度閾值,min_conf是最小置信度閾值。若事務集合T中的關聯(lián)規(guī)則A?B同時滿足support=(A?B)≥min_sup和confidence=(A?B)≥min_conf,則A?B稱為T中的強關聯(lián)規(guī)則。包含k個項的集合稱為k-項集,如果項集滿足最小支持度,則稱其為頻繁項集,頻繁k-項集的集合通常記作Lk。
目前有多種產生頻繁項集的算法,最著名的是Agrawal等[6-8]提出的 Apriori算法。Apriori算法使用逐層搜索的迭代方法,k-項集用于搜索 (k+1)-項集,利用“任意頻繁項集的子集都是頻繁項集,任意弱項集的超集都是弱項集”這一性質掃描事務集合。
Apriori算法由兩部分組成。首先使用候選項集找出頻繁項集,基于頻繁k-項集Lk,采用自連接方法產生所有可能頻繁的 (k+1)-項集,即候選 (k+1)-項集Ck+1,再掃描1次事務集合,統(tǒng)計Ck+1中每個候選的支持度,并與最小支持度閾值相比,形成頻繁 (k+1)-項集Lk+1;接著由頻繁項集產生關聯(lián)規(guī)則,對于每個頻繁項集L,產生L的所有非空子集,對于L的每個非空真子集Lu,如果L的支持度除以Lu的支持度大于等于最小置信度閾值,則輸出規(guī)則Lu? (L-Lu)。
模糊推理是采用模糊邏輯并實現(xiàn)由給定的輸入到輸出的映射過程,具體表現(xiàn)為運用模糊語言規(guī)則,對已知的模糊判斷或模糊命題進行推導而得出新的近似模糊判斷結論的過程。模糊推理步驟主要包括:輸入變量模糊化;在模糊規(guī)則前件中應用模糊算子;根據模糊蘊含運算由前提推斷結論;模糊合成;輸出變量反模糊化[9]。
利用模糊推理可針對復雜系統(tǒng)建立擁有輸入輸出數(shù)據的模糊推理系統(tǒng),同時還可與其他人工智能技術相結合形成智能融合型模糊推理系統(tǒng)。模糊推理信息融合過程為模擬人腦處理不確定性信息的過程,其基本思想可描述為:采用模糊集和隸屬函數(shù)描述多傳感器所獲信息;根據不同領域專家知識建立不同的模糊規(guī)則;利用各種模糊邏輯算子在進行模糊推理過程中實現(xiàn)多傳感器信息的融合處理;推導出模糊推理信息融合的最終結果。
從農業(yè)數(shù)據庫中獲取10組環(huán)境信息與專家監(jiān)測判別指標的分析數(shù)據 (表1)。由于所有的分析數(shù)據均為非離散的數(shù)值屬性,故應先進行離散化處理 (表2)。預處理后的數(shù)據如表3所示。
表1 歷史數(shù)據
表2 各因子離散化等級
表3 預處理后的數(shù)據
設min_sup=20%,min_conf=60%。根據Apriori算法編寫程序,搜索原始數(shù)據表,得到滿足最小支持度閾值和最小置信度閾值的關聯(lián)規(guī)則(表4)。這些關聯(lián)規(guī)則的左邊為各種環(huán)境信息所對應的等級值,右邊為監(jiān)測結果所對應的等級值。
表4 關聯(lián)規(guī)則挖掘結果
根據表2的各因子離散化等級,確定各種環(huán)境信息和監(jiān)測結果的隸屬函數(shù),為保證基于模糊推理的信息融合的實時性和快速性,采用三角形隸屬函數(shù)。接著,將表4的關聯(lián)規(guī)則挖掘結果轉換成相應的模糊規(guī)則,如關聯(lián)規(guī)則A1C1?E3可解釋為當溫度信息屬于等級1,CO2濃度屬于等級1時,監(jiān)測結果屬于等級3,此時模糊規(guī)則可表示為If(A is A1)and(C is C1)then(E is E3)。
最后對基于模糊推理信息融合的多環(huán)境信息融合監(jiān)測判別進行仿真研究,通過MATLAB語言編程來實現(xiàn)這一過程。用addvar函數(shù)定義基于模糊推理信息融合的各種環(huán)境信息的輸入變量和監(jiān)測結果的輸出變量,用addmf函數(shù)定義模糊推理系統(tǒng)輸入、輸出變量的隸屬函數(shù),用 rulelist函數(shù)和addrule函數(shù)來定義模糊規(guī)則,至此,基于多環(huán)境信息融合監(jiān)測判別的模糊系統(tǒng)已經設計完成。此外,還可利用showrule函數(shù)查看模糊推理系統(tǒng)的模糊規(guī)則,利用fuzzy函數(shù)調用模糊推理系統(tǒng)的圖形用戶界面,進行信息融合的控制決策仿真,在圖形用戶界面下,還可以查看模糊推理的過程示意圖。通過命令窗口,利用evalfis函數(shù)進行實時仿真,將實際監(jiān)測結果與仿真所得信息融合結果比較 (表5),5組數(shù)據中僅1組結果有較大偏差,正確率達80%以上。
本研究探討了將模糊推理的方法運用到基于多環(huán)境信息融合的監(jiān)測判別,并引入關聯(lián)規(guī)則挖掘,將基于典型數(shù)據挖掘出的關聯(lián)規(guī)則轉換成相應的模糊規(guī)則后,監(jiān)測識別率有明顯的提高。從關聯(lián)規(guī)則挖掘到信息融合分類,再到最后的監(jiān)測判別,其中的Apriori算法在產生關聯(lián)規(guī)則的同時,由于要多次掃描數(shù)據庫并產生大量的候選集,故在算法的計算復雜度方面還有待改進;其次,測試數(shù)據量有待進一步增加,從而使得測試結果更具精確性和說服力;最后,在多環(huán)境信息融合監(jiān)測判別模型框架中,關聯(lián)規(guī)則挖掘之前的異構數(shù)據庫數(shù)據集成和信息抽取,以及模糊推理信息融合后的人機交互界面均有待進一步設計,從而完成整個系統(tǒng)的集成。
表5 實際監(jiān)測結果與信息融合結果的比較
[1] Teixeira L,Hachem S,Issarny V,et al.Service oriented middleware for the internet of things:A perspective[M] //Towards a Service-Based Internet.Springer Berlin Heidelberg,2011:220-229.
[2] Kulkarni R V, Forster A, Venayagamoorthy G K.Computational intelligence in wireless sensor networks:A survey[J].IEEE Communications Surveys & Tutorials,2011,13(1):68-96.
[3] Atzori L,Iera A,Morabito G.The internet of things:a survey [J].Computer Networks,2010,54:2787-2805.
[4] 張飛舟,楊東凱,陳智.物聯(lián)網技術導論 [M].北京:電子工業(yè)出版社,2010:6.
[5] 彭力.物聯(lián)網技術概論 [M].北京:北京航空航天大學出版社,2011:9.
[6] Agrawal R,Srikant R.Fast algorithm for mining association rules[C].Proceedings of the20th International Conference on Very Large Data Bases.Santiago Chile,1994:487-499.
[7] Srikant R,Agrawal R.Mining quantitative association rules in large relational tables[C].Proceedings of the ACM-SIGMOD Conference on Management of Data.Washington D C,1996:1-12.
[8] Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large databases[A].Proceedings of the ACM SIGMOD International Conference on Management of Data,1993:207-216.
[9] 丁永生.計算智能:理論、技術與應用[M].北京:科學出版社,2004.