趙嫦花,米春橋
(懷化學(xué)院計(jì)算機(jī)科學(xué)與工程學(xué)院/武陵山片區(qū)生態(tài)農(nóng)業(yè)智能控制技術(shù)湖南省重點(diǎn)實(shí)驗(yàn)室,湖南懷化418008)
大數(shù)據(jù)時(shí)代基于本體的農(nóng)業(yè)信息融合方法研究
趙嫦花,米春橋*
(懷化學(xué)院計(jì)算機(jī)科學(xué)與工程學(xué)院/武陵山片區(qū)生態(tài)農(nóng)業(yè)智能控制技術(shù)湖南省重點(diǎn)實(shí)驗(yàn)室,湖南懷化418008)
從理論、技術(shù)、方法及應(yīng)用的角度分析了大數(shù)據(jù)時(shí)代基于本體的農(nóng)業(yè)信息融合問題.通過對信息融合及本體的相關(guān)方法與技術(shù)進(jìn)行歸納總結(jié),結(jié)合元數(shù)據(jù)、概念格及信息融合技術(shù)討論了農(nóng)業(yè)本體建模與不同時(shí)空農(nóng)業(yè)基礎(chǔ)數(shù)據(jù)融合的實(shí)現(xiàn)方法,通過建立統(tǒng)一的、標(biāo)準(zhǔn)化、語義化的農(nóng)業(yè)基礎(chǔ)信息本體庫,可有效地解決由于農(nóng)業(yè)物聯(lián)網(wǎng)的各種感應(yīng)器終端收集到的時(shí)空數(shù)據(jù)異構(gòu)問題,通過建立數(shù)據(jù)之間的語義關(guān)系,挖掘出隱藏在數(shù)據(jù)之中的本質(zhì)、結(jié)構(gòu)和規(guī)律,可為實(shí)現(xiàn)精準(zhǔn)農(nóng)業(yè)、智慧農(nóng)業(yè)、智能預(yù)警、精確控制等提供基礎(chǔ)方法與技術(shù)支持.
大數(shù)據(jù);農(nóng)業(yè)本體;信息融合;元數(shù)據(jù);概念格
隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)的價(jià)值將更多地體現(xiàn)在多源融合與行業(yè)應(yīng)用中[1],融合已成為大數(shù)據(jù)時(shí)代數(shù)據(jù)應(yīng)用的顯著趨勢[2].農(nóng)業(yè)大數(shù)據(jù)技術(shù)以大數(shù)據(jù)分析為基礎(chǔ),運(yùn)用大數(shù)據(jù)理念、技術(shù)及方法來處理農(nóng)業(yè)生產(chǎn)中所產(chǎn)生的海量多源異構(gòu)數(shù)據(jù),從中得到綜合全面的信息以指導(dǎo)農(nóng)業(yè)生產(chǎn)實(shí)踐[3].農(nóng)業(yè)大數(shù)據(jù)不僅數(shù)據(jù)量大,而且存在時(shí)間與空間數(shù)據(jù)的語義異構(gòu)和屬性不匹配等問題,如何才能更有效地利用這些數(shù)據(jù)為農(nóng)業(yè)生產(chǎn)提供精準(zhǔn)預(yù)測及智能控制,目前公認(rèn)比較好的解決辦法是基于本體(Ontology)的信息融合方法.
本體是指共享概念模型的明確的形式化規(guī)范說明[4],是語義網(wǎng)的基礎(chǔ),近年來更多地與領(lǐng)域相結(jié)合,用于解決資源共享、知識(shí)表示及重用等問題.國內(nèi)外與相關(guān)領(lǐng)域相結(jié)合的研究集中在計(jì)算機(jī)科學(xué)、圖書情報(bào)學(xué)、醫(yī)學(xué)、農(nóng)學(xué)等領(lǐng)域.其中與農(nóng)業(yè)領(lǐng)域相結(jié)合就稱為農(nóng)業(yè)本體[5],它屬于領(lǐng)域本體,通過計(jì)算機(jī)形式化后表征農(nóng)業(yè)領(lǐng)域概念以及概念間關(guān)系.農(nóng)業(yè)本體建模、時(shí)間與空間數(shù)據(jù)融合及其應(yīng)用國內(nèi)相關(guān)研究還較少,僅在地理信息學(xué)方面有部分研究[6].農(nóng)業(yè)是一個(gè)跨學(xué)科的復(fù)雜系統(tǒng),農(nóng)業(yè)領(lǐng)域概念及關(guān)系復(fù)雜,利用農(nóng)業(yè)本體可明確農(nóng)業(yè)領(lǐng)域概念關(guān)系,梳理正確的邏輯,這樣就為上層智能農(nóng)業(yè)應(yīng)用系統(tǒng)打下基礎(chǔ),實(shí)現(xiàn)領(lǐng)域知識(shí)的共享和協(xié)同服務(wù).
信息融合(information fusion)又稱為數(shù)據(jù)融合(data fusion),常被認(rèn)為是多傳感器數(shù)據(jù)融合[7].當(dāng)前,融合已成為社會(huì)發(fā)展的必然,它是涉及多學(xué)科的新常態(tài)[8].大數(shù)據(jù)時(shí)代信息融合具有非常重要的價(jià)值與意義,通過信息融合,能夠進(jìn)一步挖掘隱藏的數(shù)據(jù)價(jià)值,提前預(yù)測,防止決策失誤[9].在大數(shù)據(jù)時(shí)代,實(shí)現(xiàn)農(nóng)業(yè)信息融合,即實(shí)現(xiàn)復(fù)雜系統(tǒng)多傳感器數(shù)據(jù)融合,將不同時(shí)間與空間的農(nóng)業(yè)基礎(chǔ)信息進(jìn)行整合,生成經(jīng)過改進(jìn)的數(shù)據(jù)集是實(shí)現(xiàn)智能農(nóng)業(yè)的關(guān)鍵,利用農(nóng)業(yè)本體建模對不同時(shí)間與空間的農(nóng)業(yè)數(shù)據(jù)進(jìn)行融合,可為農(nóng)業(yè)智能精確控制提供有效方法與技術(shù)支持.
1.1 信息融合理論
信息融合包括像素級融合(數(shù)據(jù)級融合)[10]、特征級融合[11]和決策級融合[12]共3個(gè)層次.像素級融合是最底層的融合,它將采集到的原始數(shù)據(jù)直接進(jìn)行融合,它能提供其它融合層次不能提供的細(xì)微信息,但不能實(shí)時(shí)進(jìn)行,且受外界因素影響大.特征級融合是通過提取特征信息,例如數(shù)據(jù)信息表示量等,再按照特征信息對多傳感器數(shù)據(jù)進(jìn)行綜合分析、分類.它能提取出與決策分析有關(guān)的特征值,以達(dá)到理想的融合結(jié)果,它屬于中間層次.決策級融合是一種高層次融合,它的結(jié)果能夠?yàn)樽罱K的決策及控制等提供依據(jù).此外,它對傳感器的依賴性小,具有很高靈活性,抗干擾能力強(qiáng)[13].
信息融合算法的好壞決定了能否提高識(shí)別對象能力及系統(tǒng)處理信息能力,由于多傳感器數(shù)據(jù)具有復(fù)雜性和多樣性等特點(diǎn),因此融合算法除應(yīng)具備穩(wěn)定性及并行處理的能力外,還應(yīng)具備較高的精度和運(yùn)算速度[14].常見的信息融合的算法包括簡單方法、基于概率論的方法、人工智能方法以及基于模糊推理的方法等[15].其中簡單算法是屬于像素級融合的方法,它主要包括加權(quán)平均法、等值融合法等.基于概率論的信息融合方法屬于決策層融合的方法,它主要包括貝葉斯方法[16],D-S證據(jù)理論[17-18]等.基于模糊邏輯的信息融合方法包括粗糙集、模糊集[19]等方法.混合方法主要用于對混合特征的數(shù)據(jù)的處理,包括模糊粗糙集理論、模糊D-S證據(jù)理論等.人工智能計(jì)算方法包括神經(jīng)網(wǎng)絡(luò)[20]、深度學(xué)習(xí)算法、遺傳算法、蟻群算法[21]等,這些算法在處理數(shù)據(jù)的過程中不斷學(xué)習(xí)與歸納,融合不完善的數(shù)據(jù)[22].研究關(guān)聯(lián)的二義性是信息融合中的主要障礙,主要涉及信息的唯一性,信息的重復(fù)性、別名識(shí)別、重名區(qū)分、異構(gòu)數(shù)據(jù)加權(quán)等多個(gè)方面[23].本體是解決二義性的根本手段,它主要用于清楚的表達(dá)領(lǐng)域知識(shí)的結(jié)構(gòu),使信息能夠共享和重用,避免了重復(fù)的知識(shí)分析,提高了知識(shí)的利用率.
信息融合涉及到很多具體的技術(shù)和方法,但這些技術(shù)方法都是片面的、零散的且這些技術(shù)與方法尚處于初步階段不足以應(yīng)對當(dāng)前復(fù)雜的多源、跨界、異構(gòu)信息.當(dāng)前也尚未建立統(tǒng)一的融合理論體系和有效的融合模型和算法,特別針對于農(nóng)業(yè)領(lǐng)域多源的信息,需要對以上的這些方法進(jìn)行深入地分析,研究出適合農(nóng)業(yè)方面的技術(shù)方法以利于農(nóng)業(yè)信息融合.
1.2 信息融合方法
元數(shù)據(jù)(metadata)是描述數(shù)據(jù)屬性(property)的信息,它主要用于描述數(shù)字化信息資源基本特征及其相互關(guān)系,使得這些數(shù)字化資源能夠被計(jì)算機(jī)及其網(wǎng)絡(luò)系統(tǒng)自動(dòng)識(shí)別并進(jìn)行歸納分析的編碼體系[24].國內(nèi)外普遍認(rèn)為元數(shù)據(jù)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”或“描述數(shù)據(jù)的數(shù)據(jù)”[25].
本體的本質(zhì)就是領(lǐng)域知識(shí)的共享和重用,領(lǐng)域本體能夠?yàn)橄到y(tǒng)之間的互操作和共享提供很好的基礎(chǔ).元數(shù)據(jù)和本體都可以用來描述信息,因此,元數(shù)據(jù)從某種程度上也可以看作是一個(gè)輕量級的本體[26],但本體相比元數(shù)據(jù)具有更加豐富的概念間的關(guān)系,加入了更多的約束,對信息的描述比元數(shù)據(jù)完備[27].換言之,本體中包含了各種元數(shù)據(jù),它可以通過相關(guān)資源抽取出不同的元數(shù)據(jù),因此可以說一個(gè)完善的領(lǐng)域本體可以包含這個(gè)領(lǐng)域的所有元數(shù)據(jù)描述元素,因此,包含元數(shù)據(jù)的領(lǐng)域,可以方便地構(gòu)建本體并實(shí)現(xiàn)相互之間的數(shù)據(jù)通信.
農(nóng)業(yè)領(lǐng)域的元數(shù)據(jù)比較容易獲得且相對較完善,因此,農(nóng)業(yè)本體基于元數(shù)據(jù)將更易于構(gòu)建.利用元數(shù)據(jù)對領(lǐng)域信息進(jìn)行表示,通過遵循相關(guān)原則進(jìn)行最優(yōu)匹配,可以減少數(shù)據(jù)匹配的錯(cuò)誤[28],此外,元數(shù)據(jù)與信息融合算法能進(jìn)行更緊密的結(jié)合,為上層本體構(gòu)建,數(shù)據(jù)融合提供更好的基礎(chǔ).
概念格[29]又叫Galois格,又被稱為形式概念分析,是根據(jù)二元關(guān)系提出的概念層次結(jié)構(gòu),被廣泛用于數(shù)據(jù)的分析和規(guī)則的提取[30].利用概念格算法解決農(nóng)業(yè)時(shí)空信息異構(gòu),關(guān)鍵是發(fā)現(xiàn)領(lǐng)域中所涉及的蘊(yùn)含規(guī)則、分類規(guī)則、關(guān)聯(lián)規(guī)則,實(shí)現(xiàn)對信息的重組以減少冗余度.因此需要基于概念格生成算法(主要為批處理算法或增量算法等)[31]設(shè)計(jì)概念格生成的主要步驟,并基于此構(gòu)建農(nóng)業(yè)信息概念語義關(guān)系,為農(nóng)業(yè)本體的構(gòu)建提供基礎(chǔ),進(jìn)而實(shí)現(xiàn)語義層面的數(shù)據(jù)融合.
農(nóng)業(yè)信息量大且非常復(fù)雜,主要體現(xiàn)在地域的差別,地理環(huán)境復(fù)雜,氣候多變,而山區(qū)農(nóng)業(yè)就更為復(fù)雜[32],比如,同一座山有陽面與陰面就會(huì)造成信息的不同.針對自然環(huán)境的水、土、氣、肥、生長信息、農(nóng)產(chǎn)品生產(chǎn)的氣候、土壤成分、病蟲害災(zāi)情等時(shí)空信息,基于本體實(shí)現(xiàn)這些農(nóng)業(yè)信息的融合,可為實(shí)現(xiàn)智慧農(nóng)業(yè)提供支持.基于本體的農(nóng)業(yè)信息融合方法框架如圖1所示,從采集原始數(shù)據(jù),數(shù)據(jù)抽象再到數(shù)據(jù)融合,將傳感器獲取的信息通過A/D轉(zhuǎn)換器轉(zhuǎn)換為數(shù)據(jù),接下來抽象成為元數(shù)據(jù),有些元數(shù)據(jù)可來自于已有的數(shù)據(jù)庫.通過對元數(shù)據(jù)的語義分析,利用概念格,融合算法,本體映射等實(shí)現(xiàn)基于本體的農(nóng)業(yè)數(shù)據(jù)融合.
2.1 基于元數(shù)據(jù)的農(nóng)業(yè)基礎(chǔ)信息規(guī)范化概念構(gòu)建方法
概念是表征信息的基礎(chǔ)和橋梁,為了減少對農(nóng)業(yè)信息描述中的冗余和歧義,需要對農(nóng)業(yè)基礎(chǔ)信息所表達(dá)的涵義進(jìn)行分析,同時(shí)通過農(nóng)業(yè)領(lǐng)域?qū)<业恼J(rèn)證,明確農(nóng)業(yè)對象之間的聯(lián)系.由于農(nóng)業(yè)地理環(huán)境復(fù)雜,相關(guān)的概念很多,需要將農(nóng)業(yè)信息標(biāo)準(zhǔn)規(guī)范和各種異構(gòu)的相關(guān)時(shí)空數(shù)據(jù)作為基礎(chǔ)農(nóng)業(yè)信息的概念域,確定出每一個(gè)概念及其相互關(guān)系.根據(jù)《特色農(nóng)業(yè)基礎(chǔ)術(shù)語》、《農(nóng)業(yè)專業(yè)術(shù)語》等標(biāo)準(zhǔn)所規(guī)定要表達(dá)的基礎(chǔ)農(nóng)業(yè)信息,建立農(nóng)業(yè)信息概念的語義描述集(元數(shù)據(jù))從而實(shí)現(xiàn)這些數(shù)據(jù)標(biāo)準(zhǔn)所涵蓋的農(nóng)業(yè)信息的概念化.結(jié)合模糊邏輯、遺傳算法、蟻群算法[33]來解決數(shù)據(jù)關(guān)聯(lián)問題.使用元數(shù)據(jù),對農(nóng)業(yè)信息的相關(guān)情況包括地域、氣候、病蟲害等進(jìn)行表示,然后從全局的角度出發(fā),搜索與具體農(nóng)作物(比如柑桔作為元數(shù)據(jù)模型中的一個(gè)元素)相關(guān)的概率和最大的結(jié)果,從而規(guī)范農(nóng)業(yè)基礎(chǔ)信息概念集.
2.2 基于語義內(nèi)涵的農(nóng)業(yè)概念形式化表達(dá)方法
為了實(shí)現(xiàn)農(nóng)業(yè)信息形式化表達(dá)首先在對農(nóng)業(yè)信息的屬性提取時(shí)設(shè)置規(guī)則,包括以下要素:(1)農(nóng)業(yè)概念可以用許多屬性表示,比如不同地區(qū)柑桔病蟲害信息包含的屬性有很多,需要提煉,包括病原、癥狀、病變部位、防治方法等;(2)確定概念語義的屬性應(yīng)該是反映整個(gè)概念所指所有可能對象的屬性,是不可再分的最小單位,結(jié)合梳理數(shù)據(jù)標(biāo)準(zhǔn)所形成的農(nóng)業(yè)信息概念的內(nèi)涵和外延,內(nèi)涵不以外延的變化而變化,其屬性值保持為常量.需考慮到特殊生態(tài)環(huán)境進(jìn)行設(shè)置,為上層的智能控制提供更好的底層語義關(guān)系;(3)不同概念的本體屬性值不產(chǎn)生二義性.綜合考慮時(shí)間與空間數(shù)據(jù)的時(shí)空特性、數(shù)量與質(zhì)量特性等來確定農(nóng)業(yè)信息概念的本體屬性,抽取的屬性要符合概念格的推理規(guī)則.在Protégé中使用類、實(shí)例、屬性三元組的關(guān)系進(jìn)行描述,并使用OWL(Web OntologyLanguage)來實(shí)現(xiàn)農(nóng)業(yè)信息本體屬性的形式化表達(dá).
2.3 基于概念格算法的農(nóng)業(yè)信息概念語義關(guān)系構(gòu)建方法
將農(nóng)業(yè)信息概念之間的語義分為同義關(guān)系(Synonymy)、部分-整體關(guān)系(Part-Whole)、實(shí)例關(guān)系(Instance-of)以及概念-屬性關(guān)系(Concept-Attribute)四大類.通過概念格生成算法(主要為批處理算法或增量算法)建立數(shù)據(jù)標(biāo)準(zhǔn)范疇之內(nèi)所有農(nóng)業(yè)概念之間的層次關(guān)系,包括父類與子類、各自的屬性及關(guān)系、父子之間的繼承等,通過這些上下級關(guān)系對時(shí)空數(shù)據(jù)的屬性進(jìn)行組織與管理.
對象是概念的集合,抽取概念屬性構(gòu)建屬性的集合,構(gòu)建屬性關(guān)系,使用概念圖建立概念語義關(guān)系,生成描述農(nóng)業(yè)信息本體模型的OWL文件.通過讀取該OWL文件,使用批處理算法(包括Ganter算法、Chein算法、Bordat算法)構(gòu)建農(nóng)業(yè)信息概念格.再對概念格進(jìn)行優(yōu)化,并對錯(cuò)誤的或不合理的語義關(guān)系及屬性進(jìn)行調(diào)整.概念格生成流程如圖2所示.
圖1 基于本體的農(nóng)業(yè)信息融合框架
圖2 概念格生成流程
2.4 基于本體的農(nóng)業(yè)時(shí)空數(shù)據(jù)融合方法
時(shí)空異構(gòu)數(shù)據(jù)導(dǎo)致了本體之間難以實(shí)現(xiàn)互操作,這樣制約了農(nóng)業(yè)領(lǐng)域知識(shí)間的關(guān)聯(lián)性.基于本體概念相似度則重新考慮農(nóng)業(yè)本體中概念定義的方法[34],充分考慮到農(nóng)業(yè)領(lǐng)域概念的屬性、約束及關(guān)系,從語義層上消除不同本體之間的異質(zhì)現(xiàn)象的問題,以柑桔為例,不同地區(qū)的氣候、水土及病蟲害信息表示各異,需要解決類似這種多源時(shí)間與空間數(shù)據(jù)的屬性(語義)匹配與處理問題.在農(nóng)業(yè)物聯(lián)網(wǎng)數(shù)據(jù)中,從不同來源的時(shí)間與空間數(shù)據(jù)中找出語義相似或相關(guān)的對象,通過對比分析,進(jìn)行數(shù)據(jù)融合,以實(shí)現(xiàn)生態(tài)農(nóng)業(yè)的智能化和自動(dòng)化.
利用農(nóng)業(yè)本體對不同時(shí)間地點(diǎn)(即不同時(shí)空數(shù)據(jù))收集的資料進(jìn)行處理達(dá)到實(shí)現(xiàn)數(shù)據(jù)融合的目的.時(shí)空數(shù)據(jù)融合中數(shù)據(jù)語義匹配關(guān)鍵是建立基于不同數(shù)據(jù)標(biāo)準(zhǔn)的農(nóng)業(yè)本體之間概念的相似模型,以實(shí)現(xiàn)兩者之間的本體映射.建立農(nóng)業(yè)數(shù)據(jù)標(biāo)準(zhǔn)本體模型和國家農(nóng)業(yè)數(shù)據(jù)標(biāo)準(zhǔn)本體模型之間的映射,對重疊部分進(jìn)行數(shù)據(jù)的綜合取舍,總的原則是以國家農(nóng)業(yè)數(shù)據(jù)為準(zhǔn),根據(jù)數(shù)據(jù)地域性和數(shù)據(jù)質(zhì)量等綜合情況進(jìn)行處理.
通過本體的建模對各數(shù)據(jù)標(biāo)準(zhǔn)所定義的時(shí)空數(shù)據(jù)屬性的層次結(jié)構(gòu)進(jìn)行組織與分析,提高屬性數(shù)據(jù)處理的效率.通過這種語義相似性和屬性匹配來完成本體之間映射關(guān)系,即通過本體概念相似度提取系統(tǒng)涉及領(lǐng)域本體異構(gòu)消解,實(shí)現(xiàn)對農(nóng)業(yè)信息融合處理,并基于融合后的本體為農(nóng)業(yè)智能精確控制提供基礎(chǔ)支持.
首先對不同時(shí)間與空間農(nóng)業(yè)數(shù)據(jù)進(jìn)行采集,依據(jù)《特色農(nóng)業(yè)基礎(chǔ)術(shù)語》等標(biāo)準(zhǔn)從中分別獲取領(lǐng)域語料和領(lǐng)域詞典;然后對領(lǐng)域語料進(jìn)行處理,依據(jù)領(lǐng)域詞典從領(lǐng)域語料中自動(dòng)提取領(lǐng)域概念及其關(guān)系,并構(gòu)建元數(shù)據(jù)本體庫;接著基于概念格構(gòu)建農(nóng)業(yè)信息概念語義關(guān)系,利用相似度計(jì)算和聚類分析為工具發(fā)現(xiàn)領(lǐng)域概念間的關(guān)系,為不同本體庫映射做準(zhǔn)備.通過語義相似度計(jì)算及本體映射構(gòu)建農(nóng)業(yè)本體,基于農(nóng)業(yè)本體完成對時(shí)空數(shù)據(jù)的融合,并基于此農(nóng)業(yè)本體進(jìn)行數(shù)據(jù)融合應(yīng)用.總應(yīng)用技術(shù)路線如圖3所示.
圖3 應(yīng)用技術(shù)路線圖
在農(nóng)業(yè)大數(shù)據(jù)背景下,利用農(nóng)業(yè)本體建模實(shí)現(xiàn)復(fù)雜系統(tǒng)多傳感器多數(shù)據(jù)來源的農(nóng)業(yè)信息融合,能為精準(zhǔn)農(nóng)業(yè)、智慧農(nóng)業(yè)、智能預(yù)警、精確控制提供基礎(chǔ)技術(shù)支持,為整合現(xiàn)有的與新采集的農(nóng)業(yè)生產(chǎn)氣象、土壤、農(nóng)業(yè)生產(chǎn)統(tǒng)計(jì)等多源異構(gòu)數(shù)據(jù)完成計(jì)算機(jī)規(guī)范化處理,為構(gòu)建面向生態(tài)農(nóng)業(yè)產(chǎn)業(yè)化與基層生產(chǎn)服務(wù)的基礎(chǔ)數(shù)據(jù)庫提供信息共享平臺(tái),為農(nóng)業(yè)智能控制技術(shù)提供基礎(chǔ)方法與技術(shù)支持.筆者還將結(jié)合本體技術(shù)進(jìn)行實(shí)證研究,實(shí)現(xiàn)農(nóng)業(yè)信息的本體層面融合,以更好地適應(yīng)大數(shù)據(jù)時(shí)代農(nóng)業(yè)大數(shù)據(jù)落地應(yīng)用的需要.
[1]林仕鼎.大數(shù)據(jù):變革轉(zhuǎn)型的“強(qiáng)心劑”[N].中國教育報(bào),2016 -01-13.
[2]李國杰,程學(xué)旗.大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國科學(xué)院院刊,2012,27(6):647-657.
[3]張浩然,李中良,鄒騰飛,等.農(nóng)業(yè)大數(shù)據(jù)綜述[J].計(jì)算機(jī)科學(xué),2014,41(B11):387-392.
[4]Studer,R.,Benjamins,V.R.,F(xiàn)ensel,D..Knowledge.engineering principles and methods[J].Data and Knowledge Engineering,1998,25(1-2):161-197.
[5]王藝,王英,原野,等.基于語義本體的柑橘肥水管理決策支持系統(tǒng)[J].農(nóng)業(yè)工程學(xué)報(bào),2014,30(9):93-101.
[6]肖計(jì)劃.地理本體在基礎(chǔ)地理信息數(shù)據(jù)融合中的應(yīng)用[J].測繪科學(xué)技術(shù)學(xué)報(bào),2014,31(3):326-330.
[7]YBar-Shalom.On hierarchical trackingfor the real world[J].IEEE Trans.on Aerospace and Electronic Systems,2006,42(3):846 -850.
[8]化柏林,李廣建.大數(shù)據(jù)環(huán)境下多源信息融合的理論與應(yīng)用探討[J].圖書情報(bào)工作,2015,16(59):5-10.
[9]Izadi D,Abawajy JH,Ghanavati S,Herawan T.A Data Fusion Method in Wireless Sensor Networks[J].Sensors(Basel),2015,2(15):2964-2979.
[10]David L,Hall,James Llinas.An introduction to Multi-sensor Data Fusion[J].Proceedings ofthe IEEE,1997,85(1):6-23.
[11]劉同明,等.數(shù)據(jù)融合技術(shù)及其應(yīng)用[M].北京:國防工業(yè)出版社,1998:77-120.
[12]Lawrenee A.Klein.Sensor and Data Fusion Concepts and Applications[J].SPIEOP teal Engineering Press,1999(15):526-528.
[13]張延龍,王俊勇.多傳感器數(shù)據(jù)融合技術(shù)概述[J].艦船電子工程,2013,33(2):41-44.
[14]宋秀峰.海洋水質(zhì)檢測系統(tǒng)中多傳感器數(shù)據(jù)融合技術(shù)的研究[D].秦皇島:燕山大學(xué),2013.
[15]Shyi-Ming,Chen,Li-Wei Lee,Hsiang-Chuan Liu,Szu-Wei Yang.Multiattribute decision making based on interval-valued intuitionistic fuzzy values[J].Expert Systems With Applications,2012,39(12):10343-10351.
[16]張金槐.多源信息的Bayes融合精度鑒定方法[J].國防科技大學(xué)學(xué)報(bào),2001,23(3):93-97.
[17]Si Lei,Wang Zhongbin,Tan Chao,et al.A novel approach for coal seam terrain prediction through information fusion of improvedD-S evidencetheory andneuralnetwork[J]. Measurement,2014,54(8):140-151.
[18]Garcia E,Hausotte T,Amthor A.Bayes filter for dynamic coordinate measuremetns-Acccuracy improvement,data fusion andmeasurementuncertaintyevaluation[J].Measurement,2013,46(9):3737-3744.
[19]Lin Guoping,Liang Jiye,Qian Yuhua.An information fusion approachby combining multigranulationroughsetsand evidence theory[J].Imformation Sciences,2015,314:184-199.
[20]Safari S,Shabani F,Simon D.Multirate multisensor data fusion for linear systems using Kalman filters and a neural network[J]. Aerospace Science and Technology,2014,39(12):465-471.
[21]Suk Heung-II,Lee Seong-Whan,Shen Dinggang.Hierachical feature representation and multimodal fusion with deep learning for AD/MCI diagnosis[J].Neuroimage,2014,101:569-582.
[22]陳科文,張祖平,龍軍.多源信息融合關(guān)鍵問題、研究進(jìn)展與新動(dòng)向[J]].計(jì)算機(jī)科學(xué),2013,40(8):6-13.
[23]化柏林.多源信息融合方法研究[J].情報(bào)理論與實(shí)踐,2013,36(11):16-19.
[24]趙嫦花.基于本體的學(xué)科知識(shí)庫構(gòu)建研究[D].重慶:西南大學(xué),2008.
[25]肖瓏.元數(shù)據(jù)格式在數(shù)字圖書館中的應(yīng)用大學(xué)圖書館學(xué)報(bào),1999(4):18-24.
[26]李金定.敘詞表、元數(shù)據(jù)與本體之間關(guān)系探究[J].圖書館學(xué)研究,2007(8):61-64.
[27]Xiaolei Wanga,Nengcheng Chenab,Zeqiang Chenab,et al.Earth observation metadata ontology model for spatiotemporal-spectral semantic-enhanced satellite observation discovery:a case study of soil moisture monitoring[J].GIScience&Remote Sensing,2016,56(1):22-24.
[28]金加根,李文鋒,薛小紅,等.基于元數(shù)據(jù)的數(shù)據(jù)互聯(lián)算法[J].計(jì)算機(jī)研究與發(fā)展,2011(48):236-241.
[29]Thomas Tilley.Tool Support for FCA.Springer-Verlag Berlin Heidelberg,2008,29(61):104-111.
[30]Wille R.Restructuring lattice theory:Anapproach based on hierarchies ofconcepts[M].Ordered Sets.Springer-Verlag,Berlin Heidelberg,2005:1-33.
[31]郭倫眾,宋振明.一種基于最大滿矩陣生成概念格的算法[J].智能系統(tǒng)學(xué)報(bào),2015,10(6):1-6.
[32]Ying Wang,Yi Wang,Jing Wang,et al.An ontology-based approach to integration of hilly citrus production knowledge[J]. Computers and Electronics in Agriculture,2015(113):24-43.
[33]張海濤,周愛武.蟻群算法在文本聚類中的應(yīng)用研究[J].微電子學(xué)與計(jì)算機(jī),2016,33(1):81-84.
[34]丁博,苗世迪.制造資源本體的概念語義相似度研究[J].計(jì)算機(jī)應(yīng)用研究,2016,33(1):28-31.
Research on Ontology-based Agricultural Information Fusion Method in the Era of Big Data
ZHAO Chang-hua,MI Chun-qiao
(College of Computer Science and Engineering/Key Laboratory of Intelligent Control Technology for Wuling-Mountain Ecological Agriculture in Hunan Province,Huaihua University,Huaihua,Hunan 418008)
This paper analyzed the problems of ontology-based agricultural information fusion in the era of big data from the perspective of theories,technologies,methods and applications.By summarizing technologies and methods of information fusion and ontology and combining with metadata,information fusion technologies,concept lattice,we discussed the implementation methods of agricultural ontology modeling and different space-time data fusion in agriculture. Through a standardized semantic agriculture information ontology,we can effectively solve the problem of space-time data heterogeneity which collected from varieties of sensors in the agricultural Internet of Things.Through establishing semantic relationships among data and digging out the essences hidden in the data,we can provide basic methods and technics to realize precision agriculture,wisdom agriculture,smart alerts and precision control.
big data;agricultual ontology;information fusion;concept lattice;metadata
S126
A
1671-9743(2017)05-0041-05
2016-12-21
湖南省教育廳科學(xué)研究項(xiàng)目“基于本體的武陵山片區(qū)生態(tài)農(nóng)業(yè)信息融合方法研究”(15C1094);湖南省自然科學(xué)基金項(xiàng)目“基于大數(shù)據(jù)思維的農(nóng)作物災(zāi)害脅迫風(fēng)險(xiǎn)時(shí)空認(rèn)知方法研究”(2017JJ3252);武陵山片區(qū)生態(tài)農(nóng)業(yè)智能控制技術(shù)湖南省重點(diǎn)實(shí)驗(yàn)室開放基金項(xiàng)目“武陵山片區(qū)生態(tài)農(nóng)業(yè)病蟲害本體的構(gòu)建研究”(ZNKZ2014-10);懷化學(xué)院項(xiàng)目“教育資源云服務(wù)Ontology表示技術(shù)研究”(HHUY2014-07).
趙嫦花,1979年生,女,湖南邵陽人,講師,研究方向:語義網(wǎng)絡(luò),云計(jì)算,大數(shù)據(jù)應(yīng)用技術(shù);
*通訊作者:米春橋,1983年生,男,湖南懷化人,副教授,博士,研究方向:地理信息科學(xué)及應(yīng)用技術(shù)、數(shù)據(jù)科學(xué)及大數(shù)據(jù)應(yīng)用技術(shù).