• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于極限學(xué)習(xí)機(jī)模型的內(nèi)陸湖泊水質(zhì)遙感監(jiān)測研究

    2018-08-09 09:08:28賈雷曹紅業(yè)
    科學(xué)與財富 2018年18期
    關(guān)鍵詞:極限學(xué)習(xí)機(jī)機(jī)器學(xué)習(xí)

    賈雷 曹紅業(yè)

    摘 要:針對內(nèi)陸水體光譜特征信息與葉綠素a之間具有強(qiáng)非線性的特點(diǎn),而廣泛應(yīng)用的傳統(tǒng)的BP(Back Propagation)模型存在著學(xué)習(xí)速度慢、極易陷入局部極小等問題、而支持向量機(jī)(Support Vector Machine, SVM)模型過于復(fù)雜,且其參數(shù)難以調(diào)整,提出將極限學(xué)習(xí)機(jī)(Extreme Learning Machine, ELM)方法用于內(nèi)陸湖泊水質(zhì)遙感監(jiān)測,該算法不但可以簡化參數(shù)選擇過程,而且可以提高網(wǎng)絡(luò)的訓(xùn)練速度。在確定了最優(yōu)參數(shù)的基礎(chǔ)上,建立了葉綠素a濃度(表征水體富營養(yǎng)化程度的重要參數(shù))預(yù)測模型,并且將預(yù)測結(jié)果與BP和SVM進(jìn)行比較。實(shí)驗(yàn)結(jié)果表明:該方法可以顯著提高模型的學(xué)習(xí)速度,且相比BP和SVM模型具有更好的泛化性能。實(shí)驗(yàn)結(jié)果證明了極限學(xué)習(xí)機(jī)應(yīng)用于水質(zhì)遙感監(jiān)測的可行性和有效性。

    關(guān)鍵詞:機(jī)器學(xué)習(xí);極限學(xué)習(xí)機(jī);水質(zhì)遙感監(jiān)測;內(nèi)陸湖泊

    0 引 言

    隨著沿海和內(nèi)陸地區(qū)人口的持續(xù)增長和工業(yè)壓力持續(xù)加大,中國目前正面臨極為嚴(yán)重的水資源問題,而其中水環(huán)境質(zhì)量的急劇下降已成為一個亟待解決的問題[1],尤其是內(nèi)陸湖泊的水質(zhì)問題己經(jīng)成為全球性問題,而水質(zhì)監(jiān)測是水質(zhì)評價與水污染防治的主要依據(jù)[2],因此,準(zhǔn)確、有效、實(shí)時的內(nèi)陸湖泊水質(zhì)監(jiān)測對保護(hù)湖泊及其流域水生態(tài)環(huán)境具有重要的意義。近幾十年來,水質(zhì)評價都依賴于傳統(tǒng)的現(xiàn)場抽樣和數(shù)據(jù)收集,然后在實(shí)驗(yàn)室分析和評估各項(xiàng)水質(zhì)參數(shù),這種方法雖然可以得出較為精確的結(jié)果,但是耗時耗力,成本高昂,且嚴(yán)格受限于時間尺度與空間尺度,難以達(dá)到實(shí)時、大尺度的監(jiān)測要求。

    基于上述傳統(tǒng)水質(zhì)監(jiān)測方法的各種缺陷,近年來,遙感(RS)技術(shù)的商業(yè)應(yīng)用及其迅猛發(fā)展為水質(zhì)監(jiān)測提供了嶄新的思路。由于遙感影像能夠很清晰地顯示目標(biāo)區(qū)域內(nèi)水體污染情況及空間分布特點(diǎn),并且利用同一區(qū)域多個時間節(jié)點(diǎn)的影像,甚至可以較精確地預(yù)測該地區(qū)的污染蔓延趨勢。水質(zhì)遙感監(jiān)測是基于水體中不同組成分的光譜反射率的差異,并根據(jù)衛(wèi)星傳感器接收到的特征信息,對大面積水域中不同組成分的空間分布及其變化進(jìn)行動態(tài)定量分析與評價[3]。

    目前,內(nèi)陸湖泊水質(zhì)遙感的反演方法主要包括3種:分析模型、經(jīng)驗(yàn)?zāi)P鸵约鞍虢?jīng)驗(yàn)?zāi)P突虬敕治瞿P蚚4]。三種算法中應(yīng)用最廣泛的是半經(jīng)驗(yàn)?zāi)P?。該方法是根?jù)已知的水質(zhì)光譜特征選擇最佳的波段或波段組合,利用適合的方法建立水體光譜特征參數(shù)與遙感影像數(shù)據(jù)間的經(jīng)驗(yàn)性模型算法。

    由于內(nèi)陸湖泊水體光譜反射率與各項(xiàng)水質(zhì)參數(shù)之間的關(guān)系存在著大量不確定因素[5]。近年來,人工神經(jīng)網(wǎng)絡(luò)(Artificial Neutral Network,ANN)等機(jī)器學(xué)習(xí)算法具備自適應(yīng)、自組織映射性和容錯性等優(yōu)越性能,成為一種非常有效的水質(zhì)遙感反演策略[6]。然而,傳統(tǒng)的單隱層前饋神經(jīng)網(wǎng)絡(luò)(SLFNs)在模型參數(shù)訓(xùn)練過程中由于需要進(jìn)行多次迭代運(yùn)算,造成整個模型運(yùn)算過程會產(chǎn)生很大的時間成本,使網(wǎng)絡(luò)訓(xùn)練過程的效率難以保證,并且極易達(dá)到局部最小值,該問題在很大程度上制約了SLFNs的發(fā)展。

    極限學(xué)習(xí)機(jī)(ELM)是由Huang Guang Bin等學(xué)者于2004年提出來的一種全新思想的SLFNs。該算法的特點(diǎn)是只需要設(shè)置隱含層神經(jīng)元結(jié)點(diǎn)數(shù)目及隱含層激活函數(shù)即可,模型隱含層與輸出層的最優(yōu)連接權(quán)值根據(jù)穆爾-彭羅斯廣義逆矩陣?yán)碚?,并通過最小化平方損失函數(shù)得到的唯一最優(yōu)解。相比BP模型,ELM模型算法中未采用迭代方法,克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練時間長、過擬合等問題。

    1 ELM基本原理與算法流程

    1 .1 ELM 基本原理

    ELM改進(jìn)了SLFNs算法存在的一些嚴(yán)重問題發(fā)展而來的[7]。對于N個不同的隨機(jī)樣本(xi,ti) ,其中

    1.2 算法流程

    (1) 輸入訓(xùn)練樣本數(shù)據(jù) ,選擇最優(yōu)的隱含層輸出函數(shù)

    和隱層結(jié)點(diǎn)個數(shù)L;

    (2) 系統(tǒng)根據(jù)(1)隨機(jī)確定隱層結(jié)點(diǎn)參數(shù),如權(quán)值w以及隱層結(jié)點(diǎn)偏置 b;

    (3) 計(jì)算隱含層輸出矩陣H;

    (4) 求解網(wǎng)絡(luò)模型的最優(yōu)外權(quán) ;

    (5) 根據(jù)矩陣H和最優(yōu)外權(quán) 所構(gòu)建的最優(yōu)模型算法對選擇的測試樣本數(shù)據(jù)進(jìn)行預(yù)測。

    2 應(yīng)用實(shí)例

    由于水體中葉綠素a含量是表征富營養(yǎng)化程度的重要參數(shù),因此本文擬選取葉綠素a濃度參數(shù)進(jìn)行研究,這樣可為內(nèi)陸湖泊水質(zhì)監(jiān)測與評價及災(zāi)害防治提供新的思路和方法。

    2.1 數(shù)據(jù)獲取與預(yù)處理

    2.1.1 影像數(shù)據(jù)獲取與預(yù)處理

    本文研究區(qū)域?yàn)樘b感影像選取該區(qū)域環(huán)境小衛(wèi)星HJ-1B CCD數(shù)據(jù),衛(wèi)星過境時間為2009年10月6日早上11:35。遙感影像數(shù)據(jù)雖然經(jīng)過了幾何粗校正,但仍存在較大的幾何畸變,并受大氣吸收、散射等因素的影響,不能直接將其應(yīng)用于實(shí)驗(yàn)反演研究。為了削弱甚至消除幾何畸變影響,獲取地物真實(shí)光譜反射率或輻亮度值,必須要對遙感影像進(jìn)行必要的預(yù)處理,如下:

    利用太湖區(qū)域已經(jīng)過精校正的Landsat-TM影像作為基準(zhǔn)圖像,完成對HJ-1B CCD影像的精校正;讀取HJ-1B/CCD數(shù)據(jù)頭文件中的絕對定標(biāo)參數(shù),將遙感影像DN(Digital Number)值轉(zhuǎn)換成輻亮度值,完成輻射定標(biāo)處理;大氣校正采用相對成熟的“MODTRAN4+”方法,削弱甚至消除一定大氣組成分對地物光譜吸收和散射方面的影響。

    2.1.1 太湖葉綠素a濃度數(shù)據(jù)獲取與預(yù)處理

    在衛(wèi)星過境時間段內(nèi),組織人員在湖面采集了48個監(jiān)測點(diǎn)(圖1)數(shù)據(jù),包括監(jiān)測點(diǎn)表層水樣、水溫、風(fēng)速以及經(jīng)緯度等信息,在室內(nèi)得出監(jiān)測點(diǎn)葉綠素a實(shí)測數(shù)據(jù)(表1)。現(xiàn)將實(shí)測數(shù)據(jù)分為訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù),其中79%的數(shù)據(jù)用于建模,其余21%用于模型驗(yàn)證。

    為了更加突出地比較出ELM的優(yōu)異性能,本研究使用BP、SVM和ELM三種算法分別對太湖區(qū)域葉綠素a濃度進(jìn)行預(yù)測,且三種算法采用的樣本數(shù)據(jù)完全一致。

    2.2 模型的參數(shù)選擇

    對于BP、SVM和ELM三種模型的預(yù)測分析通過Matlab2012b軟件編程實(shí)現(xiàn)。支持向量機(jī)(SVM)采用LibSVM工具包進(jìn)行實(shí)驗(yàn)研究,并通過編寫的SVMcgForRegress函數(shù)尋找模型最佳參數(shù)。其最佳選擇參數(shù)為選取Gaussian函數(shù)作為其核函數(shù),核函數(shù)參數(shù) 和回歸懲罰系數(shù)均為1,設(shè)置允許的終止判據(jù)為0.001;根據(jù)上節(jié)極限學(xué)習(xí)機(jī)ELM的基本原理,相比BP和SVM兩種模型,該模型只需確定隱含層激勵函數(shù)以及結(jié)點(diǎn)個數(shù)即可。

    ELM中的激勵函數(shù)主要包括:Sigmodial函數(shù)、Sine函數(shù)、Hardlim函數(shù)、Triangular Basis函數(shù)和Radial Basis函數(shù)。為了更有效地確定兩個參數(shù),本研究選取上述五個激勵函數(shù),將隱含層結(jié)點(diǎn)個數(shù)初始化為5,且以5為周期遞增,比較分析不同激勵函數(shù)與隱結(jié)點(diǎn)數(shù)目對葉綠素a預(yù)測的影響程度。見圖3

    從圖可知,Sigmodial函數(shù)和Sine函數(shù)在節(jié)點(diǎn)數(shù)為10之后測試誤差(RMSE)開始平穩(wěn),Radial Basis函數(shù)在節(jié)點(diǎn)數(shù)為20之后開始趨于平穩(wěn),而Hardlim和Triangular Basis函數(shù)隨著隱節(jié)點(diǎn)個數(shù)的增加,其測試誤差波動比較大。且相比于Sigmodial和Sine兩種激勵函數(shù),Radial Basis函數(shù)在節(jié)點(diǎn)數(shù)為20之后,其測試誤差

    最小,均在0.7以下,并且相當(dāng)穩(wěn)定。因此本研究選取

    Radial Basis函數(shù)作為激勵函數(shù),隱結(jié)點(diǎn)數(shù)為20。

    2.3 實(shí)驗(yàn)結(jié)果與分析

    將BP、SVM和ELM三種算法根據(jù)上節(jié)選取的最優(yōu)參數(shù),對38個輸入訓(xùn)練樣本數(shù)據(jù)進(jìn)行訓(xùn)練,記錄該過程所占用的內(nèi)存時間(CPU Time),建立模型后,分別對10個驗(yàn)證樣本進(jìn)行預(yù)測,得到其預(yù)測結(jié)果。

    由三種模型的預(yù)測結(jié)果可知,ELM模型相對于BP和SVM兩種模型,其預(yù)測結(jié)果的相對誤差要小很多;從圖2-4可以看出,ELM模型預(yù)測值與實(shí)測數(shù)據(jù)的擬合程度要高于其余兩種模型;而從表2可以更加直觀地看出模型(1)的泛化能力方面:ELM模型訓(xùn)練樣本和預(yù)測樣本的均方根誤差RMSE = 6.3494和平均相對誤差MRE = 9.5705%均小于SVM和BP模型;(2) 運(yùn)行時間上:由于ELM模型無需迭代操作,相比BP和SVM模型運(yùn)算速度顯著提高。

    不難得出如下結(jié)論,相比BP和SVM模型,ELM模型的整體性能更優(yōu)。BP模型的模型結(jié)構(gòu)比ELM簡單,預(yù)測精度不如 ELM,并且BP模型算法參數(shù)在運(yùn)算過程中需要一直調(diào)整,以致其模型的訓(xùn)練時間多于ELM模型。而SVM模型結(jié)構(gòu)復(fù)雜,并且其參數(shù)調(diào)整較為困難,因此相比ELM模型,其時間成本較高。

    3 結(jié)語

    本文基于極限學(xué)習(xí)機(jī)ELM模型,對太湖葉綠素a濃度數(shù)據(jù)進(jìn)行了預(yù)測,獲得了較高的預(yù)測精度和速度。并與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)模型和SVM模型預(yù)測結(jié)果進(jìn)行比較分析,ELM的預(yù)測精度最高,并且占用的內(nèi)存時間更短。結(jié)果表明該方法具有很強(qiáng)的學(xué)習(xí)能力和泛化能力。說明將其應(yīng)用于內(nèi)陸湖泊水質(zhì)遙感監(jiān)測是可行的、有效的,為該方法在內(nèi)陸湖泊水質(zhì)遙感監(jiān)測方面的應(yīng)用開創(chuàng)了廣闊的應(yīng)用前景。

    參考文獻(xiàn):

    [1]王旭楠,陳圣波,呂航 [J].吉林大學(xué)學(xué)報: 地球科學(xué)版, 2007, 37(Sup):189-193.

    [2]朱利,姚延娟,吳傳慶[J].地理與地理信息科學(xué), 2010, 26(2): 81-84.

    [3] MOREL A. Y. , PRIEUR L. Analysis of variations in ocean color

    [J]. Limnology and Oceanography, 1977, 22(4): 709.

    [4]劉燦德,何報寅 [J].世界科技研究與發(fā)展, 2005, 27(5): 40-44.

    [5]張玉超,錢新,錢瑜[J].環(huán)境科學(xué), 2009, 30(5): 1321-1328.

    [6]呂恒,江南,李新國[J].地球科學(xué)進(jìn)展, 2005, 20(2): 185-192.

    [7] HUANG Guangbin. Learning capability and storage capacity of two-hidden-layer feedforward networks[J], IEEE Trans. Neural Networks. 2003:14 (2): 274–281.

    作者簡介:

    賈雷,碩士研究生,主要從事土地調(diào)查與評價,遙感監(jiān)測方面的研究。

    猜你喜歡
    極限學(xué)習(xí)機(jī)機(jī)器學(xué)習(xí)
    神經(jīng)元的形態(tài)分類方法研究
    基于判別信息極限學(xué)習(xí)機(jī)的高光譜遙感圖像分類
    極限學(xué)習(xí)機(jī)修正誤差的體育成績預(yù)測模型
    基于極限學(xué)習(xí)機(jī)的玻璃瓶口缺陷檢測方法研究
    基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
    基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
    基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
    時代金融(2016年27期)2016-11-25 17:51:36
    前綴字母為特征在維吾爾語文本情感分類中的研究
    基于支持向量機(jī)的金融數(shù)據(jù)分析研究
    機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
    南漳县| 吴江市| 舞阳县| 沈阳市| 武城县| 舟山市| 福海县| 茶陵县| 图们市| 桑植县| 鸡西市| 南陵县| 华池县| 嘉荫县| 大新县| 绩溪县| 岗巴县| 达日县| 祁连县| 图木舒克市| 庆城县| 漠河县| 昌江| 长丰县| 牡丹江市| 靖安县| 泸西县| 文山县| 武冈市| 正安县| 龙川县| 江津市| 吉水县| 内乡县| 即墨市| 讷河市| 武陟县| 克拉玛依市| 万山特区| 浦县| 永城市|