• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于深度卷積神經(jīng)網(wǎng)絡(luò)的遙感圖像場景分類

      2019-05-30 06:08:24蘆國軍陳麗芳
      關(guān)鍵詞:半軸卷積神經(jīng)網(wǎng)絡(luò)

      蘆國軍,陳麗芳

      (河北地質(zhì)大學(xué) 信息工程學(xué)院,河北 石家莊 050000)

      0 引言

      遙感圖像分類在自然植被制圖、城市規(guī)劃、土地利用、災(zāi)害檢測、地理圖像檢索、環(huán)境監(jiān)測等眾多應(yīng)用中具有重要意義[1].這些應(yīng)用的有效性取決于分類的精度.

      傳統(tǒng)的基于人工提取特征的分類方法對于分類精度的提高非常有限,目前深度卷積神經(jīng)網(wǎng)絡(luò)方法已經(jīng)開始應(yīng)用于圖像分類,在一定程度上取得了令人滿意的成績,Krizhevsky 等[2]提出的 AlexNet深度卷積神經(jīng)網(wǎng)絡(luò),在 Image Net 2012圖像分類大賽中取得了令人眼前一亮的成就,獲得了冠軍,其錯誤率與第二名應(yīng)用傳統(tǒng)算法相比錯誤率降低了約 10%.恭城等[3]利用深度卷積神經(jīng)網(wǎng)絡(luò)對遙感圖像數(shù)據(jù)集進(jìn)行分類,并和傳統(tǒng)的基于顏色和紋理特征的分類方法進(jìn)行比較,提出采用深度卷積神經(jīng)網(wǎng)絡(luò)對圖像進(jìn)行分類的精度更加優(yōu)于傳統(tǒng)方法中僅僅基于顏色和紋理對圖像進(jìn)行分類的方法.李昌俊[4]針對遙感圖像中的耕地圖像,通過卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取并應(yīng)用于圖像分類,通過對比最終采用AlexNet網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,采用了AlexNet網(wǎng)絡(luò)的圖像分類精度更加優(yōu)于采用了SVM的圖像分類精度.曲顯影等[5]對經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò) Le Net-5進(jìn)行局部改進(jìn),在激活函數(shù)的選擇上用 Relu代替 Sigmoid 和 Tanh ,對光學(xué)遙感圖像進(jìn)行分類研究,得到了令人滿意的效果.黨宇等[6]利用AlexNet模型對地表覆蓋圖斑分類進(jìn)行研究,探索深度學(xué)習(xí)方法應(yīng)用在地表覆蓋分類評價(jià)中的有效性.雖然上述方法對分類精度的提升取得了一定的進(jìn)步,但是沒有充分融合多種深度特征.針對這一問題,我們提出一種深度卷積神經(jīng)網(wǎng)絡(luò),把卷積網(wǎng)絡(luò)提取到的三層高層特征融合,輸入給分類器,并且在激活函數(shù)的選擇上,針對Relu激活函數(shù)容易在x負(fù)半軸上產(chǎn)生梯度消失這一問題,我們選用不容易產(chǎn)生梯度消失問題的PRelu[7]激活函數(shù)進(jìn)行實(shí)驗(yàn)研究.

      1 算法描述

      1.1 DCNN分類模型

      圖1 模型結(jié)構(gòu)圖

      設(shè)計(jì)的 DCNN 模型只在最后一個卷積層添加了池化層,原因在于池化層的主要作用是用來降維,而本文是對遙感圖像進(jìn)行像素級的分類,為了防止訓(xùn)練樣本在高層次的尺寸過小,只在最后一個卷積層后添加一個size為 3×3,stride為2的max pooling.5個卷積層參數(shù)設(shè)置為 96@11×11步長為4,256@3×3步長為1,384@3×3步長為1,384@3×3步長為1,256@3×3步長為1.最后兩個全連接層的神經(jīng)元個數(shù)經(jīng)過實(shí)驗(yàn)對比設(shè)置為4 096,并在之后連接一個 Softmax 層用于輸出分類結(jié)果.

      1.2 激活函數(shù)

      圖2 Relu函數(shù)和PRelu函數(shù)對比

      神經(jīng)網(wǎng)絡(luò)的傳遞過程需要用到激活函數(shù),激活函數(shù)的作用是把線性問題映射為非線性問題,在網(wǎng)絡(luò)傳遞過程中,激活函數(shù)通過激活神經(jīng)元閾值從而使神經(jīng)元進(jìn)行工作,由線性問題轉(zhuǎn)換為非線性問題,有利于特征提取.早期使用頻率較高的Sigmoid函數(shù)和Tanh函數(shù)由于存在數(shù)學(xué)上不可逆轉(zhuǎn)的飽和問題,從而無法避免兩個主要缺點(diǎn),第一,容易在激活過程中出現(xiàn)梯度消失.優(yōu)化神經(jīng)網(wǎng)絡(luò)時常采用BP反向傳播算法,即導(dǎo)數(shù)的反向傳遞:先計(jì)算輸出層對應(yīng)的損失值,然后將損失值以導(dǎo)數(shù)的形式不斷向前一層網(wǎng)絡(luò)反饋傳遞,以優(yōu)化相應(yīng)的參數(shù),達(dá)到降低損失值的目的.但是如果x較大或較小時,導(dǎo)數(shù)接近0;并且Sigmoid函數(shù)導(dǎo)數(shù)的最大值是0.25,導(dǎo)數(shù)在每一層進(jìn)行反向傳播時至少會被壓縮75%.正是由于這兩個原因,從輸出層不斷向輸入層反向傳播訓(xùn)練時,由于被壓縮導(dǎo)數(shù)很容易逐漸變?yōu)?,使得網(wǎng)絡(luò)權(quán)重和偏差參數(shù)無法被更新,最終導(dǎo)致神經(jīng)網(wǎng)絡(luò)不能被優(yōu)化.第二,冪運(yùn)算相對耗時.這個問題并沒有第一個問題嚴(yán)重,但是對于深度卷積神經(jīng)網(wǎng)絡(luò)模型來說時間也是一個相對重要的需要考慮的問題.Relu激活函數(shù)的計(jì)算復(fù)雜度非常低,而且收斂速度很快,是一種被廣泛應(yīng)用的激活函數(shù), 神經(jīng)元通過Relu函數(shù)進(jìn)行激活,會在x負(fù)半軸輸出為0,從而會使網(wǎng)絡(luò)的稀疏性增加,還會降低參數(shù)之間的相互依存關(guān)系,可以有效地緩解網(wǎng)絡(luò)發(fā)生過擬合的問題.但是,它也存在一些弊端,如果過分地強(qiáng)制增加網(wǎng)絡(luò)的稀疏性,就會使模型的有效容量大大降低,即會屏蔽掉很多有用特征,導(dǎo)致模型無法充分學(xué)習(xí)到有用特征.

      由圖2可以看出,Relu函數(shù)在x負(fù)半軸導(dǎo)數(shù)為0,梯度消失;在x正半軸導(dǎo)數(shù)為1,梯度不變.由此,神經(jīng)元通過Relu函數(shù)進(jìn)行激活,落在x正半軸的輸入能夠保持梯度不消失,但是隨著訓(xùn)練輪數(shù)的遞增,部分輸入會落在x負(fù)半軸,此時導(dǎo)數(shù)為0,相應(yīng)權(quán)重不再更新,神經(jīng)元激活失敗.而PRelu函數(shù)區(qū)別于Relu函數(shù)的地方在于負(fù)半軸,PRelu函數(shù)增加了一個自學(xué)習(xí)參數(shù)ai,與Relu函數(shù)相比,PRelu函數(shù)收斂速度更快.

      PRelu函數(shù)定義為:

      (1)

      yi表示非線性激活函數(shù)在第i個通道上的輸入,參數(shù)ai是控制負(fù)半軸斜率的自學(xué)習(xí)參數(shù).

      PRelu函數(shù)同樣可以使用反向傳播法對參數(shù)進(jìn)行訓(xùn)練,ai的梯度可以從以下公式求得:

      (2)

      (3)

      使用反向傳播算法更新ai時采用的是帶動量的更新方式,ai的更新公式定義為:

      我點(diǎn)點(diǎn)頭,準(zhǔn)備離開。他卻拉住了我。我很奇怪,為什么,他的好日子里怎么能有我這種人。我想起那昏暗臟兮兮的會場,紙醉金迷沒陽光。

      (4)

      其中,α是學(xué)習(xí)率,μ是動量.

      1.3 多層特征融合

      對于輸入的圖像上的信息,我們僅僅利用單層的特征很難將其有效地表示出來,假設(shè)能夠表示出來,其魯棒性和識別率也不會很好,從而影響圖像分類的精度.卷積神經(jīng)網(wǎng)絡(luò)中每一層都通過一組卷積核(濾波器)來提取圖像的特征,然后將其組合輸入分類器,隨著卷積層數(shù)的逐漸加深,卷積神經(jīng)網(wǎng)絡(luò)中的卷積核逐漸復(fù)雜.開始層由各種邊緣濾波器作用,此時提取到的特征是圖像的輪廓特征,用肉眼很容易辨別出圖像的所屬類別,激活幾乎保留了原始圖像中的所有信息.隨著層數(shù)的加深,激活變得越來越抽象,并且所提取的特征越來越難以直觀地理解.它們開始表示更高層次的概念,層數(shù)越深,其表示中關(guān)于圖像視覺內(nèi)容的信息就越少,而關(guān)于類別的信息就越多,各層特征如圖3所示.

      圖3 特征圖可視化

      由圖3知道,淺層卷積網(wǎng)絡(luò)提取的是一些邊緣信息,它幾乎保留了原圖像中的所有信息,深層卷積網(wǎng)絡(luò)提取的是更加抽象的信息,為了更精確地表達(dá)出圖像類別信息,我們把多層特征進(jìn)行融合,讓各層特征優(yōu)勢互補(bǔ).我們把最后一個全連接層特征定義為深層特征feature_fc,把池化層特征定義為feature_pool,把第四個卷積層特征定義為feature_conv,通過主成分分析(PCA)技術(shù)把feature_pool和feature_conv降維處理,把提取出來的三層特征進(jìn)行串聯(lián)融合,輸入到最終分類器.多層特征融合的過程如圖4所示.

      圖4 特征融合示意圖

      2 實(shí)驗(yàn)與分析

      2.1 實(shí)驗(yàn)環(huán)境

      本文采用Tensorflow1.0,Keras2.0.5開源框架,編程環(huán)境為python3.5.實(shí)驗(yàn)采用的計(jì)算機(jī)配置為Intel(R) Core(TM)i7-3770主頻3.4GHz四核處理器,16GB內(nèi)存,操作系統(tǒng)為Windows 7.

      2.2 實(shí)驗(yàn)數(shù)據(jù)集

      我們采用UC Merced土地利用數(shù)據(jù)集,這個數(shù)據(jù)集是最流行的,已經(jīng)廣泛用于遙感圖像場景分類,它有21個土地利用場景類別,每個類別由100幅航空圖像組成,一共2 100幅圖像,每張圖像大小為256×256像素,每個像素的空間分辨率為0.3 m,訓(xùn)練集和測試集的比例為8:2.

      2.3 實(shí)驗(yàn)結(jié)果及分析

      為了驗(yàn)證本文方法的有效性,實(shí)驗(yàn)將與傳統(tǒng)深度學(xué)習(xí)方法Alexnet模型進(jìn)行實(shí)驗(yàn)對比,首先,計(jì)算兩種算法的分類混淆矩陣,結(jié)果如圖6所示.混淆矩陣的橫軸表示被預(yù)測到的每類圖像的標(biāo)簽值,縱軸表示每類圖像的真實(shí)標(biāo)簽值,每類遙感圖像的分類準(zhǔn)確率由主對角線上的數(shù)值表示,分類準(zhǔn)確率和數(shù)值正相關(guān).由圖 6可以看出,Alexnet算法在個別類別上存在一些比較嚴(yán)重的誤差,而本文提出的算法在分類誤差上有所改進(jìn),分類準(zhǔn)確率較高.

      圖6 分類混淆矩陣對比

      其次,計(jì)算總體精度(Overall Accuracy,OA)和Kappa系數(shù) .

      (5)

      其中,TP表示圖像數(shù)據(jù)集中被分類正確的個數(shù),Number表示圖像數(shù)據(jù)集中總的圖像個數(shù).

      混淆矩陣中的有關(guān)信息在Kappa系數(shù)中得到了充分利用,因此Kappa系數(shù)常作為分類精度評估的綜合指標(biāo),用于分類的一致性檢驗(yàn) .

      (6)

      Pe定義為:

      (7)

      其中,a1,a2,a3,…,an表示每一類樣本的真實(shí)個數(shù),b1,b2,b3,…,bn表示每一類樣本的預(yù)測個數(shù).

      通過實(shí)驗(yàn)驗(yàn)證,得到兩種算法的 Accuracy 和 Kappa 系數(shù)如表2所示.由表2可以明確看出,本文提出的遙感圖像分類方法分類精度和Kappa 系數(shù)均優(yōu)于傳統(tǒng)算法,因此可以得出本文算法整體分類性能更加優(yōu)于對比的傳統(tǒng)深度學(xué)習(xí)算法,適合進(jìn)行遙感圖像分類應(yīng)用.

      Kappa系數(shù)值與分類的一致性之間的關(guān)系如表 1所示,表中數(shù)據(jù)表明,系數(shù)值越高,一致性越好.

      表1 Kappa系數(shù)值與分類一致性關(guān)系表

      表2 兩種算法的總體精度和Kappa系數(shù)比較

      3 結(jié)論

      針對傳統(tǒng)的基于深度學(xué)習(xí)算法的遙感圖像分類方法未能有效融合多層特征和使用的激活函數(shù)存在的各種缺點(diǎn),本文提出了一種改進(jìn)的深度學(xué)習(xí)算法網(wǎng)絡(luò)框架,對遙感圖像場景分類進(jìn)行應(yīng)用研究,在UC Merced土地利用數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)研究,并與現(xiàn)有的深度學(xué)習(xí)算法進(jìn)行比較,實(shí)驗(yàn)結(jié)果表明,本文提出的方法在分類精度和Kappa系數(shù)上都明顯優(yōu)于傳統(tǒng)的深度學(xué)習(xí)算法,證明該框架能夠有效應(yīng)用于遙感圖像場景分類問題.由于本算法實(shí)驗(yàn)所用的數(shù)據(jù)集相對較小,深度模型需要大量的數(shù)據(jù)來擬合模型,所以未來進(jìn)一步的研究是采用規(guī)模更大和類別更多的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn).

      猜你喜歡
      半軸卷積神經(jīng)網(wǎng)絡(luò)
      基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
      法蘭盤半軸鉆鉸錐孔專用夾具設(shè)計(jì)
      神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      從濾波器理解卷積
      電子制作(2019年11期)2019-07-04 00:34:38
      汽車半軸用鋼電沉積Ni-SiC復(fù)合鍍層的耐磨性
      基于傅里葉域卷積表示的目標(biāo)跟蹤算法
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      某重型車橋半軸斷裂失效分析
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
      化隆| 金湖县| 古田县| 鄂托克前旗| 莱阳市| 革吉县| 铅山县| 奎屯市| 霍邱县| 江川县| 海林市| 安宁市| 长治县| 英山县| 德兴市| 三台县| 阿合奇县| 伊金霍洛旗| 志丹县| 阳曲县| 南靖县| 汕尾市| 安顺市| 教育| 高碑店市| 全州县| 和平县| 平凉市| 普兰县| 鸡西市| 原平市| 西青区| 英吉沙县| 绥滨县| 涟水县| 广灵县| 霍山县| 枣阳市| 亳州市| 股票| 丹棱县|