摘要:圖像識別精度的高低直接影響著態(tài)勢感知系統(tǒng)的性能,針對在復雜異構環(huán)境中提取圖像關鍵要素難以識別的問題。該文提出了一種概率神經網絡識別圖像的方法。應用這種方法,首先,該文通過粗糙集屬性約簡原始數據,過濾掉冗余屬性;然后,該文使用概率神經網絡這種模型對提取的數據集進行分類訓練。這是一種有效、可行的圖像識別方法,與其傳統(tǒng)方法相比,該方法明顯地提高了圖像識別的準確性,為圖像識別態(tài)勢評估和預測提供了有力的理論保障。
關鍵詞:概率神經網絡;圖像識別;人工智能
中圖分類號:TP18? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)14-0181-03
1 背景
世界上許多事物都有一定的結構,我們可以用它來組織思想。我們使用心理數字線組織其他類型的信息,最明顯的就是數字。概率神經網絡應用到網絡空間安全[1],圖像的識別中。概率神經網絡的一個定義特征是它們的詞表征,是高維的實值向量,在這種結構中,詞被一些學習到的查找表(lookup-table)轉換成實值向量,這些向量被用作一個神經網絡的輸入,其主要優(yōu)勢是其分布式表征實現了一定水平的泛化,而使用經典的 n-gram 語言模型是不可能辦得到的。作為概率神經網絡中一種概念,數量大小可表征在單一維度上(即在一條心理數字線上,一般來說,小數字、壞的、悲傷、不道德、年輕表征在這條線的左側,大數字、好的、開心、高尚、年老等表征在右側)。牛津大學實驗心理學系Luyckx和Summerfield等人在eLife雜志上發(fā)表文章,他們做健康訓練實驗,將被試6個不同顏色的驢子照片與六種不同的獎勵概率聯系起來,通過試誤,被試學會了根據驢子獲得獎勵的可能性對它們進行排序。Luyckx等人將被試驢子觀察大腦活動與觀察數字1-6時的大腦活動進行比較。驢的EEG活動模式對應于它們在心理數字線上的數字。因此,驢子1以最低的獎勵概率,產生了類似于數字1的大腦活動模式,以此類推,產生了類似于對應數字的大腦活動模式。實驗表明,我們不是以非結構化的方式學習,而是利用過去關于刺激之間的關系知識來組織新的信息,這種現象稱為結構對齊。Luyckx等人的研究結果表明人類是通過對世界結構的一般理解來學習新事物,這對教育和人工智能有著重要意義。例如,人教授計算機了解項目之間的關系,而不是孤立地學習項目,計算機可能會更有效地學習。
新工科中人工智能中的機器學習是研究訓練計算機的學習行為。深度學習是屬于機器學習,人工神經網絡的研究促進了深度學習的發(fā)展,深度學習有多種模型,其中,多個隱藏層的多層感知器是一種深度學習的模型[2]。建立模擬人腦進行分析學習的神經網絡是研究深度學習的動力源泉,圖像識別、聲音識別、文本識別等都是模擬人腦的運行機制來分辨識別的[3]。在深度學習的理論下,機器可以模仿人的活動,例如視聽和思考等,克服了人腦的一些局限性,從而人工智能相關技術有了突飛猛進的發(fā)展[4]。香港中文大學的多媒體實驗室是最早應用深度學習進行計算機視覺研究的華人團隊。
20世紀40年代,美國數學家W.Pitts和心理學家W.McCulloch首次提出人工神經網絡的概念。1957年,F.Rosenblatt提出了一種新的人工神經網絡感知器模型,使用最小二乘法或者是Hebb學習規(guī)則來訓練感知器模型的參數,這也是目前提出時間最早且結構最簡單的人工神經網絡模型。之后又出現了新的感知器模型(Mark I),這是第一個通過硬件實現的模型,標志著人工神經網絡的計算開始向硬件方向發(fā)展。感知器采用的是閾值型激活函數,這是只有一層神經元的前向人工神經網絡。通過對數據的提取訓練之后獲得網絡權值,對應于一種輸入可以得到1或者0兩種輸出,這就實現了對目標的分類。但是,這也表明了感知器的分類能力沒有足夠的優(yōu)秀,目前只能處理二元分類,這取決于它只有一層神經網絡,所以不能處理不可分問題。
2 概率神經網絡簡介
2.1 概率神經網絡的特點
1989年,D.F.Speeht博士提出概率神經網絡(Probabilistic Neural Network)。概率神經網絡經過這多年的發(fā)展,它凸顯出自身獨特的特點:
1)快速度收斂,訓練簡單,方便使用。在PNN網絡中,訓練樣本的值賦予隱含層的神經元,輸入樣本值作為神經元的權值。這樣,用PNN網絡所形成的判決曲面與貝葉斯最優(yōu)準則下的曲面可以很逼近。
2)隱含層由非線性映射函數作為徑向基,這樣選擇的優(yōu)點是具有很強的容錯性。若樣本數據充足,概率神經網絡函數就能收斂,避免陷入局部極小的困境。
3)取概率密度函數作為隱含層的傳輸函數,分類結果不受影響。
4)擴充性能好,易于硬件實現。網絡的學習過程簡單,增加或減少類別模式時不需要重新進行長時間的訓練學習,各層神經元的數目比較固定。
從本質上說,它屬于一種有監(jiān)督的網絡分類器,基于貝葉斯最小風險準則。
2.2 概率神經網絡的技術特點
概率神經網絡的結構是屬于一種前向型的神經網絡結構,而且是徑向基網絡的一個重要分支。概率神經網絡建立在貝氏法則理論基礎上,可以快速且有效地解決任意維度輸出的分類應用問題上關于輸入向量大小的問題。由于網絡結構上的特點,連續(xù)值或二進制值都可以處理的,因而,可以解決不同形式的問題。而且在面臨因為系統(tǒng)外界環(huán)境因素改變時,概率神經網絡僅需對新進的分類數據定義權值而無須改變全部的網絡權值。概率神經網絡連接權值采取一次設定,并且直接從訓練范例中加載所需數據,無迭代過程,所以,概率神經網絡的學習速度十分快速,這對網絡的訓練是一個很重要的過程。
2.3 概率神經網絡的結構圖
概率神經網絡的結構如圖1。
首先,輸入層接收一個m維的向量X,經過加權,再傳給模式層的所有節(jié)點,模式層的節(jié)點根據不同的輸出分成不同的類,這些節(jié)點執(zhí)行高斯函數轉到總和層;總和層節(jié)點計算特征層節(jié)點的輸出來產生與每一類相對應的概率密度函數再合成計算;在一定決策規(guī)則下,輸出層產生輸出。
3 圖像識別技術的特點及應用
圖像識別是機器視覺的一個分支。計算機應用機器視覺理論的處理方法和技巧,結合神經網絡以及設備來進行圖像采集和識別。在機器視覺理論中,圖像識別主要利用軟件對圖片中的地理位置、物品、人物、形態(tài)動作和手工筆跡進行分辨的能力[5]。
3.1 圖像識別技術的特點
對于人類和動物的大腦來說,識別物體是很簡單的,但是同樣的任務對計算機來說卻是很難完成的。當我們看到一個東西像樹或者汽車或者我們的朋友,我們在分辨它是什么之前,通常不需要下意識地去研究它。然而,對于計算機來說,辨別任何事物(可能是鐘表、椅子、人或者動物)都是非常難的問題,并且找到問題解決方法的代價很高。圖像識別采用模擬人腦進行識別的方式。根據機器學習,我們可以通過圖片的訓練,教會計算機識別圖像元素。在大型數據庫中,計算機對數據呈現的模式進行識別,對圖像進行辨別,然后形成圖像相關的標簽和類別。
3.2 圖像識別技術的應用
圖像識別技術有許多應用,其中最常見的就是圖像識別技術助力的人物照片分類[6]。誰不想更好地根據視覺主題來管理巨大的照片庫呢?小到特定的物品,大到廣泛的風景。圖片識別技術賦予了照片分類應用的用戶體驗新感受。除了提供照片存儲,應用程序也可以更進一步,為人們提供更好的發(fā)現和搜索功能。有了通過機器學習進行自動圖像管理的功能,它們就可以做到這一點。在應用程序中整合的圖像識別程序界面可以根據機器所鑒定的特征對圖像進行分類,并且根據主題將照片分組。圖像識別的其他應用包括存儲照片和視頻網站、互動營銷以及創(chuàng)意活動,社交網絡的人臉和圖像識別,以及具有大型視覺圖像庫網站的圖像分類。
3.3 圖像識別應用領域
圖像識別的過程為:將圖片信息輸入到含有多層次概率神經網絡中進行處理;在最低層中對剛開始輸入進來的原始像素進行常規(guī)操作,處理之后就是原始輸入的圖像紋理以及它自己的邊緣特征,這些特征包含了像曲線,直線等各種形狀;中層網絡會把上一次從下層網絡上獲得的信息再僅需進行加工處理操作,把這些信息抽象變成更高層次的效果;最高層網絡因為能夠描繪出整個輸入圖像的全部整體特征,經過多次處理之后,機器會獲得識別該輸入原始圖像的強大能力。但是電腦識別圖像的全部過程里,電腦進行自主的學習完全沒有人的干預操作,機器自己發(fā)現圖像的特征,不需要人工干預。
深度學習中應用程度最高的就是圖像識別,ImageNet比賽更是將圖像識別的熱浪推向高潮。通過過擬合技術,使得神經網絡可以對擬合數據進行更好的處理,提高了識別的效率。深度學習模型是圖像處理技術的完美融合,不僅可以提高效率,還可以提高準確率。
深度學習的快速發(fā)展讓機器學習來到了從沒有過的高度,受到了各界的廣泛的關注,一定程度上推動了相關領域的發(fā)展。相信隨著算法和理論進一步發(fā)展,深度學習將會在更多的領域得到應用。
4 概率神經網絡對圖像識別技術的作用
圖像識別不是一項容易的任務,一個好的方法是將元數據應用到非結構數據上。聘請專家對音樂和電影庫進行人工標注或許是一個令人生畏的艱巨任務,然而有的挑戰(zhàn)幾乎是不可能完成的,諸如教會無人駕駛汽車的導航系統(tǒng)將過馬路的行人與各種各樣的機動車分辨出來,或者將用戶每天傳到社交媒體上的數以百萬計的視頻或照片進行標注以及分類。解決這個問題的一個方法是使用概率神經網絡。簡單地說,過擬合一般發(fā)生在模型過于貼合訓練數據的情況下,一般而言,這會導致參數增加(進一步增加了計算成本)以及模型對于新數據的結果在總體表現中有所下降。理論上,我們可以使用傳統(tǒng)概率神經網絡對圖像進行分析,但是實際上從計算角度來看代價很高。舉個例子,一個傳統(tǒng)的概率神經網絡在處理一張很小的圖片時(假設30*30像素)仍然需要50萬個參數以及900個輸入神經元。一個相當強大的機器可以運行這個網絡,但是一旦圖片變大了(例如500*500像素),參數以及輸入的數目就會達到非常高的數量級。根據概率神經網絡的構建方式,一個相對簡單的改變就可以讓較大的圖像變得更好處理。改變的結果就是我們所見到的卷積概率神經網絡,概率神經網絡的廣適性是他們的優(yōu)點之一,但是在處理圖像時,這個優(yōu)點就變成了負擔。卷積概率神經網絡對此專門進行了折衷:如果一個網絡專為處理圖像而設計,有些廣適性需要為更可行的解決方案做出讓步。對于任意圖像,像素之間的距離與其相似性有很強的關系,而概率神經網絡的設計正是利用了這一特點。這意味著,對于給定圖像,兩個距離較近的像素相比于距離較遠的像素更為相似。然而,在普通的概率神經網絡中,每個像素都和一個神經元相連。在這種情況下,附加的計算負荷使得網絡不夠精確。概率神經網絡通過消除大量類似的不重要的連接解決了這個問題。技術上來講,概率神經網絡通過對神經元之間的連接根據相似性進行過濾,使圖像處理在計算層面可控。對于給定層,概率神經網絡不是把每個輸入與每個神經元相連,而是專門限制了連接,這樣任意神經元只能接受來自前一層的一小部分的輸入(例如3*3或5*5)。因此,每個神經元只需要負責處理一張圖像的一個特定部分。(順便提一下,這基本就是人腦的獨立皮質神經元工作的方式,每個神經元只對完整視野的一小部分進行響應)。
5 結束語
本論文總結了概率神經網絡技術特點和應用方法,涉及從簡單的應用到通用人工智能實體概念化等一系列應用問題的開發(fā)。圖像識別和語音識別的研究領域是人工智能的重要研究領域。概率神經網絡未來的工作,我們打算實驗性地比較不同的圖像識別方法,以作為迭代地構建高質量的用于未來機器學習模型,人類對獎勵概率的學習伴隨著對價值表征的結構比對,這種比對與抽象大小概念的神經編碼相一致,表明結構對齊可以促進學習的遷移,促進概率神經網絡在圖像識別與應用技術中的使用。
參考文獻:
[1] 肖利芳,陳向陽.網絡空間安全專業(yè)課程體系建設規(guī)劃[J].電腦知識與技術,2019,15(28):177-178.
[2] 許婷婷,馬晨曄,張靜敏,等.基于深度學習的LAMOST光譜分類研究[J].天文學報,2019,60(2):15-24.
[3] 韋堅,劉愛娟,唐劍文.基于深度學習神經網絡技術的數字電視監(jiān)測平臺告警模型的研究[J].有線電視技術,2017(7):78-82.
[4] 陳先昌.基于卷積神經網絡的深度學習算法與應用研究[D].杭州:浙江工商大學,2014.
[5]岡薩雷斯.數字圖像處理[M].2版.北京:電子工業(yè)出版社,2019.
[6] 李耀輝,劉保軍.基于直方圖均衡的圖像增強[J].華北科技學院學報,2003(2):65-67.
【通聯編輯:謝媛媛】