王璐
摘要:多源信息技術(shù)的進(jìn)一步發(fā)展給精準(zhǔn)化的目標(biāo)分類識(shí)別提出了更高的挑戰(zhàn)。本文以聲目標(biāo)的特征提取和分類識(shí)別為出發(fā)點(diǎn),探討了當(dāng)前主流的幾種機(jī)器學(xué)習(xí)技術(shù),分析了集成學(xué)習(xí)技術(shù)及其決策融合方法,并在此基礎(chǔ)上,提出了基于集成學(xué)習(xí)的聲目標(biāo)識(shí)別框架,從而為復(fù)雜環(huán)境下的聲目標(biāo)識(shí)別問題提供一些技術(shù)參考。
關(guān)鍵詞:集成學(xué)習(xí);目標(biāo)識(shí)別;機(jī)器學(xué)習(xí);特征提?。粵Q策融合
在當(dāng)前的圖像處理、模式識(shí)別、自動(dòng)控制等諸多領(lǐng)域,目標(biāo)識(shí)別已經(jīng)成為一個(gè)重要的發(fā)展方向,而完善和改進(jìn)實(shí)時(shí)目標(biāo)識(shí)別技術(shù)也是提高對(duì)復(fù)雜的多源信息甄別的有效途徑。目標(biāo)的精準(zhǔn)識(shí)別依賴于對(duì)所識(shí)別信息的獲取,隨著應(yīng)用環(huán)境的逐漸多元化和復(fù)雜化以及聲目標(biāo)信號(hào)逐漸出現(xiàn)的信息多源化等諸多特點(diǎn)[1],在這樣的一個(gè)新的復(fù)雜環(huán)境下,目標(biāo)分類識(shí)別過程中所提取的特征量和特征參數(shù)存在一定的不確定性和動(dòng)態(tài)可變性,這就增加了目標(biāo)信息在一定程度上的不確定性,使得目標(biāo)特征的提取以及目標(biāo)識(shí)別結(jié)果的精準(zhǔn)性仍然存在一定的困難。因而,結(jié)合聲目標(biāo)識(shí)別技術(shù)對(duì)目標(biāo)識(shí)別實(shí)時(shí)性和準(zhǔn)確性的實(shí)際應(yīng)用需求以及公安工作復(fù)雜的特殊環(huán)境,如何使用更為先進(jìn)的技術(shù)手段從噪聲干擾大以及價(jià)值密度低的非單一多源未知聲目標(biāo)信號(hào)中提取并識(shí)別出有用的聲音目標(biāo),成為了科技強(qiáng)警戰(zhàn)略下提升戰(zhàn)斗力的一個(gè)亟待解決的研究熱點(diǎn)和研究方向。
1. 聲目標(biāo)識(shí)別技術(shù)現(xiàn)狀
在聲目標(biāo)的識(shí)別方面,美國(guó)斯坦福大學(xué)提出和研制的聲識(shí)別預(yù)警專家系統(tǒng),并經(jīng)過多個(gè)版本的改進(jìn),通過建立相關(guān)的聲目標(biāo)特征模型,在一定程度上實(shí)現(xiàn)了多傳感器監(jiān)測(cè)下的聲目標(biāo)的分類處理,從而證明了人工智能技術(shù)能夠用于聲信號(hào)的處理。加拿大相關(guān)科研人員開發(fā)了能夠用于分析輻射噪聲的信號(hào)分析專家系統(tǒng),該系統(tǒng)對(duì)相關(guān)知識(shí)的表示、推理機(jī)制、聲譜的檢測(cè)和提取方面都進(jìn)行了深入細(xì)致的研究。印度科研人員提出了能夠用于被動(dòng)聲目標(biāo)識(shí)別的專家系統(tǒng),并將專家系統(tǒng)與統(tǒng)計(jì)模式識(shí)別、神經(jīng)網(wǎng)絡(luò)等方法結(jié)合,進(jìn)一步提高了聲目標(biāo)的識(shí)別概率。隨著以神經(jīng)網(wǎng)絡(luò)為代表的機(jī)器學(xué)習(xí)技術(shù)的逐步發(fā)展,神經(jīng)網(wǎng)絡(luò)技術(shù)逐漸應(yīng)用到了傳統(tǒng)的聲目標(biāo)分類識(shí)別系統(tǒng)之中,英國(guó)科研人員通過在聲目標(biāo)識(shí)別中使用神經(jīng)網(wǎng)絡(luò)技術(shù),使其與窄帶分析、寬帶分析、解調(diào)制譜分析以及瞬態(tài)分析等諸多分析技術(shù)相結(jié)合,從而提高了系統(tǒng)的整體容錯(cuò)性能,并使得系統(tǒng)在訓(xùn)練樣本不平衡時(shí)也能夠具備很好的分類識(shí)別性能。國(guó)內(nèi)對(duì)聲目標(biāo)信號(hào)的特征提取及識(shí)別研究相對(duì)較晚,主要的研究開始于二十世紀(jì)八十年代,并通過近些年在目標(biāo)特性、特征提取技術(shù)、無線傳感技術(shù)、人工神經(jīng)網(wǎng)絡(luò)應(yīng)用等方面的研究,在聲目標(biāo)識(shí)別方面取得了一些研究成果,如文獻(xiàn)[1]通過模擬人耳聲信號(hào)處理過程的濾波器組模型,研究了聽覺機(jī)理特征基礎(chǔ)上的聲目標(biāo)識(shí)別方法,文獻(xiàn)[2]在進(jìn)行聲波結(jié)構(gòu)分析以及信號(hào)特征向量提取的研究基礎(chǔ)上,使用基于徑向基函數(shù)的SVM分類算法對(duì)聲目標(biāo)數(shù)據(jù)進(jìn)行了分類識(shí)別,文獻(xiàn)[3]在提出粒子群優(yōu)化算法的基礎(chǔ)上,開展了粒子群神經(jīng)網(wǎng)絡(luò)聲目標(biāo)識(shí)別系統(tǒng)的設(shè)計(jì)和研究。以上諸多方法在聲目標(biāo)的識(shí)別方面雖然都取得了很好的效果,但隨著應(yīng)用環(huán)境的逐漸多元化和復(fù)雜化,聲目標(biāo)信號(hào)也出現(xiàn)了信息多源化等許多新的特點(diǎn),在這樣的一個(gè)新的復(fù)雜環(huán)境下,目標(biāo)分類識(shí)別過程中所提取的特征量和特征參數(shù)存在一定的不確定性和動(dòng)態(tài)可變性,使得目標(biāo)特征的提取以及目標(biāo)識(shí)別結(jié)果的精準(zhǔn)性仍然存在一定的困難。
2. 當(dāng)前主流的機(jī)器學(xué)習(xí)技術(shù)
在處理目標(biāo)分類問題上,由于人工智能和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)一步發(fā)展,以K近鄰、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等學(xué)習(xí)方法為典型代表的機(jī)器學(xué)習(xí)技術(shù)以其優(yōu)越的性能優(yōu)勢(shì)被廣泛的應(yīng)用。
K近鄰分類法是一種非參數(shù)化的目標(biāo)分類方法,在KNN的目標(biāo)分類算法中,不需要先驗(yàn)統(tǒng)計(jì)知識(shí)和高復(fù)雜度的目標(biāo)判別函數(shù),樣本數(shù)據(jù)在進(jìn)行分類時(shí),只觀察和計(jì)算其在特征空間中的K個(gè)最近鄰樣本的類別屬性,并將所包含樣本數(shù)最多的類別作為該樣本數(shù)據(jù)的目標(biāo)類別,雖然相關(guān)文獻(xiàn)提出了改進(jìn)的KNN算法,如可調(diào)整權(quán)重的WA-KNN、基于信任的BK-NN等,但KNN算法的對(duì)存儲(chǔ)空間的要求以及樣本間較高的歐式距離計(jì)算復(fù)雜度問題難以有效的解決。
支持向量機(jī)以較為完備的理論依據(jù)能夠有效地處理小樣本高維數(shù)據(jù)的分類問題,針對(duì)線性可分問題,SVM可以表示為凸二次優(yōu)化問題,并利用已知的有效算法求解目標(biāo)函數(shù)的極值,從而獲取到線性可分問題的最有分類,而針對(duì)線性不可分問題(即非線性分類問題),SVM使用核函數(shù)映射將輸入的低維樣本空間特征向量映射到高維的特征空間中,以升維和線性化的技術(shù)方法將原有低維樣本空間的線性不可分問題轉(zhuǎn)化為高維特征空間的線性可分問題,而作為有監(jiān)督學(xué)習(xí)的機(jī)器學(xué)習(xí)方法,SVM在進(jìn)行訓(xùn)練學(xué)習(xí)時(shí)需要標(biāo)簽樣本,因而其性能將會(huì)受到樣本數(shù)據(jù)不平衡問題的制約,同時(shí),SVM在核函數(shù)及其相關(guān)參數(shù)的選擇上也具有一定的隨意性。
神經(jīng)網(wǎng)絡(luò)是以非線性節(jié)點(diǎn)單元相互連接的形式所組成的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu),具有良好的自學(xué)習(xí)、自適應(yīng)和容錯(cuò)性能,神經(jīng)網(wǎng)絡(luò)分類算法模擬復(fù)雜的非線性模型,通過函數(shù)逼近機(jī)制進(jìn)行知識(shí)的學(xué)習(xí)訓(xùn)練,并使用訓(xùn)練好的網(wǎng)絡(luò)對(duì)目標(biāo)樣本進(jìn)行分類。而由于神經(jīng)網(wǎng)絡(luò)采用的是逐層反向傳播修正權(quán)值的方式,因而,由于網(wǎng)絡(luò)訓(xùn)練機(jī)制以及計(jì)算復(fù)雜度的限制,隱層數(shù)目較多時(shí),網(wǎng)絡(luò)權(quán)值也將難以進(jìn)行更好地優(yōu)化。
3. 集成學(xué)習(xí)技術(shù)
集成學(xué)習(xí)在基學(xué)習(xí)器的基礎(chǔ)上,使用相關(guān)的決策融合規(guī)則將各個(gè)不同的基學(xué)習(xí)器的判決結(jié)果進(jìn)行融合,從而得到比基學(xué)習(xí)器效果更好且識(shí)別準(zhǔn)確率更為精準(zhǔn)的結(jié)果。集成學(xué)習(xí)技術(shù)包含兩種形式,第一種是所有基學(xué)習(xí)器都屬于同一類型的集成學(xué)習(xí)器,第二種是各個(gè)基學(xué)習(xí)器屬于多種類型的集成學(xué)習(xí)器。通常情況下,具有不同類型的基學(xué)習(xí)器所組成的集成學(xué)習(xí)器在處理目標(biāo)的分類識(shí)別任務(wù)是有著相對(duì)更好地識(shí)別效果。
集成學(xué)習(xí)算法常用的決策融合方法主要有投票法和回歸法兩種。
(1)投票法。該方法是針對(duì)分類預(yù)測(cè)而言的,主要包括簡(jiǎn)單投票、加權(quán)投票和概率投票三種。簡(jiǎn)單投票法是每個(gè)基學(xué)習(xí)器的預(yù)測(cè)結(jié)果具有相同的權(quán)重值,按照“少數(shù)服從多數(shù)”的原則,所預(yù)測(cè)的某一類別數(shù)超過某一閾值的作為集成分類器的預(yù)測(cè)結(jié)果;加權(quán)投票是給每個(gè)基學(xué)習(xí)器的預(yù)測(cè)結(jié)果賦予不同的權(quán)重值;概率投票是指將某些基學(xué)習(xí)器的分類輸出是具有相關(guān)概率信息的,將該概率信息也作為集成學(xué)習(xí)器判決結(jié)果的一個(gè)度量。
(2)平均法,該方法是針對(duì)回歸預(yù)測(cè)而言的,主要包括簡(jiǎn)單平均和加權(quán)平均兩種。簡(jiǎn)單平均即是對(duì)各個(gè)基學(xué)習(xí)器的預(yù)測(cè)結(jié)果直接取平均值;而加權(quán)平均是在給各個(gè)基學(xué)習(xí)器的預(yù)測(cè)結(jié)果賦予不同權(quán)值的基礎(chǔ)上,再對(duì)其進(jìn)行加權(quán)求和取平均。
可以看出,加權(quán)投票和加權(quán)平均兩種方法,其相同點(diǎn)都是對(duì)各個(gè)基學(xué)習(xí)器的預(yù)測(cè)結(jié)果賦予不同的權(quán)值,而其不同點(diǎn)是投票法的使用對(duì)象是不同的離散型類別,而平均法的使用對(duì)象則是不同的連續(xù)型數(shù)值。
4. 基于集成學(xué)習(xí)的聲目標(biāo)識(shí)別框架
根據(jù)神經(jīng)網(wǎng)絡(luò)和集成學(xué)習(xí)方法的特點(diǎn)及其所具備的優(yōu)勢(shì),并結(jié)合實(shí)際的目標(biāo)識(shí)別過程以及目標(biāo)識(shí)別方法,這里給出了基于集成學(xué)習(xí)的聲目標(biāo)識(shí)別模型,如圖1所示。
由圖1所示的目標(biāo)識(shí)別框架可以看出,基于集成學(xué)習(xí)的聲目標(biāo)識(shí)別過程可以分為以下幾個(gè)步驟:
(1)信息采集:使用相關(guān)的信息采集設(shè)備(如傳感器)對(duì)所需要的信息進(jìn)行采集,并將所采集到的信息匯集到一個(gè)多維的原始數(shù)據(jù)空間中,形成與所采集信息具有相關(guān)性的目標(biāo)信息狀態(tài)空間集合,此集合包含了待識(shí)別目標(biāo)的所有數(shù)據(jù)信息的屬性,以多維原始數(shù)據(jù)的信息形式組成了待識(shí)別目標(biāo)信息的原始數(shù)據(jù)集,以供后續(xù)的目標(biāo)識(shí)別處理過程予以使用。
(2)特征提?。翰煌拇R(shí)別目標(biāo)都具有著不同的特征性質(zhì),根據(jù)相關(guān)信息采集過程中的不確定性以及這些不同種類特征性質(zhì)的特點(diǎn),可以使用諸如主元分析(PCA)、偏最小二乘(PLS)、卡爾曼濾波(KF)等各種數(shù)學(xué)方法對(duì)所采集到原始數(shù)據(jù)信息進(jìn)行特征信息的提取,從而使待識(shí)別目標(biāo)以相關(guān)特征屬性的數(shù)學(xué)表達(dá)形式為下一步的目標(biāo)分類和識(shí)別提供具有特征信息的數(shù)據(jù)基礎(chǔ)。
(3)神經(jīng)網(wǎng)絡(luò)初步分類:使用帶有特征信息的訓(xùn)練數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,采用具有相同網(wǎng)絡(luò)結(jié)構(gòu)的多個(gè)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)形式,并遵循梯度下降的原則,分別訓(xùn)練出具有初步目標(biāo)分類功能的兩個(gè)神經(jīng)網(wǎng)絡(luò)。然后帶有特征信息的特征數(shù)據(jù)通過各個(gè)神經(jīng)網(wǎng)絡(luò)的輸入端進(jìn)入神經(jīng)網(wǎng)絡(luò),經(jīng)過神經(jīng)網(wǎng)絡(luò)的計(jì)算,在輸出端分別得到初步的分類結(jié)果,也就是從特征數(shù)據(jù)中所獲得的分類識(shí)別的得分,以供后續(xù)集成學(xué)習(xí)融合過程的使用。
(4)初步分類結(jié)果的融合:每個(gè)神經(jīng)網(wǎng)絡(luò)的輸出就相當(dāng)于集成學(xué)習(xí)融合過程中的分類得分,根據(jù)集成學(xué)習(xí)的相關(guān)決策融合規(guī)則,對(duì)經(jīng)過神經(jīng)網(wǎng)絡(luò)初步計(jì)算輸出所獲取到的分類得分進(jìn)行相關(guān)的決策融合,從而得到融合后的分類得分。該融合后的數(shù)據(jù)信息表征著使用集成學(xué)習(xí)方法所獲取到的具有較高識(shí)別準(zhǔn)確率的相關(guān)識(shí)別信息,為下一步的目標(biāo)識(shí)別判定提供了更為精準(zhǔn)的決策依據(jù)。
(5)判定決策:根據(jù)待識(shí)別目標(biāo)的相關(guān)分類識(shí)別的規(guī)則,并基于集成學(xué)習(xí)方法所融合獲取到的分類得分,對(duì)待識(shí)別目標(biāo)的類別給予定量的描述與判定,以此得到待識(shí)別目標(biāo)的相關(guān)類別屬性和信息,依據(jù)該相關(guān)屬性信息的性質(zhì),對(duì)待識(shí)別目標(biāo)的類別進(jìn)行定性地判決,進(jìn)而識(shí)別出待識(shí)別目標(biāo)的相關(guān)類別結(jié)果,從而完成了對(duì)待識(shí)別目標(biāo)的分類識(shí)別過程。
從以上步驟中可以看出,對(duì)于待識(shí)別目標(biāo)的識(shí)別,其實(shí)經(jīng)歷了兩次識(shí)別過程,即:一是神經(jīng)網(wǎng)絡(luò)的初步識(shí)別,二是集成學(xué)習(xí)的進(jìn)一步融合式識(shí)別,而神經(jīng)網(wǎng)絡(luò)的分類識(shí)別過程采用神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)形式,以對(duì)同一識(shí)別目標(biāo)進(jìn)行并行數(shù)據(jù)處理的模式架構(gòu),在各自的輸出端輸出初步識(shí)別結(jié)果,而這一識(shí)別結(jié)果又作為集成學(xué)習(xí)模型的融合的數(shù)據(jù)輸入,進(jìn)入進(jìn)一步的分類識(shí)別過程。這即是本文所給出的一種基于集成的聲目標(biāo)識(shí)別方法,其有效地綜合了神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)、自適應(yīng)、容錯(cuò)性好的特點(diǎn)以及集成學(xué)習(xí)在解決諸多不確定性問題方面的優(yōu)勢(shì),從而使二者結(jié)合起來應(yīng)用于聲目標(biāo)的分類識(shí)別方面,能夠進(jìn)一步地提高對(duì)待識(shí)別聲目標(biāo)的分類識(shí)別能力。
5. 結(jié)語(yǔ)
隨著應(yīng)用環(huán)境的逐漸多元化和復(fù)雜化,聲目標(biāo)也逐漸出現(xiàn)了信息多元化等特點(diǎn)。因而,復(fù)雜環(huán)境下的聲目標(biāo)識(shí)別也成為了一個(gè)亟待解決的問題。針對(duì)聲目標(biāo)識(shí)別問題中所存在的這一難點(diǎn)問題,結(jié)合當(dāng)前先進(jìn)的相關(guān)技術(shù)成果,本文在分析探討相關(guān)主流的機(jī)器學(xué)習(xí)技術(shù)和集成學(xué)習(xí)技術(shù)及其決策融合規(guī)則的基礎(chǔ)上,進(jìn)一步提出了基于集成學(xué)習(xí)的聲目標(biāo)識(shí)別框架,通過該框架模型的構(gòu)建,對(duì)復(fù)雜環(huán)境下的多源未知聲目標(biāo)進(jìn)行潛在特征的提取,并使用預(yù)測(cè)識(shí)別精度較高的集成學(xué)習(xí)融合模型,以進(jìn)一步提升聲目標(biāo)的識(shí)別預(yù)測(cè)準(zhǔn)確率,從而為公安機(jī)關(guān)快速地偵破案件、有效地預(yù)防犯罪、提高公安工作效率和水平提供技術(shù)支持,為公安機(jī)關(guān)的“打防管控”一體化新型警務(wù)模式發(fā)揮了重要的作用。
參考文獻(xiàn):
[1] 馬元鋒, 陳克安, 王娜,等. 聽覺模型輸出譜特征在聲目標(biāo)識(shí)別中的應(yīng)用[J]. 聲學(xué)學(xué)報(bào), 2009, 34(2):142-150.
[2] 侯鐵雙. 聽基于RBF神經(jīng)網(wǎng)絡(luò)的水聲目標(biāo)分類[J]. 電子技術(shù)與軟件工程, 2018(19):116-117.
[3] 劉亞雷, 于艷美, 孟春寧. 基于粒子群神經(jīng)網(wǎng)絡(luò)的聲目標(biāo)識(shí)別系統(tǒng)設(shè)計(jì)研究[J]. 電氣自動(dòng)化, 2016, 38(2):115-118.