李煒
【摘 要】機(jī)器學(xué)習(xí)成為人工智能、模式識(shí)別領(lǐng)域的共同研究熱點(diǎn),其理論方法已經(jīng)被廣泛應(yīng)用于解決實(shí)際工程應(yīng)用及科學(xué)領(lǐng)域的復(fù)雜問題。隨著技術(shù)的快速發(fā)展,以統(tǒng)計(jì)為基礎(chǔ)的機(jī)器學(xué)習(xí)受到人們的關(guān)注,并在語音、自然語言、視覺等領(lǐng)域獲得成功應(yīng)用。本文主要闡述了機(jī)器學(xué)習(xí)的分類,介紹幾種常用的機(jī)器學(xué)習(xí)方法。
【關(guān)鍵詞】機(jī)器學(xué)習(xí)分類;人工智能;P-N Leraning
0 概述
機(jī)器學(xué)習(xí)是實(shí)現(xiàn)人工智能領(lǐng)域的一個(gè)重要的研究分支,其研究的主要內(nèi)容是實(shí)現(xiàn)利用計(jì)算機(jī)程序讓帶有處理器及計(jì)算功能的機(jī)器可以隨著經(jīng)驗(yàn)的增加提高處理問題的性能。目前,機(jī)器學(xué)習(xí)的理論已經(jīng)被廣泛的應(yīng)用到,如智能視頻監(jiān)控、生物識(shí)別、無人駕駛等各個(gè)領(lǐng)域。
1 機(jī)器學(xué)習(xí)的發(fā)展及分類
機(jī)器學(xué)習(xí)基本上可分為 4 個(gè)階段。第一階段:上世紀(jì) 50 年代到 60 年代中期,系統(tǒng)通過自身不斷的學(xué)習(xí)輸入、輸出反饋,完善系統(tǒng)參數(shù)及本身的性能。第二階段:從 1960 年代中葉到 70 年代中,該階段主要是對(duì)系統(tǒng)結(jié)構(gòu)的研究,如通過邏輯結(jié)構(gòu)或者圖結(jié)構(gòu)來解釋描述機(jī)器內(nèi)部結(jié)構(gòu)。第三階段的時(shí)間是從上世紀(jì) 70 年代中到 80 年代中期,主要通過研究學(xué)習(xí)策略和學(xué)習(xí)方法來提高改善學(xué)習(xí)的效率,同時(shí)引入知識(shí)數(shù)據(jù)庫(kù),此階段機(jī)器學(xué)習(xí)取得了長(zhǎng)足的發(fā)展; 1986 年至今,神經(jīng)網(wǎng)絡(luò)的引入,及人工智能的需要,人們對(duì)機(jī)器學(xué)了得連接機(jī)制進(jìn)行了研究。
目前機(jī)器學(xué)習(xí)領(lǐng)域的研究一般可分四類,即無監(jiān)督學(xué)習(xí)、監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)以及增強(qiáng)學(xué)習(xí)[1-2]。
1.1 無監(jiān)督學(xué)習(xí)
無監(jiān)督學(xué)習(xí)是一種自學(xué)習(xí)的分類方式,對(duì)沒標(biāo)記的訓(xùn)練樣本進(jìn)行學(xué)習(xí),發(fā)掘未知數(shù)據(jù)間隱藏的結(jié)構(gòu)關(guān)系。無監(jiān)督學(xué)習(xí)和核密度估計(jì)方法非常相似。常用的無監(jiān)督學(xué)習(xí)有關(guān)聯(lián)規(guī)則學(xué)習(xí)和聚類學(xué)習(xí)
1.2 監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)是有人工參與的一種學(xué)習(xí)。監(jiān)督學(xué)習(xí)一般分為 3 步,第一標(biāo)記樣本,第二訓(xùn)練,第三模型概率估計(jì)。其大概過程如下:(1)輸入樣本的特征向量和樣本類別標(biāo)記 ,(2)訓(xùn)練時(shí)通過分析樣本的特征向量,將預(yù)測(cè)結(jié)果與訓(xùn)練樣本的實(shí)際標(biāo)記情況進(jìn)行比較,(3)調(diào)整預(yù)測(cè)模型,直到預(yù)測(cè)模型的準(zhǔn)確率和預(yù)期的準(zhǔn)確率相符。
1.3 半監(jiān)督學(xué)習(xí)
半監(jiān)督學(xué)習(xí)是同時(shí)使用以標(biāo)記的樣本數(shù)據(jù)和未標(biāo)記的樣本數(shù)據(jù)來實(shí)現(xiàn)的一種預(yù)測(cè)方法,半監(jiān)督學(xué)習(xí)分為直推和歸納兩種模式。要先用已標(biāo)記數(shù)據(jù)訓(xùn)練分類器模型,學(xué)習(xí)數(shù)據(jù)的內(nèi)在結(jié)構(gòu)聯(lián)系以便有效地對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)。
1.4 增強(qiáng)學(xué)習(xí)
增強(qiáng)學(xué)習(xí)是通過與環(huán)境的測(cè)試性交互來優(yōu)化和估計(jì)實(shí)際動(dòng)作,來實(shí)現(xiàn)序列的決策,輸入數(shù)據(jù)同時(shí)作為對(duì)模型的反饋。和其他類型學(xué)習(xí)相比強(qiáng)化學(xué)習(xí)輸入的數(shù)據(jù)直接反饋到模型,模型同時(shí)作出相應(yīng)的調(diào)整,并根據(jù)狀態(tài)變化獲得某種強(qiáng)化信號(hào),最終實(shí)現(xiàn)與環(huán)境的交互。常用的增強(qiáng)學(xué)習(xí)算法有 Q-Learning 、時(shí)間差學(xué)習(xí)算法等[3]。
2 P-N Learning算法
在2010年,Kalal提出了基于 P-N Learning的運(yùn)動(dòng)目標(biāo)跟蹤算法,該算法和其他算法的不同點(diǎn)是對(duì)未標(biāo)記的數(shù)據(jù)集進(jìn)行約束和控制通過約束條件。假設(shè)各個(gè)不同的樣本間存在相互獨(dú)立的關(guān)系,大多數(shù)的基于學(xué)習(xí)的跟蹤算法。視頻圖像中,某幀圖像的時(shí)-空關(guān)聯(lián),基本上很少是相互獨(dú)立的。Kalal 等人認(rèn)為單獨(dú)目標(biāo)或背景是具有關(guān)聯(lián)標(biāo)記的樣本圖像塊。如下圖,視頻中標(biāo)記目標(biāo)的結(jié)構(gòu)約束如軌跡所示,我們可以理解認(rèn)為所有接近目標(biāo)軌跡的圖像塊為背景,距離軌跡較遠(yuǎn)的圖像塊為運(yùn)動(dòng)目標(biāo)。
3 混合高斯算法
混合高斯算法認(rèn)為組成圖像的每個(gè)像素在一段時(shí)間內(nèi)的狀態(tài)都稱搞死狀態(tài)分布的,并且每個(gè)像素不具有相關(guān)性,都是相互獨(dú)立的,因此每個(gè)像素的狀態(tài)就可以有幾個(gè)高斯函數(shù)模擬組成。該算法可以較為詳細(xì)的表示圖像該坐標(biāo)點(diǎn)的像素,但是由于其在判定運(yùn)動(dòng)目標(biāo)和背景是采用的二值法,視頻環(huán)境中陰影的遮擋、樹葉的擺動(dòng)、光照強(qiáng)度的不同都可能影響對(duì)運(yùn)動(dòng)目標(biāo)的判斷,而且此方法的計(jì)算量也較為大,一般情況下都采用基于幀間差分的混合高斯模型,及先對(duì)相鄰的兩幀或幾幀視頻進(jìn)行差分,把視頻圖像分為感興趣區(qū)域和非感興趣區(qū)域,對(duì)于感興趣的區(qū)域我們采用混合高斯建模,非感興趣區(qū)域可采用單高斯建模,這樣可以提高算法的運(yùn)行效率,提高算法的響應(yīng)時(shí)間,在實(shí)際的應(yīng)用中有較大的應(yīng)用價(jià)值。
【參考文獻(xiàn)】
[1]孫宸.基于半監(jiān)督在線學(xué)習(xí)的目標(biāo)跟蹤算法研究[D].[碩士學(xué)位論文].上海:上海交通大學(xué),2012.
[2]高文.機(jī)載光電平臺(tái)目標(biāo)跟蹤技術(shù)的研究[D].[博士學(xué)位論文].北京:中國(guó)科學(xué)院研究生院,2012.
[3]V.Gullapalli. A comparison of supervised and reinforcement learning methods on a reinforcement learning task[C]. Proceedings of the 1991 IEEE International.
[責(zé)任編輯:朱麗娜]endprint