甄盼好
(華北電力大學(xué)控制與計(jì)算機(jī)工程學(xué)院 河北 071003)
機(jī)器學(xué)習(xí)是研究怎樣使用計(jì)算機(jī)模擬或?qū)崿F(xiàn)人類學(xué)習(xí)活動(dòng)的科學(xué)。機(jī)器學(xué)習(xí)是機(jī)器獲得知識(shí)的根本途徑,是機(jī)器具有智能的重要標(biāo)志。
機(jī)器學(xué)習(xí)的核心是學(xué)習(xí)。學(xué)習(xí)是人類特有的一項(xiàng)能力,如何讓機(jī)器像人類一樣,能夠通過外界環(huán)境的影響來改善自己的性能,是機(jī)器學(xué)習(xí)研究領(lǐng)域的重點(diǎn)。機(jī)器學(xué)習(xí)的過程是一個(gè)從未知到已知的過程。如果一臺(tái)機(jī)器擁有這樣的程序,隨著機(jī)器解決問題的增多,在該程序的作用下,機(jī)器的性能或解決問題的能力增強(qiáng),我們就說這臺(tái)機(jī)器擁有學(xué)習(xí)的能力。
從20世紀(jì)50年代中葉到60年代中葉。在這個(gè)時(shí)期,所研究“沒有知識(shí)”的學(xué)習(xí),它的主要研究目標(biāo)是研制各類自組織和自適應(yīng)系統(tǒng)。
從20世紀(jì)60年代中葉到70年代中葉。這一階段主要研究是模擬人類的概念學(xué)習(xí)過程,即符號(hào)學(xué)習(xí)。使用的工具是語義網(wǎng)絡(luò)和謂詞邏輯。
從20世紀(jì)70年代中葉到80年代中葉。這一時(shí)期的研究的目標(biāo)仍然是概念學(xué)習(xí),但是從學(xué)習(xí)單個(gè)概念擴(kuò)展到學(xué)習(xí)多個(gè)概念,探索不同的學(xué)習(xí)策略和各種學(xué)習(xí)方法。
從20世紀(jì)80年代到現(xiàn)在是機(jī)器學(xué)習(xí)的新階段。神經(jīng)網(wǎng)絡(luò)的復(fù)蘇,帶動(dòng)著各種非符號(hào)學(xué)習(xí)方法和符號(hào)學(xué)習(xí)方法并駕齊驅(qū);學(xué)習(xí)方法、學(xué)習(xí)系統(tǒng)開始走出實(shí)驗(yàn)室,進(jìn)入實(shí)際應(yīng)用領(lǐng)域。
正如人類有各種各樣的學(xué)習(xí)策略,機(jī)器學(xué)習(xí)也有很多的策略。按照學(xué)習(xí)中使用推理的多少,機(jī)器學(xué)習(xí)策略大體上可以分為五類:機(jī)械學(xué)習(xí)、傳授學(xué)習(xí)、演繹學(xué)習(xí)、歸納學(xué)習(xí)和類比學(xué)習(xí)。
機(jī)械學(xué)習(xí)是一種最基本的學(xué)習(xí)策略,把環(huán)境提供的信息簡單存儲(chǔ)起來,不經(jīng)過任何推理,“死記硬背”式的學(xué)習(xí)。適合于一些環(huán)境相對(duì)穩(wěn)定,輸入輸出模式相對(duì)固定的系統(tǒng)中,例如醫(yī)生給病人看病。
傳授學(xué)習(xí)又叫做指導(dǎo)式學(xué)習(xí)或示教學(xué)習(xí)。傳授學(xué)習(xí)的學(xué)習(xí)過程可以簡單地描述如下:(1)請(qǐng)求:先向指導(dǎo)者請(qǐng)求提出建議;(2)解釋:接受建議并將其轉(zhuǎn)化為內(nèi)部表示形式;(3)操作化:將解釋后的建議轉(zhuǎn)化為具體的知識(shí);(4)歸并:將得到的新知識(shí)歸并到知識(shí)庫中;(5)評(píng)價(jià):對(duì)新知識(shí)進(jìn)行評(píng)價(jià),常用方法有,檢查新知識(shí)與知識(shí)庫里的知識(shí)是否矛盾,或者使用新知識(shí)執(zhí)行某些任務(wù),觀察其執(zhí)行情況。
演繹學(xué)習(xí)以演繹推理為基礎(chǔ)。演繹推理是一種有一般到個(gè)別的推理方法,其核心是三段論。例如,1動(dòng)物都會(huì)死亡;2狗是一種動(dòng)物;3狗會(huì)死亡。只要對(duì)給定的知識(shí)進(jìn)行演繹的保真推理,就能得出一個(gè)正確的新結(jié)論,然后把有價(jià)值的結(jié)論存儲(chǔ)起來。
歸納學(xué)習(xí)以歸納推理為基礎(chǔ)。從某個(gè)概念的一系列正例和反例中歸納出一個(gè)一般的概念描述。歸納學(xué)習(xí)可分為有導(dǎo)師學(xué)習(xí)和無導(dǎo)師學(xué)習(xí)。有導(dǎo)師學(xué)習(xí),又稱示例學(xué)習(xí)。給學(xué)習(xí)系統(tǒng)提供正例和反例,學(xué)習(xí)系統(tǒng)通過歸納算法求解出一個(gè)總的概念描述。
無導(dǎo)師學(xué)習(xí),又稱觀察與發(fā)現(xiàn)學(xué)習(xí)。通過由環(huán)境提供的觀察來進(jìn)行學(xué)習(xí),而且這些觀察是未經(jīng)過知道者分類的例子。
類比學(xué)習(xí)是一種利用相似性來認(rèn)識(shí)新事物的學(xué)習(xí)方式,其基礎(chǔ)是類比推理??梢钥醋魇茄堇[學(xué)習(xí)和歸納學(xué)習(xí)的組合學(xué)習(xí)形式。
學(xué)習(xí)過程:
(1)聯(lián)想搜索匹配:提取特征值,搜索和它相似的已知事物;
(2)檢驗(yàn)相似程度:判斷相似程度,相似程度達(dá)到一定閾值,則說明匹配成功;
(3)修正變換求解:即類比映射,把對(duì)已知事物的有關(guān)知識(shí)進(jìn)行適當(dāng)?shù)恼{(diào)整或變換,以求出新事物的解;
(4)更新知識(shí)庫:求出新事物的解以后,將新事物及其解并入知識(shí)庫。
現(xiàn)實(shí)世界中的數(shù)據(jù),例如語音信號(hào)、數(shù)字圖像或功能性磁共振圖像等,通常都是高維數(shù)據(jù),為了正確地了解這些數(shù)據(jù),我們就需要對(duì)其進(jìn)行降維,降維的目的就是要找出隱藏在高維數(shù)據(jù)中的低維結(jié)構(gòu)。
流形學(xué)習(xí)是一種新的數(shù)據(jù)降維方法,能揭示數(shù)據(jù)的內(nèi)在變化規(guī)律,其目標(biāo)是發(fā)現(xiàn)嵌入在高維數(shù)據(jù)空間中的低維流形結(jié)構(gòu),并給出一個(gè)有效的低維表示。2000年以來,流形學(xué)習(xí)在包括數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺等多個(gè)研究領(lǐng)域得到了廣泛的應(yīng)用。
李群機(jī)器學(xué)習(xí)(Lie Group Machine Learning,LML)作為機(jī)器學(xué)習(xí)領(lǐng)域的一種新的學(xué)習(xí)方法,一方面繼承流形學(xué)習(xí)的優(yōu)點(diǎn),另一方面借用李群的思想,形成了具有創(chuàng)新特色的學(xué)習(xí)范式.自2004年提出至今,已引起加拿大、愛爾蘭、芬蘭、意大利、美國等國內(nèi)外同行的廣泛關(guān)注。
李群結(jié)構(gòu)是目前學(xué)術(shù)界公認(rèn)的對(duì)學(xué)習(xí)問題研究很有用的一套理論工具。從數(shù)據(jù)分析的角度來說,用機(jī)器學(xué)習(xí)進(jìn)行數(shù)據(jù)分析(數(shù)據(jù)挖掘),其目的就是揭示這些數(shù)據(jù)具有的規(guī)律,從而幫助用戶提供解釋的依據(jù)。李群一方面具有好的數(shù)學(xué)結(jié)構(gòu),另一方面物理學(xué)家廣泛使用李群方法來處理物理學(xué)中復(fù)雜數(shù)據(jù)的啟發(fā)。因此,引進(jìn)李群理論對(duì)機(jī)器學(xué)習(xí)是一種可以探索的新思路。
20世紀(jì)90年代初隨著統(tǒng)計(jì)學(xué)習(xí)理論的完善和線性超平面函數(shù)集容量控制方法的發(fā)現(xiàn),提出了著名的支撐矢量機(jī)方法(SVMs)。隨后,以支撐矢量機(jī)為核心算法的核機(jī)器(KM)方法和Fisher判斷分析(FDA)方法得到了機(jī)器學(xué)習(xí)、模式識(shí)別、網(wǎng)絡(luò)搜索引擎技術(shù)、計(jì)算機(jī)視覺等等領(lǐng)域的廣泛關(guān)注。
核機(jī)器方法以統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ),巧妙利用了Mercer核技巧,使其獲得了良好的推廣能力、強(qiáng)大的非線性處理能力、靈活的相似性測度定義和簡潔的模型表示,是目前在特征提取、模式識(shí)別、數(shù)據(jù)發(fā)掘領(lǐng)域公認(rèn)的具有最佳性能的方法之一。
本文對(duì)機(jī)器學(xué)習(xí)進(jìn)行了一次較全面的介紹,同時(shí)指出了一些機(jī)器學(xué)習(xí)方法的研究熱點(diǎn)。機(jī)器學(xué)習(xí)與其他學(xué)科都有著密切的聯(lián)系,因此機(jī)器學(xué)習(xí)的研究可以從其他領(lǐng)域中新的學(xué)習(xí)算法、學(xué)習(xí)體制,來提高機(jī)器的學(xué)習(xí)效果。從而促進(jìn)人工智能的長足進(jìn)步,乃至推動(dòng)人類社會(huì)文明的進(jìn)步。