劉召華
寶雞職業(yè)技術(shù)學(xué)院電子信息工程系,陜西 寶雞 721013
?
人工智能發(fā)展的新技術(shù)
——深度學(xué)習(xí)
劉召華*
寶雞職業(yè)技術(shù)學(xué)院電子信息工程系,陜西寶雞721013
摘要:近年來,在計(jì)算機(jī)和互聯(lián)網(wǎng)巨頭推動下,人工智能進(jìn)入新的發(fā)展高潮,人工神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等將人工智能推向新的高度。深度學(xué)習(xí)是人工智能的基礎(chǔ),本文針對Alpha Go深度學(xué)習(xí)分析,講述了深度學(xué)習(xí)算法實(shí)現(xiàn)原理。
關(guān)鍵詞:人工智能;深度學(xué)習(xí);深度卷積神經(jīng)網(wǎng)絡(luò)
2016年3月9日,谷歌人工智能Alpha Go與世界圍棋冠軍李世石進(jìn)行了舉世矚目的人機(jī)大戰(zhàn),人們的焦點(diǎn)再次聚集到人工智能。從人工智能提出60年來,人工智能取得長足發(fā)展,成為一門廣泛的交叉和前沿科學(xué)。人工智能發(fā)展到現(xiàn)在嶄新的階段,主要來自于機(jī)器學(xué)習(xí)中的一個子分支——深度學(xué)習(xí)。
一、深度學(xué)習(xí)
深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究,屬于機(jī)器學(xué)習(xí)研究中的一個新的領(lǐng)域。深度學(xué)習(xí)是指人工智能對從未經(jīng)過標(biāo)記的數(shù)據(jù)展開學(xué)習(xí)、訓(xùn)練,自行掌握概念,學(xué)會辨識聲音、圖像和其他數(shù)據(jù),這種學(xué)習(xí)方式更接近人腦的方式。深度學(xué)習(xí)主要是以構(gòu)建深層結(jié)構(gòu)來學(xué)習(xí)多層次的表示,并不是特指某種機(jī)器學(xué)習(xí)算法或模型,而是一種技術(shù)。
在人工神經(jīng)網(wǎng)絡(luò)研究中,研究人員利用解剖學(xué)知識發(fā)現(xiàn)大腦表示信息的方式:通過感官信號接收到的刺激信號通過一個復(fù)雜的層狀網(wǎng)絡(luò)模型獲取觀測數(shù)據(jù)展現(xiàn)的規(guī)則。也就是說,人腦是根據(jù)經(jīng)聚集和分解過程處理后的信息來識別物體。因此視皮層的功能是對感知信號進(jìn)行特征提取和計(jì)算,而不僅僅是簡單地重現(xiàn)視網(wǎng)膜的圖像。人類感知系統(tǒng)這種明確的層次結(jié)構(gòu)極大地降低了視覺系統(tǒng)處理的數(shù)據(jù)量,并保留了物體有用的結(jié)構(gòu)信息。人工神經(jīng)網(wǎng)絡(luò)是在對人腦組織結(jié)構(gòu)和運(yùn)行機(jī)制的認(rèn)識理解基礎(chǔ)之上模擬其結(jié)構(gòu)和智能行為的一種工程系統(tǒng),而含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。
深度學(xué)習(xí)通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。其動機(jī)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),從而模仿人腦的機(jī)制來解釋數(shù)據(jù),例如圖像,聲音和文本。它比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)擁有更多的隱含層,使用更多的網(wǎng)絡(luò)層次來模擬大腦的學(xué)習(xí)機(jī)制,并克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法在多層情況下訓(xùn)練困難的問題。它同樣是人工神經(jīng)網(wǎng)絡(luò),突破之處在于它的網(wǎng)絡(luò)層次和解決訓(xùn)練難度的方法。
二、Alpha Go深度學(xué)習(xí)技術(shù)過程分析
從自然期刊論文提供的資料分析,Alpha Go主要是通過把已有的技術(shù)整合在一起,并利用大量的訓(xùn)練數(shù)據(jù)和計(jì)算資源來提高準(zhǔn)確性,所以其核心仍然是強(qiáng)大的計(jì)算平臺和工程能力。Alpha Go主要用到的核心技術(shù):機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí);啟發(fā)式搜索算法的蒙特卡羅樹搜索算法,另外,深度學(xué)習(xí)模型里的深度卷積神經(jīng)網(wǎng)絡(luò)和優(yōu)化方法中的一階方法一起構(gòu)成了Alpha Go的核心組件。
圍棋人工智能問題的核心在于搜索。最簡單的方法其實(shí)就是把所有的可能性羅列出來,然后從中選出最優(yōu)的方案。實(shí)際圍棋比賽中這種“可能性”太多,即搜索空間過于龐大。即使耗費(fèi)再多的硬件資源,把每種可能的情況都做一遍驗(yàn)證也不現(xiàn)實(shí)。所以Alpha Go的核心技術(shù)避免窮舉這些所有的可能性,而是利用更聰明的方式(比如近似)來找到那些有可能促使勝利的策略。當(dāng)一個選手把白色棋子放在9*9小棋盤上的時候,對于機(jī)器來說它有80種可能的走子方案(9*9-1),這稱之為廣度(Breadth)。機(jī)器確認(rèn)了下一步走子方案的時候,選手就可以選擇剩下的79種走子方案。很容易看出,僅僅簡單的兩步就共產(chǎn)生了80*79種不同的組合。所以,當(dāng)一個游戲的長度為N的時候(也稱之為深度Depth),考慮所有的可能性是不現(xiàn)實(shí)的。總的可能性數(shù)目依賴于前面所提到的廣度和深度,所以我們的目標(biāo)就是要降低搜索空間的大小,即要降低廣度和深度。
走棋網(wǎng)絡(luò)的目的是為了減少廣度。對于一個給定的棋盤狀態(tài),我們要盡量把需要考慮的范圍減少,同時也要考慮最優(yōu)的走子方案。通過走棋網(wǎng)絡(luò)我們可以只選擇可能性較大的走子方案,而不去考慮剩下的方案。從數(shù)學(xué)的角度來講,對于給定的一個棋盤狀態(tài),先計(jì)算概率分布,然后從中選擇最為合理的走子方案。Alpha Go系統(tǒng)中選用深度神經(jīng)網(wǎng)絡(luò)中的一種——深度卷積神經(jīng)網(wǎng)絡(luò)方法來計(jì)算概率分布。在Alpha Go系統(tǒng)里,深度卷積神經(jīng)網(wǎng)絡(luò)的輸入是一個棋盤(可以把棋盤看做是一幅圖,棋盤上的黑子和白子分別可以用1和-1來表示,剩下的空位置可以用0來表示),其實(shí)相當(dāng)于一個矩陣。它的輸出就是不同走子方案的概率分布,然后基于這個分布,可以做下一步的決策。為了達(dá)到訓(xùn)練的目的,Alpha Go需要大量的訓(xùn)練樣本,樣本就是職業(yè)玩家的比賽記錄。訓(xùn)練好的模型就可以用來模擬高手似的走法。整個樣本的訓(xùn)練過程需要大量的計(jì)算資源。Alpha Go系統(tǒng)會從已有的比賽歷史中去學(xué)習(xí)頂級高手的走子方案。也就是說,給定一個棋盤狀態(tài),Alpha Go會試圖去模仿專家的走法,并判斷哪中走法最有利。然而,Alpha Go并沒有停留在這一步,而是接著用強(qiáng)化學(xué)習(xí)的方式來進(jìn)一步提高系統(tǒng)的性能。強(qiáng)化學(xué)習(xí)主要用來搜集更多的樣本,從而提高系統(tǒng)的準(zhǔn)確率。采用做法是把訓(xùn)練出來的模型倆倆做對抗,根據(jù)比賽的結(jié)果再更新模型的參數(shù)。所以這是機(jī)器和機(jī)器之間的較量,這種迭代會反復(fù)很多次。通過這種迭代,最初的模型最后可能演變成了另一種模型,這種通過不斷地自我提升訓(xùn)練出來的模型在大部分情況下會勝出最初的專家模型。
三、深度學(xué)習(xí)應(yīng)用現(xiàn)狀及不足
深度學(xué)習(xí)的應(yīng)用對象不僅包含語音、圖像、視頻,也包含文本、語言和語義信息。深度學(xué)習(xí)已成功應(yīng)用于多種模式分類問題。這一領(lǐng)域雖處于發(fā)展初期,但它的發(fā)展無疑會對機(jī)器學(xué)習(xí)和人工智能系統(tǒng)產(chǎn)生影響。同時它仍存在某些不適合處理的特定任務(wù),譬如語言辨識,生成性預(yù)訓(xùn)練提取的特征僅能描述潛在的語音變化,不會包含足夠的不同語言間的區(qū)分性信息;虹膜識別等每類樣本僅含單個樣本的模式分類問題也是不能很好完成的任務(wù)。
四、結(jié)束語
深度學(xué)習(xí)目前仍有大量工作需要研究。模型方面是否有其他更為有效且有理論依據(jù)的深度模型學(xué)習(xí)算法,探索新的特征提取模型是值得深入研究的內(nèi)容。此外有效的可并行訓(xùn)練算法也是值得研究的一個方向。在深度學(xué)習(xí)應(yīng)用拓展方面,如何充分合理地利用深度學(xué)習(xí)在增強(qiáng)傳統(tǒng)學(xué)習(xí)算法的性能仍是目前各領(lǐng)域的研究重點(diǎn)。
[參考文獻(xiàn)]
[1]李凡長.《機(jī)器學(xué)習(xí)》.中國科學(xué)技術(shù)大學(xué)出版社,ISBN:9787312026362.
[2]周志華.《機(jī)器學(xué)習(xí)及其應(yīng)用》.清華大學(xué)出版社,ISBN:9787302204190,2009.
*作者簡介:劉召華(1976-),男,漢族,陜西鳳翔人,在職碩士,寶雞職業(yè)技術(shù)學(xué)院,計(jì)算機(jī)網(wǎng)絡(luò)專業(yè)助講,研究方向:物聯(lián)網(wǎng)。
中圖分類號:B82-057
文獻(xiàn)標(biāo)識碼:A
文章編號:1006-0049-(2016)14-0223-01