陳東焰 陸暢
摘 ? 要:2017年5月,AlphaGo以3:0戰(zhàn)勝世界排名第一的柯潔九段,一時間引起了人們對人工智能的熱議。AlphaGo主要工作原理是深度學(xué)習(xí),它屬于機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)又屬于人工智能的范疇。可以說機(jī)器學(xué)習(xí)是近年來人工智能領(lǐng)域最熱門的板塊,吸引著諸多研究者投入了大量的研究,也有著豐富的產(chǎn)出。本文從AlphaGo談起,介紹人工智能的發(fā)展,機(jī)器學(xué)習(xí)的概念理解、分類及應(yīng)用,分析了模型訓(xùn)練中的常見問題,人工智能與倫理的關(guān)系。
關(guān)鍵詞:人工智能 ?機(jī)器學(xué)習(xí) ?模型
中圖分類號:TP181 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識碼:A ? ? ? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2020)05(a)-0146-02
2017年5月,AlphaGo Master以3:0戰(zhàn)勝了世界排名第一的柯潔九段,一時間引起了不小的轟動。
AlphaGo是一款圍棋程序,由Google的DeepMind公司開發(fā)。早在2015年10月,AlphaGo就以5:0戰(zhàn)勝樊麾二段;2016年3月,AlphaGo以4:1戰(zhàn)勝擁有18個世界冠軍頭銜的職業(yè)九段李世石;2016年12月29日—2017年1月4日,AlphaGo在網(wǎng)絡(luò)圍棋平臺上以“Master”為注冊號60:0戰(zhàn)勝數(shù)十名中韓日職業(yè)圍棋手;2017年10月18日,最終版本AlphaGo Zero問世,它經(jīng)過3d的訓(xùn)練以100:0的戰(zhàn)績擊敗了AlphoGo Lee,經(jīng)過40d的訓(xùn)練擊敗了AlphoGo Master 。
AlphaGo前期版本,結(jié)合了數(shù)百萬人類圍棋專家的棋譜, AlphaGo Zero則有了質(zhì)的提升,它不再需要人類數(shù)據(jù)和經(jīng)驗,研發(fā)團(tuán)隊讓它進(jìn)行自我博弈,3d的訓(xùn)練時間,自我對弈的棋局?jǐn)?shù)量為490萬盤。
AlphaGo主要工作原理是“深度學(xué)習(xí)”,深度學(xué)習(xí)是指多層的人工神經(jīng)網(wǎng)絡(luò)和訓(xùn)練它的方法。它屬于最近十年一個特別火的技術(shù)“機(jī)器學(xué)習(xí)”(ML),機(jī)器學(xué)習(xí)又屬于人工智能(AI)的范疇。
1 ?從機(jī)器學(xué)習(xí)的角度看人工智能的發(fā)展史
1956年夏天,美國達(dá)特茅斯學(xué)院舉行了人工智能研討會,被認(rèn)為是人工智能誕生的標(biāo)志。會上約翰·麥卡錫首次提出了“人工智能”這個概念。
1959年,IBM公司的計算機(jī)專家阿瑟·塞繆爾創(chuàng)造了“機(jī)器學(xué)習(xí)”一詞。
1958年,機(jī)器人之父恩格爾伯格和發(fā)明家德沃爾合作創(chuàng)立一家生產(chǎn)機(jī)器人的公司,當(dāng)年就產(chǎn)出了一個可以自動完成搬運(yùn)的機(jī)械手臂。1961年,第一臺工業(yè)機(jī)器人Unimation在通用汽車試運(yùn)行,作用非常顯著。
1973年,世界第一個人形機(jī)器人Wabot-1在早稻田大學(xué)誕生,它可以進(jìn)行簡單日語對話,測量距離和方向,靠雙腳行走,兩手有觸覺,可搬運(yùn)物體行動。1980年,WABOT-2問世,可以用手腳靈活地演奏電子琴。
20世紀(jì)70年代初,當(dāng)時的計算機(jī)有限的內(nèi)存和處理速度不足以解決實際的人工智能問題,加上數(shù)學(xué)模型和數(shù)學(xué)手段有一定的缺陷,對人工智能研究的資助逐漸停止,人工智能進(jìn)入第1個低谷。
直到1980年著名的專家系統(tǒng)XCON的研發(fā),1982年霍普菲爾德神經(jīng)網(wǎng)絡(luò)被提出,1986年BP算法出現(xiàn),使大規(guī)模神經(jīng)網(wǎng)絡(luò)的訓(xùn)練成為可能,將人工智能推向第2個黃金期。
20世紀(jì)80年代晚期,美國國防高級研究計劃局對AI的投資再次減少,1987—1993年,人工智能進(jìn)入第2個低谷。
1997年5月,IBM的“深藍(lán)”計算機(jī)戰(zhàn)勝國際象棋大師加里·卡斯帕羅夫,它存儲了從18世紀(jì)起的200多萬經(jīng)典對局。
2006年,杰弗里·辛頓提出“深度學(xué)習(xí)”神經(jīng)網(wǎng)絡(luò),使得人工智能性能獲得突破性進(jìn)展。2013年,深度學(xué)習(xí)算法在語音和視覺識別上取得成功,人工智能進(jìn)入感知智能時代。
2006年,伊利諾伊大學(xué)香檳分校教授李飛飛發(fā)現(xiàn),相對于更好的算法,數(shù)據(jù)也非常重要,她建立了數(shù)據(jù)集ImageNet。2017年的圖像識別率提升到97.3%,超過了人類,證明了更龐大的數(shù)據(jù)可以帶來更好的決策。
2011年IBM的超級計算機(jī)Watson在美國著名智力節(jié)目《危機(jī)邊緣》中戰(zhàn)勝了人類,2015—2017年AlphaGo打敗了人類。
2 ?理解機(jī)器學(xué)習(xí)及應(yīng)用
機(jī)器學(xué)習(xí)的經(jīng)典定義:利用經(jīng)驗來改善計算機(jī)系統(tǒng)的性能。
傳統(tǒng)上,如果我們想讓計算機(jī)工作,會給它一串指令,一步步執(zhí)行下去。但機(jī)器學(xué)習(xí)不接受輸入的指令,它只接收數(shù)據(jù),也就是說機(jī)器學(xué)習(xí)是一種讓計算機(jī)利用數(shù)據(jù)而不是指令來進(jìn)行工作的方法,是通過歸納思想得出的相關(guān)結(jié)論。簡單來講,“機(jī)器學(xué)習(xí)”的原理就是模仿人類學(xué)習(xí)的過程,通過經(jīng)驗來強(qiáng)化自己,所以說機(jī)器學(xué)習(xí)超越人類是完全有可能的。
我們可以這樣理解機(jī)器學(xué)習(xí)的過程:
1+2=?機(jī)器:10;——太大了;
5+7=?機(jī)器:6:——太小了;
2+6=?機(jī)器:8;——答對了。
機(jī)器知道了2+6=8,它會在不斷的試誤中找到正確的答案,在一步步地調(diào)整自己學(xué)習(xí)的方式方法和路徑的同時,優(yōu)化計算過程,保證盡可能少出錯,當(dāng)它能夠完全一次性算出正確結(jié)果時,它的模型擬合成功,可以被投入使用了。
機(jī)器學(xué)習(xí)的應(yīng)用方向:有現(xiàn)存的解決方案,但是需要手寫大量規(guī)則的問題;不存在較好的解決方案的復(fù)雜問題;不斷發(fā)展的問題,機(jī)器學(xué)習(xí)可以適應(yīng)新的數(shù)據(jù);希望通過機(jī)器學(xué)習(xí),對復(fù)雜問題和大量數(shù)據(jù)得到一些新的見解。
3 ?機(jī)器學(xué)習(xí)的分類
機(jī)器學(xué)習(xí)有不同的分類方法,常見的按是否在人為監(jiān)督下學(xué)習(xí)分為:監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、增強(qiáng)學(xué)習(xí)。
監(jiān)督機(jī)器學(xué)習(xí):需要提供帶有標(biāo)簽的數(shù)據(jù)。例如,要區(qū)分男孩和女孩的圖片,那么男孩的照片打上“男孩”、女孩的照片打上“女孩”標(biāo)簽,訓(xùn)練模型,直到它能通過測試。
半監(jiān)督機(jī)器學(xué)習(xí):只有少數(shù)圖像被標(biāo)記,計算機(jī)程序?qū)ξ礃?biāo)記的圖像進(jìn)行最佳猜測,然后作為訓(xùn)練數(shù)據(jù)反饋給程序。比如,你有一個相片集,拿出部分相片,把自己的相片標(biāo)識成“我”,把其他人的相片標(biāo)識成“某人”,訓(xùn)練模型,直到它能夠做出正確的分辨。
無監(jiān)督機(jī)器學(xué)習(xí):這種類型的機(jī)器學(xué)習(xí)不涉及任何標(biāo)簽,任由機(jī)器深入到數(shù)據(jù)中去發(fā)現(xiàn)和體驗,并尋找模式和聯(lián)系,然后得出結(jié)論。
強(qiáng)化學(xué)習(xí):強(qiáng)化學(xué)習(xí)把學(xué)習(xí)看作試探評價過程,智能體選擇一個動作用于環(huán)境,同時產(chǎn)生一個強(qiáng)化信號(獎或懲),智能體根據(jù)強(qiáng)化信號和環(huán)境當(dāng)前狀態(tài)再選擇下一個動作,選擇的原則是使受到正強(qiáng)化(獎)的概率增大。
4 ?訓(xùn)練模型時的常見問題
為了訓(xùn)練出更好的機(jī)器學(xué)習(xí)模型,我們會先選擇一個合適的機(jī)器學(xué)習(xí)算法,再準(zhǔn)備好不同的參數(shù),訓(xùn)練模型,得到合適的參數(shù)。
例如我們現(xiàn)在要做一個分辨一個物體是否是蘋果的模型,蘋果有很多品種,它要學(xué)習(xí)蘋果這些特征,把這學(xué)到的所有特征整合,也就是模型擬合。
有時存在這樣的問題:如果從一開始就界定蘋果是紅顏色的,那么,給一個青蘋果時,機(jī)器會認(rèn)為不是蘋果,這就是過擬合。一般認(rèn)為過擬合是由于網(wǎng)絡(luò)過深,模型的構(gòu)建關(guān)注到了本不是蘋果的特征,導(dǎo)致學(xué)習(xí)有誤。過擬合經(jīng)常表現(xiàn)為訓(xùn)練時,得分很高,但在測試時正確率卻很低。這時候就需要機(jī)器做及時的完善,學(xué)習(xí)成蘋果是有顏色的即可。
有時也會存在這樣的情況:如果構(gòu)建的模型,只認(rèn)為蘋果特征是圓的,那么給一個桔子,它也認(rèn)為是蘋果,這說明機(jī)器對蘋果特征的學(xué)習(xí)還不夠,這就是欠擬合。一般認(rèn)為欠擬合是由于網(wǎng)絡(luò)過小造成的,因此機(jī)器就還需要更多的學(xué)習(xí)來認(rèn)識蘋果。
5 ?人工智能與倫理
控制論之父維納在《人有人的用處》中在談到自動化技術(shù)和智能機(jī)器時,得出了一個危言聳聽的結(jié)論:“這些機(jī)器的趨勢是要在所有層面上取代人類,而非只是用機(jī)器能源和力量取代人類的能源和力量?!彪m然維納的話在今天還沒有成為現(xiàn)實,但已經(jīng)成為諸多文學(xué)和影視作品中的題材,人們也在討論人工智能究竟在何時會形成屬于自己的意識,超越人類,讓人類淪為它的奴仆。目前人工智能相關(guān)的倫理和法律研究相對滯后,但可喜的是,我們看到有許多有識之士在呼吁大家共同遵循安全的理念和規(guī)則。相信機(jī)器學(xué)習(xí)能給人類帶來美好的明天。
參考文獻(xiàn)
[1] 周志華.機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016.
[2] 李德毅,于劍.人工智能導(dǎo)論[M].北京:中國科學(xué)技術(shù)出版社,2018.
[3] Aurélien Géron.Hands-On Machine Learning with Scikit-Learn and Tensor Flow[M].CA:O'Reilly Media,Inc,2017.