丁日智
摘要:人工智能指用人工的方法去模擬和實現(xiàn)人類智能,是一門新的技術科學。本文圍繞人機圍棋大戰(zhàn)事件,對人工智能的概念、AlphaGo的工作原理和人工智能的意義進行了論述,讓我們對人工智能有了更深刻的認識。
關鍵詞:AlphaGo;人工智能;圍棋;原理;發(fā)展
1 人工智能概述
2016年3月15日,AlphaGo以4:1的絕對優(yōu)勢戰(zhàn)勝世界圍棋冠軍李世石,排名世界第二,僅次于中國九段選手柯潔。這場引人矚目的“人機大戰(zhàn)”瞬間卷起一陣“科技”風暴,“人工智能”一時間成為人們密切關注的話題。
人工智能的本質是對人的意識、思維的信息過程的模擬,它并非擁有人一樣的“大腦”,而是像人一樣可以思考,并做出與人相似的智能反應。也可指用人工的方法去模擬和實現(xiàn)人類智能,它需要軟件和硬件的緊密結合。目前實現(xiàn)的方式通常是利用計算機來模擬人們某些思維過程和行為方式,并且計算機的計算處理能力遠超人腦,準確度也明顯優(yōu)于人腦。人工智能的快速發(fā)展,是對人類智能的延伸擴展,體現(xiàn)著人類獨有的智慧。而如何讓計算機實現(xiàn)智能行為,使其更高效便捷地服務人類則是人們要攻克的技術難題。
AlphaGo,中譯名阿爾法圍棋,便是當下人工智能杰出的代表作之一,是由谷歌旗下人工智能公司DeepMind創(chuàng)造的一款智能圍棋程序。AlphaGo的勝利代表著人工智能發(fā)展史上又一重大里程碑。這個程序利用“價值網絡”去計算局面,用“策略網絡”去選擇下子,高度模擬了人類神經網絡思維模式,并具有自我學習功能,完全具備一名職業(yè)選手的下棋水準。
2 AlphaGo人工智能基本原理
圍棋擁有著5000多年的悠久歷史,是中國古代四大藝術之一。一個棋盤上縱橫各有19道,共有361個交叉點,但局面數(shù)量卻可達3^361,體量約為10^170,而全宇宙的原子數(shù)量只有10^80,這足以體現(xiàn)出圍棋的復雜程度和變幻莫測的棋形。因此面對如此復雜的圍棋規(guī)則,人工智能夠具有與人類相似的思維模式和高質量的落子判斷能力是極為不容易的。
若AlphaGo通過計算,將所有的可能性步驟都羅列出來,這需要很大的計算量和極高的硬件開銷,當然這也是不理想的事。AlphaGo之所以有著強大的應變能力和處理能力依靠的是深度學習和強化學習這一新型人工智能學習模式。
深度學習是指通過合適的矩陣數(shù)量,將多層組織鏈接一起形成神經網絡“大腦”進行精準復雜的處理,就像人們識別物體標注圖片一樣。
強化學習則是通過不斷反復試驗,將變化無常的動態(tài)情況與對應動作相匹配。AlphaGo會通過上百萬盤的棋盤對戰(zhàn)來獲取經驗教訓,這好比“吃一塹長一智”,多次高強度對戰(zhàn)將不斷優(yōu)化進AlphaGo策略判斷能力,因此AlphaGo只會變得越來越強。且AlphaGo的深度學習是無監(jiān)督或半監(jiān)督機器學習,這樣它就可以無需人力參與便可自主得到高強度專業(yè)化訓練。
此外AlphaGo還擁有著兩個不同神經網絡“大腦”。AlphaGo不斷重復訓練,依靠兩個“大腦”檢查對弈結果并調整程序參數(shù),使得下次執(zhí)行能力變得更強。第一大腦是落子選擇器,也稱為“監(jiān)督學習的策略網絡”,就是通過觀察棋盤布局嘗試找出概率最高的下一步合法棋。AlphaGo的目標是學會職業(yè)圍棋手的高超棋藝,為此它需要百萬級的對弈落子來強化“大腦”。但這上百萬次的對弈主要目標并不是贏,而是把每一個模擬棋局進行到底,不斷學會最可能贏的下一步棋,最終具備職業(yè)圍棋手的落子分析能力;第二大腦是棋局評估器,也稱為“價值網絡”。它不會去擬合下一步棋,而是預測每一步棋贏棋的可能性,并通過整體局面判斷來輔助落子選擇器。若評估器判斷此步棋為劣棋,那么它會忽略由此步棋延伸的任何其他落子可能性。棋局評估器亦需通過百萬次的對弈訓練。對弈中它可分析判斷出任意棋局黑白兩方的贏棋概率。而人類的能力和精力是有限的,如此高強度的訓練人類恐怕難以做到。不過若僅使用AlphaGo的核心處理芯片,它的“棋藝”將與其它計算機圍棋類似,但綜合以上處理方式,便可達到人類頂尖棋手水平。
3 總結人工智能的意義和發(fā)展
雖然在人機大戰(zhàn)中計算機獲得勝利,但這并不意味著人工智能已經達到高度發(fā)達的水平,在功能和技術方面,人工智能還需要不斷完善。圍棋大戰(zhàn)只能反映出在規(guī)則既定的計算領域中,計算機的處理能力遠超人類。而人類思維、情感、溝通等方面是目前人工智能無法比擬的。隨著科學技術不斷發(fā)展,人工智能和人類的差距將會不斷縮小,未來的人工智能除了準確地做出分析判斷外,還將會逐漸理解人類語言,意會人類的情感表達,這意味著人工智能會達到更高的領地。
總的來說,機器獲勝表明人工智能技術正在快速發(fā)展,又一輪新的產業(yè)將不斷推進著世界向前發(fā)展。人工智能的終極目標是能夠與人類一樣的認知世界,并更好地造福人類,為世界做出巨大的貢獻。但萬事皆有利弊,我們萬萬不能讓電影中機器統(tǒng)治人類的劇情上演。因此人們只有對人工智能做出更加徹底全面地研究,使人工智能技術趨于成熟,才能讓擁有強大運算能力的機器替人類做許多繁雜的工作,甚至超越人類。倘若正確運用人工智能,那么它將極大程度上推動人類文明的進步。