邱強(qiáng)
近年來,隨著科學(xué)技術(shù)的發(fā)展,各種人工智能和機(jī)器人的消息開始霸占各類媒體的頭條:AlphaGo以60∶0的成績戰(zhàn)勝人類頂尖圍棋選手,波士頓動(dòng)力發(fā)布最新機(jī)器人Handle,百度機(jī)器人在《最強(qiáng)大腦》中連勝人類選手……
我們不禁開始擔(dān)心,機(jī)器人是否會(huì)忽然覺醒并反抗人類?就連著名物理學(xué)家霍金也曾多次發(fā)出警告:人工智能在發(fā)展到一定程度之后,很可能會(huì)通過核戰(zhàn)爭或是生物戰(zhàn)爭摧毀人類。說到人工智能消滅人類的話題,我們不得不提《終結(jié)者》系列電影。導(dǎo)演詹姆斯·卡梅隆用兩部經(jīng)典科幻電影為我們描述了人工智能“天網(wǎng)”覺醒并統(tǒng)治人類的末日?qǐng)D景。那么,現(xiàn)實(shí)中我們離曾經(jīng)的經(jīng)典影片幻想又有多遠(yuǎn)呢?
誕生與覺醒
在首部《終結(jié)者》電影中,全球高級(jí)計(jì)算機(jī)控制系統(tǒng)“天網(wǎng)”于公元1997年7月3日獲得了武器的控制權(quán)限,并產(chǎn)生了自我意識(shí)。“天網(wǎng)”將人類視為威脅自己生存的敵人,于是它發(fā)起了核戰(zhàn)爭,殺死了數(shù)十億人。剩下的人類在約翰·康納的領(lǐng)導(dǎo)下,與“天網(wǎng)”制造的終結(jié)者T-600機(jī)器人作戰(zhàn),并逐步扭轉(zhuǎn)戰(zhàn)局。為了挽回?cái)【?,“天網(wǎng)”制造出時(shí)間機(jī)器,將終結(jié)者T-800機(jī)器人送回到1984年,讓其在約翰出生前殺死約翰的母親莎拉·康納。同時(shí),約翰也派出人類戰(zhàn)士凱爾回到過去阻止T-800。最終,莎拉用液壓機(jī)消滅了T-800,她與凱爾的孩子——約翰·康納——也順利出生。
受限于當(dāng)時(shí)的特效技術(shù),第一部《終結(jié)者》只能采用逐幀拍攝的方法展現(xiàn)T-800機(jī)器人,卡梅隆所設(shè)想的液體機(jī)器人也沒能在首部電影中出場。但是,T-800受傷后露出的金屬骨骼與電子眼睛已經(jīng)成了不少人的童年陰影(誒?可我覺得很酷?。?。
從液態(tài)金屬到最強(qiáng)機(jī)器人
在《終結(jié)者2:審判日》中,“天網(wǎng)”繼續(xù)派出更高級(jí)的液態(tài)機(jī)器人T-1000回到1995年,去刺殺只有10歲的小約翰。T-1000采用液態(tài)金屬制造,可以自由變換形體,能抵抗絕大部分物理攻擊。為了阻止T-1000,人類將一臺(tái)捕獲的T-800重新編程,并送回過去。在經(jīng)歷了與T-1000危險(xiǎn)緊張的追殺之后,約翰與莎拉終于相信T-800不再是11年前那個(gè)狠辣無情的魔鬼終結(jié)者。為了改變?nèi)祟惖拿\(yùn),約翰、莎拉和T-800找到了“天網(wǎng)”系統(tǒng)的開發(fā)者——塞伯公司的技術(shù)總監(jiān)莫爾斯戴森,讓其銷毀了一切有關(guān)“天網(wǎng)”的資料,并將T-1000終結(jié)在煉鋼廠的高溫鐵水中。為了徹底銷毀來自未來的資料,以防人類重新造出“天網(wǎng)”,T-800做出了犧牲自己的選擇,自沉鋼水之中毀滅。
《終結(jié)者2:審判日》在繼承首部《終結(jié)者》的經(jīng)典立意的同時(shí),也增添了更加華麗的特效,即使是現(xiàn)在看來,《終結(jié)者2:審判日》中液態(tài)機(jī)器人T-1000的特效也一點(diǎn)不過時(shí)。而影片中T-800與小約翰的互動(dòng)也為其增添了不少人情味,讓T-800在約翰心中樹立了一個(gè)類似父親的形象。影片最后,T-800的一句“我現(xiàn)在知道你們?yōu)槭裁磿?huì)哭了,但那是我永遠(yuǎn)做不到的事”也戳中了無數(shù)觀眾的淚點(diǎn)。
而之后的幾部終結(jié)者影片雖然沒能超越《終結(jié)者2》,但也算是不錯(cuò)的商業(yè)電影。尤其是第三部中的T-X女性終結(jié)者,具有直接操控其他機(jī)器的能力,更是成了最強(qiáng)“終結(jié)者”。
勝負(fù)難分的現(xiàn)實(shí)PK
雖然電影中的“審判之日”(1997年)早已過去,但近年來不斷霸占熱門頭條的人工智能機(jī)器人新聞,讓我們不得不時(shí)刻擔(dān)心《終結(jié)者》所描述的場景是否真的會(huì)發(fā)生?在這個(gè)科技大爆炸的時(shí)代,我們離電影中的人形機(jī)器人還有多遠(yuǎn)?
硬件材料
首先是機(jī)器人硬件,這主要涉及制造機(jī)器人所用的材料、機(jī)器人的結(jié)構(gòu)等。我們先來看看終結(jié)者們的情況:第一部開頭出現(xiàn)的T-600具有跟人類完全相同的自由度配置,骨架為超合金,外表是裸露的金屬或者覆蓋以容易被人識(shí)別的塑料皮膚;T-800則采用活性皮膚組織,具有跟人類完全相同的外表,同時(shí)配備可以連續(xù)工作120年的核反應(yīng)燃料電池;T-1000和T-X則采用液態(tài)金屬,能夠隨意變換外形。
現(xiàn)實(shí)中的機(jī)器人呢?波士頓動(dòng)力制造的Atlas具有與人類相似的自由度配置;日本東京大學(xué)的Kenshiro機(jī)器人則模仿人類采用人工肌肉作為驅(qū)動(dòng)方式;日本產(chǎn)綜研的HRP-4C則采用硅膠皮膚,擁有與人類相似的外表。但是,在能源方面,現(xiàn)實(shí)機(jī)器人跟終結(jié)者們的差距就很大了,如波士頓動(dòng)力的Handle機(jī)器人充滿電后,只能行駛約24km。而在液態(tài)金屬方面,雖然清華大學(xué)一課題組發(fā)明了可以控制變形的“液態(tài)金屬軟體機(jī)器”,但這只是進(jìn)行簡單的定向形變,離做成機(jī)器人還有非常遠(yuǎn)的距離,更別說在其中放入控制電路了。
因此從硬件角度上看,我們現(xiàn)實(shí)中的機(jī)器人技術(shù)大約相當(dāng)于T-600。
感知能力
其次,讓我們對(duì)比一下機(jī)器人的感知能力。感知是指機(jī)器人了解環(huán)境與自身狀態(tài)的過程,包括用于獲取信號(hào)的傳感器與從信號(hào)中獲取信息的信息處理算法。
當(dāng)然,這里我們并不清楚終結(jié)者們到底安裝了哪些傳感器,所以簡單進(jìn)行一個(gè)猜測:聽覺傳感器(可以聽到聲音)、多光譜高分辨率相機(jī)(能夠夜視、放大等)、關(guān)節(jié)力矩傳感器(可以感受到別人觸碰自己)。由于現(xiàn)在的機(jī)器人實(shí)驗(yàn)室基本不差錢,所以,在安裝傳感器方面,現(xiàn)實(shí)中的機(jī)器人并不比終結(jié)者們差:佩戴的麥克風(fēng)可以聽取聲音,各種高精度相機(jī)、紅外相機(jī)、深度相機(jī)、激光雷達(dá)可以作為機(jī)器人的眼睛,部分機(jī)器人也安裝了高精度的力矩傳感器。
但是,在信號(hào)處理方面,現(xiàn)實(shí)中的機(jī)器人就遠(yuǎn)遠(yuǎn)比不上終結(jié)者們了——
物體識(shí)別:雖然現(xiàn)在的深度學(xué)習(xí)算法大大提高了機(jī)器人識(shí)別物體的能力,但依舊做不到像T-800那樣在酒吧中迅速找到和定位莎拉·康納;
語義理解:終結(jié)者們可以跟人類無障礙交流,而我們現(xiàn)在最強(qiáng)的聊天機(jī)器人才剛剛通過圖靈測試;
環(huán)境理解:終結(jié)者們可以在從未見過的1984年街道上四處奔走,而我們現(xiàn)在的機(jī)器人只能在某些特定條件下,利用前期建立的地圖進(jìn)行定位導(dǎo)航。
因此,在感知方面,現(xiàn)在的機(jī)器人還未達(dá)到終結(jié)者們的水平,但是,隨著深度學(xué)習(xí)理論的發(fā)展與應(yīng)用,這個(gè)領(lǐng)域有望在十年內(nèi)出現(xiàn)可以使用的技術(shù)。
規(guī)劃算法
再來看看規(guī)劃算法,規(guī)劃是指根據(jù)給定的任務(wù)和機(jī)器人當(dāng)前狀態(tài),計(jì)算出完成這個(gè)任務(wù)的方法。包括且不限于任務(wù)規(guī)劃、運(yùn)動(dòng)規(guī)劃和路徑規(guī)劃。
任務(wù)規(guī)劃是指機(jī)器人將任務(wù)劃分為幾個(gè)可以具體操作的子任務(wù)。舉個(gè)“栗子”,我們想讓機(jī)器人送瓶飲料,那么機(jī)器人會(huì)將這個(gè)大任務(wù)分解成幾個(gè)子任務(wù):“運(yùn)動(dòng)到冰箱前→打開冰箱→找到飲料→取出飲料→關(guān)上冰箱→送到人面前”。
當(dāng)然,可以有更復(fù)雜的任務(wù)。目前,一般是采用馬爾科夫決策過程來描述問題,然后用各種規(guī)劃算法求解。總體上說,現(xiàn)在的任務(wù)規(guī)劃強(qiáng)烈依賴于任務(wù)描述方式,而且在應(yīng)對(duì)大規(guī)模、不完全可觀等復(fù)雜問題時(shí),還沒有可靠的方法。與之對(duì)應(yīng),“天網(wǎng)”只需給T-800下達(dá)“殺死莎拉·康納”的任務(wù),他就能自動(dòng)將其分解成“尋找電話簿→找到名字為莎拉·康納的人→到這個(gè)人家→殺死她→確認(rèn)任務(wù)是否完成”,如果發(fā)現(xiàn)殺錯(cuò)了人,會(huì)立即重新計(jì)算出完成任務(wù)的方法。
運(yùn)動(dòng)規(guī)劃是指要完成某個(gè)子任務(wù),機(jī)器人每個(gè)關(guān)節(jié)的具體運(yùn)動(dòng)方式。舉個(gè)“栗子”,機(jī)器人面前有一杯水,讓機(jī)器人將手運(yùn)動(dòng)到杯子面前,同時(shí)不能碰到桌子等障礙物。是的,現(xiàn)在就連讓機(jī)器人拿起面前的杯子這樣的問題也還沒有完全解決。簡而言之,我們一般是采用基于隨機(jī)采樣的算法進(jìn)行運(yùn)動(dòng)規(guī)劃的,隨機(jī)采樣的意思就是:每次規(guī)劃的結(jié)果可能不同,更無法保證規(guī)劃出的路徑是最優(yōu)的。而在終結(jié)者上就完全沒有這個(gè)問題,施瓦辛格飾演的T-800在給槍上膛時(shí),動(dòng)作干脆,沒有任何多余動(dòng)作!
路徑規(guī)劃其實(shí)跟運(yùn)動(dòng)規(guī)劃類似,不過傾向于為移動(dòng)機(jī)器人規(guī)劃行駛軌跡。Google的無人駕駛汽車已經(jīng)在城市道路和高速路上行駛超過200公里,但是我們現(xiàn)在無人車路徑規(guī)劃還必須依賴于事先建立的地圖。而終結(jié)者則可以在任何環(huán)境中快速移動(dòng),直到將獵物終結(jié)為止。
在規(guī)劃方面,現(xiàn)實(shí)中的機(jī)器人可以說是剛剛起步,機(jī)器人沒法脫離人類的指導(dǎo)完成任務(wù),所以,在機(jī)器人的規(guī)劃算法達(dá)到終結(jié)者的水平之前,我們完全不必?fù)?dān)心太多。
模仿人類的超強(qiáng)控制
當(dāng)然,要想執(zhí)行規(guī)劃的動(dòng)作,就涉及機(jī)器人控制領(lǐng)域了,從底層的電機(jī)控制到上層的機(jī)器人全身控制都屬于這個(gè)范疇。我們不清楚T-800的控制是怎么做的,但看他可以到處跑、跳,基本可以確定現(xiàn)在的機(jī)器人控制技術(shù)還沒有達(dá)到這個(gè)水平 ——
機(jī)械臂控制:大約10年前,德國宇航局的Sami Haddadin已經(jīng)可以讓機(jī)械臂拿著一把小刀刺向自己而不會(huì)造成傷害。這是因?yàn)樗麑?duì)機(jī)械臂進(jìn)行了精確地建模與控制,讓小刀在剛接觸到人體的時(shí)候終止運(yùn)動(dòng)。
機(jī)械手操作:機(jī)械手的抓取操作問題就沒這么簡單了,因?yàn)槠渲猩婕皩?shí)際物理環(huán)境的建模問題,由于摩擦力和碰撞模型不精確,所以完全基于模型的方法很難解決這一問題。目前工業(yè)應(yīng)用基本還是采用平行夾持器的方式。只有一些研究機(jī)構(gòu)在進(jìn)行靈巧手抓取方面的研究。
足式機(jī)器人控制:機(jī)械臂至少得有個(gè)相對(duì)固定的基座,但足式機(jī)器人的基座則會(huì)隨著接觸發(fā)生變化。雖然很難,但波士頓動(dòng)力這個(gè)逆天的公司還是做出了不錯(cuò)的足式機(jī)器人??梢哉f波士頓動(dòng)力以一己之力將人類的足式機(jī)器人控制水平拉高了一個(gè)層次。
其余能力,艱難成長
再來看看機(jī)器人的容錯(cuò)能力。在《終結(jié)者》系列電影中,T-800全身浸入煉鋼爐后,依舊能豎起大拇指與小約翰告別;T-1000受液氮冷卻發(fā)生故障后,還能碾壓T-800;T-X只剩下一半身子還能爬行著追殺約翰??梢姡K結(jié)者系列機(jī)器人在機(jī)體發(fā)生大規(guī)模破損的情況下還可以繼續(xù)工作,具有強(qiáng)大的容錯(cuò)能力。
與此相反,現(xiàn)實(shí)中的機(jī)器人就脆弱多了,即使巴黎索邦大學(xué)的研究者們仿造動(dòng)物發(fā)明了一種自適應(yīng)控制算法,也只能應(yīng)對(duì)機(jī)器人非關(guān)鍵部位損壞的情況。也就是說,以目前機(jī)器人技術(shù)水平而言,我們用普通的手槍即可讓大部分機(jī)器人失去行動(dòng)能力。
最后,來看看學(xué)習(xí)能力。我們知道,機(jī)器學(xué)習(xí)分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)三類,深度學(xué)習(xí)主要在監(jiān)督學(xué)習(xí)方面得到了很好的應(yīng)用;此外,對(duì)于強(qiáng)化學(xué)習(xí),也逐漸以深度學(xué)習(xí)的形式出現(xiàn);但無監(jiān)督學(xué)習(xí)并沒有什么太好的方法。與之相反,T-800在電影中能學(xué)習(xí)微笑,正得益于其超強(qiáng)的學(xué)習(xí)能力。而他能根據(jù)數(shù)據(jù)庫中的人體解剖信息,習(xí)得如何高效獵殺,說明他已經(jīng)具有了較強(qiáng)的無監(jiān)督學(xué)習(xí)能力。
結(jié)語
強(qiáng)大的學(xué)習(xí)能力讓我們能夠面對(duì)不斷變化的環(huán)境,機(jī)器人如果不能掌握學(xué)習(xí)的能力,也很難在未來的環(huán)境變化中存活下去??傮w上看,現(xiàn)實(shí)世界中的機(jī)器人還遠(yuǎn)未達(dá)到能夠統(tǒng)治人類的水平。當(dāng)然,我們也應(yīng)該從《終結(jié)者》中吸取經(jīng)驗(yàn),將機(jī)器人的應(yīng)用更加嚴(yán)格地限制在提高人類社會(huì)生產(chǎn)力的用途上。