劉有婷
當(dāng)下哪些科技最火?毫無疑問,人工智能技術(shù)名列前茅。提起人工智能,人們總能想起它帶來的便利,比如智慧醫(yī)療、無人駕駛、人臉識別等。盡管人工智能在市面上的應(yīng)用如火如荼,但是中國科學(xué)院自動(dòng)化研究所副研究員張煦堯表示,從研究的角度來看,這門技術(shù)仍有很多問題有待解決。
其中,人工智能系統(tǒng)不夠魯棒是阻止這門技術(shù)進(jìn)一步大規(guī)模應(yīng)用的主要原因之一,而如何打造更加魯棒的智能系統(tǒng),就是張煦堯的主要研究內(nèi)容。涉足人工智能領(lǐng)域多年,他在模式識別,機(jī)器學(xué)習(xí),以及深度學(xué)習(xí)等方面做出了一系列有影響力的成果,已在相關(guān)頂級期刊和會(huì)議上發(fā)表論文70余篇。
對張煦堯來說,人工智能領(lǐng)域就像一座初見光芒的寶藏,他致力于在其中發(fā)現(xiàn)更多的“財(cái)富”。
自1956年夏,麥卡錫、明斯基等科學(xué)家首次提出“人工智能”這一概念以來,相關(guān)的科學(xué)技術(shù)迅速發(fā)展起來,并越來越多地應(yīng)用到人們的生活當(dāng)中。尤其是以深度學(xué)習(xí)為代表的人工智能技術(shù),取得了巨大的成就。然而,人工智能系統(tǒng)卻并不完美,因?yàn)樗炔粔螋敯簦膊粔蚩煽俊?/p>
人工智能經(jīng)過60多年的發(fā)展,為什么還不足夠魯棒?這就要從人工智能領(lǐng)域發(fā)展基于的三個(gè)假設(shè)說起。
第一個(gè)假設(shè)是封閉世界假設(shè)。張煦堯簡單解釋道:“世界是開放的,因?yàn)樗袩o數(shù)不同的事物。但是人工智能的世界是封閉的,你教給它一樣?xùn)|西,它就認(rèn)為整個(gè)世界就只有這樣?xùn)|西。比如,阿爾法狗會(huì)下圍棋,但是它不會(huì)做其他事情?!比说膶W(xué)習(xí)是一個(gè)“主動(dòng)的”增量學(xué)習(xí)過程,但機(jī)器的學(xué)習(xí)卻是“被動(dòng)的”批量學(xué)習(xí)過程。正是由于封閉世界假設(shè),導(dǎo)致機(jī)器在面對開放環(huán)境中的新類別數(shù)據(jù)以及噪音數(shù)據(jù)時(shí)往往會(huì)出現(xiàn)過于自信的明顯錯(cuò)誤。
第二個(gè)假設(shè)是獨(dú)立同分布假設(shè),即人工智能訓(xùn)練的環(huán)境和測試的環(huán)境是獨(dú)立同分布的。舉例來說,語音識別的機(jī)器在訓(xùn)練時(shí)接收的是普通話,但是有人對著它說廣東話,它就無法識別或識別率低下。這就是導(dǎo)致人工智能不夠魯棒的第二個(gè)因素?,F(xiàn)實(shí)世界中的很多數(shù)據(jù)不是獨(dú)立的,充分利用非獨(dú)立數(shù)據(jù)的上下文關(guān)系如語言上下文和幾何上下文,可以顯著提升識別的準(zhǔn)確率。此外,在非獨(dú)立同分布情形下,通過自適應(yīng)以及多模態(tài)和多任務(wù)學(xué)習(xí),也可有效提升魯棒性。
第三個(gè)假設(shè)是大數(shù)據(jù)假設(shè)。張煦堯表示,人工智能之所以這么強(qiáng)大是因?yàn)槠浔澈笥写髷?shù)據(jù)的支撐。如果想要實(shí)現(xiàn)某一個(gè)功能,一般的做法就是采集大量相關(guān)數(shù)據(jù),然后對數(shù)據(jù)做精準(zhǔn)的標(biāo)注。但在實(shí)際應(yīng)用中,這兩者是相矛盾的?!叭绻胍么髷?shù)據(jù),就避免不了噪音數(shù)據(jù)的出現(xiàn)?!币?yàn)樵诤A康臄?shù)據(jù)中,不可能保證每一個(gè)數(shù)據(jù)都是高質(zhì)量的。為克服這一問題,人工智能系統(tǒng)需要具備數(shù)據(jù)的容錯(cuò)學(xué)習(xí)能力,以及小樣本和弱監(jiān)督學(xué)習(xí)能力。
張煦堯在蒙特利爾大學(xué)訪問期間留影
“只有打破這三個(gè)假設(shè),才能實(shí)現(xiàn)更加魯棒的人工智能應(yīng)用?!睘榱丝朔@三個(gè)假設(shè)的局限性,學(xué)術(shù)界一直在探索新的模型和新的算法,涌現(xiàn)出大量研究成果和學(xué)術(shù)論文。近期,張煦堯有關(guān)“三個(gè)假設(shè)”的研究論文“Towards Robust Pattern Recognition: A Review”以綜述的形式發(fā)表在國際期刊Proceedings of the IEEE上。
進(jìn)入21世紀(jì)后,人們對于人工智能的關(guān)注大多聚焦在其應(yīng)用上,但是張煦堯認(rèn)為,人工智能的長遠(yuǎn)發(fā)展一定要突破基礎(chǔ)研究中的問題。2008年,張煦堯從武漢大學(xué)畢業(yè)以后,進(jìn)入中國科學(xué)院自動(dòng)化研究所跟隨模式識別國家重點(diǎn)實(shí)驗(yàn)室主任劉成林研究員攻讀博士學(xué)位。劉成林研究員深厚的學(xué)術(shù)功底和嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)態(tài)度對張煦堯產(chǎn)生了深遠(yuǎn)的影響,同時(shí)張煦堯本科時(shí)期學(xué)習(xí)的是計(jì)算數(shù)學(xué)專業(yè),這為他之后的研究工作打下了堅(jiān)實(shí)的基礎(chǔ)。
張煦堯的博士論文從大類別集和非獨(dú)立同分布角度出發(fā),對模式分類中的維數(shù)削減、分類器設(shè)計(jì)及分類器自適應(yīng)等重要問題進(jìn)行了深入研究。所取得的關(guān)鍵成果發(fā)表在人工智能頂級期刊和會(huì)議上,在國際上取得了較好影響,并被TPAMI選為該刊2013年7月的焦點(diǎn)論文。此外,中國計(jì)算機(jī)學(xué)會(huì)(CCF)獎(jiǎng)勵(lì)委員會(huì)還授予他2014年度“CCF優(yōu)秀博士學(xué)位論文獎(jiǎng)”。
博士前期,張煦堯的科研工作經(jīng)歷了一段瓶頸期。因?yàn)闆]有成果產(chǎn)出,他曾一度處于低落、迷茫的狀態(tài)中。為了使自己盡快從迷茫中脫身,張煦堯前往加拿大模式識別與機(jī)器智能中心訪問學(xué)習(xí),跟隨加拿大皇家科學(xué)院院士Ching Y.Suen教授學(xué)習(xí)模式識別的相關(guān)知識。2015年,已經(jīng)在人工智能領(lǐng)域小有成績的張煦堯又前往深度學(xué)習(xí)發(fā)源地蒙特利爾大學(xué)進(jìn)行訪問研究。
在蒙特利爾大學(xué),張煦堯認(rèn)識了深度學(xué)習(xí)三巨頭之一,也就是2018年圖靈獎(jiǎng)獲得者Yoshua Bengio教授。經(jīng)過一年的學(xué)習(xí)和研究后,張煦堯取得了很大的收獲,并與Yoshua Bengio教授合作發(fā)表了三篇與深度學(xué)習(xí)相關(guān)的成果論文。
說起Yoshua Bengio教授,張煦堯語氣中有著藏不住的仰慕之情。他說,深度學(xué)習(xí)三巨頭之所以在這一領(lǐng)域能夠取得這么大成就,是因?yàn)樗麄兪肿⒅鼗A(chǔ)平臺(tái)的搭建以及基礎(chǔ)理論研究工作。在其他人還不看好深度學(xué)習(xí)的時(shí)候,他們就一直在持續(xù)地研究和探索,并向?qū)W術(shù)界開源其深度學(xué)習(xí)平臺(tái),如早期的Theano平臺(tái)等。無論神經(jīng)網(wǎng)絡(luò)研究經(jīng)歷了怎樣的起落,他們都一直在堅(jiān)持??梢哉f,他們是從無到有地推動(dòng)了深度學(xué)習(xí)的發(fā)展。
雖然跟隨國際熱點(diǎn)進(jìn)行“超車”十分重要,但是中國要想實(shí)現(xiàn)科技強(qiáng)國的目標(biāo),還要重視原始創(chuàng)新的研究。用張煦堯的話來說,既能夠“從1做到100”,也能“從0做到1”。他的研究工作就是一個(gè)“從0到1”的過程,進(jìn)入一個(gè)“無人區(qū)”,其起步必定艱難。所幸,張煦堯獲得了中國科學(xué)院基礎(chǔ)前沿科學(xué)研究計(jì)劃從0到1原始創(chuàng)新項(xiàng)目的支持,以及中國科協(xié)青年人才托舉工程的支持。
最近,中國科學(xué)院開始籌建人工智能創(chuàng)新研究院,并成立了“2035創(chuàng)新任務(wù)團(tuán)隊(duì)”,張煦堯入選了自主進(jìn)化智能基礎(chǔ)理論團(tuán)隊(duì)。目前,在項(xiàng)目和團(tuán)隊(duì)的支持下,他的研究工作正在順利進(jìn)行當(dāng)中,但是他表示,研究真正想要取得大的突破,樂觀估計(jì),還需扎扎實(shí)實(shí)地坐好幾年冷板凳。
如今,人工智能應(yīng)用無處不在,但是它不能憑空創(chuàng)造需求,而是必須依附于各個(gè)已有的產(chǎn)品,為用戶提供更好的體驗(yàn)。所以從一定角度來看,人工智能技術(shù)的應(yīng)用大多是錦上添花,而不是雪中送炭。
在一些關(guān)鍵領(lǐng)域,由于人工智能不夠魯棒和不夠可靠,很可能造成這一領(lǐng)域的巨大風(fēng)險(xiǎn),如在無人駕駛、金融、醫(yī)療等領(lǐng)域。張煦堯生動(dòng)地形容道:“人工智能有個(gè)很大的缺點(diǎn),那就是它明明錯(cuò)了,卻還十分自信。”因此置信度估計(jì)是提高智能系統(tǒng)魯棒性的有效途徑之一。張煦堯以無人駕駛汽車為例介紹說:“當(dāng)一輛無人駕駛汽車要轉(zhuǎn)彎時(shí),如果它的置信度是0.999,那它就直接轉(zhuǎn)彎了。但是,當(dāng)它的置信度只有0.1時(shí),它的識別不是很可靠,這時(shí)就需要人為的干涉來避免風(fēng)險(xiǎn)?!绷硗猓?dāng)人工智能的應(yīng)用環(huán)境、條件、數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量發(fā)生變化時(shí),如何能依舊保證較高的準(zhǔn)確率,也是智能系統(tǒng)獲得普適應(yīng)用所面臨的挑戰(zhàn)。
在中國科學(xué)院大學(xué)授課
對于人工智能威脅論,張煦堯認(rèn)為談這些為時(shí)過早。在他看來,人工智能與人的智能有著本質(zhì)不同,最顯著的是,人有“自知之明”,而人工智能卻沒有,這也是造成它不夠魯棒的根本所在。所以,我們所看到的人工智能應(yīng)用大多是錦上添花。未來,張煦堯希望可以真正觸及人工智能的技術(shù)痛點(diǎn),實(shí)現(xiàn)這門技術(shù)雪中送炭的作用。
研究工作之余,張煦堯還指導(dǎo)了多名博士研究生和碩士研究生。他在中國科學(xué)院大學(xué)參與教授的“模式識別”“深度學(xué)習(xí)”等多門課程,受到了同學(xué)們的廣泛歡迎,并獲得2019年中國科學(xué)院大學(xué)校級研究生優(yōu)秀課程。
作為新時(shí)代的青年教師,張煦堯在教育上有著自己的見解,他常常告訴學(xué)生們,要有質(zhì)疑精神。在他看來,科研就是一個(gè)新舊結(jié)合、新舊博弈、新舊更替的過程,只有敢于質(zhì)疑,才能衍生出新的方向,才能真正推動(dòng)科技的發(fā)展。