姓名:毛宏亮
身份:AI深度學(xué)習(xí)算法工程師
技能:用代碼鏈接現(xiàn)實(shí)與AI世界
2017年9月,我結(jié)束了21年的學(xué)校生涯,步入一家IT技術(shù)企業(yè),成為人工智能領(lǐng)域里的深度學(xué)習(xí)算法工程師。
在這一天到來(lái)之前,我根本不知道“深度學(xué)習(xí)”是什么,也不了解AI算法工程師的工作內(nèi)容,但我一直希望成為一個(gè)學(xué)者,活躍在學(xué)術(shù)前沿。人工智能領(lǐng)域新知識(shí)不斷涌現(xiàn)的特點(diǎn)恰恰符合我想追求新知識(shí)新技術(shù)的志向,一段“無(wú)知者無(wú)畏”的深度學(xué)習(xí)之旅就此拉開(kāi)了帷幕。
學(xué)習(xí)不簡(jiǎn)單
成為深度學(xué)習(xí)算法工程師的第一天起,我一而再再而三地向別人致歉“不好意思,我不懂深度學(xué)習(xí),真的不懂”。雖然經(jīng)歷了多年電子、計(jì)算機(jī)方面的專業(yè)學(xué)習(xí),但對(duì)于深度學(xué)習(xí)或者說(shuō)人工智能這一全新的領(lǐng)域,我的了解少得可憐。
人工智能集合多個(gè)領(lǐng)域的知識(shí):神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)源頭是生物學(xué),網(wǎng)絡(luò)內(nèi)的運(yùn)算規(guī)則需要你明白微積分等基本數(shù)學(xué)知識(shí);深度學(xué)習(xí)模型的考究,有傳承來(lái)自物理學(xué)的統(tǒng)計(jì)模型。
“神經(jīng)網(wǎng)絡(luò)”“卷積”“池化”“長(zhǎng)短時(shí)記憶”最初遇到這些專業(yè)詞匯時(shí),我也曾一臉迷糊,只能在和同事討論時(shí)拿出手機(jī)偷偷查詢。于是,每天在論文和國(guó)外報(bào)告中補(bǔ)充新知識(shí)和新技術(shù)成為了我這個(gè)“深度學(xué)習(xí)小白”的日常?!吧窠?jīng)網(wǎng)絡(luò)”是模擬生物學(xué)的神經(jīng)元激勵(lì)充放電過(guò)程,“池化”是選擇一組數(shù)字該怎么保留刪除……雖是填鴨式學(xué)習(xí),卻讓我在短時(shí)間內(nèi)快速了解了一個(gè)新的知識(shí)領(lǐng)域。慢慢地,這些深?yuàn)W的詞語(yǔ)變成了我日常掛在嘴邊的工作常用詞。
2017年底,檢驗(yàn)我學(xué)習(xí)成果的機(jī)會(huì)來(lái)了——我需要在自己的部門做一個(gè)深度學(xué)習(xí)的技術(shù)分享。一邊是精心制作的PPT,一邊是我在白板上的龍飛鳳舞,分享開(kāi)始前,我設(shè)想的是,由淺入深,同時(shí)又能點(diǎn)到即止??上гO(shè)想只能是設(shè)想,現(xiàn)實(shí)總歸是現(xiàn)實(shí)——雖然對(duì)人工智能的了解已經(jīng)比之前增進(jìn)不少,但這些新概念和算法在解釋時(shí)卻顯得依舊復(fù)雜。
當(dāng)時(shí)我挺沮喪,甚至有些茫然。不過(guò),現(xiàn)在回過(guò)頭來(lái)看這段過(guò)程,幫助卻是不少,至少讓我從一個(gè)連基礎(chǔ)詞匯都不認(rèn)識(shí)的“小白”成長(zhǎng)為一個(gè)能系統(tǒng)性地描述深度學(xué)習(xí)還引申出了自己理解的合格工程師。
拒絕1%的差錯(cuò)率
人臉識(shí)別這個(gè)技術(shù)大家應(yīng)該不陌生,去銀行辦理業(yè)務(wù)、過(guò)關(guān)入境都會(huì)涉及。公司的產(chǎn)品經(jīng)理正是感受到了時(shí)代和市場(chǎng)的脈搏,向我提議趁早開(kāi)發(fā)人臉識(shí)別即可自動(dòng)支付的程序,并以公司食堂為試點(diǎn)。
“問(wèn)題是人臉不是唯一ID,它不像銀行賬戶、員工編號(hào)能完全一對(duì)一對(duì)應(yīng)。如果計(jì)算機(jī)有99%的準(zhǔn)確率,這就意味著每識(shí)別100個(gè)人會(huì)有1個(gè)人被識(shí)別錯(cuò),如果1000個(gè)人每天三頓飯那就表示平均每天有30個(gè)人被識(shí)別錯(cuò)。食堂一天要處理30起支付事故,新技術(shù)沒(méi)怎么解決問(wèn)題就先制造一堆麻煩!”我認(rèn)為產(chǎn)品經(jīng)理的想法過(guò)于理想化。
算法不是想當(dāng)然的事,尤其是深度學(xué)習(xí),必須考慮到當(dāng)下技術(shù)還不夠成熟的情況,避免搬起石頭砸自己的腳。我是我們團(tuán)隊(duì)的算法負(fù)責(zé)人,對(duì)自己的工作負(fù)有使命感,如果工作不完善或者不合邏輯,我就應(yīng)該指出來(lái),拒絕可能發(fā)生的1%差錯(cuò)。
“難道用戶都提出需求了,我們還不做嗎?還賺不賺錢啦?!薄皠谀!碑a(chǎn)品經(jīng)理抱怨道,還用無(wú)奈又幾近乞憐的目光投向我。
“好吧,至少應(yīng)該明確一下我們算法的局限性和食堂具體應(yīng)用場(chǎng)景的人臉數(shù)量。如果要進(jìn)一步提升計(jì)算機(jī)的精度,我們得附加別的條件?!蔽艺驹诎装迩?,向產(chǎn)品經(jīng)理不斷強(qiáng)調(diào)。
最終,我和團(tuán)隊(duì)同事們商量出對(duì)策:在人臉識(shí)別的基礎(chǔ)上附加兩個(gè)條件:一是在先期注冊(cè)時(shí)通過(guò)短信二次驗(yàn)證做好人臉和數(shù)據(jù)的一比一復(fù)核;二是設(shè)置刷臉支付出錯(cuò)后的反饋機(jī)制,確保支付萬(wàn)無(wú)一失。
人工智能給工程師開(kāi)了一道解決問(wèn)題的敞亮大門,但它自身卻沒(méi)法告訴我們進(jìn)門后的路該怎么走。所以,當(dāng)深度學(xué)習(xí)算法工程師面臨一個(gè)問(wèn)題的時(shí)候,首先要做的不是想怎么解決,而是去思考這個(gè)問(wèn)題本身是不是邏輯完備,思路清晰。算法工程師提供的是核心技術(shù)的支撐,如果核心都是不可靠的,那么整個(gè)工程就離崩潰不遠(yuǎn)了。
人工智能,Always New
“你覺(jué)得注意力機(jī)制(Attention Mechanism)對(duì)人臉識(shí)別有用嗎?”我向負(fù)責(zé)人臉識(shí)別算法的同事詢問(wèn)道。
“應(yīng)該沒(méi)什么用吧,畢竟卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)把人臉的局部信息有選擇性地篩選了,注意力機(jī)制想做的也是類似的事”,他搖了搖頭,攤開(kāi)雙手,一臉無(wú)奈的表情。
“的確是這樣,我再想想?!蔽一氐诫娔X前。實(shí)驗(yàn)表明注意力機(jī)制并不能明顯提高人臉識(shí)別的準(zhǔn)確率,但這個(gè)機(jī)制的算法卻比卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)單,如果……我興奮地走到算法同事的身邊,使勁拍了一下他的背,“你覺(jué)得如果二選一,會(huì)怎么樣?”
“二選一,什么意思?”他一臉懵懂無(wú)知。
“注意力機(jī)制的確和卷積操作的功能存在重疊,如果我們嘗試拋棄其中一種,你覺(jué)得OK不?”我向他晃了晃手指,然后告訴他我將神經(jīng)網(wǎng)絡(luò)里面大量的卷積運(yùn)算替換成了注意力機(jī)制,減少了算法復(fù)雜度,降低了計(jì)算的冗余度,同時(shí)人臉識(shí)別的精準(zhǔn)度并沒(méi)有下降太多。
“這個(gè)的確很有意思,但可惜人家Google團(tuán)隊(duì)早講過(guò)這個(gè)故事了?!苯又蛭艺故玖薌oogle研究院最近發(fā)表的一篇論文——《Attention is All you Need》。
我簡(jiǎn)單瀏覽了文章摘要,發(fā)現(xiàn)我所謂的“獨(dú)創(chuàng)思路”早已經(jīng)有了類似的表述,而且使用的替換方法比我想得更簡(jiǎn)單方便。我默默嘆氣:嗨,誰(shuí)叫人家水平比我高呢!
不過(guò),我的這一番思考也不是完全沒(méi)有用處,在我們公司,使用這一算法進(jìn)行人臉識(shí)別功能操作卻還沒(méi)有進(jìn)行過(guò)。我趕緊查找到這篇文章,找到附在文章中的程序代碼,用新代碼對(duì)我們的算法進(jìn)行了合適的改寫,替換了原有的卷積操作。算法復(fù)雜度下降,程序計(jì)算時(shí)間縮短了,但精準(zhǔn)度卻沒(méi)有什么改變……雖然在深度學(xué)習(xí)領(lǐng)域,這段算法將很快被新的算法再次替代,但在當(dāng)下也算是一次成功的創(chuàng)新成果。
在人工智能的“比賽”中,概念和算法的快速更替,技術(shù)的日新月異總是讓人猝不及防。很多時(shí)候,并不是缺乏想法和好的思考角度,而是自己能想到的想法已經(jīng)早已被別人想到,甚至更加全面周到。在日新月異的AI領(lǐng)域,唯一能做的就是學(xué)好基礎(chǔ),不斷實(shí)踐,然后和它一起成長(zhǎng)。
有人說(shuō):“人工智能領(lǐng)域是一個(gè)高風(fēng)險(xiǎn)的職業(yè),你隨時(shí)有可能被后浪覆蓋。”這句話聽(tīng)上去似乎有些悲觀,不過(guò)恰恰這也是人工智能最激動(dòng)人心的地方,因?yàn)檫@也表明了也許只要你敢想、敢創(chuàng)新、敢行動(dòng),就有機(jī)會(huì)在時(shí)代浪潮中做一些改變自己,改變他人,甚至改變世界的事。
對(duì)話專業(yè)
智能相關(guān)專業(yè)
Alpha GO、無(wú)人駕駛、智能零售……人工智能的應(yīng)用和普及越來(lái)越廣,各領(lǐng)域?qū)θ斯ぶ悄苋瞬诺男枨笠苍絹?lái)越旺。中國(guó)科學(xué)院大學(xué)、南開(kāi)大學(xué)、天津大學(xué)等高校陸續(xù)開(kāi)設(shè)了人工智能學(xué)院和相關(guān)專業(yè)。對(duì)新科學(xué)、新技術(shù)、新領(lǐng)域感興趣的你,快跟上老師們的步伐,看看要成為未來(lái)的人工智能專家,你現(xiàn)在得做哪些準(zhǔn)備!
老師說(shuō)
Q1:哪些專業(yè)與人工智能領(lǐng)域的關(guān)系度最密切?
方勇純:北京大學(xué)、南開(kāi)大學(xué)等高校在10多年前就已開(kāi)設(shè)了智能類本科專業(yè)——“智能科學(xué)與技術(shù)”。經(jīng)過(guò)這些年的發(fā)展,開(kāi)設(shè)這一專業(yè)的高校不斷增多,目前已達(dá)到60所左右。其實(shí),人工智能是一個(gè)多學(xué)科交叉的綜合性學(xué)科,它和信息類很多專業(yè),例如信息自動(dòng)化、計(jì)算機(jī)類、電子類、通信類等專業(yè)都息息相關(guān),這些專業(yè)側(cè)重于智能技術(shù)的不同方面,感興趣的考生可以根據(jù)自己的實(shí)際情況選擇報(bào)考最適合自己的專業(yè)。
Q2:以上專業(yè)學(xué)生畢業(yè)后可以從事哪些和人工智能領(lǐng)域相關(guān)的職業(yè)?
方勇純:智能相關(guān)專業(yè)的學(xué)生就業(yè)口徑非常寬,畢業(yè)生可以去信息類大型企業(yè),也可以去國(guó)家各部委從事與智能技術(shù)相關(guān)的管理與服務(wù)工作,還可以到各科研院所從事智能方面的人才培養(yǎng)與科學(xué)研究工作。
學(xué)長(zhǎng)學(xué)姐說(shuō)
Q1:我可以通過(guò)哪些渠道了解人工智能領(lǐng)域的各類最新信息資訊?
毛宏亮:推薦閱讀教材《人工智能基礎(chǔ)》,這是一本面向高中生的人工智能教材,講授了人工智能的發(fā)展歷史、基本概念和應(yīng)用。如果想了解人工智能的歷史和信息,可以閱讀尼克寫的《人工智能簡(jiǎn)史》,或通過(guò)雷鋒網(wǎng)、36氪等網(wǎng)站了解人工智能最新資訊。如果有同學(xué)對(duì)算法有一定研究,可以打開(kāi)http://www.tensorfly.cn(TensorFlow中文社區(qū))這個(gè)網(wǎng)址,開(kāi)始深度學(xué)習(xí)的第一步,實(shí)現(xiàn)自己的第一個(gè)神經(jīng)網(wǎng)絡(luò)模型。
Q2:如果我未來(lái)想在人工智能領(lǐng)域發(fā)展,我在高中階段首先要做哪些準(zhǔn)備呢?
毛宏亮:首先要把英語(yǔ)學(xué)好。人工智能領(lǐng)域的知識(shí)更新很快,這領(lǐng)域的職場(chǎng)人士常常需要閱讀論文,尤其是英文論文,并關(guān)注目前技術(shù)領(lǐng)先的國(guó)內(nèi)外人工智能實(shí)驗(yàn)室在做些什么,所以熟練掌握英語(yǔ)就顯得尤為重要。(采寫:王秀英)