■周娟
智能視覺(jué)是人工智能的大門(mén),如果不打開(kāi)這扇大門(mén),就沒(méi)有辦法深入研究人工智能。
人的大腦皮層70%的活動(dòng)都在處理視覺(jué)信息,視覺(jué)信息與聽(tīng)覺(jué)信息、觸覺(jué)信息相比要重要得多。同理,如果沒(méi)有視覺(jué)信息的話,人工智能只是一個(gè)做符號(hào)推理的空架子。那么,智能視覺(jué)將通過(guò)哪些形式影響人工智能呢?
隨著智能設(shè)備的系統(tǒng)越來(lái)越接近“人性化”,即人工智能,它將更需要通過(guò)視覺(jué)途徑來(lái)學(xué)習(xí)和處理其他數(shù)據(jù),也因此,智能視覺(jué)技術(shù)爭(zhēng)奪戰(zhàn)即將打響。例如,亞馬遜最近為其以Alexa作為語(yǔ)音助手的智能設(shè)備Echo,添加了一臺(tái)攝像頭,而Google和Facebook最近又發(fā)布了新的增強(qiáng)現(xiàn)實(shí)研究的聲明。
我們經(jīng)常會(huì)看到這樣的爭(zhēng)論:無(wú)人駕駛汽車(chē)是否需要激光雷達(dá)??jī)H依賴(lài)智能視覺(jué)的解決方案足夠嗎?對(duì)此,業(yè)界普遍認(rèn)為,汽車(chē)不僅僅需要智能視覺(jué)傳感器平臺(tái)——相機(jī),也需要比GPS更精確的LiDAR和高精度無(wú)線電導(dǎo)航,因?yàn)長(zhǎng)iDAR和雷達(dá)通過(guò)范圍和角度來(lái)精確定位周?chē)h(huán)境中的實(shí)際物體,而智能視覺(jué)解決方案則應(yīng)用深度學(xué)習(xí)算法運(yùn)行圖像,取得預(yù)測(cè)的結(jié)果。然而,光學(xué)解決方案能在實(shí)際生活中識(shí)別某個(gè)地方的效果更好。
機(jī)器不僅僅通過(guò)神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)來(lái)學(xué)習(xí),他們還通過(guò)其他方法來(lái)學(xué)會(huì)識(shí)別和分析他們周?chē)氖澜纭oogle的科學(xué)家展示過(guò)一種技術(shù):通過(guò)將屋頂上的直線或紫色水果中所存在的偏差放大來(lái)判定舊房子的結(jié)構(gòu)是否存在問(wèn)題或者某個(gè)西紅柿是否比其他的成熟的更好、更飽滿。這看似很簡(jiǎn)單,卻是智能視覺(jué)的優(yōu)秀“教學(xué)”案例。
病理學(xué)家平均每天有500張幻燈片要處理,而每張幻燈片又包含數(shù)十萬(wàn)個(gè)需要分析的單個(gè)細(xì)胞,人類(lèi)無(wú)法像計(jì)算機(jī)一樣高效的工作,醫(yī)生很容易遺漏癌細(xì)胞,造成誤判。智能視覺(jué)技術(shù)可以很好地解決這個(gè)問(wèn)題:病理學(xué)家查看他們所熟悉的數(shù)據(jù),與那些由智能視覺(jué)系統(tǒng)處理過(guò)的圖像結(jié)合,基本上就可以確定癌癥的區(qū)域,然后醫(yī)生通過(guò)專(zhuān)門(mén)研究這些區(qū)域作出診斷。以乳腺癌研究為例,如果沒(méi)有智能視覺(jué)技術(shù),活檢只有85%的準(zhǔn)確率,而使用智能視覺(jué)作為輔助,錯(cuò)誤率將下降到只有5%。
優(yōu)質(zhì)相機(jī)、傳感器和深度學(xué)習(xí)軟件庫(kù)等的商品化大大擴(kuò)展了智能視覺(jué)的使用范圍,我們看到許多新的初創(chuàng)公司的出現(xiàn)。不論是由街景視圖圖像生成人口分析報(bào)告的技術(shù),還是能夠?qū)κ鹿拾l(fā)生后汽車(chē)的損壞程度進(jìn)行評(píng)估,并且計(jì)算出維修成本的應(yīng)用程序,我們可以看到智能視覺(jué)在多個(gè)方面已經(jīng)出現(xiàn)了讓人難以置信的商業(yè)化,這極大地推動(dòng)了人工智能的發(fā)展。毫無(wú)疑問(wèn),雖然對(duì)人工智能的發(fā)展已經(jīng)形成有力刺激,但智能視覺(jué)的百分百商品化還有較大難度,我們讓人工智能睜開(kāi)眼睛的任務(wù)仍然艱巨,需要各領(lǐng)域共同奮斗。