●浩海云 編 ○宋德祿 繪
相比2017年的全面屏風(fēng)潮,今年的手機市場可以說是AI的天下,各式各樣不同等級的AI拍照滿天飛。但是,可能在更多消費者的印象中,AI是一個非常強大,類似終結(jié)者那樣的存在。即使在今天,我們也能看到AI可以做各種各樣千奇百怪的事情。
在手機里,難道AI就只能作為攝影的輔助嗎?當(dāng)然不是。移動AI的終極目標(biāo)十分明確,那就是讓手機像人一樣去感知和思考。這條路不會一蹴而就,但已經(jīng)開啟的閘門當(dāng)然不會合上。
今天我們看到的基于AI專項處理芯片達(dá)成的AI攝影,或許可以看作是未來移動AI的初級版本——手機有自身AI算力,有識別和感知能力,能夠自行對外物進(jìn)行基礎(chǔ)判斷和推理。
那么不妨讓我們把腦洞炸開一下,想象在這種模式基礎(chǔ)上前進(jìn),未來幾年AI將如何改變我們的手機生活。
手機APP這東西絕對是改變?nèi)祟惿畹哪嫣彀l(fā)明,但似乎從其誕生之日起,人們就在思考如何取締它。畢竟在眼花繚亂的APP背后,隱藏的是生活被嚴(yán)重碎片化。APP之間的切換交互方式,也似乎成為我們身邊的“時間殺手”。
這種模式能不能被改變呢?或者說,能不能有某種方式,讓我們使用手機的速度進(jìn)一步加快,不用讓我們?nèi)ブ鲃訉ふ乙豁楉椃?wù),而是讓服務(wù)跟隨我們,隨呼叫即享用,甚至可以比我們先一步預(yù)判服務(wù)的發(fā)生?
目前來看,這很有可能就是移動AI的下一步。
隨著手機中聲紋識別、語義理解等技術(shù)的進(jìn)一步成熟和搭載,以及通過機器視覺進(jìn)行物理識別的不斷強化,以及手機中AI系統(tǒng)對用戶習(xí)慣與服務(wù)需求的學(xué)習(xí)能力加強。這些AI技術(shù)與手機產(chǎn)品功能的結(jié)合與優(yōu)化,令通過自然交互形式控制手機成為可能,從而我們可以從選擇APP“變成”手機主動來提供服務(wù)的新模式。
試想一下,假如你的手機可以在口袋中識別你的聲紋,輕聲說:我要約車,馬上就來了車;我餓了,馬上按照你的口味和身體狀況提供餐飲選擇?;蛘吡硪环N情況下,當(dāng)你把手機拿出來對著商品一拍,手機就可以把它買回家;對著風(fēng)景,立刻得到一張大片。
有專家表示:在未來手機生活中,很可能除了社交與信息界面之外,手機只留下一個聽覺和一個視覺入口。手機會通過接近人類的聽覺、視覺與理解能力,來把復(fù)雜的服務(wù)轉(zhuǎn)化為簡單的交互。
AI開始的手機“去應(yīng)用化”,可以看做是通過讓手機像人類,來節(jié)省人類操作手機的時間,甚至達(dá)成更多目前手機無法達(dá)成的應(yīng)用功能。
當(dāng)然,這一切的前提是服務(wù)被抽象出來,各APP之間達(dá)成數(shù)據(jù)共享。那時商家爭奪的將不再是用信息占領(lǐng)用戶時間,而是通過直接的建議和溝通,影響用戶消費習(xí)慣。
今天手機中AI的絕大部分功能,甚至可以說90%以上的功能,都是識別。這是基于機器學(xué)習(xí)理論下AI發(fā)展的基本表現(xiàn)——通過學(xué)習(xí)和提取物理世界特征,來不斷加強識別準(zhǔn)確率,達(dá)成傳統(tǒng)計算機不可能完成的任務(wù)。
有意思的是:AI帶來的識別能力,哪怕是手機攝像頭帶來的識別能力,功能都遠(yuǎn)遠(yuǎn)不只識別物體幫助拍照,和識別文字達(dá)成翻譯。事實上,在永恒疊加的機器學(xué)習(xí)巴別塔中,對萬物的識別僅僅是個時間問題而已。
比如:在旅行中,如果我們不認(rèn)識某座大廈、某處古跡、某個符號,那么完全可以拿出手機拍一下,相關(guān)的知識與信息就通過知識圖譜轉(zhuǎn)化到我們面前。今天我們出門踏青已經(jīng)習(xí)慣了識花模式,但這只是開始,未來旅行中我們或許不需要導(dǎo)游、不需要翻譯、不需要司機,一部手機輕松搞定這個世界。
再比如:在飲食中,我們今天拍食物僅僅為了發(fā)朋友圈。而接下來,我們似乎可以拍照來識別食物的做法、營養(yǎng)成分、搭配合理度等等。甚至做成一團的“黑暗料理”,也可以依據(jù)菜品近似度、食材還原等能力被AI一眼識破,提醒用戶是否吃了不健康食物。
當(dāng)然,一切飲食建議都要建立在對個體的了解上,讓手機學(xué)習(xí)用戶健康數(shù)據(jù),記錄每一餐的營養(yǎng)曲線,似乎可能成為我們未來的生活方式。
還有很多這樣來自AI識別的巨大潛力,比如:我們可以通過AI來判斷一堆東西有多重,一間屋子有多大。很多工作中的測量和稱重工作都可以下崗了,只帶一部手機就成。
再比如:AR需要依靠高精度的環(huán)境識別,這也是AI未來的主攻方向之一。當(dāng)手機中的環(huán)境識別能力進(jìn)一步加強,AR、MR的紀(jì)元或許將正式開始。
場景化的泛在識別、多層識別,在今天看來近乎擁有無窮無盡的想象空間。手機AI技術(shù)和無數(shù)聰明的腦子,將是這場“科幻電影”成為現(xiàn)實的左膀右臂。
最近的手機A I攝影而言,已經(jīng)有新的思路提出把攝影師的攝影經(jīng)驗集成為算法,來通過場景識別讓普通用戶可以拍出專業(yè)級的“大片”。
我們不妨開個腦洞,難道只有攝影大師的智慧與經(jīng)驗可以被壓縮成AI嗎?其他人的是不是也可以?
事實上,假如將我們在生活中極其寶貴的“經(jīng)驗”,分解成數(shù)學(xué)語言,大概就是各種參數(shù)的模糊控制、對應(yīng)性和優(yōu)先級。只是人腦中沒有這些數(shù)學(xué)概念,只可以把它們化為一種似是而非的感覺。
而在AI世界里,機器學(xué)習(xí)算法本身就是對“經(jīng)驗”的函數(shù)抽象和再利用。當(dāng)這種模式越來越多地來到手機當(dāng)中,各種經(jīng)驗、智慧、知識被抽象出來,變成AI模型,成為我們生活中的一部分,似乎已經(jīng)成為可能。
舉個例子:今天女孩子會看很多美妝播主,學(xué)習(xí)她們是如何挑選美妝產(chǎn)品的。這往往需要大量學(xué)習(xí)時間,還不一定選的對。假如忽略這一過程中的快樂與成就感因素,單純把美妝播主的經(jīng)驗與判斷方式抽象成AI系統(tǒng),讓消費者可以挑選適合自己的那款A(yù)I,不斷用它選適合自己的產(chǎn)品,那么似乎一切將變得更加科學(xué)、省時,并且更符合個性化要求。
當(dāng)我們攝影時可以用攝影大師的經(jīng)驗(甚至可以在不同攝影師、藝術(shù)家的風(fēng)格之間切換);做飯時可以抽取美食家的風(fēng)格;閱讀時用到某位大師的品味,那么手機或許可以變成一種全新的“人類增強器”。我們將節(jié)省大量學(xué)習(xí)成本,卻依舊享有極高的效率和優(yōu)質(zhì)的經(jīng)驗與審美。
這一切,都從今天的AI手機和AI攝影開始,雖然今天距離我們預(yù)想的未來看似還很遠(yuǎn),但閘門一旦開啟就不會終止。剩下的,不過是安然等待一場技術(shù)革命的到來。