近幾年,人工智能技術(shù)發(fā)展的如火如荼。就在前不久,兩年一度的世界計算機視覺領(lǐng)域頂級會議ECCV2020的各項挑戰(zhàn)賽結(jié)果出爐。其中,在圖像分類賽中,阿里安全的高效AI分類技術(shù)超越三星、深蘭科技、同濟大學(xué)等國內(nèi)外多支隊伍的同類技術(shù),獲得冠軍。
目前人工智能的崛起以海量的帶標簽訓(xùn)練數(shù)據(jù)作為基石,海量數(shù)據(jù)可以保障AI模型的效果,但是數(shù)據(jù)的收集和標注需要昂貴的人力成本,進行訓(xùn)練則需要消耗大量計算資源。ECCV2020分類比賽的難題是,與其他比賽動輒使用十幾萬的數(shù)據(jù)不同,ECCV2020的分類比賽共有1000個類別,每個類別僅有50張圖片作為訓(xùn)練數(shù)據(jù)。比賽要求選手在不使用任何預(yù)訓(xùn)練模型和額外數(shù)據(jù)情況下,從零訓(xùn)練模型。這意味著訓(xùn)練難度巨大,幾乎是不可能完成的任務(wù)。
不過,這也正是ECCV2020為了考驗參賽隊伍如何對來之不易的訓(xùn)練數(shù)據(jù)進行充分利用,促使AI神經(jīng)網(wǎng)絡(luò)進行高效學(xué)習(xí),降低神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中的人力和計算資源消耗,也就是說,參賽隊伍要打造一個高效能、低成本的分類AI。
阿里安全圖靈實驗室算法工程師夜清介紹,阿里安全智能算法團隊從三個技術(shù)方向進行了突破:利用隨機抽取的兩張訓(xùn)練圖像,使用數(shù)據(jù)增強并進行拼接,最大程度豐富訓(xùn)練樣本資源;設(shè)計獨特的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),加入顯著性特征模塊挖掘樣本的特點,提升分類性能;利用分層語義結(jié)構(gòu),讓AI模型更好地挖掘數(shù)據(jù),實現(xiàn)更好的學(xué)習(xí)效果。
阿里安全圖靈實驗室資深算法專家華棠認為,高效AI分類技術(shù)極大程度上解決了計算資源消耗和數(shù)據(jù)標注的人力成本問題,為自動駕駛、物體識別、智慧城市等領(lǐng)域提供了新的思路和方法。
在線下新零售場景中,對于新上架的一件商品,原來AI工程師們需要從不同的角度、光照條件和位置拍攝,收集幾千甚至上萬張圖片并進行標注,用于訓(xùn)練模型,才可以保證AI模型能充分學(xué)習(xí)到該商品的特征。而在阿里安全提出的方案下,商品圖片數(shù)量縮減到50張以下,就能保證模型的識別能力。
“我們的方法還可以與自監(jiān)督有效的結(jié)合,在學(xué)習(xí)更好的數(shù)據(jù)表征基礎(chǔ)上,指導(dǎo)模型高效學(xué)習(xí),獲得更好的識別能力。”夜清說。
目前,阿里安全這項基于小規(guī)模圖像的高效AI技術(shù)已應(yīng)用在知識產(chǎn)權(quán)商標識別、通用商品識別和動植物保護等場景中。這類場景類別數(shù)量多,每個類別樣本數(shù)量較少,而預(yù)訓(xùn)練任務(wù)和目標任務(wù)存在差異,預(yù)訓(xùn)練模型可能損害目標任務(wù)的準確率,這個方案恰恰能夠解決上述問題。
“以某知名品牌運動鞋上新為例,一段時間內(nèi)我們僅能獲得該產(chǎn)品不同的配色以及商品幾個不同角度的圖片。在僅有少量商品展示圖的情況下,通過高效AI方案,我們在新產(chǎn)品問世的極短時間內(nèi)實現(xiàn)新款商品識別能力的覆蓋,降低新產(chǎn)品被山寨和假冒的風(fēng)險?!比A棠說。