技術(shù)宅
平時瀏覽網(wǎng)頁的時候我們經(jīng)常會遇到一些偽造照片,比如使用Photoshop(以下簡稱為PS)將自己照片摳出來,然后粘貼到某個風(fēng)景區(qū)中,人為制作出自己到某地旅游的風(fēng)景照;或者使用類似https:∥thispersondoesnotexist.com/提供的AI技術(shù),生成現(xiàn)實生活中不存在的人物照片(圖1)。為了方便敘述,我們將上述兩類照片都稱之為“偽照片”。
①·網(wǎng)站AI合成的圖片
對于經(jīng)過圖像軟件處理,或者由AI合成出來的照片,Assembler是怎么進行鑒別的呢?它的幕后功臣實際上是多個圖像檢測器,這些檢測器可以針對特定的類型進行圖像鑒別,從而鑒別出真?zhèn)巍?/p>
在Assembier官網(wǎng)展示的一個演示實例中,左邊這張圖片將原來圖片里國旗上的紅色斑塊消除了,但是通過Assembier可以鑒別出這是一張經(jīng)過后期處理的圖片(圖2)。
示例圖片中的紅色斑塊,通過圖像軟件如PS可以很輕松地去除,而且我們通過肉眼很難看出其中動過什么手腳。PS刪除紅色斑塊的原理是先選取需要刪除的區(qū)域,將其刪除后再通過算法抽取被刪除區(qū)域周圍像素的數(shù)據(jù),然后對被刪除的區(qū)域進行填充,最后對填充區(qū)域的色相、明度、飽和度進行調(diào)整,使得填充區(qū)域和周圍區(qū)域看上去一致(圖3)。
②·展示鑒別實例
③·Photoshop刪除圖片多余部分的示例
④顏色和噪點模式檢測器算法圖解
Assembier可以鑒別出這類圖片,幕后功臣就是其內(nèi)置的“顏色和噪點模式”檢測器(用來鑒別有擦除痕跡的圖片),因為經(jīng)過擦除處理的圖片,它和實際圖片相比在顏色模式、圖像噪點上會出現(xiàn)異常。為此谷歌首先建立一個訓(xùn)練模型,接著準(zhǔn)備大量的類似上述示例擦除照片讓這個模型進行鑒別,在進行大數(shù)據(jù)訓(xùn)練的同時結(jié)合神經(jīng)網(wǎng)絡(luò)進行自我學(xué)習(xí)和提高,最終生成一套算法并將其部署在Assembier服務(wù)器上。這樣服務(wù)器在接收到類似圖2中的圖片時,檢測器就會根據(jù)算法對圖片每個部分進行檢測,如果發(fā)現(xiàn)其中某部分的顏色值和噪點模式不一致,那么Assembler就判定這是一張經(jīng)過后期處理的“偽圖”(圖4)。
Assembler內(nèi)置的“StyleGAN檢測器”則主要對通過“StyleGAN”技術(shù)生成的AI圖片進行鑒別(目前網(wǎng)站AI合成圖像底層技術(shù)基本來自StvleGAN)。比如使用英偉達的StyleGAN技術(shù)生成的AI人像,這類照片帶有明顯的基于樣式生成對抗網(wǎng)絡(luò)技術(shù)特征,上述檢測器可以鑒別出該特征并將其和正常照片區(qū)分出來。
此外Assembler還有“Dense-Field Copy-Meve”檢測器(用來鑒別具有粘貼特征的圖片,比如使用摳圖方法將其他物件粘貼過來的圖片)、“JPEG DIMLES”檢測器(用來鑒別被編輯過并且經(jīng)過壓縮處理的JPEG格式圖片)、“自洽性拼接”檢測器(用來鑒別更改過EXIF屬性的圖片)、“SPLICEBUSTER”“檢測器”(用來鑒別噪點模式不一致的圖片)和“集成Model”檢測器(可以同時分析圖片是否使用多種類型的操作,然后交由特定檢測器進行檢測)。這樣Assembler將多個檢測器組成的集合模型就可以識別多種圖像處理類型,鑒別結(jié)果比任何單個檢測器都更準(zhǔn)確(圖5)。
⑤Assembler工作原理圖解
類似Assembler這種簡單易用同時又有高超圖片鑒別能力的服務(wù),必然會給我們的生活帶來更多便利,比如借助Assembler的識圖能力,以后在遇到一些看上去真?zhèn)坞y辨的新聞圖片時,我們就可以通過Assembier快速地進行鑒別,避免被各種假新聞蒙騙。
當(dāng)然我們也應(yīng)該看到Assembler鑒圖能力的局限性,它實際所依賴的是每個檢測器背后的算法,而“偽”圖的制作其實也是借助算法,因此真?zhèn)舞b別本質(zhì)上就是兩種算法之爭。如果圖像處理軟件的算法比Assembler更好,那么Assembler是無法將其鑒別出來的。此外,因為Assembler的鑒別能力嚴(yán)重依賴算法,而自然界中圖片的顏色、光線千變?nèi)f化,僅僅依靠算法還是無法真正鑒別出每一張圖片,因此我們對Assembler的能力也別太過迷信(圖6)。
⑥算法之爭