王 聰
(武漢郵電科學(xué)研究院,湖北 武漢 430074)
隨著數(shù)字自動(dòng)化技術(shù)的不斷發(fā)展,視頻監(jiān)控行業(yè)對(duì)視頻質(zhì)量檢測(cè)技術(shù)的要求也越來(lái)越高。如何評(píng)價(jià)視頻圖像的清晰度是人們所關(guān)心的一個(gè)問(wèn)題。
視頻圖像清晰度異常主要是由于焦距的不當(dāng)、視頻鏡頭的損壞以及一些由于人為或是環(huán)境等因素所導(dǎo)致的。目前主要通過(guò)人工來(lái)檢測(cè)視頻圖像的清晰度的方法效率低下,而且由于人眼的主觀性,通過(guò)人眼診斷視頻圖像的清晰度會(huì)存在一定的偏差。因此,基于計(jì)算機(jī)視覺(jué)和人工智能技術(shù),借助計(jì)算機(jī)強(qiáng)大的處理能力的視頻質(zhì)量檢測(cè)技術(shù)也應(yīng)運(yùn)而生。
本文通過(guò)對(duì)幾種常用的視頻圖清晰度評(píng)斷函數(shù)的研究,得出了對(duì)這幾種圖像清晰度評(píng)價(jià)函數(shù)的分析總結(jié),提出一種基于灰度差分函數(shù)的新的視頻圖像清晰度檢測(cè)算法。
好的圖像清晰度評(píng)價(jià)函數(shù)應(yīng)具備以下幾種特征[1]:1)具有強(qiáng)單峰性和高靈敏度,即清晰度評(píng)價(jià)函數(shù)最大值對(duì)應(yīng)圖像的正焦位置,并且在接近正焦位置函數(shù)值變化明顯;2)具有較高的信噪比;3)評(píng)價(jià)函數(shù)的計(jì)算效率高。
目前評(píng)價(jià)圖像清晰度的函數(shù)分為以下4類[2]:
1)灰度變化函數(shù)。由于圖像中灰度值變化越大,圖像的聚焦程度越高,則由圖像中像素灰度變化的程度可判斷視頻圖像的清晰程度。
2)圖像灰度熵函數(shù)。該函數(shù)利用清晰圖像的信息熵比模糊圖像的信息熵要大,依據(jù)此原理可以評(píng)斷圖像的清晰度。
3)頻域類函數(shù)。根據(jù)圖像的特征,清晰的圖像比模糊的圖像擁有更鋒利的邊緣,頻域類函數(shù)主要通過(guò)傅里葉變化提取圖像的高頻部分,由于高頻部分集中在圖像的邊緣,圖像中高頻的比例越大,則擁有更鋒利的邊緣利用此原理即可判斷圖像的清晰度。頻域函數(shù)雖能準(zhǔn)確地判別圖像是否清晰,但計(jì)算量大,代碼效率低,不適用一般情況下快速、實(shí)時(shí)的檢測(cè)。
4)梯度函數(shù)。梯度函數(shù)主要被用來(lái)提取圖像的邊緣信息,對(duì)于圖像越清晰的圖片來(lái)說(shuō),圖像邊緣應(yīng)該越尖銳,則其梯度函數(shù)的值也應(yīng)該越大。
目前國(guó)內(nèi)外基于以上4類提出了很多清晰度評(píng)價(jià)函數(shù),如方差函數(shù)、能量熵評(píng)價(jià)函數(shù)、灰度差分法、頻率法等。它們大多不是直接和圖像相聯(lián)系的,因此很多評(píng)價(jià)函數(shù)的應(yīng)用范圍和作用效果都不算太好。本文提出一種基于灰度差分法的視頻圖像清晰度評(píng)價(jià)函數(shù)。
首先介紹下灰度差分法,灰度差分法[3]是一種原理簡(jiǎn)單但有效率的圖像清晰度評(píng)價(jià)方法。其原理是利用圖像中所有像素點(diǎn)與相鄰像素的差的絕對(duì)值之和作為圖像清晰度評(píng)價(jià)函數(shù),即
當(dāng)F(x,y)取最大值時(shí)即為圖像最清晰時(shí)。
通過(guò)公式不難發(fā)現(xiàn)灰度差分法應(yīng)用范圍有限,易受到灰度級(jí)數(shù)的影響,只適用于灰度級(jí)數(shù)較多的圖像中。對(duì)于那些灰度級(jí)數(shù)少,圖像亮度變化較慢的圖片,灰度差分值之間的差異小,這樣常常會(huì)導(dǎo)致一些不符合單調(diào)性要求點(diǎn)的出現(xiàn),容易對(duì)圖像的清晰程度產(chǎn)生誤報(bào)。
本文接下來(lái)將提出一種基于灰度差分法改進(jìn)的視頻圖像清晰度評(píng)價(jià)函數(shù)。
邊緣是圖像最基本的特征之一[4],所謂邊緣是指周圍像素點(diǎn)有階躍性變化點(diǎn)的像素集合,那么清晰圖像的邊緣信息也就越豐富。由于利用邊緣信息來(lái)處理圖像清晰度的問(wèn)題時(shí)具有直觀性,且不用考慮成像特性與灰度級(jí)的限制,為此文本提出“銳利點(diǎn)”的概念來(lái)描述圖像的邊緣信息。
本文提出的“銳利點(diǎn)”是指當(dāng)圖像中的某個(gè)像素點(diǎn)的灰度差分值大于某一閾值時(shí)則稱其為“銳利點(diǎn)”,閾值的選取是基于圖片的亮度值提出的,其目的就是要減少亮度對(duì)銳利點(diǎn)判斷的影響。根據(jù)上訴述“銳利點(diǎn)”的特性可知,圖像中“銳利點(diǎn)”的信息越大,則相應(yīng)圖像的邊緣信息就越豐富,這樣由“銳利點(diǎn)”的信息量就能判斷圖像的清晰程度。利用這一點(diǎn),文本提出利用視頻圖像中有效區(qū)域中所有“銳利點(diǎn)”的灰度差分值之和(sum1)與所有像素點(diǎn)的灰度差分值之和(sum2)的比值作為圖像清晰度的評(píng)判依據(jù),所謂的有效區(qū)域是指除去監(jiān)控圖像中無(wú)用的外部信息后剩余的圖片區(qū)域。如上所述得出本文所提出的視頻圖像清晰度的評(píng)價(jià)函數(shù)sum1/sum2。當(dāng)sum1/sum2的值越大時(shí),“銳利點(diǎn)”的信息量越大,圖片的清晰程度越高。
視頻監(jiān)控系統(tǒng)是一種智能化視頻分析與預(yù)警系統(tǒng),基于監(jiān)控系統(tǒng)的視頻圖像清晰度檢測(cè)算法是通過(guò)在網(wǎng)絡(luò)視頻監(jiān)控系統(tǒng)的基礎(chǔ)上疊加視頻分析的功能,充分挖掘抽取視頻圖像資源中的關(guān)鍵信息,它通過(guò)分析視頻內(nèi)容從而對(duì)視頻圖像出現(xiàn)的清晰度異常問(wèn)題做出準(zhǔn)確判斷,有效預(yù)防因硬件導(dǎo)致的圖像質(zhì)量問(wèn)題以及所帶來(lái)的不必要的損失,并及時(shí)檢測(cè)破壞監(jiān)控設(shè)備的不法行為。如圖1為利用本文提供的清晰度核函數(shù)實(shí)現(xiàn)視頻監(jiān)控系統(tǒng)中清晰度檢測(cè)的基本流程。
圖1 監(jiān)控系統(tǒng)中清晰度檢測(cè)的基本流程
基于監(jiān)控系統(tǒng)的視頻圖像清晰度檢測(cè)算法的具體實(shí)現(xiàn)步驟為:
1)通過(guò)視頻監(jiān)控平臺(tái)提供的視頻媒體接口獲取連續(xù)的視頻碼流。
2)利用OPENCV計(jì)算機(jī)圖像視覺(jué)庫(kù)從連續(xù)的視頻碼流中獲取到視頻中的每一幀圖像,并判斷圖像是否為YUV制式,若不是,對(duì)接收到的視頻圖像進(jìn)行灰度化處理,具體實(shí)施公式為
3)將每一幀圖像傳送至視頻清晰度分析算法單元,利用分析算法單元提供的核函數(shù)對(duì)圖片數(shù)據(jù)進(jìn)行分析。下述步驟為利用文本提出的清晰度評(píng)價(jià)函數(shù)作為核函數(shù)的具體實(shí)現(xiàn)。
4)過(guò)濾掉視頻圖像中的無(wú)用信息,由于監(jiān)控視頻圖像中經(jīng)常會(huì)出現(xiàn)一些類似時(shí)間、地點(diǎn)等信息,為了減少這些信息對(duì)算法準(zhǔn)確性的影響,本算法截取當(dāng)前圖像的1/8~7/8的面積進(jìn)行圖像清晰度檢測(cè),以去除OSD的影響,并提高圖像的信噪比。
5)在圖像的有效區(qū)域內(nèi),計(jì)算出當(dāng)前圖像幀中的所有像素點(diǎn)灰度差分值總和sum 1。
圖像中任意像素點(diǎn)的差分值為當(dāng)前像素點(diǎn)的Y值(灰度值)分別與其正下方和正右方像素點(diǎn)的Y值做差,然后再將兩差值取絕對(duì)值后相加,即
從而得到差分值總和sum 1為
6)計(jì)算“銳利點(diǎn)”的閾值。首先在圖像的有效區(qū)域內(nèi),計(jì)算出當(dāng)前幀中的的平均亮度值,若其亮度值低于某一數(shù)字K 1,則將“銳利點(diǎn)”閾值threshold設(shè)定為K 2/10(其中K 2>K 1),若其亮度值高于某一個(gè)數(shù)值K 3,則“銳利點(diǎn)”閾值threshold設(shè)定為K 3/10,其目的就是要減少亮度對(duì)銳利點(diǎn)判斷的影響。
7)根據(jù)步驟4)所得到的“銳利點(diǎn)”閾值threshold,得到當(dāng)前幀圖片的所有“銳利點(diǎn)”,并將這些銳利點(diǎn)的灰度差分值做和得到sum 2,當(dāng)Y(i,j)> threshold時(shí)
8)利用視頻清晰度評(píng)價(jià)函數(shù)sum2/sum1來(lái)檢測(cè)當(dāng)前幀的清晰程度,其方式為:當(dāng)sum2/sum1≥閾值Kfold1時(shí),當(dāng)前幀圖像清晰度正常;當(dāng)sum2/sum1<閾值Kfold1時(shí),當(dāng)前幀圖像清晰度異常。
9)在單位時(shí)間統(tǒng)計(jì)圖像清晰度異常的幀數(shù),當(dāng)清晰度異常的幀數(shù)與總幀數(shù)的比值大于某一比值時(shí),則判定這段時(shí)間內(nèi)視頻清晰度異常。
為了驗(yàn)證本文所提出的評(píng)價(jià)函數(shù)是一種好的圖像清晰度評(píng)價(jià)函數(shù)并能實(shí)時(shí)有效地檢測(cè)監(jiān)控視頻的圖像清晰度,本文選取了大量的圖片和視頻進(jìn)行測(cè)試,并分別與方差函數(shù)、熵函數(shù)、灰度差分函數(shù)進(jìn)行比較。
首先為了得到改進(jìn)后的評(píng)價(jià)函數(shù)和其他常用清晰度評(píng)價(jià)函數(shù)的算法效果,本文從烽火眾智公司的視頻監(jiān)控平臺(tái)中截取了56幅格式相同但聚焦程度不同的圖片,并將這56幅圖片按清晰程度平均劃分為7個(gè)等級(jí),0級(jí)為最清晰,6級(jí)為最模糊。在相同的檢測(cè)環(huán)境下,利用不同的評(píng)價(jià)函數(shù)計(jì)算出不同等級(jí)圖片的清晰度值,然后計(jì)算出每種評(píng)價(jià)函數(shù)對(duì)應(yīng)不同等級(jí)圖片所得到的函數(shù)清晰度值的平均值并將其歸一化。本次實(shí)驗(yàn)計(jì)算出的結(jié)果如表1所示。為了便于比較各評(píng)價(jià)函數(shù)的性能,本文利用表1得到的清晰度平均值結(jié)果手工描繪出如圖2所示的曲線圖示意圖,縱坐標(biāo)表示由不同評(píng)價(jià)函數(shù)歸一化后得出的圖像清晰度評(píng)價(jià)平均值,橫坐標(biāo)代表圖像清晰度的等級(jí)。
表1 不同檢測(cè)算法得到的清晰度平均值
圖2 不同評(píng)價(jià)函數(shù)的性能的示意圖
通過(guò)圖2所示的曲線示意圖可以發(fā)現(xiàn),方差評(píng)價(jià)函數(shù)的單峰性較好,但曲線夾角最寬,故其靈敏度最低,能量熵評(píng)價(jià)函數(shù)的曲線圖雖然夾角較小,但其呈現(xiàn)較大的波動(dòng),故其單峰性不好,灰度差分評(píng)價(jià)函數(shù)較方差函數(shù)和能量熵函數(shù)而言,具備較小的曲線夾角,同時(shí)又有比較好的單調(diào)性,但通過(guò)本文前面的介紹,灰度差分函數(shù)的適用性不如前面的幾種函數(shù)。再來(lái)分析下改進(jìn)后的評(píng)價(jià)函數(shù),改進(jìn)后的函數(shù)較改進(jìn)前的灰度差分函數(shù)不僅解決了之前函數(shù)適用性的問(wèn)題,而且從曲線圖可以直觀地發(fā)現(xiàn),較之前提到的3種評(píng)價(jià)函數(shù)的曲線有更好的單調(diào)性和更高的靈敏度,故其性能較佳。
接下來(lái)為了驗(yàn)證本文提出的評(píng)價(jià)函數(shù)的準(zhǔn)確率,本文從烽火眾智公司的視頻監(jiān)控平臺(tái)中選取了45個(gè)視頻格式和分辨力均相同,視頻時(shí)間長(zhǎng)度均為5 min清晰度異常的視頻,在相同的測(cè)試環(huán)境下按照如圖1所示的檢測(cè)流程僅改變檢測(cè)的核函數(shù)對(duì)這45個(gè)異常視頻進(jìn)行清晰度的測(cè)試,結(jié)果如表2所示。表2中的結(jié)果為利用不同的清晰度評(píng)函數(shù)對(duì)視頻檢測(cè)后,得出通過(guò)算法檢測(cè)能正確檢測(cè)到的視頻個(gè)數(shù)與總視頻個(gè)數(shù)的比值,即算法檢測(cè)率=正確檢測(cè)到的總數(shù)÷檢測(cè)視頻總數(shù)。從算法檢測(cè)率結(jié)果看出,改進(jìn)后的清晰度評(píng)價(jià)函數(shù)對(duì)監(jiān)控視頻清晰度檢測(cè)的準(zhǔn)確率為95.56%,比其他清晰度評(píng)價(jià)函數(shù)檢測(cè)率都要高很多,能夠更為準(zhǔn)確地判別圖像的清晰度,是一種準(zhǔn)確的清晰度評(píng)價(jià)函數(shù)。
表2 不同檢測(cè)算法的檢測(cè)率
最后為了驗(yàn)證本文提出的評(píng)價(jià)函數(shù)可靠性,本文從烽火眾智公司的視頻監(jiān)控平臺(tái)中選取了60個(gè)視頻格式和分辨力均相同,視頻時(shí)間長(zhǎng)度均為5 min清晰度正常的視頻,在相同的測(cè)試環(huán)境下,僅改變檢測(cè)的核函數(shù),利用如圖1所示的檢測(cè)流程對(duì)這60個(gè)正常視頻進(jìn)行清晰度的測(cè)試,得到如表3所示的結(jié)果。
表3 不同檢測(cè)算法的誤報(bào)率
表3中的結(jié)果為利用不同的清晰度評(píng)函數(shù)對(duì)視頻檢測(cè)后,得出通過(guò)計(jì)算誤報(bào)的視頻個(gè)數(shù)與總視頻個(gè)數(shù)的比值,即算法檢測(cè)率=誤報(bào)視頻總數(shù)÷檢測(cè)視頻總數(shù)。從算法誤報(bào)率結(jié)果看出,改進(jìn)后的評(píng)價(jià)函數(shù)誤報(bào)率僅為1.67%,比其他評(píng)價(jià)函數(shù)低很多,由此可看出本算法是一種可靠的清晰度評(píng)價(jià)函數(shù)。
本文介紹了計(jì)算機(jī)視覺(jué)中較為重要的幾種圖像清晰度評(píng)價(jià)函數(shù),并在灰度差分法的基礎(chǔ)上提出一種基于視頻監(jiān)控的視頻圖像清晰度檢測(cè)算法,經(jīng)實(shí)驗(yàn)驗(yàn)證,該檢測(cè)算法具有單峰性強(qiáng)、靈敏度高、無(wú)偏好性、信噪比高等特點(diǎn),能夠自動(dòng)實(shí)時(shí)有效地完成對(duì)監(jiān)控視頻清晰度的檢測(cè),是一種良好的視頻圖像清晰度的檢測(cè)算法。
[1]MITCHELL T M.機(jī)器學(xué)習(xí)[M].曾華軍,張銀魁,譯.北京:機(jī)械工業(yè)出版社,2003.
[2]曹茂永.基于灰度梯度的數(shù)字圖像評(píng)價(jià)函數(shù)[J].光電工程,2003(4):69-71.
[3]任四剛,李見為,謝利利.基于灰度差分法的自動(dòng)調(diào)焦技術(shù)[J].光電工程,2003(4):35-37.
[4]GONZALEZ R C.數(shù)字圖像處理(MATLAB 版)[M].阮秋琪,譯.北京:電子工業(yè)出版社,2005.
[5]楊紹清,李偉,劉松濤.基于CA的圖像邊緣檢測(cè)新方法[J].電視技術(shù),2010,34(11):111-113.