劉召斌,李躍強
(懷化醫(yī)學高等專科學校 公共課部,湖南 懷化 418000)
視頻水印技術作為一種有效的數(shù)字視頻版權保護技術,是目前數(shù)字水印技術研究的一個熱點和難點。與靜止圖像水印相比,數(shù)字視頻水印具有如下的特點:
(1)視頻水印對健壯性要求高。針對視頻水印的攻擊比圖像水印多,除幾何攻擊(如剪切、旋轉等)、噪聲攻擊(加椒鹽噪聲、泊松噪聲、高斯噪聲等)、濾波攻擊(線性濾波、中值濾波、自適應濾波)、亮度及飽和度改變等幀內攻擊外,還有幀間攻擊(如幀插入、幀刪除、幀交換)、共謀攻擊(如幀平均)和編碼壓縮攻擊(如 MPEG壓縮、AVS壓縮、H.264壓縮)等視頻水印特有的攻擊。因此,在健壯性方面對視頻水印提出更高的要求。近幾年來,視頻水印研究涌現(xiàn)出不少健壯算法[1-3]。
(2)視頻水印對透明性提出了新要求。視頻數(shù)據(jù)量龐大、存在較多的數(shù)據(jù)冗余,有利于隱藏更多的信息。從透明性考慮,通常不在每一幀都嵌入水印,而是有選擇性地在某些幀嵌入水印。如何選擇水印嵌入幀,使之不容易被隱寫分析者發(fā)現(xiàn),成為視頻水印研究的一個重要內容。近幾年來,利用圖像的某些特征值來選擇水印嵌入幀正成為研究內容之一[4-7]。
本文提出一種用歐拉數(shù)作為特征值來選取視頻水印嵌入幀,在HSV色彩空間亮度分量DCT中頻系數(shù)中嵌入水印的算法。該算法能實現(xiàn)盲嵌入、盲檢測和盲提取,且健壯性強、透明性好,能經(jīng)受噪聲、濾波、剪切、壓縮、幀插入及刪除等圖像、視頻處理與攻擊。
色彩描述可分為基色與色、亮分離色彩空間兩大類,前者典型的是RGB色彩空間,后者典型的是HSV色彩空間。
RGB 色彩空間由紅(R)、綠(G)、藍(B)三基色組成,各分量之間耦合比較強,任何一個分量的變化都會影響色彩的比例,使圖像的色彩發(fā)生變化。
HSV 色彩空間由 H、S、V 3個分量組成,H、S、V 分別代表色相(又稱色調)、純度(又稱飽和度)和明度(又稱亮度)。HSV色彩空間模型為一個倒圓錐體,如圖1所示。圓錐的頂面對應于V=1,代表的顏色最亮,錐角處V=0,代表的顏色最暗;色調H由圍繞V軸逆時針旋轉的角度表示,其中紅色對應于0°, 黃色對應于 60°,綠色對應于 120°,深藍色對應于 180°,藍色對應于 240°; 飽和度 S由軸心向椎體圓周過渡,表示飽和度由低到高。
雖然HSV色彩空間的圓錐模型比較復雜,但各分量之間聯(lián)系相對獨立,圖像彩色信息主要體現(xiàn)在色調和飽和度上,改變亮度對色調和飽和度影響較小,能較好地保留圖像的彩色信息,便于對各分量分別處理。
圖1 HSV色彩空間模型
在本文提出的視頻水印算法設計中,考慮到透明性、健壯性及圖像質量等因素,采取如下算法:
(1)在歐拉數(shù)較小的幀嵌入水印。在幾何理論中,圖像的宏觀形態(tài)可以用拓撲性質來度量。歐拉數(shù)E是圖像的一種拓撲量,它是圖像的連通區(qū)域數(shù)C與圖像的空洞數(shù)B之差:
例如某幅圖像的歐拉數(shù)為-100,說明該圖像的空洞數(shù)比對象多100個。由于圖像具有拓撲的連通性,在平移、旋轉、拉伸、壓縮及扭曲后,其連通性不會發(fā)生改變,因此,歐拉數(shù)可作為圖像的一個特征量,用于選擇特定的視頻幀來嵌入水印。
用歐拉數(shù)作為幀的特征值,對視頻水印來說有以下優(yōu)勢:
①由于視頻是由大量靜止的幀圖像組成的序列,因此能在眾多的幀圖像中選擇歐拉數(shù)較小的幀嵌入水印。
②能實現(xiàn)盲嵌入和盲檢測。能在眾多視頻幀中選擇滿足歐拉數(shù)區(qū)間的幀來嵌入水印,無需事先指定嵌入水印的視頻幀,從而實現(xiàn)盲嵌入;能在眾多的已嵌入水印的視頻幀中選取檢測出滿足歐拉數(shù)區(qū)間的幀,無需事先指定含水印的視頻幀,從而實現(xiàn)盲檢測。
③不但能抵抗幀插入、幀交換、幀刪除等攻擊,還能提高透明性。
(2)在HSV色彩空間的亮度分量中嵌入水印。HSV色彩空間亮度的改變對彩色信息影響較小,嵌入水印后能較好地保留圖像的色調和飽和度,可以較好地保證圖像質量。另一方面,把水印嵌入到視覺最敏感的亮度分量,可提高水印的健壯性。
(3)采用離散余弦變換(DCT)嵌入水印。目前大部分視頻壓縮格式 (如 MPEG-Ⅰ、MPEG-Ⅱ、ITU-T的 H.261和H.263等)變換均采用 DCT,因此,視頻水印采用DCT比較適合。
水印的嵌入步驟如下:
(1)選擇歐拉數(shù)較小的視頻幀。將視頻的RGB圖像轉換成單色二值圖像,計算出圖像的歐拉數(shù),選擇視頻歐拉數(shù)較小的幀作為水印嵌入幀。
(2)采用有意義的二值圖像作為水印。水印采用有意義的二值圖像,即使水印信息有部分的損失,由于人眼的分辨率的原因,水印信息仍能正確辨識。為增強水印的安全性,將水印圖像實施Arnold置亂。將置亂后的水印圖像轉換成0-1位串序列,經(jīng)轉換后的0-1位串序列可以表示為:
其中,m、n分別為二值圖像的寬度和長度。
(3)將RGB色彩空間轉換為HSV色彩空間。由RGB到HSV色彩空間的轉換表達式如下:
(4)對亮度分量V分塊并實施DCT變換。將亮度分量 V 劃分為 8×8 的塊 Vb(u,v)(u,v=1,2,3… ,8;b=1,2,3,…),然后實施 DCT 變換,得到DCT系數(shù)M:
圖2 修改DCT系數(shù)
(5)在DCT系數(shù)中嵌入水印。為兼顧健壯性和透明性,僅對Mb的4對DCT中頻系數(shù)進行修改,如圖2所示,從而嵌入水印。方法如下:
①當水印為“0”時,若|Mm|≥|Mn|,則|Mm|減少、|Mn|增加,直到|Mm|<|Mn|-k;
②當水印為“1”時,若|Mm|<|Mn|,則|Mm|增加、|Mn|減少,直到|Mm|≥|Mn|+k。
其中,k的取值在 5~20之間,當 k值取較大時,會增加健壯性,降低透明性;當k值取較小時,會增加透明性,降低健壯性。本實驗取k=15。
(6)重構視頻幀。對已嵌入水印的 DCT系數(shù) Mbw實施逆離散余弦變換 (IDCT),得到已嵌入水印的視頻幀亮度分量Vw:
將亮度分量Vw與H、S分量合成為嵌入水印的RGB視頻幀。由HSV到RGB色彩空間的轉換表達式如下:
最后得到嵌入水印的RGB視頻幀。
提取水印是嵌入水印的逆過程。在已嵌入水印的視頻選取歐拉數(shù)較小的幀,將選中的幀由RGB色彩空間轉換成HSV色彩空間,對亮度分量V進行分塊,然后對每塊分別實施DCT變換得到DCT系數(shù),比較4對中頻系數(shù)便可提取水印。
水印提取方法為:若|Mm|≥|Mn|,提取水印為“1”,否則為“0”。
這樣便得到水印序列,將一維水印序列轉換為二維圖像,再通過Arnold變換還原成有意義的圖像。顯然,提取水印無需原始幀、原始水印的參與,屬盲提取。
將一個無壓縮、AVI格式的真彩色廣告片作為樣本,其總幀數(shù)為 500幀,寬、高分別為 360像素、288像素,幀速為 25 f/s,大小為 155.5 MB。
將一個尺寸為 32×32、大小為 198 B、單色二值 BMP格式的天平圖像作為水印圖像,如圖3(a)所示,對其實施Arnold置亂,如圖3(b)所示,經(jīng)降維后成為一維水印序列。
圖3 水印圖像及置亂圖像
用歐拉數(shù)E≤-340(若需要在更多的幀嵌入水印,可增大E值)的條件選取原始視頻水印嵌入幀,按上述方法嵌入水印。 結果選中了第 219、220、221、222、225 及229幀,并嵌入了水印。
對已嵌入的視頻仍以歐拉數(shù)E≤-340的條件來檢測水 印嵌 入幀 , 選出第 219、220、221、222、225 及 229幀,命中率達100%。實際上,視頻幀被嵌入水印后,其歐拉數(shù)E值會有較大幅度的減小,故仍用歐拉數(shù)E≤-340的條件對檢測已嵌入水印幀沒有影響。
圖4(a)是第 219幀原始圖像,圖 4(b)是第 219幀嵌入水印后的圖像。從圖4可以看出,已嵌入水印的視頻樣本在主觀視覺上與原始視頻幾乎沒有區(qū)別,說明嵌入水印后視覺上沒有明顯的降質現(xiàn)象,透明性好。
圖4 第219幀原始圖像及嵌入水印后的圖像
為消除主觀影響,對嵌入水印前后的視頻幀用峰值信噪比(PSNR)進行客觀的定量評價,PSNR值在 43以上,說明其透明性好。
為了檢驗水印的健壯性,對已嵌入水印的視頻用以下常見視頻信號處理及轉換。檢測嵌入水印幀時,可根據(jù)不同的處理來調整檢測的條件。
(1)添加強度為 0.01 椒鹽(Salt& Pepper)噪聲。
(2)添加泊松(Poisson)噪聲。添加泊松噪聲后,其歐拉數(shù)會有較大幅度的減小,檢測時可將歐拉數(shù)適當減小。本實驗將檢測條件調整為E≤-480,能準確檢測出全部水印幀。
(3)中值濾波。由于經(jīng)濾波處理后,其歐拉數(shù)會有較大幅度的增加,檢測時可將歐拉數(shù)適當增加。本實驗將檢測條件調整為 E≤-240。
(4)先添加強度為0.01椒鹽噪聲,再用中值濾波消除噪聲。本實驗將檢測條件調整為E≤-218。
(5)剪切。將視頻幀左上角剪切 64 pix×64 pix點的方塊(用白色填充)。
(6)將已嵌入水印的視頻樣本AVI格式轉換成MPEG-Ⅰ格式文件。AVI格式的視頻文件經(jīng)MPEG-Ⅰ壓縮后,大小由155.5 MB壓縮為1.7 MB。本實驗將檢測條件調整為E≤-300,可準確提取全部水印。
為消除對提取水印圖像的主觀影響,使用歸一化相關系數(shù)NC對原始水印圖像與提取水印圖像的相似性進行更為客觀的評價。表1是經(jīng)各種處理得到的實驗結果。
表1 經(jīng)各種處理后的實驗結果
本文提出了一種選擇歐拉數(shù)較小的視頻幀,在HSV色彩空間的亮度分量的DCT域中嵌入水印的算法。該算法具有盲嵌入、盲檢測和盲提取的特點,且健壯性強、透明性好,能經(jīng)受噪聲、濾波、剪切、壓縮、幀插入及刪除等攻擊。
[1]CORIA L E, PICKERING M, NASIOPOULOS P, et al.A video watermarking scheme based on the dual-tree complex wavelettransform[J]. IEEE Transactionson Information Forensics and Security, 2008,3(3):466-474.
[2]STANKOVIC S, OROVIC I, ZARIC N.An application of multidimensional time-frequency analysis as a base for the unified watermarking approach[J].IEEE Transactions on Image Processing, 2010,19(3):1-10.
[3]Ling Hefei, Wang Liyun, Zou Fuhao, et al.Robust video watermarking based on affine invariantregions in the compressed domain[J].Signal Processing(Elsevier Academic Press), 2011,91(8):1863-1875.
[4]孫建德,劉琚.基于獨立分量分析的盲視頻水印方案[J].電子學報,2004,32(9):1507-1510.
[5]李躍強,全同貴,周支元,等.峰度特征值在視頻水印中的應用[J].計算機工程與應用,2009,45(14):90-92.
[6]毛運柳,黃東軍.基于SURF視頻分割的視頻水印算法[J].計算機工程,2010,36(19):241-243.
[7]劉紹輝,韓路,姚鴻勛.抗共謀攻擊的視頻水印算法[J].通信學報,2010,31(1):14-19.
[8]王朔中,張新鵬,張衛(wèi)明.以數(shù)字圖像為載體的隱寫分析研究進展[J].計算機學報,2009,32(7):1247-1263.