• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于PDF格式的數(shù)字版權(quán)保護(hù)算法

    2016-06-13 09:08:35盧宇鵬
    電子科技 2016年5期

    陳 青,盧宇鵬

    (上海理工大學(xué) 光學(xué)與電子信息工程學(xué)院,上?!?00093)

    ?

    基于PDF格式的數(shù)字版權(quán)保護(hù)算法

    陳青,盧宇鵬

    (上海理工大學(xué) 光學(xué)與電子信息工程學(xué)院,上海200093)

    摘要針對(duì)互聯(lián)網(wǎng)中多渠道信息傳播導(dǎo)致的文檔篡改和所有權(quán)歸屬等問題。通過分析PDF文檔結(jié)構(gòu)及內(nèi)容流特性,文中提出一種基于文本格式的新型算法。設(shè)計(jì)使用Kerckhoffs安全性準(zhǔn)則和數(shù)字簽名算法,以解決版權(quán)歸屬難題,并能有效甄別文檔篡改。文中將不可見水印作為便攜式數(shù)字簽名嵌入PDF文檔中,依據(jù)PDF文檔結(jié)構(gòu)中內(nèi)容流的字體渲染模式和字體飽和度的可修改特性,通過選擇性的修改和添加相關(guān)屬性,在不損壞文檔結(jié)構(gòu)的基礎(chǔ)上達(dá)到嵌入水印文本的目的。通過從PDF文檔中提取出的水印,與原始水印的一致性檢測,來辨別文檔的真?zhèn)渭鞍鏅?quán)歸屬。實(shí)驗(yàn)結(jié)果表明,該算法具有良好的透明性和魯棒性,以及較大地水印容量,能進(jìn)行篡改判別。

    關(guān)鍵詞PDF;渲染模式;字體飽和度;版權(quán)歸屬;真?zhèn)舞b定

    數(shù)字水印作為一種文檔的嵌入信息,是可用以描述文檔所有權(quán)和真?zhèn)涡缘?。近年?數(shù)字水印主要應(yīng)用于多種復(fù)雜攻擊下,保護(hù)版權(quán)信息及文檔真?zhèn)?且數(shù)字水印在用途上,與信息隱藏并不完全相同[1-2]。

    針對(duì)當(dāng)前以電子文檔為主體的,無紙化辦公理念的發(fā)展趨勢。提出一種新型的不可見水印算法,通過嵌入隱形的數(shù)字簽名信息來保護(hù)PDF格式文檔[3]。

    國內(nèi)外眾多科研人員主要針對(duì)圖像、音頻、視頻的相關(guān)保護(hù)做了大量研究。對(duì)于PDF電子文檔的數(shù)字水印領(lǐng)域研究較少,國內(nèi)甚至少有對(duì)于文本數(shù)字水印的文獻(xiàn)。北京郵電大學(xué)的徐國愛教授提出,通過替換交叉引用表中的不可見行末標(biāo)識(shí)符的水印間接嵌入算法,大幅提升了PDF文本水印的可嵌入容量[4]。蘭州理工大學(xué)的張秋余教授通過分析發(fā)現(xiàn)PDF文檔和PostScript頁面的工作機(jī)制,提出了一種將文本水印信息嵌入到文檔字符間距中的算法,來實(shí)現(xiàn)文檔的保護(hù)[5]。

    上述研究大幅提高了數(shù)字水印的容量且實(shí)現(xiàn)了電子版權(quán)的保護(hù)。然而,傳統(tǒng)的PDF水印嵌入方式是針對(duì)文檔固有格式的修改進(jìn)行嵌入。無法甄別第三方軟件攻擊篡改。對(duì)修改后的文檔依舊可以提取出完整水印。無法滿足當(dāng)前的實(shí)際應(yīng)用需求[6-9]。同時(shí),基于PDF文檔的格式特殊性,在非Adobe公司提供的官方閱讀上進(jìn)行PDF的文本修改,均會(huì)破壞PDF文檔固有的文本格式,形成一個(gè)新的且能被Adobe Reader讀取的PDF文檔。這種特性加大了對(duì)文檔真?zhèn)涡缘呐袆e難度。

    本文針對(duì)上述問題,提出一種將字體的渲染模式和飽和度相結(jié)合的新型數(shù)字水印算法。通過修改字體的渲染模式和飽和度信息把文本水印與PDF文本內(nèi)容緊密結(jié)合,通過檢索文檔中無法被第三方軟件刪減的灰度值信息,在能甄別第三方軟件篡改攻擊的同時(shí),也能較好的提取出水印信息。除了能達(dá)到保護(hù)版權(quán)的目的,還能被廣泛應(yīng)用于醫(yī)療行業(yè)的醫(yī)藥處方,軍工行業(yè)的機(jī)密數(shù)據(jù)保護(hù)等[10-12]。

    1PDF文檔結(jié)構(gòu)

    一個(gè)典型的PDF文件包含4個(gè)主要部分:文件頭、文件體、交叉引用表、文件尾。文件頭,用以表示這個(gè)PDF文件遵循的PDF規(guī)范版本,例如“%PDF-1.2”。

    文件體,為PDF文件的主要部分,由一系列間接對(duì)象組成,這些間接對(duì)象構(gòu)成文件的具體內(nèi)容如字體、頁面、圖像等,如圖1所示。

    圖1 間接對(duì)象構(gòu)成

    其中5是對(duì)象序號(hào),其用來唯一標(biāo)記一個(gè)對(duì)象,可用于交叉引用表中查找間接對(duì)象;0是生成號(hào),為區(qū)分不同對(duì)象。obj和endobj是間接對(duì)象的定義范圍,對(duì)象的內(nèi)容應(yīng)該是包含在<<和>>之間的。stream表示流對(duì)象的開始,相對(duì)應(yīng)的endstream表示流對(duì)象的結(jié)束。而文本對(duì)象的開始標(biāo)志是BT,相應(yīng)的ET表示文字對(duì)象的結(jié)束。在流對(duì)象中TJ是字體標(biāo)識(shí)符,字體內(nèi)容信息在其中保存。

    2數(shù)字簽名

    數(shù)字簽名就像日常生活中的物理簽名一般,是用來表明版權(quán)所有者的標(biāo)識(shí)信息。為防止未經(jīng)授權(quán)的數(shù)字簽名嵌入文檔中。在嵌入之前,經(jīng)過一系列的加密算法預(yù)處理數(shù)字簽名信息,阻止攻擊者偽造數(shù)字簽名信息。數(shù)字簽名算法包含密鑰和數(shù)字簽名信息。

    假使PDF文檔為P,密鑰信息為k,數(shù)字簽名信息為w。在數(shù)字簽名嵌入方,使用k與數(shù)字簽名w想結(jié)合形成一段新的數(shù)字信息M=(Sign(k,w)),將M嵌入文檔內(nèi)容中。接收方如需驗(yàn)證數(shù)字簽名信息,可使用M與k進(jìn)行逆向操作,得到原始的數(shù)字簽名信息(w=(‘Sign’(M,k)))。

    攻擊者由于未獲得授權(quán)信息(密鑰k),從而無法從文檔嵌入的信息中準(zhǔn)確的提取出數(shù)字簽名信息,從而保證的版權(quán)所有者的數(shù)字簽名的正確性。本文采用密鑰與數(shù)字簽名循環(huán)取模的方式進(jìn)行加密,用以保證算法的安全性。

    獲取待嵌入的數(shù)字簽名信息w及密鑰k,按照ANSI編碼標(biāo)準(zhǔn),將數(shù)字簽名信息w轉(zhuǎn)換為8位的二進(jìn)制序列w={w1,w2,w3,…,wn}和k={k1,k2,k3,…,kM}。

    將兩個(gè)二進(jìn)制序列w,k進(jìn)行循環(huán)取模,并取其中長度較長的序列作為新的序列長度,得到一個(gè)新的二進(jìn)制序列M,M={M1,M2,M3,…,Mmax(M,n)}

    (1)

    驗(yàn)證過程則為逆向操作,圖2為數(shù)字簽名加/解密流程框圖。

    圖2 數(shù)字簽名加/解密流程圖

    3嵌入與提取算法

    在PDF文件結(jié)構(gòu)中,文件體包含了所有的字體和圖片信息。修改相應(yīng)屬性的變量,可以改變PDF文檔的顯示內(nèi)容?;谶@一PDF基本結(jié)構(gòu),本文作者提出了一種將字體渲染模式和飽和度信息相結(jié)合的新型數(shù)字水印算法。

    Adobe公司提供了0~7號(hào)渲染模式。通過查詢PDF用戶手冊,作者選取0號(hào)渲染模式。在0號(hào)渲染模式下,通過修改字體的飽和度信息,達(dá)到隱蔽嵌入數(shù)字簽名的目的。

    3.1嵌入水印算法

    輸入:PDF文檔P,數(shù)字簽名信息w,密鑰信息k。

    輸出:含有數(shù)字簽名的PDF文檔P′。

    M=Sign(W,K);

    D=Uncompress(P);//將PDF格式文檔加密

    For

    if(Mi==0)

    t=Search(TJ);//找到文檔中TJ的位置

    t′=Offset(T);//指針偏移到TJ上一行

    //在t′位置處插入渲染模式0,及飽和度信息0.01

    Insert(T′,"0 Tr 0.01 g ");

    endif

    else

    if(Mi==1)

    t=Search(TJ);//找到文檔中TJ的位置

    t′=Offset(T);//指針偏移到TJ上一行

    //在T′位置處插入渲染模式0,及飽和度信息0.02

    Insert(T′,"0 Tr 0.02 g ");

    endif

    endfor

    Return D;

    P′=Compress(D);

    嵌入算法的核心思想,就是將獲取的加密數(shù)字簽名信息。按照順序,依次判別。若當(dāng)前信息sI=0,則對(duì)當(dāng)前間接對(duì)象類添加0號(hào)渲染以及數(shù)值為0.01的字體飽和度。影響該間接對(duì)象類中包含的字體集。若當(dāng)前信息sI=1,則對(duì)當(dāng)前間接對(duì)象類添加0號(hào)渲染以及數(shù)值為0.02 的字體飽和度。

    經(jīng)過理論分析推斷,由于一篇PDF文檔具有多個(gè)字體圖形標(biāo)識(shí)符“TJ”,用以顯示文檔信息,故本算法具有較大的水印容量,同時(shí)通過數(shù)字簽名預(yù)處理,增強(qiáng)了數(shù)字簽名的魯棒性。基于人眼視覺效應(yīng),選取合理的飽和度數(shù)值,可使具有飽和度信息的字形與原字形相差無幾。這樣完全隱蔽的嵌入了數(shù)字簽名信息,具有較高的魯棒性和隱蔽性。

    3.2提取水印算法

    輸入:含有數(shù)字簽名的PDF文檔P′,密鑰信息k。

    輸出:數(shù)字簽名信息w′。

    D=Uncompress(P′);

    For

    Q=Search(Tr);//尋找文檔中tR的所在位置

    第一,跟生產(chǎn)條件相聯(lián)系,明確施肥量。在近些年來,各地有效開展測土配方施肥項(xiàng)目,深入研究小麥測土配方技術(shù),掌握了在不同生態(tài)條件下小麥的施肥規(guī)律、供肥性能和肥料效應(yīng)等參數(shù),應(yīng)按照不同的環(huán)境和條件,科學(xué)測量施肥量。

    Q′=Offset(Q);//將指針偏移到tR下一行開頭

    If(Q′==0)

    mi==0;

    else

    if(Q′==1)

    mi==1;

    endif

    endfor

    Return M={m1,m2,m3,…,mmax(m,n)};

    P′=Compress(P′);

    W′=(Sign′(M,K);

    提取算法的核心思想與嵌入算法相反。檢索解壓后的含數(shù)字簽名的PDF文檔。尋找渲染模式關(guān)鍵字tR。通過檢索匹配字體飽和度信息,得到加密過后的數(shù)字簽名信息。運(yùn)用密鑰還原出原始數(shù)字簽名信息。

    4實(shí)驗(yàn)結(jié)果與分析

    實(shí)驗(yàn)分析表明,新型文本水印算法與傳統(tǒng)的文本水印算法相比,具有以下特點(diǎn):

    (1)本文提出的算法,是在PDF壓縮編碼后的文檔中進(jìn)行對(duì)屬性的添加??捎行П苊忉槍?duì)文檔的惡意格式去除。如在交叉引用表中添加的不可見行末標(biāo)識(shí)符,可人為進(jìn)行刪減。會(huì)對(duì)增加水印提取和辨別的難度;

    (2)新型水印嵌入算法,將水印信息與原文檔內(nèi)容較好的結(jié)合。能甄別原文檔是否被刪減和修改。而不是僅能夠在含水印的文檔中提取出水印信息。新型水印算法擴(kuò)大了文本水印算法的實(shí)際應(yīng)用范圍。能在保護(hù)版權(quán)信息的基礎(chǔ)上提供文檔鑒別的功能,可被應(yīng)用于醫(yī)療處方等高精度行業(yè)。

    4.1透明性分析

    在測試實(shí)驗(yàn)中,本文嵌入“USST”作為數(shù)字簽名信息,在《海的女兒》節(jié)選中。文檔大小為139 kB,共有44個(gè)嵌入點(diǎn)。在嵌入過程中,根據(jù)數(shù)字簽名信息在每個(gè)嵌入點(diǎn)嵌入飽和度信息,分別調(diào)整該系列字形飽和度。使嵌入后的字形與嵌入前盡可能相同。

    圖3 原始文檔截圖

    通過對(duì)比圖得出在數(shù)字簽名嵌入前后,文檔的差異較小,即使在放大800%的情況下,肉眼仍不可見,具有良好的隱蔽性。

    4.2嵌入容量分析

    本文對(duì)不同文本大小的PDF文檔進(jìn)行嵌入容量分析統(tǒng)計(jì),如圖5所示。

    圖5 水印容量統(tǒng)計(jì)

    由圖5可以看出,隨著文本大小的增加,文檔可嵌入容量也隨著提升。且容量大小完全能夠滿足數(shù)字簽名信息嵌入需求。在文檔大小約為1 MB時(shí),能嵌入10 000 bit的數(shù)字簽名信息,遠(yuǎn)遠(yuǎn)超過傳統(tǒng)水印算法的可嵌入容量。實(shí)驗(yàn)結(jié)果表明,本文提出的信息水印算法在大容量嵌入上具有實(shí)用性。

    4.3水印魯棒性分析

    由于上文實(shí)驗(yàn)和分析發(fā)現(xiàn),本算法具有較大的信息嵌入容量,可通過增加數(shù)字簽名的循環(huán)嵌入的次數(shù),來保證水印的魯棒性需求。表1給出了對(duì)嵌入水印的PDF文檔進(jìn)行各類攻擊后的檢測結(jié)果。

    表1 抗攻擊能力統(tǒng)計(jì)表

    由于本算法是嵌入在文檔內(nèi)容中的,所有行移,字移和特征值修改,均不影響水印提取。

    4.4攻擊甄別

    從理論上分析,一個(gè)經(jīng)過修改后的PDF文檔,文本格式雖發(fā)生了變化,但要保證文檔的直觀可讀性,文本的屬性會(huì)進(jìn)行相應(yīng)的保留。如通過本文算法得到的含有字體飽和度信息的PDF文檔tw,通過第三方軟件進(jìn)行刪減等攻擊后,生成的PDF文檔tw′應(yīng)保留原有的字體位置信息以及飽和度信息。

    對(duì)于本文的使用樣本《海的女兒》節(jié)選,通過第三方軟件的刪減操作后,文檔格式發(fā)生變動(dòng)后,字體的飽和度信息依舊保留,用以提取水印,這與實(shí)驗(yàn)結(jié)果吻合。修改后的PDF文檔解碼信息如圖6所示。

    圖6 修改后的PDF文檔解碼信息節(jié)選

    可通過在提取飽和度信息后的原PDF格式的相應(yīng)標(biāo)識(shí)符“tR”,記為e,e={e1,e2,e3,…,es}。若e=NULL,則表示含水印的PDF文檔被人為的修改,如圖3所示,文檔被人為修改。實(shí)驗(yàn)結(jié)果表明,無法尋找到含數(shù)字簽名信息的文檔中應(yīng)有渲染模式標(biāo)識(shí)符,與理論分析所得的結(jié)論一致。因此,本文提出的新型數(shù)字水印算法,在提取出數(shù)字簽名信息,保護(hù)版權(quán)信息的基礎(chǔ)上,同時(shí)達(dá)到了甄別文檔真?zhèn)蔚男Ч?/p>

    5結(jié)束語

    本算法根據(jù)PDF文檔的特殊性,通過修改文本對(duì)象操作參數(shù)和相應(yīng)操作符,在不破壞PDF文本自身結(jié)構(gòu)和內(nèi)容的前提下,達(dá)到水印嵌入和提取的目的。新型文本水印算法較傳統(tǒng)水印算法而言,嵌入水印與文檔的文本內(nèi)容很好的結(jié)合在一起,能甄別文本的完整性和真實(shí)性。在具有良好隱蔽性與魯棒性的同時(shí),還擴(kuò)大了文檔可嵌入容量。本文算法滿足PDF文檔嵌入的絕大部分需求,并擴(kuò)大了實(shí)際應(yīng)用范圍,使PDF文本能被應(yīng)用于高精度行業(yè),進(jìn)行真?zhèn)舞b別。盡管基于PDF的數(shù)字水印技術(shù)還未成熟,嵌入數(shù)字簽名來保護(hù)版權(quán)問題尚未得到相關(guān)法律的認(rèn)可。但可以相信,這是個(gè)極具發(fā)展?jié)摿Φ男屡d領(lǐng)域,等待后續(xù)的研究和完善。

    參考文獻(xiàn)

    [1]金聰.數(shù)字水印理論與技術(shù)[M].北京:清華大學(xué)出版社,2008.

    [2]Cox I J,Matthew L M,Jeffrey A B.Digital watermarking[M].Beijing:Publishing House of Electronics Industry,2003.

    [3]Maxemchuk N F,Low S.Marking text documents[C].Santa Barbara Calif:International Conference on Image Processing,1997.

    [3]鐘征燕,郭燕慧,徐愛國.基于PDF文檔結(jié)構(gòu)的數(shù)字水印算法[J].計(jì)算機(jī)應(yīng)用,2012,32(10):2776-2778,2782.

    [4]張秋余,余冬梅,管偉.中文PDF文檔數(shù)字水印算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,28(24):5983-5987.

    [5]Tan C K,Ng J C,Xu X T,et al.Security protection of DICOM medical images using dual-layer reversible watermarking with tamper detection capability[J].Journal of Digital Imaging,2011,24(3):528-540.

    [6]Deng X H,Chen Z G,Deng X H,et al.A novel dual-layer reversible watermarking fo medical image authentication and EPR hiding[J].Advanced Science Letters,2011,4(11):3678-3684.

    [7]Guo X T,Zhuang T G.A region-based lossless watermarking scheme for enhancing security of medical data[J].Journal of Digital Imaging,2009,22(1):53-64.

    [8]Peng F,Li X I,Yang B.Adaptive reversible data hiding scheme based on interger transform[J].Signal Processing,2012,92(1):54-62.

    [9]Mahmoud A,Al Maharmeh H,Al-Ahmad H,et al.A new watermarking algorithm for scanned colored PDF files using DWT and hash function[J].Information and Communication Technology Research,2015,7156441:140-143.

    [10]Alakk W,Al-Ahmad H,Kunhu A.A new watermarking algorithm for scanned grey PDF files using DWT and hash function[J].IEEE Transactions on Computer Science,2014(9):690-693.

    [11]Alahmad M A,Alshaikhli I,Alduwaikh A E.A new fragile digital watermarking technique for a pdf digital holy quran[J].Advanced Computer Science Applications and Technologies,2013,56(3):250-253.

    [12]Adobe.Adobe PDF reference[M].CA,USA:Adobe,2006.

    Digital Watermarking Protection Algorithm Based on Format of PDF Document

    CHEN Qing,LU Yupeng

    (School of Optical-Electronical and Computer Engineering,University of Shanghai for Science and Technology,Shanghai 200093,China)

    AbstractIn order to solve the problems like document tampering that is leaded by multi-channel information dissemination on the Internet and the copyright of documents,this paper proposes a new algorithm that is based on the text format by analyzing the structure and content flow characteristics of PDF (Portable Document Format).The Kerckhoffs safety criteria and the digital signature algorithm are adopted to solve the problem of the copyright and to identify document tampering effectively.The author put the invisible watermark in the PDF document as a portable digital signature,thus modifying the properties of saturation without damage to the structure of the document through selective modification and adding related attributes to achieve the purpose of putting watermark in the document.Checking the watermark from the PDF document and the comparison with the original watermark can identify both the authenticity of a document and the copyright.The experimental result shows that the algorithm has good transparency and robustness,and has a larger capacity of watermark,which helps identify if the document has been tampered.

    KeywordsPDF;rendering mode;saturation characteristics;original;check the consistency

    doi:10.16180/j.cnki.issn1007-7820.2016.05.029 10.16180/j.cnki.issn1007-7820.2016.05.030

    收稿日期:2015-10-08 2015-09-14

    基金項(xiàng)目:國家自然科學(xué)基金資助項(xiàng)目(61303203);上海自然科學(xué)基金資助項(xiàng)目(12ZR1420800)

    作者簡介:陳青(1962—),女,副教授。研究方向:數(shù)字水印技術(shù),圖像編碼等。盧宇鵬(1991—),男,碩士研究生。研究方向:數(shù)字水印技術(shù)等。 賀宏洲(1984—),男,碩士,工程師。研究方向:衛(wèi)星測控跟蹤技術(shù)。秦玉峰(1979—),男,碩士,高級(jí)工程師。研究方向:衛(wèi)星測控跟蹤技術(shù)。

    中圖分類號(hào)TP311.1

    文獻(xiàn)標(biāo)識(shí)碼A

    文章編號(hào)1007-7820(2016)05-108-05

    浦江县| 无极县| 祁东县| 麻栗坡县| 全椒县| 四平市| 溧阳市| 隆回县| 瓦房店市| 木兰县| 蒙阴县| 汤阴县| 佛坪县| 定西市| 卓资县| 嘉善县| 黔西县| 舞阳县| 屏山县| 客服| 亚东县| 志丹县| 城市| 延川县| 湖州市| 双辽市| 青河县| 沙湾县| 泰和县| 斗六市| 文山县| 新竹县| 黄大仙区| 遂昌县| 名山县| 济源市| 江永县| 拜城县| 临潭县| 那坡县| 宁阳县|