邱 靜, 袁家政
(北京聯(lián)合大學(xué) 北京市信息服務(wù)工程重點(diǎn)實(shí)驗(yàn)室, 北京 100101)
?
一種基于XGML的RVIS表示方法
邱 靜, 袁家政
(北京聯(lián)合大學(xué) 北京市信息服務(wù)工程重點(diǎn)實(shí)驗(yàn)室, 北京 100101)
提出了一種基于XGML的RVIS表示方法。首先,借鑒XML和SVG語法,設(shè)計(jì)了一套適合RVIS表示的XGML模型;其次,提取圖像特征,轉(zhuǎn)換為XGML模型中的圖元數(shù)據(jù)描述集合;最后,對圖像進(jìn)行區(qū)域分裂合并操作,對不同區(qū)域進(jìn)行處理,將得到的區(qū)域轉(zhuǎn)換為XGML模型中的圖元素描述集合。RVIS方法通過對不同的光柵化矢量圖像進(jìn)行試驗(yàn),結(jié)果表明:此方法能夠很好地將光柵化矢量圖像表示為半結(jié)構(gòu)化的XGML文檔,使其存儲容量減小且便于檢索。
XGML;半結(jié)構(gòu)化;XML;SVG
隨著網(wǎng)絡(luò)應(yīng)用技術(shù)的高速發(fā)展,Web頁面中出現(xiàn)了大量的光柵化矢量圖像。一方面光柵化矢量圖像存儲容量較大;另一方面光柵化矢量圖像是以非結(jié)構(gòu)化數(shù)據(jù)(無規(guī)律、語義不明確)的形式存在,在對其進(jìn)行檢索處理上存在一定的難度。超圖形文本標(biāo)記語言(eXtensible Graphics Markup Language,簡稱XGML)是可擴(kuò)展標(biāo)記語言(Extensible Markup Language,簡稱XML)和可伸縮矢量圖形(Scalable Vector Graphics,簡稱SVG) 語法,將圖像存儲為一定格式和結(jié)構(gòu)的文本指令體系集合。光柵化矢量圖像半結(jié)構(gòu)化(Vector-Raster image semi-structural,簡稱RVIS)是指將光柵化矢量圖像存儲為XGML描述指令格式,使其方便進(jìn)行檢索并且減少存儲空間。但是由于圖像是由一系列離散不規(guī)則的像素點(diǎn)組成的,因此RVIS表示存在一定的難度。
XML[1]是一種可以對文檔和數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理的標(biāo)準(zhǔn)格式,它能夠?qū)崿F(xiàn)更加準(zhǔn)確的搜索以及更方便的文件傳輸。同時(shí),XML還可以方便進(jìn)行數(shù)據(jù)檢索功能、圖像壓縮以及圖像理解。[2-3]XML的出現(xiàn)給將圖像使用一定格式和結(jié)構(gòu)進(jìn)行存儲帶來先機(jī)。[4-5]SVG[6]是W3C組織制定的新一代基于XML語法的面向網(wǎng)絡(luò)應(yīng)用的二維矢量圖形標(biāo)準(zhǔn)格式,其基于文本的動態(tài)圖形描述格式,能夠很好地實(shí)現(xiàn)網(wǎng)絡(luò)傳輸與信息檢索等。由于SVG自身存在的技術(shù)優(yōu)勢,能夠滿足Web中用戶瀏覽的需要,因此SVG被廣泛應(yīng)用于WebGis[7-8]、3G手機(jī)中多媒體數(shù)據(jù)處理[9-11]、數(shù)據(jù)統(tǒng)計(jì)[12-13]等領(lǐng)域。同時(shí),由SVG研究學(xué)者成立的SVG共享資源Web網(wǎng)站,展示了大量的SVG應(yīng)用研究成果。此外,還有一個(gè)商業(yè)開發(fā)軟件VectorEye,可以將圖像轉(zhuǎn)換為SVG文檔。
本文借鑒XML和SVG語法,設(shè)計(jì)了一套簡單有效的適合描述光柵化矢量圖像的XGML模型;然后根據(jù)圖像內(nèi)容和人體視覺感知等,提取圖像特征,轉(zhuǎn)換成XGML模型中的圖元數(shù)據(jù)描述集合;接著對圖像進(jìn)行區(qū)域分裂合并操作,對不同區(qū)域進(jìn)行處理,將得到的區(qū)域轉(zhuǎn)換為XGML模型中的圖元素描述集合。實(shí)驗(yàn)結(jié)果表明,提出的方法能夠很好地將光柵化矢量圖像轉(zhuǎn)換為半結(jié)構(gòu)化的XGML文檔,從而達(dá)到方便圖像檢索以及減少圖像存儲空間的目的。
為了同時(shí)保留XML的檢索優(yōu)勢與SVG(圖1為SVG圖像的效果展示圖,其中圖1a)為SVG展示的Tiger圖形,圖1b)為Tiger圖形的SVG代碼展示效果)的圖像表示優(yōu)勢,我們設(shè)計(jì)了一種適合圖像半結(jié)構(gòu)化的簡潔高效的超文本標(biāo)記語言——XGML。XGML指令體系包括以下兩個(gè)指令集:圖元數(shù)據(jù)描述指令集、圖元素描述指令集。該指令體系不僅減少圖像存儲空間,還可以實(shí)現(xiàn)圖像檢索功能。
1.1 圖元數(shù)據(jù)描述指令集
XML語法中對圖像描述的指令能夠達(dá)到方便圖像檢索的目的。本文的圖元數(shù)據(jù)描述指令集,是基于XML語法,利用圖像信息來描述圖像語義、內(nèi)容的規(guī)范性指令集。XGML元數(shù)據(jù)描述指令集分為以下兩大類:語義規(guī)則集合、內(nèi)容規(guī)則集合。
1) 語義規(guī)則集合,來源于圖像底層特征和鄰域關(guān)系,主要描述外觀信息和位置信息等。這類集合具體語法有很多,下面主要介紹幾種常用的規(guī)則。
2) 內(nèi)容規(guī)則集合,來源于圖像上下文及人體視覺感知,主要描述圖像場景信息及圖像特征信息。下面主要介紹幾種常用規(guī)則:
Subject用于描述圖像主體對象,以結(jié)束,“target““color”等為其內(nèi)嵌屬性。
1.2 圖元素描述指令集
SVG語法能夠使用不同形狀描述圖像區(qū)域,但是SVG語法中的指令過長,加大了存儲空間。因此,我們借鑒SVG語法,設(shè)計(jì)一套既簡潔又能清楚表達(dá)指令意思的圖像描述指令集。我們的圖元素描述指令集,主要用于表示轉(zhuǎn)換為不同形狀的圖像區(qū)域。使用圖元素描述指令集表示圖像,可以減少圖像的存儲容量。其主要分為以下兩類:基本圖元素對象、復(fù)雜圖元素對象。
1) 基本圖元素對象,類似于SVG中基本形狀,這里主要介紹以下幾種常用對象:點(diǎn)、線、多邊形。
2) 復(fù)雜圖元素對象,描述的是不能使用基本圖元元素描述的比較復(fù)雜的對象,主要包括以下幾種常用對象:
2.1 圖元數(shù)據(jù)提取
圖元數(shù)據(jù)的提取,需要通過計(jì)算機(jī)自動提取圖像的底層視覺特征,而使用用戶加入高層語義,達(dá)到提取圖元數(shù)據(jù)的目標(biāo)。對輸入的將要進(jìn)行半結(jié)構(gòu)化的圖像,我們通過圖像分割,分割出圖像中的不同區(qū)域,然后提取出圖像的顏色、色距、紋理等底層視覺特征。我們提取的底層特征中的顏色特征為RGB顏色;同時(shí),提取的LBP(Local Binary Pattern,局部二值模式)是一種用來描述圖像局部紋理特征的算子,它具有旋轉(zhuǎn)不變性和灰度不變性等顯著的優(yōu)點(diǎn);此外,由于顏色信息主要分布于低階矩中,所以用一階矩、二階矩足以表達(dá)圖像的顏色分布。而用戶提取的高層語義,則是基于視覺感知和主觀識別來對不同圖像場景進(jìn)行標(biāo)注。最后,將計(jì)算機(jī)提取的底層特征以及用戶標(biāo)注的高層語義轉(zhuǎn)換為XGML模型的圖元數(shù)據(jù)文檔。圖3為提取圖元數(shù)據(jù)實(shí)例,其中圖3a)為原始圖像,圖3b)為對原始圖像提取的底層特征和高層語義的數(shù)據(jù)信息,圖3c)為將3b)中的底層特征和高層語義數(shù)據(jù)轉(zhuǎn)換為圖元數(shù)據(jù)的結(jié)果。
2.2 圖元素轉(zhuǎn)換
2.2.1 區(qū)域分割
圖元素轉(zhuǎn)換過程首先需要將圖像進(jìn)行區(qū)域分割,圖像區(qū)域劃分分為區(qū)域分裂和區(qū)域合并,圖像的區(qū)域分裂合并主要依據(jù)區(qū)域一致性條件,當(dāng)圖像中某個(gè)區(qū)域的特征不一致時(shí)就將該區(qū)域分裂成四個(gè)相等的子區(qū)域,當(dāng)相鄰子區(qū)域滿足特征一致性時(shí),則將其合并成為一個(gè)大的區(qū)域。完成區(qū)域分裂合并之后,將區(qū)域分解為邊緣形狀部分和顏色特征部分。具體步驟如下所示:
1) 初始,令R為整幅圖像的區(qū)域,對R進(jìn)行區(qū)域分裂。具體分裂步驟如下所示:
③ 對4個(gè)子區(qū)域Rik重復(fù)步驟①-②,直到?jīng)]有區(qū)域可以分裂為止。
2.2.2 邊緣處理
1) 初始,令當(dāng)前需要計(jì)算的邊緣點(diǎn)為i,則ai為從點(diǎn)i-1到i的方向,ai+1為從點(diǎn)i到i+1的方向。
通過計(jì)算相鄰邊緣像素點(diǎn)的方向的變化,來提取圖像邊緣的特征點(diǎn),減少了圖像邊緣的存儲空間,且為下一步圖元素轉(zhuǎn)換做了鋪墊。
2.3 圖元素轉(zhuǎn)換
接下來,我們將經(jīng)過上述操作之后的區(qū)域mi,轉(zhuǎn)換為圖元素描述集合文檔,具體如下所示:
完全實(shí)現(xiàn)了我們的基于XGML的RVIS表示方
法,并且在大量的光柵化矢量圖像上面進(jìn)行了測試。整個(gè)實(shí)驗(yàn),以構(gòu)建XGML模型為基礎(chǔ),實(shí)現(xiàn)了將光柵化矢量圖轉(zhuǎn)換為半結(jié)構(gòu)化文檔的目標(biāo)。我們的半結(jié)構(gòu)化文檔相比較于原始圖像而言,能夠方便圖像檢索以及減少圖像的存儲空間。
圖5a)為輸入的Butterfly光柵化矢量圖像,圖5b)為使用我們的方法將Butterfly圖進(jìn)行轉(zhuǎn)換的半結(jié)構(gòu)化XGML文檔的一部分代碼展示。其中圖5a)中不同的區(qū)域分別對應(yīng)圖5b)中的XGML半結(jié)構(gòu)化文檔中的不同區(qū)域(例如圖5a)中的region 1對應(yīng)的是圖5b)中的region 1,圖5b)中的Metadata為提取的圖元數(shù)據(jù)信息)。
表1、 表2中的數(shù)據(jù)能夠進(jìn)一步說明基于XGML的圖像半結(jié)構(gòu)化算法,便于圖像檢索以及減少了圖像存儲容量。表1中對于Tiger圖像、 Butterfly圖像、horse圖像、thinking-man圖像,比較了原始圖像信息數(shù)量以及轉(zhuǎn)換成為半結(jié)構(gòu)化的XGML文檔之后的圖元數(shù)據(jù)信息數(shù)量之后,得到的結(jié)果。其中,增加的信息為半結(jié)構(gòu)化文檔中的圖元數(shù)據(jù)減去原始圖像中的信息得到的結(jié)果;增加信息的倍數(shù)為半結(jié)構(gòu)化文檔中的圖元數(shù)據(jù)除以原始圖像中的信息得到的結(jié)果。由表1可知,經(jīng)過我們的方法轉(zhuǎn)換的半結(jié)構(gòu)化文檔,要比原始圖像更加便于檢索。表2中分別比較了Tiger圖像、Butterfly圖像、horse圖像、thinking-man圖像的原始存儲容量以及轉(zhuǎn)換為XGML半結(jié)構(gòu)化文檔之后的存儲容量。其中,減少存儲容量為XGML文檔的存儲容量減去原始圖像的存儲容量的結(jié)果,減少的存儲容量的百分比為減少的存儲容量除以原始圖像的存儲容量的結(jié)果。由表2可知,經(jīng)過我們的方法轉(zhuǎn)換的半結(jié)構(gòu)化文檔,比原始圖像的存儲容量要小。
我們的方法主要針對的是光柵化的矢量圖像,在構(gòu)建XGML指令體系的基礎(chǔ)上,將圖像進(jìn)行半結(jié)構(gòu)化描述。通過對不同的光柵化矢量圖像進(jìn)行試驗(yàn),結(jié)果表明,我們的方法能夠方便圖像檢索以及減少圖像的存儲容量。當(dāng)然我們的方法還存在一定的局限性,未來將會繼續(xù)豐富半結(jié)構(gòu)化的概念,建立更加完善的XGML指令體系。
圖像原始圖像中的信息/個(gè)提出的半結(jié)構(gòu)化XGML文檔中的信息/個(gè)增加的信息/個(gè)增加信息的倍數(shù)老虎(Tiger)蝴蝶(Butterfly)馬(Horse)思考者(Thinking-man)43437981036471.75323.3
表2 原始圖像與半結(jié)構(gòu)化XGML文檔的存儲容量的對比
[1] Hong S, Nah Y. An Intelligent Image Retrieval System using XML[C]//Multimedia Modelling Conference, 2004. Proceedings. International. 2004:363-363.
[2] Maheswari D, Radha V. Secure layer based compound image compression using XML compression[C]//IEEE International Conference on Computational Intelligence and Computing Research,2011:1-5.
[3] Zhao D Z, Li W, Yang J Z. An XML-based process definition language for medical image understanding[C]//Computer Application and System Modeling (ICCASM), 2010 International Conference on. IEEE, 2010:679-683.
[4] 張苗,惠小強(qiáng). 一種快速的XML文檔驗(yàn)證算法[J]. 計(jì)算機(jī)技術(shù)與發(fā)展,2015(8):1-7.
[5] 魏博文,宋坤芳,姜明華. 基于MapReduce的XML編碼研究[J]. 電子技術(shù)與軟件工程,2016(4):247-248.
[6] 李清泉,謝智穎,左小清,等. 基于SVG的空間信息描述與可視化表達(dá)[J]. 測繪學(xué)報(bào),2005(1):58-63.
[7] Wang P, Dong L Y. Web GIS research and application based on SVG[J]. Applied Mechanics & Materials, 2014(513):2004-2007.
[8] Huang H, Li Y, Gartner G, et al. An SVG-based method to support spatial analysis in XML/GML/SVG-based WebGIS[J]. International Journal of Geographical Information Science, 2011, 25(10): 1561-1574.
[9] Yuan M, Yuan J S, Huan G, et al. The mobile oilfield map based on SVG and inforamtion integration[J]. Advanced Materials Research, 2013(798): 349-352.
[10] Lin F, Guo C. Raster-vector integration based on SVG on mobile GIS platform[C]//Pervasive Computing and Applications (ICPCA), 2011 6th International Conference on. IEEE, 2011:378-383.
[11] Zhao Q, Deng F, Zhang W, et al. The research of mobile GIS power distribution line inspection based on mobile SVG/J2ME[J]. Physics Procedia, 2012(24): 1038-1043.
[12] Molina F, Sweeney B, Willard T, et al. Building cross-browser interfaces for digital libraries with scalable vector graphics (SVG)[C]//ACM/IEEE Joint Conference on Digital Libraries, JCDL 2007, Vancouver, BC, Canada, June 18-23, 2007, Proceedings. 2007:494-494.
[13] Ralf Kunze. Dynamic and interactive visualization of weather data with SVG[C/OL]. SVG Open 2005 Conference and Exhibition, Enschede, Netherlands, August 15-18, 2005.http://www.svgopen.org/2005/papers/Dynamic Interactive Weather Data/index.html.
[14] Canny J. A computational approach to edge detection[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2010, PAMI-8(6):679-698.
(責(zé)任編輯 李亞青)
An VRIS Representation Method Based on XGML
QIU Jing, YUAN Jia-zheng
(Beijing Key Laboratory of Information Services, Beijing Union University, Beijing 100101, China)
We have proposed a method of VRIS representation based on XGML. We have designed an imitation XGML model based on SVG and XML grammar to assist our VRIS representation. In the processing of our method, image features are converted into a meta-data descriptor.Then, using a split-and-merge algorithm, transforming image into an element descriptors by utilizing XGML model. The model was applied to an experimental data set which includes various vector images. Experiment results show that our VRIS representation method can efficiently represent raster images which originally were vector image to a semi-structured XGML document, and it successfully reduces storage capacity and increases the speed of image retrieval.
XGML; Semi-structured; XML; SVG
10.16255/j.cnki.ldxbz.2016.04.006
2016-03-03
國家自然科學(xué)基金項(xiàng)目(61372148; 61271369),國家科技支撐課題(2015BAH55F03),北京聯(lián)合大學(xué)“人才強(qiáng)校項(xiàng)目”(BPHR2014A04;BPHR2014E02)。
邱靜(1990—),女,湖北黃岡人,北京聯(lián)合大學(xué)北京市信息服務(wù)工程重點(diǎn)實(shí)驗(yàn)室碩士研究生,主要研究方向?yàn)閿?shù)字圖像處理。
袁家政(1971—),男,北京市人,北京聯(lián)合大學(xué)教授,主要研究方向?yàn)閿?shù)字圖像處理、導(dǎo)航定位。 E-mail: xxtjiazheng@buu.edu.cn
TP 391
A
1005- 0310(2016)04- 0033- 08