(湖北大學(xué)知行學(xué)院,武漢 430011)
現(xiàn)代計(jì)算機(jī)的發(fā)展越來(lái)越智能,對(duì)于文字、圖像、聲音的各種信息都能夠快速的識(shí)別與處理[1-3]。隨著多媒體技術(shù)的迅速發(fā)展,圖像信息所占的資源也在不斷的擴(kuò)充,大容量的、高速的遠(yuǎn)程分布式數(shù)據(jù)庫(kù)的建立為海量的動(dòng)態(tài)圖像提供了最基礎(chǔ)的保障,在各行各業(yè)中的應(yīng)用越來(lái)越廣泛,人們對(duì)動(dòng)態(tài)圖像信息的管理與檢索就更加的重視[4-5]。動(dòng)態(tài)圖像的檢索一直是我國(guó)研究的技術(shù)問題,無(wú)論是理論、方法還是技術(shù)都需要根據(jù)不同領(lǐng)域用戶提供的圖像來(lái)尋找一種適用于該領(lǐng)域圖像的檢索技術(shù)手段?,F(xiàn)在圖像數(shù)據(jù)庫(kù)研究的中心就是對(duì)圖像進(jìn)行檢索,這是最具有本質(zhì)性的研究領(lǐng)域,已經(jīng)成為國(guó)內(nèi)外學(xué)者研究的熱點(diǎn),這也成為了必須攻克的目標(biāo)[6-7]。近幾年,隨著大量文獻(xiàn)的出現(xiàn)帶動(dòng)了人們對(duì)于過去研究成果總結(jié)的動(dòng)力,對(duì)于圖像檢索的產(chǎn)生與歷史背景都是促進(jìn)檢索功能進(jìn)步的基礎(chǔ)。傳統(tǒng)的圖像信息檢索系統(tǒng)存在檢驗(yàn)圖像完好率與檢索圖像準(zhǔn)確率方面較差、檢索的速度較慢等問題,已經(jīng)不能滿足當(dāng)下人們對(duì)圖像信息檢索的需求。
文獻(xiàn)[8]中提出了一種基于內(nèi)容的圖像檢索系統(tǒng)的設(shè)計(jì),該系統(tǒng)設(shè)計(jì)的方法就是利用圖像的紋理、形狀以及顏色對(duì)圖像的特征提取、描述以及相似性度量,雖然檢索的信息比較全面,但是在理論上還存在許多問題等待解決;文獻(xiàn)[9]中提出了一種基于小波動(dòng)態(tài)圖像檢索的系統(tǒng)設(shè)計(jì),該系統(tǒng)設(shè)計(jì)的方法就是利用小波分析圖像的分辨率,用二維動(dòng)態(tài)時(shí)間的方法進(jìn)行計(jì)算,雖然能夠?qū)ο嚓P(guān)的程序進(jìn)行匹配與識(shí)別,但是在檢索技術(shù)的方面尚不成熟。文獻(xiàn)[10]中提出了一種基于動(dòng)態(tài)圖像信息互動(dòng)的特征檢索系統(tǒng)的設(shè)計(jì),該系統(tǒng)設(shè)計(jì)的方法就是將動(dòng)態(tài)的圖像信息互動(dòng)為基礎(chǔ),將圖像信息的特征進(jìn)行分類,采用迭代的算法對(duì)動(dòng)態(tài)圖像進(jìn)行檢索。
針對(duì)上述的觀點(diǎn),我提出了一種遠(yuǎn)程分布式數(shù)據(jù)庫(kù)動(dòng)態(tài)圖像信息檢索系統(tǒng)設(shè)計(jì)。首先根據(jù)遠(yuǎn)程分布式數(shù)據(jù)庫(kù)的特點(diǎn),設(shè)計(jì)出了動(dòng)態(tài)圖像的檢索硬件系統(tǒng)框圖;然后基于動(dòng)態(tài)圖像特征檢索算法對(duì)軟件進(jìn)行了設(shè)計(jì);最后進(jìn)行了對(duì)比的實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果證明,遠(yuǎn)程分布式數(shù)據(jù)庫(kù)動(dòng)態(tài)圖像信息檢索系統(tǒng)的設(shè)計(jì)能夠改善傳統(tǒng)圖像信息檢索系統(tǒng)檢驗(yàn)圖像完好率與檢索圖像準(zhǔn)確率較差的問題,并且在檢索速度的方面也有較大的提升,具有分布性廣、通信良好以及穩(wěn)健性較強(qiáng)等優(yōu)點(diǎn),為我國(guó)未來(lái)的圖像檢索技術(shù)奠定了堅(jiān)實(shí)的基礎(chǔ)。
遠(yuǎn)程分布式數(shù)據(jù)庫(kù)動(dòng)態(tài)圖像信息檢索系統(tǒng)硬件設(shè)計(jì)需要對(duì)整個(gè)系統(tǒng)從上至下進(jìn)行分層,分別是:遠(yuǎn)程分布式數(shù)據(jù)層、公共服務(wù)層、主業(yè)務(wù)層、支撐系統(tǒng)層。遠(yuǎn)程分布式數(shù)據(jù)層的設(shè)計(jì)主要包括整個(gè)系統(tǒng)中會(huì)用到的數(shù)據(jù),通過對(duì)特征的處理得到模型的數(shù)據(jù),而圖片的特征主要用于模型的訓(xùn)練,進(jìn)行索引特征的建立與處理;公共服務(wù)層主要是提取圖片中最原始的特征,并對(duì)特征處理,這其中就包括了利用訓(xùn)練模型得到的數(shù)據(jù);主業(yè)務(wù)層主要就是用Web服務(wù)技術(shù)的設(shè)計(jì)來(lái)服務(wù)普通的用戶;支撐系統(tǒng)層為整個(gè)系統(tǒng)的存儲(chǔ)提供支撐的作用。而每個(gè)層次主要包括管理員與普通用戶這兩個(gè)角色,管理員是對(duì)硬件系統(tǒng)的管理與維護(hù);用戶是系統(tǒng)檢索服務(wù)的使用者。為了能夠應(yīng)對(duì)遠(yuǎn)程分布式數(shù)據(jù)庫(kù)的動(dòng)態(tài)圖像的需求,在硬件設(shè)計(jì)的時(shí)候應(yīng)該使用FastDFS的系統(tǒng)對(duì)圖片進(jìn)行儲(chǔ)存,該系統(tǒng)能夠直接的使用OS對(duì)計(jì)算機(jī)的管理與控制。對(duì)于圖片的上傳與下載需要將存儲(chǔ)的服務(wù)器按照原來(lái)的路徑進(jìn)行返回,但是直接在瀏覽器上就對(duì)圖片的傳輸協(xié)議請(qǐng)求進(jìn)行系統(tǒng)上的支持,這種效果并不好,為此,應(yīng)該對(duì)每臺(tái)存儲(chǔ)服務(wù)器進(jìn)行重新的配置,并安裝上具有軟件開發(fā)和高性能的反向代理服務(wù)器如圖1所示。
圖1 圖片儲(chǔ)存的系統(tǒng)架構(gòu)設(shè)計(jì)
對(duì)于Web服務(wù)設(shè)計(jì)采用的是Java EE應(yīng)用程序的技術(shù),框架為MVC的分層模型,主要包括:業(yè)務(wù)的邏輯層、控制層和視圖層,如圖2所示。
圖2 Web服務(wù)技術(shù)的架構(gòu)
由圖2可知:業(yè)務(wù)的邏輯層主要是對(duì)圖片的屬性進(jìn)行解析,然后向檢索的服務(wù)模塊發(fā)出相應(yīng)的請(qǐng)求,并歸納多個(gè)檢索服務(wù)模塊所接收到的結(jié)果信息;控制層主要是對(duì)圖片的上傳、參數(shù)的處理、返回的信息以及接收的請(qǐng)求進(jìn)行處理,一定的情況下可以調(diào)用業(yè)務(wù)的邏輯層輔助完成工作;視圖層用戶界面(UI)的模塊,主要通過JSP的負(fù)責(zé)來(lái)完成相應(yīng)的程序。
框架為MVC的分層模型能夠降低Web服務(wù)技術(shù)架構(gòu)之間的模塊耦合程度,并使數(shù)據(jù)的顯示情況與業(yè)務(wù)之間的邏輯相互分離,并且可以方便的對(duì)視圖層和業(yè)務(wù)邏輯層進(jìn)行擴(kuò)充或修改,后續(xù)的相應(yīng)工作也可以精心的維護(hù)。
結(jié)合遠(yuǎn)程分布式數(shù)據(jù)庫(kù)優(yōu)點(diǎn)與比較成熟的Web服務(wù)技術(shù)建立了動(dòng)態(tài)圖像的檢索系統(tǒng),該系統(tǒng)的模塊主要包括:查詢的引擎、特征的提取、特征的對(duì)比、特征的圖像庫(kù)、查詢的反饋與滿意程度、圖像信息的參數(shù)以及數(shù)據(jù)庫(kù)的管理,具體結(jié)構(gòu)如圖3所示。
圖3 動(dòng)態(tài)圖像的檢索硬件系統(tǒng)框圖
從圖3可以看出,交界口能夠接收用戶提供的圖像,等待查詢,設(shè)置相應(yīng)的特征進(jìn)行提取并對(duì)參數(shù)對(duì)比,即可顯示查詢的結(jié)果,并通過接口對(duì)查詢的結(jié)果進(jìn)行評(píng)價(jià),將特征修改后能夠重新對(duì)信息進(jìn)行查詢。根據(jù)用戶對(duì)查詢結(jié)果的滿意程度對(duì)參數(shù)進(jìn)行修正,通過調(diào)整可更新圖像的數(shù)據(jù)庫(kù),從而提高查詢的精準(zhǔn)度。而特征的對(duì)比就是利用提取的圖像特征進(jìn)行對(duì)比,篩選出符合規(guī)定的數(shù)據(jù)提供給用戶,該模塊可根據(jù)具體的情況進(jìn)行控制與調(diào)整。
整個(gè)系統(tǒng)的設(shè)計(jì)是在Linux的平臺(tái)上進(jìn)行的,并且使用的軟件系統(tǒng)環(huán)境都是在64位以桌面應(yīng)用為主的Ubuntu17.04券商提供的自由交易系統(tǒng)版本,并且在該系統(tǒng)中的語(yǔ)言開發(fā)環(huán)境主要是Java和C++為主體的腳本語(yǔ)言,而Web服務(wù)的結(jié)構(gòu)與Hadoop的集群為主要計(jì)算的部分,并用Java進(jìn)行語(yǔ)言的開發(fā)。
基于動(dòng)態(tài)圖像特征檢索算法的軟件設(shè)計(jì):
軟件設(shè)計(jì)采用的是直接面對(duì)檢索對(duì)象的一種算法,將動(dòng)態(tài)圖像的處理分成圖像人工的注釋、圖像內(nèi)容的特征、圖像基本的屬性以及圖像的數(shù)據(jù)源。圖像人工的注釋是對(duì)整個(gè)遠(yuǎn)程分布式數(shù)據(jù)庫(kù)動(dòng)態(tài)圖像的內(nèi)容以文字的形式進(jìn)行描述;圖像內(nèi)容的特征是對(duì)原始圖像進(jìn)行處理,并進(jìn)行相應(yīng)的匹配運(yùn)算;圖像基本的屬性是將文件的種類、所占的內(nèi)存、處理的日期以及一些其他的屬性信息存放在檢索對(duì)象的變量之中,通過指定的程序進(jìn)行初始化的編輯;圖像的數(shù)據(jù)源指的是最原始的圖像,通過遠(yuǎn)程分布式數(shù)據(jù)庫(kù)的建立,進(jìn)行相應(yīng)字段的索引。遠(yuǎn)程分布式數(shù)據(jù)庫(kù)動(dòng)態(tài)圖像信息加載的流程如圖3所示。
圖4 動(dòng)態(tài)圖像信息加載的流程
由圖4可知:動(dòng)態(tài)圖像的信息加載是一個(gè)重要的環(huán)節(jié)。檢索系統(tǒng)主要是對(duì)具有顏色模型的不同分量來(lái)對(duì)人類視覺感知的情況進(jìn)行非均勻的量化,并有效的對(duì)維數(shù)進(jìn)行矢量的壓縮,然后采用主元的分析方法將整個(gè)圖像進(jìn)行降維,并研究通過主分量來(lái)解決多變量的方差結(jié)構(gòu)的檢索方法。
1)顏色分量的方法。
顏色分量的方法是將顏色的數(shù)值對(duì)圖像的信息進(jìn)行索引的方法,這種方法又被稱為拉普拉斯或者方向?qū)?shù)的方法,得出的結(jié)果就是與之相鄰的變化率,具體方法如下所示:
首先確定顏色數(shù)值的對(duì)數(shù):
i(a,b)=ln(r(a,b))
(1)
公式(1)中(a,b)為給定的點(diǎn)的對(duì)數(shù);r(a,b)為點(diǎn)(a,b)的L值。然后計(jì)算不同的卷積:
①拉普拉斯卷積:
i(a,b)Δ2?c(a,b)
Δ2={[p(a+1,b)-p(a,b)]-[p(a,b)-p(a-1,b)]}
+{[p(a,b+1)-p(a,b)]-[p(a,b)-p(a,b-1)]}
(2)
②方向?qū)?shù):
i(a,b)Δn=cn(a,b)
(3)
最后構(gòu)造直方圖:
①拉普拉斯卷積:
(4)
②方向?qū)?shù)
(5)
2)主元的分析方法。
由上述(1)中得出的圖像特征的準(zhǔn)確率還是比較高的,但是同時(shí)也產(chǎn)生了較高的維數(shù),為此,必須采用PCA的方法對(duì)圖像降維。首先設(shè)置{ai}ci=1作為一個(gè)圖像的集合,其中c為圖像集合中的若干個(gè)圖像的個(gè)數(shù),ai為圖像特征的向量。從整個(gè)集合中隨機(jī)的抽取出若干個(gè)樣本組成{ai1,ai2,…,aim}的訓(xùn)練集合,那么樣本的平均值n以及協(xié)方差Q的表達(dá)式如下所示:
(6)
(7)
(8)
設(shè)yi,i=1,2,…,m作為協(xié)方差Q的特征向量,對(duì)應(yīng)的特征值為βi,因此可得:
Q=AATyi=βiyi
(9)
根據(jù)上述的計(jì)算步驟得出協(xié)方差Q的特征數(shù)值與特征的向量,那么計(jì)算出來(lái)的特征向量就是根據(jù)相應(yīng)的特征值按照大小的降序順序進(jìn)行排列,并將得出的特征值按照組列的形式變換成矩陣:
yi=QTai
(10)
公式(10)中的yi即為動(dòng)態(tài)圖像檢索的特征向量。
為了驗(yàn)證遠(yuǎn)程分布式數(shù)據(jù)庫(kù)動(dòng)態(tài)圖像信息檢索系統(tǒng)設(shè)計(jì)的合理性,進(jìn)行了如下的實(shí)驗(yàn)。隨著社會(huì)的不斷發(fā)展,多元化的社會(huì)環(huán)境也逐漸成熟,人們對(duì)于數(shù)據(jù)庫(kù)的動(dòng)態(tài)圖像信息檢索的性能要求也越來(lái)越嚴(yán)格。對(duì)于檢索性能的驗(yàn)證主要從兩個(gè)方面進(jìn)行實(shí)驗(yàn),分別是檢索的速度與檢索的精準(zhǔn)程度。數(shù)據(jù)庫(kù)的動(dòng)態(tài)圖像信息檢索的速度主要是由圖像的特征提取的匹配復(fù)雜程度所決定的;而動(dòng)態(tài)圖像信息檢索的精準(zhǔn)程度主要是由圖像的特征區(qū)分與匹配的算法所決定的。檢驗(yàn)圖像完好率與檢索圖像準(zhǔn)確率是目前檢驗(yàn)數(shù)據(jù)庫(kù)的動(dòng)態(tài)圖像信息檢索性能的主要指標(biāo),具體表達(dá)式如公式所示:
(11)
選取兩幅人臉表情的動(dòng)態(tài)圖像、兩幅人體運(yùn)動(dòng)的圖像作為圖像信息檢索實(shí)驗(yàn)的樣本,這些圖像均具有紋理譜特征,這種特征對(duì)圖像信息檢索實(shí)驗(yàn)的影響如表5所示。
表5 紋理譜特征對(duì)圖像信息檢索實(shí)驗(yàn)的影響
由表5可知:該特征并沒有影響動(dòng)態(tài)圖像信息檢索的完好率與準(zhǔn)確率,為此可以將特征忽略不計(jì)。
由上述的實(shí)驗(yàn)過程,可以知道選取的圖像樣本可以忽略圖像的檢索的特征,因此,也不會(huì)對(duì)檢索的過程造成影響。傳統(tǒng)的數(shù)據(jù)庫(kù)動(dòng)態(tài)圖像信息檢索系統(tǒng)與遠(yuǎn)程分布式數(shù)據(jù)庫(kù)動(dòng)態(tài)圖像信息檢索系統(tǒng)在檢驗(yàn)圖像完好率與檢索圖像準(zhǔn)確率方面進(jìn)行了對(duì)比,如表5所示。
表6 傳統(tǒng)檢索系統(tǒng)與遠(yuǎn)程分布式的檢索系統(tǒng)之間的對(duì)比
由表6可知:傳統(tǒng)的檢索系統(tǒng)在檢驗(yàn)圖像完好率與檢索圖像準(zhǔn)確率都比較差,人們對(duì)色彩感知相互一致,但是在對(duì)色彩的判定上具有一定的差距,傳統(tǒng)的圖像索引主要存在的問題就是對(duì)色彩特征的感知能力仍然不夠。
而檢索速度的方面兩個(gè)系統(tǒng)之間的對(duì)比情況如圖5所示。
由圖5可知,遠(yuǎn)程分布式數(shù)據(jù)庫(kù)動(dòng)態(tài)圖像信息檢索系統(tǒng)與傳統(tǒng)的數(shù)據(jù)庫(kù)動(dòng)態(tài)圖像信息檢索系統(tǒng)相比,檢索的速度較快。
實(shí)驗(yàn)結(jié)果證明:遠(yuǎn)程分布式數(shù)據(jù)庫(kù)動(dòng)態(tài)圖像信息檢索系統(tǒng)具有分布性廣、通信良好以及穩(wěn)健性較強(qiáng)的優(yōu)點(diǎn),作為具有完整的數(shù)據(jù)庫(kù)能夠?qū)⒎植荚诟鱾€(gè)結(jié)點(diǎn)上的圖像信息進(jìn)行匯集,在邏輯上統(tǒng)一。該系統(tǒng)結(jié)構(gòu)的檢驗(yàn)圖像完好率與檢索圖像準(zhǔn)確率較高,速度較快,適應(yīng)分布式的管理模式對(duì)機(jī)構(gòu)進(jìn)行控制,在經(jīng)濟(jì)上的性能也比較優(yōu)越,可靠性與可用性較強(qiáng),擴(kuò)展性能極好,有益于多圖像的共同檢索。
動(dòng)態(tài)圖像的檢索一直是我國(guó)研究的技術(shù)問題,無(wú)論是理論、方法還是技術(shù)都需要根據(jù)不同領(lǐng)域用戶提供的圖像來(lái)尋找一種適用于該領(lǐng)域圖像的檢索技術(shù)手段。由于圖像信息的多變,不能僅僅根據(jù)圖像的特征頻率就直接對(duì)圖像進(jìn)行檢索,還需要通過經(jīng)驗(yàn)的知識(shí)來(lái)判定圖像的大小,遠(yuǎn)程分布式數(shù)據(jù)庫(kù)動(dòng)態(tài)圖像信息檢索系統(tǒng)正是綜合了上述的特點(diǎn),并結(jié)合自身的分布式數(shù)據(jù)的優(yōu)勢(shì)進(jìn)行圖像的檢索。
總之,遠(yuǎn)程分布式數(shù)據(jù)庫(kù)動(dòng)態(tài)圖像信息檢索系統(tǒng)所涉及的領(lǐng)域較廣,發(fā)展的速度較快,不會(huì)受到時(shí)間與文獻(xiàn)的束縛,通過不斷的優(yōu)化,能夠?qū)D像數(shù)據(jù)庫(kù)分成3種主要的領(lǐng)域,分別是圖像的識(shí)別、圖像的處理以及數(shù)據(jù)庫(kù),將三者的技術(shù)成果有效的結(jié)合起來(lái),是未來(lái)的一個(gè)發(fā)展趨勢(shì)。遠(yuǎn)程分布式數(shù)據(jù)庫(kù)動(dòng)態(tài)圖像信息檢索系統(tǒng)擴(kuò)展了傳統(tǒng)數(shù)據(jù)庫(kù)中技術(shù)的應(yīng)用,為未來(lái)的圖像處理提供了有力的技術(shù)手段。
[1] 李 應(yīng), 陳秋菊. 基于優(yōu)化的正交匹配追蹤聲音事件識(shí)別[J]. 電子與信息學(xué)報(bào), 2017, 39(1):183-190.
[2] 呂其兵, 張 曦, 駱德陽(yáng),等. 基于閃光聲音信息的鋼軌焊接接頭質(zhì)量分析[J]. 焊接學(xué)報(bào), 2016, 37(9):105-109.
[3] 張艷博, 于光遠(yuǎn), 田寶柱,等. 花崗巖破裂過程聲發(fā)射主頻多元前兆信息識(shí)別[J]. 采礦與安全工程學(xué)報(bào), 2017(2):355-362.
[4] 李晴晴, 周長(zhǎng)勝, 呂學(xué)強(qiáng),等. 基于動(dòng)態(tài)紋理基元的外觀設(shè)計(jì)專利檢索[J]. 微電子學(xué)與計(jì)算機(jī), 2016, 33(3):25-31.
[5] 孫 震. 信息與技術(shù)的利用:創(chuàng)新知識(shí)與提升生活水平——從ASIS&T 2016年會(huì)論文看信息科學(xué)研究當(dāng)前熱點(diǎn)與動(dòng)態(tài)[J]. 圖書情報(bào)知識(shí), 2017(3) :24-32.
[6] 韓正彪. 基于分布式認(rèn)知的文獻(xiàn)數(shù)據(jù)庫(kù)用戶心智模型演進(jìn)驅(qū)動(dòng)因素研究[J]. 情報(bào)學(xué)報(bào), 2017, 36(1):79-88.
[7] 陳小莉. 基于大數(shù)據(jù)的計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)中的研究應(yīng)用[J]. 激光雜志, 2017(2):142-145.
[8] 陳 倩, 潘中良. 基于內(nèi)容的服裝檢索系統(tǒng)中顏色特征提取算法的研究和改進(jìn)[J]. 激光雜志, 2016(4):62-68.
[9] 翟?shī)W博, 溫顯斌, 張 鑫. 基于改進(jìn)雙樹復(fù)小波和灰度-梯度共生矩陣的紋理圖像檢索算法[J]. 計(jì)算機(jī)科學(xué), 2017, 44(6):274-277.
[10] 劉 晙, 劉 丹. 基于組合特征檢索策略的圖像檢索技術(shù)研究[J]. 合肥工業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版, 2015(7):918-922.