盛建強,陳驍
(深圳信息職業(yè)技術學院,廣東 深圳 518172)
隨著拍照設備的日益普及,各種各樣的圖像數(shù)量呈現(xiàn)幾何級的飛速增長。而同時互聯(lián)網(wǎng)的快速發(fā)展也使得圖像傳播與共享變得更加快捷。為了有效地組織、查詢與瀏覽如此大規(guī)模的圖像資源,圖像檢索技術應運而生,成為計算機視覺領域的研究重點。
目前,圖像自動標注已經(jīng)得到廣泛研究,眾多的研究者從不同的方向分析和解決標注問題,提出了各種新穎的自動圖像標注算法。這些圖像標注方法大致可以分為三類:一類是基于分類的方法,第二種是基于搜索的方法,第三種是基于概率模型的方法。
特別地,在統(tǒng)計概率模型的方法中,統(tǒng)計主題模型(Statistic Topic Model)近年來得到了充分的重視和深入的研究。
在Blei和Jordan[1]提出的C-LDA模型中,首次構建了基于LDA模型的圖片和主題的一致性關系,其模型如圖2所示。受此啟發(fā),我們構建了基于流程圖上下文關系的一致性LDA模型(CC-LDA),根據(jù)流程圖本身所包含的文本信息W以及流程圖在全文中的上下文信息C[2-5],構建一個向量(W,C),通過計算概率P(W|C),估算流程圖在全文中上下文信息條件下的主題分布,作為我們標注流程圖的主題。
一幅流程圖,diagram中的單詞和context中單詞的聯(lián)合概率分布如式(1)所示:
式(2)是diagram中單詞的條件概率
符號定義如表1所示。
表1 符號定義說明
cc-LDA模型中Context的生成過程如下:
(1)對于每個Context d∈D,從參數(shù)為α的Dirichlet先驗分布中抽樣,得到文檔-主題多項分布θd;
(2)對于每個主題z∈K,從參數(shù)為γ的Dirichlet先驗分布中抽樣,得到主題-單詞多項式分布ψz;
(3)對Context d中的第i個詞cd,i:
①從多項分布抽取一個主題zd,i;
②從多項分布抽取一個單詞cd,i;
③重復(a,b)N次
(4)重復步驟(3)D次,直到整個corpus生成完成。
流程圖(Diagram)的生成過程如下:
(1)對于每個Diagramd∈D,從參數(shù)為α的Dirichlet先驗分布中抽樣,得到文檔-主題多項分布θd;
(3)對Diagram d中的第i個詞wd,i;
從[0,N]上的均勻分布中抽取gd,i
從多項分布θd抽取一個主題zd,i;
從多項分布ψz抽取一個單詞wd,i;
重復(a,b,c)M次
(4)重復步驟(3)D次,直到整個corpus生成完成。
cc-LDA模型的推導過程如下:
式(3)為主題z的概率分布。
式(4)為Context中單詞對主題z的條件概率分布。
式(5)為Diagram中單詞對主題z的條件概率分布。
然后使用Gibbs Sampling采樣計算得到如下后驗分布:
我們的實驗結(jié)果分兩部分進行,首先我們用Perplexity指標對圖像的標注結(jié)果進行度量。結(jié)果圖1所示。
本文基于生物醫(yī)學流程圖的特有屬性,構建了基于上下文語境的圖片和主題的一致性關系,通過實驗表明,該方法具有較好的冗余性和魯棒性,得到了較好的實驗結(jié)果。
圖1 實驗運行結(jié)果