于顏儒
【摘 要】隨著多媒體技術(shù)的不斷發(fā)展,基于內(nèi)容的圖像檢索技術(shù)發(fā)展迅猛。本篇文章提供一種面向多媒體信息檢索領(lǐng)域的特征維數(shù)約簡(jiǎn)技術(shù),它針對(duì)多媒體圖像、視頻數(shù)據(jù)特征維數(shù)很高、容易引起“維數(shù)災(zāi)難”的特點(diǎn),利用檢索結(jié)果與查詢(xún)之間的相關(guān)程度信息,加入皮爾遜相關(guān)系數(shù),對(duì)傳統(tǒng)的局部保持投影(Local Preserving Projection, LPP)[1]進(jìn)行了改進(jìn),達(dá)到了提高維數(shù)約簡(jiǎn)效果的目的。
【關(guān)鍵詞】維數(shù)約簡(jiǎn) LPP 皮爾遜相關(guān)系數(shù)
1 研究背景
隨著信息技術(shù)的快速發(fā)展,圖像和視頻等多媒體數(shù)據(jù)大量涌現(xiàn),成為人們獲取信息的重要途徑之一。然而,這些數(shù)據(jù)通常具有高維特性,直接其進(jìn)行分析和處理會(huì)出現(xiàn)如下重要問(wèn)題:(1)計(jì)算復(fù)雜度高;(2)存儲(chǔ)代價(jià)高昂;(3)維數(shù)災(zāi)難。這些問(wèn)題嚴(yán)重制約多媒體內(nèi)容分析和檢索。維數(shù)約簡(jiǎn)是有效解決這些問(wèn)題的重要方法,其目標(biāo)是通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行變換而得到的有效的低維表示。維數(shù)約簡(jiǎn)的定義為給定一批觀察樣本,記作,即包含n個(gè)樣本,每個(gè)樣本均是D維,根據(jù)某個(gè)準(zhǔn)則,找到數(shù)據(jù)的低維表示,同時(shí)保持?jǐn)?shù)據(jù)的幾何結(jié)構(gòu)。
局部保持投影方法能較好解決數(shù)據(jù)處理中的“維數(shù)災(zāi)難”問(wèn)題,保持原始數(shù)據(jù)的拓?fù)浣Y(jié)構(gòu)不變[2],作為拉普拉斯特征映射的一種線(xiàn)性逼近可以較好的反映樣本的流形結(jié)構(gòu),已經(jīng)被廣泛的應(yīng)用到圖像檢索和圖像修復(fù)中。局部保持投影方法有著非常重要的一步是構(gòu)建所有點(diǎn)的鄰接圖,距離定義為歐氏距離,即相似度的計(jì)算。有時(shí)在做相似度計(jì)算的時(shí)候經(jīng)常會(huì)用到皮爾遜相關(guān)系數(shù)[3],它描述了兩個(gè)定距變量間聯(lián)系的緊密程度(線(xiàn)性關(guān)系)。在歐式距離的基礎(chǔ)之上加入皮爾遜相關(guān)系數(shù),能夠得到更加準(zhǔn)確的鄰接圖。
2 加入皮爾遜相關(guān)系數(shù)的局部保持算法
LPP是一種最近提出的能夠較好保持非線(xiàn)性局部數(shù)據(jù)特征的線(xiàn)性流形學(xué)習(xí)算法,它是Laplace-Beltrami算子[4]特征函數(shù)的一個(gè)線(xiàn)性估計(jì),其目的是保持?jǐn)?shù)據(jù)之間原有的相似關(guān)系,即原始數(shù)據(jù)空間上相鄰的數(shù)據(jù)點(diǎn)在投影后的空間上也保持相應(yīng)的相鄰關(guān)系。LPP算法中的無(wú)向圖構(gòu)造和相似矩陣的建立都需要計(jì)算任意兩點(diǎn)之間的距離,最經(jīng)典的距離計(jì)算方式是歐式距離[5],但是歐式距離只是從數(shù)據(jù)的角度,并沒(méi)有考慮到數(shù)據(jù)本身的結(jié)構(gòu),不能準(zhǔn)確的體現(xiàn)數(shù)據(jù)間的關(guān)系。所以引入了皮爾遜相關(guān)系數(shù),提出了加入皮爾遜相關(guān)系數(shù)的局部保持算法(PCC-LPP)。PCC-LPP能夠更加準(zhǔn)確保持每個(gè)數(shù)據(jù)點(diǎn)的近鄰關(guān)系,使維數(shù)約簡(jiǎn)之后的數(shù)據(jù)更加接近原始數(shù)據(jù)特征。
皮爾遜相關(guān)系數(shù)是一種度量?jī)蓚€(gè)變量間相關(guān)程度的方法。樣本之間的相關(guān)系數(shù)一般用表示,計(jì)算公式為:
的取值在-1與+1之間,若,表明兩個(gè)變量是正相關(guān),即一個(gè)變量的值越大,另一個(gè)變量的值也會(huì)越大,為1時(shí),為完全正相關(guān);若,表明兩個(gè)變量是負(fù)相關(guān),即一個(gè)變量的值越大另一個(gè)變量的值反而會(huì)越小,為-1時(shí),為完全負(fù)相關(guān)。在這里我們認(rèn)為值越大表示兩個(gè)樣本的相似程度越高[6][7]。
在計(jì)算兩點(diǎn)距離時(shí)將皮爾遜相關(guān)系數(shù)加入到原始的歐式距離中,新的距離計(jì)算公式為:
PCC-LPP能夠更加準(zhǔn)確的體現(xiàn)數(shù)據(jù)之間的關(guān)系,使得維數(shù)約簡(jiǎn)算法更加準(zhǔn)確。PCC-LPP是對(duì)LPP算法的改進(jìn),沒(méi)有加入其他標(biāo)注信息,所以依然是一個(gè)無(wú)監(jiān)督的線(xiàn)性降維算法。
3 實(shí)驗(yàn)結(jié)果
從Google搜索引擎上搜索10個(gè)查詢(xún)主題,包括 “Bike”、“Greet Wall”、“White House”、“Ice cream”、“Football”、“Fish”、“Baby”、“Tree”、“Summer”、“Stars”。分別涉及動(dòng)物,人物,運(yùn)動(dòng),景物。下載每個(gè)主題查詢(xún)結(jié)果的前500幅圖像,并且為每幅圖像人工標(biāo)注相關(guān)性等級(jí)。相關(guān)性等級(jí)分為三個(gè)級(jí):非常相關(guān)、一般相關(guān)、不相關(guān)。實(shí)驗(yàn)前為每個(gè)查詢(xún)主題選擇一少部分圖像作為訓(xùn)練圖像,非常相關(guān)、一般相關(guān)、不相關(guān)每組選出若干圖像組成標(biāo)注樣本集合,其余樣本作為未標(biāo)注樣本集合。
實(shí)驗(yàn)首先提取圖像的特征向量,然后用不同的維數(shù)約簡(jiǎn)方法處理圖像特征向量,再用降維之后得到的數(shù)據(jù)和部分標(biāo)注的相關(guān)性等級(jí)進(jìn)行排序訓(xùn)練得到排序模型,利用排序模型對(duì)所有樣本進(jìn)行排序,最后評(píng)價(jià)各個(gè)維數(shù)約簡(jiǎn)算法在重排序中的效果。(如圖1所示)為查詢(xún)的初始結(jié)果和重排序之后的結(jié)果。
參考文獻(xiàn):
[1]Niyogi X. Locality preserving projections[C]//Neural information processing systems. 2004,16:153.
[2]林晟.人臉圖像特征提取和識(shí)別算法研究[D].哈爾濱理工大學(xué),2009.
[3]Derrick T R,Bates B T, Dufek J S. Evaluation of time-series data sets using the Pearson product-moment correlation coefficient[J].Medicine and science in sports and exercise, 1994,26(7):919.
[4]Andreotti A,Vesentini E.Carleman estimates for the Laplace-Beltrami equation on complex manifolds[J].Publications Mathématiques de lIH?S,1965,25(1):81-130.
[5]張忠林,曹志字,李元韜.基于加權(quán)歐式距離的k_means算法研究[J].鄭州大學(xué)學(xué)報(bào):工學(xué)版, 2010,31(1):89-92.
[6]王翠茹,田振清.兩隨機(jī)變量簡(jiǎn)單相關(guān)系數(shù)圖式的算法設(shè)計(jì)[J].中國(guó)教育技術(shù)裝備,2011(006):69-70.
[7]郭洪燕.工業(yè)企業(yè)安全投入與產(chǎn)出模型研究[D].蘭州理工大學(xué),2011.