劉楊
摘要:基于仿射運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)核(aSFM)的非剛體運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)(NRSFM)算法(NRSFM-aSFM)是一種比較新穎和穩(wěn)定的針對(duì)運(yùn)動(dòng)形變物體的三維重構(gòu)算法。但是,該算法的重構(gòu)誤差會(huì)受到形狀基的數(shù)目,也就是秩參數(shù)的較大影響。因此,有必要找到一種有效的秩參數(shù)選取方法。本文中,我們提出了一種基于特征值分解的秩參數(shù)選取方法,該方法可以針對(duì)NRSFM-aSFM算法自動(dòng)的選取最優(yōu)或接近最優(yōu)的秩參數(shù),在一些廣泛使用的數(shù)據(jù)中的實(shí)驗(yàn)結(jié)果表明了該方法的有效性及易用性。
關(guān)鍵詞:非剛體運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)(NRSFM);秩參數(shù)選??;特征值分解
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)19-0259-02
1 背景介紹
非剛體運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)(NRSFM)技術(shù)是一種由圖像序列的二維特征點(diǎn)估計(jì)物體三維形狀和攝像機(jī)運(yùn)動(dòng)的方法[1][2]。通過(guò)估計(jì)物體的三維信息可以有效地增強(qiáng)圖像處理系統(tǒng)的性能,例如人臉的三維信息可以極大地提高人臉識(shí)別算法的準(zhǔn)確率[3]。然而,運(yùn)動(dòng)物體通常會(huì)經(jīng)歷形狀和姿態(tài)變化[1]。由于欠約束和缺少物體三位形狀的先驗(yàn)信息,解決NRSFM問(wèn)題是計(jì)算機(jī)視覺(jué)領(lǐng)域一個(gè)非常困難的任務(wù)[4]。
為了使NRSFM問(wèn)題更易處理,通常會(huì)做一些假設(shè),例如為了減少三維形狀的變化和未知量的數(shù)目,物體三維形狀通常會(huì)被假設(shè)隨著時(shí)間平滑改變[5][6]。然而當(dāng)無(wú)法確保數(shù)據(jù)的時(shí)間順序時(shí),物體形狀變化的時(shí)序平滑性就無(wú)從談起。此外,時(shí)間平滑約束也無(wú)法處理物體突然變形的情況。
為了解決這個(gè)問(wèn)題,NRSFM-aSFM算法提出空間平滑約束取代時(shí)間約束。該算法的優(yōu)點(diǎn)是可以處理非時(shí)序和突然形變的數(shù)據(jù)。但是NRSFM-aSFM算法的重構(gòu)精度一般會(huì)隨著秩參數(shù)K(形狀基的數(shù)目)的變化而波動(dòng)。因此,本文設(shè)計(jì)一種有效的方法來(lái)自動(dòng)的選取最優(yōu)或者接近最優(yōu)重構(gòu)結(jié)果的秩參數(shù)K。
本文提出了一種基于特征值分解的秩參數(shù)選取方法。在該方法中,秩參數(shù)由通過(guò)QR分解獲得的特征值的累加之和進(jìn)行估計(jì)。通過(guò)該算法可以直接由2D圖像數(shù)據(jù)推導(dǎo)出最優(yōu)或接近最優(yōu)的秩參數(shù)K。在一些使用廣泛的數(shù)據(jù)中的實(shí)驗(yàn)結(jié)果顯示了該算法在秩參數(shù)選取中的易用性和有效性。
本文余下由三個(gè)部分組成。第二節(jié)詳細(xì)介紹了該算法。第三節(jié)給出了相關(guān)的是實(shí)驗(yàn)結(jié)果。最終,在第四節(jié)給出結(jié)論。
3 實(shí)驗(yàn)
3.1 實(shí)驗(yàn)數(shù)據(jù)和設(shè)置
我們通過(guò)7個(gè)非剛體運(yùn)動(dòng)數(shù)據(jù)驗(yàn)證本文的方法。這7個(gè)圖像序列分別為:walking, face1, stretch, dance, face2, jaws, yoga。這7個(gè)數(shù)據(jù)具體的幀數(shù)和特征點(diǎn)的數(shù)目如下所示:
本文采用不同的K值分別對(duì)表1的7個(gè)數(shù)據(jù)做實(shí)驗(yàn)來(lái)驗(yàn)證本文提出方法的有效性。一般來(lái)說(shuō)NRSFM算法中低秩已經(jīng)能夠充分的表示物體的形狀變化,對(duì)于NRSFM-aSFM算法,低秩約束也是一個(gè)重要的假設(shè)條件。因此,此處我們將K值的范圍限制在[1,10]。
表2列出了最優(yōu)的K值、本文的方法選取的K值以及對(duì)應(yīng)的三維重構(gòu)誤差,對(duì)于walking和stretch,最優(yōu)的K值與使用我們的算法選擇的K值相同。從中可以看出本文提出的算法選取的K值非常接近最優(yōu)值,部分?jǐn)?shù)據(jù)中就是最優(yōu)的K值。這就說(shuō)明了本文提出的算法可以有效地選擇最優(yōu)或者接近最優(yōu)的K值。
4 結(jié)論
本文針對(duì)NRSFM-aSFM算法提出了一種基于特征值分解的秩參數(shù)選取方法。該方法可以較好地獲取最優(yōu)或接近最優(yōu)的秩參數(shù)K。實(shí)驗(yàn)結(jié)果顯示了本文秩參數(shù)選取方法的有效性及易用性。
參考文獻(xiàn):
[1] P.F.U. Gotardo, A.M. Martinez, Kernel non-rigid structure from motion, In: IEEE International Conference on Computer Vision,2011:802-809.
[2] O.C. Hamsici, P.F.U. Gotardo, A.M. Martnez, Learning spatially-smooth mappings in non-rigid structure from motion, In: Proceedings of the EuropeanConference on Computer Vision,2012:260-273.
[3] Q. Barthélemy, A. Larue, J.I. Mars, Decomposition and dictionary learning for 3D trajectories, Signal Process,2014(98):423-437.
[4] C. Bregler, A. Hertzmann, H. Biermann, Recovering non-rigid 3D shape from image streams, In: Proceedings of Conference on Computer Vision and Pattern Recognition,2000,l(2):690-696.
[5] L. Torresani,A.Hertzmann,C.Bregler,Nonrigid structure from-motion: estimating shape and motion with hierarchical priors,IEEE Trans. Pattern Anal. Mach. Intell,2008,30(5):878-892.
[6] I. Akhter,Y.A.Sheikh,S.Khan,T. Kanade, Trajectory space: a dual representation for nonrigid structure from motion, IEEE Trans. Pattern Anal. Mach.Intell,2011,7(33):1442-1456.
[7] I.Akhter,Y.A.Sheikh,S.Khan,T.Kanade,Nonrigid structure from motion in trajectory space, Proc. Neural Inf. Process,2008:41-48.