趙建府,王慧敏
(1.電子科技大學(xué)成都學(xué)院,四川成都 611731;2.西南民族大學(xué),四川成都 611731)
視頻靈活性與感官體驗(yàn)逐漸引起人們的重視,目前的二維平面效果已無法滿足實(shí)際需求,三維立體視頻開始日益盛行。三維立體視頻以人眼視差理念作為基礎(chǔ),經(jīng)過大腦分析接收圖像的深度信息,使呈現(xiàn)于人眼的圖像具有立體視覺效果,該技術(shù)在醫(yī)療、教育、監(jiān)控等多個領(lǐng)域應(yīng)用十分廣泛。無序圖像虛擬視點(diǎn)繪制是三維立體視頻中的核心技術(shù),該技術(shù)能夠確保終端快速、有效地合成符合人眼視覺的無序圖像,使用戶更好地享受立體感,并且在觀看視頻時可以擺脫視角限制。因此,研究無序圖像視點(diǎn)繪制方法對三維立體視頻的發(fā)展具有重要意義。
許多相關(guān)專家學(xué)者都對該領(lǐng)域進(jìn)行了細(xì)致探討與研究,如梁海濤等人使用深度圖預(yù)處理和圖像修復(fù)方法完成無序圖像視點(diǎn)繪制,該方法繪制的無序圖像與真實(shí)圖像的相似度較高,但繪制實(shí)時性較差,欠缺少數(shù)有效信息的恢復(fù);郭秋紅等人使用3D Warping方法完成無序圖像視點(diǎn)繪制,該方法的時間復(fù)雜度較低,能有效改善裂紋問題,但無法修復(fù)繪制過程中出現(xiàn)的全部空洞。
虛擬視覺是虛擬現(xiàn)實(shí)技術(shù)(Virtual Reality System,VR)中運(yùn)用最廣泛的技術(shù)之一,通過計算機(jī)可為參與者提供視覺感受,使其身臨其境,能夠打破各種約束對虛擬空間內(nèi)的事物進(jìn)行觀察,從而獲得及時、精確的仿真結(jié)果。本文提出基于虛擬視覺的無序圖像視點(diǎn)繪制仿真方法,通過圖像的半像素處理、雙向異步映射、亮度校正、融合、空洞填補(bǔ),完成虛擬視點(diǎn)繪制,獲得視覺效果優(yōu)異的無序圖像。
無序圖像虛擬視點(diǎn)繪制算法流程用圖1描述。
圖1 基于半像素的無序圖像虛擬視點(diǎn)繪制算法流程
基于半像素的無序圖像虛擬視點(diǎn)繪制算法,能夠解決傳統(tǒng)算法易導(dǎo)致無序圖像中出現(xiàn)空洞、亮度不均等問題,從而提高無序圖像的視覺效果。
2.2.1 半像素精度插值
圖像的半像素插值處理,可通過將半像素點(diǎn)加進(jìn)兩個整像素點(diǎn)之間實(shí)現(xiàn)。對與半像素插值點(diǎn)鄰近的像素點(diǎn)求平均數(shù),可獲得半像素插值點(diǎn)的值。
2.2.2 調(diào)整攝像機(jī)內(nèi)參數(shù)
根據(jù)式(1)調(diào)整攝像機(jī)內(nèi)參數(shù),以確保圖像完成半像素插值后仍符合準(zhǔn)確的映射關(guān)系
(1)
式中,圖像的寬用W
描述,圖像的高用H
描述。.
3.
1 正向映射1)圖像繪制
將完成半像素操作的參考圖像與相應(yīng)的深度無序圖作為基礎(chǔ),使用式(2)得到虛擬圖像及虛擬深度無序圖,在映射時出現(xiàn)的重疊問題可通過遮擋兼容算法清除
(2)
2)噪點(diǎn)去
繪制的圖像中會產(chǎn)生噪點(diǎn),是因?yàn)椴痪_的深度無序圖、舍入誤差等問題造成,在經(jīng)過中值濾波方法處理后,仍會存在一些無法去除的噪點(diǎn),此類噪點(diǎn)呈規(guī)律分布,較小深度值的前景像素,會留在較大深度值的背景中,較大深度值的背景像素,會留在較小深度值的前景中。
噪點(diǎn)存在位置可根據(jù)噪點(diǎn)和其附近像素具有的較大深度差進(jìn)行定位。在深度無序圖內(nèi),(x
,y
)位置的深度值用D
(x
,y
)描述,式(3)為去除噪點(diǎn)的步驟(3)
式中,z
的取值為[0,1,…,N
-1],且t
<t
<t
。為使圖像中的噪點(diǎn)去除,可將圖像中與像素為0的深度無序圖中的點(diǎn)相匹配的點(diǎn)賦值為0,是因?yàn)閳D像與深度無序圖中的噪點(diǎn)方位相同。3)深度圖融合
使用式(4)所描述的加權(quán)合成方法,對深度無序圖進(jìn)行融合,參考視點(diǎn)與虛擬視點(diǎn)間的距離越近,其權(quán)值越大
(4)
式中,α
=|t
-t
|/
(|t
-t
|+|t
-t
|),在(x
,y
)位置上,虛擬深度無序圖的值用D
(x
,y
)描述;根據(jù)左參考視點(diǎn)獲得的值,用D
(x
,y
)描述;根據(jù)右參考視點(diǎn)獲得的值,用D
(x
,y
)描述。4)分辨率轉(zhuǎn)換
對分辨率較高的虛擬視點(diǎn)無序圖像執(zhí)行分辨率轉(zhuǎn)換操作,以得到原始分辨率的圖像。在(x
,y
)位置上,圖像轉(zhuǎn)換前的像素值用g
(x
,y
)描述,轉(zhuǎn)換后的像素值用f
(x
,y
)描述,兩者滿足如式(5)所示的映射關(guān)系(5)
式中,將g
(2x
,2y
)作為中心的塊,用ψ
描述,其大小為3×3,其內(nèi)非空洞點(diǎn)數(shù)量用N
描述。2.
3.
2 逆向映射設(shè)置I
、I
,表示根據(jù)兩幅參考圖像得到的虛擬視點(diǎn)無序圖像,與其匹配的數(shù)組分別用flag
、flag
描述,可對該點(diǎn)的逆向映射發(fā)生狀況進(jìn)行標(biāo)記。使用0初始化flag
、flag
,為得到空洞點(diǎn)像素值,對完成融合的虛擬深度無序圖執(zhí)行逆向映射處理,使I
、I
的空洞點(diǎn)呈現(xiàn)在相應(yīng)的參考圖像中,將與其匹配的flag
、flag
內(nèi)的點(diǎn)值設(shè)置成1。x
,y
)位置上,虛擬視點(diǎn)無序圖像的亮度用f
′(x
,y
)描述,其由照度分量i
(x
,y
)及反射分量r
(x
,y
)組成,則亮度的數(shù)學(xué)表達(dá)式為f
′(x
,y
)=i
(x
,y
)·r
(x
,y
)(6)
式中,i
(x
,y
)的取值為(0,∞);r
(x
,y
)的取值為(0,1)。為將式(6)所示的乘積模型轉(zhuǎn)換為加性模型,可取其對數(shù),表示如下
lnf
(x
,y
)=lni
(x
,y
)+lnr
(x
,y
)(7)
照度與反射分量在執(zhí)行上述運(yùn)算后,所處位置不發(fā)生變動,對上式進(jìn)行傅立葉變換,結(jié)果用式(8)描述
F
(u
,v
)=I
(u
,v
)+R
(u
,v
)(8)
照度分量受空間影響較小,在頻域空間中與低頻部分相匹配;反射分量在圖像邊緣起伏劇烈,可對圖像細(xì)節(jié)部分進(jìn)行反映,在頻域空間中與高頻部分相匹配。式(9)為弱化照度分量及強(qiáng)化反射分量的表達(dá)式
S
(u
,v
)=H
(u
,v
)F
(u
,v
)=H
(u
,v
)I
(u
,v
)+H
(u
,v
)R
(u
,v
)(9)
式(10)為對上式執(zhí)行傅立葉反變換所得結(jié)果
s
(x
,y
)=F
{H
(u
,v
)F
(u
,v
)}(10)
使用同態(tài)濾波完成亮度校正的虛擬視點(diǎn)無序圖像g
′(x
,y
),可通過對上式執(zhí)行反對數(shù)變換獲得,表示如下g
′(x
,y
)=exp{s
(x
,y
)}(11)
I
(u
,v
)描述;在(u
,v
)位置上,根據(jù)左參考視點(diǎn)獲得的像素值用I
(u
,v
)描述;根據(jù)右參考視點(diǎn)獲得的像素值用I
(u
,v
)描述;給定閾值用TT
(賦值為5)描述。通過下述處理,填補(bǔ)無序圖像中的大多數(shù)空洞。1)將I
(u
,v
)使用完成加權(quán)合成的像素值進(jìn)行賦值,是在根據(jù)相同映射過程得到I
(u
,v
)與I
(u
,v
)的情況下;2)根據(jù)不同映射過程得到I
(u
,v
)與I
(u
,v
),若要使用完成加權(quán)合成的像素值對I
(u
,v
)進(jìn)行賦值,則兩者差值小于TT
,若要使用正向映射所得像素值對I
(u
,v
)進(jìn)行賦值,則兩者差值比TT
大;3)若I
(u
,v
)與I
(u
,v
)之中存在等于0的值,可使用不等于0的像素值對I
(u
,v
)進(jìn)行賦值,若兩者均等于0,可使用0對I
(u
,v
)進(jìn)行賦值。利用基于區(qū)域的空洞填補(bǔ)算法修復(fù)剩余空洞,以下為具體流程。
1)對優(yōu)先級進(jìn)行計算。將需要修復(fù)的空洞范圍標(biāo)記出來,對其邊緣各像素點(diǎn)的優(yōu)先級進(jìn)行計算,根據(jù)計算結(jié)果排序。
2)搜索最優(yōu)匹配塊。需要修復(fù)的塊為最大優(yōu)先級的塊,以絕對誤差和當(dāng)作匹配原則,在非空洞區(qū)域中,使用全局搜索方法找出與需要修復(fù)塊最為相似的匹配塊,將其像素值用于空洞區(qū)域的修復(fù)。
3)對優(yōu)先級進(jìn)行更新。實(shí)現(xiàn)一次修復(fù)操作,便更新一次邊緣的優(yōu)先級,是因?yàn)榭斩催吘壪袼攸c(diǎn)在每次修復(fù)后,其優(yōu)先級均會改變。
循環(huán)執(zhí)行上述流程,停止條件為所有空洞區(qū)域均非空,即可完成空洞填補(bǔ)。
使用C語言及Matlab仿真軟件搭建測試環(huán)境,將從微軟研究院中獲取的Breakdancers與Ballet多視點(diǎn)視頻序列作為實(shí)驗(yàn)對象,該研究對象通過8路攝像機(jī)獲得,各視點(diǎn)由120幀無序圖像、深度無序圖、攝像機(jī)參數(shù)構(gòu)成,以弧形方式排列8路攝像機(jī),將其中Cam4攝像機(jī)當(dāng)作虛擬視點(diǎn),參考視點(diǎn)為其臨近的已知攝像機(jī)。
使用峰值信噪比(PSNR)衡量無序圖像視點(diǎn)繪制質(zhì)量,其值越大,質(zhì)量越高,式(12)為峰值信噪比的計算過程
(12)
虛擬視點(diǎn)與左右參考視點(diǎn)的距離和為視點(diǎn)距離,測試當(dāng)處理幀為第40幀時,不同視點(diǎn)距離下,繪制兩個多視點(diǎn)視頻序列所得無序圖像的PSNR值,結(jié)果用表1描述。
表1 無序圖像視點(diǎn)繪制的PSNR值
分析表1可以看出,無序圖像視點(diǎn)繪制質(zhì)量隨著視點(diǎn)距離增大而變差,對于兩個測試序列,最優(yōu)PSNR值分別為36.2541、37.8265。因此可得,將與虛擬視點(diǎn)距離最小的視點(diǎn)當(dāng)作參考視點(diǎn),能夠獲得較好的無序圖像視點(diǎn)繪制質(zhì)量。
以MOS認(rèn)證為基準(zhǔn),劃分PSNR值為五個等級,詳情用表2描述。
表2 PSNR值等級劃分
進(jìn)一步測試無序圖像視點(diǎn)繪制質(zhì)量,并設(shè)計對比實(shí)驗(yàn),選擇文獻(xiàn)[3]的預(yù)處理和修復(fù)繪制方法與文獻(xiàn)[4]的3D Warping繪制方法,作為本文方法的對比方法,不同視點(diǎn)距離下,三種方法繪制Breakdancers序列所得無序圖像的PSNR值結(jié)果用圖2描述。
圖2 三種方法的PSNR值結(jié)果
分析圖2可得,隨著視點(diǎn)距離增加,三種方法繪制Breakdancers序列所得無序圖像的PSNR值均呈下降趨勢,但本文方法的PSNR值下降速率十分緩慢,且始終高于40,繪制得到的無序圖像質(zhì)量處于最高等級;預(yù)處理和修復(fù)繪制方法與3D Warping繪制方法的PSNR值呈快速下降趨勢,當(dāng)視點(diǎn)距離增加至50時,二者的PSNR值分別為17、13,所得無序圖像質(zhì)量非常差。對比這些數(shù)據(jù)可以說明,本文方法具有較優(yōu)異的無序圖像視點(diǎn)繪制效果,受視點(diǎn)距離影響較小,能夠繪制出高質(zhì)量的無序圖像。
引入結(jié)構(gòu)相似度(SSIM)衡量繪制獲得的無序圖像和Cam4攝像機(jī)獲得的實(shí)際圖像之間的相似度,值域?yàn)閇0,1],其值越接近1,相似度越高。對于前20幀,三種方法繪制Ballet序列所得SSIM值結(jié)果用圖3描述。
圖3 三種方法的SSIM值結(jié)果
分析圖3可得,相對于其它兩種方法,本文方法繪制Ballet序列所得SSIM值與1最為接近;預(yù)處理和修復(fù)繪制方法與3D Warping繪制方法的SSIM值波動較大,最大SSIM值分別為0.88、0.79,與本文方法的SSIM最大值差距較大。因此可以說明,本文方法繪制所得的無序圖像和實(shí)際圖像之間的相似度最高,更符合用戶視覺需求,無序圖像視點(diǎn)繪制優(yōu)勢顯著。
三維立體視頻的廣泛普及可為人們提供優(yōu)質(zhì)的感官體驗(yàn),在影視、醫(yī)學(xué)、軍事等領(lǐng)域具有十分廣闊的發(fā)展空間,無序圖像視點(diǎn)繪制技術(shù)在三維立體視頻中發(fā)揮著重要作用,本文以虛擬視覺為基礎(chǔ),研究基于虛擬視覺的無序圖像視點(diǎn)繪制方法,經(jīng)實(shí)驗(yàn)驗(yàn)證,該方法具有較理想的無序圖像視點(diǎn)繪制效果,能夠獲得高質(zhì)量的無序圖像,可為三維立體視頻的進(jìn)一步發(fā)展提供借鑒。