• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種改進的相鄰塊視差矢量快速獲取方法

      2019-06-27 04:21:44謝曉燕周金娜劉新闖王安琪
      西安郵電大學(xué)學(xué)報 2019年6期
      關(guān)鍵詞:視差視點空域

      謝曉燕, 周金娜, 朱 筠, 劉新闖, 王安琪

      (1. 西安郵電大學(xué) 計算機學(xué)院,陜西 西安 710121;2.西安郵電大學(xué) 電子工程學(xué)院,陜西 西安 710121)

      三維高效視頻編碼(3D-high efficiency video coding,3D-HEVC)[1]利用不同視點編碼的圖像信息,借助類似于2D幀間預(yù)測的運動估計和Merge模式獲得運動矢量的思想獲取視差矢量。視差矢量 (disparity vector,DV)在視圖間運動矢量預(yù)測、視差補償預(yù)測和其他視圖間編碼技術(shù)中起著關(guān)鍵性作用[2]。3D-HEVC中基于相鄰塊的視差矢量獲取方法(disparity vector from neighbouring blocks,NBDV)[3]按預(yù)定順序搜索空間和時間候選塊位置,把第一個搜索到的視差矢量當作最終視差矢量,并終止視差矢量的搜索。這種方法降低了視差矢量的精度,同時按照一定順序搜索也降低了視差矢量的獲取速度。

      通過重新組合或者刪減候選塊,可縮短視差矢量編碼時間。如對視差矢量候選塊重新建立候選塊視差矢量候選列表,根據(jù)列表中DV的數(shù)量,結(jié)合率失真優(yōu)化算法推導(dǎo)出最終的NBDV[4],該方法雖然通過率失真有效篩選,降低了一定的編碼時間,但是卻增加了一定的碼率。運動和視差矢量的早期確定方案[5-6],雖然跳過了一些模式,降低了算法的復(fù)雜度,但是可能會刪減掉更有效的視差矢量信息。在3D-HEVC標準測試模型HTM 8.0測試平臺對所有相鄰候選塊進行DV采用率的統(tǒng)計,為保持高效性在搜索過程中刪除了B類的候選塊,但視差矢量的精度有所降低[7]?;诤蜻x塊的組合搜索方法[8]和利用局部信息得到局部視差矢量的方法[9]雖然提高了視差矢量的精度,但是對候選塊需要不斷地進行組合再搜索,增加了編碼時間。

      為了能同時確保視差矢量精度和編碼效率,本文提出一種改進的相鄰塊視差矢量快速獲取方法。分別按照時域和空域方向獲取相應(yīng)塊的視差矢量,對其進行均值計算獲得最終的視差矢量;然后在視頻陣列處理器[10]上對該方法進行并行化實現(xiàn),以期減少視差矢量獲取過程的編碼時間。

      1 基于相鄰塊的視差矢量獲取方法

      NBDV通過編碼單元 (coding unit,CU)的時域和空域候選塊獲得視差矢量。根據(jù)相關(guān)性程度,NBDV獲取視差矢量優(yōu)先檢測時域候選塊,其次是空域候選塊。時域候選塊的搜索順序為先中間塊后右下角塊,如圖1(a)所示;5個空間候選塊的搜索順序為左邊(A1),上邊(B1),右上(B0),左下(A0),左上(B2),如圖1(b)所示。

      圖1 相鄰塊視差矢量的候選塊

      選擇第一個搜索到的視差矢量作為最終的視差矢量,一旦檢測到可用的視差矢量,即當前CU的NBDV完成。但是采用這樣的搜索匹配方式,第一個可用的視差矢量可能被當作最終的視差矢量,后面的候選塊中可能存在更優(yōu)的視差矢量信息,在沒被搜索前就已被中止,降低了視差矢量的精度,且按照一定順序搜索時域和空域候選塊,編碼時間過長,效率偏低。

      2 改進的相鄰塊視差矢量獲取方法

      空間參考塊的搜索順序可以進行多種排列組合,改進方法在不舍棄B類候選塊的前提下,將空域候選塊進行重新排序,固定A1和A0的搜索順序不變,重新組合B類。在原標準搜索順序左邊(A1),上邊(B1),右上(B0),左下(A0),左上(B2)的基礎(chǔ)上增加6組搜索順序,即第1組左邊(A1),左下(A0),右上(B0),上邊(B1),左上(B2);第2組左邊(A1),左下(A0),右上(B0),左上(B2),上邊(B1);第3組左邊(A1),左下(A0),上邊(B1),右上(B0),左上(B2);第4組左邊(A1),左下(A0),上邊(B1),左上(B2),右上(B0);第5組左邊(A1),左下(A0),左上(B2),右上(B0),上邊(B1);第6組左邊(A1),左下(A0),左上(B2),上邊(B1),右上(B0)。

      選取3D-HEVC標準測試模型HTM 16.1中Balloons 、Poznan_Street 、Poznan_Hall2、Newspaper 、Undo_Dancer和 kendo等 6個通用測試序列,利用7種空間候選塊搜索順序?qū)σ暡钍噶窟M行搜索,分別對比7種搜索順序結(jié)果的比特率和信噪比,從而選取編碼質(zhì)量最好的搜索順序作為既定的搜索順序。對比結(jié)果如表1所示。

      表1 空域候選塊按照不同搜索順序的性能結(jié)果對比

      由表1可以看出,第5組的搜索順序比其他組搜索順序編碼質(zhì)量略好,故選擇第5組搜索順序作為最終空間候選塊的搜索順序。

      按照左邊(A1),左下(A0),左上(B2),右上(B0),上邊(B1)最終空間候選塊搜索順序,搜索空域候選塊的所有視差矢量;時域候選塊按照先中間后右下的順序搜索視差矢量。分別對空域和時域候選塊得到的視差矢量進行均值計算,得到最終視差矢量,計算表達式為

      (1)

      其中:VDi為所有視差矢量的集合;m為候選塊個數(shù),每個候選塊通過均值計算得到視差矢量。

      3 改進的相鄰塊視差矢量獲取方法并行化實現(xiàn)

      候選塊視差矢量按照一定順序在空域和時域候選塊中搜索視差矢量,其中空域的5個候選塊和時域的2個候選塊數(shù)據(jù)之間雖然存在一定的相關(guān)性,但是其像素計算部分卻相互獨立,存在著較大的并行性。因此,可將改進方法中的空域和時域候選塊劃分,整合并行部分,在陣列處理器上進行并行化實現(xiàn)。

      3.1 動態(tài)視頻陣列處理器架構(gòu)

      動態(tài)視頻陣列處理器支持H.264/AVC、MVC、H.265/HEVC和3D-HEVC等視頻編解碼標準。該視頻陣列處理器以4×4結(jié)構(gòu)為例,結(jié)構(gòu)如圖2所示。

      陣列處理器在邏輯上把結(jié)構(gòu)劃分成處理元簇 (processing element group,PEG)陣列,每個簇由4×4的處理單元(processing element,PE)以陣列的形式組成。全局控制器實現(xiàn)對計算資源的控制與管理,輸入存儲 (data input memory,DIM)用于存儲原始視頻數(shù)據(jù)。視頻算法中數(shù)據(jù)的處理大多以N×N矩形塊進行,這種陣列體系結(jié)構(gòu)能更有效地實現(xiàn)視頻算法并行化。

      圖2 陣列處理器的部分結(jié)構(gòu)

      3.2 基于陣列處理器的獲取DV并行化實現(xiàn)

      將空間候選塊A1、B1、B0、A0、B2和兩個時域候選列表的中間塊及右下角塊,分別配置到PE00、PE10、PE20、PE30、PE21、PE01、PE11、PE02和PE12中,給所屬PE下發(fā)原始像素數(shù)據(jù)和參考像素數(shù)據(jù)。在進行塊匹配之前已將數(shù)據(jù)存儲到對應(yīng)PE的地址中,和其他PE計算不會產(chǎn)生沖突,因此,在同一時刻不同PE可以同時工作,最大程度實現(xiàn)算法的并行化。

      每個PE接收到數(shù)據(jù)后同時開始進行處理,計算得到各自候選塊的DV和絕對差值和(sum of absolute difference,SAD),然后將各個塊得到的DV傳送到PE03中,在PE03中對DV進行均值計算。改進的視差矢量方法計算流程如圖3所示。

      圖3 獲取視差矢量流程

      并行化實現(xiàn)具體步驟如下。

      步驟1從基本視點中讀入原始像素,同時從兩個時域參考幀中讀入?yún)⒖枷袼兀袼刂捣謩e存儲在外部存儲中。

      步驟2調(diào)度PE00、PE10、PE20、PE30、PE21、PE01、PE11、PE02和PE12。對時域的中間塊、右下角塊和空域塊A1,B1,B0,A0,B2分配原始像素和參考像素,分別計算各自的DV和SAD。

      步驟3將PE01、PE02、PE11、PE12中兩個時域參考塊中得到的DV和SAD信息存儲到PE12中,通過SAD得到最優(yōu)的時域DV信息,發(fā)送到PE03中。

      步驟4將步驟2得到的空域候選塊的所有DV也發(fā)送到PE03中。

      步驟5將步驟3和步驟4分別得到的時域和空域候選塊的DV進行均值計算,即可獲取得到最終的DV。

      4 仿真結(jié)果及實驗分析

      以3D-HEVC標準測試模型HTM 16.1為測試平臺[11],將改進方法在平臺上加以實現(xiàn)。視頻測試序列為Undo_Dancer、Poznan_Hall2和Poznan_Street等 3個1 920×1 088序列,及Kendo、Balloons和Newspaper 等3個1 024×768序列。通用測試條件規(guī)定的紋理及深度量化參數(shù)(quantization parameter,QP)為(25,34)、(30,39)、(35,42)和(40,45)。采用3個視點編碼,編碼順序分別是中間視點到左視點再到右視點,其中中間視點為基本視點。編碼測試參數(shù)如表2所示。

      表2 實驗測試參數(shù)

      4.1 改進方法的編碼結(jié)果分析

      分別對比改進方法與HTM 16.1的編碼比特率差值(bj?ntegaard delta bit rate,BDBR)、編碼峰值信噪比差值(bj?ntegaard delta peak signal-to-noise rate,BD-PSNR)[12]和編碼時間差ΔTime[13],結(jié)果如表3所示。BDBR表示在同樣的客觀質(zhì)量下,較優(yōu)的編碼方法可以節(jié)省的碼率百分比,BDBR越小,當前編碼器的壓縮性能越佳;BD-PSNR表示在同等碼率下,兩種編碼條件下壓縮后視頻PSNR-Y值的差異,BD-PSNR值越大,當前編碼器質(zhì)量損失越?。沪ime指改進方法3D-HEVC編碼時間之差的百分比。

      表3 改進方法與HTM16.1的編碼性能對比

      由表3可以看出,BDBR的平均值為-1.23%,表示改進方法比HTM 16.1增加了約1.23%的編碼增益。BD-PSNR的平均值為0.043 9 dB, 表示改進方法比HTM 16.1平均提高了0.043 9%。因此,改進方法的性能指標更好。獲取視差矢量采用了均值計算,ΔTime只增加了平均0.59%的計算量,故可忽略不計。

      改進方法和HTM16.1的編碼率失真曲線如圖4所示??梢钥闯?,改進方法能獲得更好地率失真曲線。

      圖4 率失真參數(shù)實驗結(jié)果比較曲線

      4.2 改進方法的合成結(jié)果分析

      根據(jù)圖像質(zhì)量的評價指標峰值信噪比(peak signal-to-noise ratio,PSNR)和圖像間的相似度評價指標結(jié)構(gòu)相似性(structural similarity index,SSIM)[14],對比改進方法與HTM 16.1對合成圖像的影響。改進方法與HTM 16.1合成后圖像的PSNR和SSIM對比結(jié)果分別如圖5和圖6所示。

      從圖5 (a)、圖5 (b)和圖5 (c)可以看出,圖像合成后改進方法和HTM 16.1的PSNR相近,圖5 (d)、圖5 (e)和圖5 (f)可以看出圖像合成后改進方法比HTM 16.1的PSNR略高。從圖6 中可以看出,圖像合成后改進方法和HTM 16.1的 SSIM相近,改進方法損失的失真度較小,因此,改進方法合成后視頻質(zhì)量更好。

      圖5 合成后圖像PSNR對比

      圖6 合成后圖像SSIM對比

      4.3 與文獻[7]方法的對比

      改進方法與文獻[7]方法性能對比結(jié)果如表4所示,Video1和Video2表示非獨立視點的編碼性能。

      表4 改進方法與文獻[7]的BDBR對比

      由表4可以看出,改進方法比文獻[7]方法在Video1中平均提升0.25% 的BDBR增益,在Video2中平均提升0.9%的編碼增益,編碼性能更好。

      4.4 并行化實現(xiàn)計算時間及性能分析

      改進方法在陣列處理器上的并行編碼時間和串行編碼時間之比如表5所示,可以看出,并行化后平均編碼時間減少了約8倍,提高了算法的編碼速度,減少了編碼時間。

      采用Virtex-6的XC6VLX550T 現(xiàn)場可編程門陣列(field programmable gate array, FPGA)芯片在集成軟件開發(fā)環(huán)境(integrated software environment,ISE)下進行綜合測試,采用90 nm進行邏輯綜合(Design Compiler,DC),分別對比改進方法與其他方法的計算時間、頻率和功耗,結(jié)果如圖6所示。

      從表6中可以看出,文獻[15]方法中的資源占用量高于改進方法,最高硬件頻率低于改進方法;文獻[16]方法的工作頻率和改進方法基本相當,但是資源消耗是改進方法的2倍多;文獻[17]方法的硬件工作頻率為175 MHz,稍低于改進方法,但是其查找表(look up table,LUT)消耗卻是改進方法的4.7倍。文獻[18]方法的工作頻率和改進方法相同,但整個設(shè)計規(guī)模卻是改進方法的3.6倍,占用了更多的硬件資源。文獻[19]方法的整個設(shè)計規(guī)模占用5.098 M門數(shù),資源占用過高,改進方法的工作頻率也是其3倍。因此,改進方法在硬件性能方面可以達到工作頻率和占用資源的相對平衡,性能相對較高。

      表5 改進后視差矢量方法的編碼時間

      表6 4種方法運算性能比較結(jié)果

      5 結(jié)語

      改進的候選塊視差矢量快速獲取方法,通過重新組合空域候選塊,得到最優(yōu)空域候選塊與時域候選塊的視差矢量,再均值計算得到最終視差矢量。整合該方法可并行部分,在視頻陣列處理器上進行并行化實現(xiàn),減少編碼時間。實驗結(jié)果表明,改進方法不但提高了視差矢量的精度,而且減少了編碼時間,提高了整體的編碼效率;在硬件性能方面可以達到工作頻率和占用資源的相對平衡,性能相對較高。

      猜你喜歡
      視差視點空域
      基于自適應(yīng)窗的立體相機視差圖優(yōu)化方法研究
      我國全空域防空體系精彩亮相珠海航展
      基于梯度域引導(dǎo)濾波的視差精煉迭代算法
      基于分割樹的視差圖修復(fù)算法研究
      基于貝葉斯估計的短時空域扇區(qū)交通流量預(yù)測
      淺談我國低空空域運行管理現(xiàn)狀及發(fā)展
      基于能量空域調(diào)控的射頻加熱花生醬均勻性研究
      視點
      河南電力(2016年5期)2016-02-06 02:11:24
      立體視差對瞳孔直徑影響的研究
      讓你每天一元錢,物超所值——《今日視點—2014精萃》序
      新聞前哨(2015年2期)2015-03-11 19:29:22
      肃南| 天津市| 正蓝旗| 萝北县| 天台县| 安西县| 吉林市| 施甸县| 百色市| 太谷县| 潼关县| 交口县| 盘锦市| 敦化市| 政和县| 苍溪县| 温州市| 左云县| 杨浦区| 南木林县| 新安县| 资中县| 鄂伦春自治旗| 靖远县| 上栗县| 威海市| 江孜县| 萨迦县| 安陆市| 北票市| 华宁县| 碌曲县| 辉县市| 万载县| 白城市| 周宁县| 咸宁市| 万州区| 双辽市| 台山市| 岳阳市|