• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      HEVC中率失真優(yōu)化算法的動態(tài)可重構(gòu)實(shí)現(xiàn)*

      2021-03-01 03:33:42謝曉燕鄧軍勇劉新闖胡傳瞻
      關(guān)鍵詞:指令處理器重構(gòu)

      楊 坤,蔣 林,謝曉燕,鄧軍勇,劉新闖,胡傳瞻

      (1.西安郵電大學(xué)電子工程學(xué)院,陜西 西安 710121;2.西安科技大學(xué)集成電路實(shí)驗(yàn)室,陜西 西安 710054;3.西安郵電大學(xué)計(jì)算機(jī)學(xué)院,陜西 西安 710121)

      1 引言

      與H.264/AVC編碼技術(shù)相比,HEVC(High Efficiency Video Coding)幀內(nèi)預(yù)測模式由原有的9種增加到35種,即DC 模式(模式0)、Planar模式(模式1)和33種角度預(yù)測模式(模式2~模式35)。率失真優(yōu)化算法作為幀內(nèi)預(yù)測模式選擇的判別依據(jù),每一次模式選擇都涉及一個完整的編碼過程,是幀內(nèi)編碼過程中最復(fù)雜的算法之一[1]。針對如此高復(fù)雜度的計(jì)算,僅僅從算法角度進(jìn)行優(yōu)化無法滿足實(shí)時(shí)視頻編碼的需求,所以國內(nèi)外學(xué)者已經(jīng)開始把視頻算法向?qū)S糜布限D(zhuǎn)移[2],通過硬件實(shí)現(xiàn)率失真優(yōu)化算法已經(jīng)成為一種趨勢。

      使用專用硬件進(jìn)行率失真優(yōu)化算法的實(shí)現(xiàn)方式主要有2種:針對特定規(guī)模和針對固定大小編碼塊的硬件設(shè)計(jì)。針對特定規(guī)模的硬件設(shè)計(jì)雖然能滿足算法實(shí)現(xiàn)的需要,但是結(jié)構(gòu)固定,不能根據(jù)處理速度的需求改變硬件實(shí)現(xiàn)的規(guī)模。文獻(xiàn)[3]提出一種支持8路并行的率失真優(yōu)化實(shí)現(xiàn)方法,可同時(shí)進(jìn)行8種預(yù)測模式的計(jì)算,在減少計(jì)算時(shí)間的同時(shí)增加了硬件資源的消耗;文獻(xiàn)[4]設(shè)計(jì)了一種支持3路并行的率失真優(yōu)化結(jié)構(gòu),雖然減少了資源消耗,但每次只能進(jìn)行3種模式的并行計(jì)算,若選擇模式增加,計(jì)算時(shí)間會大幅增加。針對固定大小預(yù)測塊的實(shí)現(xiàn)方法雖然能減少硬件的資源消耗,但固定塊大小的預(yù)測方式降低了編碼壓縮效率,文獻(xiàn)[5-7]均設(shè)計(jì)了一種支持4×4大小預(yù)測塊的率失真優(yōu)化算法的硬件結(jié)構(gòu),雖然減少了資源消耗,提升了計(jì)算精度,但該設(shè)計(jì)對于平坦圖像的計(jì)算量增加,且僅針對4×4大小的預(yù)測塊。文獻(xiàn)[8-10]所設(shè)計(jì)的硬件結(jié)構(gòu)雖然支持不同大小的預(yù)測塊、預(yù)測模式齊全的率失真優(yōu)化算法,但硬件實(shí)現(xiàn)過于復(fù)雜,資源消耗大。通過專用硬件實(shí)現(xiàn)率失真優(yōu)化算法,雖然提升了性能,減少了算法的執(zhí)行時(shí)間,但資源消耗過多,靈活性較差,難以針對不同的應(yīng)用需求進(jìn)行靈活切換??芍貥?gòu)陣列處理器能夠根據(jù)不同視頻圖像處理需求,靈活配置處理元邏輯功能和處理元之間的連接方式,既具有一定的靈活性,又具有計(jì)算的高效性。

      因此,本文基于項(xiàng)目組前期研究的視頻陣列處理器,提出一種動態(tài)可重構(gòu)的率失真優(yōu)化實(shí)現(xiàn)方法,將不同配置的率失真優(yōu)化算法初始化在可重構(gòu)陣列的指令存儲中,基于上下文切換的重構(gòu)機(jī)制及指令下發(fā)網(wǎng)絡(luò),實(shí)現(xiàn)不同規(guī)模、不同大小預(yù)測塊的率失真優(yōu)化算法之間的動態(tài)重構(gòu),并且可以根據(jù)計(jì)算時(shí)間和視頻質(zhì)量的不同需求,對陣列結(jié)構(gòu)的規(guī)模和執(zhí)行模式進(jìn)行重新調(diào)度。

      2 率失真優(yōu)化算法分析

      率失真優(yōu)化算法的關(guān)鍵研究內(nèi)容是如何得到編碼碼率和編碼失真,傳統(tǒng)的率失真優(yōu)化算法中,要想得到失真和碼率需要經(jīng)過一系列復(fù)雜操作[11],編碼復(fù)雜、計(jì)算量大,如圖1所示。HEVC使用哈達(dá)瑪變換來計(jì)算率失真代價(jià),這一率失真優(yōu)化算法為:

      J=SATD(s,p)+λmodeRmode

      (1)

      其中,SATD(s,p)為經(jīng)過幀內(nèi)預(yù)測后得到的殘差塊的SATD,s表示原始像素值,p表示預(yù)測像素值,Rmode是編碼當(dāng)前模式所需要的比特?cái)?shù),λmode是拉格朗日因子。SATD是指將殘差信號進(jìn)行哈達(dá)瑪變換后再求各元素絕對值之和。

      Figure 1 Block diagram of rate distortion optimization algorithm

      HEVC采用遞歸分割四叉樹的方法將編碼樹單元CTU(Coding Tree Unit)分割成不同大小的編碼單元CU(Coding Unit)、預(yù)測單元PU(Prediction Unit)和變換單元TU(Transform Unit)。這種劃分方式雖然提高了率失真優(yōu)化算法對最優(yōu)模式選擇的準(zhǔn)確性,但針對不同大小的預(yù)測塊進(jìn)行計(jì)算時(shí),需要重復(fù)遍歷35種預(yù)測模式,大大增加了從最小塊到最大塊遞歸計(jì)算的復(fù)雜度。

      而可重構(gòu)陣列處理器結(jié)合了專用硬件的計(jì)算性能和通用處理器的靈活性,能夠根據(jù)當(dāng)前視頻序列的特點(diǎn),動態(tài)配置所需要的硬件結(jié)構(gòu),率失真優(yōu)化算法的可重構(gòu)實(shí)現(xiàn)既能保證算法的靈活切換,又能減少硬件資源的消耗。因此,在可重構(gòu)陣列處理器上實(shí)現(xiàn)率失真優(yōu)化算法是解決計(jì)算復(fù)雜的一種有效方法。

      3 率失真優(yōu)化算法的動態(tài)可重構(gòu)實(shí)現(xiàn)

      3.1 動態(tài)重構(gòu)機(jī)制

      為了滿足率失真優(yōu)化算法靈活切換的需求,使用可重構(gòu)視頻陣列處理器來進(jìn)行算法的映射實(shí)現(xiàn)[12]。全局控制器為可重構(gòu)機(jī)制的核心部分,其上層為主機(jī)接口,下層為多個處理元簇PEG(Process Element Group)組成的陣列處理器,每個PEG包含 16個處理元PE(Process Element)。當(dāng)處理器資源有限卻有多個算法需要進(jìn)行映射時(shí),為了減少硬件資源消耗,將不同配置的算法指令初始化在同一PE不同的指令存儲中,如圖2所示。這種基于上下文切換的重構(gòu)機(jī)制能夠根據(jù)用戶需求在多個算法之間進(jìn)行切換,最終使用戶能夠管理和控制資源。

      Figure 2 Structure of context switched array processor

      全局控制器通過在主機(jī)接口和陣列處理器之間形成一個H型的層次化的編程網(wǎng)絡(luò),在確保每一條指令都能同時(shí)到達(dá)PE的同時(shí),實(shí)現(xiàn)對陣列資源的控制和管理。當(dāng)主機(jī)接口對陣列處理器進(jìn)行訪問時(shí),全局控制器收到來自主機(jī)接口的總線信息,總線信息包含地址位信息、標(biāo)志位信息和指令信息。其中標(biāo)志位信息用于判斷執(zhí)行數(shù)據(jù)反饋、指令下發(fā)還是配置調(diào)用;地址位信息完成每一個PE的地址劃分,保證不同的PE對應(yīng)不同的地址;指令信息用來決定PE所執(zhí)行的指令。通過地址信息、標(biāo)志信息和指令信息共同決定每個PE在某時(shí)刻所執(zhí)行的特定指令?;谏舷挛那袚Q的重構(gòu)機(jī)制,將不同配置的率失真優(yōu)化算法指令初始化在同一PE不同的指令存儲中,通過配置調(diào)用、指令反饋和指令下發(fā)操作來實(shí)現(xiàn)率失真優(yōu)化算法在視頻陣列處理器上的動態(tài)重構(gòu)。

      3.2 率失真優(yōu)化算法的并行化設(shè)計(jì)

      由于在進(jìn)行率失真優(yōu)化算法的計(jì)算過程中,不同預(yù)測模式之間相互獨(dú)立,因此可以通過并行計(jì)算來減少算法的計(jì)算時(shí)間。本文提出的基于可重構(gòu)陣列的率失真優(yōu)化實(shí)現(xiàn)方法,采用4條路徑和8條路徑并行的方式,進(jìn)行幀內(nèi)預(yù)測模式選擇的率失真優(yōu)化算法的并行映射。圖3為4條路徑并行的率失真優(yōu)化算法的映射圖。

      Figure 3 Mapping map of rate distortion optimization algorithm

      具體的執(zhí)行過程如下所示:首先將不同預(yù)測模式經(jīng)過幀內(nèi)預(yù)測后所求得的殘差值和碼率分別加載到PE00、PE01、PE02和PE03中;分別在PE10、PE11、PE12和PE13中計(jì)算各個模式下的SATD值;在計(jì)算SATD值的同時(shí),分別在PE30、PE31、PE32和PE33中計(jì)算率失真優(yōu)化算法中所需要的系數(shù)λ;待SATD值和系數(shù)λ計(jì)算完成后,通過鄰接互聯(lián)寄存器,將所求得的SATD和λ傳入PE20、PE21、PE22和PE23中,并通過移位和加法運(yùn)算得到各個模式下所需要的率失真代價(jià)RD-cost(Rate Distortion-Cost);通過比較選出具有最小RD-cost值的模式,即代表選擇出的最優(yōu)預(yù)測模式。

      3.3 率失真優(yōu)化算法可重構(gòu)實(shí)現(xiàn)

      規(guī)模重構(gòu)是指率失真優(yōu)化算法在不同陣列規(guī)模上的重構(gòu)實(shí)現(xiàn),以滿足針對計(jì)算時(shí)間和視頻質(zhì)量的不同需求選擇不同的陣列規(guī)模。首先在4×4規(guī)模的陣列中,將4條路徑并行的算法指令初始化到指令存儲器中的0~254號地址中;在8×4規(guī)模的陣列中,將8條路徑并行的率失真優(yōu)化算法指令初始化到指令存儲器的255~511號地址中。然后獲取算法計(jì)算時(shí)所需的數(shù)據(jù),進(jìn)行4路并行的率失真優(yōu)化算法的計(jì)算。如應(yīng)用需求對處理速度要求高,則基于上下文切換的重構(gòu)機(jī)制,全局控制器下發(fā)配置調(diào)用指令,執(zhí)行存放在255~511號地址中的8路并行的率失真優(yōu)化算法指令,進(jìn)行8路并行計(jì)算。在通過配置調(diào)用進(jìn)行配置切換的同時(shí),也可通過全局控制器進(jìn)行指令下發(fā),將多路并行的算法指令下發(fā)到陣列中去,實(shí)現(xiàn)率失真優(yōu)化算法在不同規(guī)模的可重構(gòu)陣列上的靈活切換。

      Figure 5 Mapping map of pattern reconfiguration

      HEVC 采用遞歸分割四叉樹的方法把塊分割成不同大小的編碼塊[13],塊重構(gòu)可以實(shí)現(xiàn)不同塊大小的率失真優(yōu)化算法的動態(tài)重構(gòu)。在HM16.0官方軟件下對不同測試序列下的CU劃分進(jìn)行統(tǒng)計(jì),結(jié)果如圖4所示。

      Figure 4 Statistics of block division under different test sequences

      從圖4中可以看出,8×8大小的編碼塊被選擇的平均概率為67%,16×16大小的編碼塊被選擇的平均概率為23%。因此,本文主要選用8×8和16×16大小的編碼塊進(jìn)行塊重構(gòu)切換。首先將8×8大小編碼塊的算法指令初始化到指令存儲器中的0~254號地址中,將16×16大小編碼塊的指令初始化到指令存儲器的255~511號地址中。然后獲取算法計(jì)算時(shí)所需的數(shù)據(jù),默認(rèn)進(jìn)行8×8大小編碼塊的率失真優(yōu)化算法的計(jì)算,如若不滿足CU的劃分模式,則全局控制器下發(fā)配置調(diào)用指令,執(zhí)行初始化在255~511號地址中的8×8大小編碼塊的率失真優(yōu)化算法。也可進(jìn)行指令下發(fā),將4×4~32×32大小編碼塊的率失真算法指令下發(fā)到陣列中去,根據(jù)用戶的需求,實(shí)現(xiàn)不同塊大小的率失真優(yōu)化算法在可重構(gòu)陣列上的靈活切換。

      4 幀內(nèi)預(yù)測模式的重構(gòu)實(shí)現(xiàn)

      HEVC通過率失真優(yōu)化選擇出最優(yōu)的預(yù)測模式后,根據(jù)最優(yōu)的結(jié)果判斷幀內(nèi)環(huán)路最終執(zhí)行哪一種預(yù)測模式。同時(shí)發(fā)送反饋指令,使可重構(gòu)陣列處理器可以根據(jù)收集到的反饋信息進(jìn)行指令下發(fā),通過指令下發(fā)網(wǎng)絡(luò)發(fā)送最優(yōu)的預(yù)測模式指令,完成不同模式的重構(gòu)。如圖5所示,本文使用8×4規(guī)模大小的可重構(gòu)陣列來進(jìn)行幀內(nèi)環(huán)路的重構(gòu)實(shí)現(xiàn),PEG00為幀內(nèi)預(yù)測過程,PEG01為率失真優(yōu)化過程。分析HEVC軟件HM16.0在不同測試序列下選擇的模式,結(jié)果顯示Planar模式、DC模式、垂直模式、水平模式、角度模式18 被選中的概率共占94.34%,因此本文選取了這5種預(yù)測模式來進(jìn)行模式預(yù)測。在計(jì)算這5種預(yù)測模式的率失真優(yōu)化算法時(shí),若最優(yōu)模式分別為Planar模式、DC模式、垂直模式、水平模式、角度模式18,則將結(jié)果分別存到PEG01中PE33的數(shù)據(jù)存儲器中的0,1,2,3,4號地址中。通過指令下發(fā)網(wǎng)絡(luò)下發(fā)反饋指令,讀出PEG01中PE33的數(shù)據(jù)存儲器中的地址數(shù)據(jù),從而判斷最終執(zhí)行哪一種預(yù)測模式,指令下發(fā)網(wǎng)絡(luò)再下發(fā)相應(yīng)的預(yù)測模式指令,進(jìn)行后續(xù)的計(jì)算。

      5 實(shí)驗(yàn)結(jié)果及性能分析

      5.1 測試方法及結(jié)果

      為了驗(yàn)證本文提出的可重構(gòu)實(shí)現(xiàn)方法的可行性,基于可重構(gòu)陣列結(jié)構(gòu)進(jìn)行驗(yàn)證。方法如下:首先將所需要的測試數(shù)據(jù)存入片外存儲,然后將并行方案的指令初始化到指令存儲器中,最后在可重構(gòu)陣列結(jié)構(gòu)上通過Questasim 進(jìn)行仿真驗(yàn)證,通過XILINX公司的ISE14.7開發(fā)環(huán)境對設(shè)計(jì)進(jìn)行綜合,得到相應(yīng)的網(wǎng)表文件,并分析其性能。最后在參考軟件HM16.0中測試編碼性能,并將本文方法放入幀內(nèi)環(huán)路中,在可重構(gòu)陣列處理器測試平臺上進(jìn)行驗(yàn)證測試[14]。實(shí)驗(yàn)結(jié)果表明,工作頻率為156.62 MHz,電路規(guī)模為87 632 Flip-flops,本文方法在可重構(gòu)處理器測試平臺上具有良好的可視效果。

      圖6統(tǒng)計(jì)了高清測試序列Beauty_1920×1080.yuv使用不同大小編碼塊的率失真優(yōu)化算法,完成一幀圖像的運(yùn)行時(shí)間。

      Figure 6 Run time to complete a frame of image

      首先將測試序列通過Matlab軟件轉(zhuǎn)換成可重構(gòu)陣列結(jié)構(gòu)能識別的二進(jìn)制數(shù)值,并將該數(shù)據(jù)放入可重構(gòu)視頻陣列的輸入存儲器中,分別通過配置調(diào)用和指令下發(fā)這2種方式進(jìn)行測試驗(yàn)證。結(jié)果顯示,運(yùn)行時(shí)間最長為17.6×10-3s,幀率為56 fps,滿足1920×1080@30 fps視頻序列的實(shí)時(shí)編碼要求,可以看出本文提出的可重構(gòu)實(shí)現(xiàn)方法能夠適應(yīng)高清視頻圖像。

      表1統(tǒng)計(jì)了不同配置的率失真優(yōu)化算法通過不同方式進(jìn)行重構(gòu)切換的總周期數(shù)以及重構(gòu)所占的時(shí)鐘周期數(shù)。通過表1可以看出,不論是相同大小編碼塊還是不同大小編碼塊的率失真優(yōu)化算法,通過配置調(diào)用或指令下發(fā)這2種方式進(jìn)行重構(gòu)切換時(shí),重構(gòu)所占的時(shí)鐘周期數(shù)都很小,不會對算法執(zhí)行的總周期數(shù)產(chǎn)生較大的影響。以4×4大小的塊切換8×8大小的塊為例,平均重構(gòu)僅占14個時(shí)鐘周期,僅占總執(zhí)行時(shí)間的1.0%。因此,本文提出的可重構(gòu)實(shí)現(xiàn)方法可以實(shí)現(xiàn)快速切換。

      以標(biāo)準(zhǔn)測試序列:carphone_qcif、salesman_qcif和silent_qcif為例,使用本文的可重構(gòu)率失真優(yōu)化實(shí)現(xiàn)方法作為幀內(nèi)預(yù)測模式選擇的判別依據(jù),在BeeCube公司的BEE4搭建的可重構(gòu)視頻陣列處理器測試平臺上進(jìn)行驗(yàn)證測試,如圖7所示為一個完整I幀的測試結(jié)果。其中,圖7a為測試序列carphone_qcif在可重構(gòu)視頻陣列處理器上的測試結(jié)果,圖7b為測試序列salesman_qcif在可重構(gòu)視頻陣列處理器上的測試結(jié)果,圖7c為測試序列si-lent_qcif在可重構(gòu)視頻陣列處理器上的測試結(jié)果。由圖7可見,測試結(jié)果具有良好的可視效果。

      Figure 7 Test results

      Table 1 Reconfigurable switching cycles

      5.2 性能分析

      本文在參考軟件HM16.0上對編碼性能進(jìn)行測試,使用6組不同視頻內(nèi)容的測試序列在全I(xiàn)幀的配置下的實(shí)驗(yàn)結(jié)果如表2所示,通過M33標(biāo)準(zhǔn)代碼計(jì)算得出BD-rate和BD-PSNR。通過表2可以得出,平均BD-PSNR為5.786%,平均BD-rate為-0.483 3 dB。

      Table 2 Coding performance analysis

      實(shí)驗(yàn)所設(shè)計(jì)的可重構(gòu)陣列處理器用Verilog HDL語言描述,以標(biāo)準(zhǔn)測試序列akiyo_qcif作為測試序列在Questasim 10.1d工具下進(jìn)行功能仿真驗(yàn)證,采用XILINX公司的ISE14.7開發(fā)環(huán)境進(jìn)行綜合,選用BEEcube公司的BEE4系列開發(fā)板進(jìn)行FPGA測試,結(jié)果如表3所示。本文所提出的可重構(gòu)實(shí)現(xiàn)方法,支持各個塊大小的率失真優(yōu)化算法,使用測試序列akiyo_qcif進(jìn)行測試,實(shí)現(xiàn)32×32塊大小下的算法判別時(shí),花費(fèi)4 831個時(shí)鐘周期。

      從表3中可以得到,在吞吐量相同的情況下,與文獻(xiàn)[3]方法的結(jié)構(gòu)設(shè)計(jì)相比,本文方法的結(jié)構(gòu)設(shè)計(jì)在支持大小為4×4~32×32的編碼塊的同時(shí),最高主頻相差不大,且支持動態(tài)可重構(gòu);文獻(xiàn)[10]方法的結(jié)構(gòu)設(shè)計(jì)的吞吐量比本文方法的結(jié)構(gòu)設(shè)計(jì)更優(yōu),但編碼性能相比本文的設(shè)計(jì)較差,在時(shí)鐘周期數(shù)基本相同的情況下,最高主頻增加了56%;文獻(xiàn)[15]方法的結(jié)構(gòu)設(shè)計(jì)雖然可以支持任意大小的PU,硬件資源消耗較少,但十分耗費(fèi)時(shí)鐘周期;文獻(xiàn)[16]方法的結(jié)構(gòu)設(shè)計(jì)的吞吐量優(yōu)于本文的設(shè)計(jì),并且執(zhí)行過程中僅僅消耗892個時(shí)鐘周期,但相比于本文方法的結(jié)構(gòu)設(shè)計(jì),其編碼性能較差,且硬件資源消耗增加了150%;文獻(xiàn)[17]方法的結(jié)構(gòu)設(shè)計(jì)引入了頭比特估計(jì)的方法,簡化了率失真優(yōu)化算法計(jì)算的過程,但其硬件設(shè)計(jì)不能靈活實(shí)現(xiàn)不同塊算法之間的切換,本文方法的結(jié)構(gòu)設(shè)計(jì)與之相比,在吞吐量相同的情況下,雖然編碼性能有所降低,但硬件資源減少了8.2%,執(zhí)行的時(shí)鐘周期數(shù)減少了16.5%,可以實(shí)現(xiàn)不同配置算法之間的快速切換。

      表4為可同時(shí)進(jìn)行多種預(yù)測模式處理的并行度對比。本文的可重構(gòu)實(shí)現(xiàn)方法支持4~8路并行的處理方式,可以根據(jù)應(yīng)用處理速度的需求的不同進(jìn)行選擇,在并行方式的選擇上比文獻(xiàn)[3,4,16,17]方法更加靈活。

      使用本文方法作為幀內(nèi)預(yù)測模式的判斷依據(jù),選取了5組測試序列在BEEcube公司的BEE4系列開發(fā)板搭建的可重構(gòu)陣列處理器測試平臺上進(jìn)行驗(yàn)證測試。峰值信噪比PSNR(Peak Signal to Noise Ratio)和結(jié)構(gòu)相似性SSIM(Structural Similarity Index Measurement)是2種常用的圖像質(zhì)量評價(jià)指標(biāo)。對一個完整I幀的測試結(jié)果圖像進(jìn)行分析,如表5所示,相比在HM16.0測試一個完整I幀的結(jié)果,本文方法的平均PSNR值增加了3.223 dB,平均SSIM值為0.999 3。

      Table 3 Structural comparison

      Table 4 Parallelism comparison

      Table 5 Test performance analysis

      6 結(jié)束語

      本文針對基于視頻陣列處理器HEVC靈活的編碼塊增加了率失真優(yōu)化算法硬件實(shí)現(xiàn)的難度,難以實(shí)現(xiàn)陣列規(guī)模和不同塊的靈活切換的問題,提出一種支持動態(tài)可重構(gòu)的率失真優(yōu)化實(shí)現(xiàn)方法。該方法基于上下文切換的重構(gòu)機(jī)制,能夠靈活地對不同配置算法進(jìn)行切換,并且最大限度地利用可重構(gòu)陣列處理器。實(shí)驗(yàn)結(jié)果表明,本文方法對于率失真優(yōu)化算法的可重構(gòu)實(shí)現(xiàn),可以達(dá)到實(shí)時(shí)處理的需求,可以快速實(shí)現(xiàn)不同規(guī)模、不同塊大小算法之間的靈活切換。對比文獻(xiàn)[17]方法,在支持多個塊大小的情況下,本文方法使用的硬件資源減少了8.2%,算法執(zhí)行的時(shí)鐘周期數(shù)減少了16.5%,最突出的優(yōu)點(diǎn)是可以根據(jù)計(jì)算時(shí)間和視頻質(zhì)量的不同需求,對陣列結(jié)構(gòu)的規(guī)模和執(zhí)行模式進(jìn)行重新調(diào)度。

      猜你喜歡
      指令處理器重構(gòu)
      聽我指令:大催眠術(shù)
      長城敘事的重構(gòu)
      攝影世界(2022年1期)2022-01-21 10:50:14
      北方大陸 重構(gòu)未來
      ARINC661顯控指令快速驗(yàn)證方法
      LED照明產(chǎn)品歐盟ErP指令要求解讀
      電子測試(2018年18期)2018-11-14 02:30:34
      北京的重構(gòu)與再造
      商周刊(2017年6期)2017-08-22 03:42:36
      論中止行為及其對中止犯的重構(gòu)
      Imagination的ClearCallTM VoIP應(yīng)用現(xiàn)可支持Cavium的OCTEON? Ⅲ多核處理器
      ADI推出新一代SigmaDSP處理器
      汽車零部件(2014年1期)2014-09-21 11:41:11
      呼嚕處理器
      大城县| 汝南县| 南京市| 鸡泽县| 二手房| 元朗区| 营口市| 二手房| 梓潼县| 襄城县| 修武县| 香河县| 手游| 泊头市| 邵东县| 方正县| 南宫市| 南郑县| 洛阳市| 伊宁县| 凤翔县| 游戏| 柯坪县| 普陀区| 五河县| 徐州市| 嘉善县| 延安市| 山阴县| 舒兰市| 临清市| 大冶市| 丰顺县| 绥化市| 阿拉尔市| 南投市| 洛川县| 岳普湖县| 航空| 江都市| 延津县|