• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向OpenVX核心圖像處理函數(shù)的并行架構(gòu)設(shè)計(jì)

    2022-07-21 03:23:34潘風(fēng)蕊邢立冬張好聰吳冠中
    計(jì)算機(jī)與生活 2022年7期
    關(guān)鍵詞:流水線寄存器圖像處理

    潘風(fēng)蕊,李 濤,邢立冬,張好聰,吳冠中

    1.西安郵電大學(xué) 電子工程學(xué)院,西安710121

    2.西安郵電大學(xué) 計(jì)算機(jī)學(xué)院,西安710121

    近年來,計(jì)算機(jī)視覺(computer vision,CV)在深度學(xué)習(xí)領(lǐng)域的應(yīng)用迅速發(fā)展,圖像處理作為CV中比較活躍的一個(gè)分支,廣泛應(yīng)用在醫(yī)療衛(wèi)生、安檢刑偵、圖像檢索與分析、增強(qiáng)現(xiàn)實(shí)等領(lǐng)域中。而CV領(lǐng)域更新變化飛快,這就要求圖像處理具有很高的靈活性、實(shí)時(shí)性和精確性。傳統(tǒng)的硬件很難滿足可編程性、高性能和低功耗的要求??删幊碳夹g(shù)的出現(xiàn)使得硬件變得可“編譯”,能在嵌入式系統(tǒng)上完成多種多樣的新任務(wù)。并行計(jì)算方式的出現(xiàn)使得硬件介質(zhì)可以提供更加強(qiáng)大的計(jì)算能力和密度,大幅提高了芯片系統(tǒng)的總體性能,實(shí)現(xiàn)片上超級(jí)計(jì)算。業(yè)界典型的兩種并行可編程模型分布式共享內(nèi)存MPI(multi-point interface)和集中式共享內(nèi)存OpenMP,與當(dāng)前GPU 多核、眾核架構(gòu)相比,形式過于單一??删幊痰膶S弥噶罴幚砥骺梢约骖櫣?、性能和靈活性,一種專為圖形圖像處理而設(shè)計(jì)的新型多態(tài)陣列處理器應(yīng)運(yùn)而生,其不但處理性能在一定程度上接近于ASIC(application specific integrated circuit),而且具有靈活的可編程性,它能夠?qū)⒕€程并行、數(shù)據(jù)并行、指令并行和操作并行融合到一個(gè)單一的陣列結(jié)構(gòu)中。對(duì)于圖像計(jì)算,ASIP(application specific instruction processor)是一種可行的硬件設(shè)計(jì)方法,基于ASIP 體系結(jié)構(gòu),本文提出了一種面向計(jì)算機(jī)視覺底層任務(wù)加速的可編程并行處理器。

    首先,本文研究了各種拓?fù)涮匦詫?duì)互聯(lián)網(wǎng)絡(luò)傳輸性能的影響,分析了一類基礎(chǔ)網(wǎng)絡(luò)的拓?fù)涮匦?,選擇了一種更加靈活的新型網(wǎng)絡(luò)結(jié)構(gòu)——層次交叉互聯(lián)網(wǎng)絡(luò)(hierarchically cross-connected mesh+,HCCM+),可以根據(jù)不同應(yīng)用的網(wǎng)絡(luò)流量重新配置為Mesh、HCCM 或HCCM-網(wǎng)絡(luò),降低整個(gè)系統(tǒng)的功耗。其次,以HCCM+的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為基礎(chǔ),設(shè)計(jì)實(shí)現(xiàn)了一種可編程的OpenVX并行處理器,使用有限的硬件資源,以可編程的方式對(duì)OpenVX 1.3 標(biāo)準(zhǔn)中核心函數(shù)進(jìn)行映射,實(shí)現(xiàn)通用的圖像處理。

    1 OpenVX的介紹

    2019年Khronos發(fā)布的OpenVX 1.3標(biāo)準(zhǔn)中,核心圖像處理函數(shù)包括了基本像素點(diǎn)處理、全局處理、局部處理、特征提取四大類。OpenVX 標(biāo)準(zhǔn)是按照新興的圖計(jì)算方式指定的,其基本加速原理是根據(jù)需求有目的性地對(duì)圖像矩陣進(jìn)行一定的操作。如圖1 所示,OpenVX基本圖像處理核函數(shù)可以看作整個(gè)處理流程中的一個(gè)節(jié)點(diǎn)(node)。對(duì)于圖像處理流程往往是數(shù)據(jù)從源Node 流向目標(biāo)Node,Node 與Node 之間形成一定的有向無環(huán)圖(graph)。開發(fā)者可以根據(jù)需要將這些基本的Node連成Graph,完成對(duì)圖像的操作。

    圖1 OpenVX圖計(jì)算模型Fig. 1 OpenVX graph calculation model

    OpenVX 作為計(jì)算機(jī)視覺一個(gè)標(biāo)準(zhǔn)化的功能框架,接口統(tǒng)一規(guī)范,具有良好的移植性,可以直接被應(yīng)用程序使用;也可以作為高級(jí)視覺的加速層、框架、引擎或平臺(tái)API,被諸多芯片企業(yè)(如NVIDIA、AMD、Intel)采用,具有廣泛的應(yīng)用前景。但專門為OpenVX 實(shí)現(xiàn)的硬件芯片十分匱乏。本文的工作屬于比較早涉及此標(biāo)準(zhǔn)的硬件設(shè)計(jì)之一,所提出的架構(gòu)適合圖計(jì)算和數(shù)據(jù)并行計(jì)算,實(shí)現(xiàn)可編程的加速處理,最大限度地提高硬件功能和性能的可移植性。

    2 OpenVX并行處理器的整體架構(gòu)

    OpenVX 并行處理器是利用有限的硬件資源實(shí)現(xiàn)OpenVX核心函數(shù),圖像處理往往是密集且重復(fù)的操作,因此除了高速計(jì)算之外,提高硬件的通用性,盡可能地使資源共享、降低功耗也成為并行處理器設(shè)計(jì)的目的。

    2.1 互聯(lián)網(wǎng)絡(luò)復(fù)雜性分析

    互連網(wǎng)絡(luò)是并行處理系統(tǒng)的重要組成部分,對(duì)于數(shù)據(jù)信息傳遞的并行計(jì)算,互連網(wǎng)絡(luò)對(duì)系統(tǒng)的整體性能尤為重要,是本文所提出的OpenVX并行處理器的主干。由于簡單的拓?fù)浣Y(jié)構(gòu)易于在超大規(guī)模集成電路(very large scale integration,VLSI)中實(shí)現(xiàn)和分析,互連網(wǎng)絡(luò)宜采用簡單的拓?fù)浣Y(jié)構(gòu),拓?fù)涮匦园ǎ?/p>

    (1)邊數(shù)(edge number):網(wǎng)絡(luò)鏈路數(shù),影響互聯(lián)網(wǎng)絡(luò)的容量及靈活性。

    (2)直徑(diameter):任意兩個(gè)節(jié)點(diǎn)之間的最短路徑中的路徑長度。直徑與通信時(shí)間成正比,直徑越長,所需通信時(shí)間越長。

    (3)對(duì)分寬度(bisection bandwidth):網(wǎng)絡(luò)被分成節(jié)點(diǎn)數(shù)相等的兩部分,切口處最小邊數(shù)為對(duì)分寬度,該參數(shù)主要反映了整個(gè)網(wǎng)絡(luò)的最大流量。

    互聯(lián)網(wǎng)絡(luò)的設(shè)計(jì)要兼顧上述3種拓?fù)涮匦?,使得整體結(jié)構(gòu)的性能在一定程度上有所提高。最基本的拓?fù)浣Y(jié)構(gòu)是Mesh型、XMesh型,本文在基本結(jié)構(gòu)的基礎(chǔ)上,選擇了HCCM結(jié)構(gòu),并對(duì)HCCM進(jìn)行擴(kuò)展得到HCCM-、HCCM+兩種拓?fù)浣Y(jié)構(gòu),如圖2所示。

    圖2 互連網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)Fig. 2 Interconnection network topology

    根據(jù)遞歸特性、循環(huán)和邊界條件,推導(dǎo)計(jì)算出4種結(jié)構(gòu)的拓?fù)涮匦怨?,如?所示。

    表1 互聯(lián)網(wǎng)絡(luò)拓?fù)湫阅鼙容^Table 1 Comparison of network topology performance

    通過對(duì)比四種結(jié)構(gòu)的拓?fù)涮匦裕琀CCM+的直徑小于Mesh 和HCCM,且比Mesh、HCCM 和HCCM-具有更寬的對(duì)分寬度。在理論上它可以比其他結(jié)構(gòu)承載更大的傳輸量,性能優(yōu)于其他結(jié)構(gòu)。因此本文采用HCCM+作為并行處理器的基礎(chǔ)網(wǎng)絡(luò)。

    2.2 并行架構(gòu)設(shè)計(jì)

    OpenVX 并行處理器采用了性能較為突出的HCCM+網(wǎng)絡(luò),包含了4×4 個(gè)處理單元(processing element,PE)、路由(RU)及全局控制(global control),整體結(jié)構(gòu)如圖3所示。在開始計(jì)算前,全局控制器接收微控制器(micro control unit,MCU)發(fā)送的微指令,根據(jù)指令中的PE標(biāo)識(shí)號(hào)(ID),將配置及數(shù)據(jù)信息經(jīng)配置開關(guān)模塊(cfg&switch)下發(fā)至相應(yīng)的PE 中。PE 執(zhí)行任務(wù)時(shí)以微指令信息為單位,可以循環(huán)執(zhí)行微指令攜帶的操作信息,中間結(jié)果可暫存到PE 內(nèi)部緩存中,由RU控制選通PE之間的數(shù)據(jù)鏈路,完成數(shù)據(jù)的傳輸。MCU 下發(fā)的微指令可實(shí)現(xiàn)多個(gè)PE 的任務(wù)切換,實(shí)現(xiàn)整體可配置。

    圖3 OpenVX并行處理器整體架構(gòu)Fig. 3 OpenVX parallel processor architecture

    每個(gè)PE 中包含了8 個(gè)ALU、2 個(gè)定點(diǎn)乘法器(MUL)、2 個(gè)浮點(diǎn)乘法器(FMUL)、1 個(gè)定點(diǎn)除法器(DIV)、1 個(gè)浮點(diǎn)除法器(FDIV)、1 個(gè)內(nèi)部交叉開關(guān)(Crossbar)、5 個(gè)32×16 的寄存器堆(regfile)以及寄存器堆的訪存模塊(RD_CTRL,LOAD_PIXEL),整體結(jié)構(gòu)如圖4所示。

    圖4 PE整體結(jié)構(gòu)Fig. 4 PE architecture

    (1)ALU負(fù)責(zé)執(zhí)行add、sub、and、or、xor、sll、srl等指令。當(dāng)ALU 執(zhí)行add 指令時(shí),a 輸入端和b 輸入端有三個(gè)數(shù)據(jù)源:①指定寄存器堆內(nèi)的數(shù)據(jù);②譯碼單元的立即數(shù);③計(jì)算單元的輸出數(shù)據(jù)。Crossbar從三個(gè)數(shù)據(jù)源中選擇一個(gè)送至ALU 的輸入端,輸出結(jié)果由分配器派遣至下一個(gè)指定的PE,進(jìn)行新的處理。其中第三個(gè)數(shù)據(jù)源的選擇,是為了處理比較復(fù)雜的函數(shù)如Canny邊緣檢測、Harris角點(diǎn)檢測等,中間結(jié)果寫回,進(jìn)行新的配置,繼續(xù)計(jì)算至最終結(jié)果的輸出。

    (2)PE 內(nèi)部的Crossbar 設(shè)計(jì)為60×32 的開關(guān)矩陣(switch matrix)、60個(gè)輸入、32個(gè)輸出。通過配置譯碼模塊(configer decode)將選通信號(hào)發(fā)送給分配器和選擇器,ALU輸入操作數(shù)可以有選擇性地連接寄存器堆或ALU 的計(jì)算結(jié)果。如圖5 所示,以ALU0 為例,ALU0 的兩個(gè)操作數(shù)是多路選擇器的輸出,ALU0 計(jì)算結(jié)果(Mid_out)通過分配器輸出。輸入、輸出數(shù)據(jù)流向選擇取決于譯碼模塊的配置指令。將多個(gè)計(jì)算單元的輸入、輸出數(shù)據(jù)通路進(jìn)行互聯(lián),組成開關(guān)矩陣。

    圖5 ALU0 I/O數(shù)據(jù)通路Fig. 5 ALU0 I/O data path

    (3)寄存器堆訪存模塊包括了RD_CTRL 和LOAD_PIXEL。RD_CTRL通過AXI總線訪問DDR,采用突發(fā)讀寫的模式,將像素?cái)?shù)據(jù)加載至寄存器堆中,減少了對(duì)DDR 訪問次數(shù)。LOAD_PIXEL 訪問寄存器堆,將像素?cái)?shù)據(jù)加載至Crossbar 的數(shù)據(jù)端口,對(duì)于像素點(diǎn)操作和模板類操作的函數(shù),由譯碼模塊發(fā)送的操作類型信號(hào)(operation_type)配置不同的加載方式。當(dāng)LOAD_PIXEL模塊訪問至寄存器堆的中間或最大地址時(shí),會(huì)向RD_CTRL 發(fā)送Half_empty 信號(hào),RD_CTRL 繼續(xù)訪問DDR,形成一個(gè)動(dòng)態(tài)加載和動(dòng)態(tài)取數(shù)的過程。

    全局控制(global control)負(fù)責(zé)控制各個(gè)模塊之間以及模塊內(nèi)部的數(shù)據(jù)交互、數(shù)據(jù)流向及數(shù)據(jù)選擇。圖6是對(duì)一個(gè)PE進(jìn)行控制的電路設(shè)計(jì)。

    圖6 全局控制電路Fig. 6 Global control circuit

    MCU 負(fù)責(zé)發(fā)送Node 類型,開始進(jìn)行圖像處理。RD_INST 向INST_MEM 發(fā)送請(qǐng)求,讀取微指令。派遣模塊(dispatch)負(fù)責(zé)將微指令派遣至相應(yīng)PE 的譯碼單元(decode)進(jìn)行解析。譯碼單元將地址信息(address)發(fā)送至寄存器堆(regfile)的地址端,將配置信息(cfg_inst)順序?qū)懭氲介_關(guān)矩陣(switch matrix)的配置寄存器(Cfg_inst)中,進(jìn)行數(shù)據(jù)通路的選擇,像素?cái)?shù)據(jù)流向?qū)?yīng)的ALU進(jìn)行計(jì)算。ALU的輸出可作為中間結(jié)果(Mid_results)返回,也可經(jīng)RU 直接輸出至下一個(gè)PE對(duì)應(yīng)的緩存中。

    PE 之間數(shù)據(jù)路由受全局控制模塊控制,本文路由以XY 路由為基礎(chǔ),并對(duì)其進(jìn)行了一定的改進(jìn),增加了新的判斷狀態(tài),在數(shù)據(jù)從當(dāng)前節(jié)點(diǎn)流向目標(biāo)節(jié)點(diǎn)的過程中增加一條對(duì)角邊。路由結(jié)構(gòu)如圖7 所示,上一級(jí)各個(gè)方向PE 的輸出Edout、Sdout、Wdout、Ndout、ESdout、WNdout 輸入至相應(yīng)的緩存E_buf、S_buf、W_buf、N_buf、ES_buf、WN_buf。Arbiter 模塊采用先來先到的仲裁機(jī)制決定數(shù)據(jù)的傳輸順序。RU模塊根據(jù)規(guī)定的傳輸方向優(yōu)先級(jí)決定數(shù)據(jù)流向,數(shù)據(jù)經(jīng)全互聯(lián)交叉開關(guān)輸入至目的PE。

    圖7 路由結(jié)構(gòu)Fig. 7 Route structure

    RU 模塊支持一對(duì)一單目標(biāo)傳輸,其中對(duì)角快速通道優(yōu)先級(jí)最高,其次為水平方向的數(shù)據(jù)通路,最后為豎直方向;RU 也支持一對(duì)多目標(biāo)的數(shù)據(jù)扇出,此時(shí)目標(biāo)與目標(biāo)之間優(yōu)先級(jí)相同,對(duì)于某一目標(biāo)通道優(yōu)先級(jí)與一對(duì)一單目標(biāo)傳輸時(shí)優(yōu)先級(jí)相同。譯碼模塊將路由配置信息寫入PE 內(nèi)部路由選擇寄存器中,選通本地PE到目標(biāo)PE的通信路徑,將計(jì)算結(jié)果發(fā)送至目標(biāo)PE,執(zhí)行新任務(wù)。

    PE之間主要數(shù)據(jù)通路如圖8所示,假設(shè)當(dāng)前節(jié)點(diǎn)為PE00,目標(biāo)節(jié)點(diǎn)為PE32,則數(shù)據(jù)流向?yàn)椋篜E00→ES_dout→PE11→ES_dout→PE22→S_dout→PE32。

    圖8 PE之間數(shù)據(jù)路由Fig. 8 Data routing between PEs

    2.3 整體架構(gòu)的優(yōu)化

    高性能OpenVX并行處理器共有五種指令類型:定點(diǎn)運(yùn)算、浮點(diǎn)運(yùn)算、邏輯運(yùn)算、加載/存儲(chǔ)、特殊指令(控制、存取及停止)。以定點(diǎn)運(yùn)算為例,常規(guī)的指令格式為:

    本文指令格式為:

    其中,Rd為目的寄存器,提供計(jì)算結(jié)果地址;Ra為源寄存器,提供源操作數(shù)A 地址;Rb 為源寄存器,提供源操作數(shù)B地址。opcode為操作類型,相比于傳統(tǒng)的指令,本文每條指令中有4 個(gè)opcode,一次可控制多個(gè)操作,使得更多運(yùn)算單元能夠同時(shí)工作,增大了操作的并行度,提高了像素的吞吐率。

    為了減少數(shù)據(jù)通路,ALU中將加法和移位合并,同時(shí)包含了與、或、非以及異或等布爾運(yùn)算。例如局部圖像處理,模板總是固定的常系數(shù),目標(biāo)中心像素由常系數(shù)與窗口內(nèi)的像素進(jìn)行乘加得到。而OpenVX并行處理器中只需要配置ALU執(zhí)行ADD操作即可,耗費(fèi)一個(gè)時(shí)鐘周期就可完成4組像素的乘加操作。

    同時(shí)在用匯編指令實(shí)現(xiàn)核心函數(shù)時(shí),可以合理地、自由地調(diào)整配置指令的順序,盡量避免相鄰指令間數(shù)據(jù)傳遞依賴性,減小整個(gè)程序的執(zhí)行時(shí)間。

    傳統(tǒng)運(yùn)算單元中只有一個(gè)ALU,合理地增加PE中ALU數(shù)目,可以減少流水停滯時(shí)間,增大像素吞吐率,計(jì)算速度快。

    為減少PE通過AXI總線訪問DDR的次數(shù),在PE內(nèi)部設(shè)置了5個(gè)深度為16,寬度為32 bit寄存器堆,用于快速存取原像素?cái)?shù)據(jù)及中間計(jì)算結(jié)果。PE之間傳遞數(shù)據(jù)直接通過訪問鄰接共享存儲(chǔ),實(shí)現(xiàn)數(shù)據(jù)的傳遞復(fù)用,只有最后一個(gè)PE 的計(jì)算結(jié)果才寫回DDR,用于最終的顯示。

    本文所采用的HCCM+中,嵌入了Mesh、HCCM和HCCM-,可以根據(jù)不同應(yīng)用的網(wǎng)絡(luò)流量重新配置為Mesh 型、HCCM 型或HCCM-型結(jié)構(gòu)。對(duì)于流量較大的應(yīng)用,可以使用HCCM+所有邊緣。對(duì)于中等級(jí)別的流量,可以關(guān)閉一些邊緣以形成HCCM網(wǎng)絡(luò),這有助于節(jié)省功耗。對(duì)于大多數(shù)短距離輕型通信,可以關(guān)閉更多的邊緣來形成HCCM-網(wǎng)絡(luò),進(jìn)一步降低功耗且更加靈活。

    為了適應(yīng)系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu),本文路由在XY路由算法的基礎(chǔ)上,增加了對(duì)角傳輸路徑。這種改進(jìn)不僅為數(shù)據(jù)到達(dá)目標(biāo)節(jié)點(diǎn)提供了最佳傳輸路徑,而且增大了單節(jié)點(diǎn)的數(shù)據(jù)扇出,可以適應(yīng)復(fù)雜度更高的Graph,使更多的PE 可以交互,延長PE 數(shù)據(jù)傳輸鏈路,提高PE單元的復(fù)用率。同時(shí)路由中采用結(jié)構(gòu)簡單的全互聯(lián)交叉開關(guān),傳輸延遲低,速度快,可實(shí)現(xiàn)數(shù)據(jù)并行傳輸。

    3 Graph映射

    并行處理器的流處理類似于FPGA(field programmable gate array)或ASIC 的流水線,每個(gè)運(yùn)算單元處理的顆粒粗細(xì)程度由MCU進(jìn)行配置調(diào)整,宏觀上實(shí)現(xiàn)流水處理。

    3.1 數(shù)據(jù)并行計(jì)算模式

    數(shù)據(jù)并行計(jì)算模式是對(duì)圖像分塊處理,將圖像分配至不同的處理單元,配置相同的指令,對(duì)不同的圖像數(shù)據(jù)進(jìn)行相同的操作,實(shí)現(xiàn)數(shù)據(jù)級(jí)并行操作。針對(duì)該模式,選取基本的核心函數(shù)在并行處理器上進(jìn)行映射,多個(gè)處理單元同時(shí)執(zhí)行同一種操作。如圖9 所示,將Sobel 函數(shù)在并行處理器上以數(shù)據(jù)并行處理的模式進(jìn)行映射。圖10為數(shù)據(jù)并行處理模式下圖像分塊方式,PE 調(diào)度的個(gè)數(shù)與圖像分塊的個(gè)數(shù)相關(guān)。在每個(gè)PE內(nèi)部,針對(duì)核心函數(shù)的算法,對(duì)基本算數(shù)邏輯操作流水細(xì)分,按需分配,微觀上實(shí)現(xiàn)細(xì)粒度并行運(yùn)算。

    圖9 數(shù)據(jù)并行計(jì)算模式映射Fig. 9 Data parallel computing pattern mapping

    圖10 數(shù)據(jù)并行計(jì)算模式下圖像分塊Fig. 10 Image segmentation in data parallel computing mode

    3.2 流水線處理

    流水線處理是將復(fù)雜的程序分解為數(shù)個(gè)簡單的操作,分配到不同的處理單元上,處理單元之間可通過相鄰的數(shù)據(jù)通路進(jìn)行數(shù)據(jù)傳遞,整體實(shí)現(xiàn)流水處理。相鄰處理單元之間指令獨(dú)立,使本結(jié)構(gòu)非常適合流水線處理的運(yùn)行方式。針對(duì)該模式,選取均值濾波(box filter)、通道合并(channel combine)、色系轉(zhuǎn)換(color convert)、圖像膨脹(image dilate)和圖像腐蝕(image erode),構(gòu)造形態(tài)學(xué)濾波的Graph計(jì)算模型,執(zhí)行流程如圖11 所示。每個(gè)基本函數(shù)為一個(gè)Node,將該執(zhí)行流程映射到并行處理器上,由于通道合并和通道提取比較簡單,將其與均值濾波合并到一起,在結(jié)構(gòu)映射中并未體現(xiàn),映射結(jié)果如圖12所示。

    圖11 形態(tài)學(xué)濾波執(zhí)行流程Fig. 11 Morphological filtering execution flow

    圖12 流水線處理模式映射Fig. 12 Pipeline processing pattern mapping

    如圖13 所示是形態(tài)學(xué)濾波數(shù)據(jù)分塊分配方式,將圖像數(shù)據(jù)分成四塊,其中陰影部分為圖像分塊后的邊界。常見的邊界處理方法是邊界復(fù)制和邊界填零。MCU 控制加載圖像像素?cái)?shù)據(jù)時(shí),發(fā)送兩次邊緣像素的讀取指令,實(shí)現(xiàn)對(duì)邊界像素進(jìn)行復(fù)制。第一塊圖像數(shù)據(jù)經(jīng)過P00、P01、P02、P03 所構(gòu)成的運(yùn)算單元鏈(流水線)分任務(wù)進(jìn)行處理。實(shí)際上,形態(tài)學(xué)濾波是由多流水線并行處理實(shí)現(xiàn)的,執(zhí)行不同任務(wù)的PE實(shí)現(xiàn)流水線處理,執(zhí)行同一任務(wù)的PE實(shí)現(xiàn)數(shù)據(jù)并行處理,宏觀上實(shí)現(xiàn)粗粒度并行運(yùn)算。

    圖13 形態(tài)學(xué)濾波數(shù)據(jù)分塊Fig. 13 Morphological filtering data segmentation

    4 測試驗(yàn)證及結(jié)果分析

    4.1 驗(yàn)證平臺(tái)

    對(duì)圖像處理硬件系統(tǒng)設(shè)計(jì)一個(gè)完整穩(wěn)定的驗(yàn)證系統(tǒng)也是至關(guān)重要的,本設(shè)計(jì)基于VS2015的MFC仿真測試平臺(tái),如圖14 所示。VS 平臺(tái)和FPGA 平臺(tái)共享輸入源圖像數(shù)據(jù),經(jīng)過相同的算法,將最終圖像處理的結(jié)果打印至文本中??梢灾苯哟蜷_文本查看結(jié)果,也可以對(duì)軟件算法處理結(jié)果與FPGA的處理結(jié)果進(jìn)行逐像素對(duì)比驗(yàn)證,并輸出兩者的比對(duì)結(jié)果。

    圖14 仿真測試平臺(tái)Fig. 14 Simulation test platform

    4.2 實(shí)驗(yàn)結(jié)果分析

    除了要關(guān)注圖像處理的正確性外,還要考慮并行處理器的性能,性能可以通過阿姆達(dá)爾定律模型展開分析,用加速比來衡量并行處理的效果,式(1)在高度理想情況下等號(hào)成立,因此加速比往往是小于處理器的個(gè)數(shù)。

    式中,為串行處理部分,為可并行處理部分。在數(shù)據(jù)并行計(jì)算模式下,為正在處理的像素?cái)?shù)據(jù)個(gè)數(shù),即圖像分塊的個(gè)數(shù)。在流水線處理模式下,為執(zhí)行不同指令的處理器個(gè)數(shù),同時(shí)也是Graph計(jì)算模型流水線的階段個(gè)數(shù)。

    在數(shù)據(jù)并行計(jì)算模式下,從OpenVX視覺函數(shù)庫中四類函數(shù)(Ⅰ基本像素點(diǎn)處理函數(shù)、Ⅱ全局處理函數(shù)、Ⅲ局部處理函數(shù)、Ⅳ特征提取函數(shù))中選取部分典型函數(shù)進(jìn)行映射。用Modelsim 仿真工具進(jìn)行仿真,調(diào)用不同數(shù)目PE 對(duì)分辨率為640×480 像素的圖像進(jìn)行處理,對(duì)每個(gè)函數(shù)的處理時(shí)間進(jìn)行了統(tǒng)計(jì)。如表2 所示,對(duì)圖像處理時(shí)間為,結(jié)合阿達(dá)姆定律計(jì)算了相應(yīng)的加速比。經(jīng)統(tǒng)計(jì)分析后,對(duì)同一函數(shù),調(diào)用更多數(shù)目PE 的情況下,圖像處理時(shí)間驟減,所對(duì)應(yīng)的加速比成線性增長。但對(duì)于不同類別的函數(shù)加速效果存在一定的差異,Ⅱ、Ⅳ類函數(shù)的加速比略低于Ⅰ、Ⅲ類函數(shù)。

    表2 基本核心函數(shù)加速比對(duì)比Table 2 Comparison of speedups of basic kernel functions

    為進(jìn)一步分析每類函數(shù)加速比存在差異的影響因素,在每一類中選取一個(gè)具有代表性的函數(shù),分別對(duì)處理過程串并比例進(jìn)行統(tǒng)計(jì)。如圖15 所示,分別為通道提取、直方圖、Sobel、高斯金字塔中串行并行比重統(tǒng)計(jì),表示串行處理部分,表示并行處理部分。對(duì)于Ⅰ類函數(shù),串行處理時(shí)間主要為預(yù)加載像素的時(shí)間;Ⅲ類函數(shù)相較于Ⅰ類,串行處理額外地增加了讀取窗口內(nèi)多個(gè)像素及多像素之間相關(guān)性操作時(shí)間。Ⅱ類函數(shù)串行處理時(shí)間主要來自遍歷整幅圖像、統(tǒng)計(jì)或累加預(yù)處理的時(shí)間,串行預(yù)處理完后才開始進(jìn)行并行處理。Ⅳ類函數(shù),復(fù)雜度明顯高于其他三類,存在中間結(jié)果寫回,導(dǎo)致流水細(xì)分程度略低于其他三類函數(shù)。

    圖15 不同函數(shù)串并比處理權(quán)重對(duì)比Fig. 15 Weight comparison of different functions serial parallelism ratio

    在調(diào)用不同數(shù)目PE 下,四個(gè)代表函數(shù)處理時(shí)間對(duì)比如圖16 所示,由于每類函數(shù)的可并行處理部分所占的比重不同,處理時(shí)間存在較大的差異,可并行處理度越高的函數(shù),實(shí)現(xiàn)所用時(shí)間越短。

    圖16 不同函數(shù)處理時(shí)間對(duì)比Fig. 16 Comparison of processing time of different functions

    在流水線處理模式下,將形態(tài)學(xué)濾波Graph執(zhí)行模型映射到本結(jié)構(gòu)上,啟用多個(gè)流水線進(jìn)行同一Graph 的運(yùn)算。本文將PE 陣列分為4 個(gè)流水線進(jìn)行加速比的計(jì)算。如果需要增加線程數(shù),則需要將Graph 計(jì)算模型中的操作重新劃分,增加每個(gè)PE 的任務(wù)負(fù)載,在總?cè)蝿?wù)不變的情況下,對(duì)空閑的PE重新分配任務(wù)?;蚴菍⒈静⑿刑幚砥髯鳛榛敬兀源藬U(kuò)展,實(shí)現(xiàn)多簇并行執(zhí)行任務(wù),進(jìn)一步提高整體的并行性。如圖17所示是原圖與本文硬件處理后結(jié)果圖的對(duì)比,其中(a)是源圖像,(b)是膨脹腐蝕后的開操作結(jié)果,(c)是Sobel邊緣檢測結(jié)果圖,(d)是軟硬件處理結(jié)果比對(duì)圖,驗(yàn)證了硬件電路功能的正確性。

    圖17 圖像處理前后對(duì)比Fig. 17 Contrast before and after image processing

    圖18 為Graph 單流水線處理圖,是加載PE內(nèi)部寄存器堆時(shí)間(預(yù)處理),為加載PE間緩存時(shí)間,圖像數(shù)據(jù)從Graph中的第一個(gè)節(jié)點(diǎn)流向最后一個(gè)節(jié)點(diǎn)并輸出,整體流水實(shí)現(xiàn)耗時(shí)為313 045 clk,相比逐函數(shù)串行處理(=1 843 860 clk)速度提升了4.89倍。

    圖18 Graph單流水線處理Fig. 18 Graph pipeline processing

    啟用不同數(shù)目的流水線對(duì)同一Graph進(jìn)行處理,測試結(jié)果如表3所示,根據(jù)阿達(dá)姆定律計(jì)算了相應(yīng)的加速比,如圖19 所示。當(dāng)執(zhí)行流水線數(shù)增加時(shí),Graph的處理加速比成線性增長。

    表3 不同數(shù)目流水線處理時(shí)間Table 3 Processing time of different number of pipelines

    圖19 Graph計(jì)算模型加速比Fig. 19 Graph execution model acceleration ratio

    4.3 性能分析

    文獻(xiàn)[4,8]針對(duì)OpenVX 1.0 標(biāo)準(zhǔn)中的核心庫函數(shù),提出了基于Mesh 型結(jié)構(gòu)的陣列處理器。通過改變?cè)垂?jié)點(diǎn)的數(shù)據(jù)注入率,對(duì)本文系統(tǒng)與文獻(xiàn)[4,8]系統(tǒng)的平均延時(shí)和吞吐量進(jìn)行了統(tǒng)計(jì)分析。測試中每個(gè)節(jié)點(diǎn)作為源節(jié)點(diǎn)注入數(shù)據(jù)的概率是相同的,通過一定約束,對(duì)目標(biāo)節(jié)點(diǎn)的選擇符合隨機(jī)均勻分布。如圖20 所示,平均延時(shí)均隨著數(shù)據(jù)注入率的增大而增大,由于HCCM+相比于Mesh 型網(wǎng)絡(luò)多了對(duì)角快速傳輸通道,本文平均延時(shí)整體小于Mesh型系統(tǒng)。

    圖20 平均延時(shí)對(duì)比Fig. 20 Average delay comparison

    如圖21所示,隨著數(shù)據(jù)注入率的增大,網(wǎng)絡(luò)負(fù)載增大,吞吐量也隨之增大。當(dāng)數(shù)據(jù)注入量增大到一定程度時(shí),網(wǎng)絡(luò)負(fù)載達(dá)到飽和,吞吐量處于穩(wěn)定狀態(tài)。由于本文系統(tǒng)中網(wǎng)絡(luò)的對(duì)分寬度大于文獻(xiàn)[4,8],本文系統(tǒng)的吞吐量整體上更大,可以承載更大的數(shù)據(jù)流量。

    圖21 吞吐量對(duì)比Fig. 21 Throughput comparison

    針對(duì)相同Kernel 函數(shù),本文與文獻(xiàn)[8]的加速比對(duì)比如圖22所示,(a)、(b)和(c)分別是中值濾波、顏色轉(zhuǎn)換及圖像腐蝕的加速比對(duì)比。結(jié)果表明,在處理性能上,本文相比同類的圖像陣列處理器,具有更大的加速比,更有優(yōu)勢。

    圖22 核心函數(shù)加速比對(duì)比Fig. 22 Speedup comparison of kernel functions

    文獻(xiàn)[18-20]是基于FPGA對(duì)Sobel算法的并行化設(shè)計(jì),實(shí)現(xiàn)了專用的圖像處理。如表4 所示,當(dāng)本文調(diào)用的PE 數(shù)目比較少時(shí),處理速度小于專用硬件電路,但是隨著調(diào)用PE 數(shù)目的增加,處理速度明顯提高,當(dāng)采用16 個(gè)PE 進(jìn)行映射時(shí),處理速度大于專用硬件電路。本文與文獻(xiàn)[18-20]資源占用對(duì)比如表5所示,本文資源占用高于其他三個(gè)設(shè)計(jì),但系統(tǒng)工作頻率更高,可支持更多的圖像處理類型,更加通用。

    表4 處理時(shí)間對(duì)比Table 4 Comparison of processing time

    表5 性能對(duì)比Table 5 Performance comparison

    5 結(jié)束語

    針對(duì)傳統(tǒng)的處理器靈活性與處理速度不能兼顧的問題,本文設(shè)計(jì)實(shí)現(xiàn)了一種OpenVX 并行處理器,不但在性能上接近于ASIC,而且具有靈活的可編程性,結(jié)構(gòu)簡單易擴(kuò)展。并行處理器支持?jǐn)?shù)據(jù)并行和管線處理兩種計(jì)算方式,使用有限的硬件資源完成對(duì)OpenVX 核心函數(shù)和復(fù)雜Graph 執(zhí)行模型的映射并且線性加速。對(duì)Ⅰ類函數(shù)的最大平均加速比為15.170,對(duì)Ⅱ類函數(shù)的最大平均加速比為14.825,對(duì)Ⅲ類函數(shù)的最大平均加速比為15.215,對(duì)Ⅳ類函數(shù)的最大平均加速比為14.810,能夠有效地提高圖像的處理速度,實(shí)現(xiàn)數(shù)據(jù)級(jí)并行和任務(wù)級(jí)并行。與同類陣列處理器相比,加速效果更加明顯。今后研究工作重點(diǎn)是繼續(xù)分析各個(gè)函數(shù)的處理瓶頸,找到更優(yōu)的映射方式,優(yōu)化最長路徑。其次以本并行處理器為基本簇,結(jié)合更加有效的通信管理機(jī)制,對(duì)其進(jìn)一步擴(kuò)展,實(shí)現(xiàn)多并行處理器簇,進(jìn)一步提高整個(gè)系統(tǒng)的性能。

    猜你喜歡
    流水線寄存器圖像處理
    Gen Z Migrant Workers Are Leaving the Assembly Line
    Lite寄存器模型的設(shè)計(jì)與實(shí)現(xiàn)
    流水線
    機(jī)器學(xué)習(xí)在圖像處理中的應(yīng)用
    電子制作(2018年18期)2018-11-14 01:48:20
    模糊圖像處理,刑事偵查利器
    圖像處理技術(shù)的實(shí)戰(zhàn)應(yīng)用
    分簇結(jié)構(gòu)向量寄存器分配策略研究*
    報(bào)廢汽車拆解半自動(dòng)流水線研究
    SIMATIC IPC3000 SMART在汽車流水線領(lǐng)域的應(yīng)用
    Photo Shop通道在圖像處理中的應(yīng)用
    河南科技(2014年1期)2014-02-27 14:04:06
    国产欧美日韩综合在线一区二区| 精品人妻一区二区三区麻豆| 久久精品国产a三级三级三级| 亚洲欧美日韩另类电影网站| 亚洲欧美日韩另类电影网站| 妹子高潮喷水视频| 亚洲av免费高清在线观看| 精品一区在线观看国产| 亚洲美女黄色视频免费看| 国产成人精品在线电影| 国产精品.久久久| 日韩一区二区视频免费看| 青春草国产在线视频| 啦啦啦中文免费视频观看日本| 2018国产大陆天天弄谢| 日韩制服骚丝袜av| 亚洲精品久久久久久婷婷小说| 一个人免费看片子| 免费黄色在线免费观看| 青青草视频在线视频观看| 一本—道久久a久久精品蜜桃钙片| 日韩三级伦理在线观看| 热99国产精品久久久久久7| 欧美成人午夜免费资源| 看免费成人av毛片| 亚洲精品日韩av片在线观看| 校园人妻丝袜中文字幕| 五月天丁香电影| videos熟女内射| 亚洲av二区三区四区| 大香蕉久久成人网| 观看美女的网站| 国产 精品1| 夜夜爽夜夜爽视频| 制服丝袜香蕉在线| 大码成人一级视频| 国产精品久久久久成人av| av线在线观看网站| 全区人妻精品视频| 中文精品一卡2卡3卡4更新| 丰满少妇做爰视频| 97在线人人人人妻| 国产成人精品久久久久久| 久久久久久伊人网av| 日本爱情动作片www.在线观看| 狂野欧美白嫩少妇大欣赏| 中文字幕久久专区| 亚洲精品乱码久久久久久按摩| 一本色道久久久久久精品综合| 国产免费视频播放在线视频| 晚上一个人看的免费电影| 国产精品99久久久久久久久| 成人黄色视频免费在线看| 99九九线精品视频在线观看视频| 久久99热6这里只有精品| 久久狼人影院| 国产探花极品一区二区| 欧美一级a爱片免费观看看| 免费观看的影片在线观看| 亚洲国产欧美在线一区| 国产一区亚洲一区在线观看| 久久久精品94久久精品| 日韩成人av中文字幕在线观看| 久久影院123| 日日摸夜夜添夜夜爱| 老司机亚洲免费影院| 亚洲精品成人av观看孕妇| 中文字幕制服av| 一级爰片在线观看| 高清视频免费观看一区二区| 国产高清不卡午夜福利| 亚洲国产精品专区欧美| 免费日韩欧美在线观看| 亚洲丝袜综合中文字幕| 国产黄色免费在线视频| 国精品久久久久久国模美| 亚洲av不卡在线观看| 亚洲无线观看免费| 美女主播在线视频| 免费观看无遮挡的男女| 在线观看一区二区三区激情| a级毛片在线看网站| √禁漫天堂资源中文www| 国产成人aa在线观看| 久久毛片免费看一区二区三区| 中文天堂在线官网| 亚洲内射少妇av| 美女国产高潮福利片在线看| 国产伦理片在线播放av一区| 又大又黄又爽视频免费| 最近手机中文字幕大全| 80岁老熟妇乱子伦牲交| 蜜臀久久99精品久久宅男| 国产日韩一区二区三区精品不卡 | 在线观看www视频免费| 麻豆成人av视频| 男人操女人黄网站| 能在线免费看毛片的网站| 91成人精品电影| 国产精品久久久久久久电影| 777米奇影视久久| 2021少妇久久久久久久久久久| 亚洲少妇的诱惑av| 国产成人精品无人区| 免费久久久久久久精品成人欧美视频 | 日韩中字成人| 好男人视频免费观看在线| 伊人久久国产一区二区| 国产av码专区亚洲av| 中国三级夫妇交换| 一级黄片播放器| 久久毛片免费看一区二区三区| 男女边摸边吃奶| 久久ye,这里只有精品| 丰满饥渴人妻一区二区三| 欧美+日韩+精品| 街头女战士在线观看网站| 亚洲色图综合在线观看| 一级爰片在线观看| 2022亚洲国产成人精品| 午夜91福利影院| 91精品伊人久久大香线蕉| 国产欧美日韩一区二区三区在线 | 春色校园在线视频观看| 久久这里有精品视频免费| 久久99一区二区三区| 97在线视频观看| 99热这里只有是精品在线观看| 久久这里有精品视频免费| 人人妻人人澡人人爽人人夜夜| 高清黄色对白视频在线免费看| 边亲边吃奶的免费视频| 性高湖久久久久久久久免费观看| www.av在线官网国产| 两个人的视频大全免费| 久久精品国产自在天天线| 少妇人妻 视频| a级毛片免费高清观看在线播放| 爱豆传媒免费全集在线观看| 午夜免费鲁丝| 99久久人妻综合| 日本黄大片高清| 男女高潮啪啪啪动态图| 国产精品蜜桃在线观看| 欧美xxⅹ黑人| 男女国产视频网站| 免费黄网站久久成人精品| 亚洲中文av在线| 成人国产av品久久久| 97超碰精品成人国产| 成人黄色视频免费在线看| 大片免费播放器 马上看| 国产成人精品一,二区| 天天躁夜夜躁狠狠久久av| 免费久久久久久久精品成人欧美视频 | 91久久精品国产一区二区三区| 亚洲欧美一区二区三区国产| 国产精品一区二区在线观看99| 久久久久久伊人网av| 99久久精品国产国产毛片| 欧美97在线视频| 只有这里有精品99| 一级毛片我不卡| 内地一区二区视频在线| 色婷婷久久久亚洲欧美| 18+在线观看网站| 天天躁夜夜躁狠狠久久av| 人人妻人人添人人爽欧美一区卜| 伊人久久国产一区二区| 亚洲精品aⅴ在线观看| 亚洲av电影在线观看一区二区三区| 性色av一级| 免费高清在线观看日韩| √禁漫天堂资源中文www| 国产精品久久久久久精品古装| 性高湖久久久久久久久免费观看| 国产男女内射视频| 老熟女久久久| 亚洲美女黄色视频免费看| 丰满少妇做爰视频| 精品少妇黑人巨大在线播放| 自拍欧美九色日韩亚洲蝌蚪91| 久久久久网色| 亚洲国产日韩一区二区| 精品久久国产蜜桃| 国内精品宾馆在线| 美女中出高潮动态图| 国产精品偷伦视频观看了| 美女内射精品一级片tv| 久久婷婷青草| 精品国产一区二区三区久久久樱花| 99热网站在线观看| 国产精品嫩草影院av在线观看| 蜜桃国产av成人99| 男的添女的下面高潮视频| 精品少妇久久久久久888优播| 成人二区视频| 亚洲欧美成人精品一区二区| 色5月婷婷丁香| 乱码一卡2卡4卡精品| 免费人成在线观看视频色| 人妻一区二区av| 日韩不卡一区二区三区视频在线| 精品人妻熟女av久视频| www.av在线官网国产| 在线观看三级黄色| 高清毛片免费看| 男的添女的下面高潮视频| 久久99热这里只频精品6学生| 99久久人妻综合| 亚洲激情五月婷婷啪啪| 国语对白做爰xxxⅹ性视频网站| 秋霞伦理黄片| 最近最新中文字幕免费大全7| 国产精品一区www在线观看| www.av在线官网国产| 国产亚洲欧美精品永久| 中文字幕免费在线视频6| 全区人妻精品视频| 中文字幕av电影在线播放| 男女无遮挡免费网站观看| 亚洲精品乱码久久久久久按摩| 国产亚洲最大av| 在线 av 中文字幕| 新久久久久国产一级毛片| 成人二区视频| 日韩一区二区视频免费看| 一级毛片黄色毛片免费观看视频| 看非洲黑人一级黄片| 亚洲精品av麻豆狂野| 亚洲成人一二三区av| 国产伦理片在线播放av一区| 最新的欧美精品一区二区| 国产高清国产精品国产三级| 51国产日韩欧美| 欧美97在线视频| 永久免费av网站大全| 爱豆传媒免费全集在线观看| 夜夜骑夜夜射夜夜干| 国产一区有黄有色的免费视频| 我的老师免费观看完整版| 日本爱情动作片www.在线观看| 免费黄频网站在线观看国产| 国产欧美日韩综合在线一区二区| 亚洲欧美一区二区三区国产| 欧美xxⅹ黑人| 午夜老司机福利剧场| 日韩欧美一区视频在线观看| 亚洲精品乱久久久久久| 精品久久久久久久久亚洲| 色婷婷久久久亚洲欧美| 九草在线视频观看| 久久综合国产亚洲精品| 精品人妻在线不人妻| 免费播放大片免费观看视频在线观看| 亚洲国产精品成人久久小说| 高清午夜精品一区二区三区| 久久国产亚洲av麻豆专区| 久久毛片免费看一区二区三区| 国产国语露脸激情在线看| 久久精品夜色国产| 永久免费av网站大全| 亚洲成人手机| 麻豆成人av视频| 午夜激情久久久久久久| 国产亚洲av片在线观看秒播厂| 2022亚洲国产成人精品| 国产成人aa在线观看| 精品国产一区二区三区久久久樱花| 国产亚洲最大av| 久久久国产欧美日韩av| 亚洲国产av影院在线观看| 99热这里只有是精品在线观看| 99视频精品全部免费 在线| av一本久久久久| 久久久国产欧美日韩av| www.色视频.com| a级毛色黄片| 国产成人精品无人区| 亚洲高清免费不卡视频| 少妇高潮的动态图| 亚洲情色 制服丝袜| 精品亚洲成国产av| 亚洲美女视频黄频| 纯流量卡能插随身wifi吗| 亚洲一区二区三区欧美精品| 男人爽女人下面视频在线观看| 久久精品国产亚洲av涩爱| 国国产精品蜜臀av免费| 一个人免费看片子| 七月丁香在线播放| av线在线观看网站| 搡女人真爽免费视频火全软件| 久久 成人 亚洲| 亚洲国产精品国产精品| 成人毛片a级毛片在线播放| 免费久久久久久久精品成人欧美视频 | 成年美女黄网站色视频大全免费 | 丝袜喷水一区| 亚洲精品乱码久久久久久按摩| 男女高潮啪啪啪动态图| 成年av动漫网址| 99视频精品全部免费 在线| 日日撸夜夜添| 日韩亚洲欧美综合| 午夜视频国产福利| 成人黄色视频免费在线看| 嫩草影院入口| 久久精品熟女亚洲av麻豆精品| 交换朋友夫妻互换小说| 中文字幕av电影在线播放| 丝袜喷水一区| 国产精品无大码| 久久青草综合色| 中文字幕人妻熟人妻熟丝袜美| 如日韩欧美国产精品一区二区三区 | 久久久a久久爽久久v久久| 成人国产麻豆网| 天堂俺去俺来也www色官网| 91久久精品电影网| 99久久精品国产国产毛片| 国产成人精品福利久久| 91久久精品国产一区二区成人| 在线播放无遮挡| 亚洲综合色网址| 丝袜喷水一区| 国产一区亚洲一区在线观看| 日本欧美视频一区| 大码成人一级视频| 男人添女人高潮全过程视频| 2018国产大陆天天弄谢| 日韩一区二区视频免费看| 中国三级夫妇交换| 丝袜喷水一区| 在线观看三级黄色| 久久狼人影院| 国产精品欧美亚洲77777| 日韩视频在线欧美| 又粗又硬又长又爽又黄的视频| 久久精品国产a三级三级三级| 制服诱惑二区| 国产精品蜜桃在线观看| 久久久久精品久久久久真实原创| 如何舔出高潮| 男人操女人黄网站| 在线亚洲精品国产二区图片欧美 | av线在线观看网站| 久久久久久伊人网av| 久久久久久久大尺度免费视频| 国产极品天堂在线| 韩国高清视频一区二区三区| 欧美日韩在线观看h| 久久精品久久久久久久性| 久久久午夜欧美精品| 曰老女人黄片| 亚洲精品视频女| 狂野欧美激情性bbbbbb| 亚洲av中文av极速乱| 狂野欧美激情性bbbbbb| 久久99精品国语久久久| 亚洲精品456在线播放app| 午夜av观看不卡| 国产无遮挡羞羞视频在线观看| 国产黄色免费在线视频| 热re99久久精品国产66热6| 日本与韩国留学比较| 水蜜桃什么品种好| 亚洲av国产av综合av卡| 热re99久久精品国产66热6| 日本与韩国留学比较| 免费黄色在线免费观看| 久久99蜜桃精品久久| 丰满饥渴人妻一区二区三| 在线观看免费日韩欧美大片 | 国产国语露脸激情在线看| 国产爽快片一区二区三区| 国产国语露脸激情在线看| 蜜桃久久精品国产亚洲av| 少妇被粗大猛烈的视频| 欧美日韩亚洲高清精品| 九九久久精品国产亚洲av麻豆| 晚上一个人看的免费电影| 美女主播在线视频| 亚洲国产精品国产精品| 黑人高潮一二区| 天天影视国产精品| 九色成人免费人妻av| 久久婷婷青草| 久久影院123| 午夜福利,免费看| 色视频在线一区二区三区| 亚洲欧美成人精品一区二区| 日本爱情动作片www.在线观看| 亚洲性久久影院| 国产高清国产精品国产三级| 久久精品国产亚洲av涩爱| 一区二区三区四区激情视频| 老司机影院毛片| 国产在视频线精品| 91久久精品电影网| 亚洲欧美一区二区三区国产| 在线观看免费日韩欧美大片 | 亚洲伊人久久精品综合| 在线观看一区二区三区激情| 国产精品欧美亚洲77777| 少妇的逼水好多| 亚洲内射少妇av| 久久精品熟女亚洲av麻豆精品| 午夜激情久久久久久久| 国产精品人妻久久久久久| 男女边吃奶边做爰视频| 少妇被粗大的猛进出69影院 | 成人影院久久| 亚洲在久久综合| 国产成人免费无遮挡视频| 国产男女超爽视频在线观看| 我要看黄色一级片免费的| 国产女主播在线喷水免费视频网站| 国产老妇伦熟女老妇高清| 男的添女的下面高潮视频| 亚洲精品第二区| 欧美精品一区二区免费开放| 亚洲国产欧美日韩在线播放| 美女国产视频在线观看| 久久国产精品男人的天堂亚洲 | 午夜激情久久久久久久| 少妇被粗大的猛进出69影院 | 日本爱情动作片www.在线观看| 欧美激情国产日韩精品一区| 亚洲精品av麻豆狂野| 黑丝袜美女国产一区| 亚洲精品国产av成人精品| 国产成人精品无人区| 免费黄色在线免费观看| 国产一区二区三区av在线| 女的被弄到高潮叫床怎么办| 少妇人妻久久综合中文| 丝袜喷水一区| a级毛片免费高清观看在线播放| 久久毛片免费看一区二区三区| 久久ye,这里只有精品| 一个人看视频在线观看www免费| 最近中文字幕高清免费大全6| 免费看光身美女| 亚洲伊人久久精品综合| 精品亚洲成a人片在线观看| 国产一区亚洲一区在线观看| 国产又色又爽无遮挡免| 啦啦啦视频在线资源免费观看| 国产精品一区二区三区四区免费观看| 王馨瑶露胸无遮挡在线观看| 亚洲欧美精品自产自拍| 韩国av在线不卡| 国产精品偷伦视频观看了| 久久久久久久国产电影| 精品午夜福利在线看| 国产淫语在线视频| 黑人欧美特级aaaaaa片| 夫妻性生交免费视频一级片| 美女国产高潮福利片在线看| 国产精品无大码| 中文字幕亚洲精品专区| 各种免费的搞黄视频| 考比视频在线观看| 高清不卡的av网站| 日本黄大片高清| 国产黄色视频一区二区在线观看| 亚洲精品亚洲一区二区| 亚洲精品中文字幕在线视频| www.色视频.com| 又黄又爽又刺激的免费视频.| 一级片'在线观看视频| 亚洲精华国产精华液的使用体验| 亚洲精品久久午夜乱码| 国产av码专区亚洲av| 国产精品99久久99久久久不卡 | 免费看av在线观看网站| 免费播放大片免费观看视频在线观看| 乱码一卡2卡4卡精品| 免费不卡的大黄色大毛片视频在线观看| 中文字幕久久专区| 国产综合精华液| 免费av不卡在线播放| 国产亚洲精品久久久com| 伊人亚洲综合成人网| 国产精品久久久久久精品古装| 又大又黄又爽视频免费| 大又大粗又爽又黄少妇毛片口| av一本久久久久| www.av在线官网国产| 大香蕉97超碰在线| freevideosex欧美| 99久久人妻综合| 色哟哟·www| 在线播放无遮挡| 免费观看性生交大片5| 美女脱内裤让男人舔精品视频| 国产片特级美女逼逼视频| av在线观看视频网站免费| 亚洲国产成人一精品久久久| 国产男人的电影天堂91| 一区二区日韩欧美中文字幕 | 免费大片18禁| 五月开心婷婷网| 亚洲精品日本国产第一区| av播播在线观看一区| av黄色大香蕉| 国产精品欧美亚洲77777| 看免费成人av毛片| 免费观看的影片在线观看| 男女啪啪激烈高潮av片| 国产精品久久久久久精品古装| 一区二区av电影网| 考比视频在线观看| 丝袜美足系列| 男的添女的下面高潮视频| 女的被弄到高潮叫床怎么办| 五月玫瑰六月丁香| 精品人妻熟女毛片av久久网站| 国产成人a∨麻豆精品| 两个人的视频大全免费| 亚洲国产成人一精品久久久| 大片电影免费在线观看免费| 久久鲁丝午夜福利片| 免费日韩欧美在线观看| 日本午夜av视频| 亚洲国产毛片av蜜桃av| 午夜免费鲁丝| 三级国产精品欧美在线观看| 性色av一级| 各种免费的搞黄视频| 欧美+日韩+精品| 国产免费一区二区三区四区乱码| 美女大奶头黄色视频| 18禁观看日本| 有码 亚洲区| 伊人久久精品亚洲午夜| 高清欧美精品videossex| 久久99蜜桃精品久久| 一个人免费看片子| 久久影院123| 国产熟女欧美一区二区| 少妇熟女欧美另类| 我的女老师完整版在线观看| 考比视频在线观看| 国模一区二区三区四区视频| 天天躁夜夜躁狠狠久久av| 亚洲美女搞黄在线观看| 伦理电影免费视频| 大陆偷拍与自拍| 亚洲国产色片| 美女主播在线视频| 久久这里有精品视频免费| 热re99久久国产66热| 亚洲av国产av综合av卡| 国产亚洲av片在线观看秒播厂| 伦理电影免费视频| 国产av码专区亚洲av| 免费看av在线观看网站| 亚洲一级一片aⅴ在线观看| 国产精品国产av在线观看| 日韩欧美精品免费久久| 视频在线观看一区二区三区| 亚洲少妇的诱惑av| 国产精品女同一区二区软件| 欧美日韩一区二区视频在线观看视频在线| 国产日韩欧美视频二区| 久久久久视频综合| 亚洲精品美女久久av网站| 老司机影院成人| av福利片在线| 另类亚洲欧美激情| 最近手机中文字幕大全| 欧美人与性动交α欧美精品济南到 | 爱豆传媒免费全集在线观看| 伊人久久精品亚洲午夜| 色婷婷久久久亚洲欧美| 视频区图区小说| 国产又色又爽无遮挡免| 中文字幕精品免费在线观看视频 | 黄色怎么调成土黄色| 亚洲精品aⅴ在线观看| 国产深夜福利视频在线观看| 国产日韩一区二区三区精品不卡 | 免费观看无遮挡的男女| 亚洲一区二区三区欧美精品| 老女人水多毛片| 久久久久人妻精品一区果冻| 成年美女黄网站色视频大全免费 | 国产精品国产三级国产av玫瑰| 熟女av电影| 在现免费观看毛片| 婷婷色综合大香蕉| 一级毛片aaaaaa免费看小| 好男人视频免费观看在线| 中文欧美无线码| 精品一品国产午夜福利视频| 成人无遮挡网站| 欧美日韩成人在线一区二区| 黄色欧美视频在线观看| 日日爽夜夜爽网站| 最新的欧美精品一区二区| 天天影视国产精品| 美女福利国产在线| 黄片无遮挡物在线观看| 欧美97在线视频| 国产免费一区二区三区四区乱码| 国产极品天堂在线| 日韩视频在线欧美| 精品国产国语对白av| 成人黄色视频免费在线看| 国产av一区二区精品久久| 美女cb高潮喷水在线观看| 亚洲天堂av无毛| 赤兔流量卡办理|