• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于二維Winograd算法的深流水線5×5卷積方法

    2021-09-09 08:09:20黃程程董霄霄
    計(jì)算機(jī)應(yīng)用 2021年8期
    關(guān)鍵詞:運(yùn)算量流水線存儲(chǔ)器

    黃程程,董霄霄,李 釗

    (山東理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,山東淄博255049)

    0 引言

    卷積神經(jīng)網(wǎng)絡(luò)在圖像分類、語音識(shí)別、目標(biāo)檢測(cè)等應(yīng)用中取得了重大進(jìn)展[1-3]。其中5×5卷積相較3×3卷積有更大的感受野,可以提取更多的邊緣特征,在醫(yī)學(xué)影像處理等領(lǐng)域效果顯著,且廣泛應(yīng)用于AlexNet、ZFNet和GoogLeNet等經(jīng)典模型[1]。近期的許多研究就使用包含5×5卷積的架構(gòu)取得了較3×3卷積更高的預(yù)測(cè)準(zhǔn)確率[4-6]。

    卷積神經(jīng)網(wǎng)絡(luò)模型規(guī)模龐大,計(jì)算復(fù)雜度高,需要占用大量硬件資源,因此硬件加速器逐漸被用于加速神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)階段。常用的神經(jīng)網(wǎng)絡(luò)加速器包括圖形處理器(Graphic Processing Units,GPU)、專用集成電路(Application Specific Integrated Circuit,ASIC)和現(xiàn)場(chǎng)可編程邏輯門陣列(Field Programmable Gate Array,F(xiàn)PGA)。得益于高并行度、低能耗和可重構(gòu)等優(yōu)點(diǎn),F(xiàn)PGA成為了目前主流的卷積神經(jīng)網(wǎng)絡(luò)硬件加速平臺(tái)[7-16]。

    目前在FPGA上加速卷積神經(jīng)網(wǎng)絡(luò)面臨的問題有:1)卷積神經(jīng)網(wǎng)絡(luò)的大規(guī)模密集型計(jì)算受到FPGA計(jì)算能力(片上數(shù)字信號(hào)處理器(Digital Signal Processor,DSP)數(shù)目)的限制,如何優(yōu)化算法以降低乘法運(yùn)算量是提升加速器系統(tǒng)性能的主要問題。2)各類快速算法在降低卷積神經(jīng)網(wǎng)絡(luò)乘法運(yùn)算量的同時(shí)通常以提升內(nèi)存資源占用和存儲(chǔ)器帶寬占用為代價(jià),F(xiàn)PGA片上硬件資源量的限制將影響加速器系統(tǒng)性能。3)卷積神經(jīng)網(wǎng)絡(luò)計(jì)算量龐大,高效的數(shù)據(jù)重用能夠降低能耗開銷并減小設(shè)計(jì)面積。

    在5×5卷積的乘法運(yùn)算量方面,文獻(xiàn)[7]使用8 bit定點(diǎn)數(shù)據(jù)量化模型,在2個(gè)8 bit權(quán)重中插入1個(gè)8位的全0數(shù)據(jù),組成一個(gè)低8位和高8位分別為權(quán)重?cái)?shù)據(jù)、中8位為全0字段的24位新數(shù)據(jù),使用1個(gè)DSP得出2次乘法運(yùn)算結(jié)果,將傳統(tǒng)卷積算法的乘法運(yùn)算量降低至50.0%。文獻(xiàn)[8]利用卷積的元素代數(shù)性質(zhì),應(yīng)用Winograd快速卷積算法,將使用小尺寸卷積的VGGNet(Visual Geometry Group Network)等模型的乘法運(yùn)算量降低至45.0%,有效提高了硬件加速器的效率。文獻(xiàn)[9]基于二維快速傅里葉變換(Fast Fourier Transform,F(xiàn)FT)算法提出了一種靈活的自動(dòng)化設(shè)計(jì)高通量模型加速器,將乘法運(yùn)算量降低至約31.0%。文獻(xiàn)[10]采用n=6的二維Winograd算法,級(jí)聯(lián)3×3卷積構(gòu)建5×5卷積,將乘法運(yùn)算量降低至約19.4%。然而二維Winograd算法不同于傳統(tǒng)卷積算法,使用級(jí)聯(lián)3×3卷積的方法構(gòu)建5×5卷積將增加乘法運(yùn)算量、系統(tǒng)的存儲(chǔ)器帶寬需求,級(jí)聯(lián)的卷積層間也存在計(jì)算延遲,同時(shí)也會(huì)增加設(shè)計(jì)空間探索周期。在硬件資源占用方面,文獻(xiàn)[11]和文獻(xiàn)[10]分別提出了基于列或行的二維Winograd卷積算法雙緩沖區(qū)數(shù)據(jù)布局方案,降低了存儲(chǔ)器帶寬需求。然而文獻(xiàn)[10]的研究結(jié)果表明,他們所設(shè)計(jì)的加速器存儲(chǔ)器帶寬占用比例略高于片上DSP占用比例,這意味著受制于有限的FPGA硬件資源,部分情況下其設(shè)計(jì)無法達(dá)到理論的最高性能。在數(shù)據(jù)重用方面,文獻(xiàn)[12]提出了一種基于深流水線體系架構(gòu)的二維/三維Winograd卷積算法加速器設(shè)計(jì),通過層融合和層聚類等方法,顯著提高了數(shù)據(jù)重用性。文獻(xiàn)[11]和文獻(xiàn)[10]通過雙緩沖區(qū)數(shù)據(jù)布局方案重用了二維W inograd算法鄰域間的重疊數(shù)據(jù)。但二維Winograd算法轉(zhuǎn)換過程大量的加法運(yùn)算中存在可復(fù)用的中間結(jié)果,這些可復(fù)用結(jié)果的加法運(yùn)算屬于無效運(yùn)算,僅會(huì)增加加速器系統(tǒng)的能耗開銷和設(shè)計(jì)面積,上述文獻(xiàn)并未就此問題進(jìn)行研究和優(yōu)化。

    針對(duì)上述方法中計(jì)算復(fù)雜度高、存儲(chǔ)器帶寬需求高、級(jí)聯(lián)的卷積層間存在計(jì)算延遲、設(shè)計(jì)空間探索周期漫長(zhǎng)和加法計(jì)算量大等問題,提出了一種基于二維Winograd算法的雙緩沖區(qū)5×5卷積6級(jí)流水線方法。首先選用適宜尺寸的二維Winograd卷積算法降低計(jì)算復(fù)雜度和存儲(chǔ)器帶寬需求,然后通過雙緩沖區(qū)最小塊單元的設(shè)定指導(dǎo)并加快設(shè)計(jì)空間探索,增強(qiáng)可移植性,平衡FPGA硬件資源的使用,使設(shè)計(jì)不受任何硬件資源限制。最后通過深化二維Winograd卷積算法流水線,復(fù)用加法運(yùn)算過程中的中間計(jì)算結(jié)果,來降低加法運(yùn)算量,減小加速器系統(tǒng)的能耗開銷和設(shè)計(jì)面積。

    1 Winograd算法介紹

    1.1 符號(hào)說明

    表1對(duì)文章中使用的重要符號(hào)進(jìn)行說明。

    表1 符號(hào)說明Tab.1 Explanation of symbols

    1.2 一維Winograd算法

    Winograd算法于1980年由數(shù)學(xué)家Winograd提出[17]。以一維Winograd算法為例,記尺寸為r的卷積核輸出m個(gè)計(jì)算結(jié)果為F(m,r)。

    傳統(tǒng)卷積算法計(jì)算F(2,3)需要2×3=6次乘法。Winograd算法計(jì)算F(2,3)僅需要4次乘法,輸入輸出如下:

    具體過程如下:

    其中m1、m2、m3、m4為:

    Winograd算法中的常數(shù)乘法可以通過移位操作(如2-1、2-2和2)或由2n或2-n(n∈Z+)的組合后再移位(如5=20+22,1/6≈2-3+2-5+2-6)近似得到,因而計(jì)算m1、m2、m3、m4只需要4次乘法運(yùn)算。

    上述乘法過程可表示為矩陣相乘形式:

    其中Winograd算法F(22,32)的轉(zhuǎn)換矩陣AT、BT和G表示如下:

    1.3 二維Winograd算法

    F(m2,r2)的二維Winograd算法可以通過嵌套迭代一維Winograd算法得到:

    具體運(yùn)算步驟如下:

    記U⊙V結(jié)果為out:

    隨著壓縮模型理論的提出和應(yīng)用,現(xiàn)階段的研究大多使用16位定點(diǎn)數(shù)據(jù)代替浮點(diǎn)數(shù)據(jù),以減小計(jì)算資源和存儲(chǔ)資源的開銷。文獻(xiàn)[10]研究結(jié)果表明,由于轉(zhuǎn)換矩陣中的常數(shù)值范圍會(huì)隨參數(shù)n的增大而增大,使用16位定點(diǎn)數(shù)據(jù)時(shí),卷積核的精度不能低于2-10,Winograd算法中參數(shù)n(n=m+r-1)不得大于8,否則將影響卷積神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)準(zhǔn)確率。本文中分別使用多項(xiàng)式插值點(diǎn)(0,1,-1)、(0,1,-1,2,-2)及(0,1,-1,2,-2,1/2,-1/2)計(jì)算F(n=3,n=4)、F(n=5,n=6)及F(n=7,n=8)的轉(zhuǎn)換矩陣AT、BT和G。常數(shù)乘法如上所述,通過移位操作或由2n或2-n的組合后再移位實(shí)現(xiàn),使這部分運(yùn)算不占用DSP資源。

    相較于傳統(tǒng)卷積算法,二維Winograd卷積算法的輸出結(jié)果不再是輸出特征圖上的單個(gè)點(diǎn),而是多個(gè)點(diǎn)組成的輸出特征圖子塊。對(duì)一個(gè)大小為m2的輸出特征圖子塊,二維Winograd卷積算法需要n2次乘法,而傳統(tǒng)算法需要m2r2次乘法。

    2 計(jì)算復(fù)雜度及帶寬需求的定量分析

    2.1 計(jì)算復(fù)雜度定量分析

    由于二維Winograd卷積算法與傳統(tǒng)卷積算法計(jì)算原理有差異,這一部分對(duì)二維Winograd卷積算法下應(yīng)用5×5卷積和級(jí)聯(lián)3×3卷積的計(jì)算復(fù)雜度進(jìn)行了定量分析。

    在此項(xiàng)工作的定量分析中默認(rèn)步長(zhǎng)為1,當(dāng)通過卷積后輸出特征圖大小為C×C時(shí),二維Winograd卷積算法乘法運(yùn)算量為:(■C/■m×n)2。

    由于m,n,r均為已知常數(shù),設(shè)定C滿足C/m為正整數(shù),不考慮填充問題,可定量分析n≤8時(shí)二維Winograd算法下級(jí)聯(lián)與非級(jí)聯(lián)方法的計(jì)算復(fù)雜度。本文采用參數(shù)相同的常用F(m2,r2)實(shí)現(xiàn)級(jí)聯(lián)。

    使用兩個(gè)F(22,32)級(jí)聯(lián)時(shí)乘法運(yùn)算次數(shù)為:

    使用兩個(gè)F(42,32)級(jí)聯(lián)時(shí)乘法運(yùn)算次數(shù)為:

    使用兩個(gè)F(62,32)級(jí)聯(lián)時(shí)乘法運(yùn)算次數(shù)為:

    F(22,52)的乘法運(yùn)算次數(shù)為:

    F(42,52)的乘法運(yùn)算次數(shù)為:

    其中應(yīng)用級(jí)聯(lián)F(22,32)替代F(22,52)的過程如圖1所示。

    圖1 級(jí)聯(lián)F(22,32)替代F(22,52)示意圖Fig.1 Schematic diagram of cascading F(22,32)to replace F(22,52)

    通過對(duì)式(18)~(22)進(jìn)行對(duì)比可以得出:F(42,52)的乘法運(yùn)算次數(shù)是兩個(gè)級(jí)聯(lián)F(22,32)的約49.0%,兩個(gè)級(jí)聯(lián)F(42,32)的約87.1%,兩個(gè)級(jí)聯(lián)F(62,32)的約111.3%。此外,是傳統(tǒng)卷積算法的約17%。

    2.2 存儲(chǔ)器帶寬需求分析

    為高效地利用硬件資源,數(shù)據(jù)傳輸速度必須大于或等于計(jì)算速度。存儲(chǔ)器帶寬需求越低,數(shù)據(jù)傳輸速度越快,為系統(tǒng)的準(zhǔn)確性和穩(wěn)定性提供保障。文獻(xiàn)[11]采用基于列的雙緩沖區(qū)數(shù)據(jù)布局完成設(shè)計(jì),并未進(jìn)行設(shè)計(jì)空間探索。文獻(xiàn)[10]采用基于行的雙緩沖區(qū)數(shù)據(jù)布局完成設(shè)計(jì),使用參數(shù)組{n,Pm,Pn}指導(dǎo)設(shè)計(jì)空間探索。其中,n表示F(m2,r2)的尺寸,Pm表示并行運(yùn)算的輸入圖像的通道數(shù),Pn表示并行運(yùn)算的卷積核的數(shù)目。本文設(shè)定參數(shù)對(duì){Pc,Px}指導(dǎo)設(shè)計(jì)空間探索,其中與文獻(xiàn)[10]相較,n=8,Pc=2Pm,Px=Pn。

    對(duì)存儲(chǔ)器帶寬需求進(jìn)行建模和定量分析。計(jì)算輸入的n列數(shù)據(jù)所需時(shí)間為:

    其中:C為輸入圖像通道數(shù),N為卷積核中濾波器數(shù)目,F(xiàn)req為工作頻率。

    m列數(shù)據(jù)并行傳輸所需的時(shí)間為:

    其中Bandwidth為存儲(chǔ)器帶寬。

    由于要滿足Ttransfer≤Tcompute,即傳輸時(shí)間小于等于計(jì)算時(shí)間。因此可得存儲(chǔ)器帶寬需求為:

    當(dāng)不采用雙緩沖區(qū)設(shè)計(jì)機(jī)制時(shí),n列數(shù)據(jù)并行傳輸所需的時(shí)間為:

    此時(shí)的存儲(chǔ)器帶寬需求為:

    通過對(duì)比式(25)和式(27)可得,在理想狀況下,雙緩沖區(qū)設(shè)計(jì)方法可以縮減(1-m/n)倍的存儲(chǔ)器帶寬需求。這意味參數(shù)m相同時(shí),卷積核尺寸越大存儲(chǔ)器帶寬需求越低。以F(42,52)、F(42,32)和F(62,32)為 例,三 者 分 別 能 夠 縮 減50.0%(1-4/8)、33.3%(1-4/6)和25.0%(1-6/8)的存儲(chǔ)器帶寬需求。因此F(42,32)和F(62,32)的存儲(chǔ)器帶寬需求約為F(42,52)的1.32倍和1.50倍。本文的設(shè)計(jì)方法較基于F(42,32)的方法降低了約24.2%的存儲(chǔ)器帶寬需求。而F(62,32)的存儲(chǔ)器帶寬需求最高,無法完成高性能的卷積神經(jīng)網(wǎng)絡(luò)加速器設(shè)計(jì)。此外存儲(chǔ)器帶寬需求越高,數(shù)據(jù)重用能力就越差,存儲(chǔ)器訪問也越高,會(huì)大幅增加整個(gè)硬件加速器系統(tǒng)的能耗。

    結(jié)合計(jì)算復(fù)雜度分析進(jìn)行綜合評(píng)定,基于F(42,52)的二維Winograd算法5×5卷積存儲(chǔ)器帶寬需求最低,計(jì)算復(fù)雜度也低于傳統(tǒng)卷積算法和基于F(22,32)和F(42,32)的設(shè)計(jì),且不存在級(jí)聯(lián)卷積層間的計(jì)算延遲。

    3 最小塊單元雙緩沖區(qū)數(shù)據(jù)布局方案

    由于卷積神經(jīng)網(wǎng)絡(luò)規(guī)模龐大,計(jì)算過程復(fù)雜,且需要保證塊隨機(jī)存儲(chǔ)器(Block Random Access Memory,BRAM)使用率和存儲(chǔ)器帶寬使用率均低于或趨近于DSP使用率,使得基于參數(shù)組{n,Pm,Pn}的設(shè)計(jì)空間探索求性能最優(yōu)解的過程較為漫長(zhǎng)。本文的設(shè)計(jì)將n確定為8,Pc=2Pm,極大地減少了可能的參數(shù)組合方式,大幅提高了設(shè)計(jì)空間探索速度。由于采用了存儲(chǔ)器帶寬需求最低的設(shè)計(jì)方法,因而僅需在探索過程中求解以BRAM資源為約束條件的性能最優(yōu)解。

    為快速高效完成設(shè)計(jì)空間探索工作,本文提出了一種雙緩沖區(qū)最小塊單元數(shù)據(jù)布局設(shè)計(jì)方案,計(jì)算和傳輸采用雙緩沖設(shè)計(jì)并行完成。最初將輸入特征圖和卷積核等輸入數(shù)據(jù)存儲(chǔ)在外部存儲(chǔ)器中,運(yùn)算過程中的輸入特征圖和輸出特征圖通過FIFO傳至FPGA平臺(tái)。由于片上存儲(chǔ)資源的限制,外部存儲(chǔ)器中存儲(chǔ)的數(shù)據(jù)將根據(jù)運(yùn)算階段分批次加載到片上存儲(chǔ)器中。之后建立性能評(píng)估模型指導(dǎo)設(shè)計(jì)空間探索求解,對(duì)多種參數(shù)組合方式進(jìn)行實(shí)驗(yàn)和數(shù)據(jù)對(duì)比,最終提出本文的設(shè)計(jì)方案。雙緩沖區(qū)最小塊單元設(shè)計(jì)如圖2所示。首先存儲(chǔ)三個(gè)緊鄰的8×4×2(8行、4列、通道數(shù)為2)的圖像塊,如圖2中A、B、C所示。其中選擇通道維度的深度為2,既降低了設(shè)計(jì)空間探索復(fù)雜度,也不會(huì)對(duì)最終性能水平產(chǎn)生影響。每次取相鄰的兩個(gè)圖像塊參與二維Winograd算法5×5卷積運(yùn)算,如AB和BC,每個(gè)最小塊單元單個(gè)運(yùn)算周期內(nèi)執(zhí)行128次乘法運(yùn)算。當(dāng)對(duì)AB進(jìn)行運(yùn)算后,A中的數(shù)據(jù)被覆蓋,而后重用B中存儲(chǔ)的數(shù)據(jù),對(duì)BC進(jìn)行運(yùn)算。當(dāng)完成最初前8行的運(yùn)算后將自動(dòng)翻轉(zhuǎn)至下部分計(jì)算的最左端,以此類推向后循環(huán),直至全部運(yùn)算結(jié)束。

    圖2 雙緩沖區(qū)最小塊單元設(shè)計(jì)示意圖Fig.2 Schematic diagram ofdouble-buffer minimum block unit design

    通過性能評(píng)估模型數(shù)據(jù)評(píng)估得出的雙緩沖區(qū)最小塊單元設(shè)計(jì),極大地降低了設(shè)計(jì)空間探索周期,也增強(qiáng)了可移植性。

    4 6級(jí)流水線設(shè)計(jì)實(shí)現(xiàn)

    如式(7)中所示,二維Winograd卷積算法F(42,52)計(jì)算需要逐步完成,首先完成U和V的加法計(jì)算,而后進(jìn)行U⊙V的矩陣點(diǎn)乘運(yùn)算,最后通過加法計(jì)算Out輸出結(jié)果。根據(jù)二維Winograd卷積算法計(jì)算過程的這一特性,使用多級(jí)流水線設(shè)計(jì)可以有效降低各計(jì)算階段間的延遲。

    之前的二維Winograd卷積算法卷積采用4級(jí)流水線結(jié)構(gòu)實(shí)現(xiàn)[10]。第1階段并行執(zhí)行U、V的運(yùn)算,第2階段執(zhí)行U⊙V的運(yùn)算,第3階段執(zhí)行Out的運(yùn)算,第4階段將各通道計(jì)算結(jié)果進(jìn)行累加。這種設(shè)計(jì)方法在1級(jí)流水中完成U、V或Out的計(jì)算。在第1階段V的運(yùn)算過程中,V=BTInB的運(yùn)算需要等待BTIn全部運(yùn)算完畢后才能繼續(xù)執(zhí)行下一步與B的運(yùn)算,使得加法計(jì)算過程的延遲可能會(huì)大于乘法計(jì)算的延遲,導(dǎo)致加速器性能下降。

    另一種方法是將In中的元素設(shè)為未知參數(shù),離線執(zhí)行V=BTInB的運(yùn)算,運(yùn)算結(jié)果中V的元素全部轉(zhuǎn)換為與In中元素相關(guān)的鏈?zhǔn)郊臃ǎㄈ鏔(22,32)中V的首個(gè)元素為(x0-x2-x8+x10)),通過這種方式在1級(jí)流水中實(shí)現(xiàn)V的計(jì)算。但由于矩陣乘法的代數(shù)性質(zhì),該方法需要完成更多次的加法運(yùn)算。以F(42,52)為例,此方法的加法運(yùn)算量是逐步運(yùn)算的近3倍,且部分常數(shù)乘法無法再由2n或2-n的組合進(jìn)行近似。這些加法運(yùn)算在FPGA中體現(xiàn)為大量觸發(fā)器(Flip Flop,F(xiàn)F)和查找表(Look-Up-Table,LUT)的使用。

    因此本文啟用深流水線設(shè)計(jì),采用逐步運(yùn)算的6級(jí)流水線結(jié)構(gòu),合理分配硬件資源并減小處理轉(zhuǎn)換矩陣中常數(shù)乘法所帶來的誤差。6級(jí)流水線設(shè)計(jì)結(jié)構(gòu)如圖3所示。對(duì)于V,在流水線的第1階段,執(zhí)行V1=BTIn的運(yùn)算和存儲(chǔ),計(jì)算過程參考式(13),流水線的第2階段,執(zhí)行V=V1B的運(yùn)算和存儲(chǔ),計(jì)算過程參考式(14)。對(duì)于U,有兩種實(shí)現(xiàn)方式:第一種與V相同,流水線的第1階段,執(zhí)行U1=GF的運(yùn)算和存儲(chǔ),計(jì)算過程參考式(11),流水線的第2階段,執(zhí)行U=U1GT的運(yùn)算和存儲(chǔ),計(jì)算過程參考式(12)。由于U的運(yùn)算量始終小于V,這種設(shè)計(jì)方法不會(huì)對(duì)流水線的延遲產(chǎn)生影響。第二種是直接離線完成U的運(yùn)算并加載到FPGA的存儲(chǔ)器中。由于卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)過程中卷積核權(quán)重不發(fā)生變化,U可以直接在FPGA外部完成計(jì)算。當(dāng)參數(shù)n≤8時(shí),V計(jì)算過程中的常數(shù)始終可以通過2n或2-n的組合進(jìn)行精確表示,而U計(jì)算過程中會(huì)出現(xiàn)諸如1/6等需要進(jìn)行近似處理的常數(shù),因此這種方法可以在更高的卷積核精度下進(jìn)行工作。相應(yīng)地,離線完成U的運(yùn)算代價(jià)是耗費(fèi)更多的BRAM資源。為保障系統(tǒng)性能,本文選用第一種方法以節(jié)省片上BRAM資源。在流水線的第3階段,執(zhí)行U⊙V的運(yùn)算并進(jìn)行存儲(chǔ)。流水線的第4階段,執(zhí)行Out1=ATout的運(yùn)算并進(jìn)行存儲(chǔ)。流水線的第5階段,執(zhí)行Out=Out1A的運(yùn)算并進(jìn)行存儲(chǔ)。流水線的第6階段,將各通道的運(yùn)算結(jié)果進(jìn)行累加和存儲(chǔ)。

    圖3 六級(jí)流水線設(shè)計(jì)結(jié)構(gòu)示意圖Fig.3 Schematic diagram of 6-stage pipeline design structure

    5 實(shí)驗(yàn)與結(jié)果分析

    為驗(yàn)證針對(duì)5×5卷積所提出的雙緩沖區(qū)二維Winograd算法6級(jí)流水線方法的綜合性能,與現(xiàn)有文獻(xiàn)[7,9-10]的針對(duì)5×5卷積的加速器設(shè)計(jì)方法就硬件資源使用率(設(shè)計(jì)方法所用的各類硬件資源占片上總資源量的比率)、計(jì)算性能和DSP效率等方面進(jìn)行對(duì)比。實(shí)驗(yàn)選用AlexNet的第二個(gè)卷積層完成算法設(shè)計(jì)。為便于比較,采用高速集成電路硬件描述語言(Verilog integrated circuit Hardware Description Language,Verilog HDL)在Xilinx XC7A200T平臺(tái)上完成雙緩沖結(jié)構(gòu)設(shè)計(jì)、加法器和乘法器的流水線設(shè)計(jì)等。利用Vivado simulator仿真工具建立寄存器轉(zhuǎn)換級(jí)(Register Transfer Level,RTL)仿真模型,時(shí)鐘頻率與之前的多項(xiàng)研究工作保持一致,設(shè)為200 MHz。卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)過程的剩余部分在FPGA外部完成,確保所設(shè)計(jì)的算法不影響模型的預(yù)測(cè)準(zhǔn)確率。

    5.1 精度損失分析

    采用ILSVRC2012數(shù)據(jù)集對(duì)本文所架構(gòu)的AlexNet進(jìn)行精度損失分析。訓(xùn)練數(shù)據(jù)集中有1 000個(gè)不同的類,每個(gè)類包含大約1 300個(gè)不同的圖像,驗(yàn)證數(shù)據(jù)集中有5 000個(gè)與訓(xùn)練數(shù)據(jù)集不同的樣本。本文采用16 bit定點(diǎn)數(shù)據(jù)完成量化,采用二維Winograd算法構(gòu)建AlexNet,并與使用32 bit浮點(diǎn)數(shù)的全精度初始模型進(jìn)行算法精度對(duì)比。

    如表2所示,本文AlexNet模型的Top-1精度損失不超過0.5%,Top-5精度損失不超過1%,與文獻(xiàn)[7]方法、文獻(xiàn)[9]方法和文獻(xiàn)[10]方法大致相同。其中文獻(xiàn)[9]方法和文獻(xiàn)[10]方法精度損失均<1%,文獻(xiàn)[7]方法由于使用8 bit數(shù)據(jù)量化因而精度損失略高,約為<3%。

    表2 精度損失分析 單位:%Tab.2 Accuracy lossanalysis unit:%

    5.2 計(jì)算性能分析

    乘法運(yùn)算量是影響卷積神經(jīng)網(wǎng)絡(luò)FPGA加速器實(shí)際計(jì)算時(shí)間的主要因素。本文統(tǒng)計(jì)傳統(tǒng)卷積方法、文獻(xiàn)[7]方法、文獻(xiàn)[9]方法、文獻(xiàn)[10]方法和本文方法的AlexNet第二卷積層乘法運(yùn)算量,并與傳統(tǒng)卷積方法進(jìn)行加速倍率比較。

    由表3可以看出,本文算法5×5卷積的乘法運(yùn)算量最低,加速倍率最高,為5.82,是其他方法的1.13~2.91倍。

    表3 乘法運(yùn)算量對(duì)比Tab.3 Comparison of multiplication computational cost

    在各類卷積神經(jīng)網(wǎng)絡(luò)FPGA加速器中,實(shí)際運(yùn)算時(shí)間直觀地反映了架構(gòu)方案的加速水平,是評(píng)估加速器性能的重要指標(biāo)。本文對(duì)比并分析了文獻(xiàn)[7]方法、文獻(xiàn)[9]方法、文獻(xiàn)[10]方法和本文方法的AlexNet第二卷積層運(yùn)算時(shí)間,并以文獻(xiàn)[7]方法的計(jì)算速度為基線比較了各類方法的加速效果。

    由表4可知,得益于最低的乘法運(yùn)算量、深流水線架構(gòu)和不存在級(jí)聯(lián)卷積的層間計(jì)算延遲等優(yōu)勢(shì),本文的方法運(yùn)算時(shí)間最短,對(duì)5×5卷積的加速效果最佳。

    表4 運(yùn)算時(shí)間對(duì)比Tab.4 Comparison of computing time

    5.3 硬件資源使用率分析

    根據(jù)文獻(xiàn)[7,9-10]的設(shè)計(jì)思想,使用本文的FPGA平臺(tái)實(shí)現(xiàn)其相應(yīng)算法對(duì)AlexNet第二個(gè)卷積層的設(shè)計(jì),就DSP、LUT和BRAM的資源使用率進(jìn)行比較。硬件資源使用率對(duì)比如圖4所示。

    圖4 硬件資源使用率對(duì)比Fig.4 Hardware resource utilization comparison

    如圖4(a)所示,本文的DSP資源使用率與文獻(xiàn)[7]方法、文獻(xiàn)[9]方法和文獻(xiàn)[10]方法相近,均在80%以上,均能保證卷積神經(jīng)網(wǎng)絡(luò)硬件加速器擁有較高的工作效率。

    如圖4(b)所示,本文的LUT資源使用率比文獻(xiàn)[7]方法高24%,比文獻(xiàn)[9]方法高28%,比文獻(xiàn)[10]方法高8%,但遠(yuǎn)低于DSP資源使用率。由于二維Winograd卷積算法通過完成大量加法運(yùn)算來降低乘法運(yùn)算量,因此采用Winograd算法的本文和文獻(xiàn)[10]需要更多的LUT資源完成加法運(yùn)算。

    此外在Winograd算法U、V及Out的加法計(jì)算過程中,存在一些可復(fù)用的中間計(jì)算結(jié)果,例如F(22,32)算法運(yùn)算過程中式(12)運(yùn)算結(jié)果U的第2、3個(gè)元素中均有(u0/2+u2/2)的運(yùn)算,其中u0、u2為式(11)運(yùn)算結(jié)果U1的第1、3個(gè)元素。為降低部分LUT開銷,本文通過字符串精確匹配搜索U、V及Out加法運(yùn)算中可復(fù)用的中間計(jì)算結(jié)果來指導(dǎo)設(shè)計(jì),在二維Winograd卷積算法的加法設(shè)計(jì)中探索并實(shí)現(xiàn)最優(yōu)的數(shù)據(jù)重用方式,降低了約8%的加法計(jì)算量,以降低LUT資源使用率。這種加法運(yùn)算中間結(jié)果重用方法避免了部分無效計(jì)算,減小了設(shè)計(jì)面積且降低了系統(tǒng)能耗。

    如圖4(c)所示,本文的BRAM資源使用率比文獻(xiàn)[7]方法低15%,比文獻(xiàn)[9]方法高30%,比文獻(xiàn)[10]方法低1%。與文獻(xiàn)[7]和文獻(xiàn)[9]的方法相較,本文和文獻(xiàn)[10]的方法相對(duì)乘法運(yùn)算量更低,這意味著在使用相同數(shù)目的DSP時(shí),二維W inograd卷積算法可對(duì)更多的輸入數(shù)據(jù)完成卷積運(yùn)算,因此采用此類方法的本文和文獻(xiàn)[10]在實(shí)現(xiàn)過程中需要占用更多的BRAM資源。本文通過設(shè)計(jì)快速設(shè)計(jì)空間探索性能分析模型來保證BRAM資源使用率低于DSP使用率,以確保加速器性能不受硬件資源數(shù)量限制。

    綜合整體硬件資源進(jìn)行分析,本文的設(shè)計(jì)與之前研究工作相較各項(xiàng)硬件資源使用率相近,通過數(shù)據(jù)重用、優(yōu)化架構(gòu)和優(yōu)化加速算法等方式取得了更高的計(jì)算性能,提高了硬件加速器的加速效率。

    5.4 DSP效率分析

    由于卷積神經(jīng)網(wǎng)絡(luò)FPGA加速器的吞吐量、功率和能量效率等性能指標(biāo)均會(huì)受FPGA平臺(tái)影響,同一設(shè)計(jì)方法在不同平臺(tái)上會(huì)有不同的性能表現(xiàn)。因此本文將DSP效率,即吞吐量/片上DSP數(shù)量作為主要指標(biāo)以客觀分析加速器性能水平。由于本文在同一FPGA平臺(tái)上實(shí)現(xiàn)相關(guān)設(shè)計(jì)因此各加速方法具有相同的工作頻率和可用DSP總量。

    由表5可知,本文的設(shè)計(jì)在5×5卷積的相關(guān)層達(dá)到了較高的DSP效率,DSP效率為0.529,高于文獻(xiàn)[7]方法和文獻(xiàn)[9]方法,由于復(fù)用了部分加法運(yùn)算結(jié)果降低了吞吐量而略低于文獻(xiàn)[10]方法的0.557。但因本文架構(gòu)方法有著更低的乘法運(yùn)算量和存儲(chǔ)器帶寬需求,因此相較文獻(xiàn)[10]方法,本文的加速器系統(tǒng)架構(gòu)方法速度更快、能耗更低、性能更優(yōu)。

    表5 DSP效率對(duì)比Tab.5 Comparison of DSPefficiency

    6 結(jié)語

    本文對(duì)基于二維Winograd算法5×5卷積的架構(gòu)問題進(jìn)行了研究,深化二維Winograd卷積算法流水線并利用雙緩沖區(qū)和復(fù)用中間運(yùn)算結(jié)果實(shí)現(xiàn)數(shù)據(jù)重用,提出了一種針對(duì)二維Winograd算法5×5卷積的雙緩沖區(qū)最小塊單元6級(jí)流水線方法,并與現(xiàn)有構(gòu)建5×5卷積的方法進(jìn)行實(shí)驗(yàn)對(duì)比。實(shí)驗(yàn)結(jié)果表明,本文提出的深流水線方法在基本不影響神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)準(zhǔn)確率的前提下,具有更低的計(jì)算復(fù)雜度和存儲(chǔ)器帶寬需求,縮短了計(jì)算時(shí)間,降低了能耗,為FPGA上5×5快速卷積的架構(gòu)提供了解決方案,有效地提高了二維W inograd算法5×5卷積在FPGA平臺(tái)上的計(jì)算效率。

    猜你喜歡
    運(yùn)算量流水線存儲(chǔ)器
    Gen Z Migrant Workers Are Leaving the Assembly Line
    靜態(tài)隨機(jī)存儲(chǔ)器在軌自檢算法
    流水線
    用平面幾何知識(shí)解平面解析幾何題
    減少運(yùn)算量的途徑
    讓拋物線動(dòng)起來吧,為運(yùn)算量“瘦身”
    報(bào)廢汽車拆解半自動(dòng)流水線研究
    存儲(chǔ)器——安格爾(墨西哥)▲
    SIMATIC IPC3000 SMART在汽車流水線領(lǐng)域的應(yīng)用
    基于Nand Flash的高速存儲(chǔ)器結(jié)構(gòu)設(shè)計(jì)
    国产av一区二区精品久久| 多毛熟女@视频| 在线观看舔阴道视频| 狂野欧美激情性bbbbbb| 国产精品麻豆人妻色哟哟久久| 亚洲国产日韩一区二区| 国产欧美日韩综合在线一区二区| 亚洲av电影在线观看一区二区三区| 免费在线观看视频国产中文字幕亚洲 | 亚洲精品一区蜜桃| 91成年电影在线观看| 亚洲熟女精品中文字幕| 成人影院久久| 97人妻天天添夜夜摸| 日韩视频在线欧美| 国产精品 国内视频| 老司机福利观看| 日韩免费高清中文字幕av| 成人国产一区最新在线观看| 国产精品一区二区在线观看99| av福利片在线| 精品国内亚洲2022精品成人 | 中国国产av一级| 国产精品1区2区在线观看. | 蜜桃国产av成人99| 老汉色av国产亚洲站长工具| 欧美成狂野欧美在线观看| 青春草亚洲视频在线观看| 久热爱精品视频在线9| 午夜影院在线不卡| 亚洲欧美一区二区三区黑人| 亚洲欧洲日产国产| 成年人午夜在线观看视频| 亚洲欧美色中文字幕在线| 精品国产一区二区三区久久久樱花| 精品久久久久久电影网| 人妻人人澡人人爽人人| 在线观看人妻少妇| 人人妻人人澡人人看| 啦啦啦在线免费观看视频4| 国产精品久久久久久精品古装| 18禁国产床啪视频网站| 国产一区二区三区av在线| 丰满迷人的少妇在线观看| 日韩中文字幕欧美一区二区| 亚洲精品美女久久av网站| 制服诱惑二区| 黑人欧美特级aaaaaa片| 国产高清视频在线播放一区 | av不卡在线播放| 一个人免费看片子| 啪啪无遮挡十八禁网站| 久久热在线av| 亚洲中文字幕日韩| 国产伦理片在线播放av一区| 亚洲人成电影免费在线| 国产在视频线精品| 国产精品香港三级国产av潘金莲| 欧美xxⅹ黑人| 国产区一区二久久| 中文精品一卡2卡3卡4更新| 国产日韩欧美在线精品| 午夜免费成人在线视频| 男女无遮挡免费网站观看| 亚洲久久久国产精品| 91av网站免费观看| 男人操女人黄网站| 如日韩欧美国产精品一区二区三区| 成人国产av品久久久| 久久精品人人爽人人爽视色| av超薄肉色丝袜交足视频| 国产欧美日韩一区二区精品| 在线av久久热| 制服人妻中文乱码| 精品国内亚洲2022精品成人 | 高清视频免费观看一区二区| 亚洲精品日韩在线中文字幕| 亚洲第一欧美日韩一区二区三区 | 国产成人av教育| 国产区一区二久久| 色视频在线一区二区三区| 精品卡一卡二卡四卡免费| 在线 av 中文字幕| 天天躁夜夜躁狠狠躁躁| av欧美777| 大陆偷拍与自拍| 成年人黄色毛片网站| 一级片'在线观看视频| 亚洲 欧美一区二区三区| 亚洲午夜精品一区,二区,三区| 黄色视频在线播放观看不卡| 欧美av亚洲av综合av国产av| 一本一本久久a久久精品综合妖精| 免费观看人在逋| 黄片大片在线免费观看| 桃花免费在线播放| 正在播放国产对白刺激| 脱女人内裤的视频| 老熟妇仑乱视频hdxx| 日韩欧美一区视频在线观看| 在线天堂中文资源库| 日韩欧美免费精品| 久久精品久久久久久噜噜老黄| 人妻久久中文字幕网| 日日爽夜夜爽网站| 一二三四在线观看免费中文在| 女人高潮潮喷娇喘18禁视频| 久久天堂一区二区三区四区| 精品国产乱码久久久久久男人| 国产av又大| 国产片内射在线| 天天躁日日躁夜夜躁夜夜| 免费在线观看影片大全网站| 美女午夜性视频免费| 一二三四社区在线视频社区8| 国产精品av久久久久免费| 男女边摸边吃奶| 亚洲伊人久久精品综合| 成人18禁高潮啪啪吃奶动态图| 夜夜骑夜夜射夜夜干| 精品国产超薄肉色丝袜足j| 波多野结衣av一区二区av| 久久久水蜜桃国产精品网| 伊人亚洲综合成人网| 亚洲国产av新网站| 9色porny在线观看| 免费在线观看视频国产中文字幕亚洲 | 久久精品熟女亚洲av麻豆精品| 亚洲中文av在线| 两性夫妻黄色片| 久久久久精品国产欧美久久久 | 久久国产精品男人的天堂亚洲| 久久久国产精品麻豆| 亚洲美女黄色视频免费看| 国产成人啪精品午夜网站| 夜夜骑夜夜射夜夜干| 国产深夜福利视频在线观看| 日韩三级视频一区二区三区| 桃红色精品国产亚洲av| 日本猛色少妇xxxxx猛交久久| 夜夜骑夜夜射夜夜干| 久久久精品免费免费高清| 亚洲色图 男人天堂 中文字幕| 午夜日韩欧美国产| a级片在线免费高清观看视频| 亚洲天堂av无毛| 精品国产国语对白av| 日本欧美视频一区| 美女主播在线视频| 9热在线视频观看99| 人妻一区二区av| 一进一出抽搐动态| 中文字幕精品免费在线观看视频| 欧美日韩av久久| a级片在线免费高清观看视频| 国产精品成人在线| 精品欧美一区二区三区在线| 色播在线永久视频| 久久人人97超碰香蕉20202| 久久中文字幕一级| 久久久久久久久免费视频了| 午夜福利视频在线观看免费| 国产精品 国内视频| 久久青草综合色| 极品少妇高潮喷水抽搐| 欧美成狂野欧美在线观看| 黑人操中国人逼视频| 精品一品国产午夜福利视频| 人人妻人人澡人人看| 久久久久网色| 男女床上黄色一级片免费看| 爱豆传媒免费全集在线观看| 999精品在线视频| 日韩视频一区二区在线观看| 成人18禁高潮啪啪吃奶动态图| 老熟妇仑乱视频hdxx| 天堂中文最新版在线下载| www.熟女人妻精品国产| 久久人人97超碰香蕉20202| 国产成人精品久久二区二区91| 精品第一国产精品| 久久国产精品男人的天堂亚洲| 国产色视频综合| 欧美日韩国产mv在线观看视频| 亚洲精品久久成人aⅴ小说| 麻豆国产av国片精品| 夜夜骑夜夜射夜夜干| 欧美激情 高清一区二区三区| 热99re8久久精品国产| 亚洲国产精品成人久久小说| videosex国产| 久久久久国产一级毛片高清牌| 国产精品一二三区在线看| 成在线人永久免费视频| 久久久久久久精品精品| 少妇被粗大的猛进出69影院| 爱豆传媒免费全集在线观看| 亚洲精品国产区一区二| 精品国产乱码久久久久久男人| 成人影院久久| 新久久久久国产一级毛片| 高清黄色对白视频在线免费看| 黄片播放在线免费| 国产精品香港三级国产av潘金莲| 99久久精品国产亚洲精品| 亚洲欧美精品综合一区二区三区| 成在线人永久免费视频| 亚洲 欧美一区二区三区| 丁香六月天网| 国产精品偷伦视频观看了| 亚洲中文日韩欧美视频| 久久中文看片网| 最新在线观看一区二区三区| 飞空精品影院首页| 又大又爽又粗| 亚洲欧美清纯卡通| 五月开心婷婷网| 欧美另类一区| 日本五十路高清| 亚洲av国产av综合av卡| 色婷婷久久久亚洲欧美| 亚洲av电影在线进入| 中文字幕最新亚洲高清| 男人添女人高潮全过程视频| 性少妇av在线| 国产亚洲一区二区精品| 久久久久久久久久久久大奶| 夜夜骑夜夜射夜夜干| 亚洲久久久国产精品| 中文精品一卡2卡3卡4更新| 国产高清视频在线播放一区 | 每晚都被弄得嗷嗷叫到高潮| 这个男人来自地球电影免费观看| 国产精品熟女久久久久浪| 黄色视频不卡| 国产精品欧美亚洲77777| 久久精品国产a三级三级三级| 最新的欧美精品一区二区| 一区二区三区乱码不卡18| 人妻一区二区av| 大码成人一级视频| 国产深夜福利视频在线观看| 欧美人与性动交α欧美精品济南到| 色老头精品视频在线观看| 五月开心婷婷网| 成人影院久久| 国产又爽黄色视频| 久久久久久亚洲精品国产蜜桃av| 国产欧美日韩一区二区三区在线| 色精品久久人妻99蜜桃| 老司机亚洲免费影院| 女人久久www免费人成看片| 精品一区在线观看国产| 日韩精品免费视频一区二区三区| 国产国语露脸激情在线看| 欧美成人午夜精品| 纵有疾风起免费观看全集完整版| 国产成+人综合+亚洲专区| 一二三四社区在线视频社区8| 国产成人啪精品午夜网站| 亚洲精品一区蜜桃| 一进一出抽搐动态| 欧美日韩亚洲高清精品| 成年人黄色毛片网站| 欧美日韩av久久| 精品国产一区二区三区久久久樱花| 我的亚洲天堂| 国产精品久久久人人做人人爽| e午夜精品久久久久久久| 亚洲精品国产区一区二| 嫁个100分男人电影在线观看| 热99国产精品久久久久久7| 岛国毛片在线播放| 久久久久久久精品精品| 深夜精品福利| 美女扒开内裤让男人捅视频| 天天影视国产精品| 成人国语在线视频| 女人高潮潮喷娇喘18禁视频| 国产麻豆69| 不卡一级毛片| 中亚洲国语对白在线视频| 国产亚洲精品一区二区www | 欧美午夜高清在线| 国产成人啪精品午夜网站| 亚洲成人免费av在线播放| 欧美日韩福利视频一区二区| 老汉色∧v一级毛片| 中国美女看黄片| 一本大道久久a久久精品| www.av在线官网国产| 国产精品一区二区在线不卡| 欧美变态另类bdsm刘玥| 多毛熟女@视频| 午夜影院在线不卡| 可以免费在线观看a视频的电影网站| 成年av动漫网址| 久久性视频一级片| 亚洲熟女毛片儿| 大型av网站在线播放| 欧美乱码精品一区二区三区| 成年人免费黄色播放视频| 成人18禁高潮啪啪吃奶动态图| 日韩精品免费视频一区二区三区| 大片电影免费在线观看免费| 国产成人系列免费观看| 成年女人毛片免费观看观看9 | 女人爽到高潮嗷嗷叫在线视频| 日韩,欧美,国产一区二区三区| 亚洲欧洲精品一区二区精品久久久| 国产又爽黄色视频| 中文精品一卡2卡3卡4更新| videos熟女内射| 一进一出抽搐动态| 自线自在国产av| 久久久国产成人免费| 国产亚洲一区二区精品| 国产色视频综合| 亚洲欧美日韩另类电影网站| 丝袜人妻中文字幕| 亚洲黑人精品在线| 曰老女人黄片| 亚洲av日韩在线播放| 美国免费a级毛片| 国产亚洲欧美在线一区二区| 中文字幕av电影在线播放| 精品乱码久久久久久99久播| 久久人人爽av亚洲精品天堂| avwww免费| 精品国产乱码久久久久久小说| a 毛片基地| 成年人免费黄色播放视频| 午夜激情久久久久久久| 欧美日韩黄片免| 99国产综合亚洲精品| 99国产精品99久久久久| 视频区欧美日本亚洲| 久久99热这里只频精品6学生| 久久中文看片网| 国产片内射在线| 一区二区日韩欧美中文字幕| 欧美少妇被猛烈插入视频| 午夜福利乱码中文字幕| 亚洲国产中文字幕在线视频| 乱人伦中国视频| 久久免费观看电影| 又黄又粗又硬又大视频| 免费观看av网站的网址| 免费在线观看视频国产中文字幕亚洲 | 成人影院久久| 国产不卡av网站在线观看| 黑人猛操日本美女一级片| 国产日韩欧美在线精品| 高清av免费在线| 欧美在线黄色| 亚洲avbb在线观看| 国产av一区二区精品久久| 午夜成年电影在线免费观看| 蜜桃在线观看..| 成人影院久久| 久久av网站| 久久人人爽av亚洲精品天堂| 欧美日本中文国产一区发布| 免费一级毛片在线播放高清视频 | 久久这里只有精品19| 黑人巨大精品欧美一区二区蜜桃| 亚洲国产av影院在线观看| 久久人人97超碰香蕉20202| 女警被强在线播放| 欧美+亚洲+日韩+国产| 三级毛片av免费| 伊人久久大香线蕉亚洲五| 国产欧美日韩综合在线一区二区| 久久精品国产a三级三级三级| 精品国产一区二区久久| 国产野战对白在线观看| 亚洲国产欧美在线一区| 80岁老熟妇乱子伦牲交| 两个人看的免费小视频| 黄色视频不卡| 色播在线永久视频| 天堂中文最新版在线下载| 在线十欧美十亚洲十日本专区| 久久精品国产亚洲av高清一级| 国产老妇伦熟女老妇高清| 交换朋友夫妻互换小说| 亚洲五月色婷婷综合| 欧美日韩成人在线一区二区| 每晚都被弄得嗷嗷叫到高潮| 精品一区二区三区四区五区乱码| 少妇精品久久久久久久| 日本猛色少妇xxxxx猛交久久| 两个人免费观看高清视频| 久久ye,这里只有精品| 18禁国产床啪视频网站| 91老司机精品| 五月开心婷婷网| 午夜日韩欧美国产| 亚洲欧美精品自产自拍| 精品福利观看| 汤姆久久久久久久影院中文字幕| 老汉色∧v一级毛片| 精品国产乱码久久久久久小说| 欧美+亚洲+日韩+国产| 少妇人妻久久综合中文| 美女午夜性视频免费| www.精华液| 91麻豆精品激情在线观看国产 | 丝袜美腿诱惑在线| 五月天丁香电影| 欧美在线一区亚洲| 黄网站色视频无遮挡免费观看| 制服诱惑二区| 自线自在国产av| e午夜精品久久久久久久| 国产成人系列免费观看| www.熟女人妻精品国产| 一本一本久久a久久精品综合妖精| 脱女人内裤的视频| 俄罗斯特黄特色一大片| 下体分泌物呈黄色| 在线观看免费日韩欧美大片| 午夜精品国产一区二区电影| 成人国产av品久久久| 色94色欧美一区二区| 女人爽到高潮嗷嗷叫在线视频| 成年美女黄网站色视频大全免费| 国产精品1区2区在线观看. | 女人久久www免费人成看片| 欧美日韩国产mv在线观看视频| 天堂中文最新版在线下载| 精品福利观看| 久久九九热精品免费| 纯流量卡能插随身wifi吗| 99久久精品国产亚洲精品| 免费少妇av软件| 男女高潮啪啪啪动态图| 欧美日本中文国产一区发布| 精品久久久精品久久久| 日韩人妻精品一区2区三区| 麻豆乱淫一区二区| 女警被强在线播放| 国产又爽黄色视频| 久久国产精品人妻蜜桃| 欧美日韩中文字幕国产精品一区二区三区 | 91av网站免费观看| 国产精品一区二区精品视频观看| 日韩欧美一区视频在线观看| 国产日韩一区二区三区精品不卡| 亚洲中文av在线| 午夜福利影视在线免费观看| 久久天躁狠狠躁夜夜2o2o| 另类精品久久| 菩萨蛮人人尽说江南好唐韦庄| 国产成人系列免费观看| 国产精品一区二区在线不卡| 成人免费观看视频高清| 五月天丁香电影| 免费高清在线观看视频在线观看| 18禁观看日本| 中文精品一卡2卡3卡4更新| 国产不卡av网站在线观看| 日日夜夜操网爽| 欧美激情高清一区二区三区| 亚洲精品第二区| 99精品久久久久人妻精品| 丁香六月天网| 国产人伦9x9x在线观看| 亚洲av日韩精品久久久久久密| 中文字幕精品免费在线观看视频| 这个男人来自地球电影免费观看| 伊人久久大香线蕉亚洲五| 777米奇影视久久| 欧美午夜高清在线| 男男h啪啪无遮挡| 亚洲av日韩在线播放| 亚洲熟女毛片儿| 亚洲欧美成人综合另类久久久| 国产成人系列免费观看| 9色porny在线观看| 国产精品av久久久久免费| 国产精品99久久99久久久不卡| 亚洲天堂av无毛| 国产亚洲av片在线观看秒播厂| 欧美少妇被猛烈插入视频| 黄色视频不卡| 欧美激情久久久久久爽电影 | 久久青草综合色| 91av网站免费观看| 日韩中文字幕欧美一区二区| 性少妇av在线| 国产欧美日韩一区二区三 | 高清视频免费观看一区二区| 人妻人人澡人人爽人人| 丝袜人妻中文字幕| 亚洲伊人色综图| 亚洲欧洲日产国产| 国产亚洲欧美在线一区二区| 亚洲国产精品成人久久小说| 久久香蕉激情| 无遮挡黄片免费观看| 国产精品一区二区在线不卡| 黑丝袜美女国产一区| 国产精品99久久99久久久不卡| 中文字幕人妻熟女乱码| 青春草视频在线免费观看| 亚洲欧美日韩高清在线视频 | 亚洲色图综合在线观看| 肉色欧美久久久久久久蜜桃| 性色av一级| 在线av久久热| 欧美黑人欧美精品刺激| 国产在视频线精品| 在线观看免费日韩欧美大片| 在线观看人妻少妇| 9色porny在线观看| 少妇裸体淫交视频免费看高清 | 精品免费久久久久久久清纯 | 国产精品1区2区在线观看. | 大香蕉久久网| 91精品国产国语对白视频| 午夜福利在线免费观看网站| 美国免费a级毛片| 在线看a的网站| 狂野欧美激情性bbbbbb| 91国产中文字幕| 悠悠久久av| 午夜老司机福利片| av天堂在线播放| 自拍欧美九色日韩亚洲蝌蚪91| 国产精品香港三级国产av潘金莲| 日日爽夜夜爽网站| 美女大奶头黄色视频| 老熟妇仑乱视频hdxx| 2018国产大陆天天弄谢| 黄色视频不卡| 777久久人妻少妇嫩草av网站| 欧美日韩一级在线毛片| 国产主播在线观看一区二区| 在线观看免费高清a一片| av超薄肉色丝袜交足视频| www.自偷自拍.com| 夫妻午夜视频| 成人亚洲精品一区在线观看| 亚洲五月色婷婷综合| 免费不卡黄色视频| 亚洲av美国av| 在线十欧美十亚洲十日本专区| 欧美人与性动交α欧美精品济南到| 久久国产精品男人的天堂亚洲| 看免费av毛片| 精品福利永久在线观看| 日韩欧美国产一区二区入口| 欧美大码av| 日韩欧美免费精品| 欧美亚洲日本最大视频资源| 熟女少妇亚洲综合色aaa.| 国产三级黄色录像| 亚洲精品第二区| 女人精品久久久久毛片| 欧美黑人欧美精品刺激| 成年人午夜在线观看视频| 女警被强在线播放| 欧美午夜高清在线| 又黄又粗又硬又大视频| 国产熟女午夜一区二区三区| h视频一区二区三区| 国产成人a∨麻豆精品| 这个男人来自地球电影免费观看| 午夜福利视频在线观看免费| 一级毛片女人18水好多| 老鸭窝网址在线观看| 老熟女久久久| 久久热在线av| 亚洲一码二码三码区别大吗| 亚洲专区中文字幕在线| 国产精品一区二区在线不卡| 精品免费久久久久久久清纯 | 亚洲三区欧美一区| 精品欧美一区二区三区在线| 五月开心婷婷网| 99热全是精品| 老司机午夜福利在线观看视频 | 永久免费av网站大全| 自线自在国产av| 青春草亚洲视频在线观看| 亚洲精品中文字幕一二三四区 | 老司机影院毛片| 妹子高潮喷水视频| 国产激情久久老熟女| 黑丝袜美女国产一区| 蜜桃国产av成人99| 欧美黄色淫秽网站| 日韩欧美一区二区三区在线观看 | 人成视频在线观看免费观看| 韩国高清视频一区二区三区| 在线av久久热| 国产一区二区激情短视频 | 国产成人av教育| 黄片小视频在线播放| 色婷婷久久久亚洲欧美| 亚洲国产av影院在线观看| 一区福利在线观看| 看免费av毛片| 肉色欧美久久久久久久蜜桃| 18禁裸乳无遮挡动漫免费视频| 一边摸一边做爽爽视频免费| 免费高清在线观看视频在线观看| 亚洲全国av大片| 亚洲国产av影院在线观看| 一个人免费看片子| 一级片'在线观看视频| 久久av网站| 丝袜美足系列| 亚洲国产欧美一区二区综合|