• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于異構(gòu)計算平臺的卷積神經(jīng)網(wǎng)絡(luò)加速器的設(shè)計?

    2024-01-29 02:23:46周賢中
    電子器件 2023年6期
    關(guān)鍵詞:延時消耗卷積

    王 帥,楊 帆,周賢中

    (廣東工業(yè)大學(xué)信息工程學(xué)院,廣東 廣州 510006)

    近年來深度學(xué)習(xí)發(fā)展迅速,并在圖像分類、目標(biāo)檢測、語義分割、語音識別等[1-4]領(lǐng)域取得成功。然而,深度學(xué)習(xí)的模型檢測精度在不斷提升的同時,對計算性能和內(nèi)存的要求也在不斷提升。當(dāng)前云端GPU 部署復(fù)雜的深度學(xué)習(xí)模型面臨高帶寬消耗、高延遲性、網(wǎng)絡(luò)可靠性不足、用戶數(shù)據(jù)隱私難以保證等問題,因此在嵌入式邊緣計算平臺上推理復(fù)雜的深度學(xué)習(xí)模型已經(jīng)成為當(dāng)前的研究熱點[5]。

    面對上述問題,部分學(xué)者從神經(jīng)網(wǎng)絡(luò)本身的結(jié)構(gòu)入手,優(yōu)化算法模型,降低模型的運算量,如Mobilenet[6]、ShuffleNet[7]、Xception[8]等輕量級網(wǎng)絡(luò)。還有部分學(xué)者使用數(shù)據(jù)位寬為2~16 位的精度來代替全精度的浮點數(shù)[9-10],進一步壓縮模型。以上研究的關(guān)注點是網(wǎng)絡(luò)模型本身的優(yōu)化,而在實際的網(wǎng)絡(luò)部署過程中,還需考慮硬件資源利用的合理性,系統(tǒng)的整體功耗以及數(shù)據(jù)傳輸吞吐率等問題。

    FPGA 具有可編程性、可重構(gòu)性、低延遲和低功耗等優(yōu)點。若使用FPGA 加速神經(jīng)網(wǎng)絡(luò)模型,可根據(jù)算法模型來設(shè)計硬件結(jié)構(gòu)[11]。Nguyen 等[12]為了避免頻繁訪問片外存儲數(shù)據(jù)所造成的過多延時,設(shè)計了一種高效的Tera-OPS 流架構(gòu)。這種架構(gòu)下,網(wǎng)絡(luò)中所有模塊的權(quán)重數(shù)據(jù)存儲在芯片上,以最大限度地減少片外數(shù)據(jù)傳輸,提高數(shù)據(jù)的復(fù)用次數(shù),這導(dǎo)致最后設(shè)計的系統(tǒng)對硬件資源要求較高。Yu 等[13]設(shè)計了一個參數(shù)化架構(gòu),建立資源消耗和系統(tǒng)時延模型,對加速器資源空間進行探索,以確定優(yōu)化系統(tǒng)延遲的設(shè)計點,同時滿足資源約束,但是網(wǎng)絡(luò)模型的量化,沒有動態(tài)分配小數(shù)位。Adiono 等[14]用通用矩陣乘法的方式來加速卷積模塊,該方法將基于滑動窗的卷積乘法形式轉(zhuǎn)換為基于二維矩陣卷積乘法的形式,提高了訪存的連續(xù)性和計算效率。Chen等[15]設(shè)計了數(shù)據(jù)流水化的結(jié)構(gòu),與文獻[12]的流水化設(shè)計區(qū)別在于它只將卷積層和池化層數(shù)據(jù)流在FPGA 片上進行流水化計算。

    針對上述研究現(xiàn)狀,本文以YOLO-FASTEST 輕量級的網(wǎng)絡(luò)結(jié)構(gòu)為模型,在ZYNQ7020 平臺上進行部署加速。主要工作如下:①對加速器的數(shù)據(jù)緩存單元與計算單元進行參數(shù)化設(shè)置。②調(diào)整卷積循環(huán)嵌套的次序,實現(xiàn)輸出特征圖復(fù)用,對Bottleneck 模塊實現(xiàn)多層的片上流水運算。③使用16 位定點量化以及層融合的方法,將網(wǎng)絡(luò)模型進一步壓縮,降低硬件資源消耗和推理時間。

    1 YOLO-FASTEST 算法模型

    YOLO-FASTEST 是YOLO 系列改進的輕量級目標(biāo)檢測網(wǎng)絡(luò)。網(wǎng)絡(luò)模型的設(shè)計思路借鑒了Mobilenet[6]的方法,引用了Bottlenecks 模塊對傳統(tǒng)卷積進行替代。同時使用SPP 模塊實現(xiàn)局部特征和全局特征的融合,豐富最終特征圖的表達能力,網(wǎng)絡(luò)模型的大小為3.5 MB,算法模型的復(fù)雜度為2.2 Bflops(billion float operations),在PSCAL VOC 2017數(shù)據(jù)集的mAP(Mean Average Precision)為69.43%。

    YOLO-FASTEST 模型如圖1 所示,由主干網(wǎng)絡(luò)(backbone)和特征金字塔網(wǎng)絡(luò)(Feature Pyramid)組成。Bottlenecks 由3 個卷積層組成,當(dāng)輸入特征圖與輸出特征的尺寸相等時帶有一個shortcut 層,為Res-Bottlenecks。SPP 模塊是由3 個尺寸為3×3、5×5 以及9×9 的最大池化層組成。模型共由84 個卷積層、3 個最大池化層、1 個上采樣層、18 個shortcut 層、2 個YOLO 層以及5 個路由層組成。最終輸出特征圖分辨率大小有13×13 和26×26 兩種,分別負責(zé)大目標(biāo)和小目標(biāo)的檢測。

    圖1 YOLO-FSATEST 網(wǎng)絡(luò)結(jié)構(gòu)

    2 系統(tǒng)設(shè)計

    系統(tǒng)的整體架構(gòu)如圖2 所示,由PL 端FPGA 搭建的加速器與PS 端CPU 構(gòu)成。PL 端加速器的架構(gòu)以單指令多數(shù)據(jù)流的形式,由控制器、計算單元和數(shù)據(jù)緩存單元三部分組成。

    當(dāng)需要計算任務(wù)時,PS 端通過AXI-lite 將任務(wù)指令傳輸至PL 端的控制器中進行解析并以參數(shù)的形式傳輸至計算單元和數(shù)據(jù)緩沖單元。計算單元和數(shù)據(jù)緩沖單元分批次通過AXI 總線從外部存儲器中讀取數(shù)據(jù)、計算加速以及寫回數(shù)據(jù)。

    Bottlenecks 模塊在PL 端上多層流水加速,最大池化層、上采樣層、shortcut 層使用PL 端單層流水加速。路由層引用前面層的特征圖,不涉及計算,通過PS 端的調(diào)度來完成。YOLO 層涉及復(fù)雜的指數(shù)計算以及sigmod 激活函數(shù),使用PL 端計算將耗費大量資源,因此將YOLO 層的運算放入PS 端內(nèi)。

    PL 端內(nèi)計算單元的計算能力以及數(shù)據(jù)緩存單元的數(shù)據(jù)吞吐量受FPGA 內(nèi)部的資源約束,需要設(shè)計合理的優(yōu)化方案,在有限的資源下,構(gòu)建性能良好的加速器。

    2.1 數(shù)據(jù)緩存單元

    數(shù)據(jù)緩存單元的設(shè)計如圖3 所示,單元中包含行緩存、輸入數(shù)據(jù)緩存、輸出數(shù)據(jù)緩存。數(shù)據(jù)在PL端內(nèi)傳輸使用雙緩存乒乓傳輸,每個緩存區(qū)在循環(huán)的周期內(nèi)交替執(zhí)行兩項指令:1、存儲上一個緩存或外部存儲傳來的數(shù)據(jù)。2、將存儲的數(shù)據(jù)傳輸?shù)较聜€緩存或外部存儲。例如當(dāng)一個周期內(nèi)行緩存1 執(zhí)行指令1 時,此時行緩存2 則執(zhí)行指令2。同理,輸入緩存1 執(zhí)行指令1 時,此時輸入緩存2 則執(zhí)行指令2。這種數(shù)據(jù)傳輸模式以空間換時間,用數(shù)據(jù)傳輸?shù)臅r間來掩蓋計算時間。

    PL 端的片內(nèi)BRAM 資源無法容下整個特征圖的數(shù)據(jù),采取對輸入特征圖進行切割分塊送入片上緩存進行運算,權(quán)重根據(jù)輸入特征圖做對應(yīng)的分割。設(shè)置Si、So、Sr、Sc 四個切割參數(shù)分別對特征圖的輸入通道、輸出通道、輸出行數(shù)、輸出列數(shù)進行切割。由上述切割參數(shù)得到的PL 端數(shù)據(jù)緩存設(shè)置及BRAM 資源消耗,如表1 所示。

    表1 PL 端數(shù)據(jù)緩存配置以及BRAM 資源消耗

    數(shù)據(jù)緩存配置中的S為步距,K為卷積核的寬,Nin為PL 端輸入接口的數(shù)量,Nout為PL 端輸出接口的數(shù)量。中間特征圖緩存用來存儲Bottlenecks 內(nèi)DW(Depthwise Convolution)層的輸入特征圖以及shortcut 層另一個輸入特征圖。

    CBRAM為單個BRAM 的存儲容量18 k,bitwidth為數(shù)據(jù)位寬。以上緩存均乘以2 表示使用雙緩存。權(quán)重緩存的數(shù)據(jù)量較少,因此使用LUT 存儲,不消耗BRAM 資源。表1 中所有緩存消耗BRAM 總和應(yīng)小于等于片上BRAM 總量。

    給定以上數(shù)據(jù)緩存配置,PL 端時鐘頻率f,使用雙緩存乒乓傳輸,從片外讀取數(shù)據(jù)到輸入緩存需循環(huán)((Sr-1)×S+K+1)×次,從輸出緩存到片外存儲需循環(huán)(次,輸入輸出緩存延時表達式如下:

    設(shè)某層需使用PL 端循環(huán)計算N次,計算單元的時延設(shè)為Tcom,雙緩存乒乓傳輸下PL 端單層運算的總時延為:

    2.2 計算單元

    計算單元內(nèi)部根據(jù)層類別劃分,構(gòu)建類別不同的計算電路,利用時分復(fù)用的思想,在每個時鐘周期不間斷地計算來自數(shù)據(jù)緩存單元傳輸?shù)臄?shù)據(jù)。

    卷積計算單元如圖4 所示,由乘法器陣列和累加器構(gòu)成。對輸入通道和輸出通道的維度進行并行乘法計算,不同輸入通道上的同一坐標(biāo)像素值與權(quán)重進行乘積,經(jīng)累加器后將部分和暫存至寄存器中,等待與下一計算周期的部分和相加。直至權(quán)重滑動窗內(nèi)的值都乘完后,將寄存器內(nèi)的值通過多個輸出通道維度保存至輸出緩存中。

    圖4 卷積計算單元

    在實際評估中,需要考慮計算并行度與資源約束之間的關(guān)系,DSP48e1 是FPGA 內(nèi)部的專用硬件資源,用DSP48e1 構(gòu)建乘法器陣列應(yīng)滿足式(4)的要求,其中NMul是乘法器的數(shù)量,Pi和Po分別表示輸入通道和輸出通道計算并行度參數(shù),NDSP表示一個乘法器消耗的DSP48e1 的資源,與數(shù)據(jù)位寬bitwidth 有關(guān)。

    給定時鐘頻率f、計算并行度參數(shù)Pi和Po以及片上數(shù)據(jù)緩存配置,單次卷積計算單元的處理時延Tconv為:

    其他模塊的計算單元如圖5 所示,圖5(a)所示是最大池化層計算單元,將用于輸出的寄存器賦最小初始值,每個循環(huán)周期與輸入的寄存器進行比較,將最大值保存至輸出寄存器,當(dāng)滑動窗內(nèi)的值都比較完后,輸出寄存器內(nèi)的值保存至輸出緩存中。圖5(b)所示是上采樣層,上采樣層是將特征圖的長和寬擴展,上采樣單元使用寄存器取出輸入緩存的值暫存后,根據(jù)擴展的比例大小循環(huán)存入輸出緩存中。圖5(c)所示為shortcut 層,將來自兩個不同層的特征圖進行相加。

    圖5 其他模塊計算單元

    這三類模塊由于輸入輸出通道的維度相等,計算單元的并行度Pi=Po。給定時鐘頻率f,三類模塊處理時延Tmax、Tshortcut、Tupsample為:

    3 優(yōu)化方法

    3.1 卷積層輸出特征圖復(fù)用

    PL 端的卷積運算由四層循環(huán)嵌套組成。傳統(tǒng)的權(quán)重窗口復(fù)用模式,將輸出特征圖的行和列的循環(huán)放入最內(nèi)層,每輪循環(huán)復(fù)用權(quán)重數(shù)據(jù),優(yōu)先計算出完整的輸出特征圖,然后對輸出通道進行循環(huán)。這種方法適用于PL 端對單個層的計算加速。

    對于PL 端上連續(xù)多層流水運算,若使用權(quán)重復(fù)用的方法,優(yōu)先計算出完整的輸出特征圖,會造成較大的延時。調(diào)整循環(huán)嵌套順序,每次只計算出部分輸出特征圖就傳遞給下一層,無需等待完整的輸出特征圖。如圖6 所示,循環(huán)嵌套由內(nèi)到外按照LOOP1 至LOOP4 的順序分別對輸入特征圖通道、輸出特征圖的通道、輸出特征圖行和列進行計算。每次循環(huán)的部分和暫存至輸出緩存內(nèi),待下一輪循環(huán)的時候再復(fù)用。當(dāng)LOOP1 循環(huán)結(jié)束后,所有部分和累加后的最終結(jié)果從輸出緩存寫回至片外存儲或者傳遞至下一層。每層的循環(huán)間隔等于設(shè)置的4 個切割參數(shù)Si、So、Sc 和Sr。

    圖6 輸出特征圖復(fù)用

    使用輸出特征圖復(fù)用模式,設(shè)In 為輸入特征圖通道數(shù),Out 為輸出特征圖通道數(shù),則「In/Si?個循環(huán)周期后,即可將輸出緩存內(nèi)的數(shù)據(jù)傳至下一層的計算單元中。

    3.2 PL 端多層流水

    PL 端連續(xù)多層流水相比于單層流水,可減少PL 端與外部存儲器數(shù)據(jù)交互的次數(shù),網(wǎng)絡(luò)結(jié)構(gòu)中的Bottleneck 由三層卷積組成,且結(jié)構(gòu)固定,適合于整個模塊放入FPGA 片上緩存進行多層流水計算,模塊結(jié)構(gòu)如圖7 所示。輸入特征圖緩存首先經(jīng)過第一層PW(pointwise)卷積,卷積結(jié)果存儲在中間緩存內(nèi),中間緩存經(jīng)過第二層DW(depthwise)卷積后,將結(jié)果覆蓋至輸入特征圖緩存,最后再經(jīng)過第三層PW(pointwise)卷積后,將計算結(jié)果存入輸出緩存內(nèi)。DW 卷積的卷積核無輸入通道維度,卷積單元只對輸出通道進行并行度為Po的并行運算。

    使用輸出特征圖復(fù)用的模式,給定時鐘頻率f,第一層PW1 輸入輸出特征通道為In1 和Out1,使用雙緩存乒乓傳輸,輸入緩存延時Tinput與計算延時Tconv1重疊「In1/Si?次,取二者最大值。PW1 的延時表達式TPW1如下:

    PW1 層的計算結(jié)果送入DW 層的進行運算,DW 計算單元延時Tconv2,DW 層的延時表達式TDW如下:

    DW 層計算完后,緊接著進行PW2 層的計算。In2、Out2 為PW2 層的輸入通道數(shù)和輸出通道數(shù),PW2 層「In2/Si?次的循環(huán)后,將結(jié)果通過輸出緩存寫回至外部存儲中,PW2 層的延時表達式TPW2如下:

    使用雙緩沖乒乓傳輸后,輸出緩存延時Tout與PW2 層的延時TPW2重疊(「Out2/So?-1)次,取二者最大值。Bottleneck 輸出部分特征圖的延時TBneck的表達式如下:

    3.3 模型量化

    模型的量化是指權(quán)重、偏置、特征圖的數(shù)據(jù)由32 位浮點數(shù),映射為16 位、8 位等低位寬數(shù)。使用低位寬數(shù)據(jù)在PL 端上進行存儲和計算可以節(jié)約BRAM 和DSP 的資源,但模型的精度也有所下降。

    本文使用一種逐層定點16 位量化的方法[10],16 位的定點數(shù)中使用1 位符號位,Q位小數(shù)位,剩下位表示整數(shù)位。量化過程中浮點數(shù)xfloat與定點數(shù)xfixed之間相互映射的關(guān)系式如下:

    L表示定點數(shù)位寬,式(13)將浮點數(shù)的小數(shù)位在定點數(shù)中使用Q位表示,Q取值越大,定點數(shù)的精度就越高。式(14)將定點數(shù)還原成浮點數(shù)。模型每層根據(jù)參數(shù)的取值范圍的不同,用不同的Q值來量化該層。

    對84 層卷積的權(quán)重使用定點8 bit 和16 bit 的量化方法,利用式(15)計算總誤差和平均每層的誤差,根據(jù)表2 結(jié)果顯示,本文將使用16 bit 的量化方案。

    表2 定點量化權(quán)重誤差

    3.4 卷積層與批量歸一化層融合

    批量歸一化層(Batch Normalization)能提高網(wǎng)絡(luò)的訓(xùn)練速度,在模型推理階段BN 層的計算固定,可以將其融合進卷積運算之中,加速推理時間,節(jié)約硬件資源。卷積層的計算式(16)和BN 層的計算式(17)如下:

    式(16)和式(17)中X與Y都表示輸入特征圖和輸出特征圖,式(16)中W和B表示卷積層的權(quán)重和偏置。式(17)中γ為尺度參數(shù),β為偏置參數(shù),μ為輸入樣本的均值,δ為輸入樣本的標(biāo)準(zhǔn)差,這四個參數(shù)是在訓(xùn)練后已學(xué)習(xí)到的。ε通常設(shè)定為一個極小的值(如0.000 001),以防止分母為0 的情況。卷積層與BN 層的融合如式(18)所示:

    化簡:

    融合后的新權(quán)重值Wmerged=,新偏置,預(yù)先計算出新的權(quán)重值和新的偏置,在FPGA 中直接進行融合后卷積運算,提高推理速度。

    4 實驗結(jié)果及評估

    系統(tǒng)開發(fā)平臺使用Xilinx 的Vivado 設(shè)計套件,使用高層次綜合工具Vivado HLS 2019.1 設(shè)計YOLO-FASTEST 加速器IP 核,然后將設(shè)計好的IP核與ARM9 以及片外DDR3 在Vivado 2019.1 上進行綜合、布局布線。最后,使用Vivado SDK 2019.1對ARM CPU 進行開發(fā)。

    PL 端內(nèi)的硬件資源包含630 KB 的BRAM、220個DSP48E、53 200 個LUT、106 400 個FF。PS 端主要使用的是雙核ARM Cortex-A9 硬核處理器和一個存儲大小為512 MB 的DRAM。特征圖和權(quán)重數(shù)據(jù)均存儲在片外DRAM 中的。在PL 端內(nèi)的AXI_DMA IP 核為四通道的AXI_HP 存儲映射接口和AXI-Stream 接口之間提供高帶寬的直接存儲訪問。PS 端發(fā)出的控制指令則由AXI_GP 接口以及PL 端內(nèi)部的AXI interconnect IP 核進行傳輸。

    4.1 資源消耗與時延評估

    在雙緩存流水機制下,數(shù)據(jù)緩存單元中切割因子設(shè)置為Si =12、So =12、Sr =26、Sc =26,輸入輸出接口Nin=Nout=4,步距S=2,卷積核尺寸K=3,數(shù)據(jù)位寬bitwidth 為16 位定點數(shù)。以上參數(shù)確定后結(jié)合表1,預(yù)估需消耗184 個BRAM。

    Bottelneck 模塊內(nèi)有PW 卷積和DW 卷積,需設(shè)置不同的卷積計算單元。PW 卷積計算單元的并行度參數(shù)Pi=Po=12,DW 卷積計算單元的并行度參數(shù)Po=12。FPGA 內(nèi)部兩個16 位數(shù)的乘法運算消耗NDSP=1,依據(jù)式(4),PW 和DW 卷積預(yù)估需消耗共156 個DSP48e1。

    Vivado 系統(tǒng)綜合后消耗的實際資源如表3 所示,實際消耗BRAM 比預(yù)估多消耗19 個,可能用于PL 端輸入輸出接口緩存。實際消耗的DSP48e1 比預(yù)估多消耗16 個,可能用于其他計算單元的消耗。

    表3 PL 端資源消耗

    給定數(shù)據(jù)緩存單元的配置以及優(yōu)化方法,PL 端的時鐘頻率為150 MHz,根據(jù)各模塊延時表達式(3)和式(12),展示部分模塊時延預(yù)估,選擇圖1 中Id =3 的Bottleneck 和shortcut 模塊、SPP 中三個Max pooling 以及Upsample,如表4 所示,實際時延與預(yù)估時延的誤差可能來自各模塊的初始化延時以及BRAM 中數(shù)據(jù)讀取和存儲的延時。

    表4 PL 端加速器部分模塊時延 單位:ms

    4.2 不同平臺性能對比

    將本文在不同的平臺對同一目標(biāo)檢測網(wǎng)絡(luò)YOLO-FASTEST 進行推理,對功耗、檢測精度、計算性能、能耗比和單幀延時進行評估。在服務(wù)器端的CPU(I5-8300H)以及GPU(GTX1050ti) 上使用Darknet 框架進行模型推理,數(shù)據(jù)類型為浮點數(shù)。在嵌入式端分為僅ARM-A9 推理以及ARM-A9+FPGA聯(lián)合推理,數(shù)據(jù)類型為16 位定點數(shù)。

    結(jié)果如表5 所示,檢測精度方面,在PSCAL VOC 2017 的數(shù)據(jù)集上,嵌入式端數(shù)據(jù)量化后的檢測精度相比服務(wù)器端的檢測精度僅降低1.3%。在性能表現(xiàn)方面,嵌入式端的功耗要遠低于服務(wù)器端,但是僅ARM9 推理模型的單幀延時較高,無法滿足目標(biāo)檢測實時性的需要。本文設(shè)計的ARM-A9+FPGA的推理框架,能耗比達到5.27 GFLOPS/W,約為嵌入式端ARM-A9 的48 倍,服務(wù)器端CPU 的55 倍,GPU 的20 倍。單幀延時為163 ms,滿足目標(biāo)檢測的實時性。

    表5 不同平臺的參數(shù)對比

    將本文的設(shè)計與前人的工作進行對比,如表6 所示,文獻[12]提出的體系結(jié)構(gòu)側(cè)重于最大限度地提高系統(tǒng)的吞吐量,因此,網(wǎng)絡(luò)的每一層都映射到一個專用的硬件塊。特征圖、權(quán)重、偏置都存儲在片上緩存中,以盡量減少片外的數(shù)據(jù)傳輸延時,取得了極高計算性能。但其對片上存儲資源的要求較高且可重構(gòu)性較差。文獻[14]使用了通用矩陣乘法來加速卷積層,需將輸入特征圖轉(zhuǎn)換為通用矩陣的形式,此過程需消耗較多的BRAM 與DSP 資源。文獻[15]使用層間流水的方式,內(nèi)部硬件控制器使卷積層的數(shù)據(jù)流直接與池化層進行連接,可降低數(shù)據(jù)與片外存儲傳輸?shù)拇螖?shù)。這種方法的卷積計算使用的是滑動窗口的方式,且僅適合卷積層后緊跟池化層的情況。

    表6 與文獻設(shè)計的系統(tǒng)對比

    5 總結(jié)

    本文提出一種將目標(biāo)檢測網(wǎng)絡(luò)YOLO-FASTEST在低成本的異構(gòu)計算平臺上運行推理的方法。針對網(wǎng)絡(luò)結(jié)構(gòu)中的Bottleneck 模塊,本文使用特征圖復(fù)用的運算模式,降低多層片上流水延時。同時本文建立數(shù)據(jù)單元和計算單元與PL 端的資源約束關(guān)系式,使設(shè)計方案滿足低成本計算平臺的資源約束。設(shè)計的系統(tǒng)根據(jù)參數(shù)調(diào)節(jié)可移植至任意資源的FPGA 計算平臺。未來的改進工作將集中在算法加速方面,例如使用Winograd 快速矩陣乘法對3×3 大小的卷積層進行加速。

    猜你喜歡
    延時消耗卷積
    如此消耗卡路里
    意林(2023年7期)2023-06-13 14:18:52
    玉鋼燒結(jié)降低固體燃料消耗實踐
    昆鋼科技(2022年4期)2022-12-30 11:23:46
    基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
    降低鋼鐵料消耗的生產(chǎn)實踐
    昆鋼科技(2021年6期)2021-03-09 06:10:18
    基于級聯(lián)步進延時的順序等效采樣方法及實現(xiàn)
    從濾波器理解卷積
    電子制作(2019年11期)2019-07-04 00:34:38
    我們消耗很多能源
    基于傅里葉域卷積表示的目標(biāo)跟蹤算法
    Two-dimensional Eulerian-Lagrangian Modeling of Shocks on an Electronic Package Embedded in a Projectile with Ultra-high Acceleration
    一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識別方法
    制服诱惑二区| 精品视频人人做人人爽| a级毛片黄视频| 欧美最黄视频在线播放免费 | 亚洲一区中文字幕在线| 国产精品电影一区二区三区 | 国产精品亚洲一级av第二区| 免费一级毛片在线播放高清视频 | 久久人人97超碰香蕉20202| 日韩免费高清中文字幕av| 男男h啪啪无遮挡| 国产aⅴ精品一区二区三区波| 国产成人精品久久二区二区91| 亚洲国产欧美网| 成熟少妇高潮喷水视频| 欧美人与性动交α欧美精品济南到| 午夜福利在线免费观看网站| 午夜免费观看网址| 国产亚洲精品第一综合不卡| a级毛片黄视频| 91精品国产国语对白视频| 欧洲精品卡2卡3卡4卡5卡区| 久久久久久亚洲精品国产蜜桃av| 亚洲熟妇中文字幕五十中出 | 亚洲全国av大片| 国产精品1区2区在线观看. | 中文亚洲av片在线观看爽 | 美女高潮喷水抽搐中文字幕| 91成人精品电影| 午夜视频精品福利| 在线观看66精品国产| 免费日韩欧美在线观看| 在线观看免费高清a一片| 国产高清国产精品国产三级| 91麻豆av在线| 99精品久久久久人妻精品| 亚洲精品自拍成人| 亚洲一码二码三码区别大吗| 成人免费观看视频高清| 精品视频人人做人人爽| 涩涩av久久男人的天堂| 美女视频免费永久观看网站| 不卡一级毛片| 国产精品免费视频内射| 国产1区2区3区精品| 黑人欧美特级aaaaaa片| xxxhd国产人妻xxx| 精品第一国产精品| 久久精品国产99精品国产亚洲性色 | 亚洲精品粉嫩美女一区| 婷婷精品国产亚洲av在线 | 免费女性裸体啪啪无遮挡网站| 亚洲第一青青草原| 日韩精品免费视频一区二区三区| 日韩免费av在线播放| 亚洲欧美日韩另类电影网站| 热99国产精品久久久久久7| 丝袜美足系列| 看免费av毛片| 最新美女视频免费是黄的| 亚洲成国产人片在线观看| 日本一区二区免费在线视频| 91国产中文字幕| 最近最新中文字幕大全免费视频| 欧美日本中文国产一区发布| 欧美老熟妇乱子伦牲交| 久久狼人影院| 乱人伦中国视频| 欧美亚洲日本最大视频资源| 亚洲欧美精品综合一区二区三区| 看片在线看免费视频| 我的亚洲天堂| svipshipincom国产片| 中文字幕色久视频| aaaaa片日本免费| 亚洲色图 男人天堂 中文字幕| 久久中文字幕人妻熟女| 国产一区二区三区综合在线观看| 国产高清激情床上av| 国产91精品成人一区二区三区| 亚洲欧美色中文字幕在线| 久久婷婷成人综合色麻豆| 国产精品99久久99久久久不卡| 日日爽夜夜爽网站| 搡老乐熟女国产| 法律面前人人平等表现在哪些方面| 亚洲免费av在线视频| 操出白浆在线播放| 久久九九热精品免费| 亚洲av欧美aⅴ国产| 少妇裸体淫交视频免费看高清 | 一级作爱视频免费观看| 亚洲成人国产一区在线观看| 一级a爱片免费观看的视频| 亚洲第一青青草原| 1024香蕉在线观看| 日韩 欧美 亚洲 中文字幕| 十八禁高潮呻吟视频| 亚洲全国av大片| 不卡一级毛片| 国产精品久久久久久精品古装| 欧美国产精品va在线观看不卡| 啦啦啦在线免费观看视频4| 成人18禁高潮啪啪吃奶动态图| 可以免费在线观看a视频的电影网站| 69精品国产乱码久久久| 在线观看午夜福利视频| 免费在线观看黄色视频的| 国产成人啪精品午夜网站| 高潮久久久久久久久久久不卡| 久久久久久久久免费视频了| √禁漫天堂资源中文www| 久久久久国产一级毛片高清牌| 黄色片一级片一级黄色片| 高清毛片免费观看视频网站 | 亚洲国产毛片av蜜桃av| 精品人妻1区二区| 韩国精品一区二区三区| 一进一出抽搐gif免费好疼 | 成人永久免费在线观看视频| 丁香六月欧美| 国产成人av激情在线播放| 一级毛片高清免费大全| 欧美精品av麻豆av| 成人影院久久| 国产精品欧美亚洲77777| 一级毛片女人18水好多| 国产在线精品亚洲第一网站| 国内久久婷婷六月综合欲色啪| 成人国语在线视频| 男女高潮啪啪啪动态图| 人妻丰满熟妇av一区二区三区 | 看黄色毛片网站| av一本久久久久| 欧美乱码精品一区二区三区| 亚洲精品av麻豆狂野| 欧美最黄视频在线播放免费 | 午夜福利一区二区在线看| 午夜福利视频在线观看免费| 国产亚洲精品久久久久久毛片 | 天天影视国产精品| 亚洲午夜精品一区,二区,三区| 香蕉久久夜色| 热re99久久精品国产66热6| 在线观看66精品国产| 又黄又爽又免费观看的视频| 老司机亚洲免费影院| 中文字幕精品免费在线观看视频| 一区二区三区国产精品乱码| 亚洲 欧美一区二区三区| 一级毛片精品| av国产精品久久久久影院| 黄色a级毛片大全视频| 91老司机精品| 日日摸夜夜添夜夜添小说| 日日爽夜夜爽网站| 九色亚洲精品在线播放| 欧美精品亚洲一区二区| 亚洲欧美精品综合一区二区三区| 热99国产精品久久久久久7| 天天躁日日躁夜夜躁夜夜| 亚洲欧美日韩另类电影网站| av线在线观看网站| 亚洲av美国av| 男女床上黄色一级片免费看| 91字幕亚洲| 国产成人欧美| 男女午夜视频在线观看| 日韩欧美三级三区| 国产黄色免费在线视频| 多毛熟女@视频| 精品国内亚洲2022精品成人 | 免费在线观看影片大全网站| 国产精品影院久久| 精品一品国产午夜福利视频| 人妻一区二区av| 夜夜爽天天搞| 欧美一级毛片孕妇| av一本久久久久| 国产亚洲欧美在线一区二区| 丰满的人妻完整版| 满18在线观看网站| 又大又爽又粗| 一级作爱视频免费观看| 欧美大码av| 国产精品国产高清国产av | 91成年电影在线观看| 亚洲一码二码三码区别大吗| 最新的欧美精品一区二区| 亚洲五月婷婷丁香| 成人黄色视频免费在线看| 国产97色在线日韩免费| 成人18禁高潮啪啪吃奶动态图| 窝窝影院91人妻| 亚洲专区字幕在线| 好男人电影高清在线观看| 久久精品国产a三级三级三级| videos熟女内射| 国产男靠女视频免费网站| 日本五十路高清| 欧美在线黄色| 亚洲第一青青草原| 叶爱在线成人免费视频播放| 亚洲一码二码三码区别大吗| 欧美日韩一级在线毛片| 国产单亲对白刺激| 真人做人爱边吃奶动态| 日韩免费高清中文字幕av| 老熟妇乱子伦视频在线观看| 成人特级黄色片久久久久久久| 日本黄色视频三级网站网址 | a级毛片在线看网站| 桃红色精品国产亚洲av| 午夜老司机福利片| 亚洲精品国产一区二区精华液| 免费一级毛片在线播放高清视频 | 欧美黄色片欧美黄色片| 久久中文字幕人妻熟女| 亚洲国产欧美一区二区综合| 成人手机av| 国产成人精品久久二区二区91| 性色av乱码一区二区三区2| 久久精品国产亚洲av高清一级| 国产精品自产拍在线观看55亚洲 | 伦理电影免费视频| 成人18禁高潮啪啪吃奶动态图| 男女高潮啪啪啪动态图| 亚洲欧美精品综合一区二区三区| 精品视频人人做人人爽| 一边摸一边抽搐一进一小说 | 国产精品乱码一区二三区的特点 | 99国产精品99久久久久| 天天躁狠狠躁夜夜躁狠狠躁| 国产av精品麻豆| 中文欧美无线码| 日本一区二区免费在线视频| √禁漫天堂资源中文www| 国产精品乱码一区二三区的特点 | 最新的欧美精品一区二区| 亚洲色图 男人天堂 中文字幕| 99精品久久久久人妻精品| 免费在线观看亚洲国产| 欧美黄色淫秽网站| 色尼玛亚洲综合影院| 中文字幕av电影在线播放| 激情视频va一区二区三区| 精品电影一区二区在线| 国产又爽黄色视频| 欧美黄色片欧美黄色片| 成人亚洲精品一区在线观看| 亚洲aⅴ乱码一区二区在线播放 | 一区二区三区激情视频| 1024香蕉在线观看| 成人黄色视频免费在线看| aaaaa片日本免费| 十八禁高潮呻吟视频| 亚洲av成人av| av福利片在线| 亚洲欧美一区二区三区久久| 精品视频人人做人人爽| 超色免费av| 91精品国产国语对白视频| 在线视频色国产色| 叶爱在线成人免费视频播放| 国产激情久久老熟女| 一二三四在线观看免费中文在| 国产一区在线观看成人免费| 国产激情欧美一区二区| 久久人妻av系列| 国产1区2区3区精品| 国产精品久久久久成人av| 国产精品98久久久久久宅男小说| 亚洲五月色婷婷综合| 国产在线一区二区三区精| 两个人免费观看高清视频| 午夜福利免费观看在线| 最近最新免费中文字幕在线| 无人区码免费观看不卡| 欧美国产精品一级二级三级| 国产乱人伦免费视频| 亚洲欧美精品综合一区二区三区| 999精品在线视频| 成年动漫av网址| av网站免费在线观看视频| 亚洲国产中文字幕在线视频| 首页视频小说图片口味搜索| 一级a爱视频在线免费观看| 黄片小视频在线播放| 日本a在线网址| 免费在线观看黄色视频的| 日韩欧美在线二视频 | 国产精品98久久久久久宅男小说| 超碰97精品在线观看| 亚洲 国产 在线| 国产欧美亚洲国产| 麻豆av在线久日| 大香蕉久久成人网| 在线av久久热| 亚洲精品久久午夜乱码| 超碰成人久久| 久久久久久久国产电影| 80岁老熟妇乱子伦牲交| 老司机影院毛片| 两性夫妻黄色片| 校园春色视频在线观看| 国产成人免费无遮挡视频| 麻豆成人av在线观看| 在线观看一区二区三区激情| 91精品三级在线观看| 99国产精品一区二区蜜桃av | 高清欧美精品videossex| 侵犯人妻中文字幕一二三四区| 丝袜在线中文字幕| 国产真人三级小视频在线观看| а√天堂www在线а√下载 | 巨乳人妻的诱惑在线观看| 制服诱惑二区| 亚洲专区字幕在线| 国产一卡二卡三卡精品| 精品一区二区三区四区五区乱码| 又黄又粗又硬又大视频| 久久亚洲精品不卡| 操出白浆在线播放| 91在线观看av| 久久精品国产清高在天天线| 中文欧美无线码| 好看av亚洲va欧美ⅴa在| 天天影视国产精品| 久久久国产成人免费| 老司机亚洲免费影院| 岛国毛片在线播放| 首页视频小说图片口味搜索| 成年版毛片免费区| 99精品欧美一区二区三区四区| 老司机午夜十八禁免费视频| 岛国在线观看网站| 十八禁网站免费在线| 亚洲免费av在线视频| 欧美国产精品va在线观看不卡| 妹子高潮喷水视频| 黄片小视频在线播放| 视频区图区小说| 看免费av毛片| 亚洲美女黄片视频| 中国美女看黄片| 成人影院久久| 三上悠亚av全集在线观看| 母亲3免费完整高清在线观看| 脱女人内裤的视频| 国产一区在线观看成人免费| 后天国语完整版免费观看| 看黄色毛片网站| 欧美午夜高清在线| 少妇的丰满在线观看| 欧美最黄视频在线播放免费 | 国产欧美日韩综合在线一区二区| 在线十欧美十亚洲十日本专区| 欧美黄色片欧美黄色片| 777米奇影视久久| 亚洲一区中文字幕在线| 天堂动漫精品| 极品人妻少妇av视频| 天堂俺去俺来也www色官网| 午夜亚洲福利在线播放| 高潮久久久久久久久久久不卡| 午夜免费成人在线视频| 免费女性裸体啪啪无遮挡网站| 熟女少妇亚洲综合色aaa.| 久久久久久免费高清国产稀缺| 99精品欧美一区二区三区四区| 两人在一起打扑克的视频| 老司机靠b影院| 亚洲av熟女| 黑人欧美特级aaaaaa片| 国产男靠女视频免费网站| 久久亚洲真实| 脱女人内裤的视频| av欧美777| 国产成人一区二区三区免费视频网站| 99精品在免费线老司机午夜| 亚洲国产精品sss在线观看 | 人人妻,人人澡人人爽秒播| 亚洲精品国产精品久久久不卡| 久久久久国内视频| 欧美精品av麻豆av| 国产在视频线精品| 在线视频色国产色| 久久精品91无色码中文字幕| 国产成人精品久久二区二区免费| 村上凉子中文字幕在线| 亚洲av电影在线进入| 一个人免费在线观看的高清视频| 久久亚洲真实| 国产精品一区二区免费欧美| 大型黄色视频在线免费观看| 99精国产麻豆久久婷婷| x7x7x7水蜜桃| 久久精品亚洲精品国产色婷小说| av中文乱码字幕在线| 精品国产一区二区三区久久久樱花| a级毛片在线看网站| 最新美女视频免费是黄的| 一区二区三区激情视频| 丁香欧美五月| 国产精品.久久久| 久久久久久亚洲精品国产蜜桃av| www日本在线高清视频| 大香蕉久久网| 亚洲人成伊人成综合网2020| 中文字幕精品免费在线观看视频| 国产一卡二卡三卡精品| 国产麻豆69| 色婷婷久久久亚洲欧美| 欧美黑人欧美精品刺激| av福利片在线| 91九色精品人成在线观看| 亚洲视频免费观看视频| 国产精品秋霞免费鲁丝片| 午夜91福利影院| 国产又色又爽无遮挡免费看| 制服诱惑二区| 香蕉久久夜色| 捣出白浆h1v1| 多毛熟女@视频| 国产亚洲精品第一综合不卡| 欧美乱妇无乱码| 成人永久免费在线观看视频| www.999成人在线观看| 大片电影免费在线观看免费| 欧美成人午夜精品| 亚洲精品中文字幕一二三四区| 国产精品一区二区在线不卡| 天天影视国产精品| 青草久久国产| 亚洲国产精品合色在线| 天堂√8在线中文| 欧美久久黑人一区二区| 久久精品国产清高在天天线| 黑人猛操日本美女一级片| 极品少妇高潮喷水抽搐| 国产色视频综合| 精品一区二区三区视频在线观看免费 | xxx96com| 精品人妻在线不人妻| 欧美丝袜亚洲另类 | 亚洲欧美色中文字幕在线| 丝袜美足系列| 欧美性长视频在线观看| 高清视频免费观看一区二区| 亚洲欧美激情综合另类| 成人特级黄色片久久久久久久| 亚洲av第一区精品v没综合| 高清在线国产一区| 亚洲国产精品sss在线观看 | 69av精品久久久久久| 亚洲成人手机| 国产精品二区激情视频| √禁漫天堂资源中文www| 国产男靠女视频免费网站| 日韩有码中文字幕| 亚洲精品中文字幕在线视频| 色精品久久人妻99蜜桃| 亚洲成人手机| 午夜福利乱码中文字幕| 久久久精品国产亚洲av高清涩受| 亚洲成人免费电影在线观看| 男女下面插进去视频免费观看| 一级毛片精品| 国产欧美日韩一区二区三| 精品无人区乱码1区二区| 变态另类成人亚洲欧美熟女 | av天堂久久9| 黑人巨大精品欧美一区二区蜜桃| 18禁美女被吸乳视频| 黄色怎么调成土黄色| 精品视频人人做人人爽| 欧美日韩福利视频一区二区| 超碰成人久久| 久久人妻福利社区极品人妻图片| 精品高清国产在线一区| 久久久久精品人妻al黑| 91大片在线观看| 国产av一区二区精品久久| 午夜久久久在线观看| 国产男靠女视频免费网站| 高清毛片免费观看视频网站 | 男人的好看免费观看在线视频 | 久久中文字幕一级| 中文字幕最新亚洲高清| 国产一区有黄有色的免费视频| 最新的欧美精品一区二区| 91九色精品人成在线观看| 欧美黄色片欧美黄色片| 国产单亲对白刺激| 999久久久国产精品视频| a级毛片在线看网站| 成人精品一区二区免费| 黄片小视频在线播放| 国产成人啪精品午夜网站| 亚洲全国av大片| 久久久久久久久久久久大奶| 一级毛片高清免费大全| a级片在线免费高清观看视频| 久久久国产成人免费| 美女国产高潮福利片在线看| 成人亚洲精品一区在线观看| 欧美久久黑人一区二区| 国产又色又爽无遮挡免费看| 久久久精品国产亚洲av高清涩受| 欧美日韩av久久| 亚洲av日韩精品久久久久久密| 欧美国产精品一级二级三级| 女人高潮潮喷娇喘18禁视频| 国产精品成人在线| 久久精品亚洲熟妇少妇任你| 国产午夜精品久久久久久| 欧美日韩亚洲国产一区二区在线观看 | 欧美成人午夜精品| 亚洲国产欧美一区二区综合| 老司机深夜福利视频在线观看| 国产精品.久久久| 美女福利国产在线| 成人亚洲精品一区在线观看| 黑人操中国人逼视频| 久久国产精品大桥未久av| 咕卡用的链子| 国产伦人伦偷精品视频| netflix在线观看网站| 亚洲性夜色夜夜综合| 日韩免费高清中文字幕av| 免费高清在线观看日韩| 午夜91福利影院| 俄罗斯特黄特色一大片| 中文字幕精品免费在线观看视频| 香蕉丝袜av| 手机成人av网站| 亚洲一码二码三码区别大吗| 亚洲国产精品合色在线| 啪啪无遮挡十八禁网站| 下体分泌物呈黄色| 中文字幕色久视频| 身体一侧抽搐| a在线观看视频网站| 亚洲成人免费电影在线观看| 最近最新中文字幕大全免费视频| 免费在线观看日本一区| 欧美激情 高清一区二区三区| 精品午夜福利视频在线观看一区| 午夜视频精品福利| 18禁黄网站禁片午夜丰满| 韩国精品一区二区三区| 热99re8久久精品国产| 嫩草影视91久久| 欧美丝袜亚洲另类 | 精品第一国产精品| a级片在线免费高清观看视频| 国产男女内射视频| 国产精品香港三级国产av潘金莲| 高清av免费在线| 国产精品香港三级国产av潘金莲| 热99re8久久精品国产| 嫩草影视91久久| 两人在一起打扑克的视频| 91成人精品电影| 国产区一区二久久| 国产精品久久久av美女十八| 中出人妻视频一区二区| 精品国产一区二区三区四区第35| 操美女的视频在线观看| 国产男靠女视频免费网站| 在线av久久热| 一级a爱片免费观看的视频| 自拍欧美九色日韩亚洲蝌蚪91| 欧美av亚洲av综合av国产av| 成熟少妇高潮喷水视频| 两个人免费观看高清视频| √禁漫天堂资源中文www| 日韩精品免费视频一区二区三区| 18禁裸乳无遮挡动漫免费视频| 99国产极品粉嫩在线观看| 国产单亲对白刺激| 搡老岳熟女国产| 国产亚洲欧美精品永久| 午夜福利欧美成人| 免费av中文字幕在线| 国产精品免费一区二区三区在线 | 色婷婷久久久亚洲欧美| 极品教师在线免费播放| 国产精品久久久久成人av| 男女免费视频国产| 一二三四在线观看免费中文在| 91精品三级在线观看| 亚洲综合色网址| 精品人妻在线不人妻| 午夜成年电影在线免费观看| 欧美亚洲日本最大视频资源| 国产欧美日韩综合在线一区二区| 亚洲欧美精品综合一区二区三区| av网站免费在线观看视频| 精品福利观看| 欧美亚洲 丝袜 人妻 在线| 亚洲精品国产区一区二| 国产精品美女特级片免费视频播放器 | 美国免费a级毛片| 精品国产乱码久久久久久男人| 亚洲成人手机| 日本a在线网址| 下体分泌物呈黄色| 十八禁人妻一区二区| 好男人电影高清在线观看| aaaaa片日本免费| 欧美在线黄色| 中文字幕最新亚洲高清| 欧美日本中文国产一区发布| 国产99久久九九免费精品|