• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于小型ZynqSoC硬件加速的改進TINYYOLO實時車輛檢測算法實現(xiàn)

    2019-08-01 01:35張雲(yún)軻劉丹
    計算機應用 2019年1期
    關鍵詞:權值卷積流水線

    張雲(yún)軻 劉丹

    摘 要:針對TINY YOLO車輛檢測算法計算量過大,且在小型嵌入式系統(tǒng)中難以達到實時檢測要求的問題。利用小型Zynq SoC系統(tǒng)的架構優(yōu)勢以及TINY YOLO的網(wǎng)絡權值中存在大量接近零的權值參數(shù)這一特點,提出硬件并行加速的改進算法,稱為濃縮小型深度網(wǎng)絡(Xerantic-TINY YOLO, X-TINY YOLO)車輛檢測算法。首先對TINY YOLO中網(wǎng)絡結構進行壓縮;其次采用高效多級流水線、流水線內(nèi)全并行的方式對卷積計算部分進行算法加速;最后提出與網(wǎng)絡結構相配合的數(shù)據(jù)切割和傳輸方案。實驗結果表明,X-TINY YOLO僅消耗50%的片內(nèi)硬件資源,可在相對于GPU和CPU性價比更高更適合嵌入式場景的Zynq SoC系統(tǒng)上實現(xiàn),且其檢測速度達到24幀/s,滿足車輛檢測的實時性要求。

    關鍵詞:車輛檢測;機器視覺;TINY YOLO;Zynq-7020;硬件加速

    中圖分類號: TP389.1; TP391.413

    文獻標志碼:A

    Abstract: TINY YOLO (TINY You Only Look Once) vehicle detection algorithm requires much amount of calculation which makes it difficult to achieve real-time detection in small embedded systems. Because plenty of zero values exist in a network weight matrix which makes the network a sparse structure, an improved version of TINY YOLO vehicle detection algorithm, called Xerantic-TINY YOLO (X-TINY YOLO), was proposed and accelerated in parallel way using architectural advantages of small Zynq SoC system. Original network structure of TINY YOLO was compressed and the operations of convolution steps were accelerated in parallel by using high efficient multistage pipeline. All multiply-add operations were concurrently executed within each stage of pipeline. By matching network structure, a method of data segmentation and transfer was also proposed. The experimental results show that, X-TINY YOLO only consumes 50% hardware resources on chip, and it can be implemented on small Zynq SoC systems which have higher performance-price ratio than GPU and CPU and is suitable for embedded implementation scenes. Its detection speed reaches 24 frames per second, which meets the requirement of real-time vehicle detection.

    Key words: vehicle detection; machine vision; TINY You Only Look Once (TINY YOLO); Zynq-7020; hardware acceleration

    0 引言

    實時車輛檢測算法主要分為三類:基于先驗知識的車輛檢測算法[1-2]、基于淺層機器的學習車輛檢測算法以及基于深度學習的車輛檢測算法[3]?;谙闰炛R的檢測算法是根據(jù)車身所帶有的線條、陰影或邊緣特征對前方車輛進行識別。文獻[4]通過對車輛尾部特定水平直線(如保險杠、后車窗下邊沿等)的檢測達到車輛檢測目的。該算法易將車身周邊環(huán)境中存在的類似直線誤判為車輛,且對處于轉彎狀態(tài)的車輛會出現(xiàn)檢測丟失現(xiàn)象。文獻[5]中提出對剎車燈進行檢測的方法實現(xiàn)車輛夜間檢測,效果較好但無法應用于外部光強較好的白天或地下停車場等環(huán)境。行駛中車輛周邊環(huán)境的多樣性常常會以噪聲形式干擾此類檢測方法準確率,故此類方法難以在環(huán)境變化劇烈的使用場景中適用?;跍\層機器學習的車輛檢測算法以先驗知識類算法中提取的車輛特征為基礎,結合機器學習算法實現(xiàn)車輛的檢測。文獻[6]中提出Haar-like與Online Boosting相結合的方式,使用大量特征集對網(wǎng)絡進行訓練使其能檢測車輛,與單純的先驗知識檢測相比該算法在各種環(huán)境中的魯棒性有了顯著提高。文獻[7]對Haar-like特征進行了優(yōu)化,提升了該特征對環(huán)境中光強變化的適應性。該類算法特點是檢測效率高、復雜度低,但依然嚴重依賴特征選取,使得其在復雜且變化的路況場景下重建模工程量大?;谏疃葘W習的車輛檢測算法多以卷積神經(jīng)網(wǎng)絡為基礎加以改進,文獻[8]中提出的Faster R-CNN(Faster Region proposal Convolutional Neural Network請補充Faster R-CNN的英文全稱)通過聚類方式對車輛尺寸進行分類,隨后使用高分辨率圖片作為網(wǎng)絡輸入,最后在KITTI數(shù)據(jù)集上獲得了較高的車輛檢測精度,但其卷積層數(shù)過多導致網(wǎng)絡計算復雜度過大而難以實現(xiàn)實時性檢測。在網(wǎng)絡模型的小型化方向上,F(xiàn)acebook的人工智能實驗室設計了更輕巧的模型YOLO(You Only Look Once)[9],其最快版本的TINY YOLO在GPU上的測試速度可以達到每秒200幀。各版本YOLO算法的出現(xiàn)為深度學習類的目標檢測算法在實際運用場景的實時性檢測提供了可能。

    深度學習算法的硬件加速方案主要有以下四種:圖形處理器(Graphic Processing Unit, GPU)、專用集成電路(Application-Specific Integrated Circuit, ASIC)、粒度可重構陣列和現(xiàn)場可編程門陣列(Field-Programmable Gate Array, FPGA)。

    利用GPU數(shù)千個計算核心并行計算的優(yōu)勢,文獻[10-12]中提出的GPU加速方案,相比CPU上實現(xiàn)的深度學習算法在運算速度和功耗方面均有較大提升,然而中低端GPU多核之間共享存儲(share memory)資源少難以完成算法移植,而高端GPU芯片昂貴的價格難以在短時間內(nèi)為工業(yè)級應用所接受。文獻[13]基于深度神經(jīng)網(wǎng)絡結構特點設計的由64塊ASIC芯片組成的超級加速器DaDianNao在加速性能方面是GPU的450.65倍,功耗僅為CPU的0.67%,性能達到極致;然而各版本神經(jīng)網(wǎng)絡的網(wǎng)絡結構間存在較大差異,而ASIC專用芯片的可變性較差,故其較適用于作為某些結構固定的網(wǎng)絡的專用加速器。文獻[14]基于單指令多數(shù)據(jù)流(Single Instruction Multiple Data, SIMD)架構,引入FPGA可編程邏輯電路,實現(xiàn)了可重構硬件的神經(jīng)網(wǎng)絡加速方案。其與文獻[15-16]中提出的基于FPGA架構的加速器均可提供多種神經(jīng)網(wǎng)絡的實現(xiàn)方案,然而其缺少核心處理器,在實現(xiàn)較復雜的分支任務繁多的算法上有一定難度。

    使用Zynq SoC架構對深度神經(jīng)網(wǎng)絡算法進行加速的研究還較少。Zynq SoC在架構方面結合了ARM(Acorn RISC Machine)嵌入式處理核心和FPGA可編程邏輯電路兩方面的優(yōu)勢,提供較強的流程控制的同時可實現(xiàn)多個高速并行的乘加運算,而卷積神經(jīng)網(wǎng)絡的主要計算量集中于卷積層中的矩陣乘加運算,故其非常適用于卷積神經(jīng)網(wǎng)絡的檢測算法加速,且該系列芯片在價格上相比FPGA和GPU均有較大優(yōu)勢。

    綜上所述,本文針對實際應用場景中車輛檢測算法對實時性要求高這一特點,選擇YOLO算法的快速版本TINY YOLO作為算法基礎,并對網(wǎng)絡作出裁剪優(yōu)化進一步降低算法復雜度;再選擇相比GPU等硬件平臺性價比更高的小型Zynq SoC平臺作為加速算法的硬件平臺;通過Zynq SoC平臺內(nèi)的數(shù)字信號處理(Digital Signal Processing, DSP)并行計算資源和流水線技術,最終在千元以內(nèi)的硬件平臺上實現(xiàn)車輛實時檢測算法。

    1.1 網(wǎng)絡結構壓縮

    TINY YOLO檢測算法是YOLO V2目標檢測算法的簡化網(wǎng)絡,相比原YOLO V2算法而言,其運算量減少,伴隨著精度的降低,但作為在系統(tǒng)內(nèi)部硬件資源極度有限的小型Zynq SoC中實現(xiàn)的嵌入式算法,TINY YOLO依然存在著網(wǎng)絡規(guī)模過大導致計算量過大的缺點,從而使得其在實際應用場景下檢測的實時性無法得到滿足,故算法中首先需考慮對TINY YOLO網(wǎng)絡進行裁剪。

    TINY YOLO網(wǎng)絡中包含三種傳遞結構:卷積層、全連接層和最大池化層。卷積層的計算過程如圖1所示。

    feature map是每一層的輸入特征矩陣,由圖1可見卷積運算中存在大量的矩陣乘加運算,所以耗時最多。又因為Zynq SoC系統(tǒng)中有可用于乘加運算加速的專用數(shù)字信號處理單元DSP48E硬IP核資源,可對乘加運算進行并行計算加速,故考慮利用FPGA(簡稱為PL端)資源對卷積層進行并行計算加速。最大池化層是滑動地取2×2網(wǎng)格中的最大值,可以緊接在卷積乘加運算之后而無需耗費更多的硬件資源。對于全連接層,雖然計算量較大,但在TINY YOLO的16層網(wǎng)絡結構中只有最后一層是全連接層,若移植至FPGA端(PL端)將占用較多資源且對速度提升不明顯,故選擇將全連接層直接放在ARM端(簡稱為PS端)串行運行。

    通過以上分析發(fā)現(xiàn),對TINY YOLO網(wǎng)絡進行移植時的主要計算量源于卷積層中的大量乘加運算,故考慮裁剪卷積層從而減少計算規(guī)模。通過觀察TINY YOLO網(wǎng)絡訓練后的卷積核中的權值發(fā)現(xiàn),該網(wǎng)絡第3到第9層卷積層中存在著大量接近0的權值。通過對比實驗發(fā)現(xiàn),這樣的網(wǎng)絡稀疏性會帶來少量的網(wǎng)絡性能提升,但伴隨著成倍的計算量的增加(表1)。故嘗試在性能不會有過大減小的情況下,在網(wǎng)絡訓練前對TINY YOLO第3到第9層卷積層的輸入卷積核個數(shù)進行裁剪,從而使得重新訓練后得到的新網(wǎng)絡(X-TINY YOLO)中接近于0的權值個數(shù)減少,最后得出縮小規(guī)模后的網(wǎng)絡權值用于嵌入式移植。

    裁剪后X-TINY YOLO網(wǎng)絡結構下新網(wǎng)絡權值的訓練方法是先用ImageNet數(shù)據(jù)集和MS COCO2007+2012數(shù)據(jù)集對網(wǎng)絡進行預訓練,待網(wǎng)絡參數(shù)穩(wěn)定后再用收集和標定的2000張圖片集(行駛車輛前方的路況圖片),對網(wǎng)絡后3層負責分類的網(wǎng)絡進行再訓練,從而進一步提升網(wǎng)絡對具體的車輛檢測任務數(shù)據(jù)的擬合效果。訓練后得出的X-TINY YOLO網(wǎng)絡與原TINY YOLO網(wǎng)絡的各卷積層輸入feature map的結構的對比如圖2。

    如圖2所示,在訓練時對上述層的輸入卷積核數(shù)量進行了控制,從而減少了對相應卷積層輸入的feature map通道個數(shù),其中第二卷積層的訓練所用卷積核個數(shù)由原來的32個減小為24個,之后每一個卷積層訓練所用卷積核個數(shù)減半。網(wǎng)絡理論總計算量如式(1):

    其中:w、h和in_c分別表示單層卷積層輸入feature map的寬、高和通道數(shù),k_sizek_size如何能有兩種含義,即是寬,又是高,是否少了一個變更,請明確表示輸入卷積核的寬和高k_size2 表示卷積核二維尺寸面積,out_c表示卷積核數(shù)量。

    訓練后的網(wǎng)絡性能及計算量對比統(tǒng)計如表1,其中mAP(mean Average Precision)為平均精度指標。

    TINY YOLO網(wǎng)絡中引入了Batch Normalization(BN)的操作來解決訓練中的梯度爆炸和收斂速度慢等問題,故在Zynq SoC平臺實現(xiàn)檢測網(wǎng)絡的前向傳播時,每一層的卷積運算之后還需要進行BN操作,其輸出output的具體公式如式(2)所示:

    其中:w為該層的權值矩陣,d為該層輸入的feature map矩陣,m為單張feature map均值,v為單張feature map方差,b為偏移向量(bias),s為縮放系數(shù)向量(scale)。若每一次的結果都進行這樣的運算,將在檢測環(huán)節(jié)耗費過多時間,而這些參數(shù)中,w、m、v、s、b通過網(wǎng)絡訓練后都成為已知參數(shù),即在網(wǎng)絡初始化時已知且不會再改變的數(shù)值,僅d需要用到上一層的計算結果。故對式(2)進行化簡得到式(3):

    按照式(3)在網(wǎng)絡初始化時提前對參數(shù)進行處理,之后網(wǎng)絡前向傳播時用新生成的和b替代原權值矩陣w和偏移b進行運算。通過這種方法,用網(wǎng)絡初始化時間增加的成本換取了實時檢測計算時間的縮減。

    1.2 數(shù)據(jù)分割算法

    由于X-TINY YOLO算法中存在大量卷積運算,即矩陣乘法運算(如圖1),若將大量乘加運算放置在Zynq SoC平臺的FPGA端(PL端)進行,就可利用多片數(shù)字信號處理單元——DSP48E內(nèi)核對多個乘加運算并行從而提升計算效率,但小型SoC平臺包含的DSP48E和塊隨機存儲單元(Block RAM, BRAM)的數(shù)量有限,遠遠小于X-TINY YOLO每一層的計算及存儲所需要的資源數(shù)量,例如圖2中第一層卷積層的輸入圖片尺寸是224×224×3,輸入權值規(guī)模是3×3×3×16,若一次性傳入PL端則共需要150960個BRAM存儲單元,之后進行224×224×16×3×3×3(共21676032)次乘加運算,而以Xilinx公司旗下Zynq-7020系列中的XC7Z020芯片為例,其PL端僅僅有4.9MB(最多可分為280片)BRAM存儲單元和220個DSP48E片上IP核,只可同時并行220個25×18位的乘加運算,遠遠小于該層卷積計算全并行所需資源。

    故考慮根據(jù)每一層的網(wǎng)絡結構,將單層卷積分解為多次進行,即將無法在PL端一次性完成的大矩陣乘法運算進行運算拆分后分多步完成。該方法首先需要對存儲于PS端的第三代雙倍數(shù)據(jù)率同步動態(tài)隨機存取存儲器DDR3 SDRAM(Double-Data-Rate Three Synchronous Dynamic Random Access Memory)中的單層網(wǎng)絡的權值矩陣和該層圖片像素矩陣(第二層后稱為feature map矩陣)進行拆分。拆分后的單個小矩陣尺寸由X-TINY YOLO網(wǎng)絡結構和PL端硬件資源允許的單次最大并行計算量共同決定。單層卷積中上述二矩陣未拆分前在PS端DDR3中的存儲示意圖如圖3~4所示。

    圖3和圖4中的(a)圖分別表示兩矩陣在PS端DDR3中的存儲方式,而圖(b)分別展示兩矩陣在X-TINY YOLO中的邏輯對照模型??梢钥闯?,單層卷積運算中權重矩陣需要傳入PL端的數(shù)據(jù)總量weights_trans計算如式(4):

    由式(3)知,還需要傳入偏移向量(bias),它只用保存在權值矩陣的最后一行并隨其一同傳輸即可,其傳輸大小為bias_trans計算如式(5):

    其中:in_c、w、h分別為輸入的feature map的通道數(shù)量、寬度和高度;out_c為輸出feature map的通道數(shù)量,也是輸入的權重矩陣中卷積核的個數(shù);k_size為卷積核尺寸,除最后一層卷積使用1×1卷積核之外,其他各層卷積核尺寸都是3×3。

    以下根據(jù)網(wǎng)絡結構核硬件平臺資源設計權值矩陣的分割方法,觀察式(4)發(fā)現(xiàn),k_size除第9層外始終是3,而in_c除第1,3層外,隨層數(shù)增加以16為基數(shù)成倍增加,weights_trans都有公約數(shù)3×3×16,即144。故決定對DDR3中權值矩陣(圖4(a))進行按列切割,切割后每列寬度為144或144的倍數(shù)(取決于硬件資源限制),單次傳入的分割后權值矩陣大?。╓eights_trans_once)為如式(7)所示:

    其中:m為Zynq SoC平臺的PL端允許的單次最大并行乘加運算個數(shù),n為雙端口BRAM存儲單元個數(shù),實際小型Zynq SoC平臺各系列芯片的n是略大于m的,m約為n的66%~90%,故m成為計算瓶頸。

    對應模型中的邏輯意義為:在本層所有卷積核的相同位置截斷,每次運算同時向PL端傳入out_c個卷積核在相同位置的144·m/144」個數(shù)據(jù),即截取該層所有卷積核的連續(xù)16·m/144」個通道的所有權值。其中的特殊情況為第1,3,9層,由于通道數(shù)小于16或k_size為1導致列數(shù)不足144。采取的措施是在初始化時,依然按單次傳入144×out_c個值,不足144按的列數(shù)在DDR3端存儲時先補0。例如,圖4中若DDR3端存儲的是第一層卷積層的權值矩陣,即16行3×3×3列的數(shù)據(jù),則在每一行末尾補144-3×3×3個0,使得每行的個數(shù)為144。

    feature map矩陣的切割方式需要與權值矩陣的切割方式相匹配以適應計算需要。在權值矩陣切割時選擇按列切割,即對in_c切割,而計算時需要傳入將會與切割后的權值矩陣作卷積運算的feature map對應部分,故對其in_c按行切割,在DDR3(圖5(a))中表現(xiàn)為按行切割,切割后每份的行數(shù)為144/k_size2·m/144」。單次傳入的分割后feature map矩陣大小(feature_map_trans_once)如式(8)所示:

    對應模型中的邏輯意義為一次性傳入多個大小為w×h的完整的通道數(shù)據(jù),但由于前三層的w,h過大導致整行數(shù)據(jù)無法一次性傳入,故需要對前三層按行切割后再按列切割。對于第1、2層,因為in_c很小不需要按行切割,只需對其矩陣按列切割。第3層需要同時按行和列切割,而之后的4~9層只需要按行切割,但按列切割操作會使得一次傳入的單通道數(shù)據(jù)不完整,而進行卷積運算時又需要用到feature map中一個單元及周邊的3×3個數(shù)據(jù),使得在對邊緣數(shù)據(jù)卷積時缺少w列數(shù)據(jù)(也缺少w行,但這部分是補零操作而非用到feature map矩陣中的數(shù)據(jù),將放在PL端補零)。故為滿足邊緣部分卷積對數(shù)據(jù)的要求,對于feature map中進行過按列切割的1,2,3層數(shù)據(jù)進行補傳操作:若是該列切割中傳入的第一塊數(shù)據(jù)或最后一塊數(shù)據(jù),則在執(zhí)行卷積操作時需要額外傳入w列;若是非首尾塊,則需額外傳入2×w列。具體切割方式的示意圖如圖5所示,圖中mul=m/144」。

    按照上述方式拆分后的兩個大矩陣被分割為存在計算匹配關系的若干小矩陣,之后成對傳入一個權值小矩陣和一個feature map小矩陣供PL端計算單元使用,單次計算完成后立即傳回PS端存儲,所有小矩陣乘加計算結束后,結果將按照X-TINY YOLO該層通道順序存儲于DDR3中,組成下一層卷積運算的feature map輸入。

    1.3 數(shù)據(jù)傳輸、在PL端的存儲和計算

    數(shù)據(jù)傳輸時采用加速一致性接口(AXI-Accelerator Coherency Port,AXI_ACP)結合分散—集中型直接內(nèi)存讀取模式(Scatter-Gather Direct Memory Access,DMA_SG)進行數(shù)據(jù)搬移,將切割后小矩陣組從PS端的DDR3中分多次搬運至PL端的BRAM中。DMA_SG方式適合傳輸數(shù)據(jù)量大于300B的連續(xù)或非連續(xù)數(shù)據(jù)塊的搬運,高效且靈活。高速一致性AXI_ACP接口使得PL端可直接讀取L1和L2兩級cache中緩存的PS端數(shù)據(jù),降低傳輸延遲。

    由于AXI_ACP口的位寬限制,分配4個8bit的AXI_ACP端口給權值矩陣的傳輸,保證在同一傳輸周期PL端可同時從PS端DDR3內(nèi)搬移4組char類型的權值矩陣數(shù)據(jù)到BRAM,并存入4個不同的BRAM中,直至單次權值小矩陣傳輸完成。單次小矩陣共需傳輸數(shù)據(jù)量計算公式如式(7),結合以上分析知,單次權值小矩陣傳輸消耗時鐘周期(weight_trans_clock)如式(9):

    分配1個8bit的AXI_ACP對feature map數(shù)據(jù)傳輸,單個feature map小矩陣共需傳輸數(shù)據(jù)量如式(8),單次feature map小矩陣傳輸消耗時鐘周期(weight_trans_clock)如式(10):

    但對于第一到第三層卷積,傳入計算的是非完整通道數(shù)據(jù)(如圖5),計算時還需要用到上一次硬件函數(shù)輸出的部分卷積運算結果,故分配4個8bit的AXI_ACP用于傳入上一個小矩陣運算后的部分結果。最后剩下的位寬留給生成的新feature map矩陣的傳回PS端使用最后剩下1個8bit位寬AXI_ACP用于在PL端單次計算得到的新feature map 矩陣傳回PS端使用此句不通順,請作相應調整,因為結果的傳輸過程是緊跟在計算完成之后放在計算流水線之內(nèi)的,每完成一次計算傳回一個結果,只會增加單級流水線的延遲,并不會增加流水線級數(shù),而當啟動間隔(Initiation Interval, II)為1且流水線級數(shù)遠遠大于單級延遲時,因此增加的少量額外時間可忽略。

    PL端的數(shù)據(jù)存儲使用BRAM存儲單元,Zynq SoC平臺允許對BRAM進行分割,每一個分割后的小BRAM都具有雙端口讀寫功能,故考慮傳入一對乘數(shù)(即一對feature map和權值數(shù)據(jù))存入分割后同一個BRAM單元,以保證可在同一時鐘周期內(nèi)同時讀寫多組數(shù)據(jù),從而極大提高了數(shù)據(jù)吞吐量。BRAM分割個數(shù)應取值為最大單次允許并行乘加個數(shù),并留出富余的2個BRAM供最大池化操作使用。

    計算時采用多級流水線、單級流水線內(nèi)全并行的方式。因為該流水線的每一級均是從不同的BRAM中取數(shù)據(jù)并使用不同的DSP48E運算單元計算(或相同DSP48E中不同級單元),故流水線不存在結構冒險和數(shù)據(jù)冒險,故可實現(xiàn)流水線II=1的高效流水線。單個卷積層乘加運算消耗總時鐘周期為:

    2 算法實現(xiàn)

    2.1 系統(tǒng)總體設計

    硬件結構如圖6所示,Zynq SoC平臺主要由ARM(簡稱PS端)和FPGA(簡稱PL端)兩部分構成,PL和PS端分別有各自的存儲單元BRAM和DDR3。

    PL端的并行攝像頭接口逐幀接收攝像頭傳入的圖像數(shù)據(jù)并傳輸給PS端的DDR3中存儲。PL端的多路并行計算單元由多片DSP48E IP核構成,用于并行地加速乘加運算。

    算法現(xiàn)實的物理平臺核心為Zynq-7020的XC7Z020芯片,其片內(nèi)只有220個DSP48E Slice,每片規(guī)格為18×25的乘法器。片內(nèi)有140片雙端口BRAM,每片存儲空間為36Kb,實際可分為280片18Kb存儲,其中每片系統(tǒng)預留2Kb不可用空間,故每片可用16Kb,即2KB空間。總可用空間為280×2KB,共可存儲280×2048個8bit數(shù)據(jù)。

    2.2 數(shù)據(jù)切割、存儲、傳輸和計算

    由第1章分析知,單次傳入計算的矩陣規(guī)模上限將受限于PL端硬件存儲資源(BRAM請補充BRAM的英文全稱。前面有全稱)和計算資源(DSP48E)數(shù)量。故需按照式(7)、(8)矩陣切割方法,對feature map矩陣和權值矩陣進行切割,由硬件資源知公式m=220,m/144」=1中,單次最多并行計算144個乘加運算。故單次傳入權值小矩陣大小為144·out_c,單次傳入feature map小矩陣大小為144/k_size2·w·h。X-TINY YOLO所有卷積層傳入PL端的分割后矩陣規(guī)模及傳入次數(shù)統(tǒng)計如表2。

    表2中,k_step、n_step分別為feature map和權值矩陣分割后需分多次傳入PL端的小矩陣數(shù)目。需要注意的是權值矩陣在傳輸當前層最后一個小矩陣時會多增加一行bias數(shù)據(jù),而feature map矩陣在第3和第9次傳入時,因為in_c無法被16整除,最后一次會傳入規(guī)模比表格中數(shù)值更小的矩陣。以上兩點未體現(xiàn)在表格中。

    數(shù)據(jù)在PL端的存儲方面,定義一個大小為146×2048的BRAM,并對第一個維度進行分割,分割為146個小BRAM,其中144個BRAM存儲兩個計算所用矩陣,2個BRAM用于最大池化操作。按照1.3節(jié)的存儲方法,在每個BRAM的前w×h個單元中存入一個通道的feature map數(shù)據(jù),從w×h開始之后的單元內(nèi)存入out_c個單元的權值數(shù)據(jù),在每個乘法計算周期內(nèi)同時從144個BRAM中讀出144對feature map和權值數(shù)據(jù)并分別送入144片DSP48E計算(綜合后電路實際只使用了110片)。DSP48E只有144片,按上述方式單個計算周期內(nèi)只能實現(xiàn)144·(16·k_size2)個乘加運算并行,乘加總量為in_c·out_c·k_size2·w·h,多個計算周期間通過#pipeline方式實現(xiàn)II=1的流水線(表75本文無表7,指代哪個表格,請明確。回復:表7改為表5)。由圖2結合式(9)、(10)和(11)得到,各層卷積運算理論耗時,如表2的最后一列所示。

    猜你喜歡
    權值卷積流水線
    基于圖像處理與卷積神經(jīng)網(wǎng)絡的零件識別
    熨燙女工
    基于全卷積神經(jīng)網(wǎng)絡的變壓器故障診斷
    基于深度卷積網(wǎng)絡與空洞卷積融合的人群計數(shù)
    奇思妙想
    流水線
    流水線上的神奇轉換
    卷積神經(jīng)網(wǎng)絡概述
    財務風險跟蹤評價方法初探
    基于洪泛查詢的最短路徑算法在智能交通系統(tǒng)中的應用
    亚洲国产精品999在线| 欧美精品亚洲一区二区| 宅男免费午夜| 亚洲精品在线美女| 两人在一起打扑克的视频| 国产伦人伦偷精品视频| 天堂√8在线中文| 成人国产一区最新在线观看| 免费无遮挡裸体视频| 正在播放国产对白刺激| 精品熟女少妇八av免费久了| 老司机午夜福利在线观看视频| 成人av在线播放网站| 狠狠狠狠99中文字幕| 波多野结衣高清作品| 久久人妻av系列| 一本一本综合久久| 欧美丝袜亚洲另类 | 美女高潮喷水抽搐中文字幕| 亚洲男人天堂网一区| 国产精品日韩av在线免费观看| 欧美成人性av电影在线观看| 香蕉国产在线看| 美女 人体艺术 gogo| 日本撒尿小便嘘嘘汇集6| 精品欧美国产一区二区三| 国产成人一区二区三区免费视频网站| 欧美人与性动交α欧美精品济南到| 老司机午夜十八禁免费视频| 精品久久久久久成人av| 丁香六月欧美| 亚洲欧美日韩东京热| 变态另类成人亚洲欧美熟女| 免费在线观看影片大全网站| 亚洲午夜精品一区,二区,三区| 一边摸一边做爽爽视频免费| 午夜影院日韩av| 午夜福利欧美成人| 久久99热这里只有精品18| 欧美黑人欧美精品刺激| 制服丝袜大香蕉在线| 俺也久久电影网| 男插女下体视频免费在线播放| 99精品久久久久人妻精品| e午夜精品久久久久久久| 午夜福利成人在线免费观看| 两个人看的免费小视频| 国产熟女xx| 国产精品免费视频内射| 又粗又爽又猛毛片免费看| 午夜福利高清视频| 亚洲精品中文字幕在线视频| 97人妻精品一区二区三区麻豆| 2021天堂中文幕一二区在线观| 欧美+亚洲+日韩+国产| 国产精品久久久久久亚洲av鲁大| 午夜影院日韩av| 国产午夜福利久久久久久| 久久精品国产综合久久久| 两个人看的免费小视频| xxx96com| 国产成+人综合+亚洲专区| 黄色毛片三级朝国网站| 精品国内亚洲2022精品成人| 亚洲av熟女| 久久午夜综合久久蜜桃| 欧美3d第一页| 最近最新中文字幕大全免费视频| 美女大奶头视频| 韩国av一区二区三区四区| 淫秽高清视频在线观看| 国产精品香港三级国产av潘金莲| 欧美午夜高清在线| 波多野结衣高清作品| 床上黄色一级片| 91成年电影在线观看| 亚洲av第一区精品v没综合| 99国产精品一区二区蜜桃av| 国产精品精品国产色婷婷| 黄色视频,在线免费观看| 欧美一区二区国产精品久久精品 | 亚洲成av人片在线播放无| 国产精品一区二区免费欧美| 久久久久久久久免费视频了| 99热这里只有是精品50| 精品国内亚洲2022精品成人| 91大片在线观看| 两个人看的免费小视频| 欧美久久黑人一区二区| 国产成人欧美在线观看| 国产单亲对白刺激| 婷婷丁香在线五月| 亚洲avbb在线观看| 亚洲在线自拍视频| 黑人欧美特级aaaaaa片| 韩国av一区二区三区四区| 老司机在亚洲福利影院| 黑人操中国人逼视频| 国产精品久久久久久人妻精品电影| 黄色女人牲交| 久久国产乱子伦精品免费另类| 日韩欧美 国产精品| 亚洲精品一卡2卡三卡4卡5卡| 中文字幕久久专区| 中文字幕久久专区| 观看免费一级毛片| 精品久久久久久成人av| 在线看三级毛片| 国产精品久久视频播放| 欧美性猛交黑人性爽| 19禁男女啪啪无遮挡网站| 久久精品综合一区二区三区| 19禁男女啪啪无遮挡网站| 九九热线精品视视频播放| 99精品欧美一区二区三区四区| 欧美一区二区国产精品久久精品 | 男女做爰动态图高潮gif福利片| 国产男靠女视频免费网站| 久久99热这里只有精品18| 国产精品一及| 在线观看一区二区三区| 巨乳人妻的诱惑在线观看| 搡老岳熟女国产| 亚洲成人国产一区在线观看| 久久精品综合一区二区三区| 草草在线视频免费看| 精品人妻1区二区| 亚洲成人免费电影在线观看| 老熟妇仑乱视频hdxx| 日韩免费av在线播放| 国产精品98久久久久久宅男小说| 国产精品一区二区三区四区免费观看 | 婷婷亚洲欧美| 国产熟女xx| 一区二区三区国产精品乱码| 日日夜夜操网爽| 一级毛片高清免费大全| 久久久久久久久中文| 国产精品亚洲美女久久久| 天堂av国产一区二区熟女人妻 | 国产伦在线观看视频一区| 一本大道久久a久久精品| 国产熟女xx| 精品午夜福利视频在线观看一区| 精品久久久久久成人av| 欧美极品一区二区三区四区| 亚洲色图 男人天堂 中文字幕| 后天国语完整版免费观看| 久久午夜亚洲精品久久| 国内毛片毛片毛片毛片毛片| 亚洲国产精品成人综合色| 亚洲国产欧洲综合997久久,| 亚洲精品美女久久久久99蜜臀| 深夜精品福利| 欧美在线黄色| 久久欧美精品欧美久久欧美| 一区二区三区激情视频| 国产视频一区二区在线看| 国产精品98久久久久久宅男小说| 黄色毛片三级朝国网站| 亚洲 欧美一区二区三区| 亚洲午夜理论影院| 精品福利观看| 精品国产亚洲在线| 在线观看一区二区三区| 国产精品爽爽va在线观看网站| 日本 欧美在线| 一卡2卡三卡四卡精品乱码亚洲| 国产精品一区二区免费欧美| 日韩国内少妇激情av| 一二三四在线观看免费中文在| 天天躁夜夜躁狠狠躁躁| 精品国产美女av久久久久小说| 一级毛片女人18水好多| 欧美最黄视频在线播放免费| 亚洲午夜精品一区,二区,三区| 亚洲成人免费电影在线观看| 女人被狂操c到高潮| 免费在线观看黄色视频的| 欧美日韩福利视频一区二区| 久久草成人影院| 午夜日韩欧美国产| 亚洲人成网站在线播放欧美日韩| 国产av在哪里看| 波多野结衣高清作品| cao死你这个sao货| 夜夜夜夜夜久久久久| 久久热在线av| 国产伦一二天堂av在线观看| 日本黄大片高清| 国产精品久久久久久精品电影| 亚洲欧美一区二区三区黑人| 99久久精品国产亚洲精品| 丁香六月欧美| 啦啦啦免费观看视频1| 在线观看午夜福利视频| 国产激情欧美一区二区| 亚洲国产看品久久| 俺也久久电影网| 麻豆一二三区av精品| 少妇人妻一区二区三区视频| 禁无遮挡网站| 久久精品亚洲精品国产色婷小说| 亚洲精品色激情综合| 在线观看日韩欧美| 亚洲欧美日韩东京热| 美女黄网站色视频| 狂野欧美激情性xxxx| av福利片在线观看| 亚洲av日韩精品久久久久久密| 少妇的丰满在线观看| 精品福利观看| 中文字幕熟女人妻在线| 国产视频内射| 亚洲中文日韩欧美视频| 精品不卡国产一区二区三区| 久久久国产成人精品二区| 一本精品99久久精品77| 白带黄色成豆腐渣| 老鸭窝网址在线观看| 成人av在线播放网站| 日本三级黄在线观看| 天天一区二区日本电影三级| 国产真人三级小视频在线观看| 十八禁网站免费在线| 国产一区二区在线av高清观看| 亚洲五月婷婷丁香| 久久午夜综合久久蜜桃| 麻豆成人av在线观看| 国产一区在线观看成人免费| 欧美性猛交╳xxx乱大交人| 欧美人与性动交α欧美精品济南到| 午夜久久久久精精品| 一二三四在线观看免费中文在| 男女下面进入的视频免费午夜| 欧美日韩亚洲综合一区二区三区_| 美女 人体艺术 gogo| 久久 成人 亚洲| 伊人久久大香线蕉亚洲五| 亚洲人成77777在线视频| 久久这里只有精品19| 精品一区二区三区av网在线观看| 国产真人三级小视频在线观看| 两性夫妻黄色片| 亚洲va日本ⅴa欧美va伊人久久| 日本精品一区二区三区蜜桃| 首页视频小说图片口味搜索| 免费无遮挡裸体视频| 精品乱码久久久久久99久播| 亚洲成a人片在线一区二区| 国语自产精品视频在线第100页| 久久精品影院6| 91麻豆av在线| 国产高清视频在线播放一区| 中国美女看黄片| 看黄色毛片网站| 亚洲片人在线观看| 99热6这里只有精品| 免费在线观看视频国产中文字幕亚洲| 亚洲av成人av| 午夜福利成人在线免费观看| 两个人的视频大全免费| 岛国在线免费视频观看| 精品久久久久久久人妻蜜臀av| 国产主播在线观看一区二区| 制服诱惑二区| 国产亚洲精品久久久久久毛片| 国产精品精品国产色婷婷| 欧美黄色淫秽网站| 亚洲成人久久性| 亚洲七黄色美女视频| 国内久久婷婷六月综合欲色啪| 日韩欧美国产一区二区入口| 欧美成人一区二区免费高清观看 | 99热这里只有是精品50| 97碰自拍视频| 亚洲五月婷婷丁香| 欧美日韩精品网址| 我要搜黄色片| 一级毛片高清免费大全| 免费av毛片视频| 两人在一起打扑克的视频| 亚洲国产高清在线一区二区三| 黄色视频,在线免费观看| 精品久久久久久久久久久久久| 亚洲av成人不卡在线观看播放网| www.www免费av| 女人爽到高潮嗷嗷叫在线视频| 岛国视频午夜一区免费看| 亚洲第一欧美日韩一区二区三区| 亚洲专区中文字幕在线| 中国美女看黄片| 亚洲一区二区三区不卡视频| 久久久久久久午夜电影| 国产精品 欧美亚洲| av天堂在线播放| 久久九九热精品免费| 久久久久国产精品人妻aⅴ院| 国产av不卡久久| 日韩欧美在线二视频| 夜夜看夜夜爽夜夜摸| АⅤ资源中文在线天堂| 这个男人来自地球电影免费观看| 少妇的丰满在线观看| 777久久人妻少妇嫩草av网站| 美女黄网站色视频| 俺也久久电影网| 亚洲人成网站高清观看| 成人特级黄色片久久久久久久| 日韩欧美一区二区三区在线观看| 欧美zozozo另类| 亚洲第一电影网av| 国产亚洲av高清不卡| 精品乱码久久久久久99久播| 午夜精品在线福利| 国产1区2区3区精品| 亚洲精品一区av在线观看| 俄罗斯特黄特色一大片| 国内精品久久久久久久电影| 欧美日韩瑟瑟在线播放| 99热只有精品国产| 亚洲精品国产一区二区精华液| 一区二区三区高清视频在线| 男插女下体视频免费在线播放| 757午夜福利合集在线观看| 欧美日韩中文字幕国产精品一区二区三区| 午夜精品一区二区三区免费看| 少妇人妻一区二区三区视频| 亚洲成人久久爱视频| 在线观看66精品国产| 欧美在线一区亚洲| 亚洲午夜精品一区,二区,三区| 天天添夜夜摸| 天堂av国产一区二区熟女人妻 | 欧美乱妇无乱码| 757午夜福利合集在线观看| 亚洲av电影在线进入| 99热这里只有精品一区 | 亚洲 欧美 日韩 在线 免费| 母亲3免费完整高清在线观看| 日日摸夜夜添夜夜添小说| 色综合亚洲欧美另类图片| 成人国语在线视频| 日韩成人在线观看一区二区三区| 久久这里只有精品19| 久久婷婷成人综合色麻豆| 欧美黑人巨大hd| 女人爽到高潮嗷嗷叫在线视频| 香蕉av资源在线| 又爽又黄无遮挡网站| 日韩精品青青久久久久久| 久久午夜亚洲精品久久| 免费无遮挡裸体视频| 99国产综合亚洲精品| 亚洲精品av麻豆狂野| 美女高潮喷水抽搐中文字幕| 最近最新中文字幕大全电影3| 亚洲国产精品sss在线观看| 精品熟女少妇八av免费久了| 亚洲精品中文字幕在线视频| 久久九九热精品免费| 欧美成人午夜精品| 又大又爽又粗| 黄色成人免费大全| 亚洲黑人精品在线| 又黄又爽又免费观看的视频| 一个人免费在线观看电影 | 国产精品影院久久| 丁香欧美五月| 无人区码免费观看不卡| 亚洲全国av大片| 国产欧美日韩一区二区精品| 国产午夜福利久久久久久| 一边摸一边抽搐一进一小说| 国产精品国产高清国产av| 俄罗斯特黄特色一大片| 香蕉久久夜色| 香蕉丝袜av| 波多野结衣巨乳人妻| 久久久水蜜桃国产精品网| 99热这里只有是精品50| 久久精品夜夜夜夜夜久久蜜豆 | 亚洲精品中文字幕在线视频| 嫁个100分男人电影在线观看| 亚洲色图av天堂| 制服丝袜大香蕉在线| 成人精品一区二区免费| 九九热线精品视视频播放| 国产av麻豆久久久久久久| 亚洲精品粉嫩美女一区| 亚洲精品av麻豆狂野| 欧美一区二区国产精品久久精品 | 免费高清视频大片| 波多野结衣巨乳人妻| 国产一区二区三区在线臀色熟女| 国产伦一二天堂av在线观看| 亚洲国产精品成人综合色| 一二三四在线观看免费中文在| 丝袜人妻中文字幕| 两个人的视频大全免费| 免费在线观看亚洲国产| 最好的美女福利视频网| 成人国语在线视频| 亚洲精品久久成人aⅴ小说| 法律面前人人平等表现在哪些方面| 女人高潮潮喷娇喘18禁视频| 免费在线观看黄色视频的| 国产精品亚洲一级av第二区| 黄频高清免费视频| 91老司机精品| 99久久精品热视频| 国产精品亚洲av一区麻豆| 久久久久久九九精品二区国产 | 欧美日韩精品网址| 久久人妻福利社区极品人妻图片| 亚洲av片天天在线观看| 亚洲精品美女久久久久99蜜臀| 亚洲男人的天堂狠狠| 男女午夜视频在线观看| 嫁个100分男人电影在线观看| 精品久久久久久久人妻蜜臀av| 免费av毛片视频| 狂野欧美激情性xxxx| 婷婷精品国产亚洲av| 叶爱在线成人免费视频播放| 亚洲欧美日韩高清在线视频| 他把我摸到了高潮在线观看| 亚洲一区高清亚洲精品| 亚洲成人久久性| 青草久久国产| 国内精品一区二区在线观看| av国产免费在线观看| 特级一级黄色大片| 国产欧美日韩精品亚洲av| 中文字幕精品亚洲无线码一区| 亚洲午夜理论影院| 免费无遮挡裸体视频| 在线永久观看黄色视频| 国产亚洲欧美98| 国产精品一区二区三区四区免费观看 | 久久精品国产清高在天天线| 亚洲人成伊人成综合网2020| 国产在线观看jvid| 国产成人aa在线观看| 久久久久国产精品人妻aⅴ院| 欧美成人一区二区免费高清观看 | 禁无遮挡网站| 精品久久久久久久久久久久久| 国产精品久久久久久久电影 | 久久99热这里只有精品18| 久久久久性生活片| 女人爽到高潮嗷嗷叫在线视频| 亚洲美女黄片视频| 最近在线观看免费完整版| 中文字幕高清在线视频| 国产又色又爽无遮挡免费看| 黄频高清免费视频| 精品久久久久久久久久免费视频| 国产精品一及| 国产高清videossex| 两个人免费观看高清视频| 91老司机精品| 欧美性猛交╳xxx乱大交人| 老司机福利观看| 国产精品一及| 亚洲中文日韩欧美视频| cao死你这个sao货| 999精品在线视频| 久久精品国产亚洲av高清一级| 久久精品亚洲精品国产色婷小说| 中亚洲国语对白在线视频| 日韩国内少妇激情av| www.www免费av| 色老头精品视频在线观看| a级毛片在线看网站| 757午夜福利合集在线观看| 亚洲国产欧美人成| 天天一区二区日本电影三级| 久久久久久大精品| 成年版毛片免费区| 精品国产乱码久久久久久男人| 白带黄色成豆腐渣| 亚洲av第一区精品v没综合| 久久国产精品影院| 一个人观看的视频www高清免费观看 | 一边摸一边抽搐一进一小说| 两个人的视频大全免费| 欧美乱妇无乱码| 亚洲真实伦在线观看| 免费在线观看黄色视频的| 美女免费视频网站| av片东京热男人的天堂| 亚洲人成网站在线播放欧美日韩| 99热6这里只有精品| av免费在线观看网站| 亚洲色图 男人天堂 中文字幕| 精品不卡国产一区二区三区| 久久这里只有精品19| 久久久久久人人人人人| 国产v大片淫在线免费观看| av中文乱码字幕在线| 成人18禁在线播放| 中文字幕人成人乱码亚洲影| 久久久久久久久免费视频了| 在线永久观看黄色视频| 一区二区三区国产精品乱码| 黄色视频不卡| 天天一区二区日本电影三级| 欧美性猛交╳xxx乱大交人| 又紧又爽又黄一区二区| 搡老妇女老女人老熟妇| 熟女电影av网| 久久久久国内视频| 亚洲真实伦在线观看| 午夜激情福利司机影院| 国内揄拍国产精品人妻在线| 午夜福利成人在线免费观看| 哪里可以看免费的av片| 久久久久久大精品| 在线a可以看的网站| 国产成人精品久久二区二区91| 亚洲欧美精品综合一区二区三区| 男女视频在线观看网站免费 | 母亲3免费完整高清在线观看| 在线观看舔阴道视频| 免费看十八禁软件| 老熟妇乱子伦视频在线观看| 午夜精品久久久久久毛片777| 免费在线观看影片大全网站| 亚洲一区高清亚洲精品| 久久人人精品亚洲av| 久久人妻av系列| 88av欧美| 日本熟妇午夜| 久久精品国产亚洲av高清一级| 老汉色∧v一级毛片| 成年人黄色毛片网站| 97人妻精品一区二区三区麻豆| 欧美丝袜亚洲另类 | 精品一区二区三区视频在线观看免费| 国产日本99.免费观看| 精品电影一区二区在线| 欧美日韩亚洲国产一区二区在线观看| 在线视频色国产色| 免费观看精品视频网站| 亚洲中文av在线| 曰老女人黄片| 午夜亚洲福利在线播放| 国产一区二区三区视频了| 欧美成狂野欧美在线观看| 18禁黄网站禁片免费观看直播| 夜夜夜夜夜久久久久| 美女高潮喷水抽搐中文字幕| 啦啦啦观看免费观看视频高清| 一个人免费在线观看电影 | 国产午夜福利久久久久久| 男女之事视频高清在线观看| 欧美日韩黄片免| 91国产中文字幕| 午夜福利18| 久久精品国产99精品国产亚洲性色| 国产高清视频在线观看网站| 黑人欧美特级aaaaaa片| 最近最新中文字幕大全免费视频| 窝窝影院91人妻| a级毛片在线看网站| 日本五十路高清| 久久久久久久久免费视频了| av视频在线观看入口| 成年版毛片免费区| 久久这里只有精品19| 美女黄网站色视频| 日韩大尺度精品在线看网址| 啪啪无遮挡十八禁网站| 国产精品影院久久| www国产在线视频色| 日韩三级视频一区二区三区| 日日摸夜夜添夜夜添小说| 中国美女看黄片| 精品国产超薄肉色丝袜足j| 欧美人与性动交α欧美精品济南到| 身体一侧抽搐| 在线观看免费日韩欧美大片| 国产亚洲精品第一综合不卡| 成人国语在线视频| 变态另类丝袜制服| √禁漫天堂资源中文www| 欧美性猛交╳xxx乱大交人| 一级毛片高清免费大全| 叶爱在线成人免费视频播放| 老司机靠b影院| 别揉我奶头~嗯~啊~动态视频| 国内揄拍国产精品人妻在线| 亚洲国产精品久久男人天堂| 叶爱在线成人免费视频播放| 岛国在线观看网站| 女警被强在线播放| 国产爱豆传媒在线观看 | 精品人妻1区二区| 观看免费一级毛片| 一进一出好大好爽视频| 国产伦在线观看视频一区| 日本a在线网址| 此物有八面人人有两片| 最近在线观看免费完整版| 久久欧美精品欧美久久欧美| 久久久久久久久免费视频了| 日本精品一区二区三区蜜桃| 777久久人妻少妇嫩草av网站| a在线观看视频网站| 18禁黄网站禁片免费观看直播| 99久久综合精品五月天人人| 亚洲中文av在线| 欧美久久黑人一区二区| 啪啪无遮挡十八禁网站|