• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于FPGA的多核可擴(kuò)展卷積加速器設(shè)計(jì)

    2021-06-28 11:39:14張坤寧孫慶斌
    關(guān)鍵詞:池化分塊加速器

    張坤寧,趙 爍,孫慶斌,鄧 寧,何 虎

    (清華大學(xué) 微電子學(xué)研究所,北京 100084)

    0 引 言

    近年來,以CNN(convolution neural networks)為代表的深度學(xué)習(xí)算法已經(jīng)成為人工智能領(lǐng)域重要的研究內(nèi)容,它在圖像識別與檢測定位、人臉識別與自動駕駛等領(lǐng)域發(fā)揮了重要作用[1]。但是隨著算法的精進(jìn)和應(yīng)用場景日益多元化,CNN網(wǎng)絡(luò)在識別準(zhǔn)確率提高的同時(shí),其結(jié)構(gòu)變得越來越復(fù)雜、深度也不斷加深[2]。尤其當(dāng)將其應(yīng)用在嵌入式設(shè)備時(shí),對計(jì)算資源和內(nèi)存資源帶來了很大的挑戰(zhàn)。因此研究CNN網(wǎng)絡(luò)的加速計(jì)算顯得尤為必要,并且對加快技術(shù)落地、拓寬應(yīng)用場景具有重要意義。

    Zhang等提出了roofline模型并在基于FPGA的卷積加速器設(shè)計(jì)中使用了數(shù)據(jù)復(fù)用、并行計(jì)算等技術(shù)[3]。Han等則提出“剪枝-定點(diǎn)壓縮-霍夫曼編碼”3種深度壓縮的技巧,極大地減少了CNN網(wǎng)絡(luò)參數(shù)所需的存儲資源,為CNN向嵌入式系統(tǒng)移植開辟了重要思路[4]。Rahman等提出了一種三維陣列結(jié)構(gòu),結(jié)合對片上緩存的優(yōu)化,將加速結(jié)構(gòu)中的乘加單元減少了22%[5]。Yao等還針對新型輕量化網(wǎng)絡(luò)的硬件加速工作進(jìn)行了研究[6]。

    本設(shè)計(jì)針對卷積計(jì)算中的循環(huán)計(jì)算順序進(jìn)行了優(yōu)化,并與片上緩存數(shù)據(jù)復(fù)用技術(shù)相結(jié)合,不僅提高了數(shù)據(jù)復(fù)用效率,還進(jìn)一步提高了加速器的通用性。設(shè)計(jì)了專門的計(jì)算單元來進(jìn)行卷積、激活、批標(biāo)準(zhǔn)化(BN)以及池化等操作,并對池化計(jì)算以及數(shù)據(jù)存取順序進(jìn)行了優(yōu)化。使用由加速器和通用處理器組成的SoC系統(tǒng),運(yùn)行VGG16網(wǎng)絡(luò)的推理運(yùn)算過程。此外還提出了一種將加速器進(jìn)行多核擴(kuò)展的方法,為其在不同F(xiàn)PGA平臺上的部署提供了一種思路。

    1 數(shù)據(jù)量化及分析

    在不影響推理準(zhǔn)確度的前提下,精簡輸入數(shù)據(jù)的位寬,能夠有效降低對片外存儲的帶寬需求[4]。因此在進(jìn)行加速器設(shè)計(jì)之前,首先使用自動化的CNN近似工具Caffe Ristretto完成了數(shù)據(jù)的量化工作。在這個(gè)過程中主要通過在參數(shù)位寬與識別精度之間進(jìn)行折衷,即在可接受的精度損失范圍內(nèi)用最短的位寬來表示網(wǎng)絡(luò)中數(shù)據(jù)。閾值越高,位寬越短;閾值越低,位寬越長。

    量化過程分為確定位寬和再訓(xùn)練兩個(gè)階段。在第一階段,輸入32 bits的單精度浮點(diǎn)數(shù),并規(guī)定識別精度的損失閾值,Ristretto工具經(jīng)過計(jì)算和迭代會給出當(dāng)前閾值下的最小位寬長度。然后可以自身具體需求來改變閾值,獲得最適合當(dāng)前設(shè)計(jì)情況下的數(shù)據(jù)位寬。在網(wǎng)絡(luò)再訓(xùn)練階段,需對網(wǎng)絡(luò)參數(shù)進(jìn)行微調(diào)。使用量化后的參數(shù)進(jìn)行前向計(jì)算,反向傳播過程先更新全精度參數(shù)然后再量化。通過若干次迭代,以盡可能將精度提升至量化前的水平。本設(shè)計(jì)將VGG16網(wǎng)絡(luò)的權(quán)值參數(shù)量化為8 bits,并保證了精度下降在1%以內(nèi)。

    為解決網(wǎng)絡(luò)不同層中數(shù)據(jù)范圍和絕對值相差較大的問題,采取了動態(tài)量化的策略[7,8],即對于網(wǎng)絡(luò)中不同的計(jì)算層,輸入的圖像數(shù)據(jù)、權(quán)重?cái)?shù)據(jù)以及計(jì)算結(jié)果的整數(shù)位數(shù)和小數(shù)位數(shù)各不相同,以確保8 bits的數(shù)據(jù)位寬能夠涵蓋相應(yīng)計(jì)算層所有數(shù)據(jù)的范圍。表1列出了經(jīng)過量化工具處理后加速器每個(gè)計(jì)算層中權(quán)重、輸入特征映射和卷積計(jì)算結(jié)果的小數(shù)位數(shù)。

    表1 3種數(shù)據(jù)的小數(shù)位數(shù)

    2 加速器架構(gòu)設(shè)計(jì)

    對于FPGA平臺中實(shí)現(xiàn)的卷積加速設(shè)計(jì),主要圍繞以下思路來展開:基于CNN網(wǎng)絡(luò)中輸入特征映射和卷積核多通道的特性,設(shè)計(jì)乘加陣列進(jìn)行并行計(jì)算[9];基于有限的片上存儲資源,對輸入和權(quán)重?cái)?shù)據(jù)進(jìn)行分塊,并通過設(shè)置片上緩存來暫時(shí)存儲分塊數(shù)據(jù)以減少加速器與片外存儲之間的數(shù)據(jù)訪存次數(shù)[10,11];通過設(shè)計(jì)特定的循環(huán)展開計(jì)算順序,實(shí)現(xiàn)片上緩存數(shù)據(jù)的復(fù)用以及高效的并行計(jì)算效率[12,13]。

    加速器主要由計(jì)算單元、片上緩存以及控制器組成。計(jì)算單元主要由乘加模塊、累加模塊、BN計(jì)算模塊、定點(diǎn)處理模塊、激活模塊以及池化模塊組成,是完成加速計(jì)算的關(guān)鍵部分。片上緩存調(diào)用FPGA的BRAM資源,將來自片外的輸入特征映射、權(quán)重?cái)?shù)據(jù)以及卷積計(jì)算結(jié)果暫存。而控制器主要產(chǎn)生一些控制卷積計(jì)算過程的信號,保證計(jì)算準(zhǔn)確有序進(jìn)行。

    2.1 計(jì)算單元

    加速器計(jì)算單元的結(jié)構(gòu)如圖1所示。根據(jù)分塊策略中卷積核在輸入和輸出通道上的分塊尺寸均為16,共包含256個(gè)乘法器和加法器的乘加模塊與累加模塊組成了乘加陣列(MAC),它們分成16組,用來完成16個(gè)輸出通道和16個(gè)輸入通道的并行卷積計(jì)算。對于一組乘加陣列,16個(gè)輸入通道上同一位置的輸入數(shù)據(jù)分別與同一輸出通道中16個(gè)輸入通道的卷積核元素相乘;不同組的乘加陣列之間輸入數(shù)據(jù)相同,卷積核元素則來自16個(gè)不同的輸出通道。由此在一個(gè)時(shí)鐘周期內(nèi)并行完成256次乘法運(yùn)算。一組乘加陣列內(nèi)15個(gè)加法器組成了加法樹,將16個(gè)輸入通道的卷積中間結(jié)果累加起來。

    圖1 加速器計(jì)算單元的結(jié)構(gòu)

    累加模塊主要用于以下兩種情況:一是將卷積核元素與輸入分塊數(shù)據(jù)做點(diǎn)乘運(yùn)算后的結(jié)果累加起來;另外由于乘加模塊每次只能完成16個(gè)輸入通道的卷積計(jì)算,而多數(shù)CNN網(wǎng)絡(luò)層的通道數(shù)均大于16,累加模塊還負(fù)責(zé)將多個(gè)16通道的計(jì)算結(jié)果累加到一起,得到最終的輸出特征映射。

    BN計(jì)算是為了解決CNN網(wǎng)絡(luò)訓(xùn)練過程中因梯度消失而難以收斂的問題而提出的,它通過將卷積計(jì)算的結(jié)果變成標(biāo)準(zhǔn)正態(tài)分布,并進(jìn)行一定的伸縮平移變換,最終在進(jìn)行激活操作之前令其處于激活函數(shù)梯度較大的區(qū)間內(nèi)。其公式為

    (1)

    在推理計(jì)算中,上述公式中mean、var、γ和β這4個(gè)參數(shù)都是訓(xùn)練好的確定值,因此可以將BN的計(jì)算公式轉(zhuǎn)換成如下一次函數(shù)的形式

    y=k*x+b

    (2)

    乘加陣列中的所有輸入數(shù)據(jù)均為定點(diǎn)8 bits,但經(jīng)過驗(yàn)證得知乘累加過程產(chǎn)生的計(jì)算結(jié)果至少為24 bits才能避免溢出。因此在完成各種乘加計(jì)算之后,定點(diǎn)處理模塊接收來自控制器的關(guān)于計(jì)算結(jié)果的小數(shù)位數(shù)信息,并將24 bits的乘累加結(jié)果截成8 bits。

    激活模塊支持ReLU和Leaky ReLU兩種函數(shù)。池化模塊支持最大池化和平均池化兩種類型的計(jì)算,并且通過設(shè)計(jì)并復(fù)用基本的池化計(jì)算單元能夠支持任意尺寸的池化計(jì)算。

    2.2 片上緩存

    片上緩存的容量不僅取決于所用FPGA開發(fā)板的BRAM資源,還取決于所用分塊策略和運(yùn)行的網(wǎng)絡(luò)結(jié)構(gòu)。根據(jù)以上提到的分塊策略,最終將各個(gè)片上緩存的容量大小確定為如表2所示。其中輸入、權(quán)重、輸出和中間結(jié)果緩存均工作在ping-pong模式下,令數(shù)據(jù)傳輸?shù)臅r(shí)間得以充分利用。

    表2 各個(gè)片上緩存的容量大小

    2.3 控制器

    控制器分為卷積計(jì)算控制器和池化計(jì)算控制器。它們均與AXI總線相連。卷積計(jì)算控制器一方面接收總線傳來的關(guān)于網(wǎng)絡(luò)每一層輸入特征映射以及卷積核各個(gè)維度上的分塊尺寸信息,另一方面在計(jì)算過程中產(chǎn)生判斷每一次分塊計(jì)算開始及完成的信號、數(shù)據(jù)傳遞的使能信號以及片上緩存讀寫數(shù)據(jù)的使能信號、地址以及ping-pong選擇信號等。池化計(jì)算控制器則從總線接收關(guān)于池化計(jì)算使能及池化類型的信號,并給出按照池化計(jì)算順序從緩存中讀取數(shù)據(jù)以及對計(jì)算結(jié)果進(jìn)行拼接的控制邏輯。關(guān)于控制邏輯的細(xì)節(jié)將在下文中介紹。

    3 加速器優(yōu)化設(shè)計(jì)

    針對加速器的優(yōu)化設(shè)計(jì)工作主要分為以下3個(gè)方面:優(yōu)化卷積循環(huán)計(jì)算順序、優(yōu)化池化計(jì)算順序和加速器的多核擴(kuò)展設(shè)計(jì)。

    3.1 卷積循環(huán)計(jì)算順序的優(yōu)化設(shè)計(jì)

    在一些前人的相關(guān)研究中,對于卷積計(jì)算單元的設(shè)計(jì)采用復(fù)用輸入數(shù)據(jù)的方法,也就是重復(fù)搬運(yùn)多次卷積核參數(shù)。這種方法的弊端在于計(jì)算單元的控制邏輯會受到卷積核尺寸的影響,尤其是在運(yùn)行具有多種不同尺寸的卷積核的網(wǎng)絡(luò)時(shí),不僅缺乏靈活性,控制邏輯的復(fù)雜性也會大大增加。

    而本設(shè)計(jì)在循環(huán)計(jì)算順序方面的優(yōu)化體現(xiàn)在將卷積核與輸入特征映射的點(diǎn)乘運(yùn)算進(jìn)行分解,即固定卷積核的一個(gè)元素,令其完成整個(gè)分塊圖像中所有需要它來參與的乘法運(yùn)算之后再移動到下一個(gè)卷積核元素。這樣依此類推,直到全部卷積核元素將它們各自負(fù)責(zé)的分塊圖像區(qū)域全部掃描一遍后,完成相應(yīng)的卷積運(yùn)算。如圖2所示,在本設(shè)計(jì)中,填充尺寸和卷積計(jì)算步長均為1,以卷積核和輸入分塊圖像的尺寸分別為3*3和9*9為例,每個(gè)卷積核元素要與7*7個(gè)數(shù)相乘。這樣經(jīng)過9*49個(gè)時(shí)鐘周期之后,將這9次相乘的結(jié)果相加,便得到了尺寸為7*7的一次中間計(jì)算結(jié)果。再按照通道數(shù)進(jìn)行累加,便可得到最終結(jié)果。

    圖2 改進(jìn)后的卷積循環(huán)計(jì)算次序

    在上述循環(huán)計(jì)算順序中,復(fù)用的數(shù)據(jù)為卷積核元素。這種令卷積核元素掃描輸入圖像數(shù)據(jù)的好處是既保證了數(shù)據(jù)復(fù)用,又避免卷積計(jì)算受到卷積核尺寸的限制。這種方法可以用于任意尺寸的分塊圖像與任意尺寸的卷積核的計(jì)算,具有非常好的通用性。本設(shè)計(jì)支持從1*1到11*11等各種尺寸的卷積核,只需將尺寸信息傳給控制器,無需設(shè)計(jì)新的控制邏輯便可完成計(jì)算,十分靈活方便。經(jīng)過優(yōu)化后完整的卷積循環(huán)計(jì)算次序如圖3所示。

    圖3 完整的卷積循環(huán)計(jì)算次序

    3.2 池化計(jì)算順序的優(yōu)化設(shè)計(jì)

    對于池化計(jì)算,為解決池化的輸入數(shù)據(jù)在卷積計(jì)算次序中非連續(xù)排列而造成卷積運(yùn)算之后無法直接開始池化計(jì)算的問題,設(shè)置了池化片上緩存。將一次分塊卷積計(jì)算的結(jié)果暫存之后,再按照池化計(jì)算的順序,從緩存中取出相應(yīng)位置的數(shù)據(jù)。

    另外以最常見的2*2池化尺寸為例,經(jīng)過池化計(jì)算后分塊圖像的尺寸變?yōu)樵瓉淼乃姆种?,為了便于網(wǎng)絡(luò)下一層的計(jì)算,使用了一種拼接策略,將4塊池化后的分塊圖像拼接成一塊與池化前尺寸相同的圖像再存入輸出緩存。當(dāng)輸入圖像的分塊尺寸為10*10時(shí),第一塊數(shù)據(jù)完成池化計(jì)算后的25個(gè)結(jié)果分別存入輸出緩存中序號為0~4,10~14,20~24,30~34,40~44的這些地址;第二塊結(jié)果存入的地址為5~9,15~19,25~29,35~39,45~49;第三塊和第四塊計(jì)算結(jié)果分別存入的地址是50~54,60~64,70~74,80~84,90~94和55~59,65~69,75~79,85~89,95~99。這樣的數(shù)據(jù)拼接結(jié)果通過池化控制器中的相應(yīng)邏輯來實(shí)現(xiàn)。而對于7*7的分塊尺寸,其總體思路與10*10的情況是類似的。但考慮到7不能被2整除,因此這種情況下還需一個(gè)額外操作,即在將數(shù)據(jù)送入加速器之前的數(shù)據(jù)重組步驟中,將分塊數(shù)據(jù)的存儲順序變?yōu)榕c池化計(jì)算類似、跨越兩行兩列的14*14。

    使用這種拼接策略能夠保證網(wǎng)絡(luò)的每一層輸入分塊圖像的尺寸都是一致的,避免了某幾層網(wǎng)絡(luò)做完池化后還要對輸入分塊數(shù)據(jù)進(jìn)行尺寸上的調(diào)整。

    3.3 加速器的多核擴(kuò)展設(shè)計(jì)

    在上述設(shè)計(jì)中,加速器的計(jì)算單元部署了256個(gè)乘法器,將計(jì)算陣列做的規(guī)模較小的原因則是為了使其適應(yīng)在不同F(xiàn)PGA平臺上的應(yīng)用。如果是在資源較少的FPGA開發(fā)板上運(yùn)行加速器,那么部署256個(gè)乘加陣列即可;如果FPGA的資源比較充裕,那么可以以包含256個(gè)乘法器的加速器為整體,進(jìn)行多個(gè)加速器核的擴(kuò)展。

    考慮到Xilinx ZCU102開發(fā)板的資源情況,主要探索了以下兩種情況下的擴(kuò)展設(shè)計(jì)。第一種情況是將輸入緩存的尺寸擴(kuò)大為原來的4倍,權(quán)重緩存的容量不變,同時(shí)部署4個(gè)加速器核。這樣便能夠?qū)崿F(xiàn)單核情況下4倍的算力。

    第二種情況則是在第一種情況的基礎(chǔ)上,將權(quán)重緩存的容量擴(kuò)大為原來的兩倍,同時(shí)加速器核的數(shù)量增加到8個(gè),此時(shí)算力和并行計(jì)算度相較于第一種情況又提高了一倍。圖4和圖5分別展示了四核和八核加速器的擴(kuò)展設(shè)計(jì)。

    圖4 四核加速器的架構(gòu)

    圖5 八核加速器的架構(gòu)

    這種擴(kuò)展設(shè)計(jì)具有十分突出的優(yōu)勢,不僅成倍提升了加速器的算力,并且這些核僅需由一個(gè)控制器進(jìn)行控制,在進(jìn)行卷積計(jì)算時(shí)它們內(nèi)部的數(shù)據(jù)流是完全一致的。而設(shè)想如果將1024(256*4)或2048(256*8)個(gè)乘法器部署在一個(gè)加速器核中,雖然其算力與以上所述的多核加速器是相同的,但是若遇到開發(fā)板資源受限而需減少計(jì)算資源的情況下,必須大幅度修改計(jì)算單元內(nèi)各個(gè)計(jì)算模塊的控制邏輯。也就是說這樣的設(shè)計(jì)會因具體的開發(fā)板資源情況而具有一定的專用性。而在當(dāng)前擴(kuò)展方式下,如果需要在不同F(xiàn)PGA上運(yùn)行加速器,可以根據(jù)當(dāng)前開發(fā)板的實(shí)際情況靈活選擇加速器核的數(shù)目以及相應(yīng)的片上緩存容量,從而大大增加了部署加速器的便捷性。

    4 SoC系統(tǒng)設(shè)計(jì)

    將加速器與AXI總線、時(shí)鐘模塊、BRAM控制器、DMA模塊、FPGA開發(fā)板上的ARM處理器以及DDR存儲器等組成可運(yùn)行完整CNN網(wǎng)絡(luò)的SoC系統(tǒng)。如圖6所示,DDR內(nèi)存、DMA控制器、ARM處理器以及加速器的控制器均與AXI總線相連,其中DMA控制DDR通過總線向片上緩存?zhèn)魉蛿?shù)據(jù),這種方式大大提高了數(shù)據(jù)傳輸?shù)男?。ARM處理器用來完成數(shù)據(jù)重組、填充(padding)、分類(softmax)以及計(jì)算準(zhǔn)確率等運(yùn)算,這種軟硬件協(xié)同設(shè)計(jì)的方式既保證了較高的運(yùn)算效率,又具有較強(qiáng)的靈活性和通用性。

    圖6 包含卷積加速器的SoC系統(tǒng)

    5 實(shí)驗(yàn)結(jié)果與分析

    將加速器部署在FPGA開發(fā)板上的流程主要分為以下3個(gè)步驟:

    (1)設(shè)計(jì)加速器各個(gè)計(jì)算模塊的功能以及控制器的邏輯,在Vivado中例化BRAM資源作為片上緩存,驗(yàn)證數(shù)據(jù)讀寫和計(jì)算是否正確。

    (2)將加速器封裝成IP,并與DDR內(nèi)存、ARM處理器、總線等構(gòu)成SoC系統(tǒng)。運(yùn)行完整的VGG16網(wǎng)絡(luò),測試加速器的性能。

    (3)按照上述擴(kuò)展思路,將加速器核的數(shù)量擴(kuò)展為4個(gè)和8個(gè),再次運(yùn)行VGG16網(wǎng)絡(luò)。

    推理計(jì)算所用數(shù)據(jù)集選用了來自ImageNet ILSVRC2012的100張圖片,每張圖片尺寸為224*224*3。將經(jīng)過定點(diǎn)處理后的圖片數(shù)據(jù)和訓(xùn)練好的權(quán)重參數(shù)存入FPGA的SD卡,然后再通過軟件從SD卡讀入DDR中。VGG16網(wǎng)絡(luò)的參數(shù)量為132 MB,每完成一張圖片的推理計(jì)算,要進(jìn)行15.84 G次乘加運(yùn)算。

    5.1 單核加速器性能分析

    運(yùn)行結(jié)果表明在300 MHz的工作頻率下,單核加速器運(yùn)行VGG16網(wǎng)絡(luò)推理一張圖片各部分所用時(shí)間為387 ms,峰值算力達(dá)到了153.5 GOP/s。通過逐層、逐模塊測試,發(fā)現(xiàn)加速器核中的各種計(jì)算以及數(shù)據(jù)在DDR和片上緩存之間傳輸占據(jù)了絕大部分的運(yùn)行時(shí)間;另外由ARM處理器負(fù)責(zé)的數(shù)據(jù)重組等計(jì)算也需要一定時(shí)間。

    表3展示了單核加速器性能與一些前人研究成果的對比。文獻(xiàn)[14]所用FPGA平臺為Xilinx Zynq-7000系列的XC7Z020,文獻(xiàn)[15]和文獻(xiàn)[7]則選用的是同一系列的XC7Z045。這兩種與本設(shè)計(jì)使用的Zynq UltraScale+MPSoC系列的XCZU9EG都是Xilinx公司開發(fā)的SoC可擴(kuò)展處理平臺,但也具有一些不同之處。Zynq-7000的XC7Z020和XC7Z045兩款SoC中的ARM處理器屬于Cortex A9系列,含有的DSP總數(shù)分別為220個(gè)和900個(gè)。而本設(shè)計(jì)中的XCZU9EG所用ARM處理器屬于Cortex A53系列,DSP總數(shù)為2520個(gè)。雖然ARM處理器的型號不同,但如前文所述,處理器計(jì)算所用時(shí)間占總運(yùn)行時(shí)間的比例較小。以及雖然DSP的總數(shù)不同,但加速器的算力并不強(qiáng)烈依賴DSP的數(shù)量。因此表3所列的數(shù)據(jù)具有良好的可比性。

    表3 本文加速器性能與前人研究成果對比

    從表中數(shù)據(jù)可以發(fā)現(xiàn),在相同量化方式下,本文中加速器實(shí)現(xiàn)了相較于文獻(xiàn)[14]和文獻(xiàn)[15]1.8倍和2.4倍的算力。在所用DSP數(shù)量與文獻(xiàn)[15]基本持平的情況下,取得了2.6倍的DSP效率;雖比文獻(xiàn)[14]用了更多的DSP,其DSP效率卻是它的1.27倍。另外在能耗方面,本文加速器的能耗比為29.0 GOP/s/W,達(dá)到了文獻(xiàn)[14]的1.2倍,文獻(xiàn)[7]的2倍。因此從工作頻率、峰值算力、DSP效率和能耗幾個(gè)方面綜合來看,本文加速器的性能要優(yōu)于前人取得的成果,在卷積加速計(jì)算方面取得了一定的進(jìn)步。

    5.2 單核與多核加速器的性能對比與分析

    表4展示了單核、四核和八核加速器的性能對比。從表中可以看出,兩種多核加速器與單核相比,算力分別提升了4倍和6.7倍。八核加速器由于工作頻率稍有下降而對算力提升產(chǎn)生了一定影響。單張圖片的推理計(jì)算時(shí)間也分別下降至260 ms和203 ms。

    表4 單核與多核加速器的性能對比

    根據(jù)以上結(jié)果可以看出,多核加速器單張圖片的推理時(shí)間沒有隨算力提升而等比例下降,原因主要在于CNN網(wǎng)絡(luò)中還有一定數(shù)量的計(jì)算由處理器來完成(這部分時(shí)間大約占總時(shí)間的四分之一),這些時(shí)間并不會隨著硬件算力增加而減少。而八核加速器的單張圖片推理時(shí)間與四核相比也沒有等比例下降,除了上述原因之外,還在于隨著硬件加速部分所花時(shí)間的減少,軟件計(jì)算時(shí)間所占的比例會逐漸增加。此外還由于在ping-pong模式下,一次分塊卷積計(jì)算的時(shí)間小于權(quán)重?cái)?shù)據(jù)的傳輸時(shí)間,而八核每次傳輸?shù)臋?quán)重?cái)?shù)據(jù)量是四核的2倍,傳數(shù)所用的時(shí)間會更長。由于算力提升減少的計(jì)算時(shí)間會被數(shù)據(jù)傳輸時(shí)間覆蓋。

    6 結(jié)束語

    本文針對目前CNN網(wǎng)絡(luò)日益復(fù)雜化帶來的計(jì)算效率較低的問題,提出了一種基于FPGA的定點(diǎn)8 bits加速器結(jié)構(gòu),通過采用有效的分塊策略并結(jié)合優(yōu)化的循環(huán)計(jì)算順序,有效地提高了CNN中卷積計(jì)算的效率。另外還提出了一種對加速器核進(jìn)行整體擴(kuò)展的策略,不僅提升了算力,還為卷積加速設(shè)計(jì)的可擴(kuò)展性應(yīng)用提供了方法。

    由于處理器中的計(jì)算在加速器運(yùn)行總時(shí)間中占有一定比例,下一步可繼續(xù)優(yōu)化軟件程序,如在加速器中實(shí)現(xiàn)數(shù)據(jù)填充操作等,降低處理器的計(jì)算時(shí)間;針對數(shù)據(jù)傳輸時(shí)間與計(jì)算時(shí)間未能完美匹配的問題,還需優(yōu)化數(shù)據(jù)傳輸機(jī)制,這對于進(jìn)一步提升加速器性能具有重要意義。

    猜你喜歡
    池化分塊加速器
    基于緊湊型雙線性網(wǎng)絡(luò)的野生茵識別方法研究
    無線電工程(2024年8期)2024-09-16 00:00:00
    輪滑加速器
    化學(xué)工業(yè)的“加速器”
    基于Sobel算子的池化算法設(shè)計(jì)
    卷積神經(jīng)網(wǎng)絡(luò)中的自適應(yīng)加權(quán)池化
    全民小康路上的“加速器”
    分塊矩陣在線性代數(shù)中的應(yīng)用
    基于卷積神經(jīng)網(wǎng)絡(luò)和池化算法的表情識別研究
    反三角分塊矩陣Drazin逆新的表示
    等待“加速器”
    黑丝袜美女国产一区| 桃花免费在线播放| www.熟女人妻精品国产| 国产免费视频播放在线视频| 丝袜人妻中文字幕| 国产男女内射视频| 丰满少妇做爰视频| 12—13女人毛片做爰片一| 新久久久久国产一级毛片| 国产欧美日韩一区二区三| 国产成人精品在线电影| 青草久久国产| 在线播放国产精品三级| 午夜激情av网站| 这个男人来自地球电影免费观看| 国产精品麻豆人妻色哟哟久久| 精品亚洲成国产av| 国产高清国产精品国产三级| 美女高潮到喷水免费观看| 丝袜美足系列| 汤姆久久久久久久影院中文字幕| 丝瓜视频免费看黄片| 人人澡人人妻人| 91国产中文字幕| 久久精品成人免费网站| 手机成人av网站| 人人澡人人妻人| 日韩中文字幕欧美一区二区| 日本wwww免费看| 另类亚洲欧美激情| 亚洲专区字幕在线| 精品一区二区三区四区五区乱码| 久久亚洲精品不卡| 水蜜桃什么品种好| 亚洲色图av天堂| 久久久久网色| 欧美亚洲日本最大视频资源| 久久久久久久国产电影| videosex国产| 亚洲成国产人片在线观看| 大片免费播放器 马上看| 少妇粗大呻吟视频| 国产精品.久久久| 欧美人与性动交α欧美精品济南到| 精品第一国产精品| 亚洲精品中文字幕在线视频| 亚洲精品国产精品久久久不卡| 欧美日韩视频精品一区| 午夜福利视频精品| 男女午夜视频在线观看| 99国产精品一区二区蜜桃av | 最新的欧美精品一区二区| 国产成人啪精品午夜网站| 国产老妇伦熟女老妇高清| 波多野结衣av一区二区av| 黑丝袜美女国产一区| aaaaa片日本免费| 热re99久久国产66热| 嫩草影视91久久| 欧美日韩中文字幕国产精品一区二区三区 | 一夜夜www| 国产精品亚洲av一区麻豆| av电影中文网址| 女人高潮潮喷娇喘18禁视频| 免费观看av网站的网址| 法律面前人人平等表现在哪些方面| 久久久久网色| 日韩精品免费视频一区二区三区| 久久久久国内视频| 国精品久久久久久国模美| 老汉色∧v一级毛片| 午夜福利,免费看| 免费人妻精品一区二区三区视频| 看免费av毛片| 午夜免费成人在线视频| 久久人妻福利社区极品人妻图片| 大片电影免费在线观看免费| 亚洲精品成人av观看孕妇| 他把我摸到了高潮在线观看 | 纯流量卡能插随身wifi吗| 亚洲精品美女久久av网站| 国产欧美日韩一区二区精品| 国产精品电影一区二区三区 | 亚洲中文av在线| 视频区图区小说| 美女福利国产在线| 精品亚洲成国产av| a级毛片在线看网站| 免费av中文字幕在线| 亚洲欧美日韩另类电影网站| 18禁国产床啪视频网站| 99热国产这里只有精品6| 黄色毛片三级朝国网站| 久久久国产欧美日韩av| 久久亚洲真实| 人人澡人人妻人| 12—13女人毛片做爰片一| 国产亚洲欧美在线一区二区| 欧美一级毛片孕妇| 国产成人一区二区三区免费视频网站| 窝窝影院91人妻| 天天躁夜夜躁狠狠躁躁| 51午夜福利影视在线观看| 人妻久久中文字幕网| 中文字幕色久视频| 亚洲一区中文字幕在线| 一本一本久久a久久精品综合妖精| 国产色视频综合| 黄色怎么调成土黄色| 中文字幕制服av| 亚洲av电影在线进入| 大香蕉久久成人网| 午夜91福利影院| 欧美av亚洲av综合av国产av| 超色免费av| 最近最新中文字幕大全电影3 | 成在线人永久免费视频| 女人久久www免费人成看片| 一个人免费在线观看的高清视频| 99国产综合亚洲精品| 一级片免费观看大全| 69精品国产乱码久久久| 成人国产av品久久久| 一边摸一边做爽爽视频免费| videos熟女内射| 十八禁网站网址无遮挡| 欧美精品人与动牲交sv欧美| 少妇被粗大的猛进出69影院| 女人爽到高潮嗷嗷叫在线视频| 青青草视频在线视频观看| 色播在线永久视频| 在线十欧美十亚洲十日本专区| 午夜两性在线视频| 欧美精品高潮呻吟av久久| 精品国产一区二区三区久久久樱花| 一本—道久久a久久精品蜜桃钙片| 成年版毛片免费区| 久久久水蜜桃国产精品网| 精品国产一区二区久久| 欧美日韩av久久| 欧美黄色片欧美黄色片| 最新在线观看一区二区三区| 亚洲熟女毛片儿| 国产在线视频一区二区| 首页视频小说图片口味搜索| 亚洲中文av在线| 久久免费观看电影| 国产在线精品亚洲第一网站| 欧美亚洲日本最大视频资源| 精品国产一区二区三区久久久樱花| 一级片'在线观看视频| 日韩中文字幕欧美一区二区| 肉色欧美久久久久久久蜜桃| 久久人人爽av亚洲精品天堂| 国产xxxxx性猛交| a在线观看视频网站| 窝窝影院91人妻| 日韩成人在线观看一区二区三区| 电影成人av| 一级毛片女人18水好多| 巨乳人妻的诱惑在线观看| 国产黄色免费在线视频| 免费在线观看日本一区| 国产精品麻豆人妻色哟哟久久| 欧美亚洲日本最大视频资源| 国产精品亚洲av一区麻豆| 免费在线观看视频国产中文字幕亚洲| 老汉色av国产亚洲站长工具| 夜夜夜夜夜久久久久| 欧美日韩av久久| 捣出白浆h1v1| 一级毛片电影观看| 国产亚洲精品第一综合不卡| 国产精品成人在线| 国产精品久久久久成人av| 两个人免费观看高清视频| 国产av又大| 老司机深夜福利视频在线观看| kizo精华| 国产一区二区在线观看av| 成年版毛片免费区| 亚洲人成77777在线视频| 亚洲精品国产一区二区精华液| 激情视频va一区二区三区| 19禁男女啪啪无遮挡网站| 免费在线观看黄色视频的| 色婷婷久久久亚洲欧美| 一本一本久久a久久精品综合妖精| 亚洲成a人片在线一区二区| 黄色成人免费大全| 国产亚洲精品久久久久5区| 国产高清国产精品国产三级| 日本五十路高清| 欧美精品一区二区大全| 亚洲成人手机| 欧美激情 高清一区二区三区| 热99re8久久精品国产| 美女国产高潮福利片在线看| 亚洲av电影在线进入| 一级毛片电影观看| 欧美精品高潮呻吟av久久| 国产精品成人在线| 又黄又粗又硬又大视频| 久久天堂一区二区三区四区| 亚洲精品乱久久久久久| 天堂俺去俺来也www色官网| 十八禁网站网址无遮挡| 色综合欧美亚洲国产小说| 在线观看www视频免费| 国产av一区二区精品久久| 美女扒开内裤让男人捅视频| 搡老乐熟女国产| 在线观看免费日韩欧美大片| 女性生殖器流出的白浆| 久久香蕉激情| 老司机福利观看| 十八禁网站网址无遮挡| 精品久久久久久久毛片微露脸| 国产黄色免费在线视频| 精品欧美一区二区三区在线| 两性午夜刺激爽爽歪歪视频在线观看 | 中文字幕最新亚洲高清| 看免费av毛片| 午夜激情久久久久久久| 欧美乱码精品一区二区三区| 97在线人人人人妻| 亚洲精品粉嫩美女一区| 高清毛片免费观看视频网站 | 99国产精品99久久久久| 国产不卡av网站在线观看| 精品国产乱码久久久久久小说| 精品一区二区三区av网在线观看 | 亚洲一卡2卡3卡4卡5卡精品中文| 久久久国产成人免费| 国产成人啪精品午夜网站| 色婷婷久久久亚洲欧美| 美女国产高潮福利片在线看| 多毛熟女@视频| 不卡av一区二区三区| 亚洲精品乱久久久久久| xxxhd国产人妻xxx| 色老头精品视频在线观看| 国产不卡一卡二| 男女免费视频国产| 国产亚洲午夜精品一区二区久久| 免费日韩欧美在线观看| 大型黄色视频在线免费观看| 日韩三级视频一区二区三区| 满18在线观看网站| 亚洲免费av在线视频| 久久精品国产综合久久久| 狠狠精品人妻久久久久久综合| 色94色欧美一区二区| 久久久精品国产亚洲av高清涩受| 亚洲成国产人片在线观看| 久久精品亚洲精品国产色婷小说| 好男人电影高清在线观看| 欧美日本中文国产一区发布| 久久久国产成人免费| 午夜福利视频精品| 激情视频va一区二区三区| 日本黄色日本黄色录像| 欧美乱妇无乱码| 国产精品久久电影中文字幕 | 亚洲欧美一区二区三区黑人| 人人澡人人妻人| 美女午夜性视频免费| 国产国语露脸激情在线看| 麻豆成人av在线观看| 国产伦人伦偷精品视频| 脱女人内裤的视频| 深夜精品福利| 正在播放国产对白刺激| 日韩 欧美 亚洲 中文字幕| 18禁黄网站禁片午夜丰满| 女同久久另类99精品国产91| 精品福利永久在线观看| 美女福利国产在线| 日本黄色日本黄色录像| 人人妻人人添人人爽欧美一区卜| 一区二区日韩欧美中文字幕| 日韩大片免费观看网站| 日本五十路高清| 青草久久国产| 建设人人有责人人尽责人人享有的| 男女下面插进去视频免费观看| 亚洲成人手机| 国产免费现黄频在线看| 窝窝影院91人妻| 国产精品免费一区二区三区在线 | 中文字幕最新亚洲高清| 午夜福利乱码中文字幕| 欧美成人免费av一区二区三区 | 欧美黑人精品巨大| 人妻久久中文字幕网| 国产男靠女视频免费网站| tocl精华| 又紧又爽又黄一区二区| 精品免费久久久久久久清纯 | 亚洲少妇的诱惑av| 亚洲熟女精品中文字幕| 蜜桃国产av成人99| 久久性视频一级片| 日韩一区二区三区影片| 久久99一区二区三区| 丰满迷人的少妇在线观看| 午夜精品国产一区二区电影| 国产精品99久久99久久久不卡| 老熟女久久久| 俄罗斯特黄特色一大片| 搡老乐熟女国产| 国产精品1区2区在线观看. | 亚洲综合色网址| 不卡av一区二区三区| 国产亚洲精品第一综合不卡| 亚洲精品自拍成人| 日韩有码中文字幕| 国精品久久久久久国模美| 欧美日韩av久久| 十八禁网站网址无遮挡| 亚洲黑人精品在线| 亚洲欧洲精品一区二区精品久久久| 国产精品熟女久久久久浪| 脱女人内裤的视频| 久久久久网色| av视频免费观看在线观看| 国产熟女午夜一区二区三区| 搡老乐熟女国产| 欧美成人午夜精品| 啦啦啦免费观看视频1| 天天操日日干夜夜撸| 午夜成年电影在线免费观看| 亚洲熟女毛片儿| 一二三四社区在线视频社区8| 国产黄频视频在线观看| 欧美国产精品一级二级三级| 97人妻天天添夜夜摸| 久久毛片免费看一区二区三区| 1024视频免费在线观看| 91大片在线观看| 少妇粗大呻吟视频| 欧美精品一区二区大全| 无限看片的www在线观看| 90打野战视频偷拍视频| 精品高清国产在线一区| 90打野战视频偷拍视频| 天天躁日日躁夜夜躁夜夜| 色94色欧美一区二区| 黑人欧美特级aaaaaa片| 亚洲av美国av| 国产成人av激情在线播放| 宅男免费午夜| 青青草视频在线视频观看| 男女无遮挡免费网站观看| 亚洲第一欧美日韩一区二区三区 | 日本a在线网址| 日韩免费高清中文字幕av| 久久中文字幕人妻熟女| av电影中文网址| 叶爱在线成人免费视频播放| 亚洲va日本ⅴa欧美va伊人久久| 亚洲av电影在线进入| 丰满迷人的少妇在线观看| 国产一区有黄有色的免费视频| 久久精品91无色码中文字幕| 亚洲 欧美一区二区三区| 亚洲少妇的诱惑av| 十八禁人妻一区二区| 欧美人与性动交α欧美软件| 国产欧美日韩一区二区三| 如日韩欧美国产精品一区二区三区| 久久午夜综合久久蜜桃| 男女午夜视频在线观看| 欧美亚洲 丝袜 人妻 在线| 99国产精品99久久久久| 国产日韩欧美在线精品| 午夜福利在线观看吧| 亚洲精品久久午夜乱码| 亚洲精品在线美女| 国产av精品麻豆| 日韩大片免费观看网站| 日韩免费高清中文字幕av| 国产91精品成人一区二区三区 | 18禁观看日本| 大型av网站在线播放| 窝窝影院91人妻| 日本精品一区二区三区蜜桃| 国产99久久九九免费精品| 捣出白浆h1v1| 午夜日韩欧美国产| 久久中文字幕一级| 美女国产高潮福利片在线看| 1024视频免费在线观看| 热re99久久精品国产66热6| 在线观看免费日韩欧美大片| 欧美日韩亚洲高清精品| 老司机午夜十八禁免费视频| 天天影视国产精品| www.熟女人妻精品国产| 91精品三级在线观看| 日本av手机在线免费观看| 99在线人妻在线中文字幕 | 老熟妇仑乱视频hdxx| 国产国语露脸激情在线看| 99久久人妻综合| 成人国产av品久久久| av片东京热男人的天堂| 国产xxxxx性猛交| 免费久久久久久久精品成人欧美视频| 另类亚洲欧美激情| 91老司机精品| 国产亚洲欧美在线一区二区| 成人永久免费在线观看视频 | 中文亚洲av片在线观看爽 | 人人妻人人添人人爽欧美一区卜| 视频区欧美日本亚洲| 99九九在线精品视频| 少妇裸体淫交视频免费看高清 | 国产激情久久老熟女| 久久久精品免费免费高清| av天堂久久9| 日韩欧美三级三区| 啦啦啦视频在线资源免费观看| 性高湖久久久久久久久免费观看| 一本大道久久a久久精品| 亚洲七黄色美女视频| 777久久人妻少妇嫩草av网站| 又大又爽又粗| 国产欧美日韩一区二区三区在线| 日本撒尿小便嘘嘘汇集6| 国产日韩欧美在线精品| 夫妻午夜视频| 99精品欧美一区二区三区四区| 精品少妇久久久久久888优播| 日韩熟女老妇一区二区性免费视频| 天堂8中文在线网| 捣出白浆h1v1| 亚洲av片天天在线观看| 久久人妻熟女aⅴ| 国产精品1区2区在线观看. | 99久久精品国产亚洲精品| 无遮挡黄片免费观看| 老司机福利观看| 在线永久观看黄色视频| 黄色怎么调成土黄色| 91成年电影在线观看| 午夜福利影视在线免费观看| 最近最新免费中文字幕在线| 悠悠久久av| av片东京热男人的天堂| 久久精品aⅴ一区二区三区四区| 午夜激情久久久久久久| 一本一本久久a久久精品综合妖精| 中文字幕av电影在线播放| 老司机影院毛片| 超碰成人久久| 国产成人精品无人区| 变态另类成人亚洲欧美熟女 | 国产精品久久久av美女十八| svipshipincom国产片| 亚洲精品美女久久久久99蜜臀| 国产免费视频播放在线视频| 亚洲七黄色美女视频| 黑人巨大精品欧美一区二区mp4| 久9热在线精品视频| 日本五十路高清| 亚洲精品国产一区二区精华液| 国产一卡二卡三卡精品| 国产成人免费无遮挡视频| 日韩精品免费视频一区二区三区| 国产成人av激情在线播放| 一个人免费在线观看的高清视频| 亚洲午夜精品一区,二区,三区| 在线观看免费日韩欧美大片| 99国产极品粉嫩在线观看| 大片电影免费在线观看免费| 免费在线观看完整版高清| 啦啦啦视频在线资源免费观看| 黄频高清免费视频| 女同久久另类99精品国产91| 欧美日韩福利视频一区二区| 丁香欧美五月| 久久人妻av系列| 国产成人精品在线电影| 777久久人妻少妇嫩草av网站| 天天操日日干夜夜撸| 国产老妇伦熟女老妇高清| 精品免费久久久久久久清纯 | 9热在线视频观看99| 国产精品久久久久久人妻精品电影 | 国产精品国产高清国产av | 五月开心婷婷网| 日日夜夜操网爽| 女性生殖器流出的白浆| 国产av国产精品国产| 国产精品久久久人人做人人爽| 老司机午夜十八禁免费视频| 亚洲精品在线美女| 日韩欧美免费精品| 亚洲精品久久午夜乱码| 久热这里只有精品99| 一区二区av电影网| 99久久人妻综合| 精品国产一区二区久久| 十八禁高潮呻吟视频| 久久精品国产99精品国产亚洲性色 | 日本av手机在线免费观看| 国产日韩欧美在线精品| 日韩有码中文字幕| 国产精品98久久久久久宅男小说| 午夜福利在线免费观看网站| 久久影院123| 精品一区二区三卡| 18禁裸乳无遮挡动漫免费视频| 国产一区有黄有色的免费视频| 99久久精品国产亚洲精品| 少妇粗大呻吟视频| 黄频高清免费视频| 久久影院123| 亚洲av成人不卡在线观看播放网| 天堂中文最新版在线下载| 制服人妻中文乱码| 欧美+亚洲+日韩+国产| 亚洲七黄色美女视频| 丰满迷人的少妇在线观看| 丝瓜视频免费看黄片| 纵有疾风起免费观看全集完整版| 搡老乐熟女国产| 99久久人妻综合| 国产精品久久久久久人妻精品电影 | 黄色毛片三级朝国网站| 亚洲欧美色中文字幕在线| 视频在线观看一区二区三区| 国产av国产精品国产| 免费少妇av软件| 成年人黄色毛片网站| 王馨瑶露胸无遮挡在线观看| 国产精品久久久av美女十八| 一区二区三区精品91| 国产成人精品久久二区二区免费| 国产成人免费无遮挡视频| 国产日韩欧美亚洲二区| 视频在线观看一区二区三区| 国产成人免费无遮挡视频| 美女午夜性视频免费| 后天国语完整版免费观看| 国产亚洲精品一区二区www | 免费在线观看影片大全网站| 免费观看人在逋| 最近最新中文字幕大全电影3 | 欧美日韩亚洲高清精品| 男女之事视频高清在线观看| 淫妇啪啪啪对白视频| 搡老岳熟女国产| 国产熟女午夜一区二区三区| 女性被躁到高潮视频| 人人妻人人爽人人添夜夜欢视频| 亚洲成a人片在线一区二区| 一边摸一边做爽爽视频免费| 国产男女超爽视频在线观看| 国产男女内射视频| 三上悠亚av全集在线观看| 亚洲黑人精品在线| 亚洲成人手机| 国产一卡二卡三卡精品| 一本—道久久a久久精品蜜桃钙片| 欧美精品亚洲一区二区| 女性生殖器流出的白浆| 在线播放国产精品三级| 精品亚洲成国产av| 麻豆国产av国片精品| 老熟妇乱子伦视频在线观看| 女人久久www免费人成看片| 在线播放国产精品三级| 国产亚洲精品第一综合不卡| 成年人黄色毛片网站| 成年版毛片免费区| 国产av精品麻豆| 精品少妇久久久久久888优播| 午夜福利乱码中文字幕| 操美女的视频在线观看| 黄色 视频免费看| 午夜福利在线观看吧| 欧美乱码精品一区二区三区| 午夜福利,免费看| 欧美中文综合在线视频| 国产男靠女视频免费网站| 亚洲一卡2卡3卡4卡5卡精品中文| 国产精品1区2区在线观看. | av免费在线观看网站| 国产av精品麻豆| 黄片播放在线免费| 人妻 亚洲 视频| 大码成人一级视频| 男人舔女人的私密视频| 国产成人影院久久av| a级毛片黄视频| 久久人妻福利社区极品人妻图片| 一级毛片精品| 99国产精品免费福利视频| 国产精品欧美亚洲77777| 搡老岳熟女国产| av片东京热男人的天堂| 亚洲全国av大片| 69精品国产乱码久久久| 黄网站色视频无遮挡免费观看| 啪啪无遮挡十八禁网站| 日韩免费高清中文字幕av| 久久精品人人爽人人爽视色| 国产99久久九九免费精品| 亚洲男人天堂网一区| 免费av中文字幕在线| 国产淫语在线视频| 亚洲精品乱久久久久久| 日本五十路高清|