• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向嵌入式的卷積神經(jīng)網(wǎng)絡(luò)硬件加速器設(shè)計(jì)

    2021-02-22 12:00:30焦繼業(yè)徐華昊
    關(guān)鍵詞:定點(diǎn)運(yùn)算卷積

    唐 蕊,焦繼業(yè),徐華昊

    西安郵電大學(xué) 計(jì)算機(jī)學(xué)院,西安 710121

    近年來(lái),隨著人工智能應(yīng)用需求的快速增長(zhǎng),神經(jīng)網(wǎng)絡(luò)在學(xué)術(shù)研究和人工智能相關(guān)應(yīng)用中蓬勃發(fā)展,并被應(yīng)用于各種新興的智能領(lǐng)域,如語(yǔ)音識(shí)別、圖像分類等[1-4]。與此同時(shí),加速卷積運(yùn)算的硬件設(shè)計(jì)隨之產(chǎn)生,針對(duì)神經(jīng)網(wǎng)絡(luò)推理的加速芯片已成為該領(lǐng)域重要的發(fā)展方向。

    目前針對(duì)嵌入式端的神經(jīng)網(wǎng)絡(luò)加速優(yōu)化,可以從模型壓縮和優(yōu)化加速運(yùn)算兩方面出發(fā)。從模型壓縮角度講,主要通過(guò)一定的優(yōu)化方式來(lái)減小網(wǎng)絡(luò)模型所占的存儲(chǔ)空間,其中包括模型剪枝和模型參數(shù)低精度量化,參數(shù)的低精度量化對(duì)卷積網(wǎng)絡(luò)中所有的運(yùn)算加速都有效。從優(yōu)化加速運(yùn)算來(lái)講,主要針對(duì)神經(jīng)網(wǎng)絡(luò)中的結(jié)構(gòu)及權(quán)重參數(shù)的共享性進(jìn)行相關(guān)硬件單元的設(shè)計(jì),可用來(lái)加快神經(jīng)網(wǎng)絡(luò)的執(zhí)行速度,優(yōu)化設(shè)計(jì)的整體性能[5-7]。文獻(xiàn)[1]采用了數(shù)據(jù)量化的方式,分析參數(shù)的取值范圍,先確定量化的大致精度,然后選出最優(yōu)量化精度,將原有參數(shù)從64 位浮點(diǎn)數(shù)量化為16 位定點(diǎn)數(shù)來(lái)表示,顯著提升了運(yùn)行速度,并提出相應(yīng)的計(jì)算和存儲(chǔ)設(shè)計(jì),結(jié)果證明對(duì)卷積網(wǎng)絡(luò)的性能有明顯提升。文獻(xiàn)[2]采用動(dòng)態(tài)可配置定點(diǎn)數(shù)據(jù)來(lái)表示網(wǎng)絡(luò)的權(quán)重和激活函數(shù),在推斷的過(guò)程中也可保持較高的準(zhǔn)確率。結(jié)果表明,低精度量化后,在盡可能保持準(zhǔn)確性的前提下,對(duì)內(nèi)存容量和帶寬的需求減小了50%。文獻(xiàn)[3]在進(jìn)行數(shù)據(jù)量化時(shí),采用的是非線性量化,分析每一層參數(shù)的范圍,確定數(shù)據(jù)量化的系數(shù),對(duì)參數(shù)進(jìn)行量化。谷歌TPU、NVIDIA Tesla V100、寒武紀(jì)DianNao[8-9]等是具有代表性的人工智能加速芯片,均采用了數(shù)據(jù)低精度量化的思想。在卷積神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)各層參數(shù)范圍各有差異,不同網(wǎng)絡(luò)層權(quán)重的概率分布也有一定的差異。

    一般來(lái)說(shuō),神經(jīng)網(wǎng)絡(luò)中的參數(shù)主要為32 位和64 位浮點(diǎn)數(shù)。然而,隨著卷積神經(jīng)網(wǎng)絡(luò)模型的層數(shù)越來(lái)越多,其中權(quán)重參數(shù)數(shù)量也在增長(zhǎng)。因此網(wǎng)絡(luò)中包含的運(yùn)算量愈加復(fù)雜,在一些場(chǎng)景上限制了相應(yīng)網(wǎng)絡(luò)模型的部署,需要借助模型壓縮、優(yōu)化加速運(yùn)算等方法突破瓶頸[10-11]。通常情況下,嵌入式設(shè)備上計(jì)算資源是非常有限的,并且對(duì)功耗有著比較嚴(yán)格的要求,使得嵌入式設(shè)備的計(jì)算能力與存儲(chǔ)訪問(wèn)能力受到了極大的限制。卷積神經(jīng)網(wǎng)絡(luò)中較為復(fù)雜的運(yùn)算及存儲(chǔ)訪問(wèn)需求使其在嵌入端的部署成為難點(diǎn)[12],其中最為復(fù)雜的便是卷積運(yùn)算。針對(duì)以上情況,神經(jīng)網(wǎng)絡(luò)模型在嵌入式設(shè)備上進(jìn)行實(shí)現(xiàn),需在保持準(zhǔn)確性的前提下,解決其運(yùn)算量大、存儲(chǔ)需求大的問(wèn)題[13]。

    為了解決該問(wèn)題,本文主要采用了將模型參數(shù)量化與硬件設(shè)計(jì)加速運(yùn)算的方式結(jié)合起來(lái)的方法,更大程度優(yōu)化網(wǎng)絡(luò)模型。首先,提出并設(shè)計(jì)了針對(duì)嵌入式平臺(tái)的低精度定點(diǎn)量化單元,研究了神經(jīng)網(wǎng)絡(luò)中經(jīng)過(guò)訓(xùn)練后的數(shù)據(jù)分布范圍及數(shù)據(jù)量化原理,根據(jù)最小誤差量化算法設(shè)計(jì)了動(dòng)態(tài)低精度量化單元,對(duì)數(shù)據(jù)進(jìn)行低精度定點(diǎn)量化。在保持精度的同時(shí)減小了數(shù)據(jù)的位寬,進(jìn)而減小了對(duì)內(nèi)存及帶寬的需求。其次,設(shè)計(jì)了可循環(huán)調(diào)用的矩陣卷積運(yùn)算的結(jié)構(gòu),使量化后的數(shù)據(jù)可并行執(zhí)行卷積運(yùn)算,進(jìn)而縮短了運(yùn)算的執(zhí)行時(shí)間,提升整體性能。本設(shè)計(jì)在減小網(wǎng)絡(luò)中數(shù)據(jù)位寬,實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)輕量化的同時(shí),又保證了數(shù)據(jù)精度,可用在對(duì)實(shí)時(shí)性要求高的嵌入式設(shè)備中。

    1 低精度動(dòng)態(tài)量化研究

    1.1 動(dòng)態(tài)量化原理

    在神經(jīng)網(wǎng)絡(luò)中,對(duì)其中的FP32 類型的參數(shù)進(jìn)行INT16 量化,使其模型更小,推斷更快。對(duì)參數(shù)量化精簡(jiǎn)的方式之所以有效,廣義來(lái)說(shuō),是由于經(jīng)過(guò)訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)對(duì)噪聲和較小的擾動(dòng)具有魯棒性,意味著在將數(shù)據(jù)量化并做相關(guān)舍入處理后,卷積網(wǎng)絡(luò)的推斷過(guò)程依舊可以得到一個(gè)相當(dāng)準(zhǔn)確的結(jié)果[14-15]。因此參數(shù)量化在幾乎不犧牲精度的情況下,可使執(zhí)行速度加快,進(jìn)而有效提升對(duì)數(shù)據(jù)的處理能力。低精度量化從某個(gè)角度來(lái)說(shuō),是一種數(shù)據(jù)在不同范圍空間的映射[16]。經(jīng)過(guò)大量研究,針對(duì)神經(jīng)網(wǎng)絡(luò)中的低精度量化,總結(jié)得出下面結(jié)論:

    (1)相比于FP32模型,低精度量化后卷積速度得到大幅提升。

    (2)量化后的網(wǎng)絡(luò)模型權(quán)重所占空間降低60%~70%,有效提升對(duì)數(shù)據(jù)的處理能力。

    (3)INT16 量化可以在提升運(yùn)行速度的同時(shí),可最大程度保持準(zhǔn)確性。

    對(duì)于INT8量化來(lái)說(shuō),在追求運(yùn)行速度的同時(shí),準(zhǔn)確性也有更大程度的損失,本設(shè)計(jì)旨在實(shí)現(xiàn)高性能的同時(shí),也盡可能保持?jǐn)?shù)據(jù)最好精度,因此將輸入的FP32數(shù)據(jù)量化為INT16定點(diǎn)數(shù)據(jù),然后進(jìn)行卷積運(yùn)算。整體設(shè)計(jì)的原理如圖1,首先需要分析神經(jīng)網(wǎng)絡(luò)中參數(shù)的數(shù)值分布范圍,如第一層神經(jīng)元的輸入、權(quán)重等,然后進(jìn)行數(shù)據(jù)的低精度量化,并將量化后的數(shù)據(jù)放入存儲(chǔ)。在執(zhí)行卷積運(yùn)算時(shí)將數(shù)據(jù)從存儲(chǔ)中取出,下一時(shí)鐘周期送入并行卷積運(yùn)算單元進(jìn)行卷積計(jì)算,實(shí)現(xiàn)了取數(shù)據(jù)和運(yùn)算的流水結(jié)構(gòu)。卷積運(yùn)算后將結(jié)果依次送至下一個(gè)存儲(chǔ)。重復(fù)調(diào)用卷積運(yùn)算單元進(jìn)行卷積運(yùn)算。

    然而,針對(duì)神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō),從浮點(diǎn)數(shù)據(jù)量化而來(lái)的每個(gè)定點(diǎn)數(shù)據(jù),以及每個(gè)中間參數(shù)的精度都是不確定的,固定精度量化會(huì)產(chǎn)生一些不必要的誤差。經(jīng)過(guò)大量研究,結(jié)果表明,在對(duì)不同精度的數(shù)據(jù)進(jìn)行低精度量化時(shí),若采用固定精度定點(diǎn)量化,則量化后的數(shù)據(jù)精度越高,數(shù)據(jù)準(zhǔn)確性也越高。然而對(duì)于同等位寬數(shù)據(jù)進(jìn)行量化時(shí),采用動(dòng)態(tài)多精度量化的情況下,數(shù)據(jù)準(zhǔn)確性更高。當(dāng)采用16 bit 的數(shù)據(jù)動(dòng)態(tài)低精度量化時(shí),引入的誤差很小[17],并且對(duì)內(nèi)存容量和對(duì)帶寬的需求減小了50%。相比于固定精度定點(diǎn)量化,動(dòng)態(tài)多精度定點(diǎn)量化更適合神經(jīng)網(wǎng)絡(luò)中的卷積運(yùn)算,進(jìn)而最小化卷積網(wǎng)絡(luò)中數(shù)據(jù)量化過(guò)程產(chǎn)生的誤差。

    因此針對(duì)該問(wèn)題,在本設(shè)計(jì)中使用動(dòng)態(tài)多精度定點(diǎn)量化方法對(duì)浮點(diǎn)數(shù)據(jù)進(jìn)行量化。

    浮點(diǎn)與定點(diǎn)之間的量化關(guān)系如下所示:

    圖1 量化卷積運(yùn)算原理示意圖

    其中,x表示浮點(diǎn)數(shù),q表示這個(gè)浮點(diǎn)數(shù)對(duì)應(yīng)的Qn型定點(diǎn)數(shù)。

    在量化單元的設(shè)計(jì)過(guò)程中,采用了最小誤差量化算法的思想,如式(3):

    其中,Dfloat為輸入的原浮點(diǎn)型參數(shù),Dfixed(L,Q)為量化后的定點(diǎn)數(shù)據(jù)。由于網(wǎng)絡(luò)中的所有參數(shù)的精度不完全一致,根據(jù)輸入數(shù)據(jù)的數(shù)值范圍,選擇合適的數(shù)據(jù)量化比例并使用Q 格式表示,通過(guò)動(dòng)態(tài)設(shè)置數(shù)據(jù)的Q 值,即可調(diào)整量化后的定點(diǎn)數(shù)據(jù)精度,進(jìn)而最小化定點(diǎn)量化所帶來(lái)的誤差。

    1.2 數(shù)據(jù)類型對(duì)比

    計(jì)算機(jī)中常用的數(shù)據(jù)類型有兩種,包括定點(diǎn)數(shù)和浮點(diǎn)數(shù)。一般來(lái)說(shuō),定點(diǎn)格式允許表示的數(shù)值范圍有限,但要求的處理硬件單元比較簡(jiǎn)單。浮點(diǎn)格式則相對(duì)復(fù)雜,浮點(diǎn)運(yùn)算廣泛應(yīng)用于通用處理器,如圖形處理器[18]。

    定點(diǎn)數(shù)的小數(shù)點(diǎn)位置是固定的。定點(diǎn)運(yùn)算相比于浮點(diǎn)運(yùn)算有著更低的硬件成本,被廣泛應(yīng)用于神經(jīng)網(wǎng)絡(luò)加速器中,定點(diǎn)數(shù)可以在存儲(chǔ)數(shù)據(jù)時(shí)節(jié)省更多的內(nèi)存容量和帶寬資源。

    1.3 定點(diǎn)數(shù)的表示格式——Q表示法

    一個(gè)定點(diǎn)數(shù)據(jù)的最大數(shù)值范圍取決于所給定的字長(zhǎng)。數(shù)值中定義整數(shù)最低位和小數(shù)最高位之間的方式被稱為定標(biāo),即指示了小數(shù)點(diǎn)的位置。定標(biāo)有兩種方法,包括Q 表示法和S 表示法,本設(shè)計(jì)中的量化部分借助Q表示法完成。

    16 位定點(diǎn)數(shù)的部分Q 值以及每個(gè)Q 值的表示精度如表1。量化單元是該設(shè)計(jì)中的一大核心模塊,量化數(shù)據(jù)的精度決定了整個(gè)卷積運(yùn)算中的數(shù)據(jù)精度。對(duì)于16位的定點(diǎn)數(shù)據(jù),若保留最高精度可使用Q15 格式,即將數(shù)據(jù)放大215倍后用定點(diǎn)數(shù)表示,然而,若浮點(diǎn)數(shù)的有效數(shù)據(jù)超出該精度表示范圍,即使該數(shù)據(jù)量化后帶來(lái)的誤差非常小,但將會(huì)損失全部有效數(shù)據(jù)。因此量化適用于有效精度在Q格式可表示最高精度范圍內(nèi)的數(shù)據(jù),有效精度超出最高精度表示范圍的極少數(shù)據(jù)將被舍棄。

    表1 16位定點(diǎn)數(shù)的Q格式表示及精度

    使用數(shù)據(jù)量化會(huì)引入額外的空間存儲(chǔ)Q值,但是相比于存儲(chǔ)原本的浮點(diǎn)數(shù)據(jù),定點(diǎn)數(shù)與Q值所占的存儲(chǔ)空間會(huì)明顯降低,同時(shí)也降低了帶寬需求。

    為進(jìn)一步解決量化過(guò)程中的誤差問(wèn)題,數(shù)據(jù)量化后使用了近似舍入方法對(duì)量化結(jié)果進(jìn)行微調(diào)。

    1.4 數(shù)據(jù)量化的舍入處理

    在運(yùn)算過(guò)程中,對(duì)量化后的數(shù)據(jù)進(jìn)行數(shù)據(jù)舍入的方案也是至關(guān)重要的。例如定點(diǎn)數(shù)可以表示為[IL:FL],分別對(duì)應(yīng)著量化后定點(diǎn)數(shù)據(jù)的整數(shù)部分和小數(shù)部分,定點(diǎn)數(shù)據(jù)范圍是[-2IL-1,2IL-1-2-FL],其中IL、FL分別代表整數(shù)和小數(shù)位寬[19]。數(shù)據(jù)在量化過(guò)程中會(huì)涉及到數(shù)據(jù)截?cái)?,針?duì)此情況本設(shè)計(jì)按照就近舍入原則,對(duì)量化后的定點(diǎn)數(shù)據(jù)進(jìn)行分析,若定點(diǎn)數(shù)據(jù)中被截?cái)嗖糠肿罡呶粸?時(shí),即被舍去部分的數(shù)值大于真實(shí)數(shù)值的0.5時(shí),則將數(shù)據(jù)進(jìn)行向上取整,小于0.5時(shí)將數(shù)據(jù)向下取整,保留整數(shù)部分即可。本設(shè)計(jì)中的數(shù)據(jù)舍入公式如式(4):

    1.5 卷積運(yùn)算單元結(jié)構(gòu)

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)主要包括輸入層、卷積層、池化層、全連接層及輸出層,其中最主要的運(yùn)算為卷積運(yùn)算,并且卷積層和全連接層包含的便是神經(jīng)網(wǎng)絡(luò)中最復(fù)雜、最耗時(shí)的運(yùn)算[20]。在常用的網(wǎng)絡(luò)模型中,如Alexnet 網(wǎng)絡(luò)中包含的計(jì)算量達(dá)到上億級(jí),單是乘法運(yùn)算就至少需要進(jìn)行7 億次。對(duì)于CNN的卷積層,每層的計(jì)算公式如式(5):

    其中,w是權(quán)重矩陣,b為偏置,f是激活函數(shù),x是每一層的輸入,Y是每一層的輸出。

    詳細(xì)來(lái)說(shuō),其中主要卷積運(yùn)算如下:

    全部的n個(gè)輸入樣本為xi(i∈[1,n]),對(duì)應(yīng)的內(nèi)核權(quán)重為wi,j(i∈ [1,n],j∈[1,m]),相乘后可得到對(duì)應(yīng)的輸出w1,j x1+w2,j x2+…+wi,j xi+…+wn,j xn當(dāng)浮點(diǎn)數(shù)量化為低精度的定點(diǎn)數(shù)后,根據(jù)輸入的參數(shù)量化為使用Q格式的定點(diǎn)數(shù)據(jù)后,根據(jù)前后Q 值的變化,在計(jì)算完乘積之后,對(duì)結(jié)果進(jìn)行截?cái)嗯c舍入處理,得出最終結(jié)果。

    定點(diǎn)數(shù)據(jù)的乘法偽代碼如下:

    由偽代碼可知,首先將兩個(gè)輸入數(shù)據(jù)進(jìn)行相乘并將Q值相加,即結(jié)果中的小數(shù)部分位寬是輸入數(shù)據(jù)的小數(shù)位寬累加和,此時(shí)可得出結(jié)果的數(shù)據(jù)范圍,進(jìn)而確定Q值。然后將超出位寬的低位部分進(jìn)行截?cái)啵⑦M(jìn)行舍入處理。在數(shù)據(jù)截?cái)鄷r(shí)會(huì)產(chǎn)生誤差,但是由于截?cái)嗟氖菙?shù)據(jù)最低位部分,即小數(shù)部分最低位,帶來(lái)的誤差很小。

    而卷積中的加法運(yùn)算原理與乘法不同。對(duì)于Q 值相同的定點(diǎn)數(shù),直接進(jìn)行運(yùn)算,結(jié)果的Q 值與加數(shù)一致。然而,當(dāng)兩個(gè)Q 值不同的定點(diǎn)數(shù)進(jìn)行運(yùn)算時(shí),需先將Q 較小的定點(diǎn)數(shù)進(jìn)行移位處理,直至兩加數(shù)Q 值一致,此時(shí)可直接執(zhí)行加法運(yùn)算。

    在本設(shè)計(jì)中,原本需由浮點(diǎn)數(shù)執(zhí)行的卷積運(yùn)算轉(zhuǎn)換為量化后的定點(diǎn)數(shù)據(jù)來(lái)執(zhí)行,并將結(jié)果輸出。

    2 面向AI的動(dòng)態(tài)定點(diǎn)量化單元架構(gòu)

    2.1 數(shù)據(jù)量化單元設(shè)計(jì)

    從圖2可以看出,首先根據(jù)輸入數(shù)據(jù)可以得到結(jié)果的符號(hào)位。其次輸入數(shù)據(jù)均為符合IEEE-754標(biāo)準(zhǔn)的浮點(diǎn)數(shù),其中尾數(shù)部分給出了有效數(shù)字的位數(shù),因而決定了浮點(diǎn)數(shù)的表示精度。而階碼指明小數(shù)點(diǎn)在數(shù)據(jù)中的位置,整數(shù)部分位寬便可確定,同時(shí)決定了浮點(diǎn)數(shù)的數(shù)據(jù)范圍,因而確定了數(shù)據(jù)量化后最適合的Q 值,并做數(shù)據(jù)截?cái)嗪蛿?shù)據(jù)舍入處理,進(jìn)而使用Q格式完成參數(shù)的動(dòng)態(tài)低精度定點(diǎn)量化,將量化后的結(jié)果輸出。

    圖2 動(dòng)態(tài)低精度量化單元原理圖

    2.2 卷積運(yùn)算單元架構(gòu)設(shè)計(jì)

    卷積網(wǎng)絡(luò)中包含大量的卷積運(yùn)算,從硬件層面講,卷積運(yùn)算分解下來(lái)即為連續(xù)的乘法和加法運(yùn)算,其中乘法運(yùn)算設(shè)計(jì)原理圖如圖3所示。

    圖3 乘法單元設(shè)計(jì)原理圖

    卷積層主要是由卷積核組成的,卷積核的作用主要是對(duì)神經(jīng)網(wǎng)絡(luò)中輸入的特征圖進(jìn)行特征提取,執(zhí)行對(duì)應(yīng)參數(shù)的卷積運(yùn)算[21-22]。在該部分的乘法單元設(shè)計(jì)中,將輸入的兩個(gè)參數(shù)送入乘法器中,首先可以根據(jù)輸入數(shù)據(jù)得到乘法運(yùn)算的結(jié)果,并確定符號(hào)位,然后根據(jù)兩個(gè)輸入數(shù)據(jù)的Q值及最小誤差量化算法的思想,確定結(jié)果的Q 格式表示,對(duì)結(jié)果進(jìn)行截?cái)嗖僮骱蜕崛胩幚恚c量化原理一致,得到最終的結(jié)果并輸出。另外,針對(duì)卷積運(yùn)算原理,提出并設(shè)計(jì)了矩陣運(yùn)算單元,使數(shù)據(jù)并行執(zhí)行乘法運(yùn)算,可提升整體性能。

    一般而言,針對(duì)神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算加速的硬件設(shè)計(jì),重點(diǎn)要考慮運(yùn)算單元的并行性,如Alexnet 網(wǎng)絡(luò)模型,共包括8 層,其中有5 層為卷積層。然而,對(duì)于在嵌入式設(shè)備來(lái)講,完全實(shí)現(xiàn)卷積核之間與不同層神經(jīng)網(wǎng)絡(luò)的并行執(zhí)行幾乎是不可能的,本文主要針對(duì)卷積核內(nèi)的并行化執(zhí)行完成設(shè)計(jì)。圖4為矩陣卷積運(yùn)算設(shè)計(jì)架構(gòu),針對(duì)目前最常用的3×3 的卷積核設(shè)計(jì)了并行卷積運(yùn)算架構(gòu),輸入層是大小為13×13的神經(jīng)元矩陣。經(jīng)過(guò)量化后的結(jié)果按照一定順序存入存儲(chǔ)矩陣中,存儲(chǔ)單元中高位為量化后的定點(diǎn)數(shù),低位為對(duì)應(yīng)的Q 值,之后從存儲(chǔ)中取出對(duì)應(yīng)的數(shù)據(jù)送至卷積運(yùn)算單元的輸入端,經(jīng)邊界填充最后可得到169個(gè)神經(jīng)元輸出。

    圖4 矩陣卷積運(yùn)算單元設(shè)計(jì)架構(gòu)

    本設(shè)計(jì)可在單周期內(nèi)從對(duì)應(yīng)存儲(chǔ)中取出量化后的數(shù)據(jù)送入卷積運(yùn)算單元中,并行執(zhí)行9 次乘法操作,隨后將結(jié)果送入加法器,完成累加得到卷積結(jié)果。矩陣并行卷積運(yùn)算單元共包含了9個(gè)乘法單元,使用空間換取時(shí)間的思想,在不增加核心邏輯資源的前提下,適當(dāng)?shù)貙⒎謺r(shí)復(fù)用的電路進(jìn)行復(fù)制,在保證控制面積的前提下更好地提升性能。本設(shè)計(jì)需耗時(shí)169 個(gè)時(shí)鐘周期完成卷積運(yùn)算,有效地提升了運(yùn)算的效率。

    2.3 量化卷積架構(gòu)設(shè)計(jì)

    圖5 量化卷積單元架構(gòu)

    量化卷積單元整體架構(gòu)主要包括量化單元、存儲(chǔ)模塊以及可循環(huán)調(diào)用的并行卷積運(yùn)算單元,量化卷積單元整體架構(gòu)如圖5。

    首先將網(wǎng)絡(luò)模型中的參數(shù)如神經(jīng)元的輸入、權(quán)重等進(jìn)行動(dòng)態(tài)低精度定點(diǎn)量化,即對(duì)數(shù)據(jù)進(jìn)行預(yù)處理操作,然后分別存入對(duì)應(yīng)的存儲(chǔ)單元中。在執(zhí)行卷積運(yùn)算時(shí),將數(shù)據(jù)分別從存儲(chǔ)中取出,送入卷積運(yùn)算單元,運(yùn)算完成后將結(jié)果輸出至存儲(chǔ)并進(jìn)行截?cái)嗪蜕崛胩幚恚h(huán)調(diào)用卷積運(yùn)算單元進(jìn)行計(jì)算。

    3 驗(yàn)證與分析

    3.1 性能參數(shù)

    本設(shè)計(jì)使用0.11 μm SMIC 工藝庫(kù)進(jìn)行綜合,綜合后的參數(shù)如表2所示。

    表2 量化卷積單元參數(shù)表

    本設(shè)計(jì)實(shí)現(xiàn)的功能為量化及卷積運(yùn)算,綜合后的量化與卷積單元面積為13 740門(mén),功耗大小為0.992 5 mW。在本設(shè)計(jì)中針對(duì)運(yùn)算加速做了相關(guān)的并行卷積運(yùn)算單元設(shè)計(jì),因此可有效提升卷積運(yùn)算的性能,并且后期經(jīng)過(guò)驗(yàn)證,本設(shè)計(jì)滿足每個(gè)關(guān)鍵路徑的時(shí)序要求。該性能參數(shù)表進(jìn)一步證明本設(shè)計(jì)適合使用在對(duì)實(shí)時(shí)性有要求的嵌入式設(shè)備中。

    3.2 結(jié)果準(zhǔn)確性驗(yàn)證

    本設(shè)計(jì)在FPGA 平臺(tái)Stratix IV GX EP4SGX230進(jìn)行驗(yàn)證,并完成了結(jié)果準(zhǔn)確性對(duì)比。首先對(duì)原始的浮點(diǎn)數(shù)據(jù)不做量化處理,直接進(jìn)行卷積運(yùn)算,可得到當(dāng)前結(jié)果的準(zhǔn)確性。之后將原始的浮點(diǎn)數(shù)據(jù)分別進(jìn)行16 bit、8 bit 的固定精度量化,在16 bit 情況下量化為Q14 格式的數(shù)據(jù),8 bit情況下對(duì)權(quán)重和偏置量化為Q6格式數(shù)據(jù),將輸入輸出量化為Q8格式數(shù)據(jù),得出對(duì)應(yīng)結(jié)果。最后驗(yàn)證本設(shè)計(jì)中動(dòng)態(tài)多精度(Dynamic Multi-Precision,DMP)量化后卷積運(yùn)算的結(jié)果準(zhǔn)確性。結(jié)果準(zhǔn)確性對(duì)比如表3。

    表3 結(jié)果準(zhǔn)確性對(duì)比

    結(jié)果表明,直接使用浮點(diǎn)數(shù)據(jù)進(jìn)行卷積運(yùn)算的數(shù)據(jù)準(zhǔn)確性最高,然而分別對(duì)數(shù)據(jù)進(jìn)行16 bit和8 bit量化時(shí)發(fā)現(xiàn),量化后的數(shù)據(jù)位寬越大,準(zhǔn)確性越高。本設(shè)計(jì)中,對(duì)數(shù)據(jù)進(jìn)行16 bit 多精度量化時(shí),結(jié)果表明數(shù)據(jù)的準(zhǔn)確性達(dá)到了97.96%,由于有個(gè)別數(shù)據(jù)精度特別低,量化過(guò)程中的數(shù)據(jù)截?cái)鄷?huì)帶來(lái)一定的誤差,處于合理范圍內(nèi),不影響網(wǎng)絡(luò)推理的正常功能。

    3.3 性能測(cè)試對(duì)比

    本文還分別與使用RISC-V處理器(E203)[23]、Cortex M4與Matlab模擬執(zhí)行卷積運(yùn)算的時(shí)間進(jìn)行對(duì)比。性能測(cè)試對(duì)比如表4。

    表4 性能測(cè)試對(duì)比

    在神經(jīng)網(wǎng)絡(luò)模型中,卷積層包含的運(yùn)算占了總體的90%以上。針對(duì)神經(jīng)網(wǎng)絡(luò)Alexnet 模型進(jìn)行性能驗(yàn)證,輸入神經(jīng)元數(shù)量為169 個(gè),即輸入數(shù)據(jù)的矩陣大小為13×13,卷積核大小為3×3,跨度為1,在不同平臺(tái)模擬卷積運(yùn)算。本設(shè)計(jì)中測(cè)試激勵(lì)模擬了169 組隨機(jī)數(shù)據(jù)進(jìn)行驗(yàn)證。結(jié)果表明,編寫(xiě)C++代碼軟件模擬實(shí)現(xiàn)卷積運(yùn)算,在CortexM4 開(kāi)發(fā)板進(jìn)行測(cè)試,參與運(yùn)算的為浮點(diǎn)數(shù)。在100 MHz 時(shí)鐘頻率下測(cè)得執(zhí)行時(shí)間為4.10 ms。由于RISC-V 處理器(E203)不支持浮點(diǎn)數(shù)據(jù),模擬相同數(shù)量的INT32數(shù)據(jù),經(jīng)驗(yàn)證得出在100 MHz時(shí)鐘下執(zhí)行卷積運(yùn)算時(shí)間為3.03 ms。在Matlab上調(diào)用卷積函數(shù)的方法,模擬相同數(shù)量的浮點(diǎn)數(shù)據(jù)執(zhí)行卷積運(yùn)算,測(cè)得執(zhí)行時(shí)間為230 ms,本設(shè)計(jì)中模擬給出同等數(shù)量的浮點(diǎn)數(shù)據(jù)量化后的INT16數(shù)據(jù),在100 MHz時(shí)鐘下執(zhí)行時(shí)間約為0.001 71 ms。經(jīng)對(duì)比證明了該設(shè)計(jì)可有效提升卷積運(yùn)算性能。

    4 結(jié)束語(yǔ)

    本文面向嵌入式平臺(tái)提出一種卷積神經(jīng)網(wǎng)絡(luò)硬件加速器的設(shè)計(jì)與實(shí)現(xiàn)方法,采用卷積加速模塊化和量化精度可配置的思想,針對(duì)神經(jīng)網(wǎng)絡(luò)推理加速設(shè)計(jì)了低精度動(dòng)態(tài)量化單元與矩陣卷積運(yùn)算架構(gòu),主要針對(duì)網(wǎng)絡(luò)模型的卷積運(yùn)算做加速。該設(shè)計(jì)使用16 位定點(diǎn)數(shù)據(jù)表示,內(nèi)存占用量和帶寬需求減半,數(shù)據(jù)精確度達(dá)到97.96%,對(duì)卷積網(wǎng)絡(luò)的正常功能影響較小,與二進(jìn)制設(shè)計(jì)相比,它具有更高的精度,性能相比軟件實(shí)現(xiàn)有大幅提升,相比CortexM4 執(zhí)行卷積運(yùn)算提升了90%以上,可有效加快卷積運(yùn)算執(zhí)行速度,適用于提高神經(jīng)網(wǎng)絡(luò)在嵌入式平臺(tái)的性能,為嵌入式卷積網(wǎng)絡(luò)推理加速提供了方法。后續(xù)工作中還需繼續(xù)深入研究,更好地實(shí)現(xiàn)卷積核間及層間的并行性,同時(shí)為移植到RISC-V 處理器中并完成指令集融合的協(xié)處理器做準(zhǔn)備。

    猜你喜歡
    定點(diǎn)運(yùn)算卷積
    例談圓錐曲線中的定點(diǎn)定值問(wèn)題
    重視運(yùn)算與推理,解決數(shù)列求和題
    定點(diǎn)幫扶讓村民過(guò)上美好生活
    解析幾何中定點(diǎn)問(wèn)題的處理策略
    基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
    直線過(guò)定點(diǎn)的5種特優(yōu)解法
    有趣的運(yùn)算
    從濾波器理解卷積
    電子制作(2019年11期)2019-07-04 00:34:38
    基于傅里葉域卷積表示的目標(biāo)跟蹤算法
    “整式的乘法與因式分解”知識(shí)歸納
    一进一出抽搐动态| 欧美色欧美亚洲另类二区| 老熟妇乱子伦视频在线观看| 亚洲一区二区三区不卡视频| 一级毛片高清免费大全| 人妻丰满熟妇av一区二区三区| 精品久久久久久久人妻蜜臀av| 最新在线观看一区二区三区| 久99久视频精品免费| 日本一二三区视频观看| 国内毛片毛片毛片毛片毛片| 国产精品一及| 欧美+亚洲+日韩+国产| 亚洲精品一区av在线观看| 亚洲精品在线观看二区| 亚洲精品在线美女| 亚洲全国av大片| 人人妻,人人澡人人爽秒播| 国产成人系列免费观看| 亚洲,欧美精品.| 国产av不卡久久| 美女高潮喷水抽搐中文字幕| 亚洲,欧美精品.| 午夜福利免费观看在线| 亚洲精品国产精品久久久不卡| 久久中文字幕人妻熟女| 舔av片在线| 久久精品91无色码中文字幕| 久久久精品国产亚洲av高清涩受| 麻豆成人午夜福利视频| 两人在一起打扑克的视频| 女人被狂操c到高潮| 成人亚洲精品av一区二区| xxxwww97欧美| 欧美另类亚洲清纯唯美| 九色国产91popny在线| 啦啦啦观看免费观看视频高清| 免费在线观看日本一区| 久久国产精品人妻蜜桃| 脱女人内裤的视频| 欧美大码av| 色综合婷婷激情| 欧美乱码精品一区二区三区| 国产成人av激情在线播放| 日日爽夜夜爽网站| 日韩国内少妇激情av| 成人国产综合亚洲| 精品国产亚洲在线| 久久久久亚洲av毛片大全| 国产不卡一卡二| 久久这里只有精品中国| 黑人操中国人逼视频| 丁香六月欧美| 手机成人av网站| 久久久久久九九精品二区国产 | 无遮挡黄片免费观看| 两个人的视频大全免费| 午夜福利高清视频| 日韩精品中文字幕看吧| 成人特级黄色片久久久久久久| 我的老师免费观看完整版| 婷婷精品国产亚洲av在线| 亚洲av成人不卡在线观看播放网| 欧美日本亚洲视频在线播放| 欧美黑人精品巨大| 欧美午夜高清在线| 亚洲精品粉嫩美女一区| 国产野战对白在线观看| 搡老岳熟女国产| 宅男免费午夜| 午夜福利免费观看在线| 亚洲国产欧美一区二区综合| 操出白浆在线播放| 国产单亲对白刺激| 色尼玛亚洲综合影院| 亚洲欧美日韩东京热| 成人永久免费在线观看视频| 免费观看在线日韩| 久久欧美精品欧美久久欧美| 国产精品av视频在线免费观看| 99久久中文字幕三级久久日本| 亚洲国产欧美人成| 最近中文字幕高清免费大全6| 午夜精品在线福利| a级毛色黄片| 精品久久久久久久久久免费视频| 中文资源天堂在线| 三级经典国产精品| 国产午夜福利久久久久久| 国产爱豆传媒在线观看| 自拍偷自拍亚洲精品老妇| 久久99热这里只有精品18| 中文精品一卡2卡3卡4更新| 国产成年人精品一区二区| 亚洲精品粉嫩美女一区| 日韩成人av中文字幕在线观看| 中国美女看黄片| 国产精品一二三区在线看| 又黄又爽又刺激的免费视频.| 中国美白少妇内射xxxbb| 亚洲色图av天堂| 欧美+亚洲+日韩+国产| 国产精品久久久久久精品电影| 国产精品爽爽va在线观看网站| 日日摸夜夜添夜夜爱| 少妇人妻精品综合一区二区 | 欧美日韩国产亚洲二区| 婷婷精品国产亚洲av| 日韩欧美 国产精品| 最好的美女福利视频网| 免费不卡的大黄色大毛片视频在线观看 | eeuss影院久久| 成人三级黄色视频| 免费av毛片视频| 日日撸夜夜添| 超碰av人人做人人爽久久| 久久午夜福利片| 桃色一区二区三区在线观看| 国产av一区在线观看免费| 99热这里只有是精品50| 国产精品电影一区二区三区| 亚洲最大成人中文| 国产精品一区二区性色av| 精华霜和精华液先用哪个| 五月玫瑰六月丁香| 国国产精品蜜臀av免费| 卡戴珊不雅视频在线播放| 男人和女人高潮做爰伦理| 久久久久性生活片| 免费看日本二区| 亚洲在线观看片| 成人高潮视频无遮挡免费网站| 亚洲中文字幕一区二区三区有码在线看| 蜜臀久久99精品久久宅男| 搡女人真爽免费视频火全软件| 亚洲精品色激情综合| 中文字幕熟女人妻在线| 一级毛片我不卡| 麻豆精品久久久久久蜜桃| 99久久人妻综合| 欧美最黄视频在线播放免费| 成人永久免费在线观看视频| 天堂中文最新版在线下载 | 人人妻人人澡人人爽人人夜夜 | 亚洲无线在线观看| 观看美女的网站| 日韩亚洲欧美综合| 少妇熟女欧美另类| 内地一区二区视频在线| 啦啦啦观看免费观看视频高清| 日韩高清综合在线| 国产成人aa在线观看| 别揉我奶头 嗯啊视频| 日本一本二区三区精品| 亚洲,欧美,日韩| 一级黄色大片毛片| 欧美+亚洲+日韩+国产| 99久久中文字幕三级久久日本| 一区二区三区四区激情视频 | 欧美精品一区二区大全| 久久热精品热| www日本黄色视频网| 爱豆传媒免费全集在线观看| 天美传媒精品一区二区| 简卡轻食公司| 蜜桃久久精品国产亚洲av| 久久亚洲国产成人精品v| 欧美精品一区二区大全| 久久99蜜桃精品久久| 日韩欧美一区二区三区在线观看| 久久综合国产亚洲精品| 在现免费观看毛片| 成人亚洲精品av一区二区| 特级一级黄色大片| 午夜福利在线在线| 麻豆国产97在线/欧美| 18禁在线无遮挡免费观看视频| 国产精品一二三区在线看| 久久久久久久亚洲中文字幕| av天堂中文字幕网| 国内揄拍国产精品人妻在线| 亚洲av一区综合| 亚洲最大成人手机在线| 亚洲精品乱码久久久v下载方式| 亚洲性久久影院| 日本色播在线视频| а√天堂www在线а√下载| 亚洲精品456在线播放app| 不卡视频在线观看欧美| 一个人看视频在线观看www免费| 日日啪夜夜撸| 欧美性猛交黑人性爽| 最近2019中文字幕mv第一页| 黄色欧美视频在线观看| 男的添女的下面高潮视频| 少妇的逼好多水| 国模一区二区三区四区视频| 久久草成人影院| 麻豆成人av视频| 两个人的视频大全免费| 国产精品,欧美在线| 天美传媒精品一区二区| 久久精品国产亚洲网站| 91精品国产九色| 可以在线观看毛片的网站| 波野结衣二区三区在线| 亚洲精品日韩av片在线观看| 国产av不卡久久| 久久国内精品自在自线图片| 亚洲不卡免费看| 亚洲性久久影院| 国产三级中文精品| 国产一区二区在线av高清观看| 好男人视频免费观看在线| 高清毛片免费看| 国产成人一区二区在线| 欧美+亚洲+日韩+国产| 深夜精品福利| 高清毛片免费观看视频网站| 亚洲精品456在线播放app| 亚洲无线观看免费| 日产精品乱码卡一卡2卡三| 深夜精品福利| 男插女下体视频免费在线播放| 国产v大片淫在线免费观看| 少妇熟女aⅴ在线视频| 天天躁夜夜躁狠狠久久av| 精品久久久久久久久av| 人妻少妇偷人精品九色| 99热这里只有是精品50| 国产一级毛片七仙女欲春2| 91av网一区二区| a级毛片a级免费在线| 亚洲国产精品成人久久小说 | 久久久成人免费电影| 国产精品久久久久久av不卡| 特大巨黑吊av在线直播| 亚洲无线观看免费| 久久精品人妻少妇| 九色成人免费人妻av| 国产真实乱freesex| 成人午夜精彩视频在线观看| 免费观看在线日韩| 精品午夜福利在线看| 男人和女人高潮做爰伦理| 中文字幕久久专区| 免费无遮挡裸体视频| 村上凉子中文字幕在线| 舔av片在线| 色视频www国产| 欧美人与善性xxx| 国产午夜精品久久久久久一区二区三区| 黄色视频,在线免费观看| 性欧美人与动物交配| 中国美白少妇内射xxxbb| 亚洲精品成人久久久久久| 夜夜爽天天搞| 老司机福利观看| 熟女电影av网| 色吧在线观看| 天天躁日日操中文字幕| 一卡2卡三卡四卡精品乱码亚洲| 色综合色国产| 婷婷六月久久综合丁香| 一本久久精品| 国产成人精品一,二区 | 禁无遮挡网站| 国内精品久久久久精免费| 在线a可以看的网站| 黑人高潮一二区| 精品人妻熟女av久视频| 欧美人与善性xxx| 97人妻精品一区二区三区麻豆| 男女视频在线观看网站免费| 中文欧美无线码| 爱豆传媒免费全集在线观看| 亚洲成人久久爱视频| 观看免费一级毛片| 全区人妻精品视频| 国产av不卡久久| 国产69精品久久久久777片| 两性午夜刺激爽爽歪歪视频在线观看| 欧美日韩精品成人综合77777| 高清毛片免费观看视频网站| 亚洲丝袜综合中文字幕| 亚洲精品乱码久久久久久按摩| 校园人妻丝袜中文字幕| 欧美另类亚洲清纯唯美| 国产精品1区2区在线观看.| 丰满的人妻完整版| 春色校园在线视频观看| 亚洲人成网站高清观看| 中文字幕av成人在线电影| 日韩成人av中文字幕在线观看| 蜜桃亚洲精品一区二区三区| 欧美不卡视频在线免费观看| 日韩三级伦理在线观看| 亚洲最大成人手机在线| 亚洲丝袜综合中文字幕| 日本五十路高清| 免费人成视频x8x8入口观看| 日日摸夜夜添夜夜爱| 精品一区二区三区视频在线| 国产精品野战在线观看| 91久久精品电影网| 亚洲av一区综合| 成年av动漫网址| 波野结衣二区三区在线| 日韩三级伦理在线观看| 三级毛片av免费| 一个人看视频在线观看www免费| 少妇被粗大猛烈的视频| 亚洲精品国产av成人精品| 日韩大尺度精品在线看网址| 亚洲电影在线观看av| 国产精品人妻久久久影院| 国产精品一区www在线观看| 麻豆成人av视频| 亚洲av.av天堂| 国产淫片久久久久久久久| 国产午夜精品论理片| 久久婷婷人人爽人人干人人爱| 欧美色视频一区免费| 熟妇人妻久久中文字幕3abv| 日日撸夜夜添| 国产成人aa在线观看| 亚洲色图av天堂| 亚洲熟妇中文字幕五十中出| 久久久久性生活片| 亚洲人成网站在线播放欧美日韩| 亚洲精品乱码久久久久久按摩| 亚洲内射少妇av| 日韩中字成人| 久久久精品大字幕| 国产高清不卡午夜福利| 国产精品久久久久久精品电影| 久99久视频精品免费| 亚洲经典国产精华液单| 精华霜和精华液先用哪个| 国产蜜桃级精品一区二区三区| 神马国产精品三级电影在线观看| 日韩欧美在线乱码| 国产亚洲av嫩草精品影院| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 成人亚洲精品av一区二区| 不卡视频在线观看欧美| 国产蜜桃级精品一区二区三区| 亚洲国产色片| 一个人看视频在线观看www免费| 国产精品免费一区二区三区在线| 精品一区二区三区视频在线| 久久久久久久久久成人| 久久精品夜夜夜夜夜久久蜜豆| 国内精品宾馆在线| 熟妇人妻久久中文字幕3abv| 黑人高潮一二区| 国产精品一二三区在线看| 变态另类成人亚洲欧美熟女| 综合色av麻豆| 天堂影院成人在线观看| av天堂在线播放| 男插女下体视频免费在线播放| 久久亚洲国产成人精品v| 日日撸夜夜添| 精品无人区乱码1区二区| 亚洲色图av天堂| 久久久久久国产a免费观看| 女的被弄到高潮叫床怎么办| 国产精品一区二区性色av| 一级二级三级毛片免费看| 在线播放国产精品三级| 又粗又爽又猛毛片免费看| 一个人观看的视频www高清免费观看| 级片在线观看| 最好的美女福利视频网| 国产亚洲精品久久久com| 日日摸夜夜添夜夜添av毛片| 精品国产三级普通话版| 亚洲成人久久爱视频| 婷婷精品国产亚洲av| 激情 狠狠 欧美| av黄色大香蕉| 免费看a级黄色片| 午夜爱爱视频在线播放| 夫妻性生交免费视频一级片| 97在线视频观看| 久久韩国三级中文字幕| 精品久久久噜噜| 看非洲黑人一级黄片| 99久久精品国产国产毛片| 国产探花极品一区二区| 亚洲最大成人中文| 亚洲国产欧美人成| 亚洲图色成人| 此物有八面人人有两片| 男插女下体视频免费在线播放| 国产伦在线观看视频一区| av又黄又爽大尺度在线免费看 | 欧美性猛交╳xxx乱大交人| 成年av动漫网址| 91aial.com中文字幕在线观看| 日韩 亚洲 欧美在线| 99视频精品全部免费 在线| 日韩强制内射视频| 中文字幕人妻熟人妻熟丝袜美| 美女大奶头视频| 亚洲国产色片| 国产亚洲精品久久久久久毛片| 嫩草影院新地址| 看黄色毛片网站| 美女黄网站色视频| 亚洲av不卡在线观看| 两个人的视频大全免费| а√天堂www在线а√下载| 美女被艹到高潮喷水动态| 亚洲欧洲国产日韩| 青春草国产在线视频 | 国产男人的电影天堂91| 国产久久久一区二区三区| 久久欧美精品欧美久久欧美| 一本一本综合久久| 一个人看的www免费观看视频| 色哟哟·www| 亚洲精品乱码久久久v下载方式| 日本与韩国留学比较| 免费观看的影片在线观看| 亚洲在久久综合| 欧美性猛交黑人性爽| 日韩一区二区视频免费看| 高清日韩中文字幕在线| 亚洲精品456在线播放app| av在线观看视频网站免费| 国产精品美女特级片免费视频播放器| 寂寞人妻少妇视频99o| 欧美激情在线99| 97超碰精品成人国产| 色吧在线观看| 中文字幕免费在线视频6| 精品人妻视频免费看| 久久人人爽人人片av| 亚洲国产日韩欧美精品在线观看| 波多野结衣高清作品| 日本在线视频免费播放| 国产av在哪里看| 男人和女人高潮做爰伦理| h日本视频在线播放| 狠狠狠狠99中文字幕| 欧美高清成人免费视频www| 国产亚洲91精品色在线| 精品久久久久久成人av| 国产精品福利在线免费观看| 欧美色视频一区免费| 熟女电影av网| 少妇猛男粗大的猛烈进出视频 | 欧美三级亚洲精品| 夜夜爽天天搞| 亚洲在久久综合| 久久精品综合一区二区三区| 亚洲av成人精品一区久久| eeuss影院久久| 欧美3d第一页| 欧美+亚洲+日韩+国产| 毛片女人毛片| 插逼视频在线观看| 18禁在线无遮挡免费观看视频| 国内精品一区二区在线观看| 亚洲内射少妇av| 十八禁国产超污无遮挡网站| 婷婷六月久久综合丁香| 蜜桃亚洲精品一区二区三区| 我的老师免费观看完整版| 精品久久久久久久久av| 亚洲不卡免费看| 亚洲精品成人久久久久久| 国产69精品久久久久777片| 91久久精品电影网| 午夜精品在线福利| 亚洲中文字幕日韩| 亚洲va在线va天堂va国产| 看十八女毛片水多多多| 淫秽高清视频在线观看| 亚洲在线自拍视频| 丰满人妻一区二区三区视频av| 中文字幕免费在线视频6| 亚洲国产精品sss在线观看| 一进一出抽搐动态| 波野结衣二区三区在线| 一个人观看的视频www高清免费观看| 搞女人的毛片| 中文字幕熟女人妻在线| 国产综合懂色| 99热网站在线观看| 亚洲久久久久久中文字幕| 国产精品av视频在线免费观看| 精品久久久久久成人av| 久久亚洲精品不卡| 国产乱人偷精品视频| 亚洲av.av天堂| 国产av一区在线观看免费| 国产蜜桃级精品一区二区三区| 晚上一个人看的免费电影| 欧美bdsm另类| 中出人妻视频一区二区| 国产极品天堂在线| 久久99热6这里只有精品| av天堂在线播放| 熟女人妻精品中文字幕| 午夜福利高清视频| 亚洲人与动物交配视频| 又粗又爽又猛毛片免费看| 少妇人妻精品综合一区二区 | 精品久久久久久久久av| 亚洲欧美日韩高清在线视频| 日韩欧美三级三区| 亚洲精品456在线播放app| 五月伊人婷婷丁香| 女人被狂操c到高潮| 国产精品无大码| 麻豆精品久久久久久蜜桃| 欧美又色又爽又黄视频| 亚洲av免费高清在线观看| 午夜福利在线观看免费完整高清在 | 国产美女午夜福利| 天天躁夜夜躁狠狠久久av| 午夜激情福利司机影院| 久久99精品国语久久久| 国产精品美女特级片免费视频播放器| 久久久久久九九精品二区国产| 精品人妻熟女av久视频| 久久久久久九九精品二区国产| 国产成人aa在线观看| 日本免费一区二区三区高清不卡| 欧美xxxx性猛交bbbb| 男人舔奶头视频| 非洲黑人性xxxx精品又粗又长| 波多野结衣高清无吗| 亚洲一区高清亚洲精品| 精品久久久久久久久亚洲| 如何舔出高潮| 少妇丰满av| 久久久久久久久久久丰满| 国产精品一及| 欧美性猛交╳xxx乱大交人| 国产伦精品一区二区三区四那| or卡值多少钱| 特级一级黄色大片| 一区二区三区四区激情视频 | 中国美女看黄片| 欧美日韩一区二区视频在线观看视频在线 | 欧美精品国产亚洲| 99久久精品一区二区三区| 色综合站精品国产| 国产午夜精品论理片| 校园人妻丝袜中文字幕| 亚洲国产精品合色在线| 亚洲欧美日韩卡通动漫| 老熟妇乱子伦视频在线观看| 夜夜爽天天搞| 成年女人看的毛片在线观看| 18禁裸乳无遮挡免费网站照片| 不卡一级毛片| 亚洲人与动物交配视频| 日韩欧美精品v在线| 内地一区二区视频在线| av免费在线看不卡| 国产色婷婷99| 中文字幕熟女人妻在线| 国产成人freesex在线| 国产黄色小视频在线观看| 伊人久久精品亚洲午夜| 六月丁香七月| 中文亚洲av片在线观看爽| 能在线免费看毛片的网站| 身体一侧抽搐| 国产成人aa在线观看| 2022亚洲国产成人精品| 三级毛片av免费| 精华霜和精华液先用哪个| 中文在线观看免费www的网站| 又粗又硬又长又爽又黄的视频 | 在线天堂最新版资源| 日韩 亚洲 欧美在线| 少妇人妻一区二区三区视频| 国产精品久久电影中文字幕| 国产高清激情床上av| 欧美一级a爱片免费观看看| 淫秽高清视频在线观看| 亚洲最大成人中文| 一区二区三区免费毛片| 色哟哟哟哟哟哟| a级毛色黄片| 国内揄拍国产精品人妻在线| 国产高清三级在线| 国产高清视频在线观看网站| 日韩在线高清观看一区二区三区| 亚洲欧美日韩卡通动漫| 国产精品久久久久久久电影| 国产精品嫩草影院av在线观看| av天堂在线播放| 亚洲人成网站在线播| 午夜a级毛片| 国产高清三级在线| 欧美性猛交黑人性爽| 国产精品一区二区三区四区免费观看| 日韩欧美精品免费久久| 日韩欧美 国产精品| 夜夜夜夜夜久久久久| 久久这里只有精品中国| 99热精品在线国产| 国产精品女同一区二区软件| 人妻制服诱惑在线中文字幕| 一本久久中文字幕| 波多野结衣高清无吗| 国产91av在线免费观看| 99热只有精品国产|