• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    卷積神經(jīng)網(wǎng)絡(luò)的軟硬件協(xié)同加速技術(shù)

    2021-08-23 07:30:46李欣瑤劉飛陽文鵬程李鵬
    航空兵器 2021年3期
    關(guān)鍵詞:目標(biāo)檢測

    李欣瑤 劉飛陽 文鵬程 李鵬

    摘 要: 面向構(gòu)建智能化航空電子系統(tǒng)的需求,提升有人機/無人機智能化作戰(zhàn)水平,設(shè)計并實現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)CNN的軟硬件協(xié)同加速技術(shù),以解決目標(biāo)識別、輔助決策、自主規(guī)劃等復(fù)雜問題。針對算法模型的龐大參數(shù)量與嵌入式環(huán)境有限存儲資源的沖突問題,采用模型結(jié)構(gòu)優(yōu)化及量化算法壓縮網(wǎng)絡(luò)規(guī)模。針對復(fù)雜浮點運算與計算資源緊缺的沖突問題,基于Verilog HDL設(shè)計卷積、池化兩種加速算子,采用流水線+全并行方式,以達到計算加速的目的。通過軟件優(yōu)化設(shè)計與硬件加速運算的協(xié)同作用,實現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)的推理過程加速。以YOLOv3及YOLOv3-Tiny兩種典型CNN為例進行加速,并在Xilinx ZCU102 FPGA評估板上進行驗證。結(jié)果表明,加速后的模型與原模型對比,參數(shù)量可壓縮3/4左右,YOLOv3的推理速度提升近65倍,YOLOv3-Tiny提升23倍左右。

    關(guān)鍵詞:智能計算;硬件加速;目標(biāo)檢測;模型壓縮;FPGA

    中圖分類號:TJ760; TP18? 文獻標(biāo)識碼: A? 文章編號:1673-5048(2021)03-0099-06

    0 引? 言

    隨著人工智能算法模型結(jié)構(gòu)的快速更迭,神經(jīng)網(wǎng)絡(luò)正逐步被應(yīng)用于解決智慧醫(yī)療、自動駕駛等多種復(fù)雜智能問題。在航空領(lǐng)域,有人機與無人機的空戰(zhàn)過程均朝著智能化的方向發(fā)展[1],目標(biāo)識別跟蹤、輔助決策、自主規(guī)劃等復(fù)雜任務(wù)均可依賴神經(jīng)網(wǎng)絡(luò)完成。但機載嵌入式環(huán)境對功耗、實時性都有著嚴(yán)格的制約,且存儲、計算資源都較為緊缺,如何將神經(jīng)網(wǎng)絡(luò)模型部署于資源受限的嵌入式環(huán)境成為亟待解決的問題。

    本文面向智能化航空電子系統(tǒng)的需求,設(shè)計并實現(xiàn)一種面向卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的軟硬件協(xié)同加速方法。針對龐大網(wǎng)絡(luò)模型參數(shù)量與有限存儲資源的沖突問題,以及大量復(fù)雜浮點運算與計算資源緊缺的沖突問題,從軟硬件兩方面對網(wǎng)絡(luò)模型進行了優(yōu)化與加速,解決了基于CAFFE(Convolutional Architecture for Fast Feature Embedding)框架的網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化問題、模型參數(shù)量化問題以及神經(jīng)網(wǎng)絡(luò)加速算子的構(gòu)建問題,以YOLOv3及YOLOv3-Tiny兩種用于目標(biāo)檢測的典型CNN網(wǎng)絡(luò)為例進行加速,并在Xilinx ZCU102 FPGA評估板上進行驗證。

    1 國內(nèi)外研究現(xiàn)狀

    一個完整的深度學(xué)習(xí)框架通常包含訓(xùn)練與推理兩個主要部分,本文所針對的主要是推理部分的優(yōu)化與加速。

    在軟件加速方面,分解卷積核使得參數(shù)量大幅減少的SqueezeNet模型[2]、逐個通道進行卷積后將結(jié)果串聯(lián)以減少計算量的MobileNet模型[3]、采用殘差網(wǎng)絡(luò)思想并在不影響精度的情況下降低分辨率的ShuffleNet模型[4]、更改卷積運算流程以提高網(wǎng)絡(luò)效率的Xception模型[5]等輕量化模型被相繼提出并不斷優(yōu)化。除輕量化模型以外,剪枝、奇異值分解、哈弗曼編碼等輕量化技術(shù)亦得到廣泛采用,該類方法的核心思想均為壓縮網(wǎng)絡(luò)模型大小,以減少計算量和降低計算復(fù)雜度,雖然會損失網(wǎng)絡(luò)模型的部分精度,但模型推理速度會得到大幅度提升。目前,在眾多輕量化算法中,量化算法具有較為突出的表現(xiàn)。

    深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練階段普遍采用float 32(簡稱FP32)的數(shù)據(jù)格式,量化算法即采用較低精度的數(shù)據(jù)格式(如float 16和int 8,簡稱FP16和INT8)代替高精度的數(shù)據(jù)格式[6]。此外,二值化(所有權(quán)重的值取+1或-1)[7]和三值化(將所有權(quán)重的值量化為[-α,0,+α]三個數(shù)之一,其中α為可訓(xùn)練的參數(shù)) [8]也是常用的量化方法。

    在硬件加速方面,目前主流采用GPU,ASIC與FPGA三種智能計算架構(gòu)進行深度神經(jīng)網(wǎng)絡(luò)模型加速[9]。其中,高性能GPU主要應(yīng)用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練階段,對環(huán)境和庫的依賴性較大,國內(nèi)技術(shù)積累較弱,難以實現(xiàn)技術(shù)自主可控;ASIC是為特定需求而專門定制優(yōu)化開發(fā)的架構(gòu),靈活性較差,缺乏統(tǒng)一的軟硬件開發(fā)環(huán)境,開發(fā)周期長且造價極高;FPGA是可編程的半定制芯片,具有高靈活性、低延時特性,開發(fā)難點在于硬件邏輯實現(xiàn)復(fù)雜。目前,面向智能化航空電子系統(tǒng)多應(yīng)用需求的智能計算加速技術(shù)多處于預(yù)研階段,考慮后期的移植、再開發(fā)等工作,相對來說FPGA架構(gòu)更適用于航空領(lǐng)域的智能計算加速。

    2 面向CNN的軟硬件協(xié)同加速方法

    卷積神經(jīng)網(wǎng)絡(luò)在處理復(fù)雜智能問題時具有巨大的優(yōu)勢,但機載嵌入式環(huán)境的存儲、計算資源均受限,為滿足航空電子系統(tǒng)智能化場景感知的應(yīng)用需求,本文設(shè)計了一種面向CNN的軟硬件協(xié)同加速方法,如圖1所示。

    軟硬件協(xié)同設(shè)計方法是針對系統(tǒng)開發(fā)中軟硬件設(shè)計的相互作用關(guān)系而提出的[10]。由于在機載嵌入式環(huán)境中,存儲資源與計算資源均較為受限,難以將規(guī)模龐大的神經(jīng)網(wǎng)絡(luò)移植到FPGA平臺上,且FPGA并不擅于進行浮點運算,不能發(fā)揮FPGA在算力方面的優(yōu)勢,實現(xiàn)計算加速。因此,本文選用軟硬件協(xié)同方法對卷積神經(jīng)網(wǎng)絡(luò)進行加速。軟件優(yōu)化方面,基于CAFFE框架實現(xiàn)結(jié)構(gòu)優(yōu)化與參數(shù)量化,旨在壓縮網(wǎng)絡(luò)模型規(guī)模,以大幅降低網(wǎng)絡(luò)模型對嵌入式平臺功耗、內(nèi)存的需求。硬件加速方面,基于Verilog HDL設(shè)計加速算子,采用流水線+全并行的方式,充分利用有限的計算資源,達到計算加速的目的。軟件優(yōu)化與硬件加速兩部分協(xié)同作用,使得卷積神經(jīng)網(wǎng)絡(luò)能夠部署于資源受限的嵌入式環(huán)境。

    本文構(gòu)建了含雷達、艦船、坦克、汽車、建筑五類物體在內(nèi)的空對地小目標(biāo)數(shù)據(jù)集,從30°和90°兩類不同視角以及彩色、紅外、黑白三種不同視圖場景進行影像采集,將采集到的12個視頻片段逐幀截取成5 000余張1 024×768像素的高分辨率圖片,參照PASCAL VOC標(biāo)準(zhǔn)數(shù)據(jù)集格式,標(biāo)注生成以航空應(yīng)用為背景的數(shù)據(jù)集,包括訓(xùn)練集3 000余張、測試集1 000余張和驗證集1 000余張,單張圖片平均含有7.4個物體。

    開發(fā)階段分為軟件優(yōu)化設(shè)計與硬件加速設(shè)計兩部分。軟件優(yōu)化設(shè)計基于CAFFE框架對網(wǎng)絡(luò)結(jié)構(gòu)進行調(diào)整、優(yōu)化,并采用量化算法壓縮網(wǎng)絡(luò)模型,為模型部署于嵌入式環(huán)境奠定基礎(chǔ)。硬件加速設(shè)計基于FPGA 模塊化設(shè)計思想,針對典型CNN網(wǎng)絡(luò)中占用資源最多的卷積、池化網(wǎng)絡(luò)層設(shè)計加速算子。

    驗證階段將網(wǎng)絡(luò)移植到Xilinx ZCU102評估板上進行驗證。其中,卷積、池化加速算子封裝為IP核,在PL端實現(xiàn),其余各層算子在以ARM為核心的PS端實現(xiàn),PL與PS之間通過DMA進行通信。

    3 面向CNN的軟件優(yōu)化技術(shù)

    由于構(gòu)建的空對地小目標(biāo)數(shù)據(jù)集以小目標(biāo)(目標(biāo)占圖片總比例的0.5%以內(nèi))為主,且目標(biāo)分布較為集中,綜合考慮航空嵌入式環(huán)境對實時性的需求,選用YOLOv3及YOLOv3-Tiny兩種典型CNN網(wǎng)絡(luò)模型進行優(yōu)化與加速[11]。YOLOv3及YOLOv3-Tiny模型具有高檢測速度及小目標(biāo)高檢測精度的特點,適用于本文構(gòu)建的數(shù)據(jù)集。

    文獻[12]指出,F(xiàn)PGA加速卷積神經(jīng)網(wǎng)絡(luò)推理過程時面臨的主要瓶頸體現(xiàn)在兩方面,一是計算量,二是數(shù)據(jù)傳輸。其中計算量對應(yīng)本文所述計算資源受限的瓶頸,數(shù)據(jù)傳輸對應(yīng)存儲資源受限的瓶頸。具體來看,卷積神經(jīng)網(wǎng)絡(luò)中的卷積層、池化層等網(wǎng)絡(luò)層涉及大量復(fù)雜浮點運算,浮點運算占用資源較多且運行速度較慢,而FPGA中DSP資源較少,若在FPGA加速之前對數(shù)據(jù)類型進行轉(zhuǎn)化,可有效提高FPGA中的并行計算能力和計算效率,從而解決計算量龐大造成的瓶頸。此外,由于片上存儲資源有限,大量中間網(wǎng)絡(luò)層數(shù)據(jù)在運算過程中需進行多次訪問存儲,由此導(dǎo)致嚴(yán)重的傳輸延遲。為解決該瓶頸,本文對模型結(jié)構(gòu)進行優(yōu)化設(shè)計,減少中間參數(shù),降低訪問存儲次數(shù),從而降低數(shù)據(jù)傳輸開銷,提高FPGA加速性能。

    3.1 基于CAFFE框架的模型結(jié)構(gòu)優(yōu)化

    CAFFE是一個開源的深度學(xué)習(xí)框架,無硬件與平臺的限制,提供網(wǎng)絡(luò)模型訓(xùn)練、微調(diào)、部署所需的完整工具包。與Darknet框架相比,CAFFE框架提供了卷積、池化、激活等多種算法接口,能夠快速、高效地搭建網(wǎng)絡(luò)模型;而Darknet框架較為小眾,對除YOLO系列以外的網(wǎng)絡(luò)模型支持度較低。本文基于CAFFE框架搭建YOLOv3以及YOLOv3-Tiny兩種網(wǎng)絡(luò),并在原有模型基礎(chǔ)上對卷積層結(jié)構(gòu)進行調(diào)整優(yōu)化。CAFFE框架雖然提供了卷積層的接口,但由于YOLOv3及YOLOv3-Tiny兩種網(wǎng)絡(luò)中,每一個卷積層之后都會連接一個歸一化層(Batch Normalization,BN),而BN層主要用于訓(xùn)練時解決梯度消失或梯度爆炸問題,單獨實現(xiàn)會占用大量顯存空間。為提高本文構(gòu)建模型的推理速度,減少BN層的運算,在基于CAFFE框架搭建時,將BN層參數(shù)合并到卷積層,實現(xiàn)為Conv+BN層。融合前原卷積層運算公式為

    Y=W×X+b(1)

    式中:X為卷積層輸入特征圖參數(shù);W為卷積層濾波器參數(shù);b為偏置值;Y為卷積層輸出值。BN層共包含兩部分運行,分別為歸一化運算以及尺度變換偏移運算:

    i← xi-μxδ2x+ε(2)

    yi← γxi+β(3)

    式中:μx為輸入?yún)?shù)均值;δ2x為輸入?yún)?shù)方差;ε為避免除數(shù)為0的微小正數(shù);γ為尺度因子,用于調(diào)整數(shù)值大小;β為偏移因子,用于增加數(shù)據(jù)偏移,γ及β是模型在訓(xùn)練過程中自學(xué)習(xí)得到的兩個參數(shù)。將BN層的兩種運算融合到原卷積層運算中:

    Y′=γ×(W×X+b)-μxδ2x+ε+β(4)

    對該式進行展開,即可得到融合后新卷積層濾波器參數(shù)W′以及新偏置值b′:

    W′=γδ2B+ε×W(5)

    b′=γδ2x+ε(b-μx)+β (6)

    將式(5)~(6)合并到式(4)中,即可得到融合BN層后的新卷積層運算公式:

    Y′=W′×X+b′(7)

    式(7)即為Conv+BN層輸出值的運算公式。

    基于以上推理,在原CAFFE框架中增加了Conv+BN層,可應(yīng)用于基于CAFFE框架搭建的網(wǎng)絡(luò)中,將BN層融合到卷積層內(nèi)進行實現(xiàn),消除推理過程中BN層單獨運算對硬件資源的占用與消耗。

    3.2 模型量化處理

    網(wǎng)絡(luò)模型參數(shù)量會直接影響存儲資源和計算資源的占用情況,從而影響網(wǎng)絡(luò)推理速度。為能更精準(zhǔn)地提取出待識別圖片的各類特征,神經(jīng)網(wǎng)絡(luò)通常需要大量卷積層和大量濾波器進行復(fù)雜浮點的乘加運算,這意味著一個精度較高的網(wǎng)絡(luò)模型在計算量上可達10億量級,參數(shù)量更是輕易突破百兆量級[13]。如在YOLOv3-Tiny網(wǎng)絡(luò)中,僅第13層的參數(shù)量便高達8億個,在不考慮復(fù)用的情況下,該層需進行的乘加運算約9 000萬次。如果將原始FP32型數(shù)據(jù)映射到硬件上,不僅會占用大量的BRAM存儲資源,其推理過程更會消耗大量的DSP計算資源,這對資源受限的嵌入式環(huán)境來說是難以承受的?;谟布Y源的考慮,采用量化算法將FP32位數(shù)據(jù)映射為INT8位數(shù)據(jù),節(jié)省存儲資源占用情況。以n×n卷積核K為例,量化過程為

    K=(k11,k12,…,kin,k(i+1)1,…,knn)(8)

    kmax=max(k11,k12,…,kin,k(i+1)1,…,knn)(9)

    δ=127/kmax(10)

    K′=(k11×δ,k12×δ,…,kin×δ,…,knn×δ) (11)

    式(8)為卷積核K的n2個參數(shù);式(9)取卷積核K參數(shù)中的最大值,記為kmax;式(10)計算量化系數(shù)δ,其中127為INT8值域中的最大值;式(11)為量化后的卷積核K′。偏置值由于數(shù)量較少,對其進行量化并不會節(jié)省太多存儲資源,反而會導(dǎo)致模型精度嚴(yán)重下降,因而對偏置值直接進行保存處理。

    使用構(gòu)建的空對地小目標(biāo)數(shù)據(jù)集中的測試集進行精度測試,模型量化前后對比如表1所示。網(wǎng)絡(luò)模型壓縮處理后,其規(guī)??煽s小約3/4,解決了硬件存儲資源受限的瓶頸。

    量化算法主要用于壓縮參數(shù)規(guī)模龐大的網(wǎng)絡(luò)模型,減小權(quán)重參數(shù)的存儲資源占用,緩解嵌入式環(huán)境存儲資源受限的瓶頸,為網(wǎng)絡(luò)模型移植到嵌入式環(huán)境奠定基礎(chǔ)。

    4 面向CNN的硬件加速技術(shù)

    FPGA作為一種可編程重構(gòu)的硬件架構(gòu),能夠很好地兼顧處理速度與調(diào)控能力。目前,高層次綜合(High-Level Synthesis,HLS)與Verilog HDL是常用于設(shè)計神經(jīng)網(wǎng)絡(luò)加速模塊的硬件結(jié)構(gòu)及硬件語言。HLS是指將高層次語言(如C, C++, System C等)描述的邏輯結(jié)構(gòu),自動轉(zhuǎn)換成低抽象級語言描述的電路模型[14],更注重于上層算法的實現(xiàn),但基于HLS結(jié)構(gòu)實現(xiàn)的神經(jīng)網(wǎng)絡(luò)有兩個弊端,一是資源占用不合理、不可控,網(wǎng)絡(luò)運行時能達到的并行度較為受限,特別是搭建中大型神經(jīng)網(wǎng)絡(luò)時,并行度較低直接導(dǎo)致其推理速度難以提升;二是轉(zhuǎn)換后的代碼不具備可讀性,這不僅加大了排查故障的難度,在不滿足設(shè)計需求時也很難對其進行優(yōu)化。

    Verilog HDL適合于RTL級的硬件描述,用于從算法級、門級到開關(guān)級的多種抽象設(shè)計層次的數(shù)字系統(tǒng)建模,更偏重于底層,因而基于Verilog HDL的設(shè)計更靈活,且效率更高。

    在YOLOv3(共106層網(wǎng)絡(luò)層)及YOLOv3-Tiny(共23層網(wǎng)絡(luò)層)網(wǎng)絡(luò)中,卷積層與池化層(共94層)占所有網(wǎng)絡(luò)層的73%左右,其中涉及的乘加、比較等運算是影響其推理性能的主要因素。為充分合理利用有限的計算資源以滿足卷積神經(jīng)網(wǎng)絡(luò)中的大量運算,從而達到加速目的,基于Verilog HDL設(shè)計卷積、池化兩種加速算子,并將其封裝為IP核,便于在加速其他具有相同結(jié)構(gòu)的網(wǎng)絡(luò)模型時復(fù)用。

    4.1 卷積加速算子的設(shè)計與實現(xiàn)

    卷積加速算子實現(xiàn)3×3濾波器的卷積運算。采用全并行加流水線方式,單次卷積運算調(diào)用9個乘法器,每個時鐘處理9組數(shù)據(jù)的乘法運算,加法運算通過2級流水線完成。

    卷積算子端口時序如圖2所示。ORDER為輸入特征圖階數(shù),特征圖讀取共需ORDER×ORDER個CLK時鐘周期,濾波器需9個CLK時鐘周期,偏置值Bias需1個CLK時鐘周期,結(jié)果特征圖從第(2×ORDER+7)個CLK時鐘周期開始輸出(無偏置值時,有偏置值則從第(2×ORDER+8)個時鐘周期開始輸出),每個時鐘周期輸出一個值,輸出(ORDER-2)2個CLK時鐘周期。

    4.2 池化加速算子的設(shè)計與實現(xiàn)

    池化加速算子實現(xiàn)步長為2的最大池化運算,采用全并行加流水線方式。

    池化加速算子端口時序如圖3所示。其中,ORDER為輸入特征圖階數(shù),特征圖輸入共需ORDER×ORDER個CLK時鐘周期,結(jié)果特征圖從第(2×ORDER+1)個CLK時鐘周期開始輸出,每隔一個時鐘周期輸出一個值,輸出(ORDER/2)2個CLK時鐘周期。由于每次讀取2×2數(shù)據(jù)進行比較之后,輸出數(shù)據(jù)會減少一半,因此valid信號表現(xiàn)為2分頻。

    4.3 卷積加速算子仿真及資源占用情況

    以5×5特征圖與3×3濾波器進行卷積運算為例,仿真結(jié)果如圖4所示。每幀特征圖輸入到輸出延時為2行輸入的時間,使用2個FIFO緩存將特征圖輸入數(shù)據(jù)延時1行和2行,當(dāng)?shù)?行特征圖數(shù)據(jù)到達時,由于延時,此時第1行和第2行數(shù)據(jù)會同時輸出。將3行數(shù)據(jù)和每行對應(yīng)的濾波器數(shù)據(jù)進行滑動相乘,通過2級流水相加求和,即可得到卷積運算結(jié)果。

    以Xilinx ZCU102評估板上的運行為例,占用資源情況如表2所示。該算子在9組乘加并行運算且含2級流水線的條件下,DSP資源僅占用了9個,占總資源的0.36%, LUT僅占用了0.07%,資源占用量較少,且并行度較高,能夠達到節(jié)省計算資源且運算加速的目的。4.4 池化加速算子仿真及資源占用情況

    以4×4特征圖、步長為2進行池化運算為例,仿真結(jié)果如圖5所示。當(dāng)奇數(shù)行特征圖數(shù)據(jù)輸入時,會寫入FIFO進行緩存。當(dāng)偶數(shù)行特征圖數(shù)據(jù)輸入時,同時讀出FIFO中的數(shù)據(jù),每隔兩個數(shù)據(jù)進行2×2的數(shù)據(jù)比較,將最大數(shù)據(jù)進行輸出。

    以Xilinx ZCU102評估板上的運行為例,該算子占用資源情況如表3所示。

    5 測試與驗證

    本文在Xilinx ZCU102評估板上進行驗證,該評估板含有2 520個DSP單元、32 Mb RAM內(nèi)存、512 MB與PL端相連的DDR4存儲器件以及4 GB與PS端相連的DDR4存儲器件,能夠滿足神經(jīng)網(wǎng)絡(luò)硬件部署的基本資源需求。在100 MHz時鐘頻率下,YOLOv3網(wǎng)絡(luò)對單張圖片的推理過程需1.49×107個時鐘周期,YOLOv3-Tiny網(wǎng)絡(luò)對單張圖片的推理過程需4.17×106個時鐘周期。

    為評估本文算法在航空背景特定數(shù)據(jù)集上的有效性以及推理階段的時效性,本文以構(gòu)建的空對地小目標(biāo)數(shù)據(jù)集作為樣本集,采用功耗、均值平均精度(mean average precision,mAP)以及推理階段運行時間FPS(frames per second)作為評價指標(biāo),衡量智能計算加速技術(shù)的綜合性能。表4列出了加速方法基于構(gòu)建的空對地小目標(biāo)數(shù)據(jù)集(1 024×768像素)在不同硬件平臺上測試的功耗與運行時間的對比情況。

    采用量化后的同一權(quán)重參數(shù)在不同硬件平臺上進行測試,測試結(jié)果表明,在CPU,GPU與FPGA三種硬件平臺上,網(wǎng)絡(luò)檢測精度基本一致。在模型推理過程的加速方面,兩種網(wǎng)絡(luò)部署于ZCU102評估板后的運行速度均有大幅提升。與原網(wǎng)絡(luò)在CPU上的運行速度相比,YOLOv3提升了65倍,可達到每秒6幀,YOLOv3-Tiny可達到每秒23幀。雖然推理速度與高性能GPU相比還有較大差距,但在功耗方面,ZCU102上的功耗不到GPU功耗的十分之一,能夠滿足嵌入式環(huán)境低功耗的需求??梢?,卷積加速算子與池化加速算子在加速神經(jīng)網(wǎng)絡(luò)模型的推理過程方面發(fā)揮了重要作用。檢測效果如圖6所示。

    綜上,本文采用了軟硬件協(xié)同加速技術(shù),為卷積神經(jīng)網(wǎng)絡(luò)部署于資源受限的嵌入式環(huán)境提供了支撐。其中,軟件優(yōu)化技術(shù)對模型結(jié)構(gòu)進行優(yōu)化,并實現(xiàn)量化算法,有效壓縮了網(wǎng)絡(luò)模型規(guī)模,極大緩解了機載嵌入式環(huán)境存儲資源受限的瓶頸,為神經(jīng)網(wǎng)絡(luò)移植到嵌入式平臺建立基礎(chǔ)。硬件加速技術(shù)基于Verilog HDL設(shè)計并實現(xiàn)卷積、池化兩種加速算子,僅需占用少量計算資源即可實現(xiàn)這兩種復(fù)雜運算。通過軟硬件兩種加速技術(shù)的協(xié)同作用,有效解決機載嵌入式環(huán)境下部署卷積神經(jīng)網(wǎng)絡(luò)時面臨的存儲資源緊缺與計算資源受限瓶頸,達到智能計算加速的目的。

    6 結(jié)? 論

    面向空戰(zhàn)過程智能化的應(yīng)用需求,提高有人機/無人機自主感知、目標(biāo)識別跟蹤、自主決策等能力,設(shè)計并實現(xiàn)了應(yīng)用于資源受限的嵌入式環(huán)境的CNN軟硬件協(xié)同加速技術(shù),旨在解決龐大模型參數(shù)量與有限存儲資源的沖突問題以及大量復(fù)雜浮點運算與計算資源緊缺的沖突問題。在開發(fā)階段,構(gòu)建了空對地小目標(biāo)數(shù)據(jù)集,基于CAFFE框架對YOLOv3和YOLOv3-Tiny兩種網(wǎng)絡(luò)進行了結(jié)構(gòu)優(yōu)化。對兩種模型進行壓縮量化處理,壓縮模型約3/4?;赩erilog HDL設(shè)計并實現(xiàn)兩種加速算子,僅需占用少量資源即可完成相應(yīng)運算。通過軟硬件協(xié)同作用,達到推理過程加速的目的。其中,基于CAFFE框架的結(jié)構(gòu)優(yōu)化方法、模型壓縮量化算法以及卷積池化加速算子均具備一定的通用性,便于構(gòu)建其他網(wǎng)絡(luò)模型時使用。在驗證階段,將兩種網(wǎng)絡(luò)模型部署于Xilinx ZCU102評估板上進行了驗證。實驗證明,兩種加速算子在計算資源緊缺的嵌入式環(huán)境下,可有效加速兩種網(wǎng)絡(luò)的推理過程。

    下一步工作主要著眼于構(gòu)建加速算子庫,封裝除卷積、池化以外的多種算子,搭建結(jié)構(gòu)更為復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,以滿足智能化航空電子系統(tǒng)的多應(yīng)用需求。同時,設(shè)計數(shù)據(jù)重用算法,提高存儲空間利用率,進一步加速嵌入式環(huán)境下深度神經(jīng)網(wǎng)絡(luò)模型的推理過程。

    參考文獻:

    [1] 鮮勇,李揚. 人工智能技術(shù)對未來空戰(zhàn)武器的變革與展望[J]. 航空兵器,2019,26(5): 26-31.

    Xian Yong,Li Yang. Revolution and Assumptions of Artificial Intelligence Technology for Air Combat Weapons in the Future[J]. Aero Weaponry,2019,26(5): 26-31. (in Chinese)

    [2] Wu B C,Iandola F,Jin P H,et al. SqueezeDet: Unified,Small,Low Power Fully Convolutional Neural Networks for Real-Time Object Detection for Autonomous Driving[C]∥2017 IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW),2017: 446-454.

    [3] Chollet F. Xception: Deep Learning with Depthwise Separable Convolutions[C]∥2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2017: 1251-1258.

    [4] Shen Y R,Han T,Yang Q,et al. CS-CNN: Enabling Robust and Efficient Convolutional Neural Networks Inference for Internet-of-Things Applications[J]. IEEE Access,2018,6: 13439-13448.

    [5] Zhang X Y,Zhou X Y,Lin M X,et al. ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices[C]∥2018 IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2018: 6848-6856.

    [6] Vanhoucke V,Senior A, Mao M Z. Improving the Speed of Neural Networks on CPUs[C]∥Deep Learning and Unsupervised Feature Learning Workshop,NIPS,2011.

    [7] Courbariaux M,Bengio Y,David J P. BinaryConnect: Training Deep Neural Networks with Binary Weights During Propagations[C]∥Advances in Neural Information Processing Systems(NIPS), 2015: 3123-3131.

    [8] Alemdar H,Leroy V,Prost-Boucle A,et al. Ternary Neural Net

    works? for Resource-Efficient AI Applications[C]∥2017 International Joint Conference on Neural Networks (IJCNN),2017: 2547-2554.

    [9] Sze V,Chen Y H,Yang T J,et al. Efficient Processing of Deep Neural Networks: A Tutorial and Survey[J]. Proceedings of the IEEE,2017,105(12): 2295-2329.

    [10] 崔小樂,陳紅英,崔小欣,等. 一種軟硬件協(xié)同設(shè)計工具原型及其設(shè)計描述方法[J]. 微電子學(xué)與計算機,2007,24(6): 28-30.

    Cui Xiaole,Chen Hongying,Cui Xiaoxin,et al. A HW/SW Codesign Design Tool and its Specification[J]. Microelectronics & Computer,2007,24(6): 28-30. (in Chinese)

    [11] Redmon J,Divvala S,Girshick R,et al. You Only Look Once: Unified,Real-Time Object Detection[C]∥ 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016: 779-788.

    [12] 吳艷霞,梁楷,劉穎,等. 深度學(xué)習(xí)FPGA加速器的進展與趨勢[J]. 計算機學(xué)報,2019(11): 2461-2480.

    Wu Yanxia,Liang Kai,Liu Ying,et al. The Progress and Trends of FPGA-Based Accelerators in Deep Learning[J]. Chinese Journal of Computers, 2019(11): 2461-2480. (in Chinese)

    [13] Cheng Y,Wang D,Zhou P,et al. Model Compression and Acce-leration for Deep Neural Networks: The Principles,Progress,and Challenges[J]. IEEE Signal Processing Magazine,2018,35(1): 126-136.

    [14] 盧冶,陳瑤,李濤,等. 面向邊緣計算的嵌入式FPGA卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建方法[J].計算機研究與發(fā)展,2018,55(3): 551-562.

    Lu Ye,Chen Yao,Li Tao,et al. Convolutional Neural Network Construction Method for Embedded FPGAs Oriented Edge Computing[J]. Journal of Computer Research and Development,2018,55(3): 551-562. (in Chinese)

    Software and Hardware Cooperative Acceleration Technology for CNN

    Li Xinyao1*,Liu Feiyang1,2,Wen Pengcheng1,2,Li Peng 1,2

    (1. Xian Aeronautics Computing Technique Research Institute,AVIC,Xian 710068,China;

    2. Aviation Key Laboratory of Science and Technology on Airborne and Missileborne Computer,Xian 710068,China)

    Abstract: To meet requirements of building intelligent avionics systems,and improve the intelligent combat level of manned/unmanned aerial vehicles,the software and hardware cooperative acceleration technology for CNN is designed and implemented to solve complex problems such as target recognition,auxiliary decision-making,and autonomous planning. Aiming at solving the conflicts between the huge amount of parameters and the limited storage resources for embedded environment,the neural network model is optimized with model structure optimization and quantization of parameters. Aiming at solving the conflicts between complex floating-point operations and the shortage of computing resources,the convolution accelerating operator and the pooling accelerating operator are designed based on Verilog HDL. The pipeline and full parallel method are used to achieve the purpose of acceleration. Through the synergy of software optimization and hardware accelerated,the inference process of convolutional neural network is accelerated. Two popular CNN networks,that are YOLOv3 and YOLOv3-Tiny,are used as examples to accelerate and verify on the Xilinx ZCU102 FPGA development board. The results show that compared with the original models,the parameters of the accelerated models can be compressed about 3/4. The inference speed of YOLOv3 is increased by nearly 65 times,and that of YOLOv3-Tiny is increased by about 23 times.

    Key words:? intelligent computing;hardware acceleration;target detection;model compression;FPGA

    收稿日期:2020-01-19

    基金項目:航空科學(xué)基金項目(2018ZC31002;2018ZC31003)

    作者簡介:李欣瑤(1994-),女,陜西西安人,碩士, 研究方向為智能計算加速技術(shù)。

    猜你喜歡
    目標(biāo)檢測
    視頻中目標(biāo)檢測算法研究
    軟件(2016年4期)2017-01-20 09:38:03
    行為識別中的人體運動目標(biāo)檢測方法
    移動機器人圖像目標(biāo)識別
    基于背景建模法的運動目標(biāo)檢測
    基于P3電位的目標(biāo)檢測研究
    科技視界(2016年4期)2016-02-22 13:09:19
    一種改進的峰均功率比判源方法
    国产女主播在线喷水免费视频网站| 最近手机中文字幕大全| 丝袜在线中文字幕| 国产不卡av网站在线观看| 亚洲成色77777| 香蕉国产在线看| 男女国产视频网站| 国产精品一区二区精品视频观看| 国产淫语在线视频| 亚洲国产欧美一区二区综合| 中文字幕色久视频| 高清欧美精品videossex| 日韩制服丝袜自拍偷拍| 国产av精品麻豆| 成人国产麻豆网| xxxhd国产人妻xxx| 热re99久久精品国产66热6| 久久精品aⅴ一区二区三区四区| 久久国产精品大桥未久av| 中文字幕人妻熟女乱码| 国产成人免费无遮挡视频| 免费黄色在线免费观看| 宅男免费午夜| 香蕉国产在线看| 国产日韩一区二区三区精品不卡| 久久久久久免费高清国产稀缺| 国产成人午夜福利电影在线观看| 超色免费av| 久久久久精品国产欧美久久久 | 丝袜人妻中文字幕| 免费观看a级毛片全部| 国产精品亚洲av一区麻豆 | 美女午夜性视频免费| 99国产综合亚洲精品| 少妇人妻久久综合中文| av国产久精品久网站免费入址| 中文字幕制服av| 亚洲精品一二三| 一级片免费观看大全| 自拍欧美九色日韩亚洲蝌蚪91| 欧美乱码精品一区二区三区| 一级爰片在线观看| 母亲3免费完整高清在线观看| xxx大片免费视频| 无限看片的www在线观看| 99久久人妻综合| 岛国毛片在线播放| 日韩制服骚丝袜av| 欧美人与性动交α欧美软件| tube8黄色片| 叶爱在线成人免费视频播放| 色综合欧美亚洲国产小说| 一区二区三区乱码不卡18| 黑人巨大精品欧美一区二区蜜桃| 亚洲成色77777| 午夜老司机福利片| 亚洲四区av| 亚洲第一av免费看| a级毛片在线看网站| 国产激情久久老熟女| 亚洲一区中文字幕在线| 男人添女人高潮全过程视频| 又大又爽又粗| 黄色怎么调成土黄色| 久久久久久免费高清国产稀缺| 高清视频免费观看一区二区| 美女主播在线视频| 欧美日韩国产mv在线观看视频| 亚洲少妇的诱惑av| 你懂的网址亚洲精品在线观看| 亚洲免费av在线视频| 亚洲国产欧美网| 午夜精品国产一区二区电影| 最近中文字幕2019免费版| 操美女的视频在线观看| 下体分泌物呈黄色| 精品少妇黑人巨大在线播放| 亚洲国产av新网站| 五月天丁香电影| avwww免费| 精品福利永久在线观看| 国产高清国产精品国产三级| 亚洲精品国产区一区二| 午夜福利在线免费观看网站| 日韩中文字幕视频在线看片| 亚洲欧美精品综合一区二区三区| 免费在线观看完整版高清| 国产精品无大码| 天美传媒精品一区二区| 久久精品国产a三级三级三级| 99精国产麻豆久久婷婷| 男女边吃奶边做爰视频| 青春草国产在线视频| 亚洲男人天堂网一区| 国产精品无大码| 国精品久久久久久国模美| 欧美 日韩 精品 国产| 女性生殖器流出的白浆| 日韩一卡2卡3卡4卡2021年| 午夜91福利影院| 丁香六月天网| 亚洲国产欧美一区二区综合| 成人漫画全彩无遮挡| 国产无遮挡羞羞视频在线观看| 黄片小视频在线播放| 两性夫妻黄色片| 亚洲精品久久午夜乱码| 亚洲国产精品国产精品| 丝袜人妻中文字幕| 中文字幕高清在线视频| 亚洲成人免费av在线播放| 国产av码专区亚洲av| 可以免费在线观看a视频的电影网站 | 黄片小视频在线播放| 亚洲天堂av无毛| 一二三四中文在线观看免费高清| 国产又爽黄色视频| 国产黄频视频在线观看| 亚洲成人手机| 久久国产精品男人的天堂亚洲| 亚洲精品aⅴ在线观看| 亚洲欧洲日产国产| 国产乱来视频区| 蜜桃在线观看..| 街头女战士在线观看网站| 久久青草综合色| 乱人伦中国视频| 你懂的网址亚洲精品在线观看| 国产亚洲欧美精品永久| 亚洲精品成人av观看孕妇| 不卡视频在线观看欧美| xxx大片免费视频| 久热爱精品视频在线9| 人妻一区二区av| 欧美日韩视频精品一区| 亚洲综合精品二区| 亚洲欧美成人精品一区二区| 亚洲欧美成人综合另类久久久| 亚洲欧美一区二区三区久久| avwww免费| 一区二区三区精品91| 伦理电影免费视频| 亚洲成人一二三区av| 国产欧美亚洲国产| 日韩av免费高清视频| 一边摸一边做爽爽视频免费| 欧美最新免费一区二区三区| 久久久精品94久久精品| 中文字幕制服av| 一级毛片黄色毛片免费观看视频| 两个人看的免费小视频| 黑人巨大精品欧美一区二区蜜桃| 久久天躁狠狠躁夜夜2o2o | 日韩一区二区三区影片| 人人妻人人澡人人爽人人夜夜| 一本色道久久久久久精品综合| 国产黄色视频一区二区在线观看| 岛国毛片在线播放| 夫妻午夜视频| 韩国精品一区二区三区| 久久女婷五月综合色啪小说| 多毛熟女@视频| 女人被躁到高潮嗷嗷叫费观| 欧美精品一区二区大全| 可以免费在线观看a视频的电影网站 | 成人毛片60女人毛片免费| 久久久久人妻精品一区果冻| 日本91视频免费播放| 狠狠婷婷综合久久久久久88av| 亚洲精品乱久久久久久| 欧美成人午夜精品| 中文字幕人妻丝袜制服| 18禁裸乳无遮挡动漫免费视频| 亚洲欧美一区二区三区久久| 久久人人爽人人片av| 成人18禁高潮啪啪吃奶动态图| 一边摸一边做爽爽视频免费| 亚洲精品美女久久av网站| 午夜av观看不卡| 久久99热这里只频精品6学生| 蜜桃国产av成人99| 国产在线视频一区二区| 国产 一区精品| 日日摸夜夜添夜夜爱| www.自偷自拍.com| 成人亚洲欧美一区二区av| 亚洲国产av影院在线观看| 亚洲欧美一区二区三区久久| 亚洲国产毛片av蜜桃av| 精品国产露脸久久av麻豆| e午夜精品久久久久久久| 看免费av毛片| 飞空精品影院首页| 午夜福利免费观看在线| 少妇人妻久久综合中文| 亚洲欧美清纯卡通| 国产在线一区二区三区精| 欧美日韩一区二区视频在线观看视频在线| 操美女的视频在线观看| 国语对白做爰xxxⅹ性视频网站| videos熟女内射| 最近最新中文字幕大全免费视频 | 国产 一区精品| 又黄又粗又硬又大视频| 亚洲在久久综合| av片东京热男人的天堂| 在线观看www视频免费| 成人亚洲欧美一区二区av| 男女国产视频网站| 亚洲欧美色中文字幕在线| 街头女战士在线观看网站| 女人爽到高潮嗷嗷叫在线视频| 赤兔流量卡办理| 亚洲美女视频黄频| 麻豆精品久久久久久蜜桃| 免费高清在线观看日韩| 午夜免费鲁丝| 日韩 欧美 亚洲 中文字幕| 别揉我奶头~嗯~啊~动态视频 | 男男h啪啪无遮挡| avwww免费| 99香蕉大伊视频| 国产精品久久久久成人av| 黄片小视频在线播放| 一本—道久久a久久精品蜜桃钙片| 亚洲熟女毛片儿| 国产有黄有色有爽视频| 午夜免费鲁丝| 亚洲欧美成人精品一区二区| 午夜久久久在线观看| 久久久久久久国产电影| 超色免费av| 国产精品久久久久成人av| 在线精品无人区一区二区三| 国产视频首页在线观看| 国产淫语在线视频| 日本vs欧美在线观看视频| 久久久精品区二区三区| av网站免费在线观看视频| 亚洲成人手机| 黄片小视频在线播放| 成年女人毛片免费观看观看9 | 国产精品麻豆人妻色哟哟久久| 成人黄色视频免费在线看| 男人爽女人下面视频在线观看| 久久鲁丝午夜福利片| 一边亲一边摸免费视频| 黑人巨大精品欧美一区二区蜜桃| 黄片无遮挡物在线观看| 亚洲国产精品一区三区| 80岁老熟妇乱子伦牲交| 日韩av免费高清视频| 亚洲av在线观看美女高潮| 亚洲精品自拍成人| 亚洲自偷自拍图片 自拍| 亚洲精品美女久久久久99蜜臀 | 欧美日韩精品网址| 99精国产麻豆久久婷婷| 热re99久久国产66热| 一区二区日韩欧美中文字幕| 国产成人91sexporn| 精品国产超薄肉色丝袜足j| 国产免费福利视频在线观看| 色播在线永久视频| 19禁男女啪啪无遮挡网站| 亚洲欧洲精品一区二区精品久久久 | 亚洲中文av在线| 丰满乱子伦码专区| 秋霞在线观看毛片| 国产一区二区激情短视频 | 欧美日韩视频精品一区| 91老司机精品| 亚洲国产成人一精品久久久| 人体艺术视频欧美日本| 午夜激情久久久久久久| 欧美日韩精品网址| 黄片小视频在线播放| 99香蕉大伊视频| 亚洲精品第二区| 中文字幕人妻丝袜制服| av电影中文网址| 国产欧美亚洲国产| 我的亚洲天堂| 久久婷婷青草| 成人国语在线视频| 久久精品国产a三级三级三级| 麻豆av在线久日| 夜夜骑夜夜射夜夜干| 国产成人一区二区在线| 高清av免费在线| 日日啪夜夜爽| 精品一区二区三区四区五区乱码 | 国产在视频线精品| 超碰97精品在线观看| 天堂中文最新版在线下载| 成人漫画全彩无遮挡| 亚洲美女搞黄在线观看| 两性夫妻黄色片| 97精品久久久久久久久久精品| 免费观看av网站的网址| 91精品伊人久久大香线蕉| 亚洲久久久国产精品| 大码成人一级视频| 亚洲精品中文字幕在线视频| 久久久国产一区二区| 99久国产av精品国产电影| 黄色一级大片看看| 青春草亚洲视频在线观看| 精品国产一区二区三区四区第35| 免费高清在线观看视频在线观看| 99热全是精品| 日韩一本色道免费dvd| 丝袜美足系列| 久久女婷五月综合色啪小说| av天堂久久9| 久久精品aⅴ一区二区三区四区| 亚洲色图 男人天堂 中文字幕| 超碰成人久久| 国产在线免费精品| 国产成人免费无遮挡视频| 亚洲久久久国产精品| 国产男女内射视频| 在线观看免费视频网站a站| 日本wwww免费看| 亚洲精品第二区| av网站免费在线观看视频| 91精品伊人久久大香线蕉| 看免费成人av毛片| av天堂久久9| 赤兔流量卡办理| 亚洲国产中文字幕在线视频| 久久久久久久国产电影| 亚洲一卡2卡3卡4卡5卡精品中文| 最近的中文字幕免费完整| 最近最新中文字幕大全免费视频 | 免费看av在线观看网站| 天天躁夜夜躁狠狠久久av| 久久久久网色| 亚洲成人av在线免费| 日日摸夜夜添夜夜爱| 热99久久久久精品小说推荐| 青春草亚洲视频在线观看| 精品人妻一区二区三区麻豆| 成人国语在线视频| 国产野战对白在线观看| 久久久精品国产亚洲av高清涩受| 亚洲美女搞黄在线观看| 香蕉国产在线看| 精品国产超薄肉色丝袜足j| 超色免费av| www日本在线高清视频| 欧美日韩一区二区视频在线观看视频在线| 91精品伊人久久大香线蕉| 性高湖久久久久久久久免费观看| 精品少妇久久久久久888优播| 久久精品熟女亚洲av麻豆精品| 大码成人一级视频| 国产日韩欧美亚洲二区| 成人国产av品久久久| 免费高清在线观看日韩| 看免费av毛片| 久久久久久久久久久免费av| 啦啦啦中文免费视频观看日本| 老汉色av国产亚洲站长工具| 久久 成人 亚洲| 人妻一区二区av| 久久久久久久久免费视频了| 久久毛片免费看一区二区三区| 久久久久精品国产欧美久久久 | 自拍欧美九色日韩亚洲蝌蚪91| 精品国产超薄肉色丝袜足j| 久久精品亚洲av国产电影网| 亚洲精品国产av成人精品| 九草在线视频观看| 精品少妇内射三级| 欧美最新免费一区二区三区| 日日摸夜夜添夜夜爱| av有码第一页| 亚洲情色 制服丝袜| 国产成人一区二区在线| 免费观看性生交大片5| 国产又色又爽无遮挡免| 9色porny在线观看| 男女床上黄色一级片免费看| 伦理电影免费视频| 亚洲在久久综合| 熟女少妇亚洲综合色aaa.| 日韩一区二区视频免费看| 欧美中文综合在线视频| 日韩 欧美 亚洲 中文字幕| 一边亲一边摸免费视频| 97在线人人人人妻| 日韩不卡一区二区三区视频在线| 国产亚洲av片在线观看秒播厂| 色网站视频免费| 亚洲欧美一区二区三区久久| 欧美黄色片欧美黄色片| 久久久久精品国产欧美久久久 | 精品一区二区三区av网在线观看 | 亚洲成人手机| 人妻 亚洲 视频| 日韩制服骚丝袜av| 免费看av在线观看网站| 色网站视频免费| 亚洲精品国产一区二区精华液| 99久久人妻综合| 精品福利永久在线观看| 热re99久久国产66热| 国产日韩欧美在线精品| 别揉我奶头~嗯~啊~动态视频 | 亚洲欧美成人精品一区二区| 人人妻人人澡人人看| 日韩一区二区三区影片| 午夜福利,免费看| 2018国产大陆天天弄谢| 国产亚洲一区二区精品| 亚洲第一区二区三区不卡| 国产日韩一区二区三区精品不卡| 午夜影院在线不卡| 亚洲熟女精品中文字幕| 国产精品一区二区精品视频观看| 欧美激情极品国产一区二区三区| 中文字幕最新亚洲高清| 日日啪夜夜爽| 国产极品粉嫩免费观看在线| 午夜激情av网站| 免费观看av网站的网址| 国产成人免费观看mmmm| 国产色婷婷99| 国产精品一区二区在线不卡| 久久天堂一区二区三区四区| 亚洲精品久久午夜乱码| 日韩,欧美,国产一区二区三区| 日日摸夜夜添夜夜爱| 最近中文字幕2019免费版| 亚洲欧美一区二区三区久久| 中文天堂在线官网| 99久国产av精品国产电影| 日韩一本色道免费dvd| 在线观看www视频免费| av在线观看视频网站免费| 女人被躁到高潮嗷嗷叫费观| 99热网站在线观看| 涩涩av久久男人的天堂| 国产精品欧美亚洲77777| 国产成人午夜福利电影在线观看| 中国国产av一级| 岛国毛片在线播放| 国产免费视频播放在线视频| 午夜福利在线免费观看网站| a级毛片黄视频| 国产成人精品无人区| 一本大道久久a久久精品| 色网站视频免费| 色播在线永久视频| 纵有疾风起免费观看全集完整版| 日韩视频在线欧美| 精品一区二区免费观看| 秋霞伦理黄片| 精品少妇久久久久久888优播| 99re6热这里在线精品视频| 少妇猛男粗大的猛烈进出视频| 看免费成人av毛片| 超碰成人久久| 国产黄色免费在线视频| 韩国av在线不卡| 欧美日韩一级在线毛片| 十八禁高潮呻吟视频| 国产成人精品福利久久| 亚洲欧洲精品一区二区精品久久久 | 99久久人妻综合| 日韩制服骚丝袜av| www.自偷自拍.com| 久久免费观看电影| 最近的中文字幕免费完整| 亚洲天堂av无毛| 亚洲国产精品一区三区| 成人亚洲精品一区在线观看| 国产精品熟女久久久久浪| 精品国产乱码久久久久久男人| 老司机在亚洲福利影院| 欧美精品一区二区大全| 悠悠久久av| e午夜精品久久久久久久| 日日啪夜夜爽| 丰满乱子伦码专区| 大香蕉久久网| netflix在线观看网站| 精品福利永久在线观看| 国产精品国产三级国产专区5o| 街头女战士在线观看网站| 亚洲精品一区蜜桃| 久久久久视频综合| 欧美激情 高清一区二区三区| av卡一久久| 一区福利在线观看| 午夜免费鲁丝| 久久人妻熟女aⅴ| 国产片特级美女逼逼视频| 欧美日韩成人在线一区二区| 人人妻,人人澡人人爽秒播 | av又黄又爽大尺度在线免费看| 久久国产精品男人的天堂亚洲| 久久人人爽av亚洲精品天堂| 美女脱内裤让男人舔精品视频| av不卡在线播放| 丝袜人妻中文字幕| 五月天丁香电影| 麻豆av在线久日| 久久久精品区二区三区| 视频在线观看一区二区三区| 亚洲自偷自拍图片 自拍| 免费在线观看完整版高清| 成人影院久久| 亚洲精品一二三| 国产免费一区二区三区四区乱码| 亚洲激情五月婷婷啪啪| 麻豆乱淫一区二区| 精品国产乱码久久久久久小说| 日韩 欧美 亚洲 中文字幕| 一级毛片电影观看| 久久女婷五月综合色啪小说| 免费黄色在线免费观看| 亚洲熟女精品中文字幕| 国产免费又黄又爽又色| 91老司机精品| 精品酒店卫生间| 中文乱码字字幕精品一区二区三区| 亚洲熟女精品中文字幕| 中文字幕制服av| 日本猛色少妇xxxxx猛交久久| 岛国毛片在线播放| av电影中文网址| 大香蕉久久成人网| 丁香六月天网| av又黄又爽大尺度在线免费看| 亚洲成av片中文字幕在线观看| 老司机深夜福利视频在线观看 | 热99久久久久精品小说推荐| 好男人视频免费观看在线| 亚洲av中文av极速乱| 国产成人欧美| 久久久国产一区二区| 黄色视频不卡| 一区二区三区乱码不卡18| 国产精品偷伦视频观看了| 精品亚洲成a人片在线观看| 啦啦啦在线观看免费高清www| 99re6热这里在线精品视频| 老司机亚洲免费影院| 亚洲精品日韩在线中文字幕| 久久精品国产a三级三级三级| 国产片内射在线| 十八禁网站网址无遮挡| 曰老女人黄片| 精品一区二区三区四区五区乱码 | 午夜免费男女啪啪视频观看| 啦啦啦中文免费视频观看日本| 纵有疾风起免费观看全集完整版| 男人舔女人的私密视频| 日韩大片免费观看网站| 另类亚洲欧美激情| 黄色毛片三级朝国网站| 国产精品av久久久久免费| 久久久久久免费高清国产稀缺| 精品久久蜜臀av无| 欧美精品高潮呻吟av久久| 欧美少妇被猛烈插入视频| 欧美人与善性xxx| 男男h啪啪无遮挡| 高清黄色对白视频在线免费看| 亚洲国产成人一精品久久久| 秋霞伦理黄片| 99九九在线精品视频| 婷婷色麻豆天堂久久| 嫩草影视91久久| av天堂久久9| 一级毛片黄色毛片免费观看视频| 少妇 在线观看| 中国三级夫妇交换| 亚洲,欧美,日韩| 精品国产国语对白av| 中文欧美无线码| 久久精品熟女亚洲av麻豆精品| 成人18禁高潮啪啪吃奶动态图| 亚洲欧美精品自产自拍| 男人舔女人的私密视频| 在线观看国产h片| 看免费成人av毛片| 久久久久国产精品人妻一区二区| 七月丁香在线播放| 欧美黄色片欧美黄色片| 亚洲国产最新在线播放| 亚洲天堂av无毛| 久热这里只有精品99| 人人妻人人添人人爽欧美一区卜| 国产福利在线免费观看视频| 丝瓜视频免费看黄片| 久久热在线av| 成人亚洲欧美一区二区av| 亚洲精品中文字幕在线视频| 多毛熟女@视频| 捣出白浆h1v1| 免费黄色在线免费观看| 国产精品人妻久久久影院| 国产成人一区二区在线| a 毛片基地| 日韩一卡2卡3卡4卡2021年| 成人午夜精彩视频在线观看| 在线观看免费高清a一片| 国产免费福利视频在线观看| www.自偷自拍.com| 91老司机精品| 日韩一本色道免费dvd| 18禁观看日本|