• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    視覺智能發(fā)展與應(yīng)用

    2019-07-16 11:55:38譚雅苧李倩王建標(biāo)
    電子技術(shù)與軟件工程 2019年8期
    關(guān)鍵詞:步態(tài)人臉識別特征提取

    譚雅苧 李倩 王建標(biāo)

    摘要:文章首先介紹了視覺智能的概念與現(xiàn)狀,其次系統(tǒng)分析了視覺智能領(lǐng)域的研究方向與應(yīng)用現(xiàn)狀,最后給出了未來的發(fā)展趨勢與挑戰(zhàn)。

    [關(guān)鍵詞]視覺智能計算機視覺應(yīng)用現(xiàn)狀

    1引言

    視覺是人類與大自然產(chǎn)生聯(lián)系最直接的途徑,可以幫助人類認識和理解外部世界,視覺智能無疑成為在人工智能領(lǐng)域最重要分支。視覺智能(VisualIntelligence)是計算機視覺與人工智能的融合學(xué)科,主要目的是讓機器可以理解視覺場景。簡單來說,研究者讓計算機對于圖片或者視頻等視覺場景不斷地學(xué)習(xí),進而分析視覺信息,最終達到自主理解視覺場景的水平。

    近年來,視覺智能廣泛應(yīng)用于城市設(shè)計、智能家居、醫(yī)療影像、交通監(jiān)控、廣播電視等領(lǐng)域,由于其巨大的研究價值和不可估量的應(yīng)用前景,吸引了大批研究者進行視覺智能領(lǐng)域的研究,本文針對視覺智能的發(fā)展與應(yīng)用現(xiàn)狀進行綜述,并對研究算法以及未來發(fā)展趨勢進行分析。

    2視覺智能的研究方向

    視覺智能可以理解為計算機視覺研究與人工智能研究的結(jié)合,主要是針對圖像、視頻等視覺內(nèi)容進行分析和理解。近年來,視覺智能領(lǐng)域的相關(guān)研究層出不窮,包括人臉識別、行人跟蹤、目標(biāo)分類與識別、視覺問答(VQA)、語義分割、姿態(tài)估計、行為識別、場景理解等。

    2.1人臉識別技術(shù)

    人臉識別是視覺智能的基礎(chǔ)研究,由于它的識別隱蔽、人像采集的方便、數(shù)據(jù)規(guī)模較大等特性,迅速成為最熱門的研究之一,廣泛的應(yīng)用于日常生活和城市建設(shè)的當(dāng)中。人臉識別主要經(jīng)歷了四個發(fā)展階段:基于心理學(xué)和工程學(xué)研究、基于人臉的機器識別研究、基于人機交互識別研究和基于機器學(xué)習(xí)的人臉識別研究。人臉識別的常見數(shù)據(jù)集有LFW、CMUPIE、YouTubeFace、PaSC等。隨著大規(guī)模人臉識別數(shù)據(jù)集的發(fā)展,研究者們提出了許多不同的算法,早年主要以梯度方向直方圖特征(HistogramofOrientedGridients,簡稱HOG)為主進行人臉識別,HOG特征是通過統(tǒng)計圖像局部區(qū)域的梯度方向信息來作為該局部圖像區(qū)域的表征。這類算法對于約束條件下的人臉識別效果較好,然而當(dāng)某些因素發(fā)生變化,識別率顯著降低。Hussain等人在2012年提出的LQP以及2014年LeiZ等人提出的DFD算法是典型的基于淺層學(xué)習(xí)的人臉識別算法。由于這些算法都是基于實數(shù)值特征進行的,對于無約束條件下的人臉較為敏感,因此面臨輸入圖像的背景環(huán)境因素變化較大時,魯棒性和準(zhǔn)確率會顯著下降,進而導(dǎo)致人臉識別效果不佳。隨著深度學(xué)習(xí)的發(fā)展,DeepFace、DeepID系列、Center-Loss等基于深度學(xué)習(xí)的人臉檢測算法取得了優(yōu)異的成績。

    2.2目標(biāo)檢測技術(shù)

    目標(biāo)檢測在圖像檢索、視頻監(jiān)控、海洋監(jiān)控、人類行為識別、防御系統(tǒng)和安全醫(yī)療等各種領(lǐng)域的廣泛應(yīng)用,使之成為視覺智能領(lǐng)域討論的中心話題。目標(biāo)檢測可以理解為針對人、動物、車、家具等真實世界物體進行分類與識別的一項研究,目標(biāo)檢測分為靜態(tài)目標(biāo)檢測和動態(tài)目標(biāo)檢測兩類。常見的靜態(tài)數(shù)據(jù)集有ImageNet、MSCOCO、PASCALVOC、KITTI等。一般來說,相比于靜態(tài)目標(biāo)檢測,動態(tài)目標(biāo)檢測需要從視頻幀序列的背景環(huán)境中分割出動態(tài)目標(biāo),需要經(jīng)歷動態(tài)目標(biāo)識別、目標(biāo)跟蹤、行為分析三個階段。目標(biāo)檢測以背景減法、幀差法、時間差法、光流為代表傳統(tǒng)算法和以RCNN、FasterRCNN、YOLO、SSD為代表的深度學(xué)習(xí)算法兩類算法為主,其中基于深度卷積網(wǎng)絡(luò)的目標(biāo)檢測算法又可以分為R-CNN系列和SSD、YOLO算法系列,基于深度學(xué)習(xí)的算法在檢測性能以及檢測速度方面都要優(yōu)于傳統(tǒng)算法。

    2.3視覺問答技術(shù)

    視覺問答(VisualQuestionAnswer,簡稱VQA)是一種計算機視覺與自然語言處理相結(jié)合的任務(wù)。VQA系統(tǒng)以圖像和基于該圖像的開放性問題作為輸入,經(jīng)過合理的分析后產(chǎn)生自然語言組成的答案作為輸出。技術(shù)方面,與其他的視覺智能任務(wù)相比,VQA任務(wù)融合了多個復(fù)雜學(xué)科知識,因此面臨了更多的未知性,功能實現(xiàn)更具挑戰(zhàn)。VQA-abstract、Visual7W、COCO-QA、DAQUAR、FM-IQA為典型的VQA數(shù)據(jù)集。VQA特征提取包括圖像和問題兩個部分,圖像特征提取常用的網(wǎng)絡(luò)有Resnet、VGG等,問題特征提取常采用的網(wǎng)絡(luò)有GRU、LSTM等。視覺問答有聯(lián)合嵌入、注意力機制、組合模型、知識增強四類方法?,F(xiàn)有的視覺智能的目前的研究重點還是基于圖像展開的,對于視頻視覺問答的研究屈指可數(shù),未來的挑戰(zhàn)還有很多。

    2.4步態(tài)識別技術(shù)

    步態(tài)識別(GaitRecognition)是視覺智能領(lǐng)域一個重要研究方向,它旨在根據(jù)人類走路姿勢進行身份識別。步態(tài)識別常用數(shù)據(jù)庫有CASIA、OU-ISIR、USF、南安普頓等。步態(tài)識別過程通常需要經(jīng)過運動檢測、周期檢測、特征提取和識別處理,其中步態(tài)特征提取主要有基于模型、基于非模型和融合特征提取這三類方法,識別過程的方法有Bayes、SVM、HMM、CNN、KNN等。步態(tài)識別技術(shù)常于目標(biāo)檢測、人臉識別、指紋識別等技術(shù)相結(jié)合,由于步態(tài)識別涉及場景復(fù)雜,實際應(yīng)用過程還有很多問題待解決。

    3視覺智能的應(yīng)用現(xiàn)狀

    經(jīng)過多年的發(fā)展,視覺智能領(lǐng)域相關(guān)技術(shù)不斷地創(chuàng)新、優(yōu)化、迭代、更新,大大地豐富和完善視覺智能研究體系,促使視覺智能在城市設(shè)計、智能交通、廣播電視、醫(yī)療影像診斷、工業(yè)視覺檢測等領(lǐng)域都有廣泛的應(yīng)用。同時,隨著大數(shù)據(jù)、物聯(lián)網(wǎng)的發(fā)展,視覺智能未來的應(yīng)用領(lǐng)域也會不斷地拓展和豐富。

    3.1媒體行業(yè)的應(yīng)用

    媒體行業(yè)主要基于內(nèi)容制作、信息傳播、終端服務(wù),視覺智能的快速發(fā)展,必然會在媒體行業(yè)掀起一陣浪潮。迄今為止,視覺智能領(lǐng)域的人臉識別、行為跟蹤、圖像檢索等技術(shù)已經(jīng)成功應(yīng)用在電影特效制作和短視頻內(nèi)容生產(chǎn)與傳播當(dāng)中,例如人臉識別成功應(yīng)用于抖音、快手等短視頻APP,行為識別與跟蹤在3D電影制作大放異彩,視頻分析特定主題、場景、對象或面部,這些例子足以證明,視覺智能如今已經(jīng)成為媒體行業(yè)不可或缺的部分,“視覺智能+媒體”模式成為了必然的發(fā)展趨勢。

    3.2交通行業(yè)的應(yīng)用

    隨著計算機視覺和人工智能技術(shù)的崛起,無人駕駛近年來備受矚目。寶馬、通用、福特等世界知名汽車廠商紛紛加入無人駕駛研發(fā)行列當(dāng)中,2016年8月谷歌成立無人駕駛項目組,10月特斯拉成為第一家大量生產(chǎn)自動駕駛硬件公司,同年12月福特攜第二代自動駕駛汽車亮相。除了汽車廠商,阿里騰訊百度等國內(nèi)互聯(lián)網(wǎng)龍頭公司都開始分別成立自動駕駛實驗室,視覺智能推動者汽車產(chǎn)業(yè)的蓬勃發(fā)展。在交通監(jiān)控方面,行人檢測技術(shù)可以輔助交警進行嫌疑人監(jiān)控追蹤,提供客觀公正的證據(jù),有效遏制違法行為發(fā)生,因此視覺智能在交通行業(yè)始終發(fā)揮著舉足輕重的作用。

    3.3醫(yī)療行業(yè)的應(yīng)用

    21世紀(jì),最值得關(guān)注的是視覺智能已經(jīng)滲透到醫(yī)學(xué)的各個領(lǐng)域,相關(guān)技術(shù)在醫(yī)療行業(yè)發(fā)揮著重要的作用,如智能影像檢測、醫(yī)學(xué)智能機器人都較為常見。醫(yī)療行業(yè)由于涉及面廣、復(fù)雜度高、高風(fēng)險等特點,使得無數(shù)研究者開始嘗試視覺智能與傳統(tǒng)醫(yī)學(xué)相結(jié)合的研究模式,視覺智能將改變傳統(tǒng)醫(yī)療行業(yè)的模式,重塑醫(yī)療產(chǎn)業(yè),推動醫(yī)學(xué)發(fā)展。

    4總結(jié)與展望

    隨著科技的發(fā)展,視覺智能雖然在各行各業(yè)都取得了很多不錯的成果,但是想要達到真正意義上的“智能”仍然還有很長的一段路要走。如何讓機器對視覺場景進行自主思考和理解,是視覺智能的需要解決的重要問題。

    視覺智能的發(fā)展需要結(jié)合強大的理論知識與過硬的技術(shù)支持,研究者們需要不斷地探究新知識,努力開拓新視野,將視覺智能技術(shù)發(fā)揮到極致,真正的融入到人類生活的方方面面。

    參考文獻

    [1]田雷,基于特征學(xué)習(xí)的無約束環(huán)境下的人臉識別研究[D].北京郵電大學(xué),2018.

    [2]A. Samal,P. A. Iyengar. Automaticrecognition and analysis of humanfaces and facial expressions: asurvey [J ]。 Pattern Recognition,1992,25(1): 65-67.

    [3]祝秀萍,吳學(xué)毅,劉文峰,人臉識別綜述與展望[J].計算機與信息技術(shù),2008(04):53-56.

    [4]張翠萍,蘇光大,人臉識別技術(shù)綜述[J].中國圖像圖形學(xué)報,2000,5(11):885-894.

    [5]周曉彥,王珂,李凌燕,基于深度學(xué)習(xí)的目標(biāo)檢測算法綜述[J].電子測量技術(shù),2017,40(11).

    [6]俞俊,汪亮,余宙.視覺問答技術(shù)研究[J].計算機研究與發(fā)展,2018,55(09):122-134.

    [7]王科俊,侯本博。步態(tài)識別綜述[J].中國圖像圖形學(xué)報,2018,12(07):1152-1160.

    猜你喜歡
    步態(tài)人臉識別特征提取
    小螞蟻與“三角步態(tài)”
    人臉識別 等
    揭開人臉識別的神秘面紗
    基于Gazebo仿真環(huán)境的ORB特征提取與比對的研究
    電子制作(2019年15期)2019-08-27 01:12:00
    基于面部和步態(tài)識別的兒童走失尋回系統(tǒng)
    電子制作(2018年18期)2018-11-14 01:48:04
    基于Kinect的學(xué)步期幼兒自然步態(tài)提取
    一種基于LBP 特征提取和稀疏表示的肝病識別算法
    基于類獨立核稀疏表示的魯棒人臉識別
    計算機工程(2015年8期)2015-07-03 12:19:07
    便宜假肢能模仿正常步態(tài)
    基于MED和循環(huán)域解調(diào)的多故障特征提取
    富阳市| 马山县| 高唐县| 宁波市| 琼海市| 民县| 桓台县| 九龙县| 怀远县| 文昌市| 平江县| 杂多县| 祁东县| 安庆市| 遂溪县| 固安县| 宣武区| 莆田市| 濮阳县| 蕉岭县| 平顶山市| 阳高县| 宁明县| 奈曼旗| 肇庆市| 子洲县| 株洲市| 武川县| 治多县| 英吉沙县| 昌平区| 潢川县| 柘城县| 百色市| 青海省| 东乡族自治县| 浙江省| 康定县| 菏泽市| 翁牛特旗| 绩溪县|