• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      計算機視覺技術(shù)及產(chǎn)業(yè)化應(yīng)用態(tài)勢分析

      2018-02-15 01:11:45
      信息通信技術(shù)與政策 2018年9期
      關(guān)鍵詞:計算機算法

      1 引言

      計算機視覺是人工智能的重要發(fā)展方向,廣泛應(yīng)用于安防、金融、醫(yī)療等多個領(lǐng)域。計算機視覺指用計算機實現(xiàn)人對客觀世界三維場景的感知、識別、理解和分析,與自然語言處理、人機交互并列為人工智能3大關(guān)鍵技術(shù)領(lǐng)域。計算機視覺涉及計算機科學(xué)、數(shù)學(xué)、工程學(xué)、物理學(xué)、生物學(xué)、心理學(xué)等多門學(xué)科,如圖形算法、信息檢索、機器學(xué)習(xí)、機器人、圖像處理、認知科學(xué)等。計算機視覺能夠極大地改善人與世界的交互方式,代替完成更多突破人類視覺局限的任務(wù),如長時間、不間斷的安防監(jiān)控等。

      計算機視覺產(chǎn)業(yè)鏈主要由3個層面組成,一是基礎(chǔ)層,包括服務(wù)器、芯片、傳感器、計算平臺、數(shù)據(jù)等;二是技術(shù)層,包括算法、產(chǎn)品及行業(yè)解決方案,如安防影像分析、泛金融身份認證、手機及互聯(lián)網(wǎng)娛樂、批發(fā)零售商品識別、嵌入式智能系統(tǒng)、工業(yè)制造、廣告營銷、醫(yī)療影像分析、自動駕駛等;三是應(yīng)用層,涉及公共安全、金融、醫(yī)療、互聯(lián)網(wǎng)、手機、交通等多個領(lǐng)域。當前,計算機視覺是人工智能領(lǐng)域發(fā)展最迅猛的技術(shù)方向,靜態(tài)和動態(tài)圖像識別在安防、視頻廣告、泛金融、手機娛樂、醫(yī)療影像等領(lǐng)域得到規(guī)模應(yīng)用。

      2 計算機視覺技術(shù)產(chǎn)業(yè)發(fā)展現(xiàn)狀及面臨的挑戰(zhàn)

      全球計算機視覺快速發(fā)展,我國市場空間廣闊、技術(shù)創(chuàng)新活躍。根據(jù)咨詢公司發(fā)布的數(shù)據(jù)預(yù)測,2018年全球計算機視覺市場規(guī)模將超過300億元,年均增長將超過20%,其中中國市場規(guī)模將達到120億元。

      國內(nèi)機器視覺企業(yè)積極推進技術(shù)研發(fā)及產(chǎn)業(yè)化應(yīng)用,如商湯科技與華為、高通、中國移動、小米、本田汽車等達成合作,技術(shù)產(chǎn)品遍布金融、安防、AR、智能手機、自動駕駛等多個領(lǐng)域;曠視科技旗下FaceID平臺廣泛應(yīng)用于今日頭條、支付寶、vivo、小米、小麥鋪、繽果盒子等知名公司,支撐全球超過2.5億人實現(xiàn)遠程實名身份驗證,并推出人臉解鎖手機、新零售刷臉支付等應(yīng)用;云從科技自動人臉識別技術(shù)產(chǎn)品已在中國超過22個省市上線應(yīng)用,支持區(qū)域布控追逃以及銀行刷臉取現(xiàn)、金融大數(shù)據(jù)服務(wù)等;依圖科技針對醫(yī)療領(lǐng)域研發(fā)的閱片機器人已在幾十家三甲醫(yī)院的影像中心落地;超多維計算視覺綜合解決方案致力于提供與人類視覺感知習(xí)慣更符合的智能化、自然化、人性化、娛樂化的全新體驗,并在醫(yī)療、教育、體驗商城、設(shè)計等領(lǐng)域綜合布局。

      數(shù)據(jù)、算法模型和運算力是計算機視覺發(fā)展的三大基本要素。計算機視覺的快速發(fā)展得益于近年來數(shù)據(jù)量暴發(fā)式增長、運算力持續(xù)增強和深度學(xué)習(xí)算法的出現(xiàn)。首先,算法模型是計算機基于所訓(xùn)練大量數(shù)據(jù)集歸納總結(jié)的識別邏輯,海量優(yōu)質(zhì)的應(yīng)用場景數(shù)據(jù)是實現(xiàn)精準視覺識別的前提和基礎(chǔ),以人臉識別為例,算法模型的訓(xùn)練對圖片數(shù)據(jù)的需求量達到百萬級別以上;互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等產(chǎn)生數(shù)據(jù)量的急劇增加為訓(xùn)練計算機視覺技術(shù)提供源源不斷的素材,助力視覺識別精準度快速提升。

      其次,GPU運算力的大幅提升為計算機視覺發(fā)展提供能力保障,視頻、圖像數(shù)據(jù)處理需要大量矩陣計算操作,對并行運算能力要求較高,傳統(tǒng)CPU無法滿足大量計算需求,如使用CPU訓(xùn)練簡單的神經(jīng)網(wǎng)絡(luò)模型需要幾周的時間,極大地制約了算法模型的試驗及迭代工作。為專門執(zhí)行復(fù)雜數(shù)學(xué)、集合計算的GPU很好地解決了并行計算的難題,為數(shù)據(jù)處理規(guī)模、運算速度帶來了指數(shù)級增長與改善,根據(jù)執(zhí)行大規(guī)模無監(jiān)督深度學(xué)習(xí)模型訓(xùn)練試驗的顯示,使用GPU和傳統(tǒng)雙核CPU在運算速度上的差距接近70倍,使用GPU運行4層、一億個參數(shù)的深度學(xué)習(xí)網(wǎng)絡(luò)僅需要一天時間,而使用CPU需要數(shù)周的時間。

      最后,深度學(xué)習(xí)算法極大地提高計算機視覺識別的準確率。深度學(xué)習(xí)是一種基于多層神經(jīng)網(wǎng)絡(luò)、以海量數(shù)據(jù)為輸入的自學(xué)習(xí)算法,在其出現(xiàn)之前計算機視覺識別是通過人為尋找特征讓機器辨識物體狀態(tài),由于人為設(shè)定邏輯無法窮舉各類復(fù)雜情境,因而面臨較大局限性、識別準確率較低;深度學(xué)習(xí)算法的出現(xiàn),讓計算機視覺識別邏輯由人為設(shè)定變?yōu)樽詫W(xué)習(xí)狀態(tài),不再通過固定的公式或程序描述來做決定,而是根據(jù)大量實際行為數(shù)據(jù)來自我調(diào)整規(guī)則中的參數(shù),進而做出準確的判斷;根據(jù)ImageNet的比賽數(shù)據(jù)顯示,深度學(xué)習(xí)的出現(xiàn)使得圖像識別精準度從70%左右提升到95%以上。

      計算機視覺核心技術(shù)涉及圖像分類、對象檢測、目標跟蹤、語義分割和實例分割5個方面,開源環(huán)境的繁榮發(fā)展大幅度降低了計算機視覺技術(shù)的創(chuàng)新門檻。圖像分類即根據(jù)被標記的圖像信息預(yù)測新的圖像測量結(jié)果,主要面臨技術(shù)挑戰(zhàn)包括視點變化、尺度變化、圖像變形、照明條件、背景雜斑等。對象檢測即利用圖像處理與模式識別等理論方法,檢測圖像中存在的目標對象、確定其語義類別并標定位置。目標跟蹤即在特定場景跟蹤某一個或多個特定對象的過程,目前在無人駕駛領(lǐng)域應(yīng)用較多。語義分割是計算機視覺的核心,將整個圖像分成多個像素組并對其進行標記和分類。實例分割將不同類型的實例進行分類,如用不同顏色來標注多個同類物品。目前學(xué)術(shù)界、產(chǎn)業(yè)界已先后推出了許多用于深度學(xué)習(xí)模型訓(xùn)練的開源工具、框架及數(shù)據(jù)集,如Caffe、Theano、Torch、MXNet、TensorFlow、PaddlePaddle、 CNTK、 MNIST、 ImageNet、 Visual Genome等,在一定程度上降低了技術(shù)研發(fā)門檻,但企業(yè)在處理實際復(fù)雜業(yè)務(wù)時仍需要針對性能、顯存支持、生態(tài)完善性、使用效率等調(diào)整框架以滿足個性化需求;此外,對于前沿算法研發(fā)創(chuàng)新以及算法在不同環(huán)境的優(yōu)化升級,不同廠商技術(shù)高低差異依然很大。

      計算機視覺算法技術(shù)層壁壘高,硬件層資本密集、巨頭眾多,應(yīng)用層市場較為分散,我國算法創(chuàng)新活躍、GPU芯片技術(shù)水平仍有待提升。算法技術(shù)層技術(shù)規(guī)模達到千億量級,需要打通產(chǎn)業(yè)鏈上下游,技術(shù)壁壘相對較高,如谷歌Tensor Flow平臺和Facebook Torch平臺在全球擁有較大的影響力。硬件層主要由英特爾、英偉達、高通等國際巨頭公司壟斷,對資金投入要求較高。應(yīng)用層涉及安防監(jiān)控、自動駕駛、機器人等眾多領(lǐng)域,IBM、特斯拉、谷歌、微軟等分別在不同的細分領(lǐng)域占據(jù)領(lǐng)先優(yōu)勢,市場格局整體較為分散。我國擁有商湯科技、依圖科技、曠視科技、云從科技等眾多原創(chuàng)明星算法廠商,其算法模型已廣泛應(yīng)用于眾多行業(yè)領(lǐng)域。以商湯科技為例,擁有1207層的超深度神經(jīng)網(wǎng)絡(luò)算法模型、6000塊GPU集群計算卡、超過100億的圖像視頻數(shù)據(jù)積累、覆蓋18個不同行業(yè)領(lǐng)域;擁有以寒武紀為代表的GPU芯片廠商,其通用型AI芯片可運行幾乎所有算法模型,并利用IP授權(quán)模式應(yīng)用于華為麒麟智能機芯片、中科曙光服務(wù)器芯片等;此外,當前我國企業(yè)和政府公共應(yīng)用數(shù)據(jù)集建設(shè)也在加速,數(shù)據(jù)規(guī)??焖贁U張。但GPU技術(shù)及產(chǎn)業(yè)化能力相較英偉達仍存在較大差距,目前我國GPU市場仍主要被國際巨頭英偉達所壟斷,寒武紀作為初創(chuàng)公司其技術(shù)產(chǎn)品在應(yīng)用領(lǐng)域和產(chǎn)業(yè)化規(guī)模方面暫時還無法與英偉達抗衡,未來技術(shù)產(chǎn)業(yè)突破仍面臨較大挑戰(zhàn)。

      計算機視覺技術(shù)產(chǎn)業(yè)發(fā)展主要面臨兩方面挑戰(zhàn),一是技術(shù)融合創(chuàng)新、新型算法研發(fā)及成本的降低。從計算機視覺發(fā)展整體情況來看,圍繞不同應(yīng)用領(lǐng)域融合多種技術(shù)能力并達到很高的識別精度是業(yè)界需要突破的重點方向;此外,針對不同芯片與數(shù)據(jù)采集設(shè)備的視覺算法開發(fā),以及研發(fā)周期的壓縮與人工成本的降低也是廠商面臨的重要挑戰(zhàn)。二是國內(nèi)產(chǎn)業(yè)鏈中上游的布局較少,存在受制于人的風(fēng)險。目前,國內(nèi)計算機視覺領(lǐng)域初創(chuàng)公司大多集中在中下游技術(shù)提供和場景應(yīng)用層面,業(yè)務(wù)同質(zhì)化競爭比較嚴重,掌握人工智能芯片技術(shù)、打通全產(chǎn)業(yè)鏈的企業(yè)相對較少。

      3 計算機視覺技術(shù)產(chǎn)業(yè)發(fā)展趨勢分析

      前端智能化、前后端協(xié)同計算和軟硬件一體化成為明顯發(fā)展趨勢。一是應(yīng)用場景對實時響應(yīng)的高要求推動前端計算處理能力大幅度提升,前置計算讓前端設(shè)備成為數(shù)據(jù)采集和數(shù)據(jù)處理的合體,可有效提升處理速度并解決云端難以處理的問題,如智能化的安防攝像機通過集成人臉分析算法,在相機內(nèi)部即可進行大量運算、實現(xiàn)獨立的人臉識別能力,提升監(jiān)控效率。

      二是前端智能與后端智能協(xié)同可滿足特定場景對隱私性、實時性的要求。后端服務(wù)器計算適用于需要大量存儲計算資源、多維度數(shù)據(jù)關(guān)聯(lián)分析的場景,前后端協(xié)同可在前端成像提供越來越多數(shù)據(jù)信息的背景下,對海量信息進行預(yù)處理,然后再將結(jié)構(gòu)化的高質(zhì)量數(shù)據(jù)結(jié)果傳輸至后端,減少或避免傳輸丟包、壓縮信息丟失等問題,進而提升智能分析的準確性。

      三是軟硬件融合一體化方案是解決不同應(yīng)用場景復(fù)雜問題的關(guān)鍵,能夠在前端硬件設(shè)備上嵌入算法模型,可實現(xiàn)更快速、更高精度的數(shù)據(jù)處理,讓用戶更直接地應(yīng)用視覺識別技術(shù)。如格靈深瞳的威目車輛特征識別系統(tǒng)通過軟硬件一體的方式讓用戶直接應(yīng)用車輛識別技術(shù);地平線機器人、閱面科技則為智能家電、機器人等提供軟硬一體化技術(shù)方案,實現(xiàn)低功耗、本地化的環(huán)境感知和人機交互。

      數(shù)據(jù)和應(yīng)用場景將成為企業(yè)布局的關(guān)鍵點,深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)將推動計算機視覺持續(xù)優(yōu)化升級。計算機視覺公司的核心競爭力是解決現(xiàn)實世界中存在的問題,真實應(yīng)用場景的數(shù)據(jù)對算法模型訓(xùn)練十分重要,初創(chuàng)公司只有持續(xù)獲取大量的數(shù)據(jù)資源,并與商業(yè)落地方向形成快速的數(shù)據(jù)循環(huán),商業(yè)模式、數(shù)據(jù)模式才能形成協(xié)同效應(yīng),如谷歌依托搜索引擎積淀了海量的優(yōu)質(zhì)數(shù)據(jù),支撐其成為世界上最先進的人工智能企業(yè),并與Facebook等互聯(lián)網(wǎng)巨頭壟斷計算機視覺行業(yè)發(fā)展。

      卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中最重要的分支之一,廣泛應(yīng)用于檢測、分割、物體識別等領(lǐng)域。深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)給計算機視覺領(lǐng)域帶來了革命性的突破,并逐步擴大計算機視覺在現(xiàn)實世界的應(yīng)用范圍。根據(jù)Tractica的預(yù)測,到2025年全球計算機視覺收入將達到262億美元,視頻監(jiān)控、機器/車輛物體檢測/識別/避讓、醫(yī)學(xué)圖像分析、AR/VR、定位/制圖、人類情感分析、臉部識別、廣告插入圖像和視頻、房地產(chǎn)開發(fā)優(yōu)化等成為最受歡迎的業(yè)務(wù)應(yīng)用。

      工業(yè)巨頭、互聯(lián)網(wǎng)巨頭和創(chuàng)業(yè)公司成為計算機視覺的三大主導(dǎo)力量,北上廣深將成為我國計算機視覺產(chǎn)業(yè)主要集聚地。工業(yè)巨頭借助在細分領(lǐng)域的長期積累,通過并購或合作的方式開展全產(chǎn)業(yè)鏈布局,渠道能力、上下游議價能力、應(yīng)用場景數(shù)據(jù)的獲取能力相對較強,能夠快速構(gòu)建完備的生態(tài)圈,代表企業(yè)包括??低?、浙江大華、海爾集團等。互聯(lián)網(wǎng)巨頭擁有最頂尖的技術(shù)團隊和壓倒性的數(shù)據(jù)優(yōu)勢,憑借技術(shù)優(yōu)勢引領(lǐng)未來,代表企業(yè)包括谷歌、Facebook、IBM、百度、阿里云等。創(chuàng)業(yè)公司依托高端人才團隊和先進的算法技術(shù)搶占市場空間,但渠道能力、數(shù)據(jù)獲取能力相對較弱,需要引入第三方合作伙伴共同制定行業(yè)解決方案,代表企業(yè)包括商湯、曠視、依圖、云從等。

      此外,計算機視覺是高度知識密集型產(chǎn)業(yè),對人才、技術(shù)、產(chǎn)業(yè)、資本等環(huán)境要求相對較高,根據(jù)艾媒咨詢發(fā)布數(shù)據(jù),截至2017年年底,全國人工智能創(chuàng)業(yè)公司在北京、上海、深圳、廣州的分別占比為42.9%、16.7%、15.5%和7.7%,合計達到82.8%。未來我國將形成以北京為絕對核心,上海、廣州、深圳為重點中心的人工智能產(chǎn)業(yè)空間格局。

      4 結(jié)束語

      在人工智能發(fā)展浪潮下,我國計算機視覺產(chǎn)業(yè)呈現(xiàn)快速增長態(tài)勢??紤]到我國在中上游領(lǐng)域核心技術(shù)對外依存度較高,未來應(yīng)從3個方面著手提升產(chǎn)業(yè)發(fā)展水平。一是整合資源、聯(lián)動發(fā)展、合作共贏,依托商湯、曠視、依圖、云從、格靈深瞳等初創(chuàng)企業(yè),以及騰訊、百度、阿里巴巴等大型互聯(lián)網(wǎng)企業(yè),著力構(gòu)建計算機視覺產(chǎn)業(yè)協(xié)同創(chuàng)新體系,通過資源整合形成業(yè)務(wù)功能互補、聯(lián)動發(fā)展、協(xié)同創(chuàng)新的的生態(tài)格局。二是加強技術(shù)研發(fā),突破技術(shù)產(chǎn)業(yè)發(fā)展瓶頸,針對前端智能系統(tǒng)功耗、穩(wěn)定性、存儲空間、數(shù)據(jù)傳輸,后端GPU計算芯片技術(shù)差距等問題,支持我國計算機視覺方面的領(lǐng)軍企業(yè)、創(chuàng)業(yè)團隊與國內(nèi)外高校、科研院所等加強合作,強化技術(shù)融合創(chuàng)新、新型算法研發(fā)、前端智能化、前后端協(xié)同計算和軟硬件一體化發(fā)展能力,提升原創(chuàng)技術(shù)創(chuàng)新能力、突破前沿技術(shù)應(yīng)用。三是支持挖掘未來場景應(yīng)用,鼓勵企業(yè)加大對數(shù)據(jù)和應(yīng)用場景的布局開發(fā),加快建設(shè)一批產(chǎn)業(yè)公共服務(wù)平臺,組織實施一批產(chǎn)業(yè)化應(yīng)用示范項目,推動拓展產(chǎn)品形態(tài)及應(yīng)用服務(wù)。

      猜你喜歡
      計算機算法
      計算機操作系統(tǒng)
      穿裙子的“計算機”
      基于計算機自然語言處理的機器翻譯技術(shù)應(yīng)用與簡介
      科技傳播(2019年22期)2020-01-14 03:06:34
      計算機多媒體技術(shù)應(yīng)用初探
      科技傳播(2019年22期)2020-01-14 03:06:30
      基于MapReduce的改進Eclat算法
      Travellng thg World Full—time for Rree
      進位加法的兩種算法
      信息系統(tǒng)審計中計算機審計的應(yīng)用
      算法初步兩點追蹤
      基于增強隨機搜索的OECI-ELM算法
      尼玛县| 柞水县| 特克斯县| 桦南县| 八宿县| 白沙| 青岛市| 娄烦县| 阿克陶县| 文山县| 琼海市| 陈巴尔虎旗| 达州市| 澎湖县| 沐川县| 晋州市| 城步| 沂南县| 东城区| 嘉禾县| 绥阳县| 辉县市| 禄劝| 霍山县| 六安市| 漳平市| 酒泉市| 银川市| 历史| 承德县| 阿荣旗| 沛县| 太原市| 弥勒县| 南投县| 安福县| 启东市| 九龙坡区| 应用必备| 柘荣县| 康乐县|