□ 文/夏廷玥
大華股份潘石柱談如何“深度見識”
□ 文/夏廷玥
▲大華股份副總裁兼國內(nèi)營銷中心總經(jīng)理張偉
2017年3月,“人工智能”首次寫進政府工作報告??梢哉f,人工智能已達到促進經(jīng)濟發(fā)展的新高度,多只人工智能概念股在兩會期間也表現(xiàn)亮眼。而早在2016年10月中旬,烏鎮(zhèn)智庫聯(lián)合網(wǎng)易科技發(fā)布了《全球人工智能發(fā)展報告(2016)》。報告提到了人工智能將在七大領域率先應用,安防行業(yè)赫然在列。
然而縱觀人工智能60年的發(fā)展歷史,經(jīng)歷了多次“寒冬”,其中一個很重要的原因就是算法效果和實際使用的差距或神經(jīng)網(wǎng)絡無法繼續(xù)深入下去。直到深度學習取得突破,直接推動了人工智能的蓬勃發(fā)展。深度學習同樣在安防行業(yè)得到應用,尤其是視頻監(jiān)控領 域 ,如 何 做 到“ 深 度 見 識 ”成 為 安 防 廠 商 所 要 面 臨的問題。近日,本網(wǎng)記者就有關問題采訪到了大華股份先進技術(shù)研究院院長潘石柱博士。
現(xiàn) 階 段 ,我 們 之 所 以 能 夠 談 數(shù) 據(jù) 的 提 取 、談 智 能分析,這一切的基礎就是高清技術(shù)得到了快速發(fā)展。如果沒有高清,如果我們還是在D1或者是更低的分辨率之下,數(shù)據(jù)的提取和分析是沒有任何意義的,也是沒有辦法做到的。簡言之,連看都看不清,如何“看得懂”、“看得懂”又有什么意義?所以,從D1到720P、1 0 8 0 P 再 到 4 K ,從 C C D 到 C M O S ,從 紅 外 補 光 到 星 光 級技術(shù)的發(fā)展,這樣一個演進的過程,它表面上解決了目標清晰度的問題,但它真正深層次的變化是為我們后面的 深度分析做 足了鋪 墊。
當深度學習的算法融合到視頻監(jiān)控系統(tǒng)的前后端 ,才 能 真 正 地 說“ 深 度 智 能 ”。 在 這 里 ,前 端 我 們 舉例 簡 單 說 明 一下,重 點 說 一下 后 端 。
前端:在應用層面上,以2016年的G20峰會安保為 例 ,大 華 提 供 的 諸 多 監(jiān) 控 攝 像 機 ,除 了 能 夠 支 持 峰會安保需要的絆線入侵、區(qū)域入侵、穿越圍欄、徘徊檢測等諸多智能分析功能外,還支持針對視頻監(jiān)控范圍的疑點盲區(qū)、重要路線、高密場所、復雜光線等目標區(qū)域的30 0 個預置點、自動巡跡、自動巡航等空閑動作,攝像機可按照事先設置好的預置點位進行多條路線的自動巡航監(jiān)控。巡航監(jiān)控定位精準無偏差,一旦有目標觸發(fā)設定的規(guī)則,立刻聯(lián)動報警。
后端:在3月7日,大華股份聯(lián)合NVIDIA發(fā)布了一款極高計算性能的智能視頻結(jié)構(gòu)化服務器“Deep Sense睿智”系列。這款服務器有兩個需要我們注意的地方:一是Tesla P4 GPU,二是結(jié)構(gòu)化分析。
大華的“Deep Sense睿智”系列是全球智能視頻分析行業(yè)第一個使用Tesla P4 GPU的服務器產(chǎn)品,也是Tesla P4首次應用于智能視頻分析行業(yè)的推演。
在談Tesla P4之前,我們先來說一說GPU和CPU的區(qū)別。由于CPU在圖像渲染方面的能力不足,GPU被發(fā)明出來分擔這部分工作,此后就成了專門搞這方面的硬件。所以,有了上千個并行的計算核心,GPU能高效地處理讓CPU十分吃力的任務。GPU的強大性能,不只來源于增加的核心數(shù)量,還必須有更快的內(nèi)存相配合才能發(fā)揮。今天,GPU的內(nèi)存帶寬相比CPU已經(jīng)有數(shù)量級上的領先,這使得GPU在處理和讀取數(shù)據(jù)上都有巨大優(yōu)勢。
所以,Tesla P4具備了一般GPU都有的特性。除此之外,Tesla P4外形小巧,功耗極低,初始功率只有50瓦特,處理推理應用的能效比與CPU相比提高了40倍。這也促使“睿智”系列能夠同時對多達192路的高清視頻流進行實時解碼和分析。同時,對于視頻推理的工作負載,一臺配備單個Tesla P4 GPU的服務器可以取代13 臺CPU服務器,因此,從商業(yè)價值上來說,Tesla P4讓總體擁有成本(包括服務器成本和電力成本)節(jié)省了超 過8 0 0 %。
據(jù)潘石柱博士介紹,“睿智”服務器把實時視頻進 行 結(jié) 構(gòu) 化 分 析 后 ,能 將 復 雜 場 景 中 的 人 、機 動 車 、非機動車分離,全方位提取車輛特征,如車牌號碼識別、主副駕駛是否系安全帶、是否打電話、有無遮陽板 、有 無 年 檢 標 、有 無 掛 墜 、有 無 紙 巾 盒 ; 針 對 行 人 ,“睿智”服務器可以多方面分析其相關特征,包括性別、表情、年齡段、服飾特征(上下衣著顏色、眼鏡)、攜帶物特征(背包、打傘)、運動特征等。
經(jīng)過結(jié)構(gòu)化處理之后的視頻數(shù)據(jù),可以進行長期保存,用戶按照尋找目標的特征,對人、機動車、非機動車的各種特征條件進行組合篩選,快速精確檢索 目 標 ,提 高 查 詢 效 率 。
由此,我們也可以清楚看到結(jié)構(gòu)化處理所帶來的優(yōu)勢:
首先,是視頻查找速度得到極大的提升。視頻結(jié)構(gòu) 化 之 后 ,從 百 萬 級 的 目 標 庫 中 ( 對 應 成 千 上 萬 小 時 的高 清 視 頻 ) 查 找 某 張 截 圖 上 的 行 人 嫌 疑 目 標 ,數(shù) 秒 即可完成;千萬級目標的庫中查找,幾分鐘即可完成(如果 實 現(xiàn) 云 化 ,速 度 會 更 快 ) 。在 結(jié) 構(gòu) 化 基 礎 上 進 行 檢索 查 詢 ,可 以 解 決 快 速 目 標 查 找 問 題 。
其次,是存儲容量極大的降低,經(jīng)過結(jié)構(gòu)化后的視頻,存儲人的結(jié)構(gòu)化檢索信息和目標數(shù)據(jù)不到視頻數(shù)據(jù)量的2%;對于車輛,不到1%;對于行為降得更多。存儲容量極大地降低,可以解決有效視頻長期存儲的問題。
最后,視頻結(jié)構(gòu)化可以盤活視頻數(shù)據(jù),可作為大數(shù)據(jù)挖掘的基礎,視頻經(jīng)過結(jié)構(gòu)化處理后,存入相應的結(jié)構(gòu)化數(shù)據(jù)倉庫,對各類的數(shù)據(jù)倉庫可以進行深度的數(shù)據(jù)挖掘,充分發(fā)揮大數(shù)據(jù)作用,提升視頻數(shù)據(jù)的應用價值,提高視頻數(shù)據(jù)的分析和預測功能。
總之,無論是芯片還是視頻結(jié)構(gòu)化,都是為了給視頻數(shù)據(jù)的智能化提供強有力的支持,從而真正實現(xiàn)大數(shù)據(jù)的價值,使主動式防控系統(tǒng)成為可能。