王倩 樂(lè)山職業(yè)技術(shù)學(xué)院 王大衛(wèi) 四川民族學(xué)院
隨著國(guó)家工業(yè)化程度的提升,城市建設(shè)、運(yùn)營(yíng)在國(guó)家發(fā)展過(guò)程中發(fā)揮越來(lái)越重要的作用[1]。人民對(duì)美好生活的需求對(duì)城市建設(shè)、治理智能化水平提出了更高的要求。2021年3月,國(guó)家十四五規(guī)劃對(duì)智慧城市建設(shè)提出了明確要求,也是未來(lái)一段時(shí)間智慧城市建設(shè)的重要指導(dǎo)方向。智慧城市基于物聯(lián)網(wǎng)、云計(jì)算等新一代信息技術(shù)等工具和方法的應(yīng)用,營(yíng)造了有利于創(chuàng)新涌現(xiàn)的生態(tài)。更為重要的是,智慧城市利用信息和通信技術(shù)讓城市生活更加智能,通過(guò)高效利用資源,節(jié)約成本、能源,提升生活質(zhì)量,減少對(duì)環(huán)境的負(fù)面影響,推動(dòng)了低碳經(jīng)濟(jì)的發(fā)展,助力國(guó)家“碳達(dá)峰、碳中和”行動(dòng)。近年來(lái),智慧城市建設(shè)引起了越來(lái)越多城市管理者的重視,很多城市也開(kāi)展了建設(shè)實(shí)踐。
智慧安防、智慧治理是智慧城市的重要應(yīng)用場(chǎng)景,支撐智慧城市高效運(yùn)行,有助于提升城市安全和社會(huì)治理水平。視頻監(jiān)控是實(shí)現(xiàn)智慧安防和智慧治理的重要手段之一。隨著城市規(guī)模的增加,智慧城市建設(shè)、運(yùn)營(yíng)過(guò)程中產(chǎn)生的視頻容量越來(lái)越大,已經(jīng)突破PB級(jí)。如何更高效的存儲(chǔ),并利用海量視頻數(shù)據(jù)實(shí)現(xiàn)高效、快速搜索、識(shí)別,提升城市治理反應(yīng)能力,是智慧城市建設(shè)后期必須面對(duì)的問(wèn)題。作為視頻處理技術(shù)之一,視頻結(jié)構(gòu)化技術(shù)既能提取海量視頻數(shù)據(jù)中的重要、關(guān)鍵信息,降低存儲(chǔ)空間,還有助于提升視頻應(yīng)用實(shí)時(shí)性。為了研究探討視頻結(jié)構(gòu)化技術(shù)的應(yīng)用,本文從視頻結(jié)構(gòu)化關(guān)鍵技術(shù)和應(yīng)用場(chǎng)景出發(fā),分析視頻結(jié)構(gòu)化技術(shù)在智慧城市中的應(yīng)用前景。
視頻結(jié)構(gòu)化關(guān)鍵技術(shù)主要包括特征建模、圖像分割、目標(biāo)識(shí)別等。
特征建模是對(duì)視頻圖像中的淺層、深層、場(chǎng)景屬性特征進(jìn)行建模,為后續(xù)圖像分割、目標(biāo)識(shí)別奠定基礎(chǔ)。淺層特征主要是指視頻圖像中的顏色、紋理信息,利用顏色分量或者幾何算子可以提取、建模。深層特征是指視頻圖像中各種人、車輛、建筑、動(dòng)物等目標(biāo)屬性、目標(biāo)運(yùn)動(dòng)軌跡,此類特征可基于深度學(xué)習(xí)方法進(jìn)行提取建模。場(chǎng)景屬性是指視頻圖像中現(xiàn)場(chǎng)場(chǎng)景屬性,例如現(xiàn)場(chǎng)是屋內(nèi)、屋外,還是河邊、冰場(chǎng),人員情緒,屬于憤怒、還是高興等。
在特征建模的基礎(chǔ)上,將不同特征的區(qū)域進(jìn)行分割,有助于后續(xù)目標(biāo)識(shí)別。圖像分割是將具有相同特征額區(qū)域作為一個(gè)子區(qū)域,與具有不同特征的區(qū)域區(qū)分開(kāi)來(lái),不同區(qū)域?qū)?yīng)不同的目標(biāo)及屬性。
目標(biāo)識(shí)別是在圖像分割的基礎(chǔ)上,識(shí)別每個(gè)分割區(qū)域內(nèi)的目標(biāo)屬性。例如利用人臉特征識(shí)別分割區(qū)域內(nèi)的人臉目標(biāo)?;谲囕v的幾何特征信息識(shí)別分割區(qū)域內(nèi)的車輛,標(biāo)定為車輛。在車輛識(shí)別基礎(chǔ)上,還可以利用顏色、車輛幾何特征等信息,利用深度學(xué)習(xí)方法識(shí)別車輛顏色、車型、車的長(zhǎng)寬高、車牌號(hào)等更多信息?;谏疃葘W(xué)習(xí),還可以識(shí)別車輛所處環(huán)境屬性,例如車輛屬于前行還是倒車,識(shí)別人的情緒。
隨著神經(jīng)網(wǎng)絡(luò)和計(jì)算機(jī)計(jì)算能力的提升,深度學(xué)習(xí)技術(shù)是實(shí)現(xiàn)特征建模、圖像分割、目標(biāo)識(shí)別的關(guān)鍵技術(shù)。常用的深度學(xué)習(xí)方法有卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、對(duì)抗神經(jīng)網(wǎng)絡(luò)。目前神經(jīng)網(wǎng)絡(luò)的層數(shù)越來(lái)越多,對(duì)計(jì)算能力的要求也越來(lái)越高,效果也是越來(lái)越好。神經(jīng)網(wǎng)絡(luò)分為輸入層、隱藏層和輸出層。輸入的特征向量通過(guò)隱含層變換達(dá)到輸出層,在輸出層得到學(xué)習(xí)的結(jié)果。在深度學(xué)習(xí)訓(xùn)練階段,參數(shù)調(diào)節(jié)是最難的,涉及神經(jīng)網(wǎng)絡(luò)的層數(shù)、權(quán)重調(diào)節(jié)等。目前,人工智能各大廠商也針對(duì)性的開(kāi)發(fā)了一些自動(dòng)調(diào)參的輔助工具,減少調(diào)參的工作量。但是,從實(shí)用化效果看,還存在一定差距。參數(shù)調(diào)節(jié)主要還是基于經(jīng)驗(yàn),從中找到合適的參數(shù)。
視頻結(jié)構(gòu)化的應(yīng)用場(chǎng)景非常廣泛,在智慧城市領(lǐng)域主要由視頻存儲(chǔ)、以圖搜圖、軌跡跟蹤等。
視頻結(jié)構(gòu)化處理以后,非關(guān)鍵信息就無(wú)須存儲(chǔ),只存儲(chǔ)核心關(guān)鍵目標(biāo)信息即可,大大降低視頻存儲(chǔ)所需要的空間。當(dāng)智慧城市中攝像頭太多,視頻數(shù)據(jù)達(dá)到海量時(shí),結(jié)構(gòu)化處理以后的數(shù)據(jù)節(jié)省的存儲(chǔ)容量非??捎^,有助于減少存儲(chǔ)設(shè)備的開(kāi)支,也可以增加視頻數(shù)據(jù)的存儲(chǔ)時(shí)間。
以圖搜圖在城市治理中發(fā)揮了很大作用,特別是案件偵破過(guò)程。利用嫌疑人照片,可以在海量監(jiān)控視頻中查清嫌疑人的身份信息、活動(dòng)區(qū)域。車輛丟失案件,交警可以將丟失車輛的照片作為輸入,從城市海量監(jiān)控視頻以較快的速度查找到的丟失車輛行駛路線等,以最快速度鎖定嫌疑人。在以上應(yīng)用場(chǎng)景中,視頻結(jié)構(gòu)化相當(dāng)遠(yuǎn)提前對(duì)視頻數(shù)據(jù)進(jìn)行了預(yù)處理,對(duì)視頻中的目標(biāo)進(jìn)行了初步識(shí)別。在實(shí)際應(yīng)用中,可以提升應(yīng)用的時(shí)效性,提升應(yīng)用效果。
本文針對(duì)智慧城市建設(shè)中的視頻結(jié)構(gòu)化技術(shù)進(jìn)行了分析研究,分析了視頻結(jié)構(gòu)化關(guān)鍵技術(shù),研究了視頻結(jié)構(gòu)化在智慧城市領(lǐng)域的應(yīng)用場(chǎng)景。未來(lái),視頻結(jié)構(gòu)化還需要解決目標(biāo)識(shí)別準(zhǔn)確性、處理實(shí)時(shí)性問(wèn)題,解決實(shí)時(shí)性與計(jì)算成本之間的矛盾。