陸佳艷
(天津職業(yè)技術(shù)師范大學,天津 300222)
目前圖像抓取遇到短暫瓶頸,為理清大數(shù)據(jù)在圖像技術(shù)概念下實踐性差異的邏輯意義,以人臉識別為研究對象的智能監(jiān)控等關(guān)鍵性技術(shù)應(yīng)運而生,基于實現(xiàn)系統(tǒng)中的借鑒意義,類似醫(yī)學圖像處理的環(huán)節(jié)將被同樣納入技術(shù)檢測范圍。
數(shù)字語境中所涉及的代表性算法語言,以代碼增強分割為主線,系統(tǒng)對接程序路徑,將圖形和影像歸于處理模擬半導體容量存儲技術(shù)和幀顯切口,為識別技術(shù)發(fā)展提供基石。深度識別領(lǐng)域?qū)τ嬎銠C視覺認定、機器語言學習及開源技術(shù),尤其是AI方向的強數(shù)據(jù)語言處理功能,提供了復雜的運算支持,使其在關(guān)鍵應(yīng)用場景下高分辨率和實時運算效率的深度學習模型得以實現(xiàn)。
作為傳統(tǒng)視覺研究一項難題,圖像分割已成為圖像理解領(lǐng)域關(guān)注的焦點,視覺基礎(chǔ)成為圖像理解的內(nèi)核。對于灰度圖像區(qū)域,其內(nèi)部呈像掃描一般具有相似不連續(xù)性。分割技術(shù)因問題重要及困難程度,采取不同門徑的質(zhì)檢形式,把傳統(tǒng)數(shù)據(jù)學習利用的環(huán)境拓撲計算等運籌方法進行演繹,隨算力增加及語境發(fā)展,效果上與以往已不可同日而語。
1.1.1 基于閾值
閾值基于圖像一個或多個灰度特征計算,將多個像素數(shù)值進行比較,最終確定關(guān)鍵準則,以求解函數(shù)最佳閾值。目標和背景占據(jù)不同范圍的圖像只需要選取單一閾值分割;如果圖像有多個目標需要提取,就需要選取多個閾值隔開?;陂撝档姆椒ň哂幸韵绿攸c:計算效率簡單高效;空間降噪素點偏低,魯棒性較弱。閾值選擇最關(guān)鍵就在于將智能遺傳算法應(yīng)用到篩選分割圖像之上,基于圖像識別和技術(shù)處理加以指正。
1.1.2 基于區(qū)域
直接尋找分割區(qū)域,基于提取形式合并形成所需全局切割區(qū)域。如代表生長像素的鄰域?qū)⑻砑臃蠙C器學習的手寫方法應(yīng)用到關(guān)鍵合理的準則之中。算法經(jīng)常需要解決區(qū)域分合問題,而區(qū)域逆過程從整幅圖像出發(fā),不斷實現(xiàn)提取。例如,四叉樹分解法中的邊界圖像分割效果在實際應(yīng)用中通常是基于使用物體定義的場景等先驗知識不足的情況使用。分水嶺算法卻可根據(jù)構(gòu)成考慮分割現(xiàn)實想象,基于拓撲學的數(shù)形方法,把圖像測地學中像素的灰度值表示為高度,局部極值及影響稱為盆區(qū),而邊界部分則形成分水嶺。通過模擬穿孔、模型加深擴展,在集水處構(gòu)筑形成。微弱邊緣良好響應(yīng)圖像噪聲、物體微表變化產(chǎn)生分割現(xiàn)象,同時保證圖像特征封閉連續(xù)。
1.1.3 基于邊界
邊界檢測圖像分割試圖通過不同區(qū)域解決問題。通過圖片空間變換到頻域,即邊緣對應(yīng)高頻的部分,將檢測并行微分像素值的不連續(xù)性采用階導法提出基于曲面擬合、擴散反應(yīng)等概念、證明了大量碎片難以形成高細節(jié)度的、非完整意義上的圖像分割過程就是邊緣信息獲取后續(xù)處理的結(jié)合任務(wù)研究。初始自適層次以及重要邊界被假性剔除。
1.1.4 基于特定工具
類似于微波分析變換、遺傳圖像分割及輪廓模型等特定方法,早在谷歌計算機視覺模擬識別大會上就公布其運用的相關(guān)技術(shù)產(chǎn)品?;陂_源跨平臺技術(shù)框架,構(gòu)建多模應(yīng)用的機器處理模態(tài),憑借幀圖識別點位,如APP與PC中的感知數(shù)據(jù)。
AI智能核心課題即圖像識別,從機器學習研究角度看智能方向,但識別問題在于定位中被叫作圖像檢測或是物體分類用途的情況,如無人駕駛攝像輔助,識別場景包括車道、標識及障礙物等,可讓出行方便輕松。
1.2.1 識別難點
圖像識別的難點就在于其多位視點,物體拍照因視點不同,外觀也會不一,包括尺度中近大遠小般的識別;光影變化一向是視覺圖像特別注意的又一個問題,不同光影下判若兩人;背景復雜的難點在于尋找的過程;遮擋的難點在于圖片的復雜性;而變形如柔體運動變形,圖像表現(xiàn)各異。
1.2.2 發(fā)展路線
從基本問題著手,利用工具檢測和識別規(guī)范形狀、幾何組合。根據(jù)外觀且不考慮識別物體結(jié)構(gòu),如人臉檢測。除了人臉識別研究,手寫識別的成果不容忽視。此外汽車檢測、指紋識別、文字光學字符識別(Optical Character Recognition,OCR)等研究工作已發(fā)展到產(chǎn)品化階段,與此同時,相關(guān)學者用新思路做圖設(shè)計學習框架,希望圖像識別借鑒文本分析,采用“詞袋”方法,在自然語言處理中對文本分類。
超大集成電路伴隨計算機技術(shù)得以迅速發(fā)展。圖像處理技術(shù)在噴氣推進實驗中首次被引入,最初是對空間照片的處理,如校正、去噪等。其中,圖片深度處理技術(shù)為后續(xù)登月計劃打下堅實基礎(chǔ)。進入20世紀中期,計算機視覺給數(shù)字圖像技術(shù)提供了發(fā)展沃土,人類著手進行數(shù)據(jù)處理、提煉圖像信息,并進一步運用分析。自此,視覺計算理論走向機器視覺領(lǐng)域,大批量處理圖像數(shù)據(jù)衍生出多種讀取方式。20世紀90年代末期,圖像處理技術(shù)迎來發(fā)展高潮,如小波理論的完善與進步。2020年,諸多應(yīng)用科學技術(shù)得到了前所未有的重視,圖像處理也拓展了其內(nèi)在業(yè)務(wù)[1]。
傅里葉變換、離散余弦變換等圖像變換處理方式,可逐步消除因壓縮過載圖像而帶來的運算遲滯;小波變換在圖像細節(jié)處理中被大量應(yīng)用。編碼壓縮因占用大量空間而增加讀寫時間的數(shù)字圖像,能有效減少處理時間;此外,目前較為成熟的處理方法是非失真或失真壓縮可有效還原圖像信息;圖像增強一般以提高圖像質(zhì)量凸顯關(guān)注因素。新型技術(shù)在圖像處理中除了上述的幾種模式外,其處理特點同樣值得深究,如圖像處理的重現(xiàn)性好、分辨率高、使用范圍廣、可靈活處理、壓縮空間大等特點。
2.3.1 個體應(yīng)用代表:汽車與字符
(1)在現(xiàn)代汽車電子圖像技術(shù)應(yīng)用發(fā)展背景下,為改善汽車綜合性能,環(huán)保、舒適等未來發(fā)展的自動駕駛構(gòu)想成為智能運輸系統(tǒng)發(fā)展研究的技術(shù)引擎。例如,防抱死微處理車載傳感器和依據(jù)熱源圖像表盤算法的變速點火控制裝置的不斷完善與進步,采用現(xiàn)代圖像技術(shù)可以解決工業(yè)發(fā)展所面臨的諸多技術(shù)難題。汽車工業(yè)以現(xiàn)代電子技術(shù)為動力,把電子化進程革命看作是衡量現(xiàn)代影像技術(shù)水平的重要標志[2]。
(2)互聯(lián)網(wǎng)信息爆炸,圖情世界不斷充盈。為保障信息秩序,監(jiān)控現(xiàn)存內(nèi)容的增長態(tài)勢,讓支持多格式圖像讀取的輿情識別軟件開發(fā)工具包(Software Development Kit,SDK)能夠定位識別文字等信息。對字幕版面模式在圖像處理類型較多的文本信息,如印刷手寫等信息處理上覆蓋全部;在處理圖像信息過程中,將識別對象予以編號,以阿拉伯數(shù)字居多;跟蹤匹配或表情分析在光照補償和面部特征提取過程中的身份背調(diào)。
2.3.2 生物醫(yī)學應(yīng)用
生物醫(yī)學領(lǐng)域圖像小到微細胞邊緣,大到骨裂手術(shù)應(yīng)用,在口腔疾病治療中越發(fā)凸顯其實用價值。例如,齲病在進行早期預(yù)療識別時,圖像檢測系統(tǒng)可針對其一定程度的危害性,有效做出預(yù)判。如新冠疫情期間,現(xiàn)代細胞圖像識別技術(shù)主要圍繞疾病治療的課題,有效避免出現(xiàn)臨床醫(yī)學在診療時難以實現(xiàn)準確病癥判斷(尤其是疑難雜癥看診中)的問題。為了解患者恢復情況,觀察并分析顯微設(shè)備對細胞識別區(qū)域內(nèi)的典型性圖像,及時確定發(fā)病原因和主要病灶位置[3]。此外,數(shù)字圖像醫(yī)學輔助應(yīng)用在常見的超聲影像、X射線技術(shù)和遺產(chǎn)序列分析等診療技術(shù)也同樣適用。由此得出,圖像處理應(yīng)用對醫(yī)療技術(shù)水平的提升具有促進作用。
利用深度學習,通過大量標注在各種任務(wù)中的現(xiàn)有技術(shù),在小數(shù)據(jù)情景中通常作為如家庭機器人等虛擬掛件,新物體很自然地完成操作,賦予擬人泛化能力,但大規(guī)模數(shù)據(jù)的關(guān)鍵在于出錯成本廉價。因此,微時代可創(chuàng)造數(shù)以億計的小數(shù)據(jù)圖標,通過建模呈現(xiàn)出極高的收益價值[4]。
(1)圖像場景理解。從場景感知到對現(xiàn)實世界的認知除了與訓練數(shù)據(jù)相關(guān)的泛化能力外,人類還可推斷物聯(lián)關(guān)系的場景布局,獲得交互應(yīng)用以外的信息。(2)自動化網(wǎng)絡(luò)制圖。處理參數(shù)和設(shè)計選擇圖像識別領(lǐng)域的重心,轉(zhuǎn)向自動更新神經(jīng)網(wǎng)絡(luò)架構(gòu)的檢索研究,但仍處于早期,且僅適于圖像分類的搜索APP,市場依舊非常狹窄。(3)智能識別映射處理。分辯關(guān)鍵目標物體,如用于安防的計算機數(shù)據(jù)過濾系統(tǒng)。排除干擾信息并自動抽取來源圖像,涵蓋智能學習效果。
基于計算機圖像識別技術(shù)的研究對于未來視覺傳媒技術(shù)產(chǎn)業(yè)有著更大的發(fā)展?jié)摿?,但也正是因為這樣,圖像識別與處理技術(shù)才有其私密防護性意義,如何更好地在公基建設(shè)領(lǐng)域發(fā)揮其效用,尚需業(yè)界用實踐來回答。