張棲瑩
摘 要:當前,我國信息化技術(shù)實現(xiàn)了迅猛發(fā)展,在各行各業(yè)都逐步滲透,并廣泛應(yīng)用,呈現(xiàn)出十分良好的應(yīng)用效果。在空間信息領(lǐng)域有效引入文字識別技術(shù),結(jié)合具體情況,有效利用車載移動測量系統(tǒng)可以切實有效的采集更高清的街景影像,并通過相應(yīng)的算法,在最大程度上有效針對特定位置展開相對應(yīng)的定位,并進行相對應(yīng)的文字識別,之后,通過相對應(yīng)的數(shù)據(jù)庫檢索相關(guān)內(nèi)容,并匹配與之相適應(yīng)的相關(guān)地理信息,然后在街景地圖上標注文字,通過這樣的方法就可以自動化的標注街景影像。
關(guān)鍵詞:街景地圖;文字識別;地理信息數(shù)據(jù)庫;地圖自動標注
1 概論
當前,信息化技術(shù),計算機技術(shù)實現(xiàn)了突飛猛進的發(fā)展,由此推進各個行業(yè)的信息化程度也逐步提升,當前,計算機文字識別技術(shù)有了更良好的發(fā)展和完善,促使相關(guān)行業(yè)的工作效率和工作質(zhì)量有了更大程度的提升。在具體的應(yīng)用過程中,街景地圖能夠結(jié)合具體需要,為移動道路智能系統(tǒng)提供相對應(yīng)的基礎(chǔ)數(shù)據(jù),也可以供給相對應(yīng)的街道以及其周圍環(huán)境全景圖像,通過這樣的方法,用戶能夠有切身感受,如身臨其境,體驗到瀏覽地圖的真實體驗,與此同時,也能夠從巨量的信息數(shù)據(jù)庫中選擇最有用的信息。
2 街景影像采集及預(yù)處理
2.1 采集街景影像
通常情況下,在具體的應(yīng)用過程中,車載移動智能系統(tǒng)提供相對應(yīng)的街景影像,這個系統(tǒng)結(jié)合具體的需要有效運用GPS技術(shù)集合激光掃描儀、IMU、相機和里程計等相關(guān)設(shè)備的優(yōu)勢和特征,把相關(guān)內(nèi)容有效融合在GPS時間系統(tǒng),通過這樣的方法,保證系統(tǒng)內(nèi)部的數(shù)據(jù)可以在根本上保持一致。里程計、GPS和IMU等相關(guān)設(shè)備獲取的信息,對其進行優(yōu)化完善,可以用其導(dǎo)航,這樣一來就可以更精準有效的獲取系統(tǒng)中的位置數(shù)據(jù)。
2.2 三維透視變形矯正
在具體的應(yīng)用環(huán)節(jié),有效利用車載移動測量系統(tǒng),能夠很明顯的看出,所有的街景影像都具備三維透視變形。由于街景圖片基本上全部都是來自于車載移動測量系統(tǒng),在這樣的情況下,如果車輛不同,所采集的圖片就會呈現(xiàn)出很大的差別,如果在相同的情況下,有一定意義上的變形問題,也情有可原。
結(jié)合具體需要而拼接和矯正原始街景影像,可以為下個環(huán)節(jié)提供相對來說更清晰,沒有發(fā)生變形的街景影像。與此同時,對其進行拼接,圖像的文字識別效率有很大程度上的改善,工作效率有極大的提升,值得指出的是,這種拼接方法只能用在無分叉路的街道。
3 文字區(qū)域定位
3.1 用顏色聚類法初步提取相關(guān)的文字區(qū)域
這種方法所涉及的內(nèi)容主要是指在彩色圖像像素要根據(jù)顏色的相似度分成多種多樣的類別,在這樣的情況下所獲得的圖片在顏色方面有著很大差別。因為大多數(shù)的時候,自然場景下的文本,有著相對來說更相似的顏色和灰度,但是和背景進行對比,其對比度比較顯著,所以在這樣的情況下,要結(jié)合實際情況應(yīng)用顏色聚類方法實現(xiàn)文本定位。有針對性的利用同區(qū)域文字顏色類似的現(xiàn)象,分割相對應(yīng)的色彩空間,使相關(guān)圖像劃分成不同類型的圖層,在其中選取出相對應(yīng)的連通區(qū)域,在這樣的情況下,深入細致的分析和探究區(qū)域內(nèi)顏色分布和區(qū)域外接框幾何特征,通過這樣的方法就可以有效定位文字。
3.2 文字分布法進行文字區(qū)域定位
對于顏色聚類法獲取的相關(guān)圖片,實施相對應(yīng)的初步篩選,把像素比較小的文字剔除出去,有效采取這樣的措施,可以使搜索的范圍得到顯著的縮小,確保識別的效率,能夠使識別效率得到更有效的提升。針對每一個圖層而言,要對其有針對性的展開圖像預(yù)處理工作,其預(yù)處理工作涉及彩色圖像灰度化、圖像去噪等一系列相關(guān)方面的內(nèi)容。
預(yù)處理完相關(guān)圖像以后,要結(jié)合具體情況,搜索相關(guān)的連通域,之后再有針對性的探尋連通域的外接矩形,并針對具體情況判斷它的長寬比、面積大小等,并經(jīng)過不斷的篩選,去除與要求不相符合的圖形,然后有針對性的結(jié)合文字的空間分布的相關(guān)性,來實施進一步的篩選。
4 文字識別與自動標注
4.1 結(jié)合詞庫開展文字識別
為進一步大幅度提高具體的識別效率和準確率,首先要從街景地圖中的候選區(qū)的第1個矩形出發(fā),并且按照順序依次順延,在某一個矩形中識別出某一個文字,在這樣的情況下,要針對該矩形進行詳細的標記,除此之外,也要把同一張圖片上的圖層進行有針對性的標注,在這樣的情況下,可以更有效的顯示該區(qū)域已經(jīng)被充分識別,沒有必要進行重復(fù)識別。
4.2 判斷識別效果并實施人工協(xié)助軟件識別
由于街景圖片有著十分顯著的復(fù)雜性,不確定性特點,所以在具體的檢測過程中,它所呈現(xiàn)出的識別結(jié)果和正確率往往不能達到100%,所以在這樣的情況下,要想確保該技術(shù)能夠充分應(yīng)用于實踐,要針對識別效果進行切實有效的判斷,并結(jié)合具體的內(nèi)容對其實施人工糾錯。同時,要有針對性的結(jié)合街景影像數(shù)量龐大的特征。
5 結(jié)語
綜上所述,通過上文的分析和論述可以很明顯的看出,對街景地圖中基于文字識別的自動標注進行簡要研究和論述,是十分重要而且必要的。在空間信息領(lǐng)域結(jié)合具體情況,切實有效的使用這種文字識別技術(shù),可以在更大程度上及時收集到更高清更精準的街景圖像,與此同時,利用與之相對應(yīng)的科學算法,可以針對相關(guān)文字區(qū)域進行自動化的識別和定位,另外也可以通過相關(guān)數(shù)據(jù)庫中的檢索信息進一步標注在街景地圖上。
參考文獻:
[1]A.Mishra and K.Alahari.Top-Down and Bottom-Up Cues for Scene Text Recognition[J].In Proc.CVPR,2012.8(5):58-60.
[2]柏宏飛.場景圖像文字提取方法研究與應(yīng)用[D].復(fù)旦大學,2015.8:96-97.