• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于C-F模型的中文地址行政區(qū)劃辨識方法

    2018-07-19 12:54:42李曉林周華兵
    計算機(jī)工程與設(shè)計 2018年7期
    關(guān)鍵詞:行政區(qū)劃字符串區(qū)劃

    李曉林,張 懿+,周華兵,李 霖

    (1.武漢工程大學(xué) 計算機(jī)科學(xué)與工程學(xué)院,湖北 武漢 430205;2.武漢工程大學(xué) 智能機(jī)器人湖北省重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430205;3.武漢大學(xué) 資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079)

    0 引 言

    隨著城市現(xiàn)代化建設(shè)的發(fā)展,城市命名方式不斷變化,故急需更新和完善現(xiàn)有地理位置信息庫。而伴隨著人們出行、交流等對互聯(lián)網(wǎng)的不斷依賴,使互聯(lián)網(wǎng)中積累了大量蘊(yùn)含地理位置信息的中文地址,故可通過提取其中的有用信息來獲取人們普遍使用的地理位置信息表示方式。但由于人們網(wǎng)絡(luò)交流的隨意性,導(dǎo)致互聯(lián)網(wǎng)中大部分中文地址表達(dá)方式紛繁復(fù)雜、形式各異[1]。且中國地域廣闊,地理位置信息的雜亂與不規(guī)范,同時具有極強(qiáng)的區(qū)域特色,往往會增加辨識的難度或引發(fā)辨識的歧義。

    中文詞語之間無明顯的分割符號,相同詞在不同語境中存在不同含義[2]。對于一條地址字符串,如果省略區(qū)劃特征字,其中可能包含多個行政區(qū)劃信息,如“江蘇鼓樓廣場”,其中“江蘇”匹配行政區(qū)劃“江蘇省”,“鼓樓”匹配“江蘇省南京市鼓樓區(qū)”和“江蘇省徐州市鼓樓區(qū)”;又如“湖北省洪山”,其中“洪山”匹配“湖北省武漢市洪山區(qū)”和“湖北省隨州市洪山鎮(zhèn)”。類似行政區(qū)劃匹配結(jié)果的多樣性與歧義性對地址信息的準(zhǔn)確辨識均產(chǎn)生影響。

    為了更好地構(gòu)建地理位置信息庫,就需首先解決地理文本信息中的中文地址行政區(qū)劃信息提取問題。

    1 相關(guān)工作

    針對中文地址識別國內(nèi)已有大量研究,特別是對行政區(qū)劃特征完整且無歧義的中文地址的識別已達(dá)到較好的效果。目前主要采用的方法可分為3個方面:基于特征詞的地址分詞算法、基于機(jī)器學(xué)習(xí)模型的地址識別以及基于自然語言理解的地址要素識別。

    文獻(xiàn)[3]采用特征詞匹配的思想,提出了一種前后綴與特征詞相結(jié)合的地名地址識別提取方法。首先利用HMM訓(xùn)練進(jìn)行分詞,接著通過地名地址前后綴詞庫進(jìn)行候選地名切分與預(yù)提取,最后根據(jù)特征詞進(jìn)行匹配過濾,實(shí)現(xiàn)對地名地址的準(zhǔn)確提取[3]。該算法具有較高的運(yùn)行效率,但分詞結(jié)果的正確率十分依賴于地址信息中是否存在特征字,當(dāng)特征字缺失時,會嚴(yán)重影響分詞的準(zhǔn)確率。目前較為熟知的機(jī)器學(xué)習(xí)模型主要有隱馬爾科夫模型(HMM)、最大熵模型(MEMM)和條件隨機(jī)場(CRF)模型等,其中CRF模型具有特征選擇靈活和擬合程度較好的優(yōu)點(diǎn)[4]。文獻(xiàn)[5]利用條件隨機(jī)場模型,根據(jù)中文地址行政區(qū)劃的表達(dá)特點(diǎn),結(jié)合判別式概率模型和四詞位標(biāo)注法,首先對觀測序列進(jìn)行標(biāo)注以對目標(biāo)序列建模,通過構(gòu)建語料訓(xùn)練集和特征模板,得到行政區(qū)劃的表達(dá)模型[5]。雖然該方法的識別準(zhǔn)確率能夠到達(dá)近90%,但需要對語料進(jìn)行人工標(biāo)注,工作量太大,同時模型訓(xùn)練的效果過于依賴所選取語料的規(guī)范性。基于機(jī)器學(xué)習(xí)的方法可以通過對中文語義進(jìn)行標(biāo)注,有效獲取語句結(jié)構(gòu)中的語義信息,但存在設(shè)計復(fù)雜、條件要求過強(qiáng)等缺陷[6]。文獻(xiàn)[7]和文獻(xiàn)[8]在自然語言理解的基礎(chǔ)上對中文地址進(jìn)行識別。文獻(xiàn)[7]通過建立空間關(guān)系地址模型和地址庫邏輯模型以解決中文地址抽象問題和地址信息空間知識表達(dá)問題,依據(jù)中文分詞和語義推理原理,在結(jié)合自然語言理解方法和地址匹配方法的基礎(chǔ)上,建立基于自然語言理解的中文地址識別算法;文獻(xiàn)[8]從人類理解地址的角度出發(fā),通過互聯(lián)網(wǎng)中蘊(yùn)含的地名信息建立一個地址知識庫,從而對地址進(jìn)行解析、更新等操作。雖然文獻(xiàn)[7]和文獻(xiàn)[8]的實(shí)驗(yàn)結(jié)果準(zhǔn)確率較高,但文獻(xiàn)[7]僅對河南省濮陽市人口庫1000條居民地址數(shù)據(jù)進(jìn)行測試,測試數(shù)據(jù)集太小且區(qū)域性太強(qiáng),缺乏足夠的說服力,文獻(xiàn)[8]主要針對電力系統(tǒng)業(yè)務(wù)部門中的地址數(shù)據(jù)進(jìn)行識別,同樣缺乏通用性。

    上述方法均可以解決行政區(qū)劃完整且無歧義的中文地址識別問題,但針對網(wǎng)絡(luò)中出現(xiàn)的雜亂無章且行政區(qū)劃存在模糊、缺失的地址的識別則存在如下問題:①建立了標(biāo)準(zhǔn)地址庫以匹配標(biāo)準(zhǔn)地址中的行政區(qū)劃,但對于無特征信息標(biāo)簽,且會產(chǎn)生歧義的非標(biāo)準(zhǔn)化地址,將產(chǎn)生錯誤的匹配結(jié)果。如“南京江寧芙閣路蘭州拉面館”,其中“蘭州拉面館”會錯誤匹配為“蘭州市”;②僅依據(jù)地名詞典進(jìn)行特征字直接匹配的方法,大多沒有考慮地址的語義信息,導(dǎo)致查找結(jié)果多樣,查找的準(zhǔn)確性較低,無法較準(zhǔn)確的獲取地址中包涵的行政區(qū)劃;③地址標(biāo)準(zhǔn)化工作較為繁重,或字符串匹配次數(shù)較多,或算法迭代次數(shù)多,導(dǎo)致程序計算量太大,系統(tǒng)運(yùn)行速度慢;④僅依靠行政區(qū)劃完善的地址數(shù)據(jù)作為訓(xùn)練樣本,雖對類似結(jié)構(gòu)的地址文本具有較好的識別率,但對行政區(qū)劃模糊或缺失的地址信息的識別效果較差,識別方法具有一定的局限性。

    為解決上述不確定性問題,本文事先建立一個有限的、輕量級的1-3級標(biāo)準(zhǔn)基址庫[9]。在此基礎(chǔ)上提出一種基于可信度模型的行政區(qū)劃可信度計算方法,利用可信度方法的概念與模型對地址行政區(qū)劃的可信度進(jìn)行推理計算,從而得到更準(zhǔn)確的中文地址行政區(qū)劃。

    2 可信度計算方法

    可信度方法是一種基本的不確定性推理方法,又稱C-F模型,具體含義請參考文獻(xiàn)[10]。結(jié)合此模型,將行政區(qū)劃作為證據(jù),其對應(yīng)匹配的行政區(qū)劃結(jié)果作為結(jié)論,并對多個匹配結(jié)論的可信度進(jìn)行不確定性推理,選擇可信度最高的區(qū)劃結(jié)論作為地址的行政區(qū)劃信息。

    2.1 名詞解釋

    (1)初始信度(initial credibility,IR)表示地址字符串對應(yīng)行政區(qū)劃結(jié)論集中的各區(qū)劃結(jié)論作為地址字符串準(zhǔn)確定位信息的初始信任程度。

    (2)傳遞因子(transfer factor,TF)表示地址字符串中各行政區(qū)劃匹配結(jié)論間信度相互傳遞的系數(shù),即0

    (3)傳遞信度(transfer credibility,TR)表示地址字符串中各行政區(qū)劃結(jié)論所包含地理信息的關(guān)系程度??杀硎緸?/p>

    傳遞信度=初始信度×傳遞因子

    (4)移動窗口最大匹配算法(maximum moving window match,MMWM)通過動態(tài)調(diào)整匹配窗口的大小,截取地址字符串的子串并與標(biāo)準(zhǔn)行政區(qū)劃字典進(jìn)行匹配,從而得到其中包含的行政區(qū)劃結(jié)論集。算法詳細(xì)步驟請參考文獻(xiàn)[11]。

    2.2 區(qū)劃可信度計算方法

    將地址字符串包含的行政區(qū)劃作為不確定性推理的證據(jù),區(qū)劃匹配的地址結(jié)果作為不確定性推理的結(jié)論;辨識方法總體流程如圖1所示。

    圖1 中文地址行政區(qū)劃信息提取流程

    具體計算方法與步驟如下:

    (1)利用行政區(qū)劃字典和移動窗口最大匹配算法,匹配得到地址字符串所包含的可能行政區(qū)劃結(jié)論集。

    (2)對一個待查詢地址字符串,當(dāng)其中行政區(qū)劃作為推理證據(jù)時,依據(jù)其位置因子(factor position,F(xiàn)P)與匹配模式系數(shù)Mode(i),計算該證據(jù)行政區(qū)劃的初始信度。

    首先根據(jù)行政區(qū)劃表,對待查詢地址字符串進(jìn)行分詞,得到若干個行政區(qū)劃字符串。

    (1)

    同時,證據(jù)行政區(qū)劃初始信度如式(2)所示

    (2)

    式中:Mode(i)為第i個行政區(qū)劃字符串的系數(shù),如果是完全匹配模式,如地址字符串“湖北省武漢市”匹配行政區(qū)劃“湖北省”、“武漢市”,則Mode(i)=0.9,此處不設(shè)Mode(i)=1.0的原因在于,完全匹配的行政區(qū)劃中可能包含命名實(shí)體,匹配模式會誤將其識別為地址行政區(qū)劃,例如:“武漢市江夏區(qū)蘭州拉面館”中的“蘭州”即為命名實(shí)體;如果是部分匹配模式,如地址字符串“湖北武漢”匹配行政區(qū)劃“湖北省”、“武漢市”等,則必須保證其匹配模式系數(shù)小于完全匹配時的系數(shù),故Mode(i)=0.7;同理,如果是簡稱匹配模式,則Mode(i)=0.5。

    (3)對于一個地址字符串,當(dāng)其包含多個行政區(qū)劃證據(jù)時,行政區(qū)劃結(jié)論集中的匹配結(jié)論會對應(yīng)多個不同的地理位置信息。但從語義的角度考慮,不同區(qū)劃匹配結(jié)論間仍存在一定的位置關(guān)系,即會將自身區(qū)劃證據(jù)初始信度傳遞到相關(guān)匹配區(qū)劃結(jié)論中,以相互支持各區(qū)劃證據(jù)。

    傳遞因子主要由兩個不同地址匹配地址結(jié)論中的相同區(qū)劃個數(shù)S(i,j)和區(qū)劃位置級差因子FPL(i,j)確定,且傳遞因子與區(qū)劃級差相關(guān)因子(factor position level relation,F(xiàn)PLR)密切相關(guān),故需先得出FPLR(i,j),如式(3)所示

    FPLR(i,j)=FPL(i,j)+S(i,j)

    (3)

    假設(shè)有區(qū)劃證據(jù)“南京”和“鼓樓”,證據(jù)“南京”匹配區(qū)劃結(jié)論為A1:“江蘇省南京市”,“鼓樓”匹配區(qū)劃結(jié)論為A2:“江蘇省南京市鼓樓區(qū)”和A3:“江蘇省徐州市鼓樓區(qū)”,由此可得S(A1,A2)=2,S(A1,A3)=1。

    對于包含完整行政區(qū)劃的地址,其區(qū)劃行政級別變化趨勢往往與位置值的變化趨勢保持一致,如當(dāng)Pos(1)=“省”,Pos(2)=“市”; 而在存在行政區(qū)劃模糊或缺失的地址中,F(xiàn)PL(i,j)的變化趨勢較為復(fù)雜多變,但本文主要針對省、市和區(qū)三級行政區(qū)劃,即Lev(i)∈{1,2,3}。 通過對大量實(shí)際地址中出現(xiàn)的行政區(qū)劃的級別與位置進(jìn)行分析,可得區(qū)劃級差相關(guān)因子具體表示形式,如式(4)所示

    (4)

    由式(4)可知,F(xiàn)PL(i,j)≤1且0≤S(i,j)≤3, 同時為滿足0≤TF≤1, 故令傳遞因子TF(i,j)如式(5)所示

    (5)

    (4)對于某一地址字符串,將其中行政區(qū)劃作為證據(jù),根據(jù)位置因子和匹配區(qū)劃級別,得到其對應(yīng)行政區(qū)劃結(jié)論的初始信度。雖然不同行政區(qū)劃匹配出各自對應(yīng)行政區(qū)劃結(jié)論,但結(jié)論之間存在一定的地理位置關(guān)系。故需利用不確定性的信度傳遞概念,對各證據(jù)的初始信度進(jìn)行轉(zhuǎn)移,由式(2)和式(5)可知

    (6)

    依據(jù)式(7)得出各行政區(qū)劃結(jié)論間的傳遞信度后,以此計算各行政區(qū)劃傳遞信度的總和,并作為各行政區(qū)劃信度的更新值,記為Credibility(j),如式(7)所示

    (7)

    最后,選取行政區(qū)劃結(jié)論集中可信度最大的行政區(qū)劃結(jié)論作為地址字符串的地理定位區(qū)劃方式,如式(8)所示

    (8)

    3 實(shí)驗(yàn)設(shè)計與分析

    本文方法主要針對中文地址行政區(qū)劃信息的辨識與提取,為了充分體現(xiàn)本文方法在解決地址行政區(qū)劃模糊、缺失和歧義等問題上的優(yōu)勢,需對實(shí)驗(yàn)進(jìn)行一定設(shè)計,并在此基礎(chǔ)上對實(shí)驗(yàn)結(jié)果進(jìn)行分析。

    3.1 實(shí)驗(yàn)設(shè)計

    為驗(yàn)證本文方法的有效性,需準(zhǔn)備一個結(jié)構(gòu)規(guī)范,內(nèi)容較為完整的行政區(qū)劃字典,作為信息匹配的依據(jù)。實(shí)驗(yàn)設(shè)計的主要內(nèi)容包括:測試語料預(yù)處理和實(shí)驗(yàn)組合方式。

    (1)測試語料預(yù)處理

    利用網(wǎng)絡(luò)爬蟲算法從互聯(lián)中獲取25萬條地址數(shù)據(jù)。然而,這些地址大多包含冗余的信息,其中“路”特征詞等低級區(qū)劃信息會對實(shí)驗(yàn)結(jié)果的準(zhǔn)確性產(chǎn)生較大干擾,如“上海路”、“南京路”和“武漢大道”等會匹配得到“上海市”、“南京市”和“武漢市”等干擾信息。為了排除此干擾,體現(xiàn)本文方法在針對行政區(qū)劃信息辨識上的優(yōu)越性,本文實(shí)驗(yàn)對于中文地址的預(yù)處理方式為省略低級區(qū)劃,只保留三級行政區(qū)劃等有效信息。

    (2)實(shí)驗(yàn)組合方式

    在所選取的測試語料中,有些地址信息十分完整與確切,如“湖北省武漢市”,此時可通過完全匹配的方式獲取其中行政區(qū)劃信息“湖北省”和“武漢市”;但也存在行政區(qū)劃特征字缺失的情況,如“安徽合肥”,此時只能依靠部分匹配的方式,“安徽”部分匹配“安徽省”,“合肥”部分匹配“合肥市”。

    為了能夠更加完整的獲取地址行政區(qū)劃信息,并體現(xiàn)本文方法能夠有效解決行政區(qū)劃特征字缺失、歧義等問題,實(shí)驗(yàn)采用完全匹配查詢、完全匹配查詢+部分匹配查詢兩種方式;并將原始語料與經(jīng)過預(yù)處理的語料分別與兩種匹配方式進(jìn)行組合實(shí)驗(yàn)。

    3.2 實(shí)驗(yàn)結(jié)果與分析

    通過可信度計算方法獲取可信度最大的區(qū)劃結(jié)果作為地址字符串的地理定位信息。4種實(shí)驗(yàn)組合方式的具體實(shí)驗(yàn)結(jié)果見表1。

    表1 可信度計算實(shí)驗(yàn)結(jié)果

    本文通過設(shè)計計算方法,對地址行政區(qū)劃信息進(jìn)行辨識,4種實(shí)驗(yàn)方式的時耗相差不大且均可被接受,故重點(diǎn)討論各組合實(shí)驗(yàn)方法的正確率。

    (1)若匹配方式不變

    均選擇完全區(qū)劃匹配查詢時,會將原始地址集字符串中所有以行政區(qū)劃命名的路街等信息過濾掉,同時也會忽略地址中省略特征詞的字符串,故是否對數(shù)據(jù)進(jìn)行預(yù)處理,對行政區(qū)劃元素選擇的正確率沒有影響。

    均選擇完全+部分區(qū)劃匹配查詢,對原始數(shù)據(jù)而言,由于完全+部分匹配查詢是對關(guān)鍵字進(jìn)行匹配查詢,會匹配得到產(chǎn)生干擾的行政區(qū)劃,比如“南京路”將匹配成“南京市”,對結(jié)果的選擇造成影響;而對于經(jīng)過預(yù)處理的測試語料,已排除了上述干擾,并綜合考慮了完全匹配、部分匹配及行政區(qū)劃層次結(jié)構(gòu)等因素,故結(jié)論具有較大的可確定性,且識別正確率高于單純地選擇最大行政區(qū)劃的結(jié)果。

    (2)若測試地址集不變

    對于原始數(shù)據(jù)而言,因未對其作任何的預(yù)處理工作,其中包含較多冗余且易產(chǎn)生歧義的信息,故當(dāng)采用完全+部分匹配方式時,會將部分命名實(shí)體或街道名等錯誤地識別為行政區(qū)劃信息,給計算方法提供了錯誤信息,干擾了地址區(qū)劃信息的識別,故導(dǎo)致識別準(zhǔn)確率較低。

    對于經(jīng)過預(yù)處理,省略了低級區(qū)劃信息的地址而言,排除了“路”特征字產(chǎn)生的干擾后,其所產(chǎn)生的歧義信息大多是由行政區(qū)劃的模糊、缺失和不確定性導(dǎo)致了。當(dāng)采用完全+部分匹配規(guī)則時,可以獲取更多的行政區(qū)劃信息,即增強(qiáng)了信息間的約束,并通過本文提出的計算方法,能夠正確地識別出其實(shí)際指定的行政區(qū)劃信息。

    故在對測試語料進(jìn)行預(yù)處理的基礎(chǔ)上,采用完全+部分匹配方法能夠更好地說明本文計算方法在針對解決行政區(qū)劃信息模糊、缺失等問題上的優(yōu)勢。

    通過對具體實(shí)驗(yàn)結(jié)果觀察分析發(fā)現(xiàn),在完善區(qū)劃匹配詞典的基礎(chǔ)上,對于較為規(guī)范的地址有非常高的識別正確率,同時針對行政區(qū)劃不完整且存在地址要素殘缺的非規(guī)范地址,本文提出的證據(jù)可信度計算方法,能夠較好地識別一般方法無法確定或識別錯誤的地址字符串中蘊(yùn)含的地址區(qū)劃信息。比如地址“中山東港新區(qū)金廣東海岸濱城”,其中包含多個相互間存在沖突或關(guān)聯(lián)的行政區(qū)劃結(jié)論,見表2。

    表2 地址行政區(qū)劃結(jié)論

    顯然一般的地址匹配算法或要素解析規(guī)則是無法確定該地址的行政區(qū)劃。究其原因在于,或地址中出現(xiàn)多個地址要素,或?qū)⒚麑?shí)體錯誤的識別為地址要素。當(dāng)多個地址要素代表的行政區(qū)劃結(jié)論存在較大歧義時,無法確定其準(zhǔn)確的信息。本文提出的可信度計算方法,通過公式計算的方法,選取地址中可信度較大地址要素代表的行政區(qū)劃結(jié)論作為地址行政區(qū)劃信息。通過本文的計算方法可以正確地確定地址“中山東港新區(qū)金廣東海岸濱城”,指定的是“遼寧省大連市中山區(qū)”,且與實(shí)際情況相符。

    本文計算方法雖然可以解析大部分規(guī)則或不規(guī)則的中文地址,但對于少量特殊的地址字符串,識別結(jié)果與地址實(shí)際位置信息依然存在偏差。針對原始地址語料識別失敗的結(jié)果主要分為以下兩種情況:

    (1)實(shí)際情況中存在單字行政區(qū)劃,其將對地址字符串中行政區(qū)劃信息的提取產(chǎn)生嚴(yán)重干擾。如地址:“江南區(qū)沙井大道”,其中“江南區(qū)”匹配行政區(qū)劃“廣西壯族自治區(qū)南寧市江南區(qū)”。但由于匹配詞典中存在單字行政區(qū)劃“南區(qū)”,無論正向匹配算法還是反向匹配算法[9],均會將“江南區(qū)”識別為“南區(qū)”,匹配行政區(qū)劃“廣東省中山市南區(qū)”等;同時由于地址字符串中無其它地理定位信息,導(dǎo)致無法準(zhǔn)確獲取該地址的地理位置信息。具體計算結(jié)果見表3。

    表3 區(qū)劃可信度計算結(jié)果二

    (2)由于實(shí)驗(yàn)地址數(shù)據(jù)形式各異,其中存在大量非標(biāo)準(zhǔn)地址,如:“合肥市明光”。當(dāng)對原始地址進(jìn)行完全匹配時,得到行政區(qū)劃“安徽省合肥市”;當(dāng)對原始數(shù)據(jù)進(jìn)行完全+部分匹配時,得到行政區(qū)劃“安徽省滁州市明光區(qū)”。通過計算得到兩種行政區(qū)劃匹配結(jié)果的可信度,具體計算結(jié)果見表4。

    表4 區(qū)劃可信度計算結(jié)果三

    由表4可知,本文計算方法將得到錯誤的行政區(qū)劃識別結(jié)果。識別錯誤的主要原因在于,地址信息的識別產(chǎn)生歧義且該地址中并無其它區(qū)劃信息以支撐相關(guān)結(jié)果。

    本文計算方法主要解決“省市區(qū)”三級行政區(qū)劃的信息提取,故若地址中包含路街等位置信息時,則可以將其忽略,即對語料進(jìn)行預(yù)處理,以提高地址行政區(qū)劃匹配精確度。由表1實(shí)驗(yàn)結(jié)果可知,當(dāng)對測試地址語料中的“路”特征字進(jìn)行預(yù)處理后,實(shí)驗(yàn)準(zhǔn)確率有了顯著提高,當(dāng)采用完全與部分區(qū)劃匹配方式時準(zhǔn)確率達(dá)到94.81%。由此可見,當(dāng)?shù)刂沸姓^(qū)劃信息充足時,本文方法在解決地址行政區(qū)劃信息模糊、缺失和歧義等問題是十分有效的。

    3.3 對比實(shí)驗(yàn)

    通過分析中文地址解析方法在各種算法中的應(yīng)用,將本文方法與基于特征字匹配方法、基于條件隨機(jī)場方法和基于自然語言理解的地址識別方法進(jìn)行對比實(shí)驗(yàn)。為了使實(shí)驗(yàn)方法根據(jù)說服力,將上述方法分別對本文經(jīng)過預(yù)處理的地址數(shù)據(jù)測試集進(jìn)行實(shí)驗(yàn),具體識別結(jié)果對比見表5。

    表5 識別結(jié)果比較表

    采用基于特征字匹配方法的分詞結(jié)果正確性通常取決于地址信息中是否有特征字符,若地址中沒有出現(xiàn)能夠區(qū)分“省市區(qū)”信息的特征字符,就會影響分詞的正確性,故對于本文從互聯(lián)網(wǎng)中獲取的雜亂無章且存在行政區(qū)劃缺失的地址,該方法無法識別,導(dǎo)致識別準(zhǔn)確率很低。采用基于條件隨機(jī)場算法,利用地址要素標(biāo)注集進(jìn)行人工標(biāo)注,可以識別地址語料蘊(yùn)含的位置信息,但識別性能一般,且需要耗費(fèi)大量的精力對語料進(jìn)行標(biāo)注,方法的效率不高。目前采用的基于自然語言理解的方法具有較大的局限性,模型對訓(xùn)練語料依賴較強(qiáng),針對互聯(lián)網(wǎng)中大量雜亂無章的地址識別效果較差。本文提出的可信度計算方法,不僅效率高,同時可以通過有效的計算消除地址字符串之間存在的歧義,并完善地址行政區(qū)劃信息。

    4 結(jié)束語

    互聯(lián)網(wǎng)中地址文本錯綜復(fù)雜、雜亂無章,難以通過一種方式有效解決所有形式地址的地理位置信息提取問題。本文提出一種基于可信度模型的行政區(qū)劃可信度計算方法,能夠靈活處理不同結(jié)構(gòu)地址的行政區(qū)劃信息。利用移動窗口最大匹配算法對地址字符串進(jìn)行行政區(qū)劃匹配[12],在顧及中文地址語義的前提下,根據(jù)中文地址的表達(dá)特點(diǎn),建立行政區(qū)劃匹配規(guī)則和可信度計算方法,能夠有效地處理引發(fā)歧義的行政區(qū)劃信息,提高了中文地址行政區(qū)劃解析的正確率和時效性。

    在未來的工作中,可在此研究的基礎(chǔ)上,進(jìn)一步增加行政區(qū)劃級別識別的級數(shù),通過處理結(jié)構(gòu)更為復(fù)雜的地址獲取更為完善的地理位置信息。

    猜你喜歡
    行政區(qū)劃字符串區(qū)劃
    林芝市雷電風(fēng)險區(qū)劃
    基于“三線一單”的環(huán)境功能區(qū)劃實(shí)證研究
    川渝傳統(tǒng)民居區(qū)劃的環(huán)境蘊(yùn)意
    中國行政區(qū)劃的前世今生
    文史春秋(2017年10期)2017-11-29 01:31:42
    河北省行政區(qū)劃
    一種新的基于對稱性的字符串相似性處理算法
    河北省行政區(qū)劃
    依據(jù)字符串匹配的中文分詞模型研究
    基于GIS的陜西省烤煙氣候生態(tài)適宜性區(qū)劃
    河北省行政區(qū)劃
    精品一区在线观看国产| 久久国产精品影院| 少妇的丰满在线观看| 国产成人欧美在线观看 | 飞空精品影院首页| av国产久精品久网站免费入址| 亚洲,一卡二卡三卡| 成人亚洲欧美一区二区av| 91麻豆精品激情在线观看国产 | 嫁个100分男人电影在线观看 | 无限看片的www在线观看| 久久久精品94久久精品| 亚洲精品乱久久久久久| 久久久久视频综合| 日本一区二区免费在线视频| 亚洲天堂av无毛| 丝袜人妻中文字幕| a级毛片在线看网站| 亚洲人成电影观看| 满18在线观看网站| 精品国产乱码久久久久久男人| 日本午夜av视频| 青春草亚洲视频在线观看| 在现免费观看毛片| 欧美在线黄色| 一级片免费观看大全| av网站在线播放免费| 久久精品久久精品一区二区三区| 亚洲精品国产av蜜桃| 91精品三级在线观看| 18在线观看网站| 2018国产大陆天天弄谢| 侵犯人妻中文字幕一二三四区| 日韩 欧美 亚洲 中文字幕| 国产成人精品在线电影| 亚洲伊人久久精品综合| 国产精品熟女久久久久浪| videos熟女内射| 看十八女毛片水多多多| 亚洲av成人精品一二三区| 9色porny在线观看| 久久久久久人人人人人| 国产成人精品在线电影| 大码成人一级视频| 精品福利观看| 黄片小视频在线播放| 久久天躁狠狠躁夜夜2o2o | 中文字幕人妻丝袜一区二区| 别揉我奶头~嗯~啊~动态视频 | 晚上一个人看的免费电影| 尾随美女入室| 免费在线观看黄色视频的| xxxhd国产人妻xxx| 18在线观看网站| 亚洲欧洲精品一区二区精品久久久| 欧美性长视频在线观看| 青春草视频在线免费观看| 大话2 男鬼变身卡| svipshipincom国产片| 亚洲欧美中文字幕日韩二区| 国产91精品成人一区二区三区 | 久久人妻熟女aⅴ| 亚洲av男天堂| 亚洲一区中文字幕在线| 久久国产精品男人的天堂亚洲| 51午夜福利影视在线观看| 国产97色在线日韩免费| 女性被躁到高潮视频| 亚洲第一av免费看| 久久99精品国语久久久| 日日夜夜操网爽| 伊人久久大香线蕉亚洲五| 欧美日本中文国产一区发布| 免费在线观看黄色视频的| 男男h啪啪无遮挡| 99久久人妻综合| 亚洲av日韩精品久久久久久密 | 婷婷成人精品国产| 欧美日本中文国产一区发布| 在线av久久热| 在线 av 中文字幕| 欧美激情 高清一区二区三区| 国产精品国产三级专区第一集| 男女国产视频网站| 国产高清视频在线播放一区 | 亚洲人成电影免费在线| av国产久精品久网站免费入址| 日本91视频免费播放| 看十八女毛片水多多多| 日韩av免费高清视频| 精品福利观看| 亚洲av美国av| 亚洲欧洲国产日韩| av国产久精品久网站免费入址| tube8黄色片| 国产福利在线免费观看视频| 国产一区二区 视频在线| 久久人人爽人人片av| 国产不卡av网站在线观看| 久久久亚洲精品成人影院| 成人18禁高潮啪啪吃奶动态图| 亚洲精品在线美女| 国产av精品麻豆| 欧美黄色淫秽网站| 亚洲欧美日韩另类电影网站| 看免费成人av毛片| 亚洲成国产人片在线观看| 最近手机中文字幕大全| 美女午夜性视频免费| 欧美在线一区亚洲| 青青草视频在线视频观看| 在线亚洲精品国产二区图片欧美| 黄色一级大片看看| 少妇的丰满在线观看| 777久久人妻少妇嫩草av网站| 免费看不卡的av| 两性夫妻黄色片| 免费在线观看日本一区| 少妇精品久久久久久久| 你懂的网址亚洲精品在线观看| 一级片'在线观看视频| 成年人午夜在线观看视频| 男女无遮挡免费网站观看| 久久精品成人免费网站| 欧美大码av| 韩国高清视频一区二区三区| 国产精品一区二区在线观看99| 久久精品久久久久久噜噜老黄| 精品少妇内射三级| 巨乳人妻的诱惑在线观看| 美女大奶头黄色视频| 国产高清videossex| 亚洲精品第二区| 国产91精品成人一区二区三区 | 亚洲精品久久久久久婷婷小说| 精品一区二区三区av网在线观看 | 青青草视频在线视频观看| 亚洲 国产 在线| 欧美日韩亚洲综合一区二区三区_| 自拍欧美九色日韩亚洲蝌蚪91| 777久久人妻少妇嫩草av网站| 深夜精品福利| 国产精品人妻久久久影院| 91九色精品人成在线观看| 欧美97在线视频| 18在线观看网站| 亚洲精品av麻豆狂野| 亚洲图色成人| 亚洲国产欧美一区二区综合| 99国产精品99久久久久| 免费少妇av软件| 欧美亚洲 丝袜 人妻 在线| 黑人欧美特级aaaaaa片| 国产野战对白在线观看| 国产成人影院久久av| 啦啦啦视频在线资源免费观看| 每晚都被弄得嗷嗷叫到高潮| 免费观看av网站的网址| svipshipincom国产片| 悠悠久久av| 人妻一区二区av| 国产一区二区在线观看av| 亚洲精品国产av成人精品| 国产精品久久久人人做人人爽| 免费人妻精品一区二区三区视频| 久久人人爽av亚洲精品天堂| 国产精品久久久av美女十八| 日本av免费视频播放| av国产精品久久久久影院| 在线观看人妻少妇| 这个男人来自地球电影免费观看| 亚洲精品国产av成人精品| 国产精品国产av在线观看| 在线观看免费午夜福利视频| av不卡在线播放| 久久精品aⅴ一区二区三区四区| 久久精品亚洲av国产电影网| 国语对白做爰xxxⅹ性视频网站| 久久久精品免费免费高清| 欧美日韩一级在线毛片| 国产精品一区二区精品视频观看| av有码第一页| 一边亲一边摸免费视频| 国产在线一区二区三区精| 美女大奶头黄色视频| 亚洲,一卡二卡三卡| 91字幕亚洲| 大型av网站在线播放| 精品一区在线观看国产| 亚洲国产精品成人久久小说| 亚洲国产日韩一区二区| 免费久久久久久久精品成人欧美视频| 少妇粗大呻吟视频| 天天操日日干夜夜撸| av国产精品久久久久影院| 国产xxxxx性猛交| 成年人黄色毛片网站| av国产久精品久网站免费入址| 欧美变态另类bdsm刘玥| 亚洲国产av影院在线观看| 免费日韩欧美在线观看| 99re6热这里在线精品视频| 亚洲国产av影院在线观看| 久久久久国产精品人妻一区二区| 国产av精品麻豆| 国产高清videossex| 人人妻,人人澡人人爽秒播 | 亚洲欧美一区二区三区久久| 一二三四社区在线视频社区8| 十分钟在线观看高清视频www| 欧美日韩精品网址| 免费高清在线观看日韩| 中文字幕最新亚洲高清| 极品少妇高潮喷水抽搐| 亚洲色图 男人天堂 中文字幕| 国语对白做爰xxxⅹ性视频网站| 国产一卡二卡三卡精品| 可以免费在线观看a视频的电影网站| 久久人人爽人人片av| 国产精品av久久久久免费| 欧美大码av| 亚洲成人免费av在线播放| 亚洲人成电影观看| 老司机深夜福利视频在线观看 | 久久性视频一级片| 欧美精品啪啪一区二区三区 | 亚洲一码二码三码区别大吗| 99久久综合免费| 赤兔流量卡办理| 久久这里只有精品19| 麻豆乱淫一区二区| 久久99一区二区三区| 黄色怎么调成土黄色| 青春草视频在线免费观看| 国产福利在线免费观看视频| 亚洲情色 制服丝袜| 丁香六月天网| 大型av网站在线播放| 欧美精品av麻豆av| 国产又爽黄色视频| 精品久久久久久电影网| 欧美亚洲日本最大视频资源| a级毛片在线看网站| 丰满少妇做爰视频| 99re6热这里在线精品视频| 大片电影免费在线观看免费| 好男人电影高清在线观看| 亚洲国产欧美一区二区综合| 欧美国产精品va在线观看不卡| 看免费成人av毛片| 欧美日韩视频高清一区二区三区二| 天天躁狠狠躁夜夜躁狠狠躁| 国产一区二区在线观看av| 在线观看www视频免费| 天堂中文最新版在线下载| 久久精品久久精品一区二区三区| 成人午夜精彩视频在线观看| 亚洲成国产人片在线观看| 晚上一个人看的免费电影| 日韩av在线免费看完整版不卡| 精品卡一卡二卡四卡免费| 蜜桃在线观看..| 亚洲免费av在线视频| 婷婷色av中文字幕| 国产精品偷伦视频观看了| 超碰成人久久| 一级毛片黄色毛片免费观看视频| 99九九在线精品视频| 久久av网站| 免费久久久久久久精品成人欧美视频| 丝袜喷水一区| 亚洲免费av在线视频| 中文字幕亚洲精品专区| 中文欧美无线码| 777久久人妻少妇嫩草av网站| 叶爱在线成人免费视频播放| 久久久久久久精品精品| 高清视频免费观看一区二区| 亚洲精品国产色婷婷电影| 新久久久久国产一级毛片| 制服诱惑二区| 免费看av在线观看网站| 国产精品成人在线| 亚洲五月色婷婷综合| 最近中文字幕2019免费版| av又黄又爽大尺度在线免费看| 国产av国产精品国产| 久久影院123| 亚洲精品中文字幕在线视频| www.av在线官网国产| 国产精品亚洲av一区麻豆| 一级毛片我不卡| 国产真人三级小视频在线观看| 久久人妻福利社区极品人妻图片 | 韩国高清视频一区二区三区| 亚洲精品久久成人aⅴ小说| 电影成人av| 久久久国产一区二区| 国产黄色视频一区二区在线观看| 考比视频在线观看| 亚洲av欧美aⅴ国产| 亚洲精品国产一区二区精华液| 一级a爱视频在线免费观看| 国产淫语在线视频| 美女脱内裤让男人舔精品视频| 性少妇av在线| 国产精品久久久久久精品电影小说| a级片在线免费高清观看视频| 天天操日日干夜夜撸| 高潮久久久久久久久久久不卡| 精品一品国产午夜福利视频| 国产男人的电影天堂91| 巨乳人妻的诱惑在线观看| av片东京热男人的天堂| 99久久人妻综合| 精品国产乱码久久久久久小说| 建设人人有责人人尽责人人享有的| 你懂的网址亚洲精品在线观看| 丝袜美足系列| 老司机影院毛片| 50天的宝宝边吃奶边哭怎么回事| 欧美激情 高清一区二区三区| 欧美国产精品一级二级三级| 欧美变态另类bdsm刘玥| 伦理电影免费视频| av视频免费观看在线观看| 国产亚洲欧美精品永久| 巨乳人妻的诱惑在线观看| 亚洲免费av在线视频| 乱人伦中国视频| bbb黄色大片| 久久久精品区二区三区| 国产一区二区三区av在线| 水蜜桃什么品种好| 欧美xxⅹ黑人| a级毛片黄视频| 丝袜美腿诱惑在线| 中文字幕精品免费在线观看视频| 天堂中文最新版在线下载| 人妻人人澡人人爽人人| 中文字幕人妻丝袜制服| 老司机影院成人| 天堂中文最新版在线下载| 国产在视频线精品| 波野结衣二区三区在线| 一区二区三区乱码不卡18| 99精国产麻豆久久婷婷| 无限看片的www在线观看| 叶爱在线成人免费视频播放| 我要看黄色一级片免费的| 国产有黄有色有爽视频| 热99国产精品久久久久久7| 中文字幕人妻丝袜制服| 97在线人人人人妻| 国产成人91sexporn| 亚洲图色成人| 久久久久久亚洲精品国产蜜桃av| 国产日韩欧美在线精品| 国产激情久久老熟女| avwww免费| 精品久久蜜臀av无| 精品一区二区三卡| 国产激情久久老熟女| avwww免费| 欧美中文综合在线视频| 午夜福利一区二区在线看| 夫妻午夜视频| 免费看不卡的av| 久久ye,这里只有精品| 国产又色又爽无遮挡免| 久久热在线av| 91精品三级在线观看| 免费在线观看日本一区| 90打野战视频偷拍视频| 又黄又粗又硬又大视频| 人成视频在线观看免费观看| 一边摸一边抽搐一进一出视频| 满18在线观看网站| 久热爱精品视频在线9| 一级片免费观看大全| 亚洲国产精品成人久久小说| 欧美精品一区二区大全| 亚洲欧美精品综合一区二区三区| 久久精品亚洲av国产电影网| 午夜视频精品福利| 午夜老司机福利片| 男女午夜视频在线观看| 可以免费在线观看a视频的电影网站| 亚洲国产毛片av蜜桃av| 欧美中文综合在线视频| 黄片小视频在线播放| 人人妻人人添人人爽欧美一区卜| 性高湖久久久久久久久免费观看| 女人爽到高潮嗷嗷叫在线视频| 99精国产麻豆久久婷婷| 在线 av 中文字幕| 18在线观看网站| 性色av一级| 国产熟女午夜一区二区三区| 久久精品国产a三级三级三级| av福利片在线| 国产亚洲精品第一综合不卡| 欧美日韩亚洲国产一区二区在线观看 | 男人舔女人的私密视频| 亚洲免费av在线视频| 91成人精品电影| 91麻豆av在线| 18禁国产床啪视频网站| 国产99久久九九免费精品| 久久久精品免费免费高清| 国产一区二区在线观看av| videos熟女内射| 日韩一卡2卡3卡4卡2021年| 韩国高清视频一区二区三区| 亚洲人成电影观看| 97人妻天天添夜夜摸| 日韩av不卡免费在线播放| 麻豆乱淫一区二区| 精品国产乱码久久久久久小说| av线在线观看网站| 亚洲综合色网址| 赤兔流量卡办理| 亚洲情色 制服丝袜| 老汉色av国产亚洲站长工具| 午夜91福利影院| 中文字幕另类日韩欧美亚洲嫩草| 欧美精品亚洲一区二区| 国产精品一国产av| av天堂在线播放| 777米奇影视久久| av欧美777| 久久影院123| 在线天堂中文资源库| 精品国产国语对白av| 久久人妻福利社区极品人妻图片 | 如日韩欧美国产精品一区二区三区| 亚洲国产成人一精品久久久| 十分钟在线观看高清视频www| 亚洲第一av免费看| 制服人妻中文乱码| videosex国产| 超碰成人久久| 只有这里有精品99| 亚洲图色成人| 日本猛色少妇xxxxx猛交久久| 18禁国产床啪视频网站| 在线观看免费高清a一片| 欧美日韩福利视频一区二区| 老熟女久久久| 色婷婷av一区二区三区视频| 国产主播在线观看一区二区 | 亚洲成色77777| 热99国产精品久久久久久7| 色精品久久人妻99蜜桃| 亚洲精品中文字幕在线视频| 七月丁香在线播放| 午夜福利一区二区在线看| 高潮久久久久久久久久久不卡| 国产精品一区二区在线观看99| 在现免费观看毛片| 国产精品成人在线| 精品人妻1区二区| 美女扒开内裤让男人捅视频| 中文字幕人妻丝袜一区二区| 一区二区三区乱码不卡18| av网站免费在线观看视频| 亚洲欧美日韩另类电影网站| 女警被强在线播放| 青春草视频在线免费观看| 久久热在线av| 色网站视频免费| 黄色视频在线播放观看不卡| 婷婷色综合大香蕉| 在线观看一区二区三区激情| 国产人伦9x9x在线观看| 九草在线视频观看| 欧美国产精品va在线观看不卡| 18在线观看网站| 亚洲 国产 在线| 中文精品一卡2卡3卡4更新| 少妇被粗大的猛进出69影院| 啦啦啦视频在线资源免费观看| 国产亚洲精品久久久久5区| 一级黄色大片毛片| 99香蕉大伊视频| 国产亚洲av片在线观看秒播厂| 2018国产大陆天天弄谢| 精品少妇黑人巨大在线播放| 国产精品久久久久成人av| 汤姆久久久久久久影院中文字幕| 乱人伦中国视频| 午夜久久久在线观看| 捣出白浆h1v1| 色婷婷久久久亚洲欧美| 欧美精品一区二区免费开放| 午夜福利视频在线观看免费| 亚洲av电影在线观看一区二区三区| 在线天堂中文资源库| 免费在线观看视频国产中文字幕亚洲 | 69精品国产乱码久久久| 丁香六月天网| 国产日韩一区二区三区精品不卡| 成在线人永久免费视频| 秋霞在线观看毛片| 亚洲伊人久久精品综合| 80岁老熟妇乱子伦牲交| av在线播放精品| 中文字幕另类日韩欧美亚洲嫩草| 亚洲中文字幕日韩| 国产97色在线日韩免费| a级片在线免费高清观看视频| 色播在线永久视频| 亚洲一区二区三区欧美精品| 91字幕亚洲| 欧美中文综合在线视频| av有码第一页| 97人妻天天添夜夜摸| 精品国产乱码久久久久久小说| 欧美97在线视频| 一级毛片女人18水好多 | 国产无遮挡羞羞视频在线观看| 老司机午夜十八禁免费视频| 国产欧美日韩一区二区三 | 狂野欧美激情性bbbbbb| 婷婷色综合大香蕉| 成年动漫av网址| xxxhd国产人妻xxx| 满18在线观看网站| 纯流量卡能插随身wifi吗| av网站在线播放免费| 国产一区二区三区综合在线观看| 中文乱码字字幕精品一区二区三区| 免费观看a级毛片全部| 亚洲第一av免费看| 亚洲 欧美一区二区三区| 久久人妻熟女aⅴ| 婷婷色av中文字幕| 成人三级做爰电影| 十八禁网站网址无遮挡| 又黄又粗又硬又大视频| 午夜av观看不卡| 午夜影院在线不卡| 脱女人内裤的视频| 满18在线观看网站| 亚洲专区中文字幕在线| 国产精品欧美亚洲77777| 美女高潮到喷水免费观看| 男人爽女人下面视频在线观看| 欧美精品一区二区免费开放| 日本欧美视频一区| 亚洲,一卡二卡三卡| 久久久久久久久久久久大奶| 欧美+亚洲+日韩+国产| 午夜久久久在线观看| 国产免费现黄频在线看| 国产日韩欧美视频二区| 国产成人欧美在线观看 | 香蕉国产在线看| 午夜影院在线不卡| 高清不卡的av网站| 亚洲激情五月婷婷啪啪| 精品亚洲成a人片在线观看| 搡老乐熟女国产| 国产成人精品在线电影| 亚洲成人免费电影在线观看 | 1024香蕉在线观看| 咕卡用的链子| 如日韩欧美国产精品一区二区三区| 免费少妇av软件| 中文字幕av电影在线播放| 国产有黄有色有爽视频| 免费在线观看影片大全网站 | 国产精品麻豆人妻色哟哟久久| 日本av手机在线免费观看| 纵有疾风起免费观看全集完整版| 三上悠亚av全集在线观看| www.熟女人妻精品国产| 久久人妻福利社区极品人妻图片 | 狂野欧美激情性xxxx| 亚洲成av片中文字幕在线观看| 成年人午夜在线观看视频| 亚洲欧美成人综合另类久久久| 亚洲精品一二三| 不卡av一区二区三区| 波多野结衣一区麻豆| 久久精品aⅴ一区二区三区四区| 精品国产国语对白av| 中文欧美无线码| 久久精品熟女亚洲av麻豆精品| 亚洲av片天天在线观看| 欧美精品一区二区免费开放| 成年动漫av网址| 亚洲国产最新在线播放| 成人手机av| 精品一品国产午夜福利视频| 亚洲欧美一区二区三区久久| 欧美日韩视频精品一区| 80岁老熟妇乱子伦牲交| 亚洲欧美清纯卡通| 亚洲天堂av无毛| 考比视频在线观看| 一本大道久久a久久精品| 欧美日韩一级在线毛片| 亚洲精品一二三| 在线 av 中文字幕| 精品久久久久久电影网| 十八禁网站网址无遮挡| 久热爱精品视频在线9| 久久久久视频综合| 视频区欧美日本亚洲| 久久精品久久久久久久性| 亚洲综合色网址| 欧美日韩综合久久久久久| 久久久久久免费高清国产稀缺| 国产成人啪精品午夜网站|