• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于互信息改進(jìn)算法和t-測(cè)試差的壯文分詞算法研究

    2017-12-26 05:38:43林葉川易云飛
    關(guān)鍵詞:詞串互信息分詞

    覃 俊,林葉川,易云飛

    (1 中南民族大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,武漢430074;2 河池學(xué)院 計(jì)算機(jī)與信息工程學(xué)院,宜州 546300)

    基于互信息改進(jìn)算法和t-測(cè)試差的壯文分詞算法研究

    覃 俊1,林葉川1,易云飛2,*

    (1 中南民族大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,武漢430074;2 河池學(xué)院 計(jì)算機(jī)與信息工程學(xué)院,宜州 546300)

    針對(duì)傳統(tǒng)的壯文分詞方法將單詞之間的空格作為分隔標(biāo)志,在多數(shù)情況下,會(huì)破壞多個(gè)單詞關(guān)聯(lián)組合而成的語(yǔ)義詞所要表達(dá)的完整且獨(dú)立的語(yǔ)義信息,在借鑒前人使用互信息MI方法來(lái)度量相鄰單詞間關(guān)聯(lián)程度的基礎(chǔ)上,首次采用互信息改進(jìn)算法MIk和t-測(cè)試差對(duì)壯文文本分詞,并結(jié)合兩者在評(píng)價(jià)相鄰單詞間的靜態(tài)結(jié)合能力和動(dòng)態(tài)結(jié)合能力的各自優(yōu)勢(shì),提出了一種MIk和t-測(cè)試差相結(jié)合的TD-MIk混合算法對(duì)壯文文本分詞,并對(duì)互信息改進(jìn)算法MIk、t-測(cè)試差、TD-MIk混合算法三種方法的分詞效果進(jìn)行了比較.使用人民網(wǎng)壯文版上的文本集作為訓(xùn)練及測(cè)試語(yǔ)料進(jìn)行了實(shí)驗(yàn),結(jié)果表明:三種分詞方法都能夠較準(zhǔn)確而有效地提取文本中的語(yǔ)義詞,并且TD-MIk混合算法的分詞準(zhǔn)確率最高.

    壯文分詞;MI改進(jìn)算法;t-測(cè)試差;混合算法;語(yǔ)義詞

    壯語(yǔ)是漢藏語(yǔ)系壯侗語(yǔ)族壯傣語(yǔ)支的一種語(yǔ)言,目前存世的壯族文字有古壯文和現(xiàn)代壯文,其中,現(xiàn)代壯文(簡(jiǎn)稱(chēng)壯文)是一種拼音文字[1,2].在互聯(lián)網(wǎng)發(fā)展迅速的時(shí)代,專(zhuān)注于壯文交流的有人民網(wǎng)壯文版、壯族在線、鼓歌壯族、壯族娛樂(lè)網(wǎng)等.分詞是文本信息處理的第一道“工序”,在自然語(yǔ)言處理的許多應(yīng)用領(lǐng)域,如機(jī)器翻譯、文本分類(lèi)、信息檢索等扮演著極其重要的角色.目前,在分詞這個(gè)研究領(lǐng)域,漢文分詞的研究成果已經(jīng)很多也相對(duì)成熟,漢文分詞技術(shù)發(fā)展到今天,大體上可以將其分為這幾類(lèi):基于詞典的分詞方法(又稱(chēng)機(jī)械分詞)、基于統(tǒng)計(jì)的分詞方法、基于理解的分詞方法、詞典與統(tǒng)計(jì)相結(jié)合的分詞方法[3].漢文分詞的難點(diǎn)主要有兩個(gè):消除歧義和未登錄詞.對(duì)于消除歧義問(wèn)題,需要結(jié)合上下文語(yǔ)境,因此,基于理解的分詞方法能夠較好的克服這個(gè)難點(diǎn),而基于統(tǒng)計(jì)的分詞可以較好地克服未登錄詞這個(gè)難點(diǎn)[4].壯文分詞與漢文有很大的相似性,但是,對(duì)壯文的文本信息處理的研究成果較少:2011年南寧平方軟件開(kāi)發(fā)了一款壯漢翻譯試驗(yàn)系統(tǒng),翻譯結(jié)果的可理解率大約在40%;同年,廣西民族大學(xué)的學(xué)生開(kāi)發(fā)了一款基于短語(yǔ)的漢壯統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)[2];2016年由中國(guó)民族語(yǔ)文翻譯局與東北大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室共同研發(fā)的壯文與漢文智能翻譯系統(tǒng)正式上線運(yùn)行,這是國(guó)內(nèi)首套壯文與漢文雙向翻譯系統(tǒng);除此之外,對(duì)于壯文文本信息處理的研究成果基本沒(méi)有較為詳實(shí)的公開(kāi)報(bào)道.因此,對(duì)于壯文分詞算法的研究具有重要意義.

    壯文文本是一種以空格分隔開(kāi)的詞序列,傳統(tǒng)的壯文分詞只需把空格標(biāo)志作為分詞方法即可.但在很多情況下,壯文中的多個(gè)單詞的關(guān)聯(lián)組合模式,也是一種不可分割的獨(dú)立語(yǔ)言單元,這種多個(gè)單詞的組合將會(huì)表達(dá)一個(gè)具體而獨(dú)立的語(yǔ)義信息,用空格隔開(kāi)的分詞方法將會(huì)喪失這種單詞組合所要表達(dá)的完整語(yǔ)義信息.這樣獲取的單詞就難以在文本標(biāo)引中發(fā)揮詞的作用,相應(yīng)的各種文本處理效果也很不理想[5,6].

    在壯文的機(jī)器翻譯中,按傳統(tǒng)的分詞方法翻譯,例如“raemx hawq raen bya”,這是一個(gè)固定的詞組,漢文意思是“水落石出”,如果以空格分隔,借助Stoneman、honghlaj等制作的Sawloih Cuengh-Gun壯漢詞典,按每個(gè)單詞去翻譯,意思就變?yōu)椤八梢?jiàn)山(石)”.這樣就很難正確表達(dá)出一個(gè)單詞組合所要表達(dá)的語(yǔ)義信息,大大降低了翻譯的準(zhǔn)確性.

    在信息檢索中,用傳統(tǒng)的分詞方法檢索出來(lái)的文本信息并不全是與搜索關(guān)鍵字相關(guān)的結(jié)果.例如關(guān)鍵字“sevei cujyi”(社會(huì)主義),傳統(tǒng)分詞會(huì)把它分成“sevei”和“cujyi”.用該關(guān)鍵字在百度上進(jìn)行測(cè)試,返回了相關(guān)結(jié)果約6440個(gè),其中返回的第一個(gè)頁(yè)面的10個(gè)結(jié)果中,有4個(gè)結(jié)果是與該關(guān)鍵字不相關(guān)的(2017年5月10日測(cè)試),結(jié)果不令人滿意.

    此外,傳統(tǒng)的空格分詞方法還會(huì)在文本主題詞提取、文本分類(lèi)及聚類(lèi)等文本處理中產(chǎn)生負(fù)面的影響.因此,研究一種能夠從壯文文本中獲取結(jié)構(gòu)穩(wěn)定、語(yǔ)義完整而獨(dú)立的壯文單詞的組合將對(duì)壯文的各種文本處理效果起到重要的積極作用.本文從漢文分詞和其他一些少數(shù)民族語(yǔ)言(如維吾爾文)的相關(guān)研究工作中得到啟發(fā),使用互信息的方法作為壯文相鄰單詞間關(guān)聯(lián)程度的度量,切分壯文文本中能夠獨(dú)立表達(dá)完整的語(yǔ)義信息的單詞組,并提出一種基于互信息改進(jìn)算法MIk和t-測(cè)試差相結(jié)合的TD-MIk混合算法,更準(zhǔn)確而有效地提取文本中的語(yǔ)義詞.

    1 基于互信息的壯文分詞

    1.1 互信息MI的壯文分詞思路及分詞過(guò)程

    根據(jù)互信息原理,對(duì)于以空格分隔的壯文詞串序列WiWi+1、單詞Wi和Wi+1之間的互信息MI(Mutual Information)定義如下:

    (1)

    其中,P(Wi,Wi+1)表示詞串序列WiWi+1在文本集中出現(xiàn)的概率;P(Wi)表示單詞Wi在文本集中出現(xiàn)的概率;P(Wi+1)表示單詞Wi+1在文本集中出現(xiàn)的概率.互信息MI(Wi,Wi+1)反映了相鄰單詞Wi和Wi+1之間的關(guān)聯(lián)程度:若MI(Wi,Wi+1)≥0,則WiWi+1間是強(qiáng)關(guān)聯(lián)的,當(dāng)MI(Wi,Wi+1)大于給定的一個(gè)閾值時(shí),認(rèn)為WiWi+1可以構(gòu)成一個(gè)不可分割的獨(dú)立語(yǔ)言單元;若MI(Wi,Wi+1)≈0,則WiWi+1間是弱關(guān)聯(lián)的,表示W(wǎng)iWi+1很難構(gòu)成一個(gè)獨(dú)立語(yǔ)言單元;若MI(Wi,Wi+1)<0,則WiWi+1間是互斥的,表示W(wǎng)iWi+1間基本不能構(gòu)成一個(gè)獨(dú)立語(yǔ)言單元.

    基于互信息MI的壯文分詞過(guò)程如下:每次從句子文本集S中依次讀取一個(gè)句子Si(1≤i≤n),并從Si中的第一個(gè)單詞開(kāi)始,從左到右依次掃描詞串,以兩個(gè)單詞為一組,統(tǒng)計(jì)單詞Wi,Wi+1以及它們的組合WiWi+1在訓(xùn)練文本集Ds中的頻度,并根據(jù)公式(1)計(jì)算WiWi+1間的互信息MI(Wi,Wi+1).若MI(Wi,Wi+1)≥Ti(Ti為給定的閾值),則認(rèn)為當(dāng)前組合可以構(gòu)成一個(gè)獨(dú)立的語(yǔ)義詞.然后把WiWi+1看成一個(gè)新的單詞,并與下一個(gè)單詞Wi+2組合(本文限制最大詞串的單詞數(shù)為4),同樣地計(jì)算它們之間的互信息;依此類(lèi)推,將問(wèn)題始終簡(jiǎn)化為計(jì)算相鄰兩個(gè)單詞之間的互信息,判斷它們是否能構(gòu)成獨(dú)立的語(yǔ)義詞.組詞過(guò)程如圖1所示.

    圖1 組詞過(guò)程圖Fig.1 The graph of Lexical process

    互信息的計(jì)算公式始終不變,在組詞過(guò)程中,當(dāng)計(jì)算得到的互信息小于對(duì)應(yīng)的閾值時(shí),說(shuō)明后續(xù)新加入單詞更不可能構(gòu)成詞.所以,應(yīng)把當(dāng)前加入的新的單詞作為第一個(gè)單詞,開(kāi)始新一輪的組詞.考慮到組詞長(zhǎng)度(單詞個(gè)數(shù))的影響,根據(jù)組詞長(zhǎng)度的增加,其對(duì)應(yīng)的閾值也相應(yīng)地變小(T1>T2>T3>…>Tn-1).

    1.2 改進(jìn)互信息算法MIk

    基于互信息MI的壯文分詞的特點(diǎn)是算法簡(jiǎn)單、速度快.但在分詞過(guò)程中發(fā)現(xiàn),存在部分兩個(gè)低頻單詞且總是一起出現(xiàn)的詞串,MI方法會(huì)過(guò)高地估計(jì)包含這些低頻詞串的結(jié)合強(qiáng)度.例如,“daihheiq mokfaenx”(大氣霧霾)、“canzciz ginhyinz”(殘疾軍人)等這些低頻詞在訓(xùn)練語(yǔ)料中低頻且總是相鄰出現(xiàn),這些詞串的MI值非常高,導(dǎo)致包含這些低頻詞的垃圾詞串相應(yīng)的MI值也非常高,例如“gij daihheiq mokfaenx”(的大氣霧霾),明顯不符合分詞要求.為了過(guò)濾掉這些垃圾詞串,克服高估低頻詞串結(jié)合強(qiáng)度這個(gè)缺點(diǎn),我們首次采用改進(jìn)互信息MIk算法對(duì)壯文進(jìn)行分詞,MIk算法是在MI方法基礎(chǔ)上引進(jìn)一個(gè)或者多個(gè)字串A與B的聯(lián)合概率因子P(A,B)[7,8].MIk算法的定義如下:

    (2)

    其中P(A)、P(B)分別表示單詞A、B的概率,P(A,B)表示詞串AB的聯(lián)合概率,MIk(A,B)表示詞串AB之間的相關(guān)度,也稱(chēng)MIk值.特殊地,當(dāng)k=1時(shí),MIk算法即為MI算法[9,10].我們分別對(duì)k值在1~10之間的取值做了實(shí)驗(yàn),得到當(dāng)k=2或3時(shí),分詞效果有比較明顯地提高,k的取值對(duì)分詞準(zhǔn)確率的影響見(jiàn)第3節(jié)實(shí)驗(yàn).

    MIk算法的壯文分詞思路:對(duì)于每一個(gè)由四個(gè)單詞組成的壯文詞串序列xABy,計(jì)算中間兩個(gè)單詞串AB和前面兩個(gè)單詞串xA的MIk值的平均值average1以及中間兩個(gè)單詞串AB和后面兩個(gè)單詞串By的MIk值的平均值average2.計(jì)算公式如下:

    (3)

    (4)

    對(duì)于詞串序列xABy,如果滿足:

    MIk(A,B)>MIk(x,A)+average1,

    (5)

    MIk(A,B)>MIk(B,y)+average2,

    (6)

    則認(rèn)為詞串AB能構(gòu)成獨(dú)立語(yǔ)義詞或者是獨(dú)立語(yǔ)義詞組成的一部分的概率較大;否則,認(rèn)為單詞AB是各自成詞或者是詞的邊界的概率較大.

    1.3 改進(jìn)互信息算法MIk的優(yōu)勢(shì)及局限性

    從互信息的計(jì)算公式(1)和(2)可知,互信息考慮的是相鄰單詞之間的內(nèi)部結(jié)合強(qiáng)度,與上下文無(wú)關(guān),反映了單詞之間的靜態(tài)結(jié)合能力.實(shí)驗(yàn)發(fā)現(xiàn),改進(jìn)的互信息方法不僅能夠有效過(guò)濾掉低頻詞的垃圾詞串,還能夠更好地保證由多個(gè)單詞組成的長(zhǎng)詞串語(yǔ)義詞不被遺漏,像“it rangh it loh”(一帶一路)等這樣的新詞串能夠更好地提取出來(lái),但同時(shí)也存在不足的地方,在連接詞的切分準(zhǔn)確度較低.例如“caenleix caeuq fazcanj”(真理和發(fā)展),MIk算法把這三個(gè)單詞組合當(dāng)作一個(gè)獨(dú)立的語(yǔ)義詞,因?yàn)檫@三個(gè)單詞組合的頻度較高,它只考慮了單詞間的靜態(tài)結(jié)合,但沒(méi)有考慮上下文單詞之間結(jié)合趨勢(shì).而正確的分詞結(jié)果應(yīng)該以中間的連詞“caeuq”為邊界切分成三個(gè)詞.因此,如果能有一種能夠衡量上下文單詞間的動(dòng)態(tài)結(jié)合趨勢(shì)的方法,來(lái)彌補(bǔ)互信息這種靜態(tài)結(jié)合的局限性,分詞的準(zhǔn)確性將會(huì)提高.

    2 TD-MIk混合算法的壯文分詞

    2.1 t-測(cè)試差

    為尋找一種能夠衡量壯文上下文單詞間的動(dòng)態(tài)結(jié)合趨勢(shì)的方法,我們首次采用t-測(cè)試差對(duì)壯文進(jìn)行分詞.Church[11]等首次引入t-測(cè)試,以度量一個(gè)英文單詞A與其它任意兩個(gè)單詞x和y的結(jié)合緊密程度.根據(jù)定義,壯文單詞串xyz的t-測(cè)試值如下公式所示:

    (7)

    其中p(y|x),p(z|y)分別是y關(guān)于x,z關(guān)于y的條件概率,σ2(p(y|x)),σ2(p(z|y))代表各自的方差.由t-測(cè)試值的定義可知:若tx,z(y)>0,則y與后繼z的結(jié)合強(qiáng)度大于與前驅(qū)x的結(jié)合強(qiáng)度,此時(shí)y應(yīng)與x分開(kāi),而與z組詞;若tx,z(y)=0,則無(wú)法判斷y要與哪個(gè)分開(kāi)或者組詞;若tx,z(y)<0,則y與前驅(qū)x的結(jié)合強(qiáng)度大于與后繼z的結(jié)合強(qiáng)度,此時(shí)y應(yīng)與z分開(kāi),而與x組詞.

    t-測(cè)試是基于字的統(tǒng)計(jì)量,而不是基于字間位置,因此為了能夠在漢文分詞中直接用來(lái)計(jì)算相鄰字間連斷概率,清華大學(xué)孫茂松教授等人提出了t-測(cè)試差的概念[12].根據(jù)定義,對(duì)于壯文單詞串xABY,相鄰單詞A,B之間的t-測(cè)試差值計(jì)算如下所示:

    TD(A,B)=tx,B(A)-tA,y(B).

    (8)

    當(dāng)TD(A,B)>T(T為閾值)時(shí),AB的單詞間位置更傾向于連,反之傾向于斷.與互信息不同,t-測(cè)試差考慮的是單詞之間的相對(duì)結(jié)合強(qiáng)度,是一個(gè)單詞與上下文的結(jié)合趨向,反映了相鄰單詞之間的動(dòng)態(tài)結(jié)合能力.從分詞的結(jié)果發(fā)現(xiàn),t-測(cè)試差方法在連接詞的切分準(zhǔn)確度更高,例如“caenleix caeuq fazcanj”(真理和發(fā)展),t-測(cè)試差能夠?qū)⑦@個(gè)詞串分成3個(gè)詞.

    2.2 TD-MIk混合算法

    從前面的分析中可以知道,互信息反映的是單詞之間的靜態(tài)結(jié)合能力,而t-測(cè)試差反映的是單詞之間的動(dòng)態(tài)結(jié)合能力,兩種方法在壯文的分詞中各有優(yōu)勢(shì),但各自又存在局限性.例如:改進(jìn)互信息MIk方法能夠準(zhǔn)確提取“it rangh it loh”(一帶一路)等這樣的新詞串,而t-測(cè)試差方法不能;t-測(cè)試差方法能夠準(zhǔn)確地把“caenleix caeuq fazcanj”(真理和發(fā)展)切分成三個(gè)詞,而改進(jìn)互信息MIk方法不能.因此,如果能夠把互信息和t-測(cè)試差這兩個(gè)統(tǒng)計(jì)原理相結(jié)合,起到互補(bǔ)效果的可行性極大.鑒于此,我們將改進(jìn)的互信息方法MIk與t-測(cè)試差相結(jié)合發(fā)現(xiàn),該方法能夠在一定程度起到互補(bǔ)的作用,既能提取“it rangh it loh”,又能將“caenleix caeuq fazcanj”正確切分成三個(gè)詞.MIk與t-測(cè)試差組合的TD-MIk的混合算法的計(jì)算公式如下:

    TD-MIk(A,B)=α*TD(A,B)+β*Mlk(A,B),

    (9)

    其中,α、β分別是t-測(cè)試差和MIk算法的權(quán)重因子,它們的和為1,具體取值見(jiàn)下一節(jié)實(shí)驗(yàn)判斷合適的取值.

    TD-MIk混合算法的分詞思路:對(duì)于壯文單詞串xABy,計(jì)算中間詞串AB的TD-MIk的值,當(dāng)TD-MIk(A,B)>T(T為閾值)時(shí),則認(rèn)為詞串AB能構(gòu)成獨(dú)立語(yǔ)義詞或者是獨(dú)立語(yǔ)義詞組成的一部分的概率較大;否則,認(rèn)為詞串AB是各自成詞或者是詞的邊界的概率較大.TD-MIk(A,B)既能在TD(A,B)和MIk(A,B)兩者判斷一致時(shí)保持判斷不變,又能在兩者判斷不一致時(shí),在一定程度上得到互補(bǔ).例如:“caeuq fazcanj”的MIk值為-5.97,判斷為連,而TD值為-9.78,判斷為斷,混合后的TD-MIk值為-8.26,判斷為斷,把兩個(gè)單詞切分開(kāi).

    3 實(shí)驗(yàn)與分析

    3.1 實(shí)驗(yàn)數(shù)據(jù)集

    為了驗(yàn)證算法的可行性及準(zhǔn)確率,從人民網(wǎng)壯文版搜集所有壯文文本,隨機(jī)選取一組文章作為測(cè)試文本,并以中國(guó)民族語(yǔ)文翻譯局的翻譯系統(tǒng)為輔助工具,對(duì)測(cè)試文本做人工標(biāo)記.壯文文本訓(xùn)練語(yǔ)料的大小約為2.8MB,主要為政府工作報(bào)告文章及政治新聞文章.

    3.2 評(píng)價(jià)指標(biāo)

    本文采用準(zhǔn)確率、召回率和F值3個(gè)指標(biāo)來(lái)衡量分詞算法的性能,計(jì)算公式如下:

    (10)

    (11)

    (12)

    其中,切分結(jié)果正確的詞數(shù)(C1)是指測(cè)試文本根據(jù)分詞算法切分后切分正確的詞數(shù);切分結(jié)果的總詞數(shù)(C2)是指測(cè)試文本根據(jù)分詞算法切分后得到的總詞數(shù);分詞后應(yīng)得到的總詞數(shù)(C3)是指測(cè)試文本人工切分后得到的總詞數(shù);F值反應(yīng)的是根據(jù)準(zhǔn)確率和召回率得出的算法的綜合性能指標(biāo).

    3.3 實(shí)驗(yàn)及結(jié)果分析

    使用C++語(yǔ)言,Visual Studio 2015為實(shí)驗(yàn)工具,對(duì)壯文進(jìn)行分詞實(shí)驗(yàn).對(duì)于改進(jìn)互信息MIk算法中,k值的選取與準(zhǔn)確率變化的趨勢(shì)圖如圖2所示.

    圖2 隨著k值變化的準(zhǔn)確率變化趨勢(shì)Fig.2 The change tendency of accuracy with the change of k value

    從圖2中可以看出,當(dāng)k=2或3時(shí),分詞準(zhǔn)確率有比較明顯的提高.

    在TD-MIk混合算法中α、β的取值實(shí)驗(yàn)如圖3所示.

    圖3 隨著α值變化的準(zhǔn)確率變化趨勢(shì)Fig.3 The change tendency of accuracy with the change of alpha value

    圖3中α是t-測(cè)試差的權(quán)重因子,相應(yīng)的MIk算法的權(quán)重因子β值為1-α.從圖中可看出當(dāng)α=0.6時(shí)為圖中曲線波峰,分詞的準(zhǔn)確率最高.

    分別用傳統(tǒng)分詞方法、改進(jìn)互信息的MIk算法、基于t-測(cè)試差算法以及TD-MIk混合算法對(duì)測(cè)試文本進(jìn)行切分得到四種詞匯表,如表1所示.其中,測(cè)試文本分詞后應(yīng)得到的總詞數(shù)即人工切分后得到的總詞數(shù)C3為9384.

    表1 不同分詞方法對(duì)應(yīng)切分結(jié)果詞匯表

    從表1可以看出傳統(tǒng)的分詞方法將文本集中大約25%的單詞組合而成的語(yǔ)義詞拆分成單個(gè)單詞,而這種多個(gè)單詞的組合將會(huì)表達(dá)一個(gè)具體而獨(dú)立的語(yǔ)義信息,包括一些人名、成語(yǔ)、專(zhuān)有名詞等,拆分成多個(gè)單詞將會(huì)喪失這種單詞組合所要表達(dá)的完整語(yǔ)義信息.因此,用傳統(tǒng)分詞方法獲取的單詞就難以在文本標(biāo)引中發(fā)揮詞的作用,相應(yīng)的各種文本處理效果也會(huì)受到消極影響.相比較而言,使用改進(jìn)互信息的MIk算法、基于t-測(cè)試差算法以及TD-MIk混合算法作為分詞算法所獲得的詞語(yǔ)不止有單個(gè)詞,還有雙詞、三詞、四詞,這樣的詞就能更好的表達(dá)完整的語(yǔ)義信息,構(gòu)成更能表達(dá)文本信息的語(yǔ)義詞,這將有助于提升各種文本處理的效果.例如,在文本的主題詞提取中,一般的主題詞都是由多個(gè)單詞組合而成的,這樣就有效地提高了主題詞提取的準(zhǔn)確性.表2中列舉了2個(gè)例句的分詞實(shí)驗(yàn)結(jié)果.

    表2 分詞實(shí)驗(yàn)結(jié)果舉例

    表2的第一個(gè)例句中的“diuz roen seicouz”(絲綢之路)由3個(gè)單詞組成一個(gè)專(zhuān)有名詞,是不可分割的,實(shí)驗(yàn)結(jié)果表明本文使用的分詞算法能夠正確地把這單詞組合切分出來(lái).此外,壯文在某些方面與漢文有很大的相似性,漢文方面,兩個(gè)單一的字組合成一個(gè)詞語(yǔ),例如“建設(shè)”是一個(gè)詞語(yǔ);在壯文方面,第二個(gè)例句中的“l(fā)ai guek”(多國(guó)),也是由兩個(gè)單詞組合成一個(gè)詞語(yǔ),把這樣的單詞組合切分出來(lái)對(duì)后續(xù)的機(jī)器翻譯或者信息檢索等都有很大的促進(jìn)作用.顯然,本文使用的分詞算法很好的切分出壯文句子中獨(dú)立而完整的語(yǔ)義詞,且切分效果也是令人滿意的.

    本文使用的幾種分詞方法由于分詞的策略不同,在分詞的效果上也有差異.不同分詞方法的分詞效果差異對(duì)比如表3所示.

    表3 分詞方法效果對(duì)比

    從表3可以看出,本文使用的分詞方法都能得到較高的準(zhǔn)確率和召回率,對(duì)應(yīng)的F值也較高.互信息反映的是單詞之間的靜態(tài)結(jié)合能力,而t-測(cè)試差反映的是單詞之間的動(dòng)態(tài)結(jié)合能力,兩者都各有優(yōu)勢(shì),t-測(cè)試差的分詞準(zhǔn)確率相比改進(jìn)互信息MIk方法稍微好一些,而TD-MIk混合算法則結(jié)合兩者的特點(diǎn),分詞的準(zhǔn)確率和召回率分別提高了3.77%和4.7%.

    4 結(jié)語(yǔ)

    本文分析了壯文文本中多個(gè)單詞組合所表達(dá)的完整而獨(dú)立的語(yǔ)義信息,以及傳統(tǒng)壯文分詞方法對(duì)這種完整而獨(dú)立的語(yǔ)義信息的破壞,同時(shí)在各種文本信息處理中所獲得的結(jié)果不令人滿意.為了能夠更好地提取文本中的這種能夠更好的表達(dá)完整的語(yǔ)義信息的語(yǔ)義詞,在使用互信息MI方法來(lái)度量壯文相鄰單詞間關(guān)聯(lián)程度的基礎(chǔ)上,提出一種基于互信息改進(jìn)算法MIk和t-測(cè)試差相結(jié)合的TD-MIk混合算法對(duì)壯文文本分詞,并用準(zhǔn)確率、召回率和F值對(duì)分詞結(jié)果進(jìn)行評(píng)價(jià).實(shí)驗(yàn)表明本文的分詞算法的分詞結(jié)果得到較高的準(zhǔn)確率和召回率,能夠較準(zhǔn)確而有效地提取文本中的語(yǔ)義詞,提出的TD-MIk混合算法也有效地提高了分詞的準(zhǔn)確率.另外,由于目前網(wǎng)上的壯文文本大都是政府工作報(bào)告文章和政治類(lèi)新聞文章,所以本文的分詞算法在對(duì)在政府工作報(bào)告和政治類(lèi)壯文文本的分詞效果相對(duì)較好,該分詞算法同樣也適用于壯文的其他各類(lèi)文本.

    [1] 韋景云,覃曉航.狀語(yǔ)通論[M].北京:中央民族大學(xué)出版社,2006:3-110.

    [2] 劉連芳,顧 林,黃家裕,等. 壯文與壯文信息處理[J]. 中文信息學(xué)報(bào),2011,25(6):175-182.

    [3] 趙秦怡,王麗珍. 一種基于互信息的串掃描中文文本分詞方法[J]. 情報(bào)雜志,2010,29(7):161-162.

    [4] Min K, Ma C, Zhao T,et al. BosonNLP: An ensemble approach for word segmentation and POS tagging[C]// Springer. The 4th CCF Conference on Natural Language Processing and Chinese Computing (NLPCC2015).Berlin: Springer, 2015:520-526.

    [5] 吐?tīng)柕亍ね泻咸?艾克白爾·帕塔爾,艾斯卡爾·艾木都拉. 基于互信息的維吾爾文自適應(yīng)組詞算法[J]. 計(jì)算機(jī)應(yīng)用研究,2013,30(2):429-431.

    [6] 吐?tīng)柕亍ね泻咸?艾克白爾·帕塔爾,艾斯卡爾·艾木都拉. 語(yǔ)義詞特征提取及其在維吾爾文文本分類(lèi)中的應(yīng)用[J]. 中文信息學(xué)報(bào),2014,28(4):140-144.

    [7] Bouma G. Normalized (pointwise) mutual information in collocation extraction [C]// UIMA. Proceedings of German Society for Computational Linguistics (GSCL 2009), Potsdam:UIMA, 2009: 31-40.

    [8] Pazienza M, Pennacchiotti M, Zanzotto F. Terminology extraction: an analysis of linguistic and statistical approaches[J]. Springer Berlin Heidelberg, 2005,185: 255-279.

    [9] 杜麗萍,李曉戈,于 根,等. 基于互信息改進(jìn)算法的新詞發(fā)現(xiàn)對(duì)中文分詞系統(tǒng)改進(jìn)[J]. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,52(1):35-40.

    [10] 杜麗萍,李曉戈,周元哲,等. 互信息改進(jìn)方法在術(shù)語(yǔ)抽取中的應(yīng)用[J]. 計(jì)算機(jī)應(yīng)用,2015,35(4):996-1000.

    [11] Church K W, Gale W, Hanks P, et al. Using Statistics in Lexical Analysis[M].Hillsdale NJ :Lawrence Erlbaum Associates,1991:115-164.

    [12] 孫茂松,肖 明,鄒嘉彥. 基于無(wú)指導(dǎo)學(xué)習(xí)策略的無(wú)詞表?xiàng)l件下的漢語(yǔ)自動(dòng)分詞[J]. 計(jì)算機(jī)學(xué)報(bào),2004,27(6):736-742.

    The traditional method of Zhuangwen word segmentation is to use the space between words as a separation mark.But in most cases, the word segmentation method will destroy multiple words association combination of semantic words which express the complete and independent semantic information. For the first time we use the mutual information to improve algorithm MIkandt-test difference in Zhuangwen text word segmentation that based on the use of mutual information MI method to measure the degree of correlation between adjacent words, and combine with the two in the evaluation of adjacent words’static binding ability and dynamic binding ability, a TD-MIkhybrid algorithm based on the MIkandt-test difference is proposed. The segmentation effects of MIk,t-test difference and TD-MIkhybrid algorithm are compared. We use the text set on the People′s network in Zhuangwen as a training and test corpus to do the experiments. The experimental results show that the three segmentation methods can extract the semantic words in text accurately and efficiently,and TD-MIkhybrid algorithm has the highest accuracy of word segmentation .

    zhuangwen word segmentation;MI improved algorithm;t-test difference;hybrid algorithm;semantic word

    2017-09-01 *

    易云飛,研究方向:智能計(jì)算,E-mail:gxyiyf@163.com

    覃 俊(1968-),女,教授,博士,研究方向:智能優(yōu)化、數(shù)據(jù)挖掘,E-mail:498011695@qq.com

    國(guó)家科技支撐計(jì)劃項(xiàng)目子課題(2015BAD29B01);中南民族大學(xué)研究生學(xué)術(shù)創(chuàng)新基金項(xiàng)目(2017sycxjj051)

    TP391

    A

    1672-4321(2017)04-0100-06

    ResearchonZhuangwenWordSegmentationAlgorithmBasedonMutualInformationImprovedAlgorithmandt-testDifference

    QinJun1,LinYechuan1,YiYunfei2

    (1 College of Computer Science,South-Central University for Nationalities,Wuhan 430074, China;

    2 College of Computer and Information Engineering, Hechi University, Yizhou 546300,China)

    猜你喜歡
    詞串互信息分詞
    靈動(dòng)的詞串,寫(xiě)話的紐帶
    結(jié)巴分詞在詞云中的應(yīng)用
    報(bào)紙新聞標(biāo)題中的“熱詞群”和“熱詞串”
    新聞傳播(2018年15期)2018-09-18 03:19:58
    值得重視的分詞的特殊用法
    美語(yǔ)口語(yǔ)詞串You Know What探析
    基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
    聯(lián)合互信息水下目標(biāo)特征選擇算法
    改進(jìn)的互信息最小化非線性盲源分離算法
    基于增量式互信息的圖像快速匹配方法
    高考分詞作狀語(yǔ)考點(diǎn)歸納與疑難解析
    在线观看午夜福利视频| 国语自产精品视频在线第100页| 麻豆av在线久日| 人人妻,人人澡人人爽秒播| av黄色大香蕉| 免费看十八禁软件| 欧美又色又爽又黄视频| av片东京热男人的天堂| 麻豆成人av在线观看| 桃色一区二区三区在线观看| 日本a在线网址| 久久精品夜夜夜夜夜久久蜜豆| 欧美日本视频| 最近在线观看免费完整版| 久久久久久九九精品二区国产| 午夜精品久久久久久毛片777| 草草在线视频免费看| 麻豆成人av在线观看| 99热精品在线国产| 精品一区二区三区视频在线 | 日本免费a在线| 天堂√8在线中文| 18禁国产床啪视频网站| 精华霜和精华液先用哪个| 国内少妇人妻偷人精品xxx网站 | 久久香蕉国产精品| 久久精品国产亚洲av香蕉五月| 欧美av亚洲av综合av国产av| 日本五十路高清| 黄色 视频免费看| 亚洲精品一卡2卡三卡4卡5卡| 在线观看舔阴道视频| 高潮久久久久久久久久久不卡| 精品无人区乱码1区二区| 欧美日韩乱码在线| 男女下面进入的视频免费午夜| 全区人妻精品视频| 最新美女视频免费是黄的| 一级作爱视频免费观看| 久久香蕉国产精品| 99视频精品全部免费 在线 | 欧美一级a爱片免费观看看| 精品熟女少妇八av免费久了| av在线天堂中文字幕| 日韩 欧美 亚洲 中文字幕| 成年女人看的毛片在线观看| 国产激情欧美一区二区| 日本撒尿小便嘘嘘汇集6| 少妇裸体淫交视频免费看高清| 国产视频一区二区在线看| 国产探花在线观看一区二区| 一级作爱视频免费观看| 国产黄色小视频在线观看| 午夜a级毛片| 国产爱豆传媒在线观看| 999久久久精品免费观看国产| 日韩精品中文字幕看吧| 少妇的逼水好多| 免费观看精品视频网站| 色av中文字幕| 精品一区二区三区四区五区乱码| 午夜精品在线福利| 我要搜黄色片| a级毛片a级免费在线| 久久精品影院6| 久久久国产精品麻豆| 久久久国产精品麻豆| 国产91精品成人一区二区三区| 久久久国产欧美日韩av| 国产野战对白在线观看| 亚洲国产高清在线一区二区三| 国产精品1区2区在线观看.| 成人一区二区视频在线观看| 97超级碰碰碰精品色视频在线观看| 免费在线观看亚洲国产| 欧美乱妇无乱码| 99精品在免费线老司机午夜| 亚洲最大成人中文| 久久人妻av系列| 99热这里只有精品一区 | 亚洲第一欧美日韩一区二区三区| 老司机午夜十八禁免费视频| 午夜精品在线福利| tocl精华| 国模一区二区三区四区视频 | 亚洲av片天天在线观看| 91老司机精品| 长腿黑丝高跟| 国产视频一区二区在线看| 亚洲国产欧美网| 天天添夜夜摸| 国产精品综合久久久久久久免费| 亚洲国产色片| 亚洲黑人精品在线| www.www免费av| 精品乱码久久久久久99久播| 日韩 欧美 亚洲 中文字幕| 最好的美女福利视频网| 国产视频一区二区在线看| 亚洲熟女毛片儿| 亚洲最大成人中文| 欧美乱色亚洲激情| 国产成+人综合+亚洲专区| 真人做人爱边吃奶动态| 国产高清videossex| xxxwww97欧美| 18禁黄网站禁片午夜丰满| 精品午夜福利视频在线观看一区| 亚洲成人精品中文字幕电影| 免费看光身美女| 欧美黑人巨大hd| 悠悠久久av| 无限看片的www在线观看| 国产精品一区二区免费欧美| 亚洲男人的天堂狠狠| 国产69精品久久久久777片 | 97超视频在线观看视频| 久久久久久久久中文| 黄色丝袜av网址大全| 久久草成人影院| 欧美成狂野欧美在线观看| 丝袜人妻中文字幕| 国产精品香港三级国产av潘金莲| 一级a爱片免费观看的视频| 脱女人内裤的视频| 国产又黄又爽又无遮挡在线| 99热这里只有精品一区 | 亚洲五月婷婷丁香| 18禁美女被吸乳视频| 国产av不卡久久| 99热只有精品国产| 国内精品美女久久久久久| 亚洲午夜精品一区,二区,三区| 亚洲欧美日韩高清在线视频| 色av中文字幕| 首页视频小说图片口味搜索| 热99re8久久精品国产| 好男人在线观看高清免费视频| 岛国在线免费视频观看| 国产精品精品国产色婷婷| 久久香蕉国产精品| 他把我摸到了高潮在线观看| av欧美777| 搡老岳熟女国产| 99久久久亚洲精品蜜臀av| 亚洲最大成人中文| 天天一区二区日本电影三级| 成人一区二区视频在线观看| 免费在线观看日本一区| 精品久久久久久久久久免费视频| 一卡2卡三卡四卡精品乱码亚洲| 精品欧美国产一区二区三| 国产成人影院久久av| 国产亚洲精品久久久久久毛片| 亚洲av熟女| 亚洲av日韩精品久久久久久密| 久久香蕉国产精品| 久久香蕉国产精品| 美女黄网站色视频| 亚洲成人中文字幕在线播放| av国产免费在线观看| 亚洲成人中文字幕在线播放| 久久香蕉精品热| 不卡av一区二区三区| 一本综合久久免费| 搡老熟女国产l中国老女人| 久久精品亚洲精品国产色婷小说| 国产激情偷乱视频一区二区| 中出人妻视频一区二区| 18禁黄网站禁片午夜丰满| 国产精品美女特级片免费视频播放器 | 国产激情偷乱视频一区二区| 日日夜夜操网爽| 香蕉久久夜色| 在线观看免费视频日本深夜| 亚洲欧美日韩无卡精品| 美女cb高潮喷水在线观看 | 女人被狂操c到高潮| 少妇的丰满在线观看| 在线观看免费午夜福利视频| 麻豆国产av国片精品| 中国美女看黄片| 午夜免费激情av| 亚洲七黄色美女视频| 我要搜黄色片| 国产精品,欧美在线| 日韩中文字幕欧美一区二区| 91老司机精品| 国产日本99.免费观看| 国产麻豆成人av免费视频| 国产欧美日韩一区二区精品| 亚洲欧美日韩高清专用| 欧美zozozo另类| 欧美zozozo另类| 久久久久九九精品影院| 亚洲国产欧美一区二区综合| 狠狠狠狠99中文字幕| 色播亚洲综合网| 日本a在线网址| 精品无人区乱码1区二区| 国产亚洲av嫩草精品影院| 国产v大片淫在线免费观看| 国产精品亚洲av一区麻豆| 国产日本99.免费观看| 国产69精品久久久久777片 | 一二三四在线观看免费中文在| 黑人操中国人逼视频| 亚洲专区字幕在线| 亚洲色图av天堂| av天堂中文字幕网| 国产精品国产高清国产av| 日韩国内少妇激情av| 天堂影院成人在线观看| 国产v大片淫在线免费观看| 老司机午夜福利在线观看视频| xxxwww97欧美| 精品日产1卡2卡| 免费看日本二区| 国产亚洲欧美98| 亚洲国产精品久久男人天堂| 国产成人av激情在线播放| 欧美国产日韩亚洲一区| 中文在线观看免费www的网站| 级片在线观看| 亚洲人成网站高清观看| 人妻丰满熟妇av一区二区三区| 一区二区三区国产精品乱码| 一级毛片精品| 人人妻人人看人人澡| 国产伦精品一区二区三区四那| 精品一区二区三区av网在线观看| 亚洲在线自拍视频| 精品久久久久久久人妻蜜臀av| 中文字幕高清在线视频| 婷婷亚洲欧美| 又紧又爽又黄一区二区| 精品国产超薄肉色丝袜足j| 精品一区二区三区视频在线观看免费| 午夜激情欧美在线| 热99在线观看视频| 国产精品一及| 国产精品一区二区三区四区久久| 久久精品综合一区二区三区| 国产成人福利小说| 日本免费a在线| 国产黄色小视频在线观看| 精品久久久久久久末码| 男插女下体视频免费在线播放| 欧美日韩一级在线毛片| 欧美色视频一区免费| 在线观看日韩欧美| 亚洲国产色片| 美女高潮的动态| 日韩欧美国产在线观看| 日本三级黄在线观看| 国产精品一区二区免费欧美| 国产激情偷乱视频一区二区| 一级毛片高清免费大全| 欧美日韩国产亚洲二区| www日本在线高清视频| 成人精品一区二区免费| 欧美乱色亚洲激情| 欧美日本视频| av天堂中文字幕网| 99久久久亚洲精品蜜臀av| 最好的美女福利视频网| 亚洲国产看品久久| 亚洲av美国av| 亚洲国产欧美人成| 日本a在线网址| 男人和女人高潮做爰伦理| 热99re8久久精品国产| 精品日产1卡2卡| 久久久精品大字幕| netflix在线观看网站| 欧美不卡视频在线免费观看| 亚洲成人久久性| 精品久久久久久,| АⅤ资源中文在线天堂| 国产一区二区三区在线臀色熟女| 69av精品久久久久久| 精品欧美国产一区二区三| 欧美丝袜亚洲另类 | 啪啪无遮挡十八禁网站| 午夜精品久久久久久毛片777| 亚洲男人的天堂狠狠| 亚洲成av人片在线播放无| 国产99白浆流出| 国产不卡一卡二| 久久久久久久午夜电影| 嫁个100分男人电影在线观看| 久久精品国产99精品国产亚洲性色| 啦啦啦韩国在线观看视频| 国语自产精品视频在线第100页| 久久久国产欧美日韩av| 久久久久久国产a免费观看| 成年人黄色毛片网站| 99热这里只有精品一区 | 国产三级在线视频| 国内毛片毛片毛片毛片毛片| 青草久久国产| 成人亚洲精品av一区二区| 国产精品亚洲美女久久久| 999久久久国产精品视频| 国产精品一区二区三区四区久久| 俺也久久电影网| 91麻豆av在线| 好看av亚洲va欧美ⅴa在| 亚洲中文字幕一区二区三区有码在线看 | 麻豆成人av在线观看| 亚洲成人中文字幕在线播放| 最近最新免费中文字幕在线| 成年女人毛片免费观看观看9| 91九色精品人成在线观看| 97碰自拍视频| 国产一区二区激情短视频| 后天国语完整版免费观看| 久久人妻av系列| 又紧又爽又黄一区二区| 啦啦啦韩国在线观看视频| 国产亚洲av高清不卡| 久久精品aⅴ一区二区三区四区| 国产成人精品无人区| svipshipincom国产片| 国产伦一二天堂av在线观看| 日韩欧美国产一区二区入口| 久久久久久国产a免费观看| 午夜福利在线观看吧| 午夜福利成人在线免费观看| 欧美乱码精品一区二区三区| 好男人电影高清在线观看| 天堂√8在线中文| 成人av在线播放网站| 99热这里只有是精品50| 国内少妇人妻偷人精品xxx网站 | 在线国产一区二区在线| 欧美在线黄色| 性色avwww在线观看| 男女那种视频在线观看| 999久久久国产精品视频| 听说在线观看完整版免费高清| 91麻豆av在线| 国产视频一区二区在线看| 日本精品一区二区三区蜜桃| 日本一二三区视频观看| 亚洲国产欧美网| 最好的美女福利视频网| 久久久久久久精品吃奶| 国产精品永久免费网站| 亚洲一区二区三区色噜噜| 国产亚洲欧美在线一区二区| 狂野欧美白嫩少妇大欣赏| 黑人操中国人逼视频| 国产成人系列免费观看| 99国产精品一区二区蜜桃av| 欧洲精品卡2卡3卡4卡5卡区| 网址你懂的国产日韩在线| 国内揄拍国产精品人妻在线| 一个人观看的视频www高清免费观看 | 日本一二三区视频观看| 中文字幕av在线有码专区| 久久亚洲精品不卡| 国模一区二区三区四区视频 | 国产精品久久久久久精品电影| 毛片女人毛片| 九色国产91popny在线| 国产99白浆流出| 国产成人福利小说| 免费在线观看亚洲国产| 91九色精品人成在线观看| 亚洲国产精品sss在线观看| 久久久久久久精品吃奶| 国内久久婷婷六月综合欲色啪| 婷婷亚洲欧美| 免费av毛片视频| 黄片大片在线免费观看| 中文字幕久久专区| 国产乱人视频| 久久久久久久午夜电影| 国产视频内射| 日本熟妇午夜| 久久精品国产亚洲av香蕉五月| 男人的好看免费观看在线视频| 国产在线精品亚洲第一网站| 国产一区二区三区视频了| 欧美黄色片欧美黄色片| 久久午夜亚洲精品久久| 欧美最黄视频在线播放免费| 亚洲中文字幕日韩| 琪琪午夜伦伦电影理论片6080| aaaaa片日本免费| 欧美日韩精品网址| 国产成年人精品一区二区| 成人av在线播放网站| 99久久99久久久精品蜜桃| 国产男靠女视频免费网站| 制服丝袜大香蕉在线| 久久久久国产一级毛片高清牌| 成人永久免费在线观看视频| 少妇丰满av| 男人的好看免费观看在线视频| 国产1区2区3区精品| 老熟妇仑乱视频hdxx| 国产一区在线观看成人免费| 日日干狠狠操夜夜爽| tocl精华| 脱女人内裤的视频| 国产高潮美女av| 亚洲精品色激情综合| 亚洲国产色片| 久久久久免费精品人妻一区二区| 美女午夜性视频免费| 嫩草影院入口| 91麻豆精品激情在线观看国产| 夜夜爽天天搞| 99精品在免费线老司机午夜| 亚洲成人精品中文字幕电影| 亚洲国产精品成人综合色| 国产aⅴ精品一区二区三区波| 国产乱人视频| 国产高清有码在线观看视频| 国产av一区在线观看免费| 人妻夜夜爽99麻豆av| 搡老妇女老女人老熟妇| 国产激情偷乱视频一区二区| 国产高清激情床上av| 亚洲五月婷婷丁香| 99国产精品99久久久久| 国产精品香港三级国产av潘金莲| 美女高潮的动态| 国产精品亚洲美女久久久| 90打野战视频偷拍视频| 国产探花在线观看一区二区| 国产欧美日韩一区二区三| 中出人妻视频一区二区| 精品人妻1区二区| 久久性视频一级片| 久久国产精品人妻蜜桃| 免费在线观看影片大全网站| 免费看美女性在线毛片视频| 色av中文字幕| 在线观看66精品国产| 综合色av麻豆| 在线观看免费午夜福利视频| 久久久久久久久免费视频了| 国产精品99久久99久久久不卡| 黄色女人牲交| 成人性生交大片免费视频hd| 不卡av一区二区三区| 在线免费观看的www视频| 日本黄色片子视频| 亚洲人成网站在线播放欧美日韩| 久久精品综合一区二区三区| 99久久成人亚洲精品观看| 国产精品久久久久久亚洲av鲁大| 99久久无色码亚洲精品果冻| 免费在线观看日本一区| 国产不卡一卡二| 亚洲色图 男人天堂 中文字幕| 欧美乱码精品一区二区三区| 久久中文看片网| 色视频www国产| 999久久久精品免费观看国产| 国产精品1区2区在线观看.| 精华霜和精华液先用哪个| 久久九九热精品免费| 9191精品国产免费久久| 香蕉av资源在线| 欧美色欧美亚洲另类二区| 亚洲成人免费电影在线观看| 黄频高清免费视频| 麻豆一二三区av精品| 久久久成人免费电影| 国内精品久久久久久久电影| 国产99白浆流出| 夜夜爽天天搞| 成人高潮视频无遮挡免费网站| 听说在线观看完整版免费高清| 亚洲在线自拍视频| av欧美777| aaaaa片日本免费| 亚洲熟女毛片儿| av视频在线观看入口| 色综合婷婷激情| 欧美黑人欧美精品刺激| 欧美极品一区二区三区四区| 人妻夜夜爽99麻豆av| 色播亚洲综合网| 国产亚洲精品一区二区www| 变态另类丝袜制服| 精品国内亚洲2022精品成人| 黄色女人牲交| 老司机午夜福利在线观看视频| 亚洲 国产 在线| 日本一二三区视频观看| 无限看片的www在线观看| 亚洲中文av在线| 91老司机精品| 国产蜜桃级精品一区二区三区| 欧美中文日本在线观看视频| 国产爱豆传媒在线观看| 国产精品久久视频播放| www日本在线高清视频| 久久久精品欧美日韩精品| 两个人看的免费小视频| 日韩 欧美 亚洲 中文字幕| 欧美色欧美亚洲另类二区| 老熟妇仑乱视频hdxx| 毛片女人毛片| 小说图片视频综合网站| 久久久久久久精品吃奶| 国产伦在线观看视频一区| 综合色av麻豆| 可以在线观看毛片的网站| 国产欧美日韩一区二区三| 老司机福利观看| 久久久国产欧美日韩av| 很黄的视频免费| 大型黄色视频在线免费观看| 国产麻豆成人av免费视频| 国产99白浆流出| 黄片大片在线免费观看| 国产极品精品免费视频能看的| 亚洲色图 男人天堂 中文字幕| 1000部很黄的大片| 国产淫片久久久久久久久 | 亚洲美女视频黄频| 99久国产av精品| 午夜免费成人在线视频| 美女 人体艺术 gogo| 国产精品综合久久久久久久免费| 国产亚洲精品久久久com| 国产亚洲精品久久久久久毛片| 免费搜索国产男女视频| 亚洲最大成人中文| 制服丝袜大香蕉在线| 国产成+人综合+亚洲专区| 久久久精品欧美日韩精品| 真人做人爱边吃奶动态| 长腿黑丝高跟| 亚洲av成人精品一区久久| 欧美午夜高清在线| 亚洲国产精品久久男人天堂| 村上凉子中文字幕在线| 99久久国产精品久久久| 国产爱豆传媒在线观看| 久9热在线精品视频| 亚洲成人免费电影在线观看| 男女视频在线观看网站免费| 搞女人的毛片| 免费看美女性在线毛片视频| 9191精品国产免费久久| 国产亚洲欧美在线一区二区| 国产 一区 欧美 日韩| 国产精品久久久久久精品电影| 特大巨黑吊av在线直播| 无遮挡黄片免费观看| 99久久精品国产亚洲精品| 嫩草影视91久久| 国产成人一区二区三区免费视频网站| 国产一区二区三区视频了| 午夜免费激情av| 全区人妻精品视频| 美女cb高潮喷水在线观看 | 欧美日韩一级在线毛片| 好男人电影高清在线观看| 色视频www国产| 国产一区二区在线观看日韩 | 亚洲狠狠婷婷综合久久图片| 欧美乱色亚洲激情| 欧美在线一区亚洲| 国产黄片美女视频| 在线观看午夜福利视频| 亚洲成人免费电影在线观看| 一本一本综合久久| 黄色 视频免费看| 成人性生交大片免费视频hd| 成人av一区二区三区在线看| 非洲黑人性xxxx精品又粗又长| 999精品在线视频| 国产欧美日韩一区二区精品| 国产99白浆流出| 久久久国产成人免费| 两个人的视频大全免费| 精品熟女少妇八av免费久了| www.自偷自拍.com| 免费在线观看成人毛片| 男女午夜视频在线观看| av片东京热男人的天堂| 啦啦啦免费观看视频1| 亚洲av电影不卡..在线观看| 午夜a级毛片| 99久久成人亚洲精品观看| 91麻豆精品激情在线观看国产| 国产aⅴ精品一区二区三区波| 岛国视频午夜一区免费看| 免费在线观看日本一区| 成年女人永久免费观看视频| 在线国产一区二区在线| 免费大片18禁| 亚洲欧美日韩东京热| 欧美成人性av电影在线观看| 又黄又爽又免费观看的视频| 夜夜爽天天搞| 午夜两性在线视频| 好男人在线观看高清免费视频| 一进一出抽搐gif免费好疼| bbb黄色大片| 国产男靠女视频免费网站| 老司机午夜福利在线观看视频| 中文字幕人成人乱码亚洲影| 午夜成年电影在线免费观看| 欧美午夜高清在线| 国产精品一区二区免费欧美| 19禁男女啪啪无遮挡网站|