• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于文體和詞表的突發(fā)事件信息抽取研究

    2018-10-19 03:03:32邱奇志周三三劉長(zhǎng)發(fā)
    中文信息學(xué)報(bào) 2018年9期
    關(guān)鍵詞:詞表語料庫突發(fā)事件

    邱奇志,周三三,劉長(zhǎng)發(fā),陳 暉

    (武漢理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,湖北 武漢 430000)

    0 引言

    我國正處于經(jīng)濟(jì)和社會(huì)的轉(zhuǎn)型期,公共安全保障基礎(chǔ)相對(duì)薄弱,其與經(jīng)濟(jì)高速發(fā)展的矛盾日益突出,形勢(shì)嚴(yán)峻[1]。同時(shí)近年來在經(jīng)濟(jì)全球化、國際政治風(fēng)云多變的影響下,全球范圍內(nèi)各類突發(fā)事件頻發(fā),波及范圍廣,持續(xù)時(shí)間長(zhǎng),給社會(huì)和諧穩(wěn)定、人民幸福生活帶來了極大的危害,應(yīng)急管理亦因此引起了各級(jí)地方政府的高度重視和大力支持。

    相比于美、英、日、澳等國家領(lǐng)先的應(yīng)急管理能力,我國應(yīng)急管理尚處于初級(jí)建設(shè)階段,依然存在以下問題[2]: 管理體制不健全、運(yùn)行機(jī)制不成熟、原有的應(yīng)急工作基礎(chǔ)薄弱、救援力量及財(cái)力投入不足等。從信息處理的角度來看,解決應(yīng)急管理復(fù)雜性的根本方法就是建立涵蓋突發(fā)事件常識(shí)、經(jīng)典案例、相關(guān)決策、處置方法等內(nèi)容的突發(fā)事件知識(shí)系統(tǒng),其中突發(fā)事件案例庫和專家?guī)焓侵С謶?yīng)急管理決策的核心。[1]

    近年來,國內(nèi)學(xué)者已開展了突發(fā)事件案例庫的研究,邵荃等[3]從消防視角考慮了火災(zāi)基本情況、作戰(zhàn)指揮和災(zāi)后經(jīng)驗(yàn)三個(gè)方面,建立了城市火災(zāi)案例庫,共構(gòu)建200余條數(shù)據(jù);廖振良等[4]則專注研究突發(fā)性環(huán)境污染事件;于璐等[5]研究了供應(yīng)鏈突發(fā)事件應(yīng)急系統(tǒng),構(gòu)建了GBR-GRA供應(yīng)鏈突發(fā)事件應(yīng)急系統(tǒng)。

    以上研究發(fā)現(xiàn)突發(fā)事件案例庫具有如下幾個(gè)問題: 信息不全,有大量數(shù)據(jù)缺失;多采用人工構(gòu)建方法;事件類型單一,多為特定場(chǎng)景下對(duì)某類突發(fā)事件的研究,鮮有針對(duì)四種類型[6]的全面研究。人工智能、數(shù)據(jù)挖掘、自然語言處理等技術(shù)的蓬勃發(fā)展為突發(fā)事件案例庫的構(gòu)建提供了更為科學(xué)合理的解決方案,本文旨在采用成熟的自然語言處理方法解決應(yīng)急管理領(lǐng)域中的文本處理問題,提出合理、科學(xué)的抽取自由文本信息的方法,解決了繁瑣冗雜的人工操作,不僅省時(shí)省力,而且具有較高的準(zhǔn)確率。

    近年來,信息抽取已經(jīng)在金融、醫(yī)藥、物流等許多領(lǐng)域得到了成功應(yīng)用[7-9]。趙小明等[8]提出一種基于統(tǒng)計(jì)的金融領(lǐng)域多元關(guān)系信息抽取算法,研究收購類事件描述句及事件角色,分別設(shè)計(jì)了單分類器和多分類器的算法,結(jié)果表明多分類器算法比單分類器識(shí)別算法F-Measure提高了1.90%。沈元一等[9]提出一個(gè)互聯(lián)網(wǎng)藥品信息抽取和監(jiān)測(cè)的整體解決方案,對(duì)互聯(lián)網(wǎng)商品信息進(jìn)行全面、準(zhǔn)確、實(shí)時(shí)、自動(dòng)的抽取,有效保障了互聯(lián)網(wǎng)藥品交易的質(zhì)量和服務(wù)。原歡[10]采用基于規(guī)則的信息抽取方法,提出了基于GATE的貨物動(dòng)態(tài)郵件信息抽取方法,應(yīng)用貨物動(dòng)態(tài)郵件驗(yàn)證了方法的科學(xué)性和有效性。

    與此同時(shí),也有學(xué)者將信息抽取技術(shù)應(yīng)用于應(yīng)急管理領(lǐng)域[11-13],吳平博等[12]在建立了統(tǒng)一事件框架的基礎(chǔ)上,利用句型模板抽取了新聞事件的基礎(chǔ)信息,并且通過實(shí)驗(yàn)表明,該方法的召回率以及精度分別達(dá)到了60.82%和94.84%,但僅限于火災(zāi)、礦難和空難這三類新聞事件。余晨等[13]針對(duì)海事突發(fā)事件提出了一種基于規(guī)則的信息抽取方法,通過定義規(guī)則抽取海事新聞中的時(shí)間、地點(diǎn)、船舶名和事故類型。實(shí)驗(yàn)結(jié)果表明,該方法的準(zhǔn)確率均在94.52%以上,但僅限于單一的海事領(lǐng)域網(wǎng)站。

    對(duì)突發(fā)事件信息來源的分析和研究顯示,突發(fā)事件信息來源通常較為單一,最常見的來源為Web新聞和政府公文,這兩類文本具有極其鮮明的文體特色,現(xiàn)有研究多忽略了這一事實(shí)。本文結(jié)合課題的研究目標(biāo),提出了基于文體和詞表的突發(fā)事件信息抽取方法,針對(duì)新聞文體所具有的規(guī)律性,將網(wǎng)絡(luò)自由文本轉(zhuǎn)換為結(jié)構(gòu)化的數(shù)據(jù),完成突發(fā)事件的信息抽取工作,構(gòu)建數(shù)據(jù)量較大的突發(fā)事件案例庫,為評(píng)估現(xiàn)有突發(fā)事件和風(fēng)險(xiǎn)措施的有效性提供數(shù)據(jù)支撐,具有重要的經(jīng)濟(jì)價(jià)值和社會(huì)意義。

    1 突發(fā)事件的信息抽取

    信息抽取(information extraction,IE)[14-15]是指把文本中包含的無結(jié)構(gòu)、無組織的信息進(jìn)行一系列處理,轉(zhuǎn)化成統(tǒng)一格式的結(jié)構(gòu)化數(shù)據(jù)保存起來。輸入信息抽取系統(tǒng)的是各種非結(jié)構(gòu)化的文檔,輸出的是結(jié)構(gòu)化的信息點(diǎn),信息點(diǎn)從各類文檔中被提取出來,按照一定格式儲(chǔ)存到數(shù)據(jù)庫中。

    信息抽取的方法大致可分為基于統(tǒng)計(jì)的方法和基于規(guī)則的方法。基于統(tǒng)計(jì)的方法以強(qiáng)大的統(tǒng)計(jì)學(xué)原理為基礎(chǔ),具有較高的可移植性,但準(zhǔn)確性不高;基于規(guī)則的方法以領(lǐng)域知識(shí)為基礎(chǔ),具有較高的準(zhǔn)確性,但跨應(yīng)用領(lǐng)域的移植性幾乎為零。

    本文的研究目標(biāo)是合理、高效地實(shí)現(xiàn)突發(fā)事件信息結(jié)構(gòu)化,結(jié)構(gòu)化的突發(fā)事件信息能更有效地用于應(yīng)急管理各個(gè)方面,可作為突發(fā)事件案例庫的一部分,或案例推理系統(tǒng)的一部分為應(yīng)對(duì)未來突發(fā)事件提供決策輔助。待處理的數(shù)據(jù)來源為新聞或其他政府網(wǎng)站上的突發(fā)事件新聞報(bào)道,根據(jù)應(yīng)急決策系統(tǒng)的應(yīng)用需求,結(jié)構(gòu)化的突發(fā)事件信息主要包含兩大類屬性:

    (1) 突發(fā)事件基本屬性: 從事件的角度描述突發(fā)事件,包括事件摘要、事件類型、發(fā)生時(shí)間、發(fā)生地點(diǎn);

    (2) 突發(fā)事件類型屬性: 從應(yīng)急管理的角度,可將突發(fā)事件分為自然災(zāi)害、事故災(zāi)難、公共衛(wèi)生事件和社會(huì)安全事件[1,16-17]。

    不同類型的突發(fā)事件具有不同的屬性,比如突發(fā)公共衛(wèi)生事件具有引發(fā)原因、表現(xiàn)形式等屬性,而事故災(zāi)難突發(fā)事件則具有因果演進(jìn)之類的屬性。本文主要研究突發(fā)事件中的傷亡屬性和自然災(zāi)害、火災(zāi)事件中特有的經(jīng)濟(jì)損失屬性抽取方法。

    1.1 抽取流程

    通過對(duì)突發(fā)事件Web新聞的文體特征和數(shù)據(jù)組織結(jié)構(gòu)的分析和研究,本文以基于規(guī)則的信息抽取方法為核心,融合統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)方法,制定了信息抽取規(guī)則和流程,基本思想如下:

    首先,在領(lǐng)域?qū)<业闹笇?dǎo)下確定待抽取的數(shù)據(jù)屬性集合,比如,前文所述突發(fā)事件的基本屬性和類型屬性。

    其次,分析數(shù)據(jù)源中各屬性的呈現(xiàn)方式,為不同的屬性制定不同的抽取方案,如“時(shí)間”屬性的呈現(xiàn)方式具有極強(qiáng)的文體特征,通常會(huì)出現(xiàn)在文章的開始部分;而“事件類型”屬性的呈現(xiàn)方式則具有極強(qiáng)的領(lǐng)域特征,如在報(bào)道地震這種自然災(zāi)害時(shí),常會(huì)出現(xiàn)“余震”“震中”等專業(yè)術(shù)語。規(guī)定“時(shí)間”屬性抽取策略為基于文體,而“事件類型”則是基于詞表。

    最后,制訂抽取所需要的規(guī)則集合,構(gòu)建抽取所需要的領(lǐng)域詞表。

    圖1為本文進(jìn)行突發(fā)事件案例信息抽取的架構(gòu)圖。從新聞網(wǎng)站獲取的信息首先經(jīng)過簡(jiǎn)單篩選等預(yù)處理,得到初始新聞?wù)Z料庫;接著借助構(gòu)建的詞表從初始新聞?wù)Z料庫中對(duì)突發(fā)事件進(jìn)行識(shí)別和分類。本文在研究新聞文體的基礎(chǔ)上,采取基于規(guī)則及其他輔助方法對(duì)突發(fā)事件新聞信息,包括突發(fā)事件時(shí)間、地點(diǎn)、傷亡情況、經(jīng)濟(jì)損失和事件摘要進(jìn)行抽取。其中,抽取突發(fā)事件摘要,使用的是最大邊界相關(guān)法MMR(maximal marginal relevance)算法,抽取地點(diǎn)時(shí)加入了命名實(shí)體識(shí)別的方法,抽取傷亡情況和經(jīng)濟(jì)損失時(shí)使用基于詞表的方法。圖1是本文的信息抽取架構(gòu)圖,由三個(gè)模塊組成:

    圖1 突發(fā)事件信息抽取架構(gòu)圖

    (1) 信息獲取模塊。利用網(wǎng)絡(luò)爬蟲爬取新聞網(wǎng)站內(nèi)容作為初始新聞?wù)Z料庫。

    (2) 事件識(shí)別與分類模塊。對(duì)初始新聞?wù)Z料庫進(jìn)行預(yù)處理,根據(jù)基礎(chǔ)詞表和子關(guān)鍵詞,判斷新聞報(bào)道是否為突發(fā)事件,并在此基礎(chǔ)上對(duì)突發(fā)事件分類。

    (3) 信息抽取模塊。完成突發(fā)事件基本屬性的抽取,實(shí)現(xiàn)突發(fā)事件屬性信息的結(jié)構(gòu)化抽取。

    1.2 評(píng)價(jià)指標(biāo)

    本文采用準(zhǔn)確率、召回率和F度量(F-Measure)作為突發(fā)事件信息抽取方法的評(píng)價(jià)指標(biāo)。計(jì)算標(biāo)準(zhǔn)見式(1)~(3)。

    (1)

    (2)

    (3)

    P為準(zhǔn)確率,R為召回率,c1為抽取信息中正確的個(gè)數(shù),c2為抽取信息的個(gè)數(shù),c3為樣本的個(gè)數(shù),β為權(quán)重系數(shù),決定在評(píng)價(jià)抽取結(jié)果時(shí)是側(cè)重準(zhǔn)確率還是側(cè)重召回率,通常設(shè)定1、2或1/2,β取值為1時(shí),準(zhǔn)確率和召回率一樣重要。

    2 基于文體和詞表的信息抽取方法

    2.1 基于文體的信息抽取

    引言中已提及,數(shù)據(jù)來源為Web新聞或其他政府網(wǎng)站上的突發(fā)事件新聞報(bào)道,本文研究發(fā)現(xiàn)突發(fā)事件新聞報(bào)道具有以下規(guī)律性:

    (1) 有固定語言體裁,且內(nèi)容真實(shí)可靠;

    (2) 闡明事件所表達(dá)的中心。標(biāo)題突出新聞的要點(diǎn),并在首段對(duì)新聞的核心事件進(jìn)行描述;

    (3) 遵循新聞特定體裁所要求的慣例。

    本文針對(duì)新聞報(bào)道所具有的文體規(guī)律性展開研究。

    文體style一詞源于拉丁語stilus,本義指用于在蠟板上寫字的骨制、木制或鐵制的尖頭筆,后引申為此種工具所寫的東西、文章、作文風(fēng)格和體裁、作文或說話的特殊風(fēng)格等[18-20]。傳統(tǒng)意義上的文體學(xué)者有以下觀點(diǎn)[21-22]: 布封(De Buffon)認(rèn)為“文體就是人本身”(the style proclaims the man);斯威夫特(J .Swift)認(rèn)為是“在恰當(dāng)?shù)牡胤绞褂们‘?dāng)?shù)脑~,這就是風(fēng)格的真實(shí)意義”(proper words in proper places make the true definition of a style)。在當(dāng)今互聯(lián)網(wǎng)時(shí)代,又衍生了具有時(shí)代特點(diǎn)的文體內(nèi)涵,如計(jì)量文體學(xué)[23],即結(jié)合當(dāng)今的信息技術(shù)對(duì)文本進(jìn)行定量分析,采用機(jī)器自動(dòng)處理,以發(fā)現(xiàn)文本中的潛在規(guī)律。

    由此可見,目前對(duì)文體的認(rèn)識(shí)并不統(tǒng)一,但至少有兩點(diǎn)是學(xué)者較為普遍接受的: 一是文體是寫作者或說話者獨(dú)特的語言選擇;二是文體是對(duì)規(guī)范或常規(guī)語言用法的偏離,即有標(biāo)記的語言使用方式。前者是從文體生成方式講,后者則強(qiáng)調(diào)其表現(xiàn)方式。綜合兩種觀點(diǎn),可做出如下界定[18]: 文體是寫作者或說話者對(duì)語言規(guī)律性選擇的結(jié)果,這種個(gè)性化選擇使該文本不同于常規(guī)表達(dá)方式,其規(guī)律性表現(xiàn)出一定的穩(wěn)定性。本文針對(duì)前人研究中存在的問題,充分利用突發(fā)事件新聞報(bào)道的文體規(guī)律性進(jìn)行信息的抽取。

    2.1.1 新聞文體的特征

    新聞文體在廣義上指的就是消息,具有“5W1H”特點(diǎn),即誰(Who)、何時(shí)(When)、何地(Where)、何事(What)、為何(Why)以及過程如何(How),以敘述為主要形式,新聞通過以上六要素組織文字。敘述方式主要是圍繞“倒金字塔型”展開[24]。文字力求客觀、真實(shí),語言簡(jiǎn)潔平實(shí)。

    新聞一般由五大部分構(gòu)成: 標(biāo)題、導(dǎo)語、主體、背景和結(jié)語,基于本文的研究目標(biāo),著重分析新聞的標(biāo)題和導(dǎo)語。標(biāo)題通常是新聞內(nèi)容的提要,導(dǎo)語則是新聞的第一句話或新聞的首段,其體現(xiàn)是用簡(jiǎn)明的文字概括出新聞報(bào)道的事實(shí)或中心。

    2.1.2 基于文體的時(shí)間屬性抽取

    根據(jù)文體特點(diǎn)及對(duì)突發(fā)事件新聞的廣泛閱讀發(fā)現(xiàn): 通常突發(fā)事件新聞報(bào)道在新聞導(dǎo)語中都會(huì)用最精煉簡(jiǎn)潔的文字客觀闡述事件,且由于新聞遵循倒金字塔結(jié)構(gòu)組織全文,采用“頭重腳輕”按重要性遞減安排全文結(jié)構(gòu),因此新聞的發(fā)生時(shí)間在新聞標(biāo)題和新聞首段被提及概率在98%左右。

    在對(duì)新聞時(shí)間抽取中,目前有研究者使用報(bào)道時(shí)間作為新聞發(fā)生時(shí)間,該方法適合微博、微信等實(shí)時(shí)社交網(wǎng)絡(luò)平臺(tái),但對(duì)于非實(shí)時(shí)新聞,則存在較大的誤差。在突發(fā)事件的時(shí)間屬性抽取中,本文主要完成的工作是時(shí)間的識(shí)別和時(shí)間格式的轉(zhuǎn)換。

    通過分析研究大量新聞報(bào)道,特別是新聞網(wǎng)站上的新聞報(bào)道,發(fā)現(xiàn)Web形式的新聞報(bào)道具有以下文體特征:

    (1) Web頁面上通常存在三個(gè)時(shí)間,即新聞的發(fā)表時(shí)間、新聞報(bào)道時(shí)間和事件發(fā)生時(shí)間[25],其含義為:

    ? 新聞的發(fā)表時(shí)間,記為pt,一般在新聞標(biāo)題的下方會(huì)詳細(xì)給出發(fā)表新聞的時(shí)間。

    ? 新聞的報(bào)道時(shí)間,記為rt,一般在新聞的開頭,以“電”或“訊”結(jié)束。

    ? 事件的發(fā)生時(shí)間,記為et,在新聞內(nèi)容中給出,多出現(xiàn)在新聞標(biāo)題和導(dǎo)語部分。

    這三者的大小關(guān)系為: et<=rt<=pt,即事件的發(fā)生時(shí)間早于新聞的報(bào)道時(shí)間,新聞報(bào)道時(shí)間早于新聞的發(fā)表時(shí)間。如圖2是一個(gè)新聞網(wǎng)頁時(shí)間屬性的示例。

    (2) Web新聞的時(shí)間表達(dá)方式和精度也呈現(xiàn)一定的規(guī)律性:

    ? pt常精確到“年”“月”“日”“時(shí)”“分”“秒”,rt一般僅涉及“月”“日”,而et可能在rt基礎(chǔ)上繼續(xù)細(xì)化或者只提及“上午”“下午”“凌晨”“時(shí)”“分”“秒”等時(shí)間信息。

    ? 時(shí)間格式通常有以下幾種形式,某年某月某日、YYYY-MM-dd、YYYY/MM/dd、YYYY.MM.dd和YYYY-M-dd等。

    圖2 新聞網(wǎng)頁時(shí)間屬性示例

    在時(shí)間屬性抽取的執(zhí)行過程中,使用了簡(jiǎn)單高效的正則表達(dá)式對(duì)時(shí)間值進(jìn)行判斷,如圖2所標(biāo)識(shí)的各個(gè)時(shí)間信息中,“2017-11-07 22: 04”為Web新聞的發(fā)表時(shí)間pt,“11月7日”為新聞的報(bào)道時(shí)間rt,“6日下午15點(diǎn)”為事件的發(fā)生時(shí)間et。算法能夠?qū)π侣勚猩婕暗母黝悤r(shí)間信息進(jìn)行抽取并轉(zhuǎn)換成統(tǒng)一格式返回。

    基于以上分析,時(shí)間屬性抽取見算法1。

    算法1 時(shí)間屬性抽取算法

    2.1.3 基于文體的事件摘要屬性抽取

    文摘通常是指在給定字?jǐn)?shù)限制范圍內(nèi),去繁為簡(jiǎn),以簡(jiǎn)短、凝練的文字幫助人們獲取全面準(zhǔn)確的全文信息,提高閱讀效率,節(jié)省時(shí)間,同時(shí)也能夠幫助人們?nèi)ズY選海量信息。自動(dòng)文摘是自然語言處理的一個(gè)分支,即摘取原文中的部分句子概括全文的主要內(nèi)容,因此本文使用非監(jiān)督性自動(dòng)文摘從原始新聞中提取摘要,作為突發(fā)事件“事件摘要”屬性值。

    在摘要的監(jiān)督性和非監(jiān)督性機(jī)器學(xué)習(xí)方法中,前者通常會(huì)產(chǎn)生重復(fù)語句的摘要。因此很多衍生出的監(jiān)督性模型采用增加句間關(guān)系的方式來解決該問題,但同時(shí)也增加了復(fù)雜度。非監(jiān)督性方法中,應(yīng)用最多的是最大邊界相關(guān)法MMR和基于圖(graph)的TextRank模型,前者在多樣性上優(yōu)于后者。本文的單篇新聞自動(dòng)摘要就是基于MMR模型。MMR是一種重新確定文檔序值的方法,如式(4)所示。

    (4)

    Di為當(dāng)前句子,Q為當(dāng)前文章的句子集合,S為當(dāng)前摘要的句子集合,R為當(dāng)前非摘要的句子集合,λ為相關(guān)性系數(shù)。

    sim1計(jì)算的是句子的重要性分值,sim2計(jì)算的是句子與已經(jīng)被選擇成摘要的句子之間的相似度最大值,MMR方法在相似度和去冗余的計(jì)算中,按照文體的特點(diǎn)考察了句子的位置重要性,實(shí)現(xiàn)了對(duì)不同文體文摘的個(gè)性化和句子的多樣化。

    2.2 基于詞表的突發(fā)事件屬性抽取

    2.2.1 詞表的構(gòu)建

    詞表在自然語言處理中扮演著重要的角色,比如在中文分詞、新詞識(shí)別、命名實(shí)體識(shí)別等工作中起著不可或缺的作用。在信息抽取中采用領(lǐng)域詞表已經(jīng)成為提高準(zhǔn)確率的重要方法。

    2013年,Google開源了用于詞向量計(jì)算的工具Word2Vec,它可以在海量數(shù)據(jù)集上進(jìn)行高效的訓(xùn)練,它包含CBOW(continuous bag-of-words)和Skip-Gram兩種核心架構(gòu),在對(duì)大量語料進(jìn)行訓(xùn)練的基礎(chǔ)上,量化了詞與詞之間的相關(guān)程度,同時(shí)解決了自然語言處理中的近義詞和相關(guān)詞的問題。如使用Word2Vec計(jì)算“危化品”相關(guān)詞,返回結(jié)果為“危險(xiǎn)品”“儲(chǔ)油區(qū)”“倉儲(chǔ)”等。Word2Vec所具有的強(qiáng)大統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)基礎(chǔ),使其在自然語言處理領(lǐng)域得到了廣泛的應(yīng)用。

    本文詞表以突發(fā)事件類型劃分為主線,分為基礎(chǔ)詞表和擴(kuò)充詞表,表1是構(gòu)建詞表的部分內(nèi)容?;A(chǔ)詞表由領(lǐng)域?qū)<覙?gòu)建;擴(kuò)充詞表則利用Google Word2Vec構(gòu)建,以基礎(chǔ)詞表為核心,無監(jiān)督地生成擴(kuò)充詞表,考慮到詞表的規(guī)模和系統(tǒng)的效率,選取了相關(guān)度最高的前10個(gè)詞構(gòu)成子關(guān)鍵詞,共同組成了擴(kuò)充詞表。至此完成了詞表的構(gòu)建。

    表1 詞表(部分)

    2.2.2 基于詞表的突發(fā)事件識(shí)別與分類

    如圖1所示,在進(jìn)行突發(fā)事件屬性抽取之前,首先要完成對(duì)突發(fā)事件新聞的識(shí)別,本文基于上節(jié)構(gòu)建的詞表進(jìn)行突發(fā)事件新聞的識(shí)別及分類。

    綜合考慮信息抽取的準(zhǔn)確率和效率,本文對(duì)匹配子關(guān)鍵詞個(gè)數(shù)進(jìn)行了測(cè)試,實(shí)驗(yàn)結(jié)果如圖3,(橫軸為子關(guān)鍵詞個(gè)數(shù),縱軸為突發(fā)事件分類準(zhǔn)確率)該實(shí)驗(yàn)采用中文維基百科語料庫訓(xùn)練模型,實(shí)驗(yàn)結(jié)果顯示當(dāng)子關(guān)鍵詞個(gè)數(shù)為2時(shí),準(zhǔn)確率達(dá)到最高,為91.84%,因此選定子關(guān)鍵詞個(gè)數(shù)為2。

    圖3 子關(guān)鍵詞個(gè)數(shù)實(shí)驗(yàn)結(jié)果

    在此基礎(chǔ)上,基于詞表的突發(fā)事件識(shí)別與分類的具體實(shí)現(xiàn)見算法2。

    算法2 突發(fā)事件的識(shí)別與分類算法

    2.3 基于文體和詞表的突發(fā)事件屬性抽取

    2.3.1 基于文體和詞表的地點(diǎn)屬性抽取

    命名實(shí)體識(shí)別在自然語言處理領(lǐng)域中占有很重要的地位,能在文本中識(shí)別具有特定意義的實(shí)體,如人名、地名、機(jī)構(gòu)名或其他專有名詞。

    細(xì)究文體結(jié)構(gòu)和新聞敘述方式發(fā)現(xiàn),雖然新聞的發(fā)生地點(diǎn)在新聞標(biāo)題和新聞首段被提及的概率在98%左右,但通常在標(biāo)題中提及的地點(diǎn)范圍較大,而在正文中,會(huì)對(duì)發(fā)生地點(diǎn)進(jìn)行詳細(xì)闡述,呈現(xiàn)位置具體化、粒度縮小的趨勢(shì)。因而本文采用命名實(shí)體識(shí)別和詞表的方法,獲取突發(fā)事件詳細(xì)地點(diǎn)。

    本文根據(jù)中國地名,建立各省市詳細(xì)的地名表,由于地名具有明顯的層次結(jié)構(gòu),本文采用樹結(jié)構(gòu)存儲(chǔ),層次清晰,簡(jiǎn)單明了。在對(duì)新聞中地名實(shí)體進(jìn)行識(shí)別后,遍歷地名結(jié)構(gòu)樹,從而得到突發(fā)事件完整地點(diǎn)。

    2.3.2 基于文體和詞表的傷亡屬性抽取

    突發(fā)事件傷亡信息描述,主要存在新聞的標(biāo)題、導(dǎo)語和主體三個(gè)部分。首先,標(biāo)題中涉及傷亡信息為最終傷亡結(jié)果,以醒目、直接的表達(dá)方式呈現(xiàn)事件

    結(jié)果引起人們的普遍關(guān)注。其次,導(dǎo)語部分提及的傷亡信息是新聞?wù)w客觀性描述,通常會(huì)在主體部分進(jìn)行詳細(xì)展開。新聞報(bào)道要求全面、公正、客觀,在新聞報(bào)道中對(duì)傷亡結(jié)果信息都是言簡(jiǎn)意賅,不存在形式上的多樣性。

    因此,對(duì)突發(fā)事件傷亡信息的抽取,本文結(jié)合文體特點(diǎn),并構(gòu)建傷亡詞表,同時(shí)定義相關(guān)規(guī)則進(jìn)行突發(fā)事件傷亡屬性抽取。由于四種類型事件的抽取傷亡表達(dá)上既有共性又有特性,因此先建立傷亡的公共詞表,又針對(duì)其存在的特殊性構(gòu)建了各自的專有詞表,二者共同識(shí)別突發(fā)事件的傷亡情況,如表2所示。

    在著重研究上海大學(xué)公開的中國突發(fā)事件語料庫(Chinese emergency corpus,CEC)、暨南大學(xué)突發(fā)事件案例庫等資料的基礎(chǔ)上,通過使用正則表達(dá)式,定義如下的抽取規(guī)則:

    規(guī)則1(程度副詞1)?(數(shù)詞)*(程度副詞1)?(人類數(shù)量詞)?(受災(zāi)對(duì)象)?(修飾詞)?{傷亡觸發(fā)詞}+.{1,4}|{觸發(fā)詞}+(數(shù)詞)*(程度副詞1)?(人類數(shù)量詞)?(受災(zāi)對(duì)象)?

    ? 程度副詞1: 左右、大約、多、上下、余、近、至少等

    ? 數(shù)詞: 阿拉伯?dāng)?shù)字,中文數(shù)字,“兩”(如: 兩死兩傷)

    ? 人類數(shù)量詞: 人、名、例、位、個(gè)等

    ? 受災(zāi)對(duì)象: 人、兒童、學(xué)生、老師、居民、工人、消防員、司機(jī)、師生等

    ? 修飾詞: 不同程度、全部、當(dāng)場(chǎng)、受……(如: 二十余人不同程度受傷)

    ? 傷亡觸發(fā)詞: 見表2

    ? ?: 表示匹配前面字符0~1次

    ? *: 表示匹配前面字符0~n次

    ? +: 表示匹配前面字符1~n次

    ? .: 表示匹配任意字符

    圖4為傷亡屬性抽取示例。

    圖4 傷亡屬性抽取示例

    上述表達(dá)式在未造成人員傷亡、沒有人受傷、未收到人員受傷等信息時(shí)無法抽取。針對(duì)上述情況,補(bǔ)充如下規(guī)則:

    規(guī)則2(0傷亡詞表)+.{1,6}(人類數(shù)量詞)?(受災(zāi)對(duì)象)?({傷亡觸發(fā)詞})

    ? 0傷亡詞表: 未、沒有、無人、尚無、尚未等

    由于標(biāo)題和正文中均有可能對(duì)傷亡情況進(jìn)行描述,其中標(biāo)題中的傷亡信息通常是對(duì)整體事件的概括,當(dāng)標(biāo)題中提及傷亡信息時(shí),為了避免信息重復(fù)抽取,不需重復(fù)抽取內(nèi)容中的傷亡信息;當(dāng)標(biāo)題中未出現(xiàn)傷亡情況但文章中提及傷亡情況時(shí),根據(jù)構(gòu)建的傷亡詞表和定義的規(guī)則獲取傷亡結(jié)果。傷亡屬性抽取過程見算法3。

    算法3 傷亡屬性抽取算法

    2.3.3 基于文體和詞表的經(jīng)濟(jì)損失屬性抽取

    對(duì)事件結(jié)果經(jīng)濟(jì)損失屬性的抽取,類似于傷亡屬性抽取,采用文體、詞表和規(guī)則相結(jié)合的方法。其中所構(gòu)建的經(jīng)濟(jì)損失屬性詞表見表3。

    表3 經(jīng)濟(jì)損失屬性詞表

    針對(duì)經(jīng)濟(jì)損失存在的特點(diǎn),使用正則表達(dá)式方法,定義如下的抽取規(guī)則:

    規(guī)則3(經(jīng)濟(jì)損失觸發(fā)詞)+(程度副詞2)?(數(shù)字.數(shù)字)+(數(shù)詞)*(程度副詞2)?(單位量詞)+

    研究發(fā)現(xiàn),上述匹配模式無法對(duì)如下表達(dá)進(jìn)行正確匹配,“倒塌房屋30戶99間,重?fù)p2 769戶9 626間……”,針對(duì)此類情況,定義如下規(guī)則:

    規(guī)則4(經(jīng)濟(jì)損失觸發(fā)詞)+(程度副詞2)?(數(shù)詞)+(單位量詞)?(數(shù)字)+(單位量詞)?

    ? 經(jīng)濟(jì)損失觸發(fā)詞: 見表3

    ? 程度副詞2: 約、左右、已達(dá)、多、至少、余、近等

    ? 數(shù)字: 阿拉伯?dāng)?shù)字、中文數(shù)字、“兩”等

    ? 數(shù)詞: 十、百、千、萬、十萬、百萬、千萬、億、十億、百億、千億

    ? 單位量詞: 元、人民幣、美元、間、公頃、平方米、頭、畝、公里、戶、只、根、米、m3、處等

    ? .: 為轉(zhuǎn)義字符,代表普通圓點(diǎn)符號(hào)

    圖5是經(jīng)濟(jì)損失的示例。

    圖5 經(jīng)濟(jì)損失抽取示例

    3 實(shí)驗(yàn)與分析

    3.1 實(shí)驗(yàn)環(huán)境

    本文實(shí)驗(yàn)環(huán)境配置如下。

    (1) 硬件環(huán)境

    CPU: Intel(R) Core(TM) i5-6200U CPU @2.3GHz 2.40 GHz 4核

    內(nèi)存: 8GB

    硬盤: 250GB

    (2) 軟件環(huán)境

    操作系統(tǒng): Windows 10

    開發(fā)平臺(tái): Python 3.6.2

    IDE: PyCharm 2017.2.1

    本文算法由Python語言實(shí)現(xiàn),包括網(wǎng)絡(luò)爬蟲、數(shù)據(jù)預(yù)處理、Word2Vec、核心算法實(shí)現(xiàn)等。選擇中文維基百科語料庫,訓(xùn)練Word2Vec模型,采用Python結(jié)巴分詞進(jìn)行命名實(shí)體識(shí)別。

    3.2 數(shù)據(jù)源

    3.2.1 突發(fā)事件語料庫構(gòu)建

    本文選擇湖北地區(qū)新聞為研究對(duì)象,新聞網(wǎng)站選擇影響力大、涉及范圍廣、及時(shí)更新、權(quán)威性高的網(wǎng)站。

    通過對(duì)各大網(wǎng)站的瀏覽和分析,選擇合適新聞板塊,使用Python 3.6編程語言,PyCharm編程工具,編寫爬蟲獲取新聞內(nèi)容,保存新聞標(biāo)題、報(bào)道時(shí)間、新聞內(nèi)容、新聞鏈接。

    網(wǎng)絡(luò)爬蟲獲取的新聞,會(huì)存在少量的字符亂碼和異常數(shù)據(jù),需要對(duì)數(shù)據(jù)預(yù)處理。筆者對(duì)新聞?wù)Z料主要進(jìn)行如下兩個(gè)步驟的處理:

    (1) 去除新聞在文本爬取保存過程中發(fā)生的字符亂碼,主要是一些Unicode字符,如xa0等;

    (2) 網(wǎng)站轉(zhuǎn)發(fā)其他網(wǎng)站新聞進(jìn)行多次鏈接跳轉(zhuǎn)或者分頁處理大量的圖片新聞,會(huì)導(dǎo)致新聞內(nèi)容嚴(yán)重缺失,筆者設(shè)定當(dāng)新聞內(nèi)容字?jǐn)?shù)少于30個(gè)字符時(shí),舍棄這條新聞。

    爬取新聞共獲取11 865條新聞,經(jīng)過上述預(yù)處理共收集8 123條內(nèi)容完整新聞。以此為初始語料庫建立突發(fā)事件研究數(shù)據(jù)集[注]https://gitee.com/Amos698/TuFaShiJianGongKaiShuJuJi。經(jīng)過突發(fā)事件識(shí)別與分類,共篩選出1 432篇突發(fā)事件相關(guān)內(nèi)容,此數(shù)據(jù)集相比其他研究數(shù)據(jù)集具有以下優(yōu)點(diǎn):

    (1) 數(shù)據(jù)信息完整,數(shù)據(jù)集涵蓋范圍廣;

    (2) 采用非監(jiān)督自動(dòng)構(gòu)建方法,節(jié)省人力物力;

    (3) 數(shù)據(jù)規(guī)模大,至少是其他數(shù)據(jù)集的四五倍;

    (4) 內(nèi)容豐富,不再是單一的事件類型,而是涵蓋四類突發(fā)事件信息來源。自然災(zāi)害類事件,如地震、臺(tái)風(fēng)等;公共衛(wèi)生事件,如登革熱、食物中毒事件等;事故災(zāi)害,如交通事故、火災(zāi)等;社會(huì)安全事件,如恐怖主義、群體性突發(fā)事件等。

    3.2.1 公開語料庫CEC

    CEC語料庫由上海大學(xué)劉宗田教授的《面向事件的本體研究》人工標(biāo)注所構(gòu)建完成。以六元組形式標(biāo)識(shí)事件[26],形式化地定義事件e為:e=(A,O,T,P,S,L),其中事件六元組中的元素稱為事件要素,分別表示動(dòng)作(action)、對(duì)象(object)、時(shí)間(time)、地點(diǎn)(place)、狀態(tài)(status)、語言表現(xiàn)(language expressions)。以此六元組表示新聞各個(gè)角色之間的聯(lián)系。CEC語料庫采用XML格式存儲(chǔ),共包含五種類型的突發(fā)事件,分別是地震、火災(zāi)、交通事故、恐怖襲擊、食物中毒,共332篇。

    3.3 實(shí)驗(yàn)結(jié)果及分析

    3.3.1 突發(fā)事件語料庫實(shí)驗(yàn)結(jié)果與分析

    在爬取新聞,對(duì)初始語料庫進(jìn)行預(yù)處理之后,通過事件識(shí)別與分類模塊,將獲取突發(fā)事件新聞。本文隨機(jī)選取其中100篇突發(fā)事件新聞進(jìn)行測(cè)評(píng),通過專家評(píng)價(jià)實(shí)驗(yàn)結(jié)果的正確性,結(jié)果如表4所示。

    (1) 從“時(shí)間”屬性結(jié)果中可以看出,時(shí)間屬性識(shí)別效果最好。主要是新聞事件中時(shí)間表達(dá)形式固定統(tǒng)一,有規(guī)律可循,但在個(gè)別新聞事件中出現(xiàn)了連續(xù)的事件流,導(dǎo)致時(shí)間信息沒有正確抽取,因此突發(fā)事件時(shí)間屬性抽取準(zhǔn)確率和召回率為94.00%。

    表4 突發(fā)事件信息抽取結(jié)果

    (2) 從“地點(diǎn)”結(jié)果中可以看出,對(duì)地點(diǎn)屬性識(shí)別效果的準(zhǔn)確率和召回率均為84.00%。分析發(fā)現(xiàn): 其一,由于結(jié)巴分詞自身的弊端,無法完全準(zhǔn)確識(shí)別出地點(diǎn)名詞和實(shí)體名詞;其二,本文選取的新聞?wù)Z料中,存在部分交通事故類型,此類事件的發(fā)生地點(diǎn),都是一些相關(guān)路段,例如“沿京港澳高速下行線由北往南行駛至孝昌段……”,根據(jù)詞性標(biāo)注和詞表信息,不能正確識(shí)別出地點(diǎn)名詞,也無法根據(jù)詞表信息返回事件發(fā)生地點(diǎn);其三,由于地點(diǎn)名詞本身的限制,部分地點(diǎn)并不在詞表中,導(dǎo)致事件發(fā)生地點(diǎn)無法被識(shí)別。

    (3) 從“傷亡”結(jié)果中可以看出,傷亡屬性抽取準(zhǔn)確率高于召回率,究其原因: 其一,傷亡詞表需要進(jìn)行完善,某些事件發(fā)生頻率低,缺少此種表達(dá)規(guī)律;其二,個(gè)別事件側(cè)重描述細(xì)節(jié),比如“清潔工周某在送往醫(yī)院途中不幸身亡”,并不存在傷亡數(shù)量,規(guī)則無法識(shí)別周某,進(jìn)而推導(dǎo)出一人死亡。因此,傷亡屬性識(shí)別效果準(zhǔn)確率為89.47%,召回率為77.27%。

    (4) 經(jīng)濟(jì)損失多存在于自然災(zāi)害類型和火災(zāi)事故中,此新聞?wù)Z料中涉及經(jīng)濟(jì)損失的新聞?shì)^少,共有13條。從結(jié)果中看出,經(jīng)濟(jì)損失屬性抽取的準(zhǔn)確率和召回率最差,主要有以下原因: 其一,詞表不夠全面,需要對(duì)其進(jìn)行擴(kuò)充。由于災(zāi)害事件造成的損失各種各樣,同時(shí)存在地域特色,需要閱讀足夠多的數(shù)據(jù),不斷完善詞表;其二,經(jīng)濟(jì)損失描述時(shí),多涉及具體的實(shí)體,有些實(shí)體在新聞中出現(xiàn)比較低頻。因此,經(jīng)濟(jì)損失識(shí)別效果準(zhǔn)確率只有80.00%,召回率只有61.54%。

    (5) 從“事件分類”結(jié)果中可以看出,事件分類識(shí)別效果準(zhǔn)確率和召回率為92.00%。究其原因,在事件識(shí)別時(shí),出現(xiàn)了交叉事件類型的關(guān)鍵詞,導(dǎo)致類型識(shí)別不準(zhǔn)確。

    3.3.2 CEC語料庫實(shí)驗(yàn)結(jié)果與分析

    本文同時(shí)使用上海大學(xué)公開的CEC語料庫進(jìn)行測(cè)試,隨機(jī)選擇其中100條新聞,重復(fù)3.3.1中的實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表5所示。

    從表5可以看出,使用公開語料庫的準(zhǔn)確率和召回率普遍高于突發(fā)事件語料庫,主要是因?yàn)镃EC語料庫是半結(jié)構(gòu)化的語料庫,經(jīng)過眾多專家學(xué)者精心挑選,結(jié)構(gòu)規(guī)范,表達(dá)具有一定的規(guī)律性,在進(jìn)行信息抽取時(shí),獲得了較好的效果。此外,其“地點(diǎn)”屬性抽取結(jié)果低于前者,主要原因是100條新聞數(shù)據(jù)中包含了大量的交通事故類型突發(fā)事件,導(dǎo)致抽取過程中一些路段名無法識(shí)別,因此地點(diǎn)屬性識(shí)別效果準(zhǔn)確率只有79.38%,召回率為77.00%。

    表5 CEC信息抽取結(jié)果

    4 結(jié)束語

    本文提出了切實(shí)有效的結(jié)構(gòu)化突發(fā)事件案例信息的實(shí)施方案,從應(yīng)急管理的角度來看,結(jié)構(gòu)化案例信息是高效開展應(yīng)急管理的基礎(chǔ),一方面是構(gòu)建突發(fā)事件案例的基礎(chǔ)工作,另一方面也是應(yīng)急決策中案例推理的基礎(chǔ)工作;從自然語言處理的角度來看,本文所提出的基于文體和詞表的信息抽取方法融合了基于規(guī)則和統(tǒng)計(jì)方法的優(yōu)點(diǎn),同時(shí)利用新聞文體特點(diǎn),對(duì)于結(jié)構(gòu)化Web信息進(jìn)行了有效的探索,對(duì)于其他應(yīng)用領(lǐng)域的信息抽取具有較高的實(shí)踐價(jià)值。

    由于詞表不夠完善、分詞軟件自身的局限性、Web新聞表達(dá)的多樣性及編寫規(guī)則不全面,造成“經(jīng)濟(jì)損失”和“地點(diǎn)”識(shí)別準(zhǔn)確率和召回率較低。同時(shí),由于存在交叉事件導(dǎo)致事件,分類的準(zhǔn)確率有待進(jìn)一步提高。

    未來的工作中,我們將嘗試采用機(jī)器學(xué)習(xí)和規(guī)則相結(jié)合的方式,進(jìn)行快速、高效的信息抽取,考慮在其中引入語義語法分析,解決規(guī)則制定繁瑣、擴(kuò)展性較差的問題,同時(shí)能夠?qū)γ麑?shí)體識(shí)別進(jìn)行深入學(xué)習(xí),提高識(shí)別的準(zhǔn)確率。

    猜你喜歡
    詞表語料庫突發(fā)事件
    A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會(huì)項(xiàng)目名稱漢英對(duì)照詞表
    英語世界(2021年13期)2021-01-12 05:47:51
    《語料庫翻譯文體學(xué)》評(píng)介
    把課文的優(yōu)美表達(dá)存進(jìn)語料庫
    敘詞表與其他詞表的互操作標(biāo)準(zhǔn)
    突發(fā)事件的輿論引導(dǎo)
    清朝三起突發(fā)事件的處置
    文史春秋(2016年8期)2016-02-28 17:41:32
    基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
    語言與翻譯(2015年4期)2015-07-18 11:07:45
    突發(fā)事件
    小說月刊(2014年10期)2014-04-23 08:53:40
    國外敘詞表的應(yīng)用與發(fā)展趨勢(shì)探討*
    常用聯(lián)綿詞表
    亚洲,一卡二卡三卡| 国产精品久久久久成人av| 91精品伊人久久大香线蕉| 青春草亚洲视频在线观看| 亚洲,一卡二卡三卡| 久久综合国产亚洲精品| 国产精品三级大全| 午夜福利免费观看在线| 国产在线一区二区三区精| 天天躁狠狠躁夜夜躁狠狠躁| 在线观看一区二区三区激情| 国产野战对白在线观看| 亚洲伊人色综图| 免费黄频网站在线观看国产| 久热这里只有精品99| 大陆偷拍与自拍| 香蕉国产在线看| 国产人伦9x9x在线观看| 啦啦啦啦在线视频资源| 午夜免费男女啪啪视频观看| 久久免费观看电影| 青春草亚洲视频在线观看| 亚洲国产精品成人久久小说| 久久久久久免费高清国产稀缺| 亚洲av成人精品一二三区| 国产女主播在线喷水免费视频网站| 久久精品亚洲av国产电影网| 国产麻豆69| 啦啦啦在线观看免费高清www| 搡老乐熟女国产| 丁香六月欧美| 99久国产av精品国产电影| 国产 精品1| 伊人久久大香线蕉亚洲五| 婷婷成人精品国产| 国产又爽黄色视频| 日韩欧美一区视频在线观看| 捣出白浆h1v1| 免费女性裸体啪啪无遮挡网站| 色精品久久人妻99蜜桃| 最黄视频免费看| 日日撸夜夜添| 黑人欧美特级aaaaaa片| 欧美国产精品va在线观看不卡| 999精品在线视频| 免费黄频网站在线观看国产| 国产一区二区三区综合在线观看| av网站免费在线观看视频| 99久久精品国产亚洲精品| 精品一区在线观看国产| 一级毛片我不卡| 国产亚洲一区二区精品| 午夜影院在线不卡| 国产精品.久久久| 国产精品国产三级专区第一集| 亚洲国产av新网站| 黑丝袜美女国产一区| 欧美精品一区二区大全| 日韩大码丰满熟妇| 一本—道久久a久久精品蜜桃钙片| 亚洲国产毛片av蜜桃av| 国产深夜福利视频在线观看| 久久久久久久国产电影| 如何舔出高潮| 久久久久久久国产电影| 女人被躁到高潮嗷嗷叫费观| 在线免费观看不下载黄p国产| 一边摸一边做爽爽视频免费| 热re99久久精品国产66热6| 天堂俺去俺来也www色官网| 亚洲精品在线美女| 国产乱人偷精品视频| 国产av一区二区精品久久| 国产伦理片在线播放av一区| tube8黄色片| 考比视频在线观看| 国产午夜精品一二区理论片| 色94色欧美一区二区| 青草久久国产| 少妇的丰满在线观看| 男男h啪啪无遮挡| 一边摸一边做爽爽视频免费| 精品亚洲乱码少妇综合久久| 飞空精品影院首页| 性色av一级| 国产爽快片一区二区三区| 涩涩av久久男人的天堂| 日韩精品免费视频一区二区三区| 伦理电影大哥的女人| 亚洲av国产av综合av卡| 亚洲国产av新网站| 国精品久久久久久国模美| 色婷婷久久久亚洲欧美| 性色av一级| 国产一卡二卡三卡精品 | 黄色毛片三级朝国网站| 天堂8中文在线网| 免费黄色在线免费观看| 免费黄频网站在线观看国产| 午夜福利免费观看在线| 最近最新中文字幕大全免费视频 | 人成视频在线观看免费观看| 哪个播放器可以免费观看大片| 日韩av免费高清视频| 在线观看免费高清a一片| 亚洲精品第二区| 在线观看www视频免费| 亚洲国产精品国产精品| 男人添女人高潮全过程视频| 亚洲久久久国产精品| 国产av码专区亚洲av| 日韩一本色道免费dvd| 日日撸夜夜添| 秋霞在线观看毛片| 夫妻性生交免费视频一级片| 欧美国产精品一级二级三级| 天堂俺去俺来也www色官网| 啦啦啦 在线观看视频| 色婷婷av一区二区三区视频| 一二三四在线观看免费中文在| 亚洲欧美成人精品一区二区| 69精品国产乱码久久久| av电影中文网址| 在线观看免费视频网站a站| 中文天堂在线官网| 99久久精品国产亚洲精品| 国产精品欧美亚洲77777| 国产99久久九九免费精品| 99热全是精品| 亚洲精品国产av蜜桃| 免费少妇av软件| 久久久欧美国产精品| 国产一区有黄有色的免费视频| 日韩欧美一区视频在线观看| 黄色视频不卡| 欧美精品人与动牲交sv欧美| 亚洲美女视频黄频| 亚洲精品国产一区二区精华液| 99九九在线精品视频| 国产精品久久久久久久久免| 男女免费视频国产| 亚洲av福利一区| 毛片一级片免费看久久久久| 天堂俺去俺来也www色官网| 美女中出高潮动态图| 欧美日韩一区二区视频在线观看视频在线| 汤姆久久久久久久影院中文字幕| 波多野结衣一区麻豆| 亚洲综合色网址| 亚洲色图综合在线观看| a 毛片基地| 久久毛片免费看一区二区三区| 国产精品无大码| 9191精品国产免费久久| a级片在线免费高清观看视频| 婷婷色综合大香蕉| 女人爽到高潮嗷嗷叫在线视频| avwww免费| 街头女战士在线观看网站| 国产av国产精品国产| 亚洲成人免费av在线播放| 亚洲精品视频女| 国产99久久九九免费精品| 午夜福利视频在线观看免费| 丝袜人妻中文字幕| 国产在视频线精品| 国产在线视频一区二区| 国产成人欧美在线观看 | 妹子高潮喷水视频| 亚洲七黄色美女视频| 精品第一国产精品| 巨乳人妻的诱惑在线观看| 日韩大码丰满熟妇| 一级毛片我不卡| 另类亚洲欧美激情| 99热网站在线观看| 亚洲精品在线美女| av.在线天堂| 在线观看国产h片| 狠狠精品人妻久久久久久综合| 狠狠婷婷综合久久久久久88av| 国产精品一区二区在线不卡| 黑人巨大精品欧美一区二区蜜桃| 欧美精品人与动牲交sv欧美| 啦啦啦视频在线资源免费观看| 搡老岳熟女国产| 亚洲精品,欧美精品| 国产日韩一区二区三区精品不卡| 成年人午夜在线观看视频| 99热全是精品| 亚洲成人免费av在线播放| 人人妻人人澡人人爽人人夜夜| 亚洲激情五月婷婷啪啪| av片东京热男人的天堂| 七月丁香在线播放| av天堂久久9| 免费日韩欧美在线观看| 男人舔女人的私密视频| 欧美人与善性xxx| 亚洲七黄色美女视频| 桃花免费在线播放| 制服人妻中文乱码| 在现免费观看毛片| 在线亚洲精品国产二区图片欧美| 少妇被粗大的猛进出69影院| 精品酒店卫生间| 国产精品久久久久久人妻精品电影 | a 毛片基地| 久久精品aⅴ一区二区三区四区| 亚洲七黄色美女视频| 又粗又硬又长又爽又黄的视频| 亚洲精品国产av成人精品| 亚洲国产欧美日韩在线播放| 一区二区日韩欧美中文字幕| 亚洲人成电影观看| 国产精品 欧美亚洲| 看免费av毛片| 亚洲欧美一区二区三区国产| 亚洲第一av免费看| 精品国产乱码久久久久久男人| 十分钟在线观看高清视频www| 午夜福利视频精品| 亚洲国产精品999| 国产成人免费观看mmmm| 狠狠精品人妻久久久久久综合| 老鸭窝网址在线观看| 久久 成人 亚洲| 久久毛片免费看一区二区三区| 少妇人妻久久综合中文| 女的被弄到高潮叫床怎么办| 亚洲av欧美aⅴ国产| 亚洲成人手机| 精品人妻熟女毛片av久久网站| 大片电影免费在线观看免费| 丁香六月天网| 日本wwww免费看| 黄网站色视频无遮挡免费观看| 丝袜美腿诱惑在线| 啦啦啦视频在线资源免费观看| 日韩欧美一区视频在线观看| 亚洲国产av新网站| 中文字幕亚洲精品专区| 久久天躁狠狠躁夜夜2o2o | 大片电影免费在线观看免费| 久久久久网色| 一个人免费看片子| 肉色欧美久久久久久久蜜桃| 日韩大片免费观看网站| 亚洲欧美一区二区三区久久| 日韩视频在线欧美| 99精品久久久久人妻精品| 水蜜桃什么品种好| 最近最新中文字幕大全免费视频 | 天天躁夜夜躁狠狠躁躁| 黄片无遮挡物在线观看| 91精品伊人久久大香线蕉| 国产成人午夜福利电影在线观看| 午夜久久久在线观看| 97在线人人人人妻| 国产 一区精品| 国产精品99久久99久久久不卡 | 久久久久国产精品人妻一区二区| 成人毛片60女人毛片免费| 午夜福利视频精品| 国产伦理片在线播放av一区| www.精华液| 精品亚洲成a人片在线观看| 国产 一区精品| 日韩 亚洲 欧美在线| 一级毛片黄色毛片免费观看视频| 中文精品一卡2卡3卡4更新| 曰老女人黄片| 一区福利在线观看| 日韩av在线免费看完整版不卡| 色综合欧美亚洲国产小说| 在线免费观看不下载黄p国产| 国产成人午夜福利电影在线观看| 伊人亚洲综合成人网| 中文字幕色久视频| 99热全是精品| 黄色视频不卡| 久久这里只有精品19| 亚洲精品av麻豆狂野| 18禁动态无遮挡网站| 亚洲中文av在线| 久久久精品国产亚洲av高清涩受| 一本久久精品| 日日啪夜夜爽| 国产免费现黄频在线看| e午夜精品久久久久久久| 丁香六月欧美| 日韩制服丝袜自拍偷拍| 男女床上黄色一级片免费看| 久久久亚洲精品成人影院| 亚洲精品国产一区二区精华液| av女优亚洲男人天堂| 秋霞伦理黄片| 亚洲人成电影观看| 久久影院123| 亚洲精品国产区一区二| 日韩熟女老妇一区二区性免费视频| 精品午夜福利在线看| 亚洲欧美日韩另类电影网站| 国产欧美亚洲国产| 99久国产av精品国产电影| 无遮挡黄片免费观看| 超色免费av| 中文字幕最新亚洲高清| 在线亚洲精品国产二区图片欧美| 19禁男女啪啪无遮挡网站| 国产97色在线日韩免费| 亚洲欧美精品综合一区二区三区| 亚洲成av片中文字幕在线观看| 日韩大片免费观看网站| 性色av一级| av.在线天堂| 黄色怎么调成土黄色| 丝袜在线中文字幕| 久久亚洲国产成人精品v| 国产成人91sexporn| 美国免费a级毛片| 99国产精品免费福利视频| 日韩中文字幕视频在线看片| 婷婷成人精品国产| 成人亚洲精品一区在线观看| 可以免费在线观看a视频的电影网站 | 精品人妻一区二区三区麻豆| 久久久亚洲精品成人影院| 欧美另类一区| 中文乱码字字幕精品一区二区三区| 亚洲,欧美精品.| 在线观看免费午夜福利视频| 2021少妇久久久久久久久久久| a级片在线免费高清观看视频| 日韩制服骚丝袜av| 一二三四在线观看免费中文在| 国产在线免费精品| 色综合欧美亚洲国产小说| 国产精品久久久久久久久免| 男女之事视频高清在线观看 | 老司机亚洲免费影院| 欧美精品高潮呻吟av久久| 制服丝袜香蕉在线| 午夜激情久久久久久久| 国产精品国产三级国产专区5o| 伦理电影大哥的女人| 99热网站在线观看| 一级黄片播放器| 夫妻性生交免费视频一级片| 国产亚洲最大av| 亚洲av成人不卡在线观看播放网 | 老熟女久久久| 人人妻人人澡人人看| 18禁观看日本| 国产麻豆69| 久久精品国产a三级三级三级| 亚洲欧洲国产日韩| 三上悠亚av全集在线观看| 欧美日韩福利视频一区二区| 黑人巨大精品欧美一区二区蜜桃| av片东京热男人的天堂| 欧美精品高潮呻吟av久久| 中文字幕色久视频| 精品一品国产午夜福利视频| 欧美精品av麻豆av| 国产毛片在线视频| 一区二区三区四区激情视频| 90打野战视频偷拍视频| 一级毛片我不卡| 丝袜美腿诱惑在线| 成年人午夜在线观看视频| 国产成人精品久久二区二区91 | 99精国产麻豆久久婷婷| 2021少妇久久久久久久久久久| 亚洲第一区二区三区不卡| 日本欧美国产在线视频| 电影成人av| 少妇 在线观看| 亚洲一区二区三区欧美精品| 免费看av在线观看网站| 久久精品久久久久久噜噜老黄| 男人舔女人的私密视频| 桃花免费在线播放| 久久狼人影院| 久久久久人妻精品一区果冻| 99re6热这里在线精品视频| 校园人妻丝袜中文字幕| 久久精品人人爽人人爽视色| 美国免费a级毛片| 免费观看人在逋| 免费日韩欧美在线观看| 亚洲激情五月婷婷啪啪| 亚洲精品国产区一区二| 亚洲美女视频黄频| 亚洲欧美色中文字幕在线| 一级片'在线观看视频| 一区二区日韩欧美中文字幕| 欧美久久黑人一区二区| 五月开心婷婷网| 9191精品国产免费久久| 在线看a的网站| 欧美精品亚洲一区二区| 成人手机av| 婷婷色av中文字幕| 久久这里只有精品19| 国产野战对白在线观看| 久久久国产一区二区| 一区二区日韩欧美中文字幕| 91老司机精品| videosex国产| 欧美人与性动交α欧美软件| 色精品久久人妻99蜜桃| 亚洲精品中文字幕在线视频| 亚洲国产av影院在线观看| 久久久国产欧美日韩av| 亚洲国产中文字幕在线视频| 熟女av电影| 久久99热这里只频精品6学生| 伦理电影大哥的女人| 天天躁日日躁夜夜躁夜夜| 亚洲欧美精品自产自拍| 国产亚洲av高清不卡| 亚洲色图 男人天堂 中文字幕| 亚洲精品国产av蜜桃| av片东京热男人的天堂| 午夜福利乱码中文字幕| 我的亚洲天堂| 成人亚洲欧美一区二区av| 人妻人人澡人人爽人人| 亚洲国产欧美一区二区综合| 性色av一级| 日本一区二区免费在线视频| 丝袜喷水一区| 国产亚洲最大av| 精品少妇黑人巨大在线播放| 久久精品国产综合久久久| 黄频高清免费视频| 国产亚洲av高清不卡| 日本午夜av视频| 十八禁高潮呻吟视频| 精品午夜福利在线看| 亚洲人成网站在线观看播放| 亚洲情色 制服丝袜| 成人免费观看视频高清| 色婷婷久久久亚洲欧美| 国产黄频视频在线观看| 国产深夜福利视频在线观看| 久久久国产一区二区| 久久亚洲国产成人精品v| 啦啦啦在线免费观看视频4| 国产高清不卡午夜福利| 9热在线视频观看99| 只有这里有精品99| 伊人久久大香线蕉亚洲五| 久久久久视频综合| tube8黄色片| 极品人妻少妇av视频| 丝袜喷水一区| 多毛熟女@视频| 99国产精品免费福利视频| 色播在线永久视频| 午夜福利网站1000一区二区三区| 日本欧美国产在线视频| 成年美女黄网站色视频大全免费| 久久久久精品性色| 亚洲天堂av无毛| 国产无遮挡羞羞视频在线观看| 亚洲精品日韩在线中文字幕| 超碰97精品在线观看| 18在线观看网站| xxxhd国产人妻xxx| 欧美日韩一区二区视频在线观看视频在线| 大片免费播放器 马上看| 51午夜福利影视在线观看| 99热全是精品| 日本wwww免费看| 亚洲国产看品久久| 日本av手机在线免费观看| 成人亚洲欧美一区二区av| 久久久久精品性色| 欧美人与性动交α欧美精品济南到| 亚洲精品一区蜜桃| 免费av中文字幕在线| 久久精品国产亚洲av涩爱| 欧美乱码精品一区二区三区| 亚洲av中文av极速乱| 午夜精品国产一区二区电影| 中文字幕色久视频| 人妻一区二区av| netflix在线观看网站| 久久久久久久久久久久大奶| 18禁动态无遮挡网站| 中文字幕色久视频| 欧美黑人欧美精品刺激| 婷婷色综合www| 又大又爽又粗| 亚洲国产精品国产精品| 久久久久精品国产欧美久久久 | 丝瓜视频免费看黄片| 一级片'在线观看视频| 深夜精品福利| 一本久久精品| 一区二区三区精品91| 亚洲精品国产区一区二| 国产极品天堂在线| 亚洲熟女毛片儿| 亚洲人成电影观看| 亚洲国产精品成人久久小说| 国产成人精品久久久久久| 一本久久精品| 精品国产一区二区三区久久久樱花| 国产免费视频播放在线视频| 欧美日本中文国产一区发布| 免费观看性生交大片5| 欧美日本中文国产一区发布| 久久97久久精品| av有码第一页| 亚洲成人手机| 国产av精品麻豆| 亚洲自偷自拍图片 自拍| 国产女主播在线喷水免费视频网站| 婷婷色av中文字幕| 国产一区亚洲一区在线观看| 91精品三级在线观看| 免费在线观看视频国产中文字幕亚洲 | 国产xxxxx性猛交| 久久久久久久精品精品| 满18在线观看网站| 女的被弄到高潮叫床怎么办| 国产男女内射视频| 看十八女毛片水多多多| 最近的中文字幕免费完整| 亚洲美女视频黄频| 国产成人午夜福利电影在线观看| 99九九在线精品视频| 18在线观看网站| 新久久久久国产一级毛片| 在线观看国产h片| 丝袜美腿诱惑在线| 啦啦啦啦在线视频资源| 久久久久国产一级毛片高清牌| 国产精品二区激情视频| 日本欧美国产在线视频| 欧美人与性动交α欧美精品济南到| 日韩视频在线欧美| 高清不卡的av网站| 天天躁夜夜躁狠狠久久av| 久久久久久人妻| 丰满乱子伦码专区| 99精国产麻豆久久婷婷| 久久精品久久久久久久性| 可以免费在线观看a视频的电影网站 | 午夜激情久久久久久久| 国产在线免费精品| 一级a爱视频在线免费观看| 日韩制服骚丝袜av| 熟女av电影| 欧美人与性动交α欧美软件| 久久天躁狠狠躁夜夜2o2o | 丁香六月天网| 大片电影免费在线观看免费| 久久亚洲国产成人精品v| 久久97久久精品| 90打野战视频偷拍视频| 日韩欧美精品免费久久| 亚洲七黄色美女视频| 国产精品免费视频内射| 国产黄频视频在线观看| 久久久久久久大尺度免费视频| 日本wwww免费看| 亚洲欧美色中文字幕在线| 欧美中文综合在线视频| 国产一区二区三区综合在线观看| 亚洲欧美中文字幕日韩二区| 亚洲国产av新网站| 国产毛片在线视频| 亚洲一区中文字幕在线| 少妇人妻 视频| 亚洲精华国产精华液的使用体验| 女人爽到高潮嗷嗷叫在线视频| 日本av免费视频播放| 精品一区二区三卡| 在线观看免费高清a一片| 汤姆久久久久久久影院中文字幕| 亚洲国产毛片av蜜桃av| 啦啦啦视频在线资源免费观看| 亚洲一区二区三区欧美精品| 在线观看人妻少妇| 日本爱情动作片www.在线观看| 老鸭窝网址在线观看| av在线app专区| 观看美女的网站| 成人毛片60女人毛片免费| 亚洲图色成人| 亚洲情色 制服丝袜| 国产女主播在线喷水免费视频网站| 亚洲av成人不卡在线观看播放网 | 日本猛色少妇xxxxx猛交久久| 色94色欧美一区二区| 性色av一级| 国产激情久久老熟女| 美女脱内裤让男人舔精品视频| 国产精品久久久久久精品古装| 免费久久久久久久精品成人欧美视频| 亚洲人成77777在线视频| 国产无遮挡羞羞视频在线观看| 国产男女内射视频| 叶爱在线成人免费视频播放| 黄网站色视频无遮挡免费观看| 精品一区二区三区四区五区乱码 | 日韩制服丝袜自拍偷拍| 亚洲av福利一区| 亚洲精华国产精华液的使用体验| 啦啦啦视频在线资源免费观看| 亚洲国产精品一区二区三区在线|