• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向數(shù)字人文的中國古代典籍詞性自動標(biāo)注研究
    ——以SikuBERT預(yù)訓(xùn)練模型為例*

    2022-06-17 09:03:00耿云冬張逸勤王東波
    圖書館論壇 2022年6期
    關(guān)鍵詞:典籍分詞古文

    耿云冬,張逸勤,劉 歡,王東波

    0 引言

    “人文計算”(Humanities Computing)或稱“數(shù)字人文”(Digital Humanities),肇始于1949年[1]。彼時意大利神父羅伯托·布薩(Roberto Busa)借助計算機(jī)為神學(xué)家阿奎那(Thomas Aquinas)的全集編制中世紀(jì)拉丁文字詞索引。此后依托計算機(jī)技術(shù)開展人文社會科學(xué)的方法日漸流行,數(shù)字人文研究理念也應(yīng)運(yùn)而生。作為全新的方法論,數(shù)字人文研究的顯著特征是基于大規(guī)模數(shù)字化語料,針對具體的研究對象開展數(shù)據(jù)化分析,以期揭示語料背后隱藏的規(guī)律、趨勢,發(fā)現(xiàn)新知識。1980年代以來,中國古文典籍文本數(shù)字化工作發(fā)展迅速,產(chǎn)生了大量的“原生性數(shù)字文本”與“再生性數(shù)字文本”,前者指從電子設(shè)備端直接輸入、可便捷共享的數(shù)字文本,后者指通過機(jī)器掃描轉(zhuǎn)錄而成的數(shù)字文本[2]。然而,無論是“原生性數(shù)字文本”還是“再生性數(shù)字文本”,體現(xiàn)的是典籍文本的“數(shù)字化”轉(zhuǎn)化成績,海量的數(shù)字化古籍文本仍主要用于檢索瀏覽,更多充當(dāng)印刷資源或影印資源的替代物,缺乏結(jié)構(gòu)化的知識組織和深度利用[3],距離成為計算對象還很遙遠(yuǎn)[1]。換言之,面向數(shù)字人文研究的深度利用率亟待提升[4]。眾所周知,古文典籍的重要性不僅在于它們具備文獻(xiàn)學(xué)價值,更在于蘊(yùn)藏的“中國元典精神”[5],借助數(shù)字人文研究方法,推進(jìn)古籍文獻(xiàn)由數(shù)字化向數(shù)據(jù)化轉(zhuǎn)變,使其成為可分析、計算的對象,能更加有效揭示與深刻闡述載于古文典籍的元典精神,有效促進(jìn)其現(xiàn)代轉(zhuǎn)換和現(xiàn)世啟迪。近年隨著深度學(xué)習(xí)技術(shù)與預(yù)訓(xùn)練語言模型創(chuàng)新,如何推進(jìn)古籍文本的數(shù)字化處理向數(shù)據(jù)化研究縱深發(fā)展,進(jìn)而提升我國數(shù)字人文研究水平,為世界數(shù)字人文研究發(fā)展貢獻(xiàn)“中國智慧”,成為時代課題。

    基于多年來積累的古籍?dāng)?shù)字化資源,筆者所在團(tuán)隊以2018年發(fā)布的BERT預(yù)訓(xùn)練語言模型為基礎(chǔ),面向繁體中文的典籍文本開發(fā)了SikuBERT和SikuRoBERTa兩個預(yù)訓(xùn)練模型,并在自動分詞、詞性標(biāo)注、斷句、實(shí)體識別等各個層面展開了驗(yàn)證,結(jié)果表明這兩個模型均達(dá)到了較高的精度。本文聚焦團(tuán)隊在典籍文本詞性自動標(biāo)注方面所做的探索與成果。從本質(zhì)上說,詞性是一個詞在與其他詞組合時所顯示出來的語法性質(zhì)。在自然語言處理領(lǐng)域,詞性標(biāo)注則是根據(jù)上下文語境信息,構(gòu)建并運(yùn)用適當(dāng)?shù)乃惴P?,在給定的語篇或句子中判定每個語詞的語法范疇,根據(jù)其語法作用加注詞性標(biāo)記的過程。然而中國典籍文本中詞界模糊,詞的兼類現(xiàn)象普遍而靈活。對古文典籍文本中的語詞進(jìn)行切分和標(biāo)注詞性困難較大。但古文典籍文本詞性自動標(biāo)注研究具有重要意義:高精度的詞性自動標(biāo)注有利于更準(zhǔn)確地挖掘古文典籍文本中的隱性知識,有利于以語詞為粒度開展更具深度的古文應(yīng)用工作[6],如古漢語詞典編纂、古籍跨語翻譯、中華元典精神挖掘,從而實(shí)現(xiàn)更高效的人文計算研究。

    本文旨在呈現(xiàn)SikuBERT模型在16部古文典籍詞性標(biāo)注層面的實(shí)驗(yàn)設(shè)計及其結(jié)果,研究內(nèi)容主要包括:述評1980年代以來針對古文典籍文本詞性自動標(biāo)注的代表性研究成果;概要介紹SikuBERT預(yù)訓(xùn)練語言模型的構(gòu)建背景;闡述基于SikuBERT預(yù)訓(xùn)練語言模型的詞性自動標(biāo)注實(shí)驗(yàn)設(shè)計及結(jié)果分析;展示“SIKU-BERT典籍智能處理系統(tǒng)”的詞性自動標(biāo)注功能設(shè)計及應(yīng)用;對數(shù)字人文視閾下的古文典籍文本詞性自動標(biāo)注可以繼續(xù)拓展的研究方向做出展望。

    1 研究現(xiàn)狀

    詞性是詞的詞類屬性,“是一個個具體的詞跟名詞、動詞、形容詞……等詞類標(biāo)簽之間的映射(指派)關(guān)系”[7]。詞性自動標(biāo)注工作就是利用語言學(xué)知識和計算機(jī)技術(shù)標(biāo)注文本中每個詞的詞性,也就是確定該詞屬于名詞、動詞、形容詞還是其他詞性的過程。詞性自動標(biāo)注是古文智能處理最基礎(chǔ)的工作之一,其準(zhǔn)確性會影響信息檢索、語法分析、語義分析、機(jī)器翻譯、語音合成、知識挖掘等后續(xù)任務(wù)實(shí)現(xiàn)的效果。目前,面向漢語文本的詞性自動標(biāo)注方法主要有四種,即基于規(guī)則的方法、基于統(tǒng)計模型的方法、融合規(guī)則與統(tǒng)計的混合方法以及基于深度學(xué)習(xí)技術(shù)的預(yù)訓(xùn)練語言模型方法。這些方法在漢語文本的詞性標(biāo)注工作中都有所應(yīng)用并不斷改進(jìn),而且學(xué)界對詞性標(biāo)注問題的研究重心近年來也由現(xiàn)代漢語文本逐漸轉(zhuǎn)向古籍文本。

    1.1 基于規(guī)則的詞性自動標(biāo)注

    基于規(guī)則的詞性自動標(biāo)注方法始于1970年代,主要得益于英語語料庫建設(shè)對詞性自動標(biāo)注的探索,其基本理念是:基于語言學(xué)的詞性/詞類①研究成果[8],利用詞典手動編制標(biāo)注規(guī)則,然后依據(jù)上下文信息,為語詞確定適切的詞性。在該方法中,“規(guī)則知識庫”的構(gòu)造是關(guān)鍵,需要考慮兩個基本問題:規(guī)則對語言現(xiàn)象的覆蓋率和規(guī)則處理的正確率[9]。該方法的優(yōu)勢在于可以參考語言學(xué)理論研究成果,規(guī)則表達(dá)清晰,借助語境信息可以實(shí)現(xiàn)對語詞的詞性特征的細(xì)致描述,消歧效果較好[10],而且可應(yīng)用范圍較廣。然而基于規(guī)則的詞性自動標(biāo)注方法其缺陷也較為明顯:人工構(gòu)造規(guī)則知識庫耗時費(fèi)力,規(guī)則的嚴(yán)寬劃分存在較大主觀性,規(guī)則應(yīng)用的一致性較弱,機(jī)器對規(guī)則的自動學(xué)習(xí)效果較差。從本質(zhì)上說,基于規(guī)則的詞性自動標(biāo)注是“一種確定性的演繹推理方法”[11],這就決定其在自然語言處理中的魯棒性較弱。

    1.2 基于統(tǒng)計模型的詞性自動標(biāo)注

    基于統(tǒng)計的詞性標(biāo)注方法得益于經(jīng)驗(yàn)主義方法在計算語言學(xué)研究的廣泛應(yīng)用。該方法的基本理念是:首先制訂詞性標(biāo)記集;然后,由人工對一定數(shù)量的語料展開詞性標(biāo)記工作;接下來交由計算機(jī)學(xué)習(xí)、統(tǒng)計人工標(biāo)注的語料,獲得相關(guān)頻率數(shù)據(jù)(如標(biāo)記同現(xiàn)頻率、語詞表現(xiàn)為某一詞類的頻率);最后基于頻率數(shù)據(jù),構(gòu)建統(tǒng)計模型,應(yīng)用于詞性判定任務(wù)[12]。在該方法中,基于特征模板的統(tǒng)計模型建構(gòu)是關(guān)鍵。在不斷改進(jìn)的各種算法模型中,得到比較廣泛應(yīng)用的主要有“隱馬爾可夫模型”(Hidden Markov Model)、“最大熵模型”(Maximum Entropy Models)和“條件隨機(jī)場”(Conditional Random Fields,)3種②。

    隱馬爾可夫模型是一種面向隨機(jī)序列數(shù)據(jù)處理的統(tǒng)計模型,基于該模型的詞性自動標(biāo)注方法通常假設(shè)中心詞的詞性僅與它前面的n個詞有關(guān),而與中心詞后面的詞無關(guān)。然而,現(xiàn)實(shí)中的情況往往并非如此[13]。為此,研究者針對基于隱馬爾可夫模型的詞性標(biāo)注方法做了很多改進(jìn)。袁里馳提出將馬爾可夫族模型與句法分析相結(jié)合的方法來進(jìn)行詞性自動標(biāo)注,實(shí)驗(yàn)結(jié)果表明,相較于隱馬爾可夫模型,馬爾可夫族模型的性能更優(yōu)[14]。

    最大熵原理是統(tǒng)計學(xué)習(xí)的一般原理,其基本理念是:學(xué)習(xí)概率模型時,在所有可能的概率分布中,熵最大的模型就是最好的模型。換言之,在只掌握關(guān)于未知分布的部分知識時,應(yīng)當(dāng)選取滿足全部已知條件但熵值最大的概率分布[15]。該方法充分利用語詞所處的上下文信息,但是也面臨著“標(biāo)簽偏見(label bias)”的不足[13]。針對其不足,研究者也在不斷改進(jìn)基于最大熵模型的詞性自動標(biāo)注方法。例如,趙偉等立足漢語語言特點(diǎn),重視特征提取問題,提出一種新的最大熵模型,采用BLMVM算法和Gaussian prior平滑技術(shù),設(shè)計出基于漢語的詞和字特征的詞性自動標(biāo)注系統(tǒng),標(biāo)注效果較為理想[15]。

    條件隨機(jī)場是一種指數(shù)型模型,基本理念是:通過建立概率模型來標(biāo)注序列數(shù)據(jù),使用復(fù)雜、有重疊性和非獨(dú)立的特征展開訓(xùn)練和推理[13]。相較于隱馬爾可夫模型和最大熵模型,條件隨機(jī)場似乎更受自然語言處理研究者的青睞,相關(guān)研究成果更多,代表性研究包括:石民等以《左傳》文本作為實(shí)驗(yàn)語料,提出基于條件隨機(jī)場的一體化詞性標(biāo)注方法,實(shí)驗(yàn)結(jié)果表明F值可以達(dá)到89.65%[16]。留金騰等針對上古漢語文獻(xiàn)《淮南子》語料庫構(gòu)建過程中的自動分詞及詞性自動標(biāo)注工作做了探究,嘗試使用Domain Adaptation(領(lǐng)域適應(yīng))方法,并以一定量來自目標(biāo)領(lǐng)域的Seed Data(種子數(shù)據(jù))為基礎(chǔ),采用條件隨機(jī)場模型以及特征模板,顯著提高了詞性自動標(biāo)注的準(zhǔn)確率,最高得到80.81%的準(zhǔn)確率[17]。朱曉等以《明史》文本作為實(shí)驗(yàn)語料,通過交叉檢驗(yàn)方法比較基于條件隨機(jī)場的“無邊圖模型”“完全圖模型”“嵌套圖模型”3種圖模型在古漢語詞性自動標(biāo)注中的應(yīng)用。實(shí)驗(yàn)結(jié)果表明,完全圖模型與嵌套圖模型在詞性自動標(biāo)注中的效果更優(yōu),并提出分詞在一定程度上有助于提升古漢語詞性自動標(biāo)注效率[18]。

    相較于基于規(guī)則的方法,基于統(tǒng)計的方法優(yōu)勢在于它的全部知識是通過對大規(guī)模語料庫的參數(shù)訓(xùn)練自動得到的,標(biāo)注結(jié)果有較高的一致性和較廣的覆蓋率,并且可以將一些不確定的知識定量化分析[10]。因此,在面向漢語的自然語言處理領(lǐng)域,基于統(tǒng)計的詞性自動標(biāo)注方法更受青睞,當(dāng)前應(yīng)用更廣泛。然而,該方法也并非完美無缺:當(dāng)訓(xùn)練語料達(dá)到一定規(guī)模后,通過擴(kuò)大語料規(guī)模來提高準(zhǔn)確率將變得困難[19],而且特定的統(tǒng)計模型在應(yīng)用范圍上都具有領(lǐng)域性,一旦使用領(lǐng)域發(fā)生變換,模型效用度也可能隨之減弱[20]。

    1.3 基于混合方法的詞性自動標(biāo)注

    基于規(guī)則的詞性標(biāo)注方法和基于統(tǒng)計的詞性標(biāo)注方法各有優(yōu)劣,很多研究者在實(shí)際應(yīng)用會對兩種方法加以組合,甚至做出更大改進(jìn),以建構(gòu)更加符合漢語特性的詞性自動標(biāo)注方法。例如,周強(qiáng)將規(guī)則和統(tǒng)計相結(jié)合設(shè)計出一種新的軟件系統(tǒng),并對封閉語料和開放語料的詞性自動標(biāo)注展開實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明正確率分別達(dá)到96.06%和95.82%[10];張民等引入“置信區(qū)間”概念,提出一種統(tǒng)計和規(guī)則并舉的漢語詞性自動標(biāo)注算法,在未考慮生詞和漢語詞錯誤切分的情況下,詞性自動標(biāo)注的準(zhǔn)確率分別達(dá)到98.9%(封閉測試結(jié)果)和98.1%(開放測試結(jié)果)[11];王東波等構(gòu)建包含45個特征在內(nèi)的組合特征模板,基于條件隨機(jī)場展開詞性自動標(biāo)注實(shí)驗(yàn),最終F值的均值達(dá)到90.40%,驗(yàn)證了組合特征模板在古籍文本詞性自動標(biāo)注中的優(yōu)勢[21]。

    1.4 基于深度學(xué)習(xí)的詞性自動標(biāo)注

    深度學(xué)習(xí)(Deep Learning)使用神經(jīng)網(wǎng)絡(luò)模擬人類智能,通常利用大量標(biāo)記的數(shù)據(jù)訓(xùn)練計算機(jī)執(zhí)行學(xué)習(xí)任務(wù),直至訓(xùn)練出一個成熟的模型。2018 年 Devlin 等 提 出 Bidirectional Encoder Representations from Transformers(BERT)[22]深度學(xué)習(xí)模型,引發(fā)學(xué)界關(guān)注。就本質(zhì)而言,BERT是自然語言處理領(lǐng)域最底層的語言模型,是一種基于Transformer架構(gòu)的神經(jīng)網(wǎng)絡(luò),具有強(qiáng)大特征提取能力,通過海量語料預(yù)訓(xùn)練,獲得序列當(dāng)前最全面的局部和全局特征表示。張琪等[20]認(rèn)為,深度學(xué)習(xí)模型可以自動提取豐富的上下文特征,能夠應(yīng)對傳統(tǒng)方法中存在的特征依賴、特征稀疏等問題。他們嘗試將BERT引入古漢語分詞詞性自動標(biāo)注研究,以經(jīng)過手工分詞并標(biāo)注詞性后得到的25部先秦古籍文本為實(shí)驗(yàn)語料,構(gòu)建分詞詞性標(biāo)注一體化模型,未加入任何人工特征的模型詞性標(biāo)注的準(zhǔn)確率達(dá)到88.97%,該研究還進(jìn)一步把基于BERT開發(fā)的分詞詞性標(biāo)注一體化模型應(yīng)用于未經(jīng)人工處理的《史記》文本詞性自動標(biāo)注,發(fā)現(xiàn)該模型的分詞和詞性標(biāo)注效果穩(wěn)定,實(shí)用性較強(qiáng)。該研究為把BERT等深度學(xué)習(xí)模型應(yīng)用于古籍文本詞性自動標(biāo)注做了積極探索。

    綜上而言,現(xiàn)有面向漢語的詞性自動標(biāo)注研究以基于統(tǒng)計方法為主,存在提升空間:一是面向現(xiàn)代漢語語料的探索偏多,面向古文典籍的探索亟待深化;二是以建語料庫為導(dǎo)向的詞性標(biāo)注需要轉(zhuǎn)向以服務(wù)數(shù)字人文研究為目標(biāo)的詞性標(biāo)注;三是產(chǎn)生于機(jī)器學(xué)習(xí)時代的詞性標(biāo)注方法需要升級到深度學(xué)習(xí)時代的預(yù)訓(xùn)練語言模型方法。隨著技術(shù)發(fā)展以及標(biāo)注需求的細(xì)化,基于深度學(xué)習(xí)的模型正日益成為該領(lǐng)域的研究熱點(diǎn)與發(fā)展趨勢。

    2 SikuBERT模型構(gòu)建背景

    從工作原理看,BERT模型基于自注意力機(jī)制對文本進(jìn)行建模,Transformer強(qiáng)大的特征提取能力使BERT相對于循環(huán)神經(jīng)網(wǎng)絡(luò)模型具有天然優(yōu)勢。此外,采用雙向語言模型可同時提取語詞的上下文信息,使語詞的表示具有更豐富的語義。BERT的語言數(shù)據(jù)訓(xùn)練分為兩個階段:預(yù)訓(xùn)練(Pre-training)和微調(diào)(Fine-tuning)。具體而言,BERT模型在預(yù)訓(xùn)練階段利用Transformer的雙向編碼器根據(jù)上下文雙向轉(zhuǎn)換解碼,同RNN模型相比,Transformer具有并行化處理功能,為了實(shí)現(xiàn)雙向理解使用Masked Language Model遮蓋部分詞語并在訓(xùn)練過程中對這些詞語進(jìn)行預(yù)測,以及利用Next Sentence Prediction 方法進(jìn)行句子級別的表示,使模型學(xué)習(xí)兩個句子之間的關(guān)系。預(yù)訓(xùn)練階段之后,基于訓(xùn)練語料對模型進(jìn)行有監(jiān)督的微調(diào)使其能夠應(yīng)用到各種任務(wù)場景中。目前預(yù)訓(xùn)練語言模型已在英語和現(xiàn)代漢語文本上極大地提升了文本挖掘的精度。

    當(dāng)前基于BERT預(yù)訓(xùn)練模型開發(fā)的古籍文本智能處理方法主要包括Google 官方提供的Bert-Base-Chinese、哈工大訊飛聯(lián)合實(shí)驗(yàn)室(HFL)提供的RoBERTa、北京理工大學(xué)提供的GuwenBERT。其中,Bert-Base-Chinese和RoBERTa是基于中文維基百科預(yù)訓(xùn)練的包含簡體與繁體中文的預(yù)訓(xùn)練模型,GuwenBERT是基于殆知閣古文文獻(xiàn)訓(xùn)練的簡體中文預(yù)訓(xùn)練模型。相較于殆知閣古文文獻(xiàn),中文維基百科在語法上與典籍文獻(xiàn)有較大差異。然而,基于殆知閣古文文獻(xiàn)訓(xùn)練的GuwenBERT 卻又是基于簡體中文的預(yù)訓(xùn)練模型。可以預(yù)見,在繁體中文的典籍文獻(xiàn)命名實(shí)體識別中,上述三個預(yù)訓(xùn)練模型皆有其優(yōu)點(diǎn)而又有明顯的不足。有鑒于此,南京農(nóng)業(yè)大學(xué)信息管理學(xué)聯(lián)合南京師范大學(xué)文學(xué)院、南京理工大學(xué)經(jīng)濟(jì)管理學(xué)院開發(fā)“SIKU-BERT 典籍智能處理系統(tǒng)”。以《四庫全書》繁體版本語料為實(shí)驗(yàn)數(shù)據(jù),基于SikuBERT 預(yù)訓(xùn)練模型開展了自動分詞、詞性自動標(biāo)注、自動斷句、命名實(shí)體識別等下游任務(wù)實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,SikuBERT預(yù)訓(xùn)練模型的效能較上述三個預(yù)訓(xùn)練模型均有不同幅度的提升。下文著重介紹基于SikuBERT模型的詞性自動標(biāo)注實(shí)驗(yàn)。

    3 實(shí)驗(yàn)設(shè)計

    3.1 數(shù)據(jù)描述

    本研究實(shí)驗(yàn)設(shè)計利用BERT進(jìn)行特征提取,使用經(jīng)過大型語料庫預(yù)訓(xùn)練的BERT創(chuàng)建語境化的字嵌入,進(jìn)而作為后續(xù)模型的輸入。實(shí)驗(yàn)數(shù)據(jù)來源于“中國哲學(xué)書電子化計劃”網(wǎng)站(https://ctext.org/confucianism/zhs.),站內(nèi)收錄了逾3萬部中國歷代傳世文獻(xiàn),提供中英文版本。針對前人研究多使用單本或同類典籍文本作為語料來源而導(dǎo)致模型普適性較差的不足,文章從該網(wǎng)站爬取16部不同類型的典籍作為實(shí)驗(yàn)語料,包括《周易》《周禮》《孝經(jīng)》《論衡》《孫子兵法》《史記》《商君書》《墨子》《莊子》《公孫龍子》《孟子》《論語》《禮記》《戰(zhàn)國策》《尚書》《道德經(jīng)》。通過人工摘錄的方式,以編碼、中文句子、英文和典籍名稱4個字段存儲在Excel 中,樣例見圖1,構(gòu)建完成古-英典籍平行語料庫。

    圖1 數(shù)據(jù)摘錄樣例

    本研究的古文分詞標(biāo)準(zhǔn)主要參照南京農(nóng)業(yè)大學(xué)領(lǐng)域知識關(guān)聯(lián)中心制訂的《南京農(nóng)業(yè)大學(xué)古漢語分詞與詞性標(biāo)注規(guī)范》。該規(guī)范以國家標(biāo)準(zhǔn)《漢語信息處理詞匯》《現(xiàn)代漢語語料庫加工——詞語切分與詞性標(biāo)注規(guī)范與手冊》《南京農(nóng)業(yè)大學(xué)領(lǐng)域知識關(guān)聯(lián)研究中心語料標(biāo)注及校對規(guī)范》《南京農(nóng)業(yè)大學(xué)古漢語詞性標(biāo)記集(NACP)標(biāo)準(zhǔn)規(guī)范》為基礎(chǔ),以信息處理應(yīng)用為目的,根據(jù)古漢語的特點(diǎn)及規(guī)律,規(guī)定古漢語的分詞與詞性標(biāo)注原則。最終語料庫中源語言即古文標(biāo)注后的樣例(源自《孟子·梁惠王上》)如下所示:

    孟子/nr見/v梁惠王/nr,/w王/nr立/v於/p沼/n上/f,/w 顧/v 鴻雁/n 麋鹿/n,/w 曰/v:/w“/w 賢/n者/r亦/d樂/v此/r乎/y?/w”/w

    在數(shù)據(jù)準(zhǔn)備階段,將已進(jìn)行分詞的語料使用句末終點(diǎn)符如句號、問號等對句子進(jìn)行切分,并將每一個句子作為一行輸入。按照語料斷句,以{B,E,I,S}為標(biāo)記集合,B代表句首字,E代表句尾字,I代表當(dāng)句子長度大于3時的中間字,S代表單字成句。訓(xùn)練語料摘錄樣例如表1。

    表1 訓(xùn)練語料摘錄樣例

    實(shí)驗(yàn)中,以隨機(jī)的順序?qū)?shù)據(jù)集分為10份,其中9份作為訓(xùn)練集,1份為測試集,并使用十折交叉驗(yàn)證(10-fold cross-validation)方法增大數(shù)據(jù)集,輪流將十份數(shù)據(jù)中九份作為訓(xùn)練數(shù)據(jù),增強(qiáng)實(shí)驗(yàn)準(zhǔn)確性,減小誤差。預(yù)測情況與真實(shí)情況之間的混淆矩陣見表2。

    表2 混淆矩陣

    評價模型分詞水平常用評價指標(biāo)包括3個:精確率P(Precision)、召回率R(Recall)以及調(diào)和平均值F1(F1-score)。其中,準(zhǔn)確率和召回率分別體現(xiàn)了模型分詞的精確程度和全面程度,而調(diào)和平均值綜合了兩者的優(yōu)點(diǎn),避免二者差距過大的情況,能更客觀評價分詞結(jié)果,是實(shí)驗(yàn)中關(guān)鍵的評價指標(biāo),所用3個計算公式如下:

    3.2 參數(shù)設(shè)置

    本實(shí)驗(yàn)選取的實(shí)驗(yàn)工具與環(huán)境為Pytorch1.4.0與Python3.7。在實(shí)驗(yàn)中,SikuBERT 模型的超參數(shù)均調(diào)整至最佳狀態(tài)。表3展示模型在任務(wù)環(huán)境下最佳狀態(tài)的主要超參數(shù)設(shè)置。

    表3 實(shí)驗(yàn)主要超參數(shù)設(shè)置

    3.3 實(shí)驗(yàn)結(jié)果分析

    根據(jù)本次實(shí)驗(yàn)十折交叉結(jié)果,記錄了每組的準(zhǔn)確率、召回率和調(diào)和平均值作為判斷模型性能的標(biāo)準(zhǔn),如表4所示。

    表4 十組數(shù)據(jù)測驗(yàn)的準(zhǔn)確率、召回率和F1值

    為便于比較,選擇觀察結(jié)果較為直觀的柱狀圖來反映本次實(shí)驗(yàn)?zāi)P偷目傮w性能,以十折交叉十組實(shí)驗(yàn)組次為橫軸,各組的各項指標(biāo)平均值為縱軸,圍繞模型訓(xùn)練結(jié)果制成圖2。

    圖2 十折模型指標(biāo)平均值

    通過對十折交叉整體調(diào)和平均值的比較分析,可知本實(shí)驗(yàn)的詞性標(biāo)簽總體預(yù)測準(zhǔn)確率達(dá)89.64%、召回率達(dá)90.03%、F1值達(dá)89.83%。實(shí)驗(yàn)證明,SikuBERT模型的整體效果均比較優(yōu)越。為進(jìn)一步分析實(shí)驗(yàn)結(jié)果,以第六組實(shí)驗(yàn)為例(表5),具體分析詞性自動標(biāo)注結(jié)果。其中,標(biāo)簽w(標(biāo)點(diǎn)符號)、y(語氣詞)、u(助詞)、r(代詞)、m(數(shù)詞)、p(介詞)、d(副詞)的識別準(zhǔn)確率均達(dá)到90%以上,標(biāo)簽c(連詞)、n(普通名詞)、v(一般動詞)的識別準(zhǔn)確率達(dá)到88%左右,而由于標(biāo)簽j(兼詞)、i(詞綴)、q(量詞)存在有效識別數(shù)量較少的問題,在本文中的研究意義不大,忽略不計。

    表5 第六組實(shí)驗(yàn)的準(zhǔn)確率、召回率和F1值

    從上述實(shí)驗(yàn)結(jié)果可知,SikuBERT模型在古文典籍文本詞性自動標(biāo)注方面取得了較理想的效果。相比傳統(tǒng)機(jī)器學(xué)習(xí)模型及常見的深度學(xué)習(xí)模型,SikuBERT模型在詞性自動標(biāo)注這一下游任務(wù)上效果有較大提升,更適應(yīng)海量規(guī)模的典籍任務(wù)處理,助推數(shù)字人文研究向縱深發(fā)展。

    4 SIKU-BERT 平臺詞性自動標(biāo)注功能設(shè)計及應(yīng)用

    基于python語言,使用PyQt5圖形界面編程,構(gòu)建單機(jī)版“SIKU-BERT典籍智能處理系統(tǒng)”。該平臺1.0版本實(shí)現(xiàn)了文本分類、自動分詞與詞性自動標(biāo)注、自動斷句、實(shí)體自動識別等功能,能輔助減少數(shù)字人文研究者在文本處理上的消耗。在構(gòu)建“SIKU-BERT 典籍智能處理系統(tǒng)”(單機(jī)版)詞性自動標(biāo)注功能時,首先利用《漢語大詞典》的分詞文本對SikuBERT的訓(xùn)練集進(jìn)行擴(kuò)充,提升模型對非史籍文本分詞的準(zhǔn)確性;然后,基于分詞文本進(jìn)行詞性自動標(biāo)注。通過對代碼的整合,實(shí)現(xiàn)單句詞性自動標(biāo)注、單文本文件詞性自動標(biāo)注和多文本文件詞性自動標(biāo)注功能,以適用于不同規(guī)模文本的處理。軟件中的分詞按鈕通過PyQt5的信號發(fā)送功能與作為槽函數(shù)的分詞函數(shù)相連接,分詞函數(shù)的參數(shù)見表6。

    表6 詞性標(biāo)注函數(shù)的參數(shù)和功能

    在以上參數(shù)中,inputpath和outputpath用于接受用戶輸入的待處理文件路徑和處理后輸出的文件路徑,輸入文件中每個序列的長度一般控制在512以下,對于單個過長的序列則截斷為多個子序列。軟件能夠以CPU和GPU兩種方式運(yùn)行,從而最大限度地利用計算資源。圖3 為“SIKU-BERT典籍智能處理系統(tǒng)”主界面截圖,用戶單擊“單文本模式”和“語料庫模式”按鈕后即可跳轉(zhuǎn)至詞性自動標(biāo)注界面。

    圖3 SIKU-BERT古文智能處理平臺主界面

    在單文本模式下,用戶只需在界面左側(cè)“原始文本”導(dǎo)入待處理語料,單擊詞性標(biāo)注按鈕,系統(tǒng)即可在右側(cè)自動生成古籍文本詞性標(biāo)注結(jié)果。如圖4所示,選取《史記·陳涉世家》中的部分文本內(nèi)容作為樣例,能看到在右側(cè)的處理結(jié)果中,幾乎正確地切分所有人名、地名、官職等單字詞與雙字詞,并且對切分的字詞標(biāo)注出相對應(yīng)的不同詞性標(biāo)簽,適用于對一般古籍的處理。

    圖4 SIKU-BERT古文智能處理平臺“單文本模式”詞性自動標(biāo)注示例

    當(dāng)用戶需要處理大規(guī)模文本時,可選擇“語料庫模式”進(jìn)入系統(tǒng)(如圖5所示),單擊瀏覽按鈕選取待處理文件夾和輸出文件夾,再點(diǎn)擊詞性標(biāo)注按鈕,即可自動調(diào)用Siku-BERT詞性自動標(biāo)注模型以實(shí)現(xiàn)對批量文本的詞性標(biāo)注任務(wù)。

    圖5 SIKU-BERT古文智能處理平臺“語料庫模式”詞性自動標(biāo)注示例

    為驗(yàn)證SIKU-BERT古文智能處理平臺“詞性自動標(biāo)注”功能的實(shí)用性,以二十四史文本為語料,在“語料庫模式”下做了進(jìn)一步的詞性自動標(biāo)注及應(yīng)用分析。限于篇幅,僅展示名詞自動標(biāo)注的頻次結(jié)果,如表7所示。

    表7 SIKU-BERT古文智能處理平臺對二十四史文本名詞自動標(biāo)注結(jié)果的頻次統(tǒng)計

    名詞的自動標(biāo)注、統(tǒng)計與分析對還原和理解歷史事件的重要性不言而喻。以地名為例,通過頻次分析可知哪些地域?yàn)楸冶貭幹?,見圖6。

    圖6 SIKU-BERT古文智能處理平臺對二十四史文本地名的自動標(biāo)注結(jié)果頻次統(tǒng)計(前10位)

    頻次排在首位的“河南”非指今日中國的省份,而是多指古代河套以南地區(qū)。如《史記·蒙恬列傳》載:“秦已並天下,乃使蒙恬將三十萬眾北逐戎狄,收河南?!崩迷~性自動標(biāo)注技術(shù),基于頻次統(tǒng)計和古籍文本細(xì)致比讀,可以幫助更好地挖掘和理解歷史。而以時間名詞為例,通過頻次分析,可知?dú)v史上權(quán)力更迭與事件頻發(fā)的時間段(如圖7所示),從而開展更為深入的史學(xué)知識挖掘與分析。

    圖7 SIKU-BERT古文智能處理平臺對二十四史文本時間名詞的自動標(biāo)注結(jié)果頻次統(tǒng)計(前10位)

    從“元年”“二年”“三年”“四年”之類的時間名詞可知,王朝更替或權(quán)力更迭初期往往發(fā)生重要?dú)v史事件。更為有趣的是,“七月”“三月”“二月”3個月份也是歷史上事件多發(fā)時間段,個中規(guī)律值得跨學(xué)科合作下的深度挖掘。綜上可知,詞性自動標(biāo)注作為基礎(chǔ)工作對從量化分析角度實(shí)現(xiàn)更好的數(shù)字人文研究具有重要助益。

    5 結(jié)論和展望

    面向數(shù)字人文研究的復(fù)雜需求,本文構(gòu)建SikuBERT預(yù)訓(xùn)練模型并針對其在古籍文本詞性自動標(biāo)注方面的效能展開實(shí)驗(yàn),驗(yàn)證了其良好性能,展示了所開發(fā)的“SIKU-BERT典籍智能處理系統(tǒng)”詞性自動標(biāo)注功能模塊的設(shè)計理念及應(yīng)用。后續(xù)研究應(yīng)擴(kuò)大作為研究對象的古籍文本數(shù)量,進(jìn)一步檢驗(yàn)和提升SikuBERT預(yù)訓(xùn)練模型在古漢語詞性自動標(biāo)注中的性能。同時,深入研究與詞性密切相關(guān)的更多特征項,推進(jìn)詞性自動標(biāo)注工作向更深層次發(fā)展,并與相關(guān)學(xué)科學(xué)者展開合作,推出更具深度的數(shù)字人文研究成果。

    注釋

    ①在漢語語法研究、辭書編纂等領(lǐng)域,“詞類”和“詞性”兩個術(shù)語的異同曾引發(fā)不少討論與爭鳴,本文傾向于萬眾(2020)的觀點(diǎn):“詞類”和“詞性”實(shí)為一個問題的兩面,“詞類”是就宏觀角度而言,針對詞的整體,確定類別,而“詞類”則是就微觀角度而言,針對詞的個體,進(jìn)行歸類。自然語言處理領(lǐng)域的詞性自動標(biāo)注本質(zhì)上就是利用計算機(jī)技術(shù)實(shí)現(xiàn)語詞自動歸類的問題。詳見:萬眾.詞類標(biāo)注還是詞性標(biāo)注[J].漢字文化,2020(13):118-121.

    ②其他基于統(tǒng)計的詞性自動標(biāo)注方法還有神經(jīng)元網(wǎng)絡(luò)、決策樹、線性分離網(wǎng)絡(luò)標(biāo)注模型、SVMTool等。限于篇幅,本文不詳細(xì)展開。

    猜你喜歡
    典籍分詞古文
    中古文學(xué)劄叢之二(五題)
    國學(xué)(2021年0期)2022-01-18 05:58:20
    《典籍里的中國》為什么火?
    金橋(2021年4期)2021-05-21 08:19:24
    古文中走出的“超能力者”
    稱象
    結(jié)巴分詞在詞云中的應(yīng)用
    智富時代(2019年6期)2019-07-24 10:33:16
    讀《隸定古文疏證》札記
    在詩詞典籍中賞春日盛景
    值得重視的分詞的特殊用法
    典籍翻譯模式的構(gòu)建與啟發(fā)
    先秦典籍中的男嬖形象探微
    午夜老司机福利剧场| 日韩在线高清观看一区二区三区| 国产精品久久久久久精品电影小说 | 尤物成人国产欧美一区二区三区| 亚洲精品日韩在线中文字幕| 人妻制服诱惑在线中文字幕| 成年av动漫网址| 91在线精品国自产拍蜜月| 女人久久www免费人成看片| 国产在线男女| 青春草国产在线视频| 午夜福利影视在线免费观看| 一级二级三级毛片免费看| 午夜激情久久久久久久| 一区二区三区精品91| 欧美日韩综合久久久久久| 亚洲,欧美,日韩| 免费av不卡在线播放| 欧美性感艳星| 精品久久久久久久末码| 久久久色成人| 国产无遮挡羞羞视频在线观看| 中文字幕免费在线视频6| 精品亚洲乱码少妇综合久久| 国产av码专区亚洲av| 国产极品天堂在线| 大码成人一级视频| 激情五月婷婷亚洲| 欧美少妇被猛烈插入视频| 国产淫语在线视频| 99久国产av精品国产电影| av国产久精品久网站免费入址| 免费大片18禁| 亚洲欧美日韩无卡精品| 最近中文字幕2019免费版| 久久久精品免费免费高清| 婷婷色av中文字幕| 日本欧美国产在线视频| 国产av国产精品国产| 亚洲综合色惰| 日本与韩国留学比较| 免费观看av网站的网址| 国产成人freesex在线| 亚洲av成人精品一区久久| 中文乱码字字幕精品一区二区三区| 久久6这里有精品| 我要看日韩黄色一级片| 国内精品宾馆在线| 亚洲美女搞黄在线观看| 亚洲,欧美,日韩| 免费观看在线日韩| 日本黄大片高清| 久久精品人妻少妇| 成人黄色视频免费在线看| 99久久中文字幕三级久久日本| 少妇的逼好多水| 91精品国产国语对白视频| 精品一区二区三区视频在线| 亚洲精品一区蜜桃| 亚洲欧美日韩东京热| 男人舔奶头视频| 精品国产三级普通话版| 在线观看美女被高潮喷水网站| 美女cb高潮喷水在线观看| 久久99热6这里只有精品| 国产大屁股一区二区在线视频| 人妻一区二区av| 一级毛片黄色毛片免费观看视频| 一区在线观看完整版| 日韩中文字幕视频在线看片 | 在线 av 中文字幕| av黄色大香蕉| 尾随美女入室| 高清黄色对白视频在线免费看 | 亚洲精品亚洲一区二区| 国产精品人妻久久久影院| 中文字幕精品免费在线观看视频 | 国产淫语在线视频| 人体艺术视频欧美日本| 观看av在线不卡| 多毛熟女@视频| 亚洲国产最新在线播放| 国产视频内射| 在线观看免费视频网站a站| 国产有黄有色有爽视频| 深夜a级毛片| 各种免费的搞黄视频| 91久久精品国产一区二区三区| 国产免费视频播放在线视频| 国产中年淑女户外野战色| 国产午夜精品一二区理论片| 国产女主播在线喷水免费视频网站| 26uuu在线亚洲综合色| 免费av中文字幕在线| 欧美xxxx黑人xx丫x性爽| 欧美3d第一页| 久久亚洲国产成人精品v| 国产成人精品久久久久久| 精华霜和精华液先用哪个| 精品久久久久久久久av| 我要看黄色一级片免费的| 亚洲精品456在线播放app| 老熟女久久久| 麻豆成人av视频| 国产极品天堂在线| 91久久精品国产一区二区三区| 亚洲欧美清纯卡通| 青春草国产在线视频| 成人一区二区视频在线观看| 亚洲三级黄色毛片| 亚洲欧美日韩无卡精品| 美女脱内裤让男人舔精品视频| 夜夜看夜夜爽夜夜摸| 一区二区av电影网| 亚洲精品乱久久久久久| 2018国产大陆天天弄谢| 五月玫瑰六月丁香| av又黄又爽大尺度在线免费看| 亚州av有码| 色婷婷av一区二区三区视频| 99久久中文字幕三级久久日本| 亚洲熟女精品中文字幕| 一区二区三区四区激情视频| 成人18禁高潮啪啪吃奶动态图 | 国产成人精品久久久久久| 亚洲精品乱码久久久久久按摩| 肉色欧美久久久久久久蜜桃| 天堂中文最新版在线下载| 高清午夜精品一区二区三区| 欧美日韩在线观看h| 亚洲av成人精品一二三区| 久久 成人 亚洲| 欧美丝袜亚洲另类| 亚洲精品一二三| 亚洲精品aⅴ在线观看| 国产精品一及| 伦理电影免费视频| 免费观看av网站的网址| 精品人妻一区二区三区麻豆| 欧美成人午夜免费资源| 精品99又大又爽又粗少妇毛片| 一级爰片在线观看| 高清视频免费观看一区二区| 欧美三级亚洲精品| 高清黄色对白视频在线免费看 | 热re99久久精品国产66热6| 国产淫语在线视频| 亚洲精品亚洲一区二区| 国产高清国产精品国产三级 | 99热这里只有是精品50| 欧美日韩综合久久久久久| 国产极品天堂在线| 在线观看国产h片| 日韩伦理黄色片| 午夜精品国产一区二区电影| 亚洲精品一二三| 亚洲国产色片| 亚洲av国产av综合av卡| 91狼人影院| 一级av片app| 狂野欧美激情性xxxx在线观看| 午夜福利网站1000一区二区三区| 亚洲欧洲国产日韩| 毛片一级片免费看久久久久| 日韩一区二区三区影片| 亚洲精品国产av蜜桃| 一个人看视频在线观看www免费| 精品国产露脸久久av麻豆| 久久99蜜桃精品久久| 国产黄频视频在线观看| 国产成人免费观看mmmm| 欧美少妇被猛烈插入视频| 国产黄片视频在线免费观看| 欧美成人一区二区免费高清观看| 中文字幕免费在线视频6| 一本久久精品| 99久久精品一区二区三区| 这个男人来自地球电影免费观看 | 国产一区二区在线观看日韩| 成年女人在线观看亚洲视频| 国产精品人妻久久久影院| 欧美激情极品国产一区二区三区 | av在线蜜桃| videossex国产| 亚洲精品国产av成人精品| 成年人午夜在线观看视频| 欧美精品亚洲一区二区| 国产精品伦人一区二区| 最近最新中文字幕大全电影3| 久久久久久久亚洲中文字幕| 人妻 亚洲 视频| 日韩电影二区| 久久久欧美国产精品| 免费观看av网站的网址| 在线观看一区二区三区| 最近中文字幕2019免费版| 亚洲精品久久午夜乱码| 国产在线视频一区二区| 偷拍熟女少妇极品色| 伊人久久国产一区二区| 国产高清国产精品国产三级 | 九九爱精品视频在线观看| 九色成人免费人妻av| 久久人妻熟女aⅴ| 精品一区二区三卡| 亚洲欧美一区二区三区国产| 中国国产av一级| 久久精品久久久久久噜噜老黄| 免费大片黄手机在线观看| 大香蕉久久网| 亚洲伊人久久精品综合| 丰满少妇做爰视频| 在线观看一区二区三区激情| 欧美精品人与动牲交sv欧美| 国产精品精品国产色婷婷| 久久久久国产精品人妻一区二区| 亚洲国产精品999| 久久久午夜欧美精品| 久久久精品94久久精品| 欧美xxxx性猛交bbbb| 在线观看免费视频网站a站| 久久人妻熟女aⅴ| 亚州av有码| 久久国内精品自在自线图片| 在线观看免费视频网站a站| 国内少妇人妻偷人精品xxx网站| 国产精品福利在线免费观看| 久久精品久久精品一区二区三区| 老熟女久久久| 两个人的视频大全免费| 亚洲怡红院男人天堂| 搡女人真爽免费视频火全软件| 在线观看国产h片| 美女高潮的动态| 麻豆成人av视频| 免费观看av网站的网址| 国产精品欧美亚洲77777| 免费黄色在线免费观看| 中国美白少妇内射xxxbb| 国产午夜精品久久久久久一区二区三区| 欧美一区二区亚洲| 亚洲人成网站在线播| 夫妻性生交免费视频一级片| 久久精品国产自在天天线| 卡戴珊不雅视频在线播放| 老熟女久久久| 夜夜看夜夜爽夜夜摸| 亚洲精品色激情综合| 五月天丁香电影| 联通29元200g的流量卡| 欧美精品一区二区免费开放| 六月丁香七月| 国产 一区 欧美 日韩| 精品熟女少妇av免费看| 精品午夜福利在线看| 日本黄色片子视频| av在线蜜桃| 我的女老师完整版在线观看| 香蕉精品网在线| 午夜免费男女啪啪视频观看| 精品一区二区免费观看| 午夜激情福利司机影院| 国产精品一区二区在线观看99| 在线观看三级黄色| 国产精品久久久久久久久免| 中文字幕av成人在线电影| 亚洲色图综合在线观看| 精品视频人人做人人爽| 亚洲伊人久久精品综合| 一级av片app| 色网站视频免费| 国产亚洲最大av| 精品亚洲乱码少妇综合久久| 精品久久久久久久久亚洲| 中文字幕精品免费在线观看视频 | 最新中文字幕久久久久| 国产69精品久久久久777片| 夜夜看夜夜爽夜夜摸| av国产精品久久久久影院| 国产欧美日韩精品一区二区| 日日撸夜夜添| 国产欧美日韩一区二区三区在线 | 久久久久久久久久人人人人人人| 少妇裸体淫交视频免费看高清| 国产精品麻豆人妻色哟哟久久| 黄片无遮挡物在线观看| 熟女人妻精品中文字幕| 亚洲av日韩在线播放| 久久韩国三级中文字幕| 亚洲性久久影院| 少妇的逼好多水| 亚洲精品一区蜜桃| 最新中文字幕久久久久| 免费看日本二区| 纵有疾风起免费观看全集完整版| 亚洲国产最新在线播放| 亚洲色图av天堂| 丰满迷人的少妇在线观看| 久久国产精品男人的天堂亚洲 | tube8黄色片| 欧美日韩精品成人综合77777| 国产淫片久久久久久久久| 免费av不卡在线播放| 综合色丁香网| 亚洲精品一二三| 啦啦啦在线观看免费高清www| 中文字幕亚洲精品专区| 久久国产乱子免费精品| 99热6这里只有精品| 国产精品久久久久久久电影| 毛片一级片免费看久久久久| 国产在线视频一区二区| 一级二级三级毛片免费看| 男女无遮挡免费网站观看| 国产伦精品一区二区三区视频9| 国产亚洲一区二区精品| 久久久午夜欧美精品| 免费观看的影片在线观看| 黄色配什么色好看| 综合色丁香网| 色5月婷婷丁香| 亚洲欧洲日产国产| 免费人成在线观看视频色| 九九久久精品国产亚洲av麻豆| 国产亚洲一区二区精品| 国产亚洲5aaaaa淫片| 日韩亚洲欧美综合| 夜夜看夜夜爽夜夜摸| 天天躁日日操中文字幕| 久久久久国产网址| 天堂8中文在线网| 久久婷婷青草| 2018国产大陆天天弄谢| 国产免费又黄又爽又色| 我的女老师完整版在线观看| 97在线人人人人妻| 久久久久精品久久久久真实原创| 免费看av在线观看网站| freevideosex欧美| 国产精品99久久99久久久不卡 | 内射极品少妇av片p| 久久人人爽人人爽人人片va| 国产成人精品一,二区| 精品人妻视频免费看| 毛片一级片免费看久久久久| 免费大片黄手机在线观看| 免费大片18禁| 欧美+日韩+精品| 久久影院123| 秋霞伦理黄片| 九色成人免费人妻av| 少妇精品久久久久久久| 一级毛片 在线播放| 国产深夜福利视频在线观看| 男女下面进入的视频免费午夜| 99热这里只有是精品在线观看| 国产高潮美女av| 最近手机中文字幕大全| 免费观看在线日韩| 国产精品熟女久久久久浪| 久久久久久久久久人人人人人人| videossex国产| 久久久久国产网址| 啦啦啦视频在线资源免费观看| 亚洲无线观看免费| 亚洲av电影在线观看一区二区三区| 国产欧美日韩精品一区二区| 男女边吃奶边做爰视频| 精品久久久噜噜| 国产精品一及| 99热这里只有是精品50| 精品午夜福利在线看| 精品亚洲成国产av| 我的女老师完整版在线观看| 亚洲国产毛片av蜜桃av| 在线观看免费视频网站a站| 少妇人妻 视频| 特大巨黑吊av在线直播| 日本午夜av视频| 美女高潮的动态| 国产黄色免费在线视频| 亚洲精品第二区| 国产爱豆传媒在线观看| 人妻少妇偷人精品九色| 欧美精品人与动牲交sv欧美| 下体分泌物呈黄色| 欧美精品人与动牲交sv欧美| 最近2019中文字幕mv第一页| 婷婷色麻豆天堂久久| 国产精品99久久99久久久不卡 | 三级经典国产精品| 一区二区三区免费毛片| 国产精品久久久久久久电影| 男人和女人高潮做爰伦理| 欧美日韩一区二区视频在线观看视频在线| 中国三级夫妇交换| 亚洲一级一片aⅴ在线观看| 欧美日本视频| 在线观看人妻少妇| 又爽又黄a免费视频| av视频免费观看在线观看| 亚洲色图av天堂| 亚洲av国产av综合av卡| 成人18禁高潮啪啪吃奶动态图 | 如何舔出高潮| 丝袜喷水一区| 亚洲精品中文字幕在线视频 | 国产久久久一区二区三区| av在线app专区| 免费少妇av软件| 99热这里只有精品一区| 中文乱码字字幕精品一区二区三区| 综合色丁香网| 国产老妇伦熟女老妇高清| 色视频www国产| 一个人免费看片子| 高清视频免费观看一区二区| av网站免费在线观看视频| 国产精品av视频在线免费观看| 精品久久国产蜜桃| 精品久久久精品久久久| 久久精品国产亚洲网站| 丝袜喷水一区| 中文资源天堂在线| 国产一区亚洲一区在线观看| 亚洲丝袜综合中文字幕| 成人18禁高潮啪啪吃奶动态图 | 妹子高潮喷水视频| 少妇丰满av| 久久精品国产鲁丝片午夜精品| 久久99热这里只有精品18| 中文在线观看免费www的网站| 亚洲精品色激情综合| 久久精品熟女亚洲av麻豆精品| 欧美少妇被猛烈插入视频| 国产精品不卡视频一区二区| 欧美性感艳星| 亚洲中文av在线| 午夜老司机福利剧场| 高清午夜精品一区二区三区| av女优亚洲男人天堂| 午夜福利高清视频| 性色av一级| 久久精品国产自在天天线| 久久久久久人妻| 日韩制服骚丝袜av| 国产免费又黄又爽又色| 日韩强制内射视频| 人人妻人人爽人人添夜夜欢视频 | 99久久精品国产国产毛片| 午夜福利网站1000一区二区三区| 51国产日韩欧美| 日产精品乱码卡一卡2卡三| 啦啦啦啦在线视频资源| 亚洲av成人精品一二三区| 最近最新中文字幕大全电影3| 一级片'在线观看视频| 国产午夜精品一二区理论片| 国产免费福利视频在线观看| 插阴视频在线观看视频| 国产精品一区二区性色av| 少妇人妻精品综合一区二区| 中文欧美无线码| 在线亚洲精品国产二区图片欧美 | 久久人妻熟女aⅴ| 男人和女人高潮做爰伦理| 日韩av在线免费看完整版不卡| 久久久久性生活片| 婷婷色综合大香蕉| av黄色大香蕉| 国产国拍精品亚洲av在线观看| 80岁老熟妇乱子伦牲交| 亚洲av电影在线观看一区二区三区| 亚洲久久久国产精品| 91久久精品国产一区二区成人| 欧美激情极品国产一区二区三区 | 肉色欧美久久久久久久蜜桃| 91在线精品国自产拍蜜月| 午夜老司机福利剧场| 精品久久国产蜜桃| 少妇的逼好多水| 啦啦啦视频在线资源免费观看| 免费黄网站久久成人精品| 男人添女人高潮全过程视频| 成人免费观看视频高清| av.在线天堂| 精品酒店卫生间| 成人高潮视频无遮挡免费网站| av福利片在线观看| 视频区图区小说| 久久6这里有精品| 国产精品蜜桃在线观看| 赤兔流量卡办理| 欧美xxⅹ黑人| 在线观看国产h片| 国产在线男女| 色哟哟·www| 国产高清三级在线| 国产成人免费观看mmmm| 纯流量卡能插随身wifi吗| 欧美精品人与动牲交sv欧美| 高清不卡的av网站| 亚洲在久久综合| 视频中文字幕在线观看| 国产精品一区二区在线观看99| 国产淫片久久久久久久久| 国产一区二区三区av在线| 老师上课跳d突然被开到最大视频| 一级a做视频免费观看| 欧美激情国产日韩精品一区| 99久久精品国产国产毛片| 一区二区三区精品91| 尤物成人国产欧美一区二区三区| 91久久精品国产一区二区三区| 伦理电影大哥的女人| 色婷婷久久久亚洲欧美| 亚洲天堂av无毛| 国产色爽女视频免费观看| 在线观看国产h片| 黑丝袜美女国产一区| 少妇人妻精品综合一区二区| 国产精品秋霞免费鲁丝片| 午夜免费观看性视频| 欧美zozozo另类| 身体一侧抽搐| 嘟嘟电影网在线观看| 国产精品人妻久久久影院| 亚洲,欧美,日韩| 久久国内精品自在自线图片| 自拍偷自拍亚洲精品老妇| 久久久久久久久久久丰满| 成人特级av手机在线观看| 国产黄片美女视频| 国产 精品1| 国产一区二区在线观看日韩| 国产免费又黄又爽又色| 一区二区三区四区激情视频| 91久久精品电影网| 中文字幕亚洲精品专区| 男女边吃奶边做爰视频| 黄色日韩在线| 日韩一区二区三区影片| 日韩大片免费观看网站| 99国产精品免费福利视频| 婷婷色综合www| 国产精品无大码| 国产成人精品一,二区| 亚洲精品久久午夜乱码| 国产成人精品久久久久久| 国产69精品久久久久777片| 一本色道久久久久久精品综合| 国产精品不卡视频一区二区| 亚洲欧美清纯卡通| 久久国产乱子免费精品| 美女中出高潮动态图| 一二三四中文在线观看免费高清| 国产高潮美女av| 熟妇人妻不卡中文字幕| 免费久久久久久久精品成人欧美视频 | 青春草视频在线免费观看| 日本爱情动作片www.在线观看| 高清黄色对白视频在线免费看 | 久久久久国产网址| 黄色视频在线播放观看不卡| 亚洲怡红院男人天堂| 91精品一卡2卡3卡4卡| 日韩欧美精品免费久久| av网站免费在线观看视频| 亚洲成人一二三区av| 搡女人真爽免费视频火全软件| 国产乱人偷精品视频| 一本—道久久a久久精品蜜桃钙片| 久久国产精品男人的天堂亚洲 | 尾随美女入室| 国产亚洲精品久久久com| 亚洲欧美日韩无卡精品| 一级毛片aaaaaa免费看小| 天天躁日日操中文字幕| 国产亚洲5aaaaa淫片| 久久久久久久亚洲中文字幕| 色视频在线一区二区三区| 永久免费av网站大全| 在线亚洲精品国产二区图片欧美 | 国产精品国产三级国产av玫瑰| 99国产精品免费福利视频| 亚洲国产精品成人久久小说| 日本wwww免费看| 色5月婷婷丁香| 在线 av 中文字幕| 亚洲欧洲国产日韩| 日韩成人伦理影院| 亚洲精品日本国产第一区| 少妇人妻 视频| 日韩成人伦理影院| 久久久久网色| 久久久久精品久久久久真实原创| 18+在线观看网站| 亚洲欧美日韩卡通动漫| 精品国产露脸久久av麻豆| 久久久久网色| 啦啦啦啦在线视频资源| 亚洲精品,欧美精品| 亚洲av综合色区一区| 男女下面进入的视频免费午夜| 久久精品国产亚洲av天美| 亚洲欧洲国产日韩| 乱码一卡2卡4卡精品| 亚洲国产欧美在线一区| av视频免费观看在线观看| 久久久久久久精品精品| 国产精品一区二区在线观看99| 免费观看的影片在线观看| 亚洲精品视频女| 亚洲精品国产av蜜桃| 一本色道久久久久久精品综合|