• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    大規(guī)模古籍文本在中國(guó)史定量研究中的應(yīng)用探索

    2016-12-29 19:16:31歐陽(yáng)劍
    關(guān)鍵詞:數(shù)字人文定量分析古籍

    歐陽(yáng)劍

    摘要 利用新的信息技術(shù)與面向數(shù)字人文研究的跨學(xué)科方法,采用大數(shù)據(jù)研究理念對(duì)古籍文本進(jìn)行字詞的歷時(shí)詞頻分布規(guī)律可視化分析,以中國(guó)史定量研究為例,對(duì)部分中國(guó)史的經(jīng)典宏觀理論從量化角度進(jìn)行了初步驗(yàn)證。認(rèn)為大數(shù)據(jù)視域下的技術(shù)邏輯和人文邏輯相耦合的數(shù)字人文研究為人文社會(huì)科學(xué)經(jīng)典理論的驗(yàn)證和拓展提供了更多研究空間與研究方法,有利于推進(jìn)古籍文獻(xiàn)深層次的開發(fā)與利用。

    關(guān)鍵詞 大數(shù)據(jù) 數(shù)字人文 定量分析 計(jì)量史 古籍

    1.引言

    隨著“大數(shù)據(jù)”時(shí)代的到來,對(duì)大規(guī)模歷史資料進(jìn)行定量分析已成為歷史學(xué)研究中一種新的、行之有效的方法,通過統(tǒng)計(jì)分析從大規(guī)模數(shù)據(jù)中挖掘新事實(shí)、產(chǎn)生新認(rèn)識(shí),能夠發(fā)現(xiàn)靠傳統(tǒng)文獻(xiàn)閱讀無法發(fā)現(xiàn)的隱藏在歷史文獻(xiàn)中的史實(shí)與現(xiàn)象。20世紀(jì)中期以來,歷史學(xué)定量分析逐漸成為國(guó)際學(xué)術(shù)研究中的一股新風(fēng)潮,并服務(wù)于學(xué)界,現(xiàn)在學(xué)者們認(rèn)為許多不具備數(shù)字特征的事物或事件,只要所研究的事物或事件存在特征并能加以量化,同樣可進(jìn)行定量研究,計(jì)量史學(xué)在經(jīng)濟(jì)史、政治史、社會(huì)史、人口史等領(lǐng)域研究中取得了很多的研究成果,發(fā)揮著巨大的作用。人文學(xué)科中的定量研究不僅能通過數(shù)據(jù)挖掘新發(fā)現(xiàn),更能解釋和理解這些發(fā)現(xiàn),進(jìn)而改變我們固有的歷史和社會(huì)科學(xué)理論與認(rèn)知。

    大數(shù)據(jù)給了人文學(xué)科研究的全新思維。人文學(xué)科研究往往會(huì)預(yù)先設(shè)定研究問題或理論模型和假設(shè),然后去尋找相關(guān)材料,但部分研究因?yàn)椴牧鲜占休^強(qiáng)的主觀性和選擇性,往往傾向于重復(fù)確認(rèn)“已知”,而忽略發(fā)現(xiàn)“未知”。因此,很難促進(jìn)對(duì)社會(huì)事物整體規(guī)律形成統(tǒng)一且有效的認(rèn)知。而大數(shù)據(jù)研究思維則不是隨機(jī)樣本,而是全體數(shù)據(jù);不是精確性,而是混雜性;不是因果關(guān)系,而是相關(guān)關(guān)系。埃雷茲·艾登(Erez Aiden)等在《可視化未來數(shù)據(jù)透視下的人文大趨勢(shì)》(UNCHARTED:Big Data as a Lens on Human Culture)中以“谷歌圖書”項(xiàng)目為背景,通過500多萬本電子書不同詞匯使用頻度隨時(shí)間的變化,講述了大數(shù)據(jù)在研究歷史文化、人類語言、社會(huì)名望、群體記憶等方面的重要作用,凸顯了大數(shù)據(jù)對(duì)人文社會(huì)科學(xué)研究的變革意義。大數(shù)據(jù)時(shí)代的各種思潮和視角在不斷涌現(xiàn),大數(shù)據(jù)作為一種全新的資料,以其大大超越傳統(tǒng)調(diào)查數(shù)據(jù)的樣本量和時(shí)間跨度,為人文社會(huì)科學(xué)經(jīng)典理論的驗(yàn)證和拓展提供了更多研究空間。而基于大數(shù)據(jù)的定量分析則為人文社會(huì)科學(xué)研究提供了一個(gè)全新的視角,傳統(tǒng)人文社會(huì)科學(xué)的實(shí)證研究強(qiáng)調(diào)在理論的前提下建立假設(shè),大數(shù)據(jù)時(shí)代重在發(fā)現(xiàn)知識(shí)與現(xiàn)象,在沒有理論假設(shè)的前提下去預(yù)知,從海量的數(shù)據(jù)中發(fā)現(xiàn)知識(shí),尋找隱藏在數(shù)據(jù)中的模式、趨勢(shì)和相關(guān)性,揭示事物現(xiàn)象與發(fā)展規(guī)律,大規(guī)模的古籍文獻(xiàn)擴(kuò)大了人文學(xué)科資料的范圍,提供了人文學(xué)科新的研究空間和新的研究可能。

    2.大數(shù)據(jù)視域下的傳統(tǒng)古籍文獻(xiàn)開發(fā)及利用分析

    目前,我國(guó)古籍文獻(xiàn)的數(shù)字化已經(jīng)比較成熟,文字層面的數(shù)字化也具一定規(guī)模,為古籍的深度開發(fā)與利用奠定了基礎(chǔ)。古籍文獻(xiàn)的統(tǒng)計(jì)分析是數(shù)字人文研究對(duì)古籍深度利用的基本需求,定量分析則是數(shù)字人文研究的一種主要研究方式。與傳統(tǒng)的定性分析不同,定量分析是依據(jù)統(tǒng)計(jì)數(shù)據(jù),建立數(shù)學(xué)模型,并用數(shù)學(xué)模型計(jì)算出分析對(duì)象的各項(xiàng)指標(biāo)及其數(shù)值的一種方法。因此,定量分析的應(yīng)用使人文學(xué)科研究更趨于科學(xué)化。人文學(xué)科的研究者對(duì)定量分析的需求日趨強(qiáng)烈,研究者不再滿足檢索結(jié)果的簡(jiǎn)單羅列,更需要從計(jì)量學(xué)的角度對(duì)符合一定條件的古籍文獻(xiàn)從作者、文獻(xiàn)來源、體裁及年代等多角度進(jìn)行統(tǒng)計(jì)分析。近年來學(xué)者在古代詩(shī)、詞、古代文學(xué)及中國(guó)史等研究中采用定量研究的趨勢(shì)更為明顯,例如,武漢大學(xué)著名詞學(xué)研究者王兆鵬教授把文獻(xiàn)計(jì)量的方法成功地引入詞學(xué)研究中,李伯重教授在史學(xué)研究中大量地采用量化方法,李中清教授通過定量方法提出了150年來中國(guó)精英出身家庭四個(gè)階段論述,胡俊峰、俞士汶利用統(tǒng)計(jì)分析的方法定義了唐宋詩(shī)中詞匯語義的統(tǒng)計(jì)表達(dá),20世紀(jì)90年代中期,北京大學(xué)開發(fā)的古詩(shī)研究系統(tǒng)就設(shè)置了統(tǒng)計(jì)分析的功能,定量方法的使用使得人文學(xué)科的研究成果增加了定量的特征,增強(qiáng)了人文科學(xué)研究的科學(xué)屬性。

    此外,多元、多角度的對(duì)比分析及古籍內(nèi)容挖掘也是人文學(xué)科中數(shù)字人文研究所急需的??茖W(xué)研究可以從多個(gè)角度進(jìn)行對(duì)比分析,發(fā)現(xiàn)新的問題與現(xiàn)象,尋找隱藏在數(shù)據(jù)中的模式、趨勢(shì)和相關(guān)性。對(duì)于作為史料來源的古籍文獻(xiàn)來說,通過文獻(xiàn)記載的史實(shí)對(duì)比,可以考察文獻(xiàn)原始出處及后續(xù)的演變。哲學(xué)上,空間和時(shí)間的依存關(guān)系表達(dá)著事物的演化秩序,時(shí)間及空間上的比較分析法是常用的分析方法,它從時(shí)間角度和空間角度對(duì)事物的發(fā)展及變化進(jìn)行立體式的描述,將是古籍文獻(xiàn)深度利用方面的重要方式。而古籍內(nèi)容挖掘更是人文學(xué)科領(lǐng)域深度分析的主要方式。利用文本挖掘技術(shù)可以對(duì)歷史事件的發(fā)展等做出宏觀的描述,更能準(zhǔn)確地還原歷史真相,對(duì)古籍文獻(xiàn)中錯(cuò)綜復(fù)雜人物關(guān)系建立關(guān)聯(lián),歷史人物的社會(huì)評(píng)價(jià)做出客觀的判斷,對(duì)語言、社會(huì)及地理等現(xiàn)象進(jìn)行有效的解釋,同時(shí)古籍內(nèi)容挖掘也是古籍?dāng)?shù)字化知識(shí)構(gòu)建的基礎(chǔ)。

    隨著古籍?dāng)?shù)字化的進(jìn)一步發(fā)展,更多的學(xué)者開始認(rèn)識(shí)到古籍?dāng)?shù)字化帶給我們的不僅僅是海量的古籍文獻(xiàn)存儲(chǔ),“數(shù)字化”為技術(shù)與人文的合流構(gòu)筑了新平臺(tái),更為一個(gè)技術(shù)邏輯和人文邏輯相耦合的“數(shù)字人文”的出現(xiàn)提供了可能。傳統(tǒng)的古籍開發(fā)與應(yīng)用模式已難以適應(yīng)人文學(xué)科中數(shù)字人文研究的需要,急需研究輔助工具與研究方式的創(chuàng)新與開發(fā)。引入大規(guī)模定量計(jì)算分析方法,構(gòu)建可持續(xù)完善和豐富的數(shù)據(jù)集和分析工具,充分利用新的信息技術(shù)、中文信息處理技術(shù)及跨學(xué)科方法來對(duì)古籍進(jìn)行深層次的分析與挖掘,對(duì)數(shù)字化古籍文獻(xiàn)所蘊(yùn)涵的多重信息進(jìn)行多角度的揭示和重組,這種深度的開發(fā)使古籍文獻(xiàn)不再是平面的、孤立的資料,而使其構(gòu)成一個(gè)立體的文化學(xué)術(shù)知識(shí)庫(kù)。

    3.大數(shù)據(jù)視域下的古籍文本可視化分析與挖掘

    詞匯的時(shí)空傳播與演化探索,研究意義重大。金觀濤與劉青峰的《觀念史研究:中國(guó)現(xiàn)代重要政治術(shù)語的形成》,以十年之功,建立起一個(gè)龐大的“中國(guó)近現(xiàn)代思想史專業(yè)數(shù)據(jù)庫(kù)”(1830-1930年),通過核心關(guān)鍵詞在歷史文獻(xiàn)中的統(tǒng)計(jì)數(shù)據(jù),找到一份中國(guó)重要政治術(shù)語形成時(shí)期的觀念史地圖,從而跳出傳統(tǒng)史學(xué)研究被詬病的框架——研究觀念起源往往囿于思辨而無法實(shí)證。計(jì)量史學(xué)遭遇的是方法論難題,建設(shè)大規(guī)模數(shù)據(jù)集,則可能是逾越“大歷史觀”、整體史研究與繁蕪歷史資料間鴻溝的有效辦法。如何將這類歷史資料進(jìn)行合理有效的編碼和數(shù)據(jù)集成化,并通過實(shí)證分析更好地幫助我們了解社會(huì)發(fā)展的歷史經(jīng)驗(yàn)和對(duì)當(dāng)下的啟示,成為學(xué)界需要加強(qiáng)探索和討論的關(guān)鍵技術(shù)課題。

    按照馬創(chuàng)新、曲維光、陳小荷主張的古籍?dāng)?shù)字化開發(fā)的兩個(gè)層次來看,顯然,以存檔和檢索為目的的古籍文獻(xiàn)表層數(shù)字化已取得豐碩成果,而古籍文本可視化分析與挖掘?qū)儆谏顚哟蔚拈_發(fā),深層次的古籍文獻(xiàn)開發(fā)主要是古籍知識(shí)單元標(biāo)注及知識(shí)網(wǎng)絡(luò)構(gòu)建、古籍文獻(xiàn)之間的關(guān)聯(lián)、文本內(nèi)容分析及挖掘等,就目前的數(shù)字化古籍文獻(xiàn)的開發(fā)及利用現(xiàn)狀來說,面向數(shù)字人文研究的數(shù)字化古籍文獻(xiàn)的深度利用所面臨的主要問題有以下兩點(diǎn):

    (1)缺乏有效的對(duì)于數(shù)字化古籍文獻(xiàn)的整合。

    目前的古籍文獻(xiàn)數(shù)字化存在各自為政的狀況,由于版權(quán)及產(chǎn)權(quán)的原因,導(dǎo)致數(shù)字化的古籍文獻(xiàn)分散于不同公司、不同研究機(jī)構(gòu)中,而且重復(fù)建設(shè)嚴(yán)重,不僅功能單一,數(shù)據(jù)也往往只涵蓋某一個(gè)類別或某一個(gè)專題,分散的數(shù)據(jù)不能實(shí)現(xiàn)多元化及整體化的研究對(duì)比與分析。而有比較才有鑒別,有比較才有發(fā)現(xiàn),有綜合才能發(fā)現(xiàn)知識(shí)、規(guī)律的全貌。大數(shù)據(jù)時(shí)代已經(jīng)來臨,超大規(guī)模古籍?dāng)?shù)據(jù)、更多更豐富的古籍文獻(xiàn)匯集在一起,可以提供更多、更全面、更準(zhǔn)確的資料,滿足文、史、哲等各學(xué)科研究的需要,對(duì)交叉學(xué)科來說更是不可或缺。面向數(shù)字人文研究的數(shù)字化古籍文獻(xiàn)整合的目是共享或者合并來自于兩個(gè)或者更多應(yīng)用的數(shù)據(jù)集,創(chuàng)建一個(gè)具有更多功能的數(shù)字人文研究應(yīng)用的過程,數(shù)字化古籍文獻(xiàn)的整合將有利于知識(shí)揭示、現(xiàn)象發(fā)現(xiàn),將極大節(jié)省研究者的時(shí)間,提升研究和創(chuàng)新水平,通過異構(gòu)數(shù)字古籍文獻(xiàn)的融合、聚類和重組使資源從數(shù)據(jù)層的揭示與展現(xiàn)轉(zhuǎn)向信息層、知識(shí)層的深度服務(wù),通過將零星的史料片段按一定規(guī)則重新組合、排列,對(duì)蘊(yùn)含在古籍中的知識(shí)進(jìn)行多元重組,使不同知識(shí)單元之間建立關(guān)聯(lián),形成一個(gè)多維的知識(shí)網(wǎng)絡(luò),可以幫助研究者發(fā)現(xiàn)原有脈絡(luò)中難以獲得的發(fā)現(xiàn)與解讀。因此,數(shù)字化古籍文獻(xiàn)整合勢(shì)在必行,打破古籍?dāng)?shù)據(jù)庫(kù)建設(shè)“小、散、亂”,以及各自為政的模式,已形成學(xué)術(shù)共識(shí)。

    (2)缺乏新的數(shù)字人文研究范式及方法。

    基于古籍文獻(xiàn)的語言、文學(xué)及歷史等人文學(xué)科的研究在學(xué)術(shù)上的突破往往依賴于新材料的發(fā)現(xiàn)。雖然數(shù)字化古籍文獻(xiàn)的使用引發(fā)了研究思維的轉(zhuǎn)變,改變了學(xué)術(shù)前沿的概念,但囿于研究工具及研究手段限制,人文學(xué)科研究在創(chuàng)新方面遇到新的瓶頸,在傳統(tǒng)研究范式的制約下,使得一些研究項(xiàng)目無法開展,研究視野受到束縛,傳統(tǒng)的數(shù)字化古籍文獻(xiàn)的開發(fā)及利用模式難以催生突破式的發(fā)現(xiàn)。馬克思說過:生產(chǎn)工具促進(jìn)生產(chǎn)力的發(fā)展。同樣,先進(jìn)的研究工具有利于學(xué)術(shù)研究的發(fā)展。新的數(shù)字人文研究工具與方法的出現(xiàn)將突破傳統(tǒng)的研究范式,古籍文獻(xiàn)數(shù)字化的廣泛普及促進(jìn)了古籍的利用,大大節(jié)約了研究者查找資料的時(shí)間,消除了古籍文獻(xiàn)獨(dú)占的客觀制約,史料的綜合化消除了語言、文學(xué)、歷史、哲學(xué)等學(xué)科的材料隔閡,在如今強(qiáng)調(diào)各學(xué)科協(xié)同創(chuàng)新的大背景下,更為人文學(xué)科的交叉研究提供了條件。

    3.1數(shù)據(jù)來源

    數(shù)據(jù)和方法是數(shù)字人文的兩大支柱。數(shù)字人文領(lǐng)域的研究使數(shù)據(jù)驅(qū)動(dòng)(Data-Driven)研究成為熱點(diǎn),數(shù)據(jù)已成為數(shù)字人文研究的基礎(chǔ)和核心。大規(guī)模古籍文本具有覆蓋時(shí)空跨度大、材料面廣的特點(diǎn),很大程度上可避免選擇資料時(shí)的疏漏與偏廢,彌補(bǔ)史學(xué)家慣用的“選精”與“集粹”研究方法帶來的缺陷。古籍文本的收集、整理是大規(guī)模數(shù)字化古籍文獻(xiàn)研究的基礎(chǔ),而對(duì)古籍文本語料庫(kù)的構(gòu)建主要采取對(duì)已有數(shù)字化古籍文獻(xiàn)整合的方式。大規(guī)模古籍?dāng)?shù)據(jù)并不是單一數(shù)據(jù)很大,其最核心的問題是多源跨域數(shù)據(jù)的融合,即通過融合不同類別、不同專題的數(shù)字化古籍?dāng)?shù)據(jù)的知識(shí)來共同解決單一數(shù)據(jù)解決不了的難題。大規(guī)模古籍?dāng)?shù)據(jù)有三個(gè)非常重要的層次:數(shù)據(jù)的獲取、數(shù)據(jù)的描述和數(shù)據(jù)的分析,在語料庫(kù)的建設(shè)過程中,語料庫(kù)應(yīng)該滿足三個(gè)基本要求:樣本的代表性;規(guī)模的有限性;機(jī)器可讀性。因此古籍文本語料庫(kù)構(gòu)建應(yīng)遵循以下原則:

    (1)目的性。數(shù)字化古籍文獻(xiàn)整合的主要目的是為人文學(xué)科的研究服務(wù),因此,古籍文本語料庫(kù)構(gòu)建需要以研究的適用范圍為導(dǎo)向,有針對(duì)性地選取多數(shù)據(jù)進(jìn)行融合,特別需要收集有一定權(quán)威、認(rèn)可度的高質(zhì)量數(shù)據(jù),實(shí)現(xiàn)多數(shù)據(jù)源的濃縮,幫助降低學(xué)者研究時(shí)的對(duì)比、統(tǒng)計(jì)和分析數(shù)據(jù)的勞動(dòng)強(qiáng)度。

    (2)一致性。古籍?dāng)?shù)據(jù)整合的一致性首先表現(xiàn)在格式的一致性。多來源的數(shù)據(jù)易導(dǎo)致格式的不統(tǒng)一,因此,存儲(chǔ)和處理時(shí)必須對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一的編碼格式轉(zhuǎn)換。為了提高電子文本的規(guī)范化和標(biāo)準(zhǔn)化程度,1987年美國(guó)計(jì)算機(jī)語言協(xié)會(huì)(ACL)、美國(guó)文學(xué)與語言計(jì)算協(xié)會(huì)(ALLC)和美國(guó)計(jì)算與人文協(xié)會(huì)(ACH)贊助并組織的文本編碼倡議(TEI)為電子形式的文本材料定義了一系列的通用標(biāo)準(zhǔn),并被世界各國(guó)廣泛采用。其次,數(shù)據(jù)內(nèi)容的準(zhǔn)確性也應(yīng)保持一致性,這樣才能提高分析結(jié)果的可靠性。再次,數(shù)據(jù)的分割、統(tǒng)計(jì)、分析方法的一致性,在同一標(biāo)準(zhǔn)下進(jìn)行分析及統(tǒng)計(jì),這樣的結(jié)果才有可比性。因此,一致性的古籍文獻(xiàn)分割、保存、整合、透視和展示方式,可以最大程度地保證研究結(jié)果的可靠性、可檢驗(yàn)性及再現(xiàn)性,也有利于后期的更新與維護(hù)。

    (3)多樣性。數(shù)字化古籍文本語料庫(kù)是一個(gè)龐大的文本文獻(xiàn)的集合,主要用于觀察、分析和研究文、史、哲等多個(gè)學(xué)科的需要,不僅僅滿足于傳統(tǒng)的語言學(xué)詞匯、語法、語義語用、語體等研究的需要,更需要能滿足文、史、哲等多學(xué)科和跨學(xué)科研究的需要,因此加工深度及標(biāo)注信息既要反映各種語言學(xué)屬性,語料也應(yīng)具有多樣性,更應(yīng)注重多學(xué)科的交叉和融合。

    (4)共享性。人文研究學(xué)者需要的不僅僅是統(tǒng)計(jì)分析的結(jié)果,他們對(duì)原始研究數(shù)據(jù)也有強(qiáng)烈的需求。傳統(tǒng)的研究者常從檔案、出版物或者文物等人類文化記錄中提取數(shù)據(jù),有時(shí)可能會(huì)花費(fèi)幾個(gè)月甚至幾年的時(shí)間。而語料庫(kù)將極大節(jié)省研究者的時(shí)間,幫助他們利用現(xiàn)有數(shù)據(jù)提出新的研究問題或作為有效的例證。因此,語料庫(kù)文本數(shù)據(jù)的共享也是非常必要的。

    目前,已數(shù)字化的古籍文本主要以兩種形式存在,一種是網(wǎng)絡(luò)上的各種專業(yè)性論壇或網(wǎng)站,另一種則存儲(chǔ)于專業(yè)數(shù)據(jù)庫(kù)中。從數(shù)據(jù)收集角度來說,主要來源途徑有網(wǎng)絡(luò)數(shù)據(jù)采集與專業(yè)數(shù)據(jù)庫(kù)文本獲取兩種。然后對(duì)獲取來的文本進(jìn)行編碼、分類、標(biāo)注等處理。大規(guī)模數(shù)字化古籍文本語料庫(kù)構(gòu)建過程如圖1所示。利用計(jì)算機(jī)自動(dòng)、半自動(dòng)收集的方式,加快了數(shù)字化古籍文本建庫(kù)的速度,為建設(shè)大規(guī)模古籍文本語料庫(kù)提供了保障。經(jīng)過近半年的抓取及抽取,收集、整理了41563種(大約48億字)數(shù)字化古籍本文,涵蓋從上古到民國(guó)的經(jīng)、史、子、集等40個(gè)類目的文獻(xiàn),覆蓋面廣且有時(shí)間上的延續(xù)性,形成了一個(gè)比較綜合、學(xué)科門類全面的數(shù)字化古籍文本語料庫(kù)。

    3.2數(shù)據(jù)處理

    構(gòu)建面向人文學(xué)科的分析系統(tǒng)并非單純將古籍文獻(xiàn)數(shù)字化,而是需要憑借人文學(xué)者對(duì)古籍文獻(xiàn)的深刻理解,創(chuàng)造性地進(jìn)行編碼、歸類和整合。大規(guī)模、長(zhǎng)時(shí)期的數(shù)字化古籍文獻(xiàn)普遍存在著體量龐大、標(biāo)注不明確和不同年代同類信息含義有差異等諸多問題。采用靈活、有效的編碼方法成為研究歷史數(shù)據(jù)成敗的關(guān)鍵。對(duì)數(shù)字化古籍文獻(xiàn)進(jìn)行系統(tǒng)、合理的分類與編碼是開展數(shù)據(jù)庫(kù)構(gòu)建和進(jìn)行最終定量分析的基礎(chǔ)和前提。在進(jìn)入生語料庫(kù)之前,數(shù)字化古籍文本語料需要經(jīng)過以下三個(gè)數(shù)據(jù)整理的步驟:

    (1)版本挑選。在大規(guī)模機(jī)器自動(dòng)采集的過程中,網(wǎng)絡(luò)采集源的數(shù)據(jù)質(zhì)量難以通過機(jī)器來判定,因此,通過人工方式對(duì)數(shù)據(jù)整理是不可或缺的,也是為了保證高質(zhì)量古籍文本語料庫(kù)的需要。通過人工檢查的方式對(duì)數(shù)據(jù)進(jìn)行整理,去除那些低質(zhì)量、殘缺的數(shù)據(jù),挑選出那些高質(zhì)量的數(shù)字化古籍版本,高質(zhì)量的文本語料更能提高分析、統(tǒng)計(jì)的準(zhǔn)確性,提高分析結(jié)果的可信度。

    (2)文本抽取。由于采集的古籍文獻(xiàn)的數(shù)據(jù)來源不同,因此文本的載體格式也呈多樣化,采集的數(shù)據(jù)格式包含PDF、WORD、HTML等多種形式,為了研究的需要,在數(shù)據(jù)整理及標(biāo)注前需對(duì)采集的數(shù)據(jù)進(jìn)行文本數(shù)據(jù)的抽取及編碼轉(zhuǎn)化。文本數(shù)據(jù)的抽取通過程序自動(dòng)抽取,抽取過程中把UTF-8、Uni-code、GBK等不同編碼轉(zhuǎn)換成統(tǒng)一的Unicode編碼。

    (3)文本轉(zhuǎn)碼。與文本載體格式類似,采集、抽取的文本字體存在大陸簡(jiǎn)體、古籍繁體及臺(tái)灣繁體字等三種。不同字體造成了對(duì)于以文本為基礎(chǔ)的統(tǒng)計(jì)及內(nèi)容分析的困難和復(fù)雜性。因此,古籍文本語料采用大陸簡(jiǎn)體,字體轉(zhuǎn)換采用廈門大學(xué)、教育部語言文字應(yīng)用研究所、北京師范大學(xué)聯(lián)合開發(fā)的《漢字簡(jiǎn)繁文本智能轉(zhuǎn)換系統(tǒng)》進(jìn)行簡(jiǎn)繁異體字轉(zhuǎn)換,形成統(tǒng)一的簡(jiǎn)體字?!稘h字簡(jiǎn)繁文本智能轉(zhuǎn)換系統(tǒng)》采用語料庫(kù)語言學(xué)的研究方法,通過數(shù)線性模型(Log-Linear Models)進(jìn)行簡(jiǎn)繁字體轉(zhuǎn)換,準(zhǔn)確率達(dá)到97%以上。

    生文本語料的標(biāo)注也是語料庫(kù)構(gòu)建的一個(gè)重要環(huán)節(jié)。古籍文獻(xiàn)的準(zhǔn)確標(biāo)注能夠使計(jì)算機(jī)快速準(zhǔn)確地找到目標(biāo)文獻(xiàn),并能有效地建立文獻(xiàn)之間的關(guān)聯(lián)。生語料的標(biāo)注既要適應(yīng)計(jì)算機(jī)自動(dòng)處理的需要,也要考慮到人文學(xué)科研究的需要。生文本語料的標(biāo)注分成兩部分,一是對(duì)古籍文獻(xiàn)的外部特征的元數(shù)據(jù)標(biāo)注;二是對(duì)古籍文獻(xiàn)的內(nèi)容進(jìn)行標(biāo)注。古籍文獻(xiàn)的外部特征主要是指文獻(xiàn)名稱、作者(包含編、撰、注、疏等)、作品年代、著者信息(出生時(shí)間、死亡時(shí)間、出生地等)、版本信息、作品分類等。古籍文獻(xiàn)的外部特征可為數(shù)據(jù)分析、統(tǒng)計(jì)提供必要的信息,例如分析、統(tǒng)計(jì)過程中的時(shí)間點(diǎn)就是按照作品的作者卒年時(shí)間為依據(jù)的,在卒年時(shí)間不明確或無法考證時(shí)即按作品所在的年代為依據(jù)(作者的卒年及古籍文本的版本考證是一個(gè)難題,存在諸多爭(zhēng)議,這涉及史書語料時(shí)代性這一老大難的問題,通過相關(guān)專業(yè)人士的核查將為分析的準(zhǔn)確性提供保障)。

    在標(biāo)注古籍文獻(xiàn)作者及地理信息時(shí),參考了哈佛大學(xué)費(fèi)正清中國(guó)研究中心、臺(tái)灣中央研究院歷史語言研究所和北京大學(xué)中國(guó)古代史研究中心共同開發(fā)的《中國(guó)歷代人物傳記資料庫(kù)》(CBDB)與復(fù)旦大學(xué)的《中國(guó)歷史地理信息系統(tǒng)》(CHGIS),根據(jù)研究的具體需要,從前者抽取了作品作者的生卒年代、地理信息等,從后者整合了部分地理信息。通過抽取、整合多個(gè)外部數(shù)據(jù)源,充分利用了外部的已有資源,不但減少了標(biāo)注的時(shí)間,而且豐富了數(shù)據(jù)內(nèi)涵,同時(shí)準(zhǔn)確性及可靠性也得到了保證。

    (4)文本切分。詞頻分析是文本挖掘中的一種重要研究方式,也是文本可視化的一種重要模式。當(dāng)面對(duì)海量文本時(shí),人們需要對(duì)每個(gè)文本或者整個(gè)文本集合的主要內(nèi)容進(jìn)行快速瀏覽,因此需要構(gòu)建基于詞頻的文本可視化。常用的思路是將文本看作一個(gè)詞匯的集合,利用詞頻信息來呈現(xiàn)文本特征。例如谷歌(Google)實(shí)驗(yàn)室推出書籍詞頻統(tǒng)計(jì)器(Books Ngram Viewer)就是以歷代詞頻分析研究為基礎(chǔ)而進(jìn)行的可視化分析。對(duì)古籍文獻(xiàn)的內(nèi)容進(jìn)行標(biāo)注是數(shù)字化古籍文獻(xiàn)知識(shí)提取和知識(shí)重組的關(guān)鍵。對(duì)古籍文獻(xiàn)的切分必須遵循古代漢語詞匯的發(fā)展特點(diǎn),在大規(guī)模地對(duì)不同朝代的古籍文本進(jìn)行分詞時(shí),采用分朝代、分詞匯表的方式切分才符合古代漢語詞匯的發(fā)展規(guī)律。即切分不同朝代的古籍文本語料時(shí)采用相應(yīng)朝代的詞匯表,可以最大程度上提升古籍分詞的準(zhǔn)確率。筆者采用分段疊加的方式,從已有的古代漢語詞匯詞典及專書中提取詞匯,從已有語料中采用統(tǒng)計(jì)學(xué)的方法自動(dòng)提取詞匯作為補(bǔ)充,以二元(Bigram)模型為主對(duì)古籍分詞。

    3.3大規(guī)模古籍文本可視化分析與挖掘

    大規(guī)模古籍文本可視化分析與挖掘以古籍文本為基礎(chǔ),基于大數(shù)據(jù)研究理念,采用格拉布斯(Grubbs)法進(jìn)行數(shù)據(jù)降噪,最大程度消除問題數(shù)據(jù),在分詞后的古籍語料庫(kù)基礎(chǔ)上,以詞頻統(tǒng)計(jì)為研究核心對(duì)古籍文本進(jìn)行分析與挖掘,采用單位時(shí)間窗口滑動(dòng)技術(shù)對(duì)單位時(shí)間內(nèi)的詞頻進(jìn)行分析,運(yùn)用內(nèi)存實(shí)時(shí)計(jì)算思想很好地解決了讀取數(shù)據(jù)的瓶頸問題。實(shí)時(shí)統(tǒng)計(jì)分析則采用并行計(jì)算方式解決了實(shí)時(shí)查詢效率問題,統(tǒng)計(jì)分析結(jié)果以時(shí)間軸為主線的微觀散點(diǎn)圖和宏觀曲線圖對(duì)進(jìn)行宏觀層次與微觀層次展示,并以古籍文獻(xiàn)作者為主線,利用地理信息系統(tǒng)(GIS)技術(shù),將我國(guó)龐大的、靜態(tài)的、分散的數(shù)字化古籍進(jìn)行大規(guī)模的集成和地圖展示,以古籍文獻(xiàn)的檢索為線索在地圖上呈現(xiàn)相關(guān)作者的地理分布,實(shí)現(xiàn)了實(shí)時(shí)、在線、立體、可視化、定量分析字詞的歷史詞頻分布規(guī)律,為研究者構(gòu)建一個(gè)以語言學(xué)、歷史文獻(xiàn)學(xué)、歷史地理學(xué)等人文學(xué)科為主的古籍實(shí)時(shí)統(tǒng)計(jì)分析平臺(tái)。

    4.大規(guī)模古籍文本可視化分析與挖掘在中國(guó)史定量研究中的應(yīng)用

    大規(guī)模古籍文獻(xiàn)的收集整理和量化數(shù)據(jù)集是相當(dāng)有難度的,而更大的挑戰(zhàn)來自對(duì)歷史數(shù)據(jù)定量分析結(jié)果的理解和詮釋。大規(guī)模古籍文獻(xiàn)經(jīng)過可視化定量分析后,常常有一些“不期而遇”的發(fā)現(xiàn)。以大規(guī)模數(shù)據(jù)為基礎(chǔ)的量化研究還能較好糾正研究的主觀性,實(shí)現(xiàn)研究從常見的理論或問題驅(qū)動(dòng)轉(zhuǎn)向數(shù)據(jù)或經(jīng)驗(yàn)驅(qū)動(dòng)。運(yùn)用數(shù)學(xué)方法對(duì)歷史資料進(jìn)行定量分析,使史學(xué)研究更趨于精確,大規(guī)模的古籍文本其本身就具有重要的歷史研究?jī)r(jià)值。在此基礎(chǔ)之上,通過該系統(tǒng)能對(duì)一些歷史事件與現(xiàn)象作定量分析,使結(jié)論的可靠性具有更好的說服力。

    武則天一度成為爭(zhēng)論最多、留下疑惑最多的一個(gè)歷史人物,對(duì)武則天的歷史評(píng)價(jià)向來毀譽(yù)不一。迄今學(xué)術(shù)界對(duì)武則天功過的評(píng)價(jià)仍然眾說紛紜,不僅史學(xué)界沒有定論,在大學(xué)課堂里亦評(píng)價(jià)各異。在傳統(tǒng)研究中,研究者易將“某一或某些例證所反映的現(xiàn)象普遍化”,從而可能喪失真實(shí)性,導(dǎo)致研究結(jié)果具有一定的不可靠性。通過大規(guī)模古籍文獻(xiàn)來分析歷史文獻(xiàn)中對(duì)武則天稱謂的變化,從中能發(fā)現(xiàn)一些有趣的歷史現(xiàn)象。由于筆者非歷史學(xué)專業(yè)出身,對(duì)問題描述與解析可能會(huì)存在一些偏差,需要專業(yè)人士來對(duì)獲得的現(xiàn)象進(jìn)行更為合理的解讀。

    系統(tǒng)統(tǒng)計(jì)分析顯示,在歷史文獻(xiàn)中對(duì)武則天稱謂的總體分布和年代分布如圖2、圖3所示。從其稱謂來看有武后、武才人、武則天、武氏、武皇后、武媚、則天大圣皇后、則天大圣皇帝等,武則天死后,唐人對(duì)其的評(píng)價(jià)曾發(fā)生過一些變化,正如王雙懷教授所說“唐中宗給武則天舉行隆重的葬禮”,睿宗即位后,“對(duì)武則天的評(píng)價(jià)明顯降低”,“唐玄宗基本上還是肯定了武則天。”,“盛唐以后的統(tǒng)治者對(duì)武則天是相當(dāng)尊重的”。從詞頻可以看出,到唐末期很少出現(xiàn)直呼其名的或稱其“武氏”,從唐中期到唐末時(shí)期基本以“武后”相稱,雖然不承認(rèn)其皇帝身份,但稱謂也無有意貶低之意。

    五代后,稱其為“武氏”的文獻(xiàn)開始大量出現(xiàn),與“武后”稱謂不差上下,從大量文獻(xiàn)來看,該時(shí)段褒貶都有,對(duì)武則天任用酷吏、改朝換代的事和武周政治進(jìn)行了嚴(yán)厲的抨擊,“但總的看來,是否定武則天的”。北宋時(shí)期,歐陽(yáng)修、宋祁等人用最惡毒的語言攻擊武則天,但是,歐陽(yáng)修等人只是反對(duì)武則天干預(yù)朝政、任用酷吏、殺戮宗室大臣以及改朝換代,并不否認(rèn)她的政績(jī)。及至南宋,人們對(duì)武則天的評(píng)價(jià)越來越低,但也不是都持全盤否定的態(tài)度。到了清初,因?qū)Ξ愖褰y(tǒng)治不滿,又無能為力,遂借古諷今,但也有文獻(xiàn)對(duì)武則天的評(píng)價(jià)是較高的。稱其“武皇后”、“武媚”基本上集中在五代十國(guó)到南宋,而稱其為“則天大圣皇帝”(圖4)的基本以史書記載為主,文獻(xiàn)分布也比較分散。所有以上記錄武后、武才人、武則天、武氏、武皇后、武媚、則天大圣皇后、則天大圣皇帝等稱謂的文獻(xiàn)作者空間上的聚合分布如圖5所示,除了江蘇、浙江一帶比較多以外,其他地區(qū)分布得比較均勻。

    對(duì)另一個(gè)經(jīng)典的歷史思想觀念進(jìn)行驗(yàn)證的是“重學(xué)輕術(shù)”。中國(guó)傳統(tǒng)觀念一直受“重學(xué)輕術(shù)”這一思想的影響,學(xué)、術(shù)在我國(guó)古代分別具有不同的含義,按《漢語大詞典》、《康熙字典》等的解釋,都有不少義項(xiàng),“學(xué)”基本是指鉆研知識(shí)、獲得知識(shí)、掌握知識(shí)等為主,而“術(shù)”則多指技藝、方法??梢?,學(xué)術(shù)在中國(guó)古代的知識(shí)體系中學(xué)是學(xué),術(shù)是術(shù),且在傳統(tǒng)的儒家思想中學(xué)是“儒道之經(jīng)”,術(shù)是“奇技淫巧”。從圖6可見,“學(xué)”的頻率在中國(guó)古代文獻(xiàn)中要遠(yuǎn)高于同期“術(shù)”的頻率,不知是否跟中國(guó)古代儒家歷來重“學(xué)”輕“術(shù)”有關(guān),或一定程度上反映了儒家思想對(duì)仕人思想的影響。

    文學(xué)地理學(xué)的研究對(duì)象是文學(xué)要素的地理分布、組合與變遷,文學(xué)要素及其整體形態(tài)的地域特性與地域差異,文學(xué)與地理環(huán)境之間的相互關(guān)系。文學(xué)要素包括文學(xué)家、文學(xué)作品和文學(xué)讀者,地理環(huán)境則包括自然地理環(huán)境和人文地理環(huán)境。文學(xué)地理學(xué)的任務(wù),就是考察不同的自然地理環(huán)境和人文地理環(huán)境對(duì)文學(xué)家的氣質(zhì)、心理、知識(shí)結(jié)構(gòu)、文化底蘊(yùn)、價(jià)值觀念、審美傾向、藝術(shù)感知、文學(xué)選擇等構(gòu)成的影響。文學(xué)與地理環(huán)境的關(guān)系是一個(gè)互動(dòng)關(guān)系。對(duì)中國(guó)歷代文學(xué)家的地理分布格局分析是文學(xué)地理研究的重要內(nèi)容。而古籍文獻(xiàn)則又是分析的主體。系統(tǒng)提供了古籍作者空間信息可視化分析功能,為文學(xué)地理的空間環(huán)境分析提供了新的研究工具。

    在傳統(tǒng)研究中,從地理空間的視角研究文學(xué)作品,定量化解析文本中的空間信息是一項(xiàng)繁雜的工作。系統(tǒng)能通過文學(xué)作品中詞組出現(xiàn)頻率來分析其空間分布及方言詞分布,提供時(shí)間和空間二個(gè)維度的分析視角。例如,先秦至西漢年間(公元前2070-公元23年)古籍文獻(xiàn)的作者(由于系統(tǒng)目前沒有嚴(yán)格按譚正璧主編的《中國(guó)文學(xué)家大辭典》對(duì)屬于古代文學(xué)家的人物進(jìn)行標(biāo)識(shí),故統(tǒng)計(jì)分析的是所有古籍文獻(xiàn)的作者數(shù)據(jù)。以下同)主要地理分布如圖7。這一時(shí)期的作者分布主要在黃河以北地區(qū),在山東與山西境內(nèi);東漢至西晉年間(公元23-公元316年)古籍文獻(xiàn)的作者主要地理分布如圖8,這一時(shí)期的作者分布主要中心開始往長(zhǎng)江一帶轉(zhuǎn)移,以成都、武漢、南京為主;東晉至南北朝年間(公元316-公元581年)古籍文獻(xiàn)的作者主要地理分布如圖9,這一時(shí)期的作者分布主要以南京為主;隋至五代十國(guó)年間(公元581-公元979年)古籍文獻(xiàn)的作者主要地理分布如圖10,這一時(shí)期的作者主要分布中心重新北遷,主要分布在黃河中下游地區(qū),以河南、山東為主;宋至清末年間(公元979-公元1911年)古籍文獻(xiàn)的作者主要地理分布如圖11,這一時(shí)期的作者分布區(qū)域明顯擴(kuò)大,而且主要分布在沿海及中、東部地區(qū)。

    從以上古籍文獻(xiàn)作者的地理分布圖可以看出,古籍文獻(xiàn)作者的地理分布是有規(guī)律可循的,從周秦到清代中心的分布大體呈現(xiàn)以下規(guī)律:

    (1)以都城區(qū)域?yàn)橹行姆植?。都城既是全?guó)的政治和軍事中心,也是全國(guó)的文化和人才中心,聚集了豐富的教育與經(jīng)濟(jì)資源,文化和文學(xué)人才興盛,這種現(xiàn)象在我國(guó)古代早期表現(xiàn)更為明顯。先秦時(shí)期的都城以黃河以北區(qū)域?yàn)橹?,此時(shí)的作者基本分布在黃河以北區(qū)域,東漢至西晉年間都城開始往南遷移,如蜀國(guó)建都成都,吳國(guó)建都建業(yè)(今南京),此時(shí)的作者基本分布在長(zhǎng)江中下游區(qū)域,東晉至南北朝年間的都城也是建業(yè),此時(shí)的作者分布以南京為中心,隋至五代十國(guó)年間的都城以西安、開封、洛陽(yáng)為主,此時(shí)則以黃河中下游區(qū)域分布為主。由此可見,宋朝之前都城區(qū)域的變化對(duì)作者地理分布影響為主因。

    (2)以經(jīng)濟(jì)中心分布。黃河中下游流域與長(zhǎng)江一帶古時(shí)是中國(guó)的經(jīng)濟(jì)重心,最為富庶,這些地區(qū)的文人占了全國(guó)的絕大多數(shù),經(jīng)濟(jì)的繁榮,也帶動(dòng)了教育的發(fā)展,這些為文學(xué)人才的成長(zhǎng)提供了重要的條件。從宋朝開始,長(zhǎng)江中下游地區(qū)成為經(jīng)濟(jì)中心,此時(shí),經(jīng)濟(jì)中心對(duì)作者地理分布影響成為主因。

    (3)文明程度的影響。文化傳統(tǒng)悠久、文化根基深厚的地區(qū)一旦形成,就有一定的穩(wěn)定性,不會(huì)因政治、經(jīng)濟(jì)等外在條件的改變而立刻改變。比如長(zhǎng)江下游的江蘇、浙江一帶,無論朝代的更替都一直保持著文化和文學(xué)人才的興盛。

    (4)交通的影響。早期的作者地理分布影響因素主要是都城及經(jīng)濟(jì),從宋朝開始,隨著交通的便利,作者地理分布呈現(xiàn)出分散的態(tài)勢(shì),交通的發(fā)達(dá)促進(jìn)了各地經(jīng)濟(jì)、文化交流,經(jīng)濟(jì)與文化的廣泛交流是一個(gè)地區(qū)文化建設(shè)的一種重大的推動(dòng)力,此時(shí),作者地理分布集中在中國(guó)沿海及中、東部地區(qū),而西部地區(qū)由于交通因素限制了經(jīng)濟(jì)與文化的交流。

    以上分析的結(jié)果與曾大興在《文學(xué)地理學(xué)研究》中的研究成果高度相符。空間信息可視化分析為古籍深層次開發(fā)與應(yīng)用的發(fā)展做出了一種探索和嘗試,實(shí)現(xiàn)了從古籍作品一般信息的統(tǒng)計(jì)學(xué)分析擴(kuò)展到古籍信息空間信息挖掘,為文學(xué)地理學(xué)研究提供了新的視角,也為其他歷史、文化地理學(xué)等相關(guān)學(xué)科的研究提供了可參考的案例。

    5.結(jié)語

    大數(shù)據(jù)視域下的技術(shù)邏輯和人文邏輯相耦合的數(shù)字人文研究為社會(huì)科學(xué)經(jīng)典理論的驗(yàn)證和拓展提供了更多研究空間與研究方法。在人文學(xué)科領(lǐng)域,數(shù)字化大數(shù)據(jù)成百上千倍地?cái)U(kuò)大了資料的范圍,無疑有助于人們較為系統(tǒng)、全面地了解已有研究成果。但同時(shí)資料總量的快速增漲也給學(xué)者帶來了巨大挑戰(zhàn),研究所涉及的資料大大超出一般的閱讀、分析和理解所能處理的范疇,是以往“不可研究”或“難以研究”的。數(shù)字人文分析方法的出現(xiàn),為人文學(xué)科研究提供了新的研究空間和新的研究可能。筆者利用新的信息技術(shù)與面向數(shù)字人文的跨學(xué)科研究方法及研究范式,采用大數(shù)據(jù)研究理念,對(duì)古籍文本進(jìn)行了歷時(shí)詞頻分布規(guī)律的可視化分析,并以中國(guó)史定量研究為例,對(duì)部分中國(guó)史的經(jīng)典宏觀理論從量化角度進(jìn)行了初步驗(yàn)證。大規(guī)模的古籍文本定量分析是對(duì)古籍文獻(xiàn)深層次開發(fā)與利用的一種有益嘗試。

    猜你喜歡
    數(shù)字人文定量分析古籍
    中醫(yī)古籍“疒”部俗字考辨舉隅
    關(guān)于版本學(xué)的問答——《古籍善本》修訂重版說明
    天一閣文叢(2020年0期)2020-11-05 08:28:06
    關(guān)于古籍保護(hù)人才培養(yǎng)的若干思考
    天一閣文叢(2018年0期)2018-11-29 07:48:08
    我是古籍修復(fù)師
    金橋(2017年5期)2017-07-05 08:14:41
    數(shù)字人文目標(biāo)下圖書館信息服務(wù)模式研究
    數(shù)字學(xué)術(shù)與公眾科學(xué):數(shù)字圖書館新生態(tài)
    跨界與融合:全球視野下的數(shù)字人文
    跨界與融合:全球視野下的數(shù)字人文
    FTA在工業(yè)氣體探測(cè)報(bào)警系統(tǒng)中的應(yīng)用
    商務(wù)英語詞匯量與商務(wù)英語閱讀能力相關(guān)性研究
    亚洲,一卡二卡三卡| 亚洲三区欧美一区| 精品一品国产午夜福利视频| 永久免费av网站大全| 少妇人妻 视频| 青青草视频在线视频观看| 777久久人妻少妇嫩草av网站| 免费看av在线观看网站| 久久精品国产亚洲av涩爱| 性高湖久久久久久久久免费观看| 欧美精品一区二区免费开放| xxx大片免费视频| av国产久精品久网站免费入址| 在线观看www视频免费| 一区二区日韩欧美中文字幕| 亚洲激情五月婷婷啪啪| 亚洲欧洲日产国产| 最近的中文字幕免费完整| 亚洲第一av免费看| 永久免费av网站大全| xxx大片免费视频| 夜夜骑夜夜射夜夜干| 自线自在国产av| 十八禁网站网址无遮挡| av福利片在线| 日日爽夜夜爽网站| 国产色婷婷99| 国产成人精品无人区| 久久久久国产一级毛片高清牌| 99久久99久久久精品蜜桃| 欧美日韩亚洲高清精品| 亚洲av日韩精品久久久久久密 | 女人久久www免费人成看片| av在线观看视频网站免费| 国产激情久久老熟女| 午夜91福利影院| 亚洲欧美中文字幕日韩二区| 亚洲精品aⅴ在线观看| 精品少妇一区二区三区视频日本电影 | 我的亚洲天堂| 毛片一级片免费看久久久久| 女性被躁到高潮视频| 热re99久久精品国产66热6| 亚洲国产欧美日韩在线播放| 国产精品久久久久久久久免| 水蜜桃什么品种好| 欧美亚洲日本最大视频资源| 久久精品久久久久久久性| 99久久人妻综合| av有码第一页| 最黄视频免费看| 天堂8中文在线网| 黄网站色视频无遮挡免费观看| 午夜福利一区二区在线看| 国产精品久久久久久人妻精品电影 | 一区二区三区激情视频| 久久精品国产亚洲av涩爱| 欧美日韩视频精品一区| 男男h啪啪无遮挡| 国产欧美日韩一区二区三区在线| 午夜福利在线免费观看网站| 久久久久视频综合| 水蜜桃什么品种好| 国产探花极品一区二区| 观看av在线不卡| 黄色怎么调成土黄色| 亚洲成人一二三区av| 午夜福利,免费看| 国产黄频视频在线观看| 黄色毛片三级朝国网站| 丁香六月天网| 精品国产一区二区三区久久久樱花| 亚洲国产av新网站| 不卡av一区二区三区| 国产精品久久久av美女十八| 色精品久久人妻99蜜桃| 久久热在线av| 亚洲专区中文字幕在线 | 在线 av 中文字幕| 国产不卡av网站在线观看| 国产黄色免费在线视频| 亚洲精品久久午夜乱码| 伊人久久大香线蕉亚洲五| 黄色一级大片看看| 桃花免费在线播放| 国产片特级美女逼逼视频| 男女无遮挡免费网站观看| 国产成人精品无人区| √禁漫天堂资源中文www| 午夜激情av网站| 日韩欧美一区视频在线观看| 电影成人av| 欧美中文综合在线视频| 性色av一级| 国产一卡二卡三卡精品 | 丝袜脚勾引网站| 国产精品久久久人人做人人爽| 亚洲精品自拍成人| 中国国产av一级| 国产乱来视频区| 欧美黑人欧美精品刺激| 欧美日韩一级在线毛片| 超碰成人久久| 久久av网站| 欧美日韩视频精品一区| 欧美人与性动交α欧美软件| 男人添女人高潮全过程视频| 人成视频在线观看免费观看| av天堂久久9| 在线观看www视频免费| 黄色视频不卡| 少妇的丰满在线观看| av电影中文网址| av在线app专区| 51午夜福利影视在线观看| 亚洲精品乱久久久久久| 日韩中文字幕欧美一区二区 | av免费观看日本| 亚洲婷婷狠狠爱综合网| 日韩精品免费视频一区二区三区| 日本av免费视频播放| 一区二区三区四区激情视频| 欧美av亚洲av综合av国产av | 老汉色∧v一级毛片| 成年人免费黄色播放视频| av福利片在线| 中文字幕精品免费在线观看视频| 亚洲国产精品999| 婷婷色综合大香蕉| av不卡在线播放| 精品一品国产午夜福利视频| 国产熟女午夜一区二区三区| 少妇猛男粗大的猛烈进出视频| 日本91视频免费播放| 男女下面插进去视频免费观看| 亚洲欧洲精品一区二区精品久久久 | 热99久久久久精品小说推荐| 两性夫妻黄色片| 中文字幕高清在线视频| 波多野结衣av一区二区av| 久久久久久久久久久久大奶| 国产1区2区3区精品| 新久久久久国产一级毛片| 亚洲av日韩在线播放| 欧美中文综合在线视频| 亚洲美女搞黄在线观看| 欧美精品一区二区大全| 亚洲 欧美一区二区三区| 免费黄网站久久成人精品| 天堂中文最新版在线下载| 在线 av 中文字幕| 日韩,欧美,国产一区二区三区| 久久这里只有精品19| 国产片特级美女逼逼视频| 亚洲国产精品999| 一区二区av电影网| 一二三四在线观看免费中文在| 亚洲国产精品999| 欧美精品一区二区免费开放| www日本在线高清视频| 午夜免费男女啪啪视频观看| 一区二区av电影网| 亚洲欧美激情在线| 成人免费观看视频高清| 一本—道久久a久久精品蜜桃钙片| 99久国产av精品国产电影| 久热这里只有精品99| 最新的欧美精品一区二区| 欧美日韩亚洲国产一区二区在线观看 | 五月天丁香电影| 亚洲精品国产av蜜桃| 两个人免费观看高清视频| 交换朋友夫妻互换小说| 大码成人一级视频| 又黄又粗又硬又大视频| 久热爱精品视频在线9| 国产精品久久久久久久久免| 蜜桃在线观看..| av视频免费观看在线观看| www.av在线官网国产| 黄频高清免费视频| 视频区图区小说| 欧美另类一区| 国产在视频线精品| 如何舔出高潮| 高清视频免费观看一区二区| 亚洲av电影在线进入| 麻豆av在线久日| 国产97色在线日韩免费| 久久青草综合色| 国产精品国产三级国产专区5o| 熟女av电影| 成人国产麻豆网| 中文乱码字字幕精品一区二区三区| 18禁国产床啪视频网站| 国产男人的电影天堂91| 日韩中文字幕欧美一区二区 | 99久久精品国产亚洲精品| 午夜福利视频精品| 2021少妇久久久久久久久久久| 一边亲一边摸免费视频| 国产精品女同一区二区软件| 另类精品久久| 久热这里只有精品99| 国产有黄有色有爽视频| 精品一区二区免费观看| 卡戴珊不雅视频在线播放| 国产日韩欧美亚洲二区| 两性夫妻黄色片| 又黄又粗又硬又大视频| videosex国产| 青青草视频在线视频观看| 亚洲精品一区蜜桃| 日本午夜av视频| 亚洲自偷自拍图片 自拍| 亚洲成人国产一区在线观看 | 久久久精品94久久精品| 丝袜喷水一区| 国产麻豆69| 久久人人爽人人片av| 国产av精品麻豆| 激情五月婷婷亚洲| 亚洲欧美色中文字幕在线| 黄片无遮挡物在线观看| 一二三四在线观看免费中文在| 人人妻人人澡人人爽人人夜夜| 国产精品免费大片| 极品少妇高潮喷水抽搐| av免费观看日本| 欧美日韩精品网址| 欧美xxⅹ黑人| 丁香六月欧美| 亚洲久久久国产精品| 成人三级做爰电影| 精品亚洲成国产av| 欧美日韩福利视频一区二区| 9热在线视频观看99| 美女高潮到喷水免费观看| 熟女少妇亚洲综合色aaa.| 晚上一个人看的免费电影| 国产成人精品久久二区二区91 | 国产成人午夜福利电影在线观看| 可以免费在线观看a视频的电影网站 | 日韩av不卡免费在线播放| 男男h啪啪无遮挡| 宅男免费午夜| 亚洲精品乱久久久久久| 97在线人人人人妻| 美女主播在线视频| 美女国产高潮福利片在线看| 成人亚洲欧美一区二区av| 丰满迷人的少妇在线观看| 久久国产精品男人的天堂亚洲| av免费观看日本| 亚洲欧美一区二区三区国产| 成年美女黄网站色视频大全免费| 色播在线永久视频| 日韩,欧美,国产一区二区三区| 国产成人啪精品午夜网站| 自线自在国产av| 只有这里有精品99| 在线免费观看不下载黄p国产| 黑丝袜美女国产一区| 亚洲情色 制服丝袜| 一级爰片在线观看| 视频区图区小说| 丰满饥渴人妻一区二区三| 久久鲁丝午夜福利片| 别揉我奶头~嗯~啊~动态视频 | 亚洲免费av在线视频| 国产亚洲av高清不卡| 欧美日韩亚洲综合一区二区三区_| 亚洲精品久久午夜乱码| 亚洲精品一二三| 国产成人欧美在线观看 | 性高湖久久久久久久久免费观看| 观看美女的网站| 国产精品香港三级国产av潘金莲 | 咕卡用的链子| av有码第一页| 日日摸夜夜添夜夜爱| 亚洲欧美成人精品一区二区| 黑人猛操日本美女一级片| 日日啪夜夜爽| 亚洲欧美一区二区三区黑人| 国产av码专区亚洲av| 男女之事视频高清在线观看 | 狠狠精品人妻久久久久久综合| 制服丝袜香蕉在线| 人人妻人人澡人人看| 日本爱情动作片www.在线观看| 十八禁高潮呻吟视频| 天天操日日干夜夜撸| 久久人人爽av亚洲精品天堂| 女的被弄到高潮叫床怎么办| 免费观看人在逋| 国产精品 欧美亚洲| 在线观看www视频免费| 国产伦理片在线播放av一区| 久久性视频一级片| 日本爱情动作片www.在线观看| 女人被躁到高潮嗷嗷叫费观| 成年人午夜在线观看视频| 国产乱人偷精品视频| 久久久国产精品麻豆| 别揉我奶头~嗯~啊~动态视频 | 亚洲精品,欧美精品| 黄片播放在线免费| 久久久久久人妻| 久久天躁狠狠躁夜夜2o2o | 午夜影院在线不卡| 成人国产av品久久久| 免费观看a级毛片全部| 久久人人爽人人片av| 精品福利永久在线观看| 下体分泌物呈黄色| 最近中文字幕2019免费版| 青青草视频在线视频观看| 赤兔流量卡办理| 国产精品人妻久久久影院| 日韩制服丝袜自拍偷拍| 久久精品久久久久久噜噜老黄| 亚洲精品中文字幕在线视频| 亚洲精品视频女| 国产 精品1| 国产伦人伦偷精品视频| 亚洲精品国产av成人精品| 90打野战视频偷拍视频| 男男h啪啪无遮挡| 成年人免费黄色播放视频| 久久久久久久久免费视频了| 尾随美女入室| 午夜免费鲁丝| 欧美激情极品国产一区二区三区| 日日摸夜夜添夜夜爱| 精品人妻熟女毛片av久久网站| 成人漫画全彩无遮挡| 亚洲精华国产精华液的使用体验| 久久久久精品国产欧美久久久 | 久久久久国产精品人妻一区二区| 久久精品国产亚洲av高清一级| 亚洲国产最新在线播放| 你懂的网址亚洲精品在线观看| 亚洲欧美一区二区三区久久| 亚洲成人av在线免费| 国产1区2区3区精品| 啦啦啦 在线观看视频| 国产精品女同一区二区软件| 91精品三级在线观看| 久久人人爽av亚洲精品天堂| 不卡视频在线观看欧美| 精品少妇久久久久久888优播| 深夜精品福利| 观看美女的网站| 欧美黑人欧美精品刺激| 亚洲 欧美一区二区三区| 日本黄色日本黄色录像| av国产精品久久久久影院| 亚洲,欧美精品.| 成人三级做爰电影| 欧美成人精品欧美一级黄| 亚洲第一青青草原| 久久性视频一级片| 嫩草影院入口| 久久久精品免费免费高清| 久久久精品国产亚洲av高清涩受| 国产 精品1| 成人亚洲精品一区在线观看| 色婷婷av一区二区三区视频| 少妇人妻精品综合一区二区| 亚洲人成77777在线视频| 男女边吃奶边做爰视频| 高清在线视频一区二区三区| 亚洲精品久久久久久婷婷小说| xxxhd国产人妻xxx| 午夜福利视频在线观看免费| 母亲3免费完整高清在线观看| 亚洲成人手机| 国产精品国产av在线观看| 一级毛片 在线播放| 国产乱来视频区| 免费观看av网站的网址| 综合色丁香网| 日韩电影二区| 欧美日韩福利视频一区二区| 狂野欧美激情性bbbbbb| 人体艺术视频欧美日本| 久久ye,这里只有精品| 丝袜喷水一区| 美女主播在线视频| 少妇 在线观看| 欧美最新免费一区二区三区| 一本久久精品| 亚洲国产精品一区二区三区在线| 最近2019中文字幕mv第一页| 黄片无遮挡物在线观看| 伊人久久大香线蕉亚洲五| 亚洲伊人久久精品综合| 免费黄频网站在线观看国产| 啦啦啦在线观看免费高清www| 国产免费又黄又爽又色| 亚洲欧洲精品一区二区精品久久久 | 国产熟女欧美一区二区| 不卡av一区二区三区| 永久免费av网站大全| 一级a爱视频在线免费观看| 这个男人来自地球电影免费观看 | 99热网站在线观看| 午夜影院在线不卡| 激情五月婷婷亚洲| 久久久久精品人妻al黑| 精品卡一卡二卡四卡免费| 叶爱在线成人免费视频播放| 超碰成人久久| 麻豆av在线久日| 天堂俺去俺来也www色官网| 久久精品亚洲av国产电影网| 18禁观看日本| 少妇的丰满在线观看| 国产精品香港三级国产av潘金莲 | 亚洲欧美激情在线| 最黄视频免费看| 亚洲国产精品国产精品| 成人国产av品久久久| 欧美精品高潮呻吟av久久| 男男h啪啪无遮挡| 赤兔流量卡办理| 大码成人一级视频| 伊人久久国产一区二区| 这个男人来自地球电影免费观看 | avwww免费| bbb黄色大片| 老司机靠b影院| 日韩av在线免费看完整版不卡| 男男h啪啪无遮挡| 不卡视频在线观看欧美| 国产精品三级大全| 狠狠精品人妻久久久久久综合| 亚洲一区二区三区欧美精品| 美国免费a级毛片| 在线天堂中文资源库| 亚洲av电影在线观看一区二区三区| 搡老岳熟女国产| 一区二区av电影网| 国产成人欧美| 18在线观看网站| 又黄又粗又硬又大视频| 女性生殖器流出的白浆| 9色porny在线观看| 日韩 欧美 亚洲 中文字幕| 国产成人免费观看mmmm| 成年av动漫网址| 国产黄色免费在线视频| 嫩草影院入口| 国产亚洲av高清不卡| 一区在线观看完整版| 制服诱惑二区| 九色亚洲精品在线播放| 亚洲欧美一区二区三区黑人| 欧美国产精品va在线观看不卡| 香蕉丝袜av| 一本久久精品| 丝袜美腿诱惑在线| 精品久久久精品久久久| 精品国产一区二区三区久久久樱花| 欧美日韩国产mv在线观看视频| 成年人免费黄色播放视频| 久久久久精品国产欧美久久久 | 最新的欧美精品一区二区| 亚洲国产精品成人久久小说| 欧美激情高清一区二区三区 | 一区在线观看完整版| 亚洲少妇的诱惑av| 美女扒开内裤让男人捅视频| 人妻一区二区av| 王馨瑶露胸无遮挡在线观看| 男女下面插进去视频免费观看| 国产亚洲一区二区精品| 操美女的视频在线观看| 欧美黑人精品巨大| 中文字幕av电影在线播放| 欧美日韩亚洲综合一区二区三区_| 水蜜桃什么品种好| 看非洲黑人一级黄片| 少妇精品久久久久久久| 久久ye,这里只有精品| 国产精品.久久久| 一本大道久久a久久精品| 国产黄色免费在线视频| 亚洲av成人不卡在线观看播放网 | 亚洲成国产人片在线观看| 久久毛片免费看一区二区三区| 日日爽夜夜爽网站| 午夜福利网站1000一区二区三区| 黄色 视频免费看| 亚洲成国产人片在线观看| 免费看不卡的av| 热re99久久国产66热| 免费观看av网站的网址| 在线观看www视频免费| 国产成人91sexporn| 赤兔流量卡办理| 久久国产亚洲av麻豆专区| 成年美女黄网站色视频大全免费| 久久久久久免费高清国产稀缺| 亚洲国产av影院在线观看| 日韩欧美一区视频在线观看| 国产1区2区3区精品| 午夜福利网站1000一区二区三区| 欧美成人精品欧美一级黄| 大码成人一级视频| 久久久久精品人妻al黑| 久久精品亚洲熟妇少妇任你| 91国产中文字幕| 丁香六月天网| 国产精品女同一区二区软件| 中文字幕另类日韩欧美亚洲嫩草| 一边摸一边做爽爽视频免费| 国产麻豆69| av视频免费观看在线观看| 在线观看免费高清a一片| av网站免费在线观看视频| 中文字幕亚洲精品专区| 操美女的视频在线观看| 少妇精品久久久久久久| 色综合欧美亚洲国产小说| 亚洲一区中文字幕在线| 在线观看免费视频网站a站| 大码成人一级视频| 少妇精品久久久久久久| e午夜精品久久久久久久| 国产乱人偷精品视频| 99热网站在线观看| 午夜福利视频在线观看免费| 18禁裸乳无遮挡动漫免费视频| 在线观看一区二区三区激情| 中文精品一卡2卡3卡4更新| 日韩 欧美 亚洲 中文字幕| 美女扒开内裤让男人捅视频| 久热这里只有精品99| 久久久久精品国产欧美久久久 | 免费观看a级毛片全部| 亚洲精品国产av蜜桃| 精品久久久久久电影网| 国产野战对白在线观看| 日日撸夜夜添| 日本欧美视频一区| 黄色怎么调成土黄色| 久久99一区二区三区| 国产一级毛片在线| 国产男女内射视频| 伦理电影大哥的女人| 一二三四在线观看免费中文在| 午夜老司机福利片| kizo精华| 超碰成人久久| 中文字幕人妻熟女乱码| 精品人妻在线不人妻| 亚洲国产欧美网| 亚洲激情五月婷婷啪啪| 国产亚洲精品第一综合不卡| 国产成人av激情在线播放| 亚洲国产精品一区二区三区在线| 纯流量卡能插随身wifi吗| 美女扒开内裤让男人捅视频| 人人妻人人澡人人爽人人夜夜| 国产亚洲av高清不卡| 中国三级夫妇交换| 日韩,欧美,国产一区二区三区| 欧美日韩av久久| 免费观看a级毛片全部| 乱人伦中国视频| 大码成人一级视频| 欧美日韩av久久| 女人久久www免费人成看片| 啦啦啦视频在线资源免费观看| 黄色视频不卡| 大片免费播放器 马上看| 欧美日韩亚洲综合一区二区三区_| 日韩免费高清中文字幕av| 波野结衣二区三区在线| av国产久精品久网站免费入址| 国产伦人伦偷精品视频| 少妇 在线观看| 日本午夜av视频| 女人高潮潮喷娇喘18禁视频| 色综合欧美亚洲国产小说| 蜜桃在线观看..| 日日摸夜夜添夜夜爱| 免费观看av网站的网址| 少妇 在线观看| 看非洲黑人一级黄片| 一个人免费看片子| www.精华液| 不卡视频在线观看欧美| 咕卡用的链子| 亚洲一码二码三码区别大吗| 亚洲精品第二区| 少妇被粗大猛烈的视频| 日本91视频免费播放| 一级毛片电影观看| 91精品三级在线观看| 99九九在线精品视频| av网站免费在线观看视频| 久久久久久免费高清国产稀缺| 精品久久久久久电影网| 久久婷婷青草| 国产亚洲最大av| 性高湖久久久久久久久免费观看| 亚洲四区av| 久久精品亚洲av国产电影网| av线在线观看网站| 熟女少妇亚洲综合色aaa.| 99re6热这里在线精品视频| 欧美乱码精品一区二区三区|