• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    文獻數(shù)字化技術在甲骨文數(shù)據(jù)庫建設中的應用與展望

    2020-12-01 05:02:00劉永革
    殷都學刊 2020年3期
    關鍵詞:字符識別甲骨手寫

    李 邦,劉永革

    (安陽師范學院 甲骨文信息處理教育部重點實驗室,河南 安陽 455000)

    甲骨文是迄今為止中國發(fā)現(xiàn)的年代最早的成熟文字系統(tǒng),也是研究我國文字源流的珍貴資料。識別和解讀甲骨文對于研究早期文字的產(chǎn)生、演變,了解殷商時期的歷史文化以及中華民族的文化傳承都具有重要意義。自1899年甲骨文首次被發(fā)現(xiàn)以來,殷墟甲骨文逐漸為人們所熟知,國內(nèi)外學界也對其表現(xiàn)出濃厚的興趣,在幾代考古學家和歷史學家孜孜不倦的努力之下,甲骨文的解讀和考釋迄今已取得豐碩成果[1-4]。記載和收錄這些研究成果的甲骨文研究文獻極大地推進了甲骨文的研究進程,奠定了甲骨文的研究基礎。隨著甲骨文研究的逐漸深入,為了便于查閱資料,學者們對甲骨文資料進行了整理,出版了《甲骨文合集》[1]《甲骨學文獻集成》[2]《甲骨文詁林》[3]《甲骨文研究資料匯編》[4]等系列叢書。但遺憾的是,整理成冊的書籍資料雖然為甲骨學研究提供了極大的便利,但也存在一定的局限性。大部頭、多冊出版的書籍受限于成本通常售價高昂,其豐富且繁雜的內(nèi)容也大量增加了資料查閱的時間、人力成本。隨著信息化、數(shù)字化技術的發(fā)展,通過對甲骨文研究文獻進行數(shù)字化處理,打造開放、便捷、共享的甲骨文數(shù)字化平臺成為大勢所趨。而甲骨學文獻實現(xiàn)數(shù)據(jù)化,也意味著可以進一步利用大數(shù)據(jù)技術對文獻進行分析,并為甲骨學研究提供更深入的智能化服務[5](p74-77)。本文將對甲骨文大數(shù)據(jù)平臺--《殷契文淵》開發(fā)所需的關鍵技術文獻數(shù)字化進行詳細介紹,并進一步展望數(shù)字化技術在實現(xiàn)甲骨學研究智能化過程中的前景運用,為甲骨學研究者了解當下甲骨學研究領域中的信息化進程提供幫助。

    一、文獻數(shù)字化與甲骨文大數(shù)據(jù)平臺

    信息化浪潮下,文獻的數(shù)字化發(fā)展也成為大勢所趨。借助數(shù)字網(wǎng)絡技術,對甲骨文研究手稿、文獻等資料進行數(shù)字化處理,可使研究人員不受時間、空間限制,實現(xiàn)對甲骨文研究原著的便捷查閱、比對和???。此外,文獻數(shù)字化還可以降低在人工翻閱甲骨文研究手稿等原始資料時可能產(chǎn)生的丟失或損壞風險,進一步拓寬和提高原始文獻的利用范圍和利用率[6](p130-137)。因此,文獻數(shù)字化在推動甲骨文研究廣度和深度的拓展方面必將發(fā)揮重要作用。

    從廣義上講,任何將文獻內(nèi)容從物理空間輸入至計算機存儲單元的行為,都可以稱為文獻數(shù)字化。然而,在人工智能、大數(shù)據(jù)時代背景下,如果所謂的數(shù)字化過程僅能起到保護文獻的作用,而不能為其研究對象提供便捷的查閱、對比、校勘等服務,這樣的文獻數(shù)字化就顯得有些“名不副實”。甲骨文大數(shù)據(jù)平臺--《殷契文淵》的開發(fā)目標是實現(xiàn)甲骨學研究的便捷性、共享性、交互性、實用性,盡可能地為研究者提供權威便捷的檢索、查詢、對比、??钡确?,平臺開發(fā)過程中對甲骨學文獻的大規(guī)模數(shù)字化工作也始終貫徹該思想,并創(chuàng)造性地將整個開發(fā)過程劃分為三個階段,即“數(shù)據(jù)化” “數(shù)字化”“智能化”。

    首先,《殷契文淵》的“數(shù)據(jù)化”階段旨在將物理空間的書籍、文獻、原始手稿等紙媒文檔通過拍照掃描等方式轉(zhuǎn)化為計算機可以存儲的數(shù)據(jù)。一般而言,文獻資料的數(shù)據(jù)化結(jié)果將按照頁碼順序?qū)D片進行排列并以pdf文件格式存儲。目前,《殷契文淵》中所收錄的文獻均以pdf格式分門別類地存儲,已實現(xiàn)資源共享,研究者可通過訪問網(wǎng)站直接免費下載(需要聲明的是,《殷契文淵》大數(shù)據(jù)平臺上的文獻資料不完全是由實驗室搜集整理的,其中有很大一部分來自于廣大甲骨學研究者的無私奉獻)?!皵?shù)據(jù)化”的過程作為甲骨學文獻整理的第一階段,其目的在于為后續(xù)的智能化開發(fā)提供盡可能多的數(shù)據(jù)支撐。但是,僅對文獻資料進行數(shù)據(jù)化處理存在著明顯的弊端:在交互性方面,圖片格式的文檔資料過于“死板”,利用計算機翻閱pdf文獻與翻閱紙質(zhì)文檔并沒有太大區(qū)別,也不能實現(xiàn)文檔內(nèi)容的復制、粘貼以及檢索,單純的文獻數(shù)據(jù)化對閱讀者來說依然不夠“便捷”。只有能夠通過檢索快速提取到所需信息,才能真正體現(xiàn)出數(shù)字化工作的意義。因此,平臺建設的第二階段就是在實現(xiàn)文獻數(shù)據(jù)化的基礎上,進一步開發(fā)文獻的內(nèi)容檢索、對比等功能,這個階段稱為平臺的“數(shù)字化”階段。

    相較于文獻“數(shù)據(jù)化”,“數(shù)字化”可以將不便于計算機處理的“數(shù)據(jù)”轉(zhuǎn)化為便于計算機處理的形式,具體表現(xiàn)為:將圖片格式的文檔轉(zhuǎn)化為可以檢索的文字文檔,并在此基礎上對文獻內(nèi)容進行“碎片化”處理。例如,將著錄文獻內(nèi)容按照拓片、摹本、出處、著拓號等內(nèi)容分類并在平臺上進行系統(tǒng)地存儲;將拓片圖像以及甲骨文釋集上的甲骨字與對應的釋文進行識別、定位并在平臺上進行展示等。簡單來說,“數(shù)字化”工作是將甲骨學文獻的“數(shù)據(jù)”進行系統(tǒng)地整理,使研究者能夠更加快速、精準地查找到自己所需的內(nèi)容。平臺“數(shù)字化”的發(fā)展,無疑將極大地減輕研究者檢索文獻資料的負擔,推動甲骨文研究廣度與深度的拓展。需要特別指出的是,隨著近年來數(shù)據(jù)挖掘與機器學習技術的發(fā)展,在平臺“數(shù)據(jù)化”建設的過程中,針對甲骨學文獻的“數(shù)字化”研究也正向著“智能化”發(fā)展。在完善相關技術之后,殷契文淵平臺也將推出相應的“智能化”服務,如甲骨字識別服務(筆跡分類)、以圖查甲骨片服務、手寫甲骨字識別服務等等。

    文獻數(shù)字化技術正是依托于平臺的“數(shù)字化”建設階段,在利用計算機技術大幅提高“數(shù)據(jù)化”工作效率的同時,開發(fā)一系列智能應用工具,為廣大甲骨學研究者與愛好者提供智能化、便捷化、精準化服務的一項技術。

    甲骨學文獻數(shù)字化工作主要利用了光學字符識別技術(OCR)[7]。該技術涵蓋了所有圖像文字檢測和識別的相關技術。本文選取了其中與文獻文本圖片識別相關的兩個重要技術進行介紹,即文檔分析技術與字符識別技術[8]。文檔分析又稱為文檔布局分析,是指識別和分類文本文檔的掃描圖像中的特征區(qū)域。字符識別,則是在文檔分析的基礎上,將其中的文本區(qū)域的內(nèi)容轉(zhuǎn)化為計算機通用的字符編碼。由于實現(xiàn)準確、高效、智能的文檔分析與字符識別是文獻數(shù)字化技術發(fā)展的基礎和關鍵,因此,對文檔分析和字符識別技術的研究與應用也成為《殷契文淵》甲骨文大數(shù)據(jù)平臺當前建設的重點。

    二、文檔分析技術在文獻數(shù)字化中的應用與展望

    文檔分析技術作為文獻數(shù)字化的第一步,是對文獻整體結(jié)構的初步分析。根據(jù)分析需求的不同,文檔布局分析可劃分為兩個層次,即幾何文本分析與邏輯文本分析[9](p139)。

    幾何文本分析是指對文檔圖片中文本正文、插圖、數(shù)學符號和嵌入文檔中的表格等不同區(qū)域進行檢測和標記,找出文本中字符所在的位置,并在分割出的文本區(qū)域中,進一步進行字符切分的一種技術,這也為后續(xù)的字符識別奠定了基礎。

    從圖像處理的角度看,幾何文本分析主要是利用圖片的幾何結(jié)構特征進行圖片分割。對大部分甲骨學文獻而言,由于文獻本身一般是出版物,其內(nèi)容是經(jīng)過統(tǒng)一整理編輯后再進行印刷的,因此排版布局具有一定的規(guī)范性,比較適合運用經(jīng)典的版面分析方法進行版面分析。常見的經(jīng)典版面分析算法包括:投影法[10](p139-141)、遞歸X-Y剪切法[11](p10-22)、行程拖尾算法(RLSA)[12]( p1658-1669)等。這些算法的共同點在于可以通過分析文檔圖片中黑色像素的位置,將間隔比較近的黑色像素劃分為同一個文本塊。在文本塊正確分割的基礎上,進行后續(xù)的幾何版面分析,將文本分割為文本行或文本列,最終實現(xiàn)對單個字符的分割。就中文文獻而言,漢字單個字符的分割通常需要與識別結(jié)果相結(jié)合,判斷單個字符的分割是否正確,主要是看分割出的字符能否被識別。但是,在單個漢字字符的分割中,經(jīng)常出現(xiàn)漢字粘連、重疊以及漢字部首的錯誤分割等問題,導致分割出的漢字字符不能被正確識別,例如,在字符分割中,經(jīng)常會出現(xiàn)偏旁部首“搭錯車”的錯誤識別案例,不得不再次進行人工???,增加了研究者的時間、人力成本。

    從數(shù)據(jù)整理的角度看,幾何文檔分割是后續(xù)字符識別的前提和必要條件。但受限于當下的技術發(fā)展程度,對于結(jié)構化文檔,僅通過幾何分析結(jié)果完成的字符識別仍需進行大量的后續(xù)數(shù)據(jù)整理工作。以甲骨學研究中必不可少的著錄類文獻為例,此類文獻的整理通常需要在圖片分割與字符識別的基礎上,將甲骨片的編號、出處、著拓號、甲骨字原文、漢字釋文等相關信息也錄入到系統(tǒng)中。而這些信息在文獻中往往具有較強的邏輯關系,如編號通常出現(xiàn)在拓片附近、著拓號在文檔中一般有固定結(jié)構等。因此,要實現(xiàn)對甲骨學文獻中著錄類文獻的文檔分析,需要在幾何文本分析的基礎上,進一步運用邏輯文本分析技術進行分析。

    邏輯文本分析可理解為是對幾何文檔分析結(jié)果的深度挖掘,它將進一步對文本區(qū)域在文檔中扮演的不同邏輯角色(如標題、腳注等)進行分析[13]( p1658-1669)。簡單而言,邏輯文本分析技術是指在幾何分析的基礎上對文本塊內(nèi)容之間的邏輯結(jié)構進行劃分。這種邏輯劃分可以更高效且準確地識別結(jié)構化文本,其在日常生活中已有廣泛運用,如對身份證、銀行票據(jù)、病例、各種登記表格以及高度結(jié)構化的書籍等的識別就屬于邏輯文本分析技術[14]。

    邏輯文本分析技術的優(yōu)勢在高度架構化文本的識別整理中更為明顯。相較于幾何文本分析,即便是使用最簡單的邏輯文檔分析技術提取高度架構化文本中的圖片,也將大幅提升文獻的整理效率。以《簠室殷契征文》一書為例,全書共計收錄拓片圖1125張,書中內(nèi)容頁只包含拓片圖像與對應漢字編號的共有228頁。如果通過手工截圖的方式對這本著錄進行整理,約需花費20個小時的工作時間。然而,通過分析文獻頁面的圖片特征對圖片進行提取,整個截圖過程僅需花費不到一分鐘的時間。而且在全部截圖中,累計錯誤截圖僅17張,所需的人工勘誤與整理時間合計不超過半個小時。在這個案例中,使用邏輯文檔分析技術可以將甲骨文著錄整理的工作效率提高將近40倍。

    目前,邏輯文本分析的實現(xiàn)方式主要有兩種。常見的一種是首先在幾何文本分析的基礎上進行字符識別,然后利用自然語言處理技術(NLP)對字符識別結(jié)果進行處理,以理解文本內(nèi)容并推理文檔內(nèi)容之間的邏輯關系[15](p5-9)。另一種則是直接從圖片中獲取視覺信息并進行語義分析的邏輯文檔分析方式[16]。在流程上,該方式在實現(xiàn)步奏上與上一種方式有著本質(zhì)區(qū)別。以著錄整理為例,第一種方式需要計算機首先將所有圖片上的內(nèi)容識別出來,在利用NLP技術進行語義理解后將識別出來的內(nèi)容歸類并放入目標excel表格。然而,不管是圖片內(nèi)容識別還是語義理解的過程都存在一定的錯誤率,因此最終生成的excel表格一般還需進行人工糾錯。而第二種方式的實現(xiàn)步奏是,先不對文本圖片的具體內(nèi)容進行識別,而是通過位置判定進行分析,即通過判斷圖片上哪些字距離文中圖片比較近,哪些字在圖表中的第一行等諸如此類的位置信息,提前明確需要識別的內(nèi)容在目標excel表中的位置,并在識別完成后錄入目標excel表。相較于第一種方式,這種利用計算機視覺技術進行語義分析的方法可以最大程度地規(guī)避邏輯分析錯誤。

    對比邏輯文本分析的兩種實現(xiàn)方式,對《殷契文淵》平臺的著錄類文獻的整理工作而言,第二種實現(xiàn)方式具有更高的準確率,可以更好地減少人力的機械重復工作。但是,第二種實現(xiàn)方式需要提供大量的結(jié)構化文檔數(shù)據(jù)以供計算機進行訓練。為了早日實現(xiàn)對甲骨學文獻的邏輯文本分析,進一步提高文獻的整理效率,《殷契文淵》甲骨文大數(shù)據(jù)平臺正著手創(chuàng)建用于甲骨學文獻文檔分析的訓練數(shù)據(jù)集,以支撐甲骨學文獻研究中邏輯分析技術的創(chuàng)新和發(fā)展。相信假以時日,文獻的整理工作將由人工整理進化為人工智能整理,屆時專家學者可以將自己搜集到的文獻資料直接上傳至大數(shù)據(jù)平臺,平臺在完成自動化的資料分析整理后錄入數(shù)據(jù)庫,并自動實現(xiàn)與其他數(shù)據(jù)的關聯(lián)對比,以此為專家學者研究甲骨學提供更多更好的智能化、便捷化服務。

    三、字符識別技術在甲骨學文獻研究中的應用與展望

    在順利實現(xiàn)甲骨學文獻數(shù)字化的文檔分析之后,能否高效、準確地實現(xiàn)甲骨學文獻內(nèi)容的字符識別,直接關系到文獻數(shù)字化的成功與否。因此,字符識別技術也是當下《殷契文淵》甲骨文大數(shù)據(jù)平臺的研究重點。前文提到,字符識別技術的主要目的在于將字符的圖片轉(zhuǎn)化為字符編碼以便計算機直接查詢,這項技術在日常生活中也早有應用,使用計算機進行字符輸入就是通過輸入法查找字符編碼完成的。對于《殷契文淵》而言,字符識別是平臺“數(shù)據(jù)化”工作的必由之路,只有將文獻中的每一個字都轉(zhuǎn)化為計算機可識別的字符,并將識別結(jié)果全部錄入到平臺中,才能實現(xiàn)文獻內(nèi)容的“網(wǎng)絡化”,進而達到只需輸入一個甲骨字/漢字/作者/拓片圖等便可檢索到所有與輸入內(nèi)容相關的文獻/甲骨片信息的目標。

    就目前的技術發(fā)展而言,字符識別主要是通過深度學習技術完成的。深度學習技術,就是計算機使用訓練集中的字符數(shù)據(jù)來訓練計算,通過不斷“學習”獲得正確識別字符的能力。為了實現(xiàn)對每一個字符的正確識別,訓練集必須囊括所有需要被識別的圖片和字符,而且每個字都需要上千張圖片組作為訓練數(shù)據(jù),每張圖片也需要標記識別結(jié)果以供計算機學習??梢钥闯?,要獲得高正確率的識別結(jié)果,需要在大量具有正確結(jié)果標記的數(shù)據(jù)的基礎上不斷進行深度學習算法開發(fā)。

    而根據(jù)字符數(shù)據(jù)集開發(fā)進度的不同,字符識別技術可以進一步細分為印刷漢字識別,手寫漢字識別,拓片甲骨字識別,手寫甲骨字識別等。

    (一)印刷體漢字識別

    訓練集圖片獲取難度最低的當屬印刷體漢字,因為常見漢字均可以從網(wǎng)絡上獲取圖片,甚至可以直接利用標準宋體字庫作為訓練數(shù)據(jù)。當下,在印刷體漢字的文獻識別方面已經(jīng)具備比較成熟的識別技術,僅漢字識別這一環(huán)節(jié),識別準確率已可達到99%以上。市面上現(xiàn)已開發(fā)出一大批高質(zhì)量、高準確率的ocr軟件,這些軟件在簡/繁體中文的印刷體以及清末石印的古籍漢字等字符的識別中表現(xiàn)良好。在此基礎上,《殷契文淵》甲骨文大數(shù)據(jù)平臺也已經(jīng)開始利用ocr進行甲骨學文獻數(shù)字化的記錄工作,實現(xiàn)了部分漢字印刷文獻的全文檢索。對于已完成數(shù)據(jù)化的文獻,在平臺上輸入文獻中的任何內(nèi)容即可檢索到相關文獻,基本實現(xiàn)了甲骨學文獻檢索的便捷化、高效化。

    (二)手寫漢字識別

    相較于印刷體漢字,手寫漢字數(shù)據(jù)集的獲取存在一定的困難,因為手寫漢字很難直接從網(wǎng)絡圖片中獲取,其收集工作進展相對緩慢。同時,由于每個人的書寫風格有所不同,同一個手寫字的圖像特征也存在很大差別,客觀上增大了手寫漢字的識別難度。近年來,手寫漢字識別一直是國內(nèi)漢字識別領域的研究熱點,專家學者也陸續(xù)整理出一系列適合手寫漢字識別的中文手寫數(shù)據(jù)集,例如,北京郵電大學整理的HCL2000數(shù)據(jù)集[17],華南理工大學整理的SCUT-COUCH2009系列數(shù)據(jù)集[18](p53-64),以及中國科學院自動化研究所整理的CASIA-HWDB1.0-1.2系列數(shù)據(jù)集[19] (p155-162)等。在這些手寫數(shù)據(jù)集中,SCUT-COUCH2009系列數(shù)據(jù)集中共涉及6763個簡體漢字以及5401個繁體漢字,CASIA-HWDB1.0-1.2系列數(shù)據(jù)集則囊括了7185個簡體漢字。通過對數(shù)據(jù)集中上百萬張圖片的訓練,單個手寫漢字的識別準確度已經(jīng)可以達到98%以上。但將文檔分析與漢字識別相結(jié)合,整個文檔的漢字識別正確率卻只有80%左右[20](p370-382)。

    盡管對手寫漢字進行識別的技術已經(jīng)漸趨成熟,但這類手寫漢字的識別技術卻不能直接應用于手寫甲骨學文獻中的漢字字符識別。這主要是由以下兩方面原因造成的:一方面,作為文字研究類文獻,文獻中經(jīng)常出現(xiàn)上述數(shù)據(jù)集中沒有收錄到的生僻漢字,這些生僻字在手寫漢字數(shù)據(jù)集中沒有出現(xiàn)過,因此無法進行正確識別;另一方面,甲骨學文獻常用繁體字書寫,且文中經(jīng)常出現(xiàn)不屬于現(xiàn)代漢字的古文字、隸定字等,即使這些字體不是手寫字,但無論在數(shù)據(jù)上還是技術上對這些字體的相關研究均不夠充分,因此,手寫甲骨學文獻中的漢字字符的識別仍有很長的路要走。

    (三)拓片甲骨字識別

    除漢字字符外,甲骨學文獻中還收錄了大量的甲骨字字符,根據(jù)文獻中甲骨字所在的位置,可將其分為拓片甲骨字與手寫甲骨字。安陽師范學院甲骨文信息處理教育部重點實驗室以甲骨文識別為核心開展了一系列的研究開發(fā)工作,其中,拓片甲骨字的識別便是實驗室的研究重心之一。拓片甲骨字是在整理著錄中拓片圖的基礎上,對拓片上的每一個甲骨字進行分割整理,并將分割出來的甲骨字圖片作為訓練數(shù)據(jù)供計算機進行深度學習。根據(jù)目前的整理結(jié)果,數(shù)據(jù)集已整理出4927個甲骨字、474379張甲骨字圖片。但在整理過程中,由于許多甲骨字的出現(xiàn)次數(shù)過少,導致訓練數(shù)據(jù)出現(xiàn)了樣本不均衡現(xiàn)象,拓片甲骨字的整體識別準確率尚未達到讓人滿意的水平。為規(guī)避樣本不均衡問題,我們只對出現(xiàn)次數(shù)較多的306個甲骨字(共計309551張圖片)進行了識別訓練,目前達到的最高單字準確率為82.28%[21]。

    拓片甲骨字的識別是未來甲骨文大數(shù)據(jù)平臺提供智能化服務的重要一環(huán)。目前,平臺已經(jīng)初步實現(xiàn)了查詢包含特定甲骨字的所有甲骨片的功能。隨著拓片甲骨字識別技術的完善,該功能將兼容輸入拓片圖進行查詢的功能,平臺會自動對甲骨拓片上的甲骨字進行識別并利用識別結(jié)果進行檢索,用戶可以通過點擊自己上傳的拓片圖上的特定甲骨字進行直接檢索。

    (四)手寫甲骨字識別

    除拓片甲骨字外,甲骨學文獻中常見的甲骨字通常為手寫甲骨字,這是由于當前甲骨字還沒有統(tǒng)一的字符編碼,在甲骨學文獻的編輯過程中,難以利用輸入法直接輸入甲骨字并進行排版,因此大部分甲骨學文獻中的甲骨字通常為手寫甲骨字或甲骨字摹本的截圖。要從根本上解決手寫甲骨字的識別難題,需要整理并建立甲骨字字符編碼,以確保甲骨學文獻中的甲骨字書寫方式統(tǒng)一。目前,實驗室已經(jīng)開始著手甲骨字的整理,整理結(jié)果將以甲骨文字庫的方式上傳到甲骨文大數(shù)據(jù)平臺。在此基礎上,平臺還開發(fā)了與字庫相匹配的甲骨字輸入法以期實現(xiàn)甲骨字的直接輸入與智能檢索。

    對手寫甲骨字的識別而言,在已經(jīng)出版的甲骨學文獻中,不論是手寫甲骨字還是摹本甲骨字,甲骨文都不是書寫者的母語,其書寫方式本質(zhì)上都是通過臨摹方式完成的,手寫甲骨字的識別與其說是字符識別,不如說是圖畫(簡筆畫)識別。因此手寫甲骨字的識別更適合借鑒基于深度學習的圖像識別技術。而深度學習技術同樣需要建立手寫甲骨字的數(shù)據(jù)集,為此,實驗室還利用甲骨文字庫專門開發(fā)了手寫甲骨字搜集工具,截至目前,已搜集手寫甲骨字圖片83245張。利用目前收集的手寫甲骨字數(shù)據(jù),手寫甲骨字識別準確度達到97.8%,相關識別成果已經(jīng)應用于平臺上的手寫甲骨字輸入法的開發(fā)中。隨著手寫甲骨字識別技術的逐漸成熟,平臺未來也會推出基于甲骨字識別的智能化服務,用戶可以隨時隨地將手機拍到的甲骨字上傳至平臺進行識別并查詢相應的信息。此外,對手寫甲骨字識別的研究也將在計算機輔助的基礎上實現(xiàn)對甲骨字的筆記識別,對于甲骨字的分期研究起到一定的幫助。

    四、結(jié)語

    本文圍繞《殷契文淵》甲骨文大數(shù)據(jù)平臺“數(shù)據(jù)化”“數(shù)字化”“智能化”三個發(fā)展階段,重點介紹并展望了文獻數(shù)字化技術在甲骨學文獻中的應用與前景。在《殷契文淵》甲骨文大數(shù)據(jù)平臺的建設過程中,文獻數(shù)字化技術為計算機提供了可供檢索、關聯(lián)與分析的數(shù)字化素材,為實現(xiàn)甲骨學研究的便捷化、智能化奠定了基礎。盡管利用人工錄入也可以完成文獻數(shù)字化工作,但以機器學習為代表的人工智能技術輔助文獻整理工作,使得甲骨學文獻整理的工作效率得到了大幅提升,利用人工智能技術進行甲骨學文獻整理也成為未來的發(fā)展趨勢。此外,文獻數(shù)字化技術也可以為甲骨學研究者與甲骨文愛好者提供一系列智能化服務,如圖片手寫甲骨字識別、拓片字符關聯(lián)信息檢索等,不斷拓展甲骨學研究的廣度與深度。目前,《殷契文淵》開發(fā)團隊正積極開展甲骨學文獻整理相關應用軟件的研發(fā)工作,并針對深度學習所需要的大量數(shù)據(jù)進行了搜集與整理,組成了部分數(shù)據(jù)訓練集。相信隨著大量先進技術的應用,《殷契文淵》一定能成為甲骨學研究的綜合性平臺,為甲骨學研究持續(xù)取得突破性進展提供有力支撐與保障。

    猜你喜歡
    字符識別甲骨手寫
    手寫比敲鍵盤更有助于學習和記憶
    我手寫我心
    字溯甲骨?文承龍韻
    抓住身邊事吾手寫吾心
    說甲骨新綴所見的“南孟”與“奠子方”
    甲骨釋字四則
    基于集成學習的MINIST手寫數(shù)字識別
    電子制作(2018年18期)2018-11-14 01:48:08
    一種改進深度學習網(wǎng)絡結(jié)構的英文字符識別
    儀表字符識別中的圖像處理算法研究
    基于CUDA和深度置信網(wǎng)絡的手寫字符識別
    免费在线观看黄色视频的| 免费人妻精品一区二区三区视频| 久久久精品免费免费高清| 免费一级毛片在线播放高清视频 | 色精品久久人妻99蜜桃| 日本a在线网址| 久久性视频一级片| 桃花免费在线播放| 日韩免费高清中文字幕av| 成人国产一区最新在线观看| 国产在线视频一区二区| 久久午夜亚洲精品久久| 亚洲精品久久午夜乱码| 热re99久久精品国产66热6| 他把我摸到了高潮在线观看 | 亚洲欧美精品综合一区二区三区| 国产高清激情床上av| 一夜夜www| 国产区一区二久久| 亚洲av片天天在线观看| 97在线人人人人妻| 欧美激情高清一区二区三区| 大码成人一级视频| 国产精品国产高清国产av | 99国产综合亚洲精品| 国产欧美日韩综合在线一区二区| 精品国内亚洲2022精品成人 | 午夜免费成人在线视频| 国产有黄有色有爽视频| 两人在一起打扑克的视频| 少妇猛男粗大的猛烈进出视频| 妹子高潮喷水视频| 国产一区二区激情短视频| 制服诱惑二区| 黄色丝袜av网址大全| 国产精品1区2区在线观看. | 岛国毛片在线播放| 一区在线观看完整版| 最新美女视频免费是黄的| 在线十欧美十亚洲十日本专区| 美女国产高潮福利片在线看| 亚洲全国av大片| 99久久人妻综合| 丁香欧美五月| 国产91精品成人一区二区三区 | 天堂8中文在线网| 丁香六月欧美| 老司机在亚洲福利影院| 丝袜在线中文字幕| 免费少妇av软件| 在线观看免费视频网站a站| 日韩欧美一区视频在线观看| 高清视频免费观看一区二区| 亚洲中文av在线| 午夜福利在线免费观看网站| 欧美精品人与动牲交sv欧美| 欧美亚洲 丝袜 人妻 在线| 成人手机av| 99精品久久久久人妻精品| 日本wwww免费看| 精品欧美一区二区三区在线| 青青草视频在线视频观看| 国精品久久久久久国模美| 9191精品国产免费久久| 亚洲一区中文字幕在线| 他把我摸到了高潮在线观看 | 亚洲全国av大片| 国产三级黄色录像| 日本撒尿小便嘘嘘汇集6| 亚洲欧美一区二区三区久久| 欧美av亚洲av综合av国产av| cao死你这个sao货| 中文字幕最新亚洲高清| 婷婷成人精品国产| 国产一区二区激情短视频| 中文字幕人妻熟女乱码| 亚洲av片天天在线观看| 国产真人三级小视频在线观看| 久久人妻熟女aⅴ| 成人国产av品久久久| 亚洲精品美女久久av网站| 欧美成狂野欧美在线观看| 国产aⅴ精品一区二区三区波| 少妇 在线观看| 国产免费av片在线观看野外av| 亚洲精华国产精华精| 在线播放国产精品三级| 亚洲成人免费电影在线观看| 欧美激情极品国产一区二区三区| 69精品国产乱码久久久| 日日夜夜操网爽| 每晚都被弄得嗷嗷叫到高潮| 欧美激情极品国产一区二区三区| 日韩大片免费观看网站| 99九九在线精品视频| 中文字幕制服av| 欧美激情极品国产一区二区三区| 成人国语在线视频| 亚洲专区国产一区二区| 一本一本久久a久久精品综合妖精| 黄片大片在线免费观看| 国精品久久久久久国模美| 成人国产一区最新在线观看| 亚洲欧美一区二区三区黑人| 美女扒开内裤让男人捅视频| 手机成人av网站| 在线观看免费视频网站a站| 色精品久久人妻99蜜桃| 在线播放国产精品三级| 狠狠精品人妻久久久久久综合| 国产在线免费精品| 99久久精品国产亚洲精品| 欧美人与性动交α欧美软件| 国产不卡一卡二| 交换朋友夫妻互换小说| 国产亚洲午夜精品一区二区久久| 大片免费播放器 马上看| 国产精品熟女久久久久浪| 精品国产亚洲在线| 丁香六月天网| 欧美日本中文国产一区发布| 久久精品国产亚洲av高清一级| 久久性视频一级片| 午夜久久久在线观看| 一级毛片女人18水好多| 国产精品亚洲一级av第二区| 亚洲国产毛片av蜜桃av| 国产亚洲欧美在线一区二区| 电影成人av| 欧美日韩一级在线毛片| 精品第一国产精品| 色婷婷久久久亚洲欧美| 美女视频免费永久观看网站| 精品一品国产午夜福利视频| 欧美激情高清一区二区三区| 男人操女人黄网站| 高清在线国产一区| 亚洲专区中文字幕在线| a级毛片在线看网站| 色视频在线一区二区三区| 老熟女久久久| 男女边摸边吃奶| 人人澡人人妻人| 日韩欧美国产一区二区入口| 最近最新免费中文字幕在线| 精品一区二区三区av网在线观看 | 超色免费av| 国产99久久九九免费精品| 免费看a级黄色片| 亚洲精品中文字幕一二三四区 | 性高湖久久久久久久久免费观看| www.精华液| 亚洲精品中文字幕在线视频| 性色av乱码一区二区三区2| 国产成人啪精品午夜网站| 不卡一级毛片| 亚洲av电影在线进入| 2018国产大陆天天弄谢| 国产欧美日韩一区二区三区在线| 纵有疾风起免费观看全集完整版| 黄片播放在线免费| 色在线成人网| 一级,二级,三级黄色视频| 国产成人av激情在线播放| 在线观看免费视频日本深夜| 十八禁网站免费在线| 亚洲国产av新网站| 老熟妇乱子伦视频在线观看| 91成年电影在线观看| 婷婷丁香在线五月| 中文亚洲av片在线观看爽 | 亚洲伊人久久精品综合| 国产亚洲av高清不卡| 19禁男女啪啪无遮挡网站| 操美女的视频在线观看| 不卡一级毛片| 交换朋友夫妻互换小说| 亚洲午夜理论影院| 欧美激情 高清一区二区三区| 久久久精品国产亚洲av高清涩受| 亚洲专区字幕在线| 亚洲精品美女久久久久99蜜臀| 性少妇av在线| 日韩中文字幕欧美一区二区| 中文字幕人妻丝袜制服| 看免费av毛片| 他把我摸到了高潮在线观看 | avwww免费| 欧美精品一区二区免费开放| 色婷婷久久久亚洲欧美| 91成年电影在线观看| 亚洲欧洲日产国产| 飞空精品影院首页| 一级片免费观看大全| 久久青草综合色| 国产真人三级小视频在线观看| 免费人妻精品一区二区三区视频| 精品久久久精品久久久| 老汉色av国产亚洲站长工具| av一本久久久久| 日韩免费av在线播放| 亚洲国产精品一区二区三区在线| 中文字幕av电影在线播放| 丁香六月天网| 日韩有码中文字幕| 97人妻天天添夜夜摸| av有码第一页| 91大片在线观看| 老熟女久久久| 波多野结衣一区麻豆| www日本在线高清视频| 亚洲av美国av| 欧美另类亚洲清纯唯美| 国产野战对白在线观看| 免费观看a级毛片全部| 超碰成人久久| 成人免费观看视频高清| 色尼玛亚洲综合影院| 亚洲av成人不卡在线观看播放网| 国产精品偷伦视频观看了| 午夜91福利影院| 80岁老熟妇乱子伦牲交| aaaaa片日本免费| 侵犯人妻中文字幕一二三四区| 老司机影院毛片| 国产片内射在线| 国产精品亚洲一级av第二区| 一个人免费在线观看的高清视频| 黄片播放在线免费| 日韩欧美一区二区三区在线观看 | 高清av免费在线| 大型黄色视频在线免费观看| 如日韩欧美国产精品一区二区三区| 午夜福利影视在线免费观看| 成人亚洲精品一区在线观看| 看免费av毛片| 欧美激情 高清一区二区三区| 久久精品国产99精品国产亚洲性色 | 亚洲欧美激情在线| 亚洲一码二码三码区别大吗| 国产在视频线精品| 国产xxxxx性猛交| 69av精品久久久久久 | 一级a爱视频在线免费观看| av视频免费观看在线观看| 亚洲人成77777在线视频| 精品少妇黑人巨大在线播放| 69精品国产乱码久久久| 超碰成人久久| 在线观看人妻少妇| 亚洲美女黄片视频| 亚洲av第一区精品v没综合| 国产aⅴ精品一区二区三区波| 激情视频va一区二区三区| 国产亚洲欧美在线一区二区| 亚洲国产av影院在线观看| av电影中文网址| 久久国产精品男人的天堂亚洲| 狠狠狠狠99中文字幕| av片东京热男人的天堂| 日本av手机在线免费观看| 97人妻天天添夜夜摸| 欧美av亚洲av综合av国产av| 日韩视频一区二区在线观看| 波多野结衣一区麻豆| 国产在线精品亚洲第一网站| 国产精品一区二区精品视频观看| 国产野战对白在线观看| 国产亚洲欧美在线一区二区| 高清毛片免费观看视频网站 | 自拍欧美九色日韩亚洲蝌蚪91| 国产精品一区二区免费欧美| 免费日韩欧美在线观看| 日韩制服丝袜自拍偷拍| 亚洲第一青青草原| 国产免费福利视频在线观看| 女警被强在线播放| 制服人妻中文乱码| 老司机深夜福利视频在线观看| 久久久久久久大尺度免费视频| 成年动漫av网址| 99精国产麻豆久久婷婷| 男人操女人黄网站| 国产精品一区二区在线不卡| 欧美性长视频在线观看| 人人妻,人人澡人人爽秒播| 欧美黑人欧美精品刺激| 精品福利永久在线观看| 桃花免费在线播放| 在线观看免费高清a一片| 午夜两性在线视频| 人妻 亚洲 视频| 狠狠婷婷综合久久久久久88av| 最黄视频免费看| 欧美久久黑人一区二区| 亚洲五月色婷婷综合| 搡老岳熟女国产| 久久人妻福利社区极品人妻图片| 美女主播在线视频| 色视频在线一区二区三区| 麻豆成人av在线观看| 成年动漫av网址| 大陆偷拍与自拍| 欧美日韩一级在线毛片| 天堂8中文在线网| 一边摸一边做爽爽视频免费| 巨乳人妻的诱惑在线观看| 亚洲性夜色夜夜综合| 久久这里只有精品19| 中文字幕av电影在线播放| 妹子高潮喷水视频| 免费在线观看完整版高清| 日韩人妻精品一区2区三区| 成人三级做爰电影| 热99国产精品久久久久久7| 国产精品影院久久| 国产三级黄色录像| 欧美人与性动交α欧美精品济南到| 久久人妻av系列| 亚洲精品一卡2卡三卡4卡5卡| 国产精品久久久av美女十八| 日韩欧美免费精品| 成人国语在线视频| 欧美成人午夜精品| 男女之事视频高清在线观看| 黑人欧美特级aaaaaa片| 中文字幕制服av| 啪啪无遮挡十八禁网站| 免费一级毛片在线播放高清视频 | 一区福利在线观看| 母亲3免费完整高清在线观看| 夫妻午夜视频| a级毛片黄视频| 亚洲av成人不卡在线观看播放网| 国产精品一区二区在线观看99| 三级毛片av免费| 少妇猛男粗大的猛烈进出视频| 乱人伦中国视频| 精品免费久久久久久久清纯 | 久久久国产成人免费| 天天躁日日躁夜夜躁夜夜| 在线观看人妻少妇| 一区二区三区精品91| 精品少妇久久久久久888优播| 天天躁夜夜躁狠狠躁躁| 免费在线观看视频国产中文字幕亚洲| 久久亚洲精品不卡| 亚洲色图 男人天堂 中文字幕| 免费在线观看视频国产中文字幕亚洲| 日韩 欧美 亚洲 中文字幕| 香蕉国产在线看| 国产精品一区二区在线不卡| 国产精品亚洲一级av第二区| 日本黄色日本黄色录像| tocl精华| 一级毛片精品| 精品亚洲乱码少妇综合久久| 国产精品成人在线| 啦啦啦视频在线资源免费观看| 韩国精品一区二区三区| 18禁美女被吸乳视频| av天堂久久9| 久久久久久久大尺度免费视频| 性色av乱码一区二区三区2| 国产aⅴ精品一区二区三区波| 大型黄色视频在线免费观看| 国产成人精品无人区| 人人妻人人添人人爽欧美一区卜| 精品亚洲成a人片在线观看| 久久久久国内视频| 男男h啪啪无遮挡| 久久亚洲精品不卡| 日韩有码中文字幕| 9热在线视频观看99| 成年人免费黄色播放视频| 色综合欧美亚洲国产小说| 999精品在线视频| 中文字幕人妻丝袜制服| 国产日韩一区二区三区精品不卡| 国产野战对白在线观看| 一区在线观看完整版| 亚洲色图av天堂| 90打野战视频偷拍视频| 久久久久视频综合| 亚洲精品国产色婷婷电影| 高潮久久久久久久久久久不卡| 国产真人三级小视频在线观看| 亚洲天堂av无毛| 伦理电影免费视频| 大型黄色视频在线免费观看| 男女边摸边吃奶| 亚洲欧美一区二区三区久久| 久久久国产精品麻豆| 亚洲欧美日韩高清在线视频 | 国产黄频视频在线观看| 欧美激情久久久久久爽电影 | 婷婷成人精品国产| 亚洲一码二码三码区别大吗| 午夜日韩欧美国产| 日韩三级视频一区二区三区| 久久热在线av| 另类亚洲欧美激情| 国产单亲对白刺激| 悠悠久久av| 欧美精品一区二区免费开放| av免费在线观看网站| 亚洲av欧美aⅴ国产| 成人永久免费在线观看视频 | 国产男女超爽视频在线观看| 搡老乐熟女国产| videos熟女内射| 国产麻豆69| 成人av一区二区三区在线看| 狠狠狠狠99中文字幕| 亚洲综合色网址| 嫩草影视91久久| 精品国产一区二区久久| 纯流量卡能插随身wifi吗| 高清黄色对白视频在线免费看| 无限看片的www在线观看| 99国产综合亚洲精品| 女人爽到高潮嗷嗷叫在线视频| 俄罗斯特黄特色一大片| 9191精品国产免费久久| 国产午夜精品久久久久久| 亚洲精品乱久久久久久| 国产精品影院久久| 午夜精品久久久久久毛片777| 另类精品久久| 18禁美女被吸乳视频| 国产成+人综合+亚洲专区| 亚洲九九香蕉| 女人爽到高潮嗷嗷叫在线视频| 美女高潮喷水抽搐中文字幕| 成人影院久久| 人妻 亚洲 视频| av一本久久久久| 一区二区日韩欧美中文字幕| 成人三级做爰电影| 日本五十路高清| 午夜老司机福利片| 久久久久久人人人人人| 久久久国产成人免费| 纯流量卡能插随身wifi吗| 精品国产乱码久久久久久小说| 12—13女人毛片做爰片一| 国产欧美日韩一区二区精品| 女人爽到高潮嗷嗷叫在线视频| 久久精品国产亚洲av香蕉五月 | 黄色成人免费大全| 精品一区二区三区视频在线观看免费 | 菩萨蛮人人尽说江南好唐韦庄| 日韩中文字幕欧美一区二区| 免费观看人在逋| 黑人欧美特级aaaaaa片| 在线观看人妻少妇| 菩萨蛮人人尽说江南好唐韦庄| 久久久久久久国产电影| 欧美成狂野欧美在线观看| 两性午夜刺激爽爽歪歪视频在线观看 | 久久精品成人免费网站| 精品国内亚洲2022精品成人 | 久久久久久久国产电影| 99热国产这里只有精品6| 一区二区三区激情视频| 一区二区三区精品91| 亚洲精品国产区一区二| 成人手机av| 国产精品久久久久久精品电影小说| 90打野战视频偷拍视频| 免费一级毛片在线播放高清视频 | 两性夫妻黄色片| 亚洲欧美日韩另类电影网站| 国产成人影院久久av| 亚洲专区国产一区二区| 欧美激情高清一区二区三区| 日日夜夜操网爽| 国产不卡av网站在线观看| 欧美国产精品一级二级三级| 天天躁狠狠躁夜夜躁狠狠躁| 日本撒尿小便嘘嘘汇集6| 悠悠久久av| 在线观看免费午夜福利视频| 999久久久国产精品视频| 国产一区二区在线观看av| 免费看a级黄色片| 国产97色在线日韩免费| 亚洲伊人色综图| 久久久精品国产亚洲av高清涩受| 国产一区二区三区视频了| 久久人妻熟女aⅴ| 亚洲自偷自拍图片 自拍| 91av网站免费观看| 又黄又粗又硬又大视频| 十八禁网站网址无遮挡| 久久99热这里只频精品6学生| 亚洲成人国产一区在线观看| 日本av手机在线免费观看| 国产欧美亚洲国产| 黄色丝袜av网址大全| 日韩欧美三级三区| 色尼玛亚洲综合影院| videos熟女内射| 熟女少妇亚洲综合色aaa.| 久久毛片免费看一区二区三区| av一本久久久久| 他把我摸到了高潮在线观看 | 一二三四社区在线视频社区8| 一级毛片精品| 天天添夜夜摸| 热99国产精品久久久久久7| 欧美精品一区二区大全| 亚洲三区欧美一区| 午夜精品久久久久久毛片777| av线在线观看网站| 国产成人欧美在线观看 | kizo精华| av一本久久久久| 亚洲精品久久成人aⅴ小说| 亚洲avbb在线观看| 热99久久久久精品小说推荐| 免费久久久久久久精品成人欧美视频| 久久天堂一区二区三区四区| 亚洲欧美日韩高清在线视频 | 欧美大码av| 日本黄色日本黄色录像| 精品少妇内射三级| 亚洲九九香蕉| 成年人午夜在线观看视频| 99国产精品一区二区蜜桃av | 人妻久久中文字幕网| 在线观看免费视频网站a站| 精品欧美一区二区三区在线| 亚洲精品久久成人aⅴ小说| 国产一区二区 视频在线| 日韩欧美三级三区| 我的亚洲天堂| 久久久国产精品麻豆| 在线观看舔阴道视频| 99国产精品一区二区蜜桃av | 精品人妻1区二区| 亚洲精品乱久久久久久| 国产男靠女视频免费网站| 一本色道久久久久久精品综合| 巨乳人妻的诱惑在线观看| 亚洲精品国产色婷婷电影| 久久久久精品人妻al黑| 国精品久久久久久国模美| 老汉色av国产亚洲站长工具| 精品少妇内射三级| 狠狠狠狠99中文字幕| 亚洲中文字幕日韩| 黄频高清免费视频| 精品少妇一区二区三区视频日本电影| 成年人黄色毛片网站| 亚洲精品国产区一区二| 亚洲人成伊人成综合网2020| 天天躁狠狠躁夜夜躁狠狠躁| 色综合欧美亚洲国产小说| 蜜桃在线观看..| 精品第一国产精品| 色94色欧美一区二区| 久久精品国产综合久久久| 老鸭窝网址在线观看| 动漫黄色视频在线观看| 日韩有码中文字幕| 国产精品麻豆人妻色哟哟久久| 午夜成年电影在线免费观看| 国产不卡av网站在线观看| 在线播放国产精品三级| 午夜福利乱码中文字幕| 最新美女视频免费是黄的| 国产亚洲欧美在线一区二区| 精品卡一卡二卡四卡免费| 久久精品国产亚洲av高清一级| 精品国产亚洲在线| av福利片在线| tube8黄色片| 丰满人妻熟妇乱又伦精品不卡| 亚洲成av片中文字幕在线观看| 中文字幕av电影在线播放| 俄罗斯特黄特色一大片| 亚洲va日本ⅴa欧美va伊人久久| 电影成人av| 亚洲中文字幕日韩| 丝袜人妻中文字幕| 国产欧美日韩一区二区三区在线| 老司机午夜十八禁免费视频| 久久狼人影院| 91老司机精品| 国产三级黄色录像| 99国产精品一区二区三区| 一级,二级,三级黄色视频| 国产欧美日韩一区二区三区在线| 亚洲综合色网址| 国产在线视频一区二区| 久久精品亚洲熟妇少妇任你| 香蕉国产在线看| 精品亚洲成a人片在线观看| 美女扒开内裤让男人捅视频| 国产精品免费一区二区三区在线 | 久久人妻av系列| 十八禁网站网址无遮挡| 欧美日韩国产mv在线观看视频| 亚洲七黄色美女视频| 欧美激情久久久久久爽电影 | av一本久久久久| 国产精品九九99| 91九色精品人成在线观看| av网站免费在线观看视频| 亚洲精品中文字幕在线视频| 国产成人免费观看mmmm| 午夜福利一区二区在线看| 人人澡人人妻人| 俄罗斯特黄特色一大片|