• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      游戲校對方式在古籍?dāng)?shù)字化中的應(yīng)用

      2015-08-24 07:19:50廣州圖書館廣東廣州510623
      圖書館建設(shè) 2015年11期
      關(guān)鍵詞:國家圖書館芬蘭古籍

      陳 雅 (廣州圖書館 廣東 廣州 510623)

      游戲校對方式在古籍?dāng)?shù)字化中的應(yīng)用

      陳雅(廣州圖書館 廣東 廣州 510623)

      芬蘭國家圖書館與Microtask公司合作推出了古籍?dāng)?shù)字化校對在線游戲,該游戲使廣大群眾參與到古籍?dāng)?shù)字化校對工作中,不僅高效完成了古籍?dāng)?shù)字化工作,還提高了芬蘭國家圖書館的知名度。因此,圖書館應(yīng)巧妙地將眾包方式應(yīng)用到圖書館業(yè)務(wù)建設(shè)中,以提高工作效率。

      古籍?dāng)?shù)字化校對在線游戲眾包

      古籍?dāng)?shù)字化有利于古籍的利用、傳播及保護(hù)。數(shù)字化古籍資源首先須將文本字符數(shù)字化,即將漢字以編碼的形式而不是以圖形的形式存儲于計算機中。古籍?dāng)?shù)字化是一項浩大的工程,需要投入大量的人力、物力、財力,其間若采用傳統(tǒng)人工校對方式,進(jìn)度將非常緩慢[1]。

      芬蘭國家圖書館與Microtask公司合作推出的古籍?dāng)?shù)字化校對在線游戲極大地提高了校對效率,僅用22個月便完成了8 000 000字詞(件)的古籍?dāng)?shù)字化任務(wù),成績斐然。本文將詳細(xì)介紹此款在線游戲的設(shè)計機制及原理,以期給我國古籍?dāng)?shù)字化校對工作提供新方法,提高我國古籍?dāng)?shù)字化校對工作效率。

      1 眾包及其具體應(yīng)用

      眾包不是外包,外包是把任務(wù)中的一部分包給固定機構(gòu),并給予一定報酬,令其在固定時間內(nèi)完成任務(wù)。而眾包則沒有固定機構(gòu)負(fù)責(zé),是將任務(wù)碎片化,使原來復(fù)雜的任務(wù)分解為若干部分,任務(wù)中相對機械化的、專業(yè)程度不高的部分將會通過某一種方式被分散出去,由非專業(yè)人士完成,并將結(jié)果反饋至中心機構(gòu),由中心機構(gòu)集中專業(yè)人員處理初步結(jié)果。眾包使有限的專業(yè)人員得以從專業(yè)度不高的工作中解脫出來,更好地從事專業(yè)度高的工作[2]。

      眾包方式是一種高效率的處理任務(wù)方式,利用眾包方式較好完成任務(wù)的案例有:《喬布斯傳》的翻譯工作,美國紐約公共圖書館菜單數(shù)據(jù)庫眾包應(yīng)用,Linux系統(tǒng)及維基百科等。

      2 眾包方式應(yīng)用于古籍?dāng)?shù)字化的處理

      圖書館有大量掃描好的古籍圖片文件需要轉(zhuǎn)換為字符輸入系統(tǒng)。雖然已有OCR(Optical Character Recognition,光學(xué)字符識別)系統(tǒng)程序可以應(yīng)用于該工作,但其不夠精準(zhǔn),還是需要人工來判讀,甚至由好幾位工作人員來共同判讀才能確保其成果準(zhǔn)確。將眾包方式應(yīng)用于古籍?dāng)?shù)字化的處理,就是把古籍?dāng)?shù)字化中需要逐字校對的工作分解為一個個極小的任務(wù),并通過某種方式(如在線游戲等)擴散,由廣大群眾(玩家)進(jìn)行古籍文字圖片與字符的校對工作,然后把零散的數(shù)據(jù)重新組裝,進(jìn)而完成古籍的數(shù)字化。

      2.1將任務(wù)碎片化,轉(zhuǎn)化為微任務(wù)。

      數(shù)字化的第一步為將校對任務(wù)碎片化:掃描古籍使其轉(zhuǎn)變?yōu)閳D片形式,通過OCR系統(tǒng)程序?qū)⑵渥詣忧懈顬槿舾蓤D片塊,每個圖片塊按照編排順序被賦予唯一的編號。

      2.2設(shè)計有趣味的游戲,校對圖片與字符。

      由于將圖片轉(zhuǎn)換成字符格式的任務(wù)是離散、標(biāo)準(zhǔn)化的,因此玩家無需接受培訓(xùn)即可上崗,甚至不用知道任務(wù)的來龍去脈也可以完成。玩家只要安坐在計算機前玩游戲,完成不同的任務(wù)即可升級。

      2.3古籍?dāng)?shù)字化校對的完成

      當(dāng)玩家通過在線游戲?qū)D片與文字進(jìn)行校對后,游戲系統(tǒng)會把結(jié)果反饋到中心數(shù)據(jù)庫,中心數(shù)據(jù)庫按照圖片的編號,自動把校對后的文字放回原本位置,完成該圖片的初步數(shù)字化過程。所有圖片皆被初步數(shù)字化后,專業(yè)館員對其進(jìn)行最后審核。審核無誤后,古籍?dāng)?shù)字化工作完成。

      芬蘭國家圖書館經(jīng)過以上3個步驟完成了古籍?dāng)?shù)字化,如圖1~3所示[3]。

      3 古籍?dāng)?shù)字化在線游戲介紹

      3.1在線游戲的設(shè)計

      在線校對游戲是一種絕妙的方式:圖片與文字的校對工作相對枯燥,若由專業(yè)人士長時間地一味校對,容易疲勞且效率低。而通過游戲,玩家可以用輕松的心情,在業(yè)余時間進(jìn)行校對。要想吸引玩家對這種在線游戲產(chǎn)生興趣,一定要把游戲設(shè)計得有趣。游戲設(shè)計涉及4個方面:

      (1)游戲美工設(shè)計的美觀性:游戲的主角需可愛,場景畫面需讓人愉悅。

      (2)游戲過程的趣味性:讓玩家有持續(xù)興趣一直玩下去,正如Microtask公司首席執(zhí)行官Wili Miettinen所言:“游戲設(shè)計師是激勵人們,讓他們做重復(fù)性工作的專家。”[4]

      (3)游戲關(guān)卡難度的合理性:要使玩家有成就感,難度太大,玩家會放棄游戲;難度太小,玩家將喪失玩游戲的興趣;難度適中才能使玩家產(chǎn)生成就感。

      (4)游戲的便利性:方便玩家隨時隨地玩游戲。

      芬蘭國家圖書館古籍?dāng)?shù)字化在線游戲的主角為群眾喜愛的鼴鼠的卡通形象。該古籍?dāng)?shù)字化在線游戲過程很有趣,游戲關(guān)卡難度適中,并且可在電腦及手機上進(jìn)行游戲。

      芬蘭國家圖書館的古籍?dāng)?shù)字化在線游戲分為兩個階段。第一階段的游戲是: 追捕鼴鼠Mole Hunt();游戲提供兩個詞,要求玩家必須盡快確定這兩個詞是否相同。這個游戲有助于發(fā)現(xiàn)錯誤的條目和驗證正確單詞的翻譯(見下頁圖4)。

      若第一階段驗證為錯誤的條目,這些錯誤的條目將在第二階段的游戲中得以校正。第二階段的游戲是:鼴鼠搭橋Mole Bridge(),游戲要求玩家必須正確拼寫出現(xiàn)在屏幕上的詞語。若答案正確,則幫助鼴鼠在河上建一座橋,使其順利到達(dá)對岸(見下頁圖5)。

      3.2質(zhì)量控制

      第一階段游戲中,古籍圖片塊需隨機派發(fā)給不同的用戶若干次,只有反饋結(jié)果一致率超過一定百分比(設(shè)為70%,可根據(jù)反饋結(jié)果調(diào)整),才能確定該詞可以進(jìn)行初步數(shù)字化。若某詞的反饋結(jié)果不能達(dá)到70%的一致率,則把該詞歸入第二階段游戲,由玩家手工輸入圖片字符。該圖片將在第二階段游戲中再度派發(fā)給不同用戶若干次,若玩家反饋的結(jié)果達(dá)到70%的一致率,則該詞實現(xiàn)了初步數(shù)字化。

      圖1 芬蘭國家圖書館藏報紙的掃描圖片

      圖2 由OCR視覺文字辨識系統(tǒng)程序校對結(jié)果

      圖3 通過游戲校對及專業(yè)館員審核后的成品

      圖4 追捕鼴鼠

      圖5  鼴鼠搭橋

      通過以上兩個階段游戲后,則進(jìn)入第三階段,由專業(yè)館員對反饋結(jié)果進(jìn)行綜合審核,以確保最終結(jié)果的準(zhǔn)確性。

      此外,玩家的身份具有一定的條件限制,即玩家須具有大學(xué)文化程度。因為校對人員反饋的數(shù)據(jù)質(zhì)量決定了古籍?dāng)?shù)字化的質(zhì)量,如果玩家文化知識不足,或?qū)τ螒驔]有一定的責(zé)任感,反饋的結(jié)果錯誤率高,將直接影響數(shù)據(jù)庫質(zhì)量,因此必須對玩家進(jìn)行篩選。

      3.3芬蘭國家圖書館的古籍校對在線游戲推廣策略

      推廣策略主要有:①參與游戲的玩家必須進(jìn)行身份認(rèn)證及注冊。游戲設(shè)計者可以根據(jù)玩家的游戲成績,設(shè)立玩家排行榜,對成績好的玩家給予一定的獎勵。②在線游戲分為電腦版及手機版,方便玩家隨時玩游戲。③在線游戲?qū)θ虬l(fā)布,即使在海外的玩家,也可以玩游戲進(jìn)行古籍校對。④在圖書館官網(wǎng)及相關(guān)媒體進(jìn)行宣傳推廣。

      4 芬蘭國家圖書館利用在線游戲進(jìn)行古籍校對的成效分析

      4.1高效完成古籍?dāng)?shù)字化校對工作

      芬蘭國家圖書館應(yīng)用的古籍校對游戲于2011年2月8日向公眾推廣,于2012年11月29日結(jié)束。這期間,近110 000名參與者在22個月內(nèi)完成了8 000 000字詞(件)的古籍?dāng)?shù)字化校對任務(wù)。

      4.2使廣大群眾參與到保護(hù)文化遺產(chǎn)工作中

      在線游戲的校對方式讓群眾(玩家)參與到了古籍?dāng)?shù)字化工作中。這種寓游戲于工作的模式與以往的一些眾包工作最不相同之處在于,玩家并沒有選擇他們要做哪一件事情的權(quán)利,任務(wù)由系統(tǒng)隨機指派。盡管如此,玩家還是樂此不疲,在玩游戲的過程中完成了一個又一個的項目。

      4.3提高知名度

      芬蘭國家圖書館使公眾知道有這樣一種新穎的工作方式,不僅宣傳了圖書館的獨特館藏資源,同時也宣傳了館藏資源的易用性和可用性:芬蘭國家圖書館的文化遺產(chǎn)資料以數(shù)字化的形式存在,可在虛擬環(huán)境中使用。

      5 對圖書館業(yè)務(wù)建設(shè)的啟示

      芬蘭國家圖書館與Microtask公司合作推出的古籍校對游戲案例說明,眾包方式也能應(yīng)用于圖書館的其他數(shù)據(jù)處理業(yè)務(wù)中,如糾正數(shù)據(jù)庫、篩選不良圖像、將音頻轉(zhuǎn)錄為文字等。在數(shù)字化、網(wǎng)絡(luò)化時代,巧妙地將新事物、新方式應(yīng)用到圖書館業(yè)務(wù)建設(shè),能大大提高工作效率。

      [1]顧磊, 趙陽. 古籍全文文本化中存在的若干問題[J]. 圖書館學(xué)研究, 2013(20):31-35.

      [2]李書寧, 曾姍. 國外圖書館數(shù)字館藏眾包建設(shè)實踐調(diào)查與分析[J]. 圖書情報工作, 2014(12):83-90.

      [3]Digitalkoot. Digitalkoot[EB/OL].[2015-02-15].http:// www.digitalkoot.fi.

      [4]劉艷艷. 芬蘭“跨游戲”工作平臺Microtask:讓流水線打工“有趣”[EB/OL]. (2011-08-01)[2015-02-15].http://tech.sina.com. cn/i/2011-08-01/07465862616.shtml.

      陳 雅 現(xiàn)工作于廣州圖書館采編中心,館員。

      Application of On-Line Games as an Proofread Way in Ancient Books Digitization

      An on-line game of proofread ancient book digitization was a joint project run by the National Library of Finland and Microtask. The project enabled volunteers to participate in the proofread work by playing games. This project not only digitize documents efficiently, but also make the National Library of Finland more famous. The library also applies crowd-sourcing into the library work to improve working efficiency.

      Ancient book digitization; Proofread ; On-line game; Crowd-sourcing

      G255.1

      B

      2015-07-10 ]

      猜你喜歡
      國家圖書館芬蘭古籍
      國家圖書館出版社重點圖書
      中醫(yī)古籍“疒”部俗字考辨舉隅
      國家圖書館藏四種古籍編目志疑
      天一閣文叢(2020年0期)2020-11-05 08:28:36
      關(guān)于版本學(xué)的問答——《古籍善本》修訂重版說明
      天一閣文叢(2020年0期)2020-11-05 08:28:06
      關(guān)于古籍保護(hù)人才培養(yǎng)的若干思考
      天一閣文叢(2018年0期)2018-11-29 07:48:08
      芬蘭學(xué)校能治愈“厭學(xué)癥”
      好日子(2018年9期)2018-10-12 09:57:26
      中國國家圖書館藏西夏文《不空羂索神變真言經(jīng)》考論
      西夏學(xué)(2018年2期)2018-05-15 11:26:38
      在芬蘭坐火車
      華人時刊(2018年23期)2018-03-21 06:26:10
      我是古籍修復(fù)師
      金橋(2017年5期)2017-07-05 08:14:41
      Herrmans對芬蘭工廠進(jìn)行擴建
      中國自行車(2017年5期)2017-06-24 10:45:35
      白银市| 张家界市| 新兴县| 兰溪市| 上饶市| 基隆市| 偃师市| 墨竹工卡县| 康定县| 邯郸县| 尚志市| 钟祥市| 库尔勒市| 清丰县| 乐山市| 卓尼县| 九台市| 抚州市| 耒阳市| 沅江市| 华蓥市| 三原县| 澎湖县| 徐水县| 万全县| 武邑县| 敖汉旗| 孟村| 靖远县| 涡阳县| 集贤县| 乾安县| 塘沽区| 航空| 江川县| 梧州市| 昌宁县| 德昌县| 赣州市| 搜索| 大关县|