• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)字保存的認知與實踐

      2012-04-29 04:10:13臧國全郭營
      圖書與情報 2012年1期

      臧國全 郭營

      摘 要:數(shù)字保存的認知是對數(shù)字保存基本問題的看法,對地觀測數(shù)據(jù)保存的認知調(diào)查包括保存的重要性、保存原因、保存用途和保存威脅。數(shù)字保存的實踐是對數(shù)字保存領(lǐng)域中相關(guān)問題的目前解決方法,對地觀測數(shù)據(jù)的實踐調(diào)查包括保存數(shù)據(jù)的內(nèi)容、采用的元數(shù)據(jù)標準和保存數(shù)據(jù)的使用?;谡J知調(diào)查,提出了加強數(shù)字保存經(jīng)濟可持續(xù)性研究的思想?;趯嵺`調(diào)查,提出了制定數(shù)字保存質(zhì)量保證標準與設(shè)計質(zhì)量認證模型的思路。

      關(guān)鍵詞:數(shù)字保存 認知調(diào)查 實踐調(diào)查 對地觀測

      中圖分類號: G250.76文獻標識碼: A 文章編號: 1003-6938(2012)01-0062-05

      Perception and Practice on Digital Preservation: Based on Survey for Data Preservation in Earth Observation

      Abstract The perception on digital preservation consists of some ideas to basic problems in the field of digital preservation. The perception survey on Earth Observation data preservation includes preservation importance, reasons, usages and threats. Practices on digital preservation are the current resolving methods for the related issues in the field of digital preservation, including preserved data content, metadata standards, data access and its usage. Based on the perceptionsurvey, the author proposes an idea on digital preservation economic sustainability and based on the practice survey the author puts forward to study on setting up preservation quality standard and designing quality certification models.

      Keywords digital preservation; perception survey; practice survey; earth observation

      目前的數(shù)字保存對象主要有兩類:學(xué)術(shù)論著和研究型數(shù)據(jù)。前者比較普遍,其保存理論和實踐相對成熟;后者集中在數(shù)據(jù)密集型領(lǐng)域,保存理論和實踐相對滯后。對地觀測產(chǎn)生大量的觀測數(shù)據(jù)(一種重要類型的研究型數(shù)據(jù)),該類數(shù)據(jù)在地球科學(xué)的研究中扮演重要角色。

      據(jù)普查,目前為止對地觀測數(shù)據(jù)的保存與使用調(diào)查案例非常少見,僅發(fā)現(xiàn)的一個案例是歐盟科學(xué)研究院第七框架項目組的PARSE.insight項目 (2010年)[1],該項目的調(diào)查對象來源有二:一是對地觀測數(shù)據(jù)保存的實施人員(下稱保存者,共計105人給予了完全回答,一些保存者同時也是研究人員),選自于全球各地太空項目(一些大型項目擁有多個對地觀測數(shù)據(jù)的保存系統(tǒng)),如歐洲太空總署ESA[2]、美國NASA[3]、中國航天集團等,這類項目是對地觀測數(shù)據(jù)的主要收集者和保存者;二是該類數(shù)據(jù)的使用者(共計600人給予了完全回答),選自地球科學(xué)、大氣科學(xué)和海洋科學(xué)的研究人員,這三個領(lǐng)域的科研人員是對地觀測數(shù)據(jù)的集中使用者。筆者基于該項調(diào)查,總結(jié)對地觀測數(shù)據(jù)的保存者和使用者對數(shù)字保存的認知與實踐,分析數(shù)字保存存在的問題,尋求可能的解決方案。

      1 數(shù)字保存的認知

      認知就是看法,對地觀測數(shù)據(jù)的保存認知是指保存者和使用者對這類數(shù)字資源保存基本問題的看法,包括:保存的重要性、保存原因、保存用途和保存威脅。

      1.1 保存的重要性

      總體上,被調(diào)查者中71.8%的認為長期保存對地觀測數(shù)據(jù)非常重要,22.4%的認為重要,4.6%的認為比較重要,只有1.2%的認為不重要。

      可能因為對地觀測數(shù)據(jù)的幾乎不可重復(fù)性(難以出現(xiàn)或創(chuàng)建完全相同的觀測環(huán)境),被調(diào)查者對一些領(lǐng)域中觀測數(shù)據(jù)的長期保存重要性認知度相當高(90%以上認為非常重要),這些領(lǐng)域有海洋水質(zhì)監(jiān)測、海洋生物變遷、海洋水文地理、地面沉降、地震和火山爆發(fā)等(其他領(lǐng)域的調(diào)查結(jié)果見表1)。整體上,與保存者相比,使用者對保存的重要性認知度更高一點,可能的解釋是這些學(xué)科都是數(shù)據(jù)密集型學(xué)科,科學(xué)研究活動高度依賴于對地觀測數(shù)據(jù)。

      1.2 保存原因

      保存原因有很多,但得到比較廣泛認可的有四個(見表2)??傮w上,與數(shù)據(jù)使用者相比,數(shù)據(jù)保存者對保存原因的認知度要略低一點,也許是因為數(shù)據(jù)保存者對對地觀測數(shù)據(jù)保存的困難體會較深,對保存原因的認知更趨理智。

      1.3 保存用途

      對地觀測數(shù)據(jù)主要來自于通過圍繞地球運行的人造衛(wèi)星收集到的有關(guān)地球物理、化學(xué)和生物系統(tǒng)的信息,這類信息是地球科學(xué)研究的基礎(chǔ),廣泛應(yīng)用于自然環(huán)境和人造環(huán)境的監(jiān)控和預(yù)測。

      1.4 保存威脅

      調(diào)查顯示,數(shù)據(jù)保存的最主要威脅來自保存系統(tǒng)缺乏可持續(xù)性、軟硬件和數(shù)據(jù)格式過時導(dǎo)致數(shù)據(jù)無法訪問以及描述型元數(shù)據(jù)丟失導(dǎo)致數(shù)據(jù)對象無法發(fā)現(xiàn)(見表4)。整體上,數(shù)據(jù)保存者對保存威脅的認知度略高,說明了保存者對數(shù)據(jù)保存過程的困難與缺憾深有感悟。

      注:原因1:對地觀測多由公共資金支持實施,觀測數(shù)據(jù)為公共財產(chǎn),理應(yīng)合理保存,為未來科學(xué)研究之用;

      原因2:對地球狀態(tài)(包括地球環(huán)境和演變過程)的分析需要長期的盡可能全面的觀測數(shù)據(jù);

      原因3:時間無法逆轉(zhuǎn),環(huán)境無法復(fù)制,對地觀測無法重復(fù)取樣,因此需要完整地保存這類數(shù)據(jù);

      原因4:對地觀測數(shù)據(jù)的價值難以估量,未來的潛在應(yīng)用難以預(yù)測。

      注:用途1:地球災(zāi)害觀測(如水災(zāi)、地震、颶風(fēng)、火山爆發(fā));

      用途2:氣候變化監(jiān)控;

      用途3:生態(tài)追蹤(如海洋、碳化循環(huán));

      用途4:天氣預(yù)測;

      用途5:土地使用測量與統(tǒng)計(如深林濫伐、城市膨脹) 。

      2 數(shù)字保存的實踐

      對地觀測數(shù)據(jù)的保存實踐是指目前對該類數(shù)據(jù)保存中相關(guān)問題的解決方法,包括:保存數(shù)據(jù)的內(nèi)容、采用的元數(shù)據(jù)標準和保存數(shù)據(jù)的使用。其中前兩個問題的調(diào)查對象是數(shù)據(jù)保存者,最后一個問題的調(diào)查對象是數(shù)據(jù)使用者。

      2.1 保存內(nèi)容

      基于對地觀測數(shù)據(jù)保存者調(diào)查的結(jié)果顯示,不同的對地觀測數(shù)據(jù)保存系統(tǒng)所保存的數(shù)據(jù)內(nèi)容分布比較集中(見表5),表明保存系統(tǒng)在此項實踐上比較一致。

      注:威脅1:數(shù)據(jù)保存系統(tǒng)缺乏可持續(xù)性;

      威脅2:軟硬件過時導(dǎo)致保存數(shù)據(jù)無法訪問。

      威脅3:數(shù)據(jù)文件格式過時導(dǎo)致用戶無法理解和使用。

      威脅4:描述型元數(shù)據(jù)丟失導(dǎo)致數(shù)據(jù)對象無法檢索利用。

      威脅5:數(shù)據(jù)保存系統(tǒng)的可信任性遭到質(zhì)疑。

      威脅6:數(shù)據(jù)訪問與使用的限制無法保證導(dǎo)致知識產(chǎn)權(quán)受到侵犯。

      威脅7:數(shù)據(jù)來源信息改變或丟失導(dǎo)致數(shù)據(jù)的真實性無從考究。

      2.2 元數(shù)據(jù)標準

      用戶對對地觀測數(shù)據(jù)的訪問是通過元數(shù)據(jù)實現(xiàn)的,不同的對地觀測數(shù)據(jù)保存系統(tǒng)采用的元數(shù)據(jù)標準也不盡相同,針對保存者的調(diào)查顯示,對地觀測數(shù)據(jù)保存采用的元數(shù)據(jù)方案比較集中在HDF、netCDF、ISO19xxx系列空間元數(shù)據(jù)標準、INSPIRE和OGC等(見表6)。

      2.3 數(shù)據(jù)使用的目的與問題

      總體上,使用者對保存數(shù)據(jù)高頻率訪問的占61.7%,經(jīng)常訪問的占22.7%,偶爾訪問的占15.6%。從用途角度,使用者訪問保存數(shù)據(jù)的目的比較分散(見表7)。

      從訪問和使用的保存數(shù)據(jù)類型角度,被調(diào)查者中有79%經(jīng)常使用原始觀測數(shù)據(jù),50%經(jīng)常使用合成數(shù)據(jù)(基于多項原始數(shù)據(jù)加工而成的數(shù)據(jù)產(chǎn)品),37%經(jīng)常使用解釋型數(shù)據(jù)(針對一些難以理解的原始數(shù)據(jù)進行解釋的輔助數(shù)據(jù))。

      在數(shù)據(jù)使用過程中,最常遇到的問題見表8。

      針對上述第一個問題,可能導(dǎo)致的原因有數(shù)據(jù)遷移和數(shù)據(jù)恢復(fù)。數(shù)據(jù)遷移包括存貯介質(zhì)遷移和數(shù)據(jù)格式遷移。存貯介質(zhì)遷移是將保存數(shù)據(jù)從不穩(wěn)定的存貯介質(zhì)轉(zhuǎn)移到穩(wěn)定的存貯介質(zhì)中,這個過程可能會導(dǎo)致數(shù)據(jù)的丟失。數(shù)據(jù)格式遷移是數(shù)據(jù)存貯的文件格式從過時的格式轉(zhuǎn)換為新格式的過程,這個轉(zhuǎn)換過程也會導(dǎo)致數(shù)據(jù)的丟失。另外,存儲介質(zhì)本身的老化和損壞也是導(dǎo)致數(shù)據(jù)丟失的常見原因。

      針對上述第二個問題,可能的原因是元數(shù)據(jù)丟失。用戶對數(shù)字資源的檢索是通過描述性元數(shù)據(jù)實現(xiàn)的,描述型元數(shù)據(jù)的丟失和不充分使得用戶無法找到相對應(yīng)的數(shù)字資源。

      針對上述第三個問題,可能的原因是數(shù)據(jù)存貯格式過時。數(shù)據(jù)格式過時是用戶使用當前瀏覽器無法打開瀏覽原來的數(shù)據(jù)存貯文件格式。

      針對上述第四個問題,可能的原因是表征信息缺失或不充分。表征信息是指有效瀏覽和使用保存數(shù)據(jù)所必須的工具,比如瀏覽軟件、分析軟件、理解保存數(shù)據(jù)所需的知識、記錄對地觀測數(shù)據(jù)生產(chǎn)的文檔等,這類信息常常要求與對地觀測數(shù)據(jù)一起保存。由于一些對地觀測數(shù)據(jù)的高度復(fù)雜性,表征信息對有效使用和理解這類數(shù)據(jù)至關(guān)重要。

      3 對數(shù)字保存的思考

      3.1 認知上的思考

      認知上,雖然保存人員和使用人員認為對地觀測數(shù)據(jù)的保存非常重要,并且對保存原因和用途的認識也基本一致,但對該類數(shù)據(jù)保存的未來高度憂慮,具體體現(xiàn)在表4中最嚴重的保存威脅為“數(shù)據(jù)保存系統(tǒng)缺乏可持續(xù)性”,實際上該表中的其他6項威脅也是可持續(xù)性的細化。因此,學(xué)術(shù)界應(yīng)該加強對數(shù)字保存的可持續(xù)性研究。

      宏觀上,影響數(shù)字保存可持續(xù)性的最主要問題有管理、技術(shù)和經(jīng)濟三個方面。多年來,對數(shù)字保存的研究主要集中在管理和技術(shù)層面,但對經(jīng)濟問題涉獵甚少,因此應(yīng)該開展對數(shù)字保存經(jīng)濟可持續(xù)性的探討。實際上,數(shù)字保存本身就是一種經(jīng)濟產(chǎn)品,要么是基于市場機制運營的市場經(jīng)濟產(chǎn)品(如CNKI的中國期刊網(wǎng)),要么是基于公益性機制運營的公共經(jīng)濟產(chǎn)品(如美國國會圖書館的American Memory)。從經(jīng)濟產(chǎn)品角度,數(shù)字保存經(jīng)濟可持續(xù)性可以從經(jīng)濟要素和經(jīng)濟評價兩個方面進行研究。

      數(shù)字保存的經(jīng)濟要素可以從宏觀和微觀兩個層面進行解析。宏觀上的經(jīng)濟要素主要是“供給與需求”。在“供給”方面,應(yīng)該研究其影響因素(如數(shù)字資源的保存價值、數(shù)字資源非排斥性消費以及由此產(chǎn)生的搭便車問題、保存動機的缺失與錯位等)以及解決方法;在“需求”方面,同樣也應(yīng)該研究其影響因素(如當前用戶需求的發(fā)散性、未來用戶需求的預(yù)測性、數(shù)字保存的派生需求等)以及解決方法。微觀上的數(shù)字保存經(jīng)濟要素主要是“成本與收入”,成本方面的研究應(yīng)該構(gòu)建數(shù)字保存成本的計量模型(如已出現(xiàn)的LIFE模型[4]、BCL模型[5]等),收入方面的研究應(yīng)該設(shè)計用戶訪問收費和保存者委托保存收費的計量方法(如英國考古學(xué)數(shù)據(jù)保存ADS項目[6])。

      數(shù)字保存的經(jīng)濟評價可以參考其他相近類型項目(如IT項目)的經(jīng)濟評價方法結(jié)合數(shù)字保存項目特征來實施,一般從定性和定量兩個角度進行。在定性評價方面,可以從供給的必要性(如數(shù)字資源保存價值大小、搭便車問題的影響與解決、保存動機缺失與錯位的存在情況及提升與糾正等)和需求的充分性(如現(xiàn)實需求水平、未來需求預(yù)測、派生需求的市場供給)等方面,分析數(shù)字保存項目的經(jīng)濟必要性。在定量評價方面,應(yīng)該基于“成本與收入”的計量或預(yù)測值,評價數(shù)字保存項目的經(jīng)濟可行性,一般包括的步驟有建立評價指標體系、設(shè)計評價指標計量模型、設(shè)置評價指標基準值以及評價實施等。

      3.2 實踐上的思考

      實踐上,保存人員保存對地觀測數(shù)據(jù)的類型比較一致;所采用的元數(shù)據(jù)標準雖然比較分散,但大都遵從該類數(shù)據(jù)的特點;使用者的訪問目的雖然也比較分散,但大都因任務(wù)而異;最突出的問題表現(xiàn)在訪問過程中遇到的不足。實際上,這些不足都是數(shù)字保存質(zhì)量問題的具體體現(xiàn)。作為一種經(jīng)濟產(chǎn)品,同其他類型產(chǎn)品一樣,數(shù)字保存質(zhì)量可以通過建立質(zhì)量標準(如不少產(chǎn)品都有質(zhì)量標準)并在此基礎(chǔ)上進行質(zhì)量認證(如產(chǎn)品的ISO9000系列認證)來解決。但目前為止,對數(shù)字保存的質(zhì)量標準與認證探討不多,應(yīng)該加強這方面的研究。

      在質(zhì)量標準研究方面,可以首先分析影響數(shù)字保存質(zhì)量的因素,然后建立數(shù)字保存的質(zhì)量標準。

      在數(shù)字保存質(zhì)量影響因素解析方面,根據(jù)全面質(zhì)量管理的原理,應(yīng)該基于數(shù)字資源生命周期包含的階段,從各個階段實施的主體來分析。一般認為,數(shù)字資源生命周期包括的主要階段有:數(shù)字資源的生產(chǎn)階段(由數(shù)字資源生產(chǎn)機構(gòu)實施)、數(shù)字資源的存儲階段(由保存機構(gòu)通過建立運行數(shù)字保存系統(tǒng)來實施,有的保存者與生產(chǎn)者是同一個機構(gòu),有的則是不同機構(gòu))、數(shù)字資源的訪問階段(由用戶通過對數(shù)字保存系統(tǒng)進行檢索、結(jié)果瀏覽與下載來實現(xiàn))等。因此,數(shù)字保存質(zhì)量影響因素可以從數(shù)字保存系統(tǒng)、數(shù)字資源生產(chǎn)機構(gòu)、保存機構(gòu)、用戶、信息技術(shù)支撐(由于數(shù)字保存的整個生命周期都需信息技術(shù)支撐)等方面進行分析。

      在數(shù)字保存質(zhì)量標準建立方面,應(yīng)該在上述分析的基礎(chǔ)上,從數(shù)字保存的管理質(zhì)量、保存系統(tǒng)的性能質(zhì)量、用戶服務(wù)質(zhì)量和技術(shù)支持質(zhì)量等方面來實現(xiàn)。其中:(1)數(shù)字保存的管理質(zhì)量,應(yīng)該涵蓋數(shù)字保存方針、所需人力資源與員工職責(zé)、保存系統(tǒng)監(jiān)控與反饋、保存系統(tǒng)運行日志管理、數(shù)字資源的完整性監(jiān)控與測度、災(zāi)難性事件的防御與恢復(fù)計劃、數(shù)字遷移等各種長期保存措施的風(fēng)險管理、數(shù)字資源產(chǎn)權(quán)管理等;(2)保存系統(tǒng)的性能質(zhì)量,可以參照OAIS參考模型來研究,內(nèi)容應(yīng)該涵蓋數(shù)字資源獲取與收錄、存檔技術(shù)與管理規(guī)范、檢索元數(shù)據(jù)和管理元數(shù)據(jù)、數(shù)字對象質(zhì)量指標、檢索功能與檢索效率、各種導(dǎo)航與鏈接規(guī)范等;(3)用戶服務(wù)質(zhì)量,應(yīng)該涵蓋目標用戶及其需求、滿足用戶信息需求的元數(shù)據(jù)方案、用戶服務(wù)模式與方針、用戶訪問記錄的管理與分析、數(shù)字資源的用戶可用性與可理解性的測試與核實、用戶信息反饋機制等;(4)技術(shù)支持質(zhì)量,可以參照信息安全標準ISO17799來研究,內(nèi)容應(yīng)該涵蓋多平臺支持、數(shù)據(jù)備份與同步訪問機制、損壞和丟失數(shù)據(jù)的檢測與恢復(fù)、存儲介質(zhì)遷移與數(shù)據(jù)檢驗、軟硬件對用戶服務(wù)的支持水平、保存系統(tǒng)環(huán)境分析與安全報警機制等。

      在數(shù)字保存質(zhì)量認證方面,可以參考ISO產(chǎn)品質(zhì)量認證的方案,結(jié)合數(shù)字保存的特點,設(shè)計數(shù)字保存的認證模型。該模型應(yīng)該包括的基本模塊有:(1)認證機構(gòu)與認證人員,內(nèi)容應(yīng)該涵蓋認證機構(gòu)的基本要求、認可獲得程序、認證人員資格獲取與監(jiān)視、認證人員行為準則與職責(zé)及能力的評價與管理等;(2)認證模式,應(yīng)該參考ISO9001的認證模式,研究數(shù)字保存認證模式的構(gòu)成要素,并據(jù)此設(shè)計認證模式的種類,探討每種認證模式的優(yōu)缺點和適應(yīng)范圍;(3)認證流程,應(yīng)該研究認證流程的構(gòu)成要素(如認證的申請、數(shù)字保存質(zhì)量管理體系檢查、數(shù)字保存性能抽查、審查與審定及認證批準等);(4)認證方案,應(yīng)該涵蓋認證方案的形式、認證實施階段(如資格檢查、認證、跟蹤)、認證方案的內(nèi)容等。

      參考文獻:

      [1]Kuipers T, Hoeven J. Insight into digital preservation of research output in Europe: Case studies report[EB/OL]. [2011-04-01].http://www.parse-insight.eu/downloads/P

      ARSE-Insight_D3-3_CaseStudiesReport.pdf.

      [2]EAS.The European Space Agency portal[EB/OL].[2011

      -09-10].http:www.esa.int/.

      [3]NASA.National Aeronautics and Space Administration[EB/OL].[2011-05-01]. http://www.nasa.gov/.

      [4]Ayris P.etal. The LIFE: Final Project Report[EB/OL].[2011-08-10]. http://www.life.ac.uk.

      [5]Beagrie N et al. Keeping Research Data Safe: A Cost Model and Guidance for UK Universities[M].London: JISC, 2008.

      [6]ADS. Archaeology data service[EB/OL].[2011-09-07]. http://archaeologydataservice.ac.uk/.

      作者簡介:臧國全(1963-),男,博士/博士后,鄭州大學(xué)信息管理系教授,研究方向:數(shù)字保存;郭營(1988-),女,鄭州大學(xué)信息管理系碩士研究生。

      广水市| 峡江县| 靖安县| 福州市| 葫芦岛市| 稻城县| 永清县| 清新县| 嘉荫县| 大城县| 临安市| 洛川县| 南昌市| 靖远县| 穆棱市| 龙泉市| 会宁县| 中宁县| 芜湖县| 临澧县| 于田县| 吉林省| 大城县| 咸阳市| 南皮县| 马龙县| 民乐县| 奉节县| 武山县| 措勤县| 建德市| 唐海县| 永和县| 漳浦县| 乐业县| 谷城县| 霞浦县| 尤溪县| 洪泽县| 北票市| 墨江|