楊世英
摘 要:在海量科技檔案數(shù)據(jù)中如何找準(zhǔn)信息,如何使借用件、共用件關(guān)聯(lián)有用的信息是科技檔案工作者面臨的一個重要課題,本文對企業(yè)科技檔案管理面臨的困難進(jìn)行了論述和分析,提出有效解決遇到問題的一些建議,以期能為我國各科研單位的科技檔案管理提供參考。
關(guān)鍵詞: 科技檔案;管理;關(guān)聯(lián);信息
1 引言
當(dāng)“互聯(lián)網(wǎng)+”概念迅速走紅,當(dāng)“中國制造2025”正在推動制造業(yè)的智能化升級,當(dāng)大數(shù)據(jù)和云計算正在推動形成新的消費理念、商業(yè)模式和產(chǎn)業(yè)形態(tài),信息技術(shù)已經(jīng)滲透到幾乎所有的領(lǐng)域。隨著研究院數(shù)字檔案館的建成和運行,幾年來無論是傳統(tǒng)載體的數(shù)字化,還是電子文件系統(tǒng)的建設(shè),都產(chǎn)生了大量的檔案數(shù)字信息,過去科技檔案借用件、共用件的應(yīng)用,無論在紙質(zhì)檔案或《檔案管理系統(tǒng)》檔案都無法實現(xiàn)關(guān)聯(lián),過去的傳統(tǒng)檔案管理已不適應(yīng)目前研究院的檔案信息化建設(shè)要求。通過加強對數(shù)據(jù)管理與數(shù)據(jù)的標(biāo)準(zhǔn)化、優(yōu)化數(shù)據(jù)庫性能,持續(xù)提高信息資源的傳遞和共享水平,從而做好科技檔案數(shù)字化管理中信息關(guān)聯(lián)問題,加強檔案信息化建設(shè),提高信息服務(wù)的自動化水平。
2 科技檔案
科技檔案是指產(chǎn)品在研制、生產(chǎn)活動中形成的具有保存價值的各種技術(shù)文件??萍紮n案材料主要是由本單位自己編制形成的,但與本單位科技、生產(chǎn)活動有直接關(guān)系的其他單位提供的、轉(zhuǎn)讓的、引進(jìn)的、移交的科技文件材料,也都視為科技檔案材料。借用件、共用件是指從已定型(或鑒定)產(chǎn)品中借用的零、部、組件;共用件是指同一型號中共同使用的零、部、組件。
近年來,我院檔案主管部門非常重視檔案信息化建設(shè),隨著科技信息技術(shù)的應(yīng)用和數(shù)字檔案館建設(shè),產(chǎn)生的大量科技電子文件(科技電子文檔)形成一個巨大的檔案數(shù)字資源。
3 當(dāng)前科技檔案管理面臨的困難
3.1 快速而準(zhǔn)確地找到所需的信息。如何在大量的科技檔案中快速而準(zhǔn)確地找到所需的信息,是檔案服務(wù)要解決的首要問題。在大數(shù)據(jù)時代,科技檔案數(shù)量急劇增長,在進(jìn)行檔案查詢時,往往需要的信息會被埋沒在大量的不需要的數(shù)據(jù)中,并且檢索性能急劇下降,甚至無法響應(yīng),即:“找準(zhǔn)信息”。
3.2 科技檔案數(shù)字化管理中借用件、共用件信息關(guān)聯(lián)問題。檔案凝結(jié)了企業(yè)在科研、生產(chǎn)及經(jīng)營管理等活動中所創(chuàng)造的全部成果,具有重要的參考價值和借鑒作用。尤其在新產(chǎn)品的研制或產(chǎn)品的改進(jìn)改型中,通過借鑒檔案資料幫助企業(yè)快速、準(zhǔn)確地設(shè)計產(chǎn)品尤為重要,借用件、共用件、關(guān)重件等使用非常常見。近年來,我院“檔案管理”系統(tǒng)平臺實現(xiàn)了與協(xié)同工作平臺、PDM、OA等主要業(yè)務(wù)系統(tǒng)的集成,電子文件實現(xiàn)了實時在線歸檔和自動采集,加上館藏檔案的數(shù)字化,檔案數(shù)據(jù)量的激增,不可避免地會導(dǎo)致用戶從大量的檔案中找到所需的消息并與之關(guān)聯(lián)難度增大。目前在科技檔案借用件、共用件關(guān)聯(lián)運用中,工作界面程序就多,耗時過長,使用不方便。譬如某套科技圖紙中有一張圖紙是借用件需要關(guān)聯(lián),數(shù)據(jù)不在同一庫節(jié)點,根本做不到數(shù)據(jù)消息關(guān)聯(lián),即使數(shù)據(jù)在同一庫節(jié)點上,也需要在檔案管理系統(tǒng)中進(jìn)入2次界面,有時還出現(xiàn)對所需的資料檢索不到或死機現(xiàn)象,最后還得逐條在成千的圖紙中挑其中的這張圖紙才能關(guān)聯(lián)。
4 大數(shù)據(jù)時代科技檔案管理解決方案
為了解決在大量科技檔案中“找準(zhǔn)信息”和“借用件、共用件信息關(guān)聯(lián)”的問題,要做好以下工作。
4.1 首先要全面收集和保存科技檔案數(shù)據(jù)。只有全面收集和保存科技檔案數(shù)據(jù),才有可能在科技檔案數(shù)據(jù)庫中找到所需的信息。資源類數(shù)據(jù)包括館藏檔案經(jīng)過數(shù)字化加工而產(chǎn)生的各類電子檔案,PDM、CAPP、OA等系統(tǒng)存儲的各類電子檔案,檔案信息網(wǎng)建設(shè)和維護(hù)信息。在企業(yè)檔案信息化建設(shè)過程中,如果我們具備保存海量數(shù)據(jù)的條件,首先要盡可能多地收集和保存數(shù)據(jù),做到全覆蓋,不能因為數(shù)據(jù)量大,處理復(fù)雜,保存代價高等一系列主客觀原因,而放棄暫時對科研生產(chǎn)無關(guān)的數(shù)據(jù)。檔案工作其實是一項繁瑣的工作,尤其是科技檔案工作,我們永遠(yuǎn)不知道哪份科技檔案哪一天要用,對哪個人有用,不知道這些數(shù)據(jù)可能就是明天科研人員需要關(guān)聯(lián)的數(shù)據(jù)信息,因此,在科技發(fā)達(dá)到能夠存儲海量數(shù)據(jù)的今天,我們理應(yīng)全面收集和保存好科技檔案數(shù)據(jù),需要保存的文件,確保得到及時收集、分類歸檔。對任何一份科技檔案都要做到寧可一直用不到,也不能出現(xiàn)科研人員用到時不能方便找到的現(xiàn)象。
4.2 加強對數(shù)據(jù)管理與數(shù)據(jù)的標(biāo)準(zhǔn)化。建立數(shù)據(jù)管理規(guī)范標(biāo)準(zhǔn),嚴(yán)格規(guī)定科技檔案各類信息的著錄格式、著錄細(xì)則。由于數(shù)據(jù)庫存儲和利用的特殊性,可能幾年以前形成的數(shù)據(jù)現(xiàn)在已經(jīng)無法利用,或者數(shù)據(jù)不能有效地讀取。例如:受控文本的錄入必須用半角格式,否則在全文批量掛接上傳時,因格式不匹配而無法掛接全文。因此,我們要規(guī)定受控記錄的范圍、格式與填寫要求,確保檔案信息錄入完整、準(zhǔn)確、規(guī)范,培養(yǎng)時時更新意識,要派專門檔案人員及時對數(shù)據(jù)庫進(jìn)行更新和核準(zhǔn),只有做到這些,才能提高數(shù)據(jù)質(zhì)量,確保檔案材料的齊全、完整和準(zhǔn)確性。具體包括科技資料更改、替換、銷毀的時間、依據(jù)、階段標(biāo)記、內(nèi)容、責(zé)任者,確保文件的更改和現(xiàn)行修訂狀態(tài)得到標(biāo)識,關(guān)聯(lián)數(shù)據(jù)時就不會不同階段的資料一股腦兒地全部跳出來,防止作廢文件的非預(yù)期使用,而確因需要而保留作廢文件時,對這些文件進(jìn)行標(biāo)識,以防誤用;根據(jù)商業(yè)秘密的級別,對資料(含涉及商業(yè)密級的檔案資料)密級做相應(yīng)密級調(diào)整,將檔案系統(tǒng)中文件條目“商業(yè)秘密級別”按要求標(biāo)識“最重要”“重要”“一般”,PDM系統(tǒng)歸至《檔案管理系統(tǒng)》的電子檔案,除PDF格式外,WORD格式也同樣標(biāo)識商業(yè)密級;科技成果補錄成果完成人,確保使用者輸入完成人的部分信息能夠關(guān)聯(lián)到該科技成果詳細(xì)科研資料。做好記錄的標(biāo)識,以便使用者快速而準(zhǔn)確識別、檢索和使用。才能有效進(jìn)行數(shù)據(jù)信息關(guān)聯(lián),進(jìn)一步推動檔案信息化進(jìn)程。
著錄規(guī)則包含技術(shù)文件、光盤、整套圖紙、底圖以及設(shè)計更改單、技術(shù)通知單、工程更改/偏離單等,數(shù)據(jù)庫中所著錄的標(biāo)點符號都為英文半角格式。在著錄數(shù)據(jù)庫條目時,不允許覆蓋,如有換版的情況產(chǎn)生,必須新建條目著錄,并修改原條目中“文件狀態(tài)”欄目的屬性。圖/文件號按歸檔資料上的實際圖/文件號著錄,著錄要求完整,PDM系統(tǒng)數(shù)據(jù)此項為必錄項并推送至檔案管理系統(tǒng);歸檔單位按資料歸檔單位填寫,用中文著錄,不可用數(shù)字或符號表示,兩個以上單位合作歸檔的資料,幾個單位全部著錄,單位之間用“/”分隔;責(zé)任者指資料的編寫者或建議者。外來資料如無明確“責(zé)任者”時,填寫資料形成單位。歸檔資料無明確編寫者,注明歸檔人或單位,例如:王君(歸);某某單位(歸)。譯文資料根據(jù)情況要注明歸檔人或單位,例如:李四(譯);形成時間指文件簽署頁的批準(zhǔn)欄目中最后的日期,統(tǒng)一由8位阿拉伯?dāng)?shù)字組成,如2008.01.01;歸檔時間指文件或單據(jù)移交檔案主管的交接時間,統(tǒng)一由8位阿拉伯?dāng)?shù)字組成,由系統(tǒng)自動生成;密級指歸檔文件或單據(jù)上所標(biāo)識的密級,如內(nèi)部、秘密、機密、絕密。外來文件未標(biāo)識密級的,填寫內(nèi)部。密級變更后,應(yīng)在備注中說明變更人、變更日期、變更依據(jù)文件;載體類型指文件資料存儲介質(zhì),分為紙質(zhì)、光盤、磁盤、硬盤、膠帶等;文件狀態(tài)指文件現(xiàn)在的狀態(tài),包含:現(xiàn)行、下架、作廢、封存、撤銷,文件發(fā)生換版等動作時應(yīng)更改其狀態(tài)。
要快速而準(zhǔn)確地關(guān)聯(lián)到所需的信息,必須嚴(yán)格按科技檔案各類信息的著錄格式、著錄細(xì)則規(guī)定操作。
4.3 對數(shù)據(jù)庫進(jìn)行性能優(yōu)化。原始數(shù)據(jù)往往由于在數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)組織、數(shù)據(jù)表達(dá)等方面與用戶需求存在不一致的地方,需要進(jìn)行數(shù)據(jù)信息轉(zhuǎn)換與處理。數(shù)據(jù)信息轉(zhuǎn)換后仍不能達(dá)到數(shù)據(jù)信息化關(guān)聯(lián)的,則系統(tǒng)存在性能瓶頸,需要進(jìn)行數(shù)據(jù)庫性能優(yōu)化,就必須部署新的技術(shù),繼續(xù)升級檔案資源管理系統(tǒng)平臺。
5 結(jié)束語
大數(shù)據(jù)時代,作為科技檔案管理人員有責(zé)任、有義務(wù)主動思考科技檔案管理中面臨的問題,并提出解決遇到問題的相關(guān)建議,切實推動研究院科技檔案工作的發(fā)展,同時我們將會積極參與到智慧研究院科技檔案管理建設(shè)過程中。