艾文蜀
(中國電子科技集團公司第三十八研究所,合肥 230088)
隨著互聯(lián)網(wǎng)的快速發(fā)展,信息逐漸被網(wǎng)絡化、數(shù)字化。目前,媒體資料越來越多,媒體資源90 %的數(shù)據(jù)是視頻、圖片等多媒體非結構化數(shù)據(jù),并且這些數(shù)據(jù)呈現(xiàn)指數(shù)級增長,在這些非結構化數(shù)據(jù)(音視頻、圖片、文檔)中,以視頻為主的聲像資料比重越來越大,已經(jīng)逐步成為最重要的數(shù)字化資產(chǎn)。這些資料一旦缺乏科學有效的管理,必然會影響媒體資料的有效利用,同時也不利于實現(xiàn)數(shù)字化、信息化的檔案建設目標。
隨著我國經(jīng)濟形勢、政策改革的巨大變化,近幾年檔案數(shù)字化開發(fā)利用的形式和特點也發(fā)生了較大的變化。為適應新形勢和新環(huán)境下的檔案歸檔利用工作,必須更加認真思考、探索及分析,采納相應的政策,改善數(shù)字檔案歸檔存儲利用工作,不斷提升檔案編研利用等服務。
目前,很多科研單位對數(shù)字化資產(chǎn)沒有進行任何規(guī)范化、流程化的管理,對媒體資源的收集、管理及利用沒有統(tǒng)一管理的數(shù)字系統(tǒng)。數(shù)字化資產(chǎn)管理中存在的主要問題表現(xiàn)在以下幾個方面。
第一,海量的音視頻及其他數(shù)字化聲像資料的數(shù)量和容量龐大,靠人工及簡單目錄化方式實行高效管理幾乎不可能,自動化管理極為困難。
第二,聲像資料處于管理失控的無序狀態(tài),產(chǎn)生的數(shù)據(jù)往往會因保存不當而丟失,控制權限不合適低密級人員越級利用,從而使檔案的保密性無法得到安全保障。
第三,日常業(yè)務工作中,需要不斷查詢歷史聲像資料,應用傳統(tǒng)的人工方式和資料柜管理,檢索過程非常緩慢煩瑣。即使在計算機上搜索,從大量文件中查找到所需要的資料,甚至只是某個視頻鏡頭,也是一件耗時耗力的工作。對于大多數(shù)文檔、照片、視頻,只能進行簡單的題目檢索,無法進行全文檢索,獲取信息和資料速度慢,工作效率低下。
第四,有大量歷史聲像資料急需數(shù)字化搶救,保存時間過長會導致部分數(shù)據(jù)丟失,急需開展數(shù)字化采集整理工作。
第五,數(shù)字化視頻節(jié)目和素材每年不斷增加,尤其是后續(xù)高清素材越來越多,也需要新系統(tǒng)來存儲和管理這些高清音視頻資源。
針對聲像檔案管理混亂無序、資源無法集中存檔的局面,首先應構建檔案信息集中管理系統(tǒng)平臺,實現(xiàn)媒體檔案(將所有需要系統(tǒng)管理的聲像資料統(tǒng)稱為資源)的綜合管理。保存的目的是保存數(shù)據(jù)信息的內(nèi)容、物理形式和功能,對其進行分類、歸檔、管理,即使時間流逝,技術發(fā)生變化,依然能對存檔數(shù)據(jù)進行調(diào)取,實現(xiàn)可檢索、可調(diào)用。
明確聲像檔案管理范圍:需要能夠支持各類聲像資料、數(shù)字資源的管理,包括各類音視頻、圖片、文檔等文件資源,并且在聲像檔案基礎上建立多組管理對象,如各類會議、各種活動、領導視察來訪、外事接待等產(chǎn)生的所有照片、錄像、錄音、解說詞、發(fā)言。
規(guī)范聲像檔案編目:對收集歸檔的資源對象制定相對應的著錄編目規(guī)范,可以對所有數(shù)字資源進行描述。編目的基本元數(shù)據(jù)項應包含信息本身產(chǎn)生的一些源數(shù)據(jù),再進行分層編目并細化。
統(tǒng)籌聲像檔案組織:不同資源模式下,為不同的歸檔檔案建立相關的檔案組織和規(guī)章制度,以實現(xiàn)對歸檔檔案的快速定位和檢索。
統(tǒng)一聲像檔案管理流程:為后續(xù)工作建立并組織合理的檔案采集編目利用流程,也一并為各種檔案信息建立有利于內(nèi)外部的檔案資源管理、檢索下載等流程。對自身檔案實體和檔案信息的管理、服務等各項業(yè)務工作從起始到完成,需由不同部門、不同職位,經(jīng)不同環(huán)節(jié)協(xié)調(diào)及順序工作來實現(xiàn)完整過程。
構建聲像檔案管理模式:依據(jù)現(xiàn)實中檔案資源保存的場景,對各類不相同的檔案對象和檔案信息管理人員、建立人員、利用人員創(chuàng)建不相同的多種場景。聲像檔案不能獨立成類,應和與其內(nèi)容相關的紙質(zhì)文檔建立有機聯(lián)系,不僅要建立管理制度,還要制定相應細則。為了使館藏的珍貴原始聲像檔案能夠永久保存,共享服務于大眾,同時能快速檢索到自己需要的影像資源,安全便捷地進行管理存儲,實現(xiàn)通過網(wǎng)絡查閱、預覽、播放,關鍵需要解決對音視頻、照片等多媒體載體產(chǎn)生的媒體檔案采集收集、整理編目、信息存儲、查詢檢索和信息發(fā)布等問題。現(xiàn)有的媒體檔案管理系統(tǒng)已成為創(chuàng)建數(shù)字檔案館這一過程中不可或缺的重要組成部分。
先進的媒體檔案管理系統(tǒng)所具備的技術亮點,是以“高管控、高質(zhì)量、高可用、高效率”為原則,為用戶提供媒體檔案資產(chǎn)搶救、管理、利用等一系列整體的解決方案。其優(yōu)勢包括先進的技術、構架和設計理念,具有良好的互聯(lián)互通性,支持多格式、泛媒體,工作流程靈活、簡潔,可以滿足不同用戶的需求。需做到設備先進、系統(tǒng)科學、功能實用、接口開放、維護方便。為聲像檔案的歸檔、整理、編目、檢索、瀏覽等一系列工作保駕護航,且需要滿足聲像檔案格式轉(zhuǎn)換、編目審核、安全完整和下載輸出等各功能要求,確保聲像檔案數(shù)字化工作順利開展。中國電子科技集團公司第三十八研究所經(jīng)過兩年的考察時間,在多方協(xié)調(diào)促進下成功上線了聲像檔案媒體資產(chǎn)管理系統(tǒng)(以下簡稱“檔案媒資系統(tǒng)”),解決了當前音像資料老化和存儲、管理的一些迫切問題,以下簡單介紹該系統(tǒng)。
1.人性化的軟件設計
用戶功能操作界面層次分明、新穎耐看,系統(tǒng)界面布局合理、簡單易用;所有上傳、下載任務實時監(jiān)控,使得用戶對任務狀態(tài)一目了然;圖片和視頻上傳時,后臺自動提取相關信息,如拍攝日期、拍攝像素、文件格式、拍攝人等,實現(xiàn)部分數(shù)據(jù)自動化處理;視頻文件系統(tǒng)內(nèi)嵌一套傳輸服務,做到隨時隨地上傳、下載文件,并且支持斷點續(xù)傳(圖1)。
圖1 聲像檔案媒體資產(chǎn)管理系統(tǒng)上傳界面
2.功能齊全、操作簡單
多種來源的資料采集方式,與獨立軟件配合使用,可實現(xiàn)文件、光盤、藍光等全介質(zhì)的批量上傳;自動識別該視頻資料是否有低質(zhì)量文件,如果沒有則后臺自動生成低碼率文件用于瀏覽,保證了音視頻文件入庫的同時存在兩份(高低質(zhì)量各一份);支持元數(shù)據(jù)信息自定義,包括分類自定義、編目體系自定義、編目數(shù)據(jù)自定義;支持多業(yè)務系統(tǒng)數(shù)據(jù)(實體文件及元數(shù)據(jù))交換,方便檔案移交;高效全文檢索引擎,提供全文模糊查詢、編目查詢、主題檢索等(圖2)。
圖2 聲像檔案媒體資產(chǎn)管理系統(tǒng)檢索界面
本系統(tǒng)對于集中管理的檔案資源提供全文檢索、分類檢索功能,簡單直觀、高效維護。在資源管理、歸檔遷移等方面,具有國內(nèi)超前的智能化技術,系統(tǒng)在資源調(diào)用、共享、管控等方面有很大優(yōu)勢。
3.流程方便明晰,泛媒體、多格式支持
在使用過程中,整個流程一目了然,沒有繁雜的操作,網(wǎng)絡結構成熟。系統(tǒng)本身包含自己的工作流監(jiān)控,并可與交互平臺的流程管理無縫集成。其工作流程可以定義系統(tǒng)內(nèi)部工作環(huán)節(jié)與走向,配置各環(huán)節(jié)的執(zhí)行參數(shù)與執(zhí)行人員等。下圖以照片歸檔為例(圖3)。
圖3 聲像檔案媒體資產(chǎn)管理系統(tǒng)照片歸檔流程
基于文件方式的存儲管理模式,對存檔文件的格式?jīng)]有任何限制;支持各類視頻文件、音頻文件、文本文件(Word、Excel、TXT等)及圖片文件(JPG、GIF等);支持多格式轉(zhuǎn)碼文件;支持視頻文件高清格式。
對傳統(tǒng)介質(zhì),如VO錄像帶、IMAX錄像帶、DV帶等進行采集,生成數(shù)字化檔案信息,同時生成相應的初始編目信息。上傳下載模塊支持Web網(wǎng)頁登錄,應具備至少5個端口同時高速運作的寬帶,不限制同時瀏覽的端口數(shù)量。具備批量采集轉(zhuǎn)碼和批量編目功能,同時還可以對采集的音像素材進行簡單裁切、合成的編輯工作,以達到歸檔的要求。將文件格式轉(zhuǎn)化成AVI、MPG4、JPG等多種通用格式,用于內(nèi)外檔案信息的交換。
4.成熟、完備的存儲管理
使用安全、可靠、高效的多級存儲體系,智能化地進行在線、近線、離線資料的統(tǒng)一管理。在設計過程中充分考慮系統(tǒng)的安全性,本所在提供高性能的虛擬化服務器資源的同時,也為數(shù)據(jù)備份提供了雙控制器系統(tǒng)和冗余電源。數(shù)據(jù)存儲的可使用有效容量大于200T,每臺核心服務器在配置的時候系統(tǒng)盤和數(shù)據(jù)盤也全部采用冗余配置,采用文件存儲服務器與系統(tǒng)服務器兩個獨立的硬件系統(tǒng),文件存儲服務器具有雙備份功能,最大化保證數(shù)據(jù)不易損壞和丟失,同時源數(shù)據(jù)設備與備份存儲設備Raid級別均采用Raid 6方式。
整個系統(tǒng)具有完善的應急方案,對在系統(tǒng)安裝及運行過程中出現(xiàn)的故障和問題,都能及時指出排解方法和手段。在線對網(wǎng)絡運行情況進行記錄和監(jiān)測,對于不同用戶進行權限的嚴格區(qū)分和限制。
5.穩(wěn)定、安全、可靠
嚴密的用戶安全訪問機制,保證內(nèi)容訪問權限;系統(tǒng)內(nèi)置強大的工作流導航和模塊應用,支持在流程中任意環(huán)節(jié)設置操作權限,文件流轉(zhuǎn)過程中,嚴格把控利用權限,防止誤操作。嚴格的QA機制保障產(chǎn)品的穩(wěn)定和可靠,降低維護的代價。
在應用服務器上安裝SFTP服務器是因為媒體檔案管理系統(tǒng)中有“超大附件”電子文件上傳功能,而所上傳的視頻文件大多是超過10 G的文件,為了優(yōu)化超大附件上傳功能,故需要借用SFTP服務端。
與傳統(tǒng)聲像檔案素材比較,數(shù)字化聲像檔案的優(yōu)點就是可以無損重復利用,鑒于計算機網(wǎng)絡的開放性及可擴展性,聲像檔案能夠被比較容易地再利用,真正成為用戶可以周轉(zhuǎn)流通的媒體“檔案”,而不像傳統(tǒng)聲像素材被沉淀在庫房、藏館內(nèi)。
遵循安全性的重要原則,在網(wǎng)絡系統(tǒng)構建方面,整個系統(tǒng)要保證軟件不受病毒感染、黑客攻擊,具有高度的安全和保密性,系統(tǒng)硬件選型也以安全、穩(wěn)定為主。
6.全新概念,強大的資源轉(zhuǎn)換
采用先進的、成熟的資源轉(zhuǎn)換和管理技術,從系統(tǒng)集成角度、設備選型、搜索技術及先進的數(shù)據(jù)計算存貯技術平臺等入手,最大化地符合聲像資料行業(yè)規(guī)范和標準,滿足與OA系統(tǒng)、PDM系統(tǒng)等的相關接口協(xié)議。從而實現(xiàn)聲像檔案資源共享,服務社會。
為迎接信息時代科技發(fā)展的挑戰(zhàn),加快媒體檔案管理系統(tǒng)的建設,以適應現(xiàn)代信息技術發(fā)展的基本流向,本系統(tǒng)在其整個生命周期內(nèi)可保持一定的先進性。在信息數(shù)字化、管理網(wǎng)絡化背景下,通過對多媒體信息資源的統(tǒng)籌管控,為深入挖掘聲像檔案的知識價值和利用價值、拓展聲像檔案的利用渠道提供成熟的軟硬件環(huán)境。在提高自身業(yè)務水平的過程中,應充分借助計算機網(wǎng)絡技術去繼續(xù)探索聲像檔案的價值,從而實現(xiàn)知識共享,最大限度地發(fā)揮聲像檔案的文化潛質(zhì),不斷提升檔案在科研單位中的創(chuàng)新能力和發(fā)展需求。