□鄧珞華 鄧東寧 陳晟
鄧東寧,中南財經(jīng)政法大學(xué)圖書館,武漢,430073;
陳晟,中石化武漢分公司信息中心,武漢,430082
視頻圖書館是國外近幾年隨著影像資料的增長和計算機(jī)影像技術(shù)的發(fā)展而出現(xiàn)的一個新名詞,它主要是指一些專門收集視頻資料以及相關(guān)的音頻資料并對公眾提供服務(wù)的機(jī)構(gòu),例如澳大利亞在上世紀(jì)末就建立了音樂數(shù)字圖書館和圖像數(shù)字圖書館[1],并在互聯(lián)網(wǎng)上免費提供使用,美國北卡萊羅納大學(xué)信息與圖書館學(xué)院也主持過“開放數(shù)字視頻圖書館”項目[2]。
上世紀(jì)末以來,影像資料的增長呈迅猛發(fā)展的勢頭。目前視頻資料的來源主要有3個:一是音像出版社制作的 VCD、DVD、CD光碟和錄音帶錄像帶,目前我國300多家音像出版社每年出版量大約2.8萬種[3]。二是廣播電視電影節(jié)目制作單位,據(jù)因特網(wǎng)電影數(shù)據(jù)庫統(tǒng)計,1991年全球生產(chǎn)影片5972部,2001年達(dá)到10342部。據(jù)美國加州大學(xué)伯克利分校信息管理與系統(tǒng)學(xué)院的“How much information”項目的統(tǒng)計,2003年,全球有電視臺21264個,每年播放節(jié)目3100萬小時。全球有廣播電臺47776個,每年播放節(jié)目 7000萬小時,按信息存儲量計算,大大超過了美國所有研究圖書館的館藏總量[4]。三是單位和個人制作的音像資料。隨著攝像機(jī)、具有攝像功能的手機(jī)的普及以及計算機(jī)處理圖像功能的加強(qiáng),個人制作的聲像節(jié)目越來越多,在民間和網(wǎng)上流傳。海量的音像資料是視頻圖書館產(chǎn)生和發(fā)展的前提和基礎(chǔ)。越來越多的圖書館開展了音像資料的采集、組織、管理和服務(wù)工作,如美國國會圖書館和英國大不列顛圖書館的音視頻資料都達(dá)到數(shù)百萬件[5],我國絕大多數(shù)中等以上規(guī)模的圖書館都建立了聲像閱覽室,視頻圖書館的研究也提上了圖書館理論界的日程表。
目前國內(nèi)向圖書館提供影像資料的主要是一些中間供應(yīng)商,如中外合資的武漢緣來文化傳播有限責(zé)任公司,它主要提供國外影視節(jié)目制作單位(如澳大利亞的CLASSROOM VIDEO、美國的 DISCOVERY)制作的影像節(jié)目,其特點是節(jié)目制作精美,版權(quán)問題解決得徹底,中英文聲音和文字對照,尤其適合大學(xué)讀者的需要,其中很多科教節(jié)目可以直接用來作大學(xué)老師的課件。該公司目前可提供的節(jié)目達(dá)到一萬小時以上。此外,一些做傳統(tǒng)文字?jǐn)?shù)據(jù)庫的供應(yīng)商,如清華同方公司、北京超星公司等也開始涉足這個領(lǐng)域。
與傳統(tǒng)的文字資料相比,聲像資料整合了文字、圖形、影像、聲音及動畫等不同信息,具有更直觀、更生動的特點,但同時,由于聲像資料除了含有文字信息之外,更包含聲音、圖像信息,因此在著錄、保存、使用、版權(quán)與軟件硬件等許多方面比文字資料更復(fù)雜,更具特殊性,本文試圖從技術(shù)和管理兩個層面對視頻圖書館的特點進(jìn)行剖析和總結(jié)。
由于視音頻數(shù)據(jù)的特殊性,它的元數(shù)據(jù)處理在功能設(shè)置、元素設(shè)置等方面具有更高的要求:1)視音頻數(shù)據(jù)為了加強(qiáng)其描述能力,需要更多的元素和修飾詞。例如影視節(jié)目的責(zé)任者除了有劇本原作者外,還有改編者、導(dǎo)演和演員、配音、燈光、道具等諸多責(zé)任者。又如錄像帶包括時長、制式、畫面縱橫比、聲道數(shù)等等紙質(zhì)文獻(xiàn)不具備的物理特征。2)視音頻數(shù)據(jù)中的信息來源是多樣性的,如腳本、字幕、圖像和聲音,因此視音頻元數(shù)據(jù)除了包括傳統(tǒng)的文本元數(shù)據(jù),還應(yīng)包括視頻元數(shù)據(jù)和音頻元數(shù)據(jù)以幫助用戶高效檢索和瀏覽所需信息。3)為了滿足一些專業(yè)用戶深層次的檢索需求,視音頻數(shù)據(jù)需要從視音頻資料的片段層、鏡頭層的角度揭示更為深入的信息內(nèi)容。
關(guān)于視音頻元處理的研究在國內(nèi)外都引起了普遍重視。我國廣播電視部2003年出臺了《廣播電視音像資料編目規(guī)范》,北京大學(xué)信息管理系國家社科基金項目“視音頻信息元數(shù)據(jù)與檢索創(chuàng)新研究”課題組2004年研制成《視音頻信息元數(shù)據(jù)規(guī)范》。國外關(guān)于這方面的研究則更加深入,并形成了一系列的規(guī)范與標(biāo)準(zhǔn),如美國國防虛擬圖書館項目形成的基于MARC的《數(shù)字動態(tài)圖像元數(shù)據(jù)指南》,美國、加拿大、英國、荷蘭、意大利、巴西、泰國等國數(shù)十個機(jī)構(gòu)的100多位專家學(xué)者組成的“視頻開發(fā)計劃”視頻存取工作組研制的基于 DC的《VIDE用戶指南:面向數(shù)字視頻的DUBLIN核心應(yīng)用文檔》,源自美國國會圖書館電影保存計劃的同時支持MPEG-7和DC的《MIC核心數(shù)據(jù)元素表》,美國北卡萊羅納大學(xué)信息和圖書館學(xué)院的“開放式數(shù)字視頻圖書館”項目形成的《視頻元數(shù)據(jù)和文本數(shù)據(jù)并重的開放式數(shù)字視頻圖書館元數(shù)據(jù)方案》[6]?!秶庖曇纛l元數(shù)據(jù)研究文獻(xiàn)綜述》介紹了國外大量的視音頻元數(shù)據(jù)研究的機(jī)構(gòu)、成果和研究文獻(xiàn),這里就不一一贅敘了[2]。
視音頻數(shù)據(jù)庫檢索的最大難點在于聲音和圖像的檢索,尤其是連續(xù)圖像的檢索,這也是它與文本文件檢索的最大區(qū)別。目前直接以聲音和圖像的特征對聲像資料進(jìn)行檢索,少數(shù)的還可以(如能識別少數(shù)聲音和圖像的門禁系統(tǒng)),海量的聲像信息檢索,技術(shù)上難度則相當(dāng)大。要對海量的聲音圖像信息進(jìn)行檢索,目前還只能把聲音圖像信息轉(zhuǎn)化成文字信息,再從文字的角度檢索聲音和圖像。
首先是對視音頻資料進(jìn)行分類和主題標(biāo)引,這就要借助適合于聲像資料管理方面的分類法和主題詞表。在原有分類法和主題法的基礎(chǔ)上,針對音像資料的特點,增加一些類目、主題詞、使用說明、附表等,是可以對音像資料進(jìn)行分類和主題標(biāo)引的,盡管仍不能充分表達(dá)音像資料的豐富內(nèi)容,但能滿足大部分檢索要求。付昕、耿敏在《數(shù)字圖書館中的視頻信息檢索》一文中對這方面進(jìn)行了很好的說明[7]。
音視頻數(shù)據(jù)庫檢索最難也是最迫切需要解決的是內(nèi)容的檢索,相當(dāng)于文本數(shù)據(jù)庫的全文檢索,即根據(jù)檢索標(biāo)識,找到具有這種標(biāo)識特征的音視頻資料的片段。它不同于傳統(tǒng)數(shù)據(jù)庫的檢索,是一種近似匹配技術(shù)。
基于內(nèi)容的描述是基于內(nèi)容檢索的前提?;趦?nèi)容的描述方案包括自動視覺特征抽取和人工語義的特征標(biāo)注。MPEG專家組制定的基于內(nèi)容的多媒體描述方案MPEG-7著眼用代碼的形式表示和標(biāo)識視聽內(nèi)容,試圖提供一組強(qiáng)大的標(biāo)準(zhǔn)化工具來描述多媒體數(shù)據(jù)內(nèi)容,即所謂的“多媒體數(shù)據(jù)內(nèi)容描述接口”[7]。
目前國內(nèi)視頻數(shù)據(jù)庫能做到內(nèi)容檢索的只有武漢緣來文化傳播有限責(zé)任公司。他們采取的方法是將視頻資料的腳本中的每一段標(biāo)上對應(yīng)的時間段,在腳本中檢索到所需要的標(biāo)識特征后,顯示出該段解說詞,進(jìn)而顯示出該時間段的影視內(nèi)容。這種方法比較好地解決了音視頻數(shù)據(jù)庫的內(nèi)容檢索問題,同時對生產(chǎn)商和用戶而言都比較容易操作。
視頻圖書館的軟件技術(shù)主要包括音像數(shù)字信息處理技術(shù),如文本、數(shù)值、圖像、聲音信息的編碼、解碼、壓縮、模擬信號與數(shù)字信號的相互轉(zhuǎn)換,還有適用于全文本、圖像以及聲音等非結(jié)構(gòu)化數(shù)據(jù)庫管理系統(tǒng),此外更為圖書館關(guān)心的就是視頻節(jié)目的點播技術(shù)。
目前我國圖書館提供的多媒體信息服務(wù)方式主要有兩種:一種是開辟視聽閱覽室,讀者將館藏音像資料(如錄音帶、錄像帶、光盤等)借出,借助視聽室配置的錄像機(jī)、錄音機(jī)、電腦等播放設(shè)備閱讀。一種是將各種媒體的資料信息以數(shù)字化形式整合存儲在視頻服務(wù)器中,利用視頻點播系統(tǒng)(VOD),通過網(wǎng)絡(luò)提供給讀者隨時點播。據(jù)朱咫渝、孫曉的抽樣調(diào)查,目前我國高校圖書館使用第一種方式的約占65.83%,使用VOD點播的主要是實力較強(qiáng)的一些重點高校圖書館[8]。
流媒體技術(shù)的關(guān)鍵在于網(wǎng)絡(luò)數(shù)據(jù)傳輸和客戶端播放并行。該技術(shù)的實現(xiàn)有幾個必備條件:一是寬帶網(wǎng),這是因為音像信息比文字信息占的空間大得多,帶寬不夠會造成網(wǎng)絡(luò)涌堵。二是對服務(wù)器的性能和存儲空間要求較高,這類服務(wù)器是為流媒體應(yīng)用量身定做的,它的價格一般比較昂貴。三是系統(tǒng)平臺的穩(wěn)定性和支持的并發(fā)用戶數(shù),并發(fā)用戶的數(shù)量要根據(jù)圖書館讀者的多少和使用的頻率而定。
流媒體技術(shù)是 Real NetWorks公司首先推出的。目前技術(shù)上比較成熟的應(yīng)用比較廣泛的視頻點播系統(tǒng)有Real NetWorks公司推出的Real System Windous、微軟開發(fā)的Media Service和蘋果計算機(jī)公司推出的 Quik Time[9]。
視頻圖書館的計算機(jī)硬件要求一般高于普通數(shù)字圖書館,主要表現(xiàn)在三個方面:
服務(wù)器:視頻圖書館的服務(wù)器是視頻圖書館的核心硬件,其主要作用是視頻資料的存儲和發(fā)布,目前主要采用流媒體專用服務(wù)器或通用服務(wù)器兩種。專業(yè)流媒體視頻服務(wù)器是為流媒體應(yīng)用量身定做的,其存儲結(jié)構(gòu)和網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計主要是針對流媒體的特點,針對不同的網(wǎng)絡(luò)環(huán)境的不同的用戶需求,提供不同的服務(wù)模塊。他們大都帶有大容量的磁盤陣列,支持多路CPU,擴(kuò)展性能強(qiáng),并帶有流媒體操作系統(tǒng)和應(yīng)用軟件,價格比較昂貴。通用服務(wù)器通常由普通微機(jī)擔(dān)當(dāng),配備較大的存儲空間,其價格相對便宜,維護(hù)簡單,但處理能力有限,支持的并發(fā)用戶數(shù)少。
存儲器:由于視頻信息所占有的空間遠(yuǎn)遠(yuǎn)大于文本信息,因此視頻圖書館一般采用大容量并可擴(kuò)展的磁盤陣列柜。
外圍設(shè)備:由于音視頻資料呈猛增勢頭,目前大多數(shù)計算機(jī)增設(shè)了多媒體插件和光盤,MMX技術(shù)逐步完善,出現(xiàn)了多媒體計算機(jī),包括色彩豐富的視頻顯示器,處理聲音圖像的數(shù)據(jù)信號裝置、圖形緩沖區(qū)、點式設(shè)備(如鼠標(biāo)器等)以及其他外圍設(shè)備。此外采集制作聲像節(jié)目的數(shù)碼相機(jī)、攝像機(jī)、編輯機(jī)等也要根據(jù)需要配備。
音像資料的數(shù)字化就是利用計算機(jī)技術(shù)把傳統(tǒng)的音視頻資料(如錄音帶、錄像帶)模擬信號轉(zhuǎn)換成數(shù)字信號,以方便利用和長期保存。音頻資料的數(shù)字化整理一般采用計算機(jī)的聲卡、光驅(qū)和相應(yīng)的軟件來處理,視頻資料的數(shù)字化,可以視頻資料播放設(shè)備(攝像機(jī)、錄像機(jī)、影碟機(jī)等)、帶視頻捕捉卡(視頻編輯卡)或IEEE1394(俗稱“火線”)的計算機(jī)、視頻線和相應(yīng)的視頻處理軟件組成一套視頻資料數(shù)字化設(shè)備。符國偉同志在《基于多媒體技術(shù)的圖書館音像資料數(shù)字化建設(shè)》中比較詳細(xì)地介紹了音頻資料和視頻資料數(shù)字化的實際操作技術(shù),這里就不再贅述了[10]。
迄今為止,版權(quán)問題一直是我國電子文獻(xiàn)資源供應(yīng)商面臨的最為頭疼的問題,國內(nèi)電子文獻(xiàn)供應(yīng)商中徹底解決版權(quán)問題的還只是極少數(shù),其原因除了長期以來國家和民眾缺乏版權(quán)意識外,主要是版權(quán)交易不方便,尤其是與讀者簽約十分困難,大部分供應(yīng)商都是采取與出版商簽約的方式解決版權(quán)問題,而作品的最終版權(quán)所有者是作者。
視頻圖書館的版權(quán)問題相對來講要好解決一些,因為音視頻資料的版權(quán)所有者大多是單位而不是個人,簽約相對容易一些。正因為如此,國內(nèi)近年發(fā)生的電子文獻(xiàn)版權(quán)糾紛和訴訟很少涉及到音視頻資源供應(yīng)商。但這不等于說音視頻資源供應(yīng)商就沒有侵權(quán)問題,更不意味著我們可以忽視這方面的問題。
問題的主要方面依然是與個人作者的簽約。誠然,音視頻作品的版權(quán)所有者大多數(shù)是單位而非個人,但也有相當(dāng)數(shù)量的作品的版權(quán)所有者是個人,如中央電視臺《百家講壇》里的節(jié)目,其主要版權(quán)所有人是主講人而非電視臺,因此供應(yīng)商在與電視臺簽約的時候,應(yīng)該請電視臺出示電視臺與作者簽訂的作者允許電視臺發(fā)行其作品的協(xié)議。其次,總版權(quán)屬于單位的音視頻作品中也有部分版權(quán)是屬于個人的,如電影中的演員肖像是不能隨意用來作商業(yè)宣傳的。
目前我國圖書館音視頻資源供應(yīng)商中,版權(quán)問題解決得比較好的是武漢緣來文化公司,他們采取的主要方式是與澳大利亞、德國、美國等影視資源生產(chǎn)商直接簽約,而這些西方國家在版權(quán)方面的要求是比較嚴(yán)格規(guī)范的。
文獻(xiàn)資源共享是幾代圖書館人的夙愿,和所有的圖書館共享工程一樣,視頻圖書館的共建共享具有十分重要的意義。視頻圖書館的共建共享主要采取兩種方式:
一種是在全國、一個地區(qū)或一個系統(tǒng)建一個視頻圖書館,供全國、一個地區(qū)或一個系統(tǒng)內(nèi)所有人享用。由于只需一套設(shè)備、一班人馬,避免了大量的重復(fù)建設(shè),從經(jīng)濟(jì)效益和使用效益上來講,這種方式是最好的,但這需要政府的決心,尤其是資金上的投入和強(qiáng)有力的協(xié)調(diào)。根據(jù)目前國內(nèi)文獻(xiàn)資源的一些共建共享工程(如文化部的“全國文化共享工程”、科技部的“科技文獻(xiàn)共享平臺”、教育部的CALIS項目)的進(jìn)展情況來看,這種可能性還是很大的。第二種方式是圖書館之間簽訂視頻資源的共享協(xié)議。這種方式看起來似乎簡單一些,實際上操作更為困難,因為它牽涉到各方眾多圖書館的利益,在視頻資源的團(tuán)購、資金和人員的攤派、組織機(jī)構(gòu)的設(shè)置以及其他諸多方面需要做大量的協(xié)調(diào)工作。
不過歷史潮流不可阻擋,視頻資源的共建和共享和其他文獻(xiàn)資源的共建共享一樣,是歷史發(fā)展的必然趨勢,在計算機(jī)技術(shù)、網(wǎng)絡(luò)通訊技術(shù)高度發(fā)達(dá)和文獻(xiàn)資源共享意識成為圖書館界共識的今天,視頻圖書館的共建和共享在不遠(yuǎn)的將來必定會成為現(xiàn)實。
1 T he National Library of Austrulia-.[2004-11-20].http://www.musicaustrulia.org/index.html
2 張久珍等.國外視音頻元數(shù)據(jù)研究文獻(xiàn)綜述.大學(xué)圖書館學(xué)報,2005(1):22
3 馬曉明.關(guān)于高校音像資料的管理與發(fā)展趨勢探討.黑龍江科技信息,2008(4):19
4 同2:25
5 同2:25
6 姚星星等.國外視音頻數(shù)據(jù)研究綜述.數(shù)字圖書館論壇,2007(8):57
7 付昕,耿敏.數(shù)字圖書館中的視頻信息檢索.大學(xué)圖書館學(xué)報,2002(2):31
8 朱咫渝,孫曉.我國高校圖書館多媒體信息服務(wù)調(diào)查研究.四川圖書館學(xué)報,2007(5):53
9 張莉.圖書館音視頻資料的網(wǎng)絡(luò)應(yīng)用技術(shù).圖書館學(xué)刊,2005(2):14
10 符國偉.基于多媒體技術(shù)的圖書館音像資料數(shù)字化建設(shè).山東圖書館季刊,2006(1):27