唐文玲 李春燕
1 北京郵電大學(xué) 北京 100876
2 湖南農(nóng)業(yè)大學(xué)科技師范學(xué)院 長(zhǎng)沙 410128
作者:唐文玲,北京郵電大學(xué)計(jì)算機(jī)學(xué)院2010級(jí)本科生;李春燕,湖南農(nóng)業(yè)大學(xué)副教授。
高校圖書館在高校信息化建設(shè)中發(fā)揮著重要作用。隨著圖書館信息量的劇增和“數(shù)字化文獻(xiàn)”載體形態(tài)的迅猛發(fā)展,圖書館必須開始運(yùn)用起數(shù)字化技術(shù)貯存和傳遞文獻(xiàn)信息。當(dāng)今大部分高校圖書館都實(shí)現(xiàn)了資源數(shù)字化,但因開發(fā)軟件不同,在運(yùn)用時(shí)會(huì)針對(duì)不同的格式要求下載不同的閱讀軟件,給讀者帶來一定的不便。存儲(chǔ)的格式也各種各樣,使檢索資源的有效性降低。各高校圖書館資源建設(shè)存在大量的重復(fù),如今信息化社會(huì)步入云時(shí)代,高校圖書館資源共享已經(jīng)成為圖書館發(fā)展的大趨勢(shì),如何實(shí)現(xiàn)圖書館資源的共享和減少數(shù)字資源開發(fā)的重復(fù)?基于XML語(yǔ)言的圖書館共享數(shù)字資源存儲(chǔ)格式的開發(fā)將為解決上述問題提供參考。
XML(Extensible Markup Language),意為“可擴(kuò)展標(biāo)記語(yǔ)言”,是用于標(biāo)記電子文件使其具有結(jié)構(gòu)性的標(biāo)記語(yǔ)言。
XML僅僅是存儲(chǔ)數(shù)據(jù)。事實(shí)上XML與其他數(shù)據(jù)表現(xiàn)形式最大的不同是:它極其簡(jiǎn)單。通過XML可以用純文本文件來存儲(chǔ)數(shù)據(jù),它可以用來在文件或數(shù)據(jù)庫(kù)中存儲(chǔ)數(shù)據(jù)。
XML在數(shù)據(jù)的交換、存儲(chǔ)和共享方面有著獨(dú)特的優(yōu)勢(shì)?,F(xiàn)在市面上的數(shù)據(jù)庫(kù)種類繁多,雖然數(shù)據(jù)庫(kù)之間大多可以相互轉(zhuǎn)換,但是它們并不兼容,搜索多樣的不兼容數(shù)據(jù)庫(kù)更是無法實(shí)現(xiàn)的。但是XML可以將不同來源的結(jié)構(gòu)化數(shù)據(jù)很容易地結(jié)合在一起,后臺(tái)數(shù)據(jù)庫(kù)和其他應(yīng)用得來的數(shù)據(jù)就能夠在中間層的服務(wù)器上進(jìn)行集成了。
XML的簡(jiǎn)單使其易于在任何應(yīng)用程序中讀寫數(shù)據(jù),這使XML很快成為數(shù)據(jù)交換的唯一公共語(yǔ)言,意味著程序可以更容易地與Windows、Mac OS、Linux以及其他平臺(tái)下產(chǎn)生的信息結(jié)合,然后可以很容易加載XML數(shù)據(jù)到程序中并分析,以XML格式輸出結(jié)果。
XML保留了SGML(標(biāo)準(zhǔn)通用標(biāo)記語(yǔ)言)的結(jié)構(gòu)化功能,這樣就使得設(shè)計(jì)者可以定義自己的文檔類型。XML同時(shí)推出一種新型文檔類型,開發(fā)者可以不必定義文檔類型,這使得XML極其靈活。
在圖書館檢索系統(tǒng)中(以北京郵電大學(xué)圖書館為例),檢索要素包括題名、出版社、索書號(hào)、作者、標(biāo)準(zhǔn)號(hào)(ISBN)、主題詞、圖書條碼、分類號(hào)、題名縮寫,這些基本上也就是一本圖書在檢索時(shí)會(huì)用到的全部要素,當(dāng)然不同的圖書館檢索系統(tǒng)中要素可能不完全相同,檢索要素還可以包括出版時(shí)間、字?jǐn)?shù)等。
以北京郵電大學(xué)圖書館檢索系統(tǒng)中用到的圖書要素為例,一本圖書的DTD定義如下:
這個(gè)DTD完整地表述了一本圖書所包含的主要信息:題名及縮寫、一個(gè)或多個(gè)作者、索書號(hào)、出版社名字及出版時(shí)間、ISBN標(biāo)準(zhǔn)號(hào)、主題詞(關(guān)鍵字)、圖書條碼、中圖分類號(hào)。作者后面的“+’表示至少應(yīng)有一個(gè)作者,主題詞及關(guān)鍵字后的“?”表明可以省略,#PCDATA表示為字符串型。
由于圖書檢索系統(tǒng)與論文期刊檢索系統(tǒng)一般是獨(dú)立的,所以論文期刊的DTD也可另行設(shè)計(jì),實(shí)際上與圖書的DTD大同小異,但在元素設(shè)置上略有不同。期刊論文的檢索要素更多,以知網(wǎng)中國(guó)期刊全文數(shù)據(jù)庫(kù)檢索項(xiàng)為例,除了圖書的這些要素外,還包括關(guān)鍵詞、摘要、刊名、參考文獻(xiàn)、基金、ISSN等。
一個(gè)論文期刊的DTD可以設(shè)置為:
當(dāng)需要將圖書格式化輸出顯示在屏幕上時(shí),就要將XML文檔變換為HTML文檔,可采用XSLT將XML文檔格式化顯示。XSLT是擴(kuò)展樣式表轉(zhuǎn)換語(yǔ)言(Extensible Stylesheet Language Transformations)的簡(jiǎn)稱,這是一種對(duì)XML文檔進(jìn)行轉(zhuǎn)化的語(yǔ)言。
大部分軟件如FrameMaker、Microsoft Office中的MS Word、Excel等都支持XML,所以XML文件轉(zhuǎn)換為其他格式文件也相當(dāng)方便。
對(duì)于不同高校圖書館圖書要素定義不同的情況,或是圖書本身要素不全的情況,此格式擴(kuò)展非常方便。例如:若有出版時(shí)間這個(gè)要素,將其作為press的子元素date并標(biāo)記為可以省略,這樣有些圖書有出版時(shí)間這個(gè)要素,有些出版時(shí)間不明的則可以省略。在此DTD基礎(chǔ)上,可以加入其他各要素,方便管理及查詢。
相關(guān)圖書館間可構(gòu)建共享空間,將數(shù)字資源放于存儲(chǔ)資源層,用戶只需將電子設(shè)備連接至互聯(lián)網(wǎng),就可訪問和獲取所需的任何數(shù)據(jù)。在實(shí)現(xiàn)共享資源時(shí),會(huì)因?yàn)橹貜?fù)資源而浪費(fèi)大量存儲(chǔ)空間。DTD中有一項(xiàng)owner元素表明了此資源的擁有者,“+”表示至少有一個(gè)擁有者。
增加此元素后,若發(fā)現(xiàn)有重復(fù)資源,將資源擁有者都加入此表項(xiàng)后,重復(fù)資源即可刪除,為存儲(chǔ)更多其他資源做準(zhǔn)備。資源擁有者為各大高校圖書館,可以用各高??s寫或是更為簡(jiǎn)潔的標(biāo)號(hào)來表示。
隨著云計(jì)算技術(shù)的發(fā)展,云存儲(chǔ)模式下圖書館數(shù)字資源的建設(shè)成為當(dāng)今熱門討論話題。在云存儲(chǔ)模式中,當(dāng)用戶提交一個(gè)查詢請(qǐng)求時(shí),云存儲(chǔ)的管理系統(tǒng)將調(diào)用云中的所有服務(wù)器和存儲(chǔ)設(shè)備同時(shí)搜索眾多的數(shù)據(jù)庫(kù),然后將結(jié)果返回給用戶。另外,除了使用PC外,用戶還可以通過PDA、手機(jī)等終端方便、快捷地獲得云存儲(chǔ)中的相關(guān)信息和服務(wù),無需考慮使用的是哪個(gè)數(shù)據(jù)庫(kù)、哪個(gè)存儲(chǔ)設(shè)備。
而XML滿足了兩個(gè)基本的需求:將數(shù)據(jù)和表達(dá)形式分離;在不同的應(yīng)用之間傳輸數(shù)據(jù)。
基于XML的存儲(chǔ)方式能更好地幫助各高校實(shí)現(xiàn)共享資源,不僅方便大家交流和查找資料,而且能實(shí)現(xiàn)資源高效利用,減少資源浪費(fèi)現(xiàn)象。
[1]曾祥文.云存儲(chǔ)模式下圖書館數(shù)字資源建設(shè)[J].軟件導(dǎo)刊,2011(12):165-167.
[2]劉姝.對(duì)高校圖書館建設(shè)數(shù)字資源存儲(chǔ)系統(tǒng)的思考[J].大學(xué)圖書館學(xué)報(bào),2008(6):75-78.
[3]邵泳兵.基于XML的考試系統(tǒng)的設(shè)計(jì)[J].中國(guó)科技信息,2006(5):86-87.