解 凌 錢 進
淺談WebService技術在標準文獻信息系統(tǒng)中的應用
解 凌 錢 進
本文首先分析現(xiàn)有的標準文獻信息系統(tǒng)建設中不足,并指出了產(chǎn)生這些不足之處的根本原因。然后介紹XML和WebService這些新技術及其在標準文獻信息系統(tǒng)建設中應用。文章的最后介紹了現(xiàn)有的利用XML和WebService技術實現(xiàn)的標準文獻信息系統(tǒng)的應用,并提出了今后研究的方向。
標準文獻信息系統(tǒng) XML WebService
近年來,隨著社會各界對標準文獻需求范圍的不斷增加,以及需求頻率的不斷提升,各地方標準化機構希望能夠對外提供更便捷、更有效的標準文獻信息服務。同時,隨著信息技術,特別是網(wǎng)絡技術的高速發(fā)展和普及,一些地方標準化機構紛紛斥資建立起了規(guī)模不一的標準文獻信息服務系統(tǒng),在Internet上對外提供標準文獻信息,以滿足用戶對標準的需求。
通過建設標準文獻信息服務系統(tǒng)可以滿足用戶對標準的需求,但是隨之也產(chǎn)生了一些不足之處。第一,前期投入巨大。由于標準文獻信息資源很龐大,內(nèi)容也很豐富,因此標準文獻信息系統(tǒng)建設的前期投入相當大,建設周期一般也比較長,對需要投入的軟硬件設備的要求也比較高,很多中小地方的標準化機構沒有能力獲取完整的標準文獻資源,也沒有能力自行開發(fā)如此規(guī)模的信息系統(tǒng),造成他們無法通過信息化手段對外提供標準信息服務。第二,后續(xù)更新很難跟上。隨著社會不斷的進步與發(fā)展,各類標準也在不斷更新,標準文獻資源的信息量也不斷擴大。如果無法及時獲取到最新資源,那就無法向社會提供標準文獻信息服務。第三,資源重復建設。因為資源形式、站點風格等多方面的因素,每一個標準文獻信息服務網(wǎng)站在一定程度上都重復其他站點的資源建設,這種資源的重復建設不能不說也是一個弊端。
探究這些不足之處的原因,最根本的在于傳統(tǒng)的Web應用開發(fā)模式本身存在弊端。標準文獻信息資源很龐大,包括了國內(nèi)外數(shù)十個品種的題錄信息以及相關的電子全文信息,而且標準文獻信息系統(tǒng)的功能也比較豐富,包括題錄檢索、在線購買、電子全文在線閱讀與打印等。為了存儲大量的文獻資源,就必須配備大容量的存儲設備,并根據(jù)存儲情況不斷調(diào)整。另外,為了能夠實現(xiàn)標準文獻信息系統(tǒng)的功能,還必須配置相應的數(shù)據(jù)庫軟件(如Oracle、SQLServer等)和 WebServer軟件(如Weblogic、Websphere、IIS 等),同時還要配置相應數(shù)量和性能的服務器。以上這些軟硬件設備的費用以及開發(fā)相應系統(tǒng)的費用對于一些中小地方的標準化服務機構來說是一個不菲的數(shù)目。而且對于這些機構來說,由于系統(tǒng)的復雜性較高,系統(tǒng)的日常維護也是一項非常艱巨的工作。另外,傳統(tǒng)的Web應用各自采用的數(shù)據(jù)庫軟件和WebServer軟件的不同,使得各個系統(tǒng)之間無法進行資源共享和功能互補,致使資源重復建設。
新技術的產(chǎn)生總會給很多應用帶來新的啟發(fā)和思路,這一點在標準文獻信息系統(tǒng)中也不例外。那么現(xiàn)在到底有什么新的技術會對標準文獻信息系統(tǒng)產(chǎn)生重大的影響呢?答案是XML和Web Service。
2.1.1 XML的定義
XML是eXtensibleMarkupLanguage(可擴展標記語言)的縮寫,中文稱之為可擴展的置標語言,它是SGML(StandardGenericMarkupLanguage)的一個子集。WorldWideWebConsortium(W3C)的XML工作組于1998年2月完成了XML規(guī)范1.0版本的定義。
XML很容易讓人誤解為是HTML的擴展,其實不然,它雖然同HTML一樣是標記語言,但是它卻有著與HTML完全不同的機制,它比HTML的應用范圍要廣闊得多。HTML可以很好地表現(xiàn)一個內(nèi)容,但卻極度缺乏對內(nèi)容的表達能力。而這正是XML所擅長的地方。XML將內(nèi)容與表現(xiàn)形式分開,既可以很好地描述一個內(nèi)容,又可以借助于樣式單來格式化顯示內(nèi)容。比如下面的一個關于人員檔案的例子,用HTML寫為:
在這里,用戶通過瀏覽可以知道這個人的各個信息,而計算機卻根本無法知道標記<p>、<h1>所表示的內(nèi)容是什么。如果用XML,那么就可能如下所寫:
在這里,通過標記<姓名>、<地址>等就可以立即明白其表示的內(nèi)容。
2.1.2.XML的優(yōu)點
通過上面的例子可以看出,XML標記可以清晰地指明其表示的內(nèi)容,這使得精確的搜索成為可能。這是XML第一個優(yōu)點,其次在它的基礎上,自動化的UserAgent或者說智能的Web應用不再是奢望。比如想通過一個站點,自動定購一張在時間、價錢、機型都理想的機票,在XML結構下就非常容易。
XML是以文本的方式存在的,所以任何操作系統(tǒng)、任何數(shù)據(jù)庫構成的平臺,只要裝了XML解析器,都可以很簡單地訪問XML數(shù)據(jù)。借用勞虎在《無廢話XML》中所說“XML是非常理想的網(wǎng)際語言,它方便了各式各樣網(wǎng)絡器具間的信息交流”,如圖1所示。
圖1 XML是非常理想的網(wǎng)際語言,方便各式各樣網(wǎng)絡設備間的信息交流
XML已經(jīng)在很多領域如電子商務、數(shù)學符號描述、語音、矢量圖形、化學標記等都建立了專門的XML語言。
2.1.3 XML與標準文獻信息系統(tǒng)
標準文獻信息系統(tǒng)所暴露出的大部分弊病,最重要的原因就是沒有統(tǒng)一的資源描述方式。對于這一點,正是XML最大的優(yōu)勢所在。所以XML在標準文獻信息系統(tǒng)中最基本的就是用來描述各類資源。舉個例子來說明,比如在標準文獻信息系統(tǒng)中定義的一條標準文獻題錄數(shù)據(jù),用XML就可以表示為:
在用XML對各種資源進行描述之后,就可以利用XML的特性來開發(fā)和建設更智能化、綜合化的Web應用和標準文獻信息系統(tǒng)。比如下面的例子,A是一個提供標準文獻信息的網(wǎng)站,都以XML方式進行描述。用戶B想在網(wǎng)站A上查找有關計算機網(wǎng)絡的國內(nèi)標準,就可以通過“<標準信息>.<中文名稱>=計算機網(wǎng)絡 and<標準信息>.<文獻類型>=國內(nèi)標準”來進行非常精確的搜索了。
2.2.1 WebService的定義
WebService是一個很新的名詞,中文稱之為“Web服務”。WebService是一個Web上的組件編程模型,在這個模型中,各個應用都以服務(組件)的形式在Web上發(fā)布,然后遠程的應用程序可以通過一個統(tǒng)一的訪問方式(HTTP+SOAP)來調(diào)用這個服務,將其集成到本地的應用程序中。Web Service也是一個分布式計算模型,但是它打破了COBRA、DCOM及RMI的客戶與服務緊耦合的限制,比它們中的任何一種都更具優(yōu)勢。
2.2.2 WebService的優(yōu)點
WebService的優(yōu)點或者說優(yōu)勢有很多,下面就是最為重要的幾個。
· 首先就是它的松耦合性。也就是說,客戶或服務任何一方執(zhí)行機制的改變都不會影響應用程序的正常運行。
· 互操作性。任何Web服務都可以與其他Web服務進行交互。
· 集成性和簡單性。這里有兩點,第一可以使用任何語言(如 C、C++、VB、VC、JAVA,甚至COBOL)來編寫Web服務,開發(fā)者無需更改他們的開發(fā)環(huán)境就可生產(chǎn)和使用 Web服務。第二,已有的組件(如 COM、JavaBean)很容易被包裝成Web服務。
· 普遍性。Web服務使用HTTP和XML進行通信。因此,任何支持這些技術的設備都可以擁有和訪問 Web服務。不久,它們將在電話、汽車甚至汽水販賣機中出現(xiàn)。汽水供應不足嗎?沒問題,無線聯(lián)網(wǎng)的汽水販賣機可以與本地供應商的 Web服務聯(lián)系,訂購更多您喜愛的飲料。
· 行業(yè)支持。所有主要的供應商都支持SOAP和周邊Web服務技術。例如,微軟的 .NET平臺就基于Web服務,因此用VisualBasic編寫的組件很容易作為Web服務部署,并由使用IBMVisualAge編寫的Web服務使用,反之亦然。
2.2.3 WebService與標準文獻信息系統(tǒng)
如果用WebService來構建標準文獻信息系統(tǒng),會有什么樣的結果呢?我們先來看一個例子。圖2一共有四個網(wǎng)站,其中站點STD是標準文獻信息系統(tǒng)的入口站點,站點A、B、C都提供遠程標準信息服務。一個用戶登錄到STD,然后發(fā)送一個查詢標準的基本要求(步驟①),如標準中文名稱=計算機網(wǎng)絡、文獻類型=國內(nèi)標準等。STD根據(jù)用戶的要求自動到各個站點(站點A、B、C)上搜索符合要求的標準(步驟②、③),并通過匯總(步驟④)將最符合要求的標準信息返回給用戶(步驟⑤)。
圖2 多站點間的數(shù)據(jù)通訊
標準文獻題錄檢索可以通過WebService的形式在Internet上發(fā)布,那么類似的,標準文獻電子全文閱覽室、標準有效性查證等所有的標準文獻資源都可以以 WebService的形式在 Internet上發(fā)布,供其他的 Web應用程序(本地或遠程)進行調(diào)用。
新技術往往帶來很多新的應用,但這不是主要的。更為重要的是,新技術所帶來的一種概念,一個新型的開發(fā)模式。XML和WebService及其他一些技術(如CSCW)的產(chǎn)生和發(fā)展正是給標準文獻信息系統(tǒng)的建設開辟了一個新的思路和更廣闊的發(fā)展空間。
針對以往標準文獻信息系統(tǒng)建設中出現(xiàn)的問題,我們提出通過運用基于XML與SOAP(Simple ObjectAccessProtocol,簡單對象訪問協(xié)議)協(xié)議的WebService技術,利用數(shù)據(jù)庫、Internet等各種設備環(huán)境,運用各種技術手段,結合地方標準化服務機構的實際需求,實現(xiàn)了標準文獻題錄數(shù)據(jù)庫與標準文獻動態(tài)信息的遠程調(diào)用,標準文獻遠程有效性查證以及電子閱覽室,以實現(xiàn)標準文獻信息的異地實時共享查詢,滿足各地方標準化機構進一步充分、及時地向用戶提供標準文獻信息服務的需求,提升各地方的標準信息服務水平;同時,進一步提高上海市標準化研究院館藏標準文獻利用率。
系統(tǒng)的架構如圖3所示:
首先,在上海市標準化研究院的標準信息服務平臺中搭建一系列的數(shù)據(jù)交互接口,并將其部署在Web服務平臺中。然后,第三方終端網(wǎng)站通過調(diào)用這一系列的接口,就可對外提供標準文獻信息服務。與傳統(tǒng)的開發(fā)模式相比,第三方終端只需配備PC服務器即可,節(jié)省了前期投入,而且也易于維護,節(jié)省了人力物力。
3.2.1 常州市技術標準信息平臺(http://www.cztss.org)
常州市技術標準信息平臺是常州地區(qū)唯一面向社會提供標準化在線服務的專業(yè)網(wǎng)站,向國民經(jīng)濟管理部門、企業(yè)與消費者提供國內(nèi)外標準信息/文本傳遞,是常州標準化服務的權威網(wǎng)站。該平臺通過調(diào)用上海市標準化研究院標準信息服務平臺的標準文獻檢索接口,實現(xiàn)了異構網(wǎng)站的無縫對接,并在其網(wǎng)站上對外提供標準文獻題錄檢索、標準文獻電子閱覽室以及遠程標準有效性查證功能。網(wǎng)站收錄有完備的國際標準、國外先進標準、中國國家標準、行業(yè)標準等四十多萬條數(shù)據(jù)。網(wǎng)站全面覆蓋了標準化咨詢、標準化應用、標準化培訓等服務,能夠滿足各行各業(yè)對標準化的各種類型的服務需求。
3.2.2 上海研發(fā)公共服務平臺(http://www.sgst.cn)
上海研發(fā)公共服務平臺是運用信息、網(wǎng)絡等現(xiàn)代技術構建的開放的科技基礎設施和公共服務體系,由科學數(shù)據(jù)共享、科技文獻服務、儀器設施共用、資源條件保障、試驗基地協(xié)作、專業(yè)技術服務、行業(yè)檢測服務、技術轉移服務、創(chuàng)業(yè)孵化服務和管理決策支持十大系統(tǒng)組成。其中的科技文獻服務就包含標準文獻服務系統(tǒng),該系統(tǒng)通過遠程調(diào)用上海市標準化研究院標準文獻信息服務平臺的一系列接口,在線提供標準文獻題錄檢索、全文閱讀、購買、咨詢及有效性查證等一站式服務的服務系統(tǒng),通過系統(tǒng),研發(fā)平臺用戶可以在線瀏覽存放于上海市標準化研究院標準文獻信息服務平臺上的60余萬條信息,系統(tǒng)提供標準號、檢索詞、中國標準分類號、國際標準分類號、標準品種、采用標準等多種檢索途徑,幫助用戶尋找所需求的標準。
3.3 尚需進一步研究的問題
3.3.1 進一步完善網(wǎng)絡和系統(tǒng)基礎設施(如:網(wǎng)絡帶寬擴容以及網(wǎng)絡、服務器等設備增配等)
目前,該系統(tǒng)已投入使用。隨著今后使用面的不斷推廣,用戶數(shù)會逐漸增加,這樣勢必會對現(xiàn)有的硬件設備(服務器)、軟件設備(數(shù)據(jù)庫系統(tǒng)、Web Server)以及網(wǎng)絡設備帶來增加負荷。因此,建議今后能夠對現(xiàn)有的軟硬件設備以及網(wǎng)絡設備進行擴充,以滿足更多的用戶對標準文獻的需求。
3.3.2 進一步推廣分布式標準信息服務的應用領域
目前,標準化服務機構與一些大中型企業(yè)對標準文獻服務的需求越來越迫切,但由于受到一些條件的限制,他們無法去開發(fā)一套完整的標準文獻信息服務系統(tǒng)。因此,建議在標準化服務機構與一些大中型企業(yè)中推廣該應用,以滿足他們對標準文獻信息服務的需求。
3.3.3 不斷開拓分布式標準信息的服務功能,進一步完善分布式標準信息服務系統(tǒng)的性能
目前,該系統(tǒng)對外提供了標準文獻動態(tài)信息、標準文獻題錄檢索、標準有效性查證以及標注文獻電子閱覽室功能。隨著標準文獻對外服務模式的不斷完善與擴充,可以不斷拓展分布式標準信息服務系統(tǒng)的功能;同時,建議進一步完善分布式標準信息服務系統(tǒng)的性能,以滿足今后不斷增加的對外服務。
[1]勞虎.無廢話XML[EB/OL].[1999].http://wenku.baidu.com/view/26c2ff 610blc59eef8c7b4f4.html.
[2]柴曉路.架構WebService[EB/OL].[2001].http://www.cn.ibm.com/developerWorks.
[3]GrahamGlass.Web服務創(chuàng)新[EB/OL].[2000].http://www.cn.ibm.com/developerWorks.
[4]Microsoft.XML、Web服務和.NET框架[EB/OL].[2001].http://www.aspcool.com.
上海市標準化研究院)