謝玳英 胡京華
摘要介紹了當前網格技術發(fā)展狀況與網格體系結構的框架組成,以及綜述了網格技術當前應用狀況,提出了介紹校園網絡資源整合的方案。
關鍵詞 網格,資源整合,WS-資源
中圖分類號:TP393文件標識碼:A 文章編號:1671-489X(2007)02-0063-04
Researching on Framework of Grid Technology and Application Statement //Xie Daiying , Hu Jinghua
Abstract In this paper, the author analysesthe grid technology development and framework form of system structure, also discusses the current situation and brings forward the scheme ofcampus resources integration.
key words grid; resource integration; WS-resource
Author's address Capital Normal University, Beijing 100037
1網格技術
網格技術是近年來興起的一個信息技術研究領域,它是基于internet分布式計算技術長期發(fā)展的必然結果。網格技術的研究目標是改變當前互聯網資源利用率極低的狀況,將網絡上的各種可利用資源有效整合起來,從而提供強大的計算、存儲和信息服務功能。
2Web Service資源框架(WSRF)與Globus ToolKit網格開發(fā)工具
2.1 Web Service資源框架(WSRF)
要了解WSRF,首先得了解網格體系結構,所謂網格體系結構,就是關于如何建造網格的技術。它給出了網格的基本組成與功能,描述了網格各組成部分的關系以及它們集成的方法或方式,刻畫了支持網格有效運轉的機制。目前,網格體系結構發(fā)展經過了五層沙漏結構、OGSA體系結構(Open GridServices Architecture)兩種體系。
2.1.1五層沙漏模型
五層沙漏結構最重要的思想是以"協議"為中心,十分強調服務與應用編程接口(API)和軟件開發(fā)工具包(SDK)的重要性。在五層沙漏結構中,共享的概念不僅僅是交換文件,而是更強調對計算機、軟件、數據以及其他資源的直接訪問。五層沙漏模型自上而下分別為應用層、匯聚層、資源層、連接層和構造層。
2.1.2 OGSA體系結構
五層沙漏結構雖然簡單,但人們在研究中發(fā)現,在許多情況下,復雜的服務或應用很難分解為標準而低級的基本協議,而且人們在解決問題時也不習慣于按照協議的方式來進行。鑒于五層沙漏結構的不足,Ian Foster等人結合Web服務技術提出了一種新的網格體系結構--開放網格服務體系結構。
開放網格服務體系結構的思想一切都抽象為服務,包括計算機、程序、數據和儀器設備等。這種觀念有利于通過統一的標準接口來管理和使用網格。Web服務提供了一種基于服務的框架結構。但是,Web服務面對的一般都是永久性服務,而在網格應用環(huán)境中,大量的是臨時性的短暫服務??紤]到網格環(huán)境的具體特點,OGSA在原來的Web服務概念的基礎上,提出了“網格服務”(Grid Service)的概念,用于解決與臨時服務發(fā)現、動態(tài)服務創(chuàng)建以及服務生命周期管理等問題。基于網格服務的概念,OGSA將整個網格看作是"網格服務"的集合,但是這個集合不是一成不變的,而是可以擴展的,這反映了網格的動態(tài)特性。
OGSA是一個抽象的東西,是一個框架。由它提出了一個基于OGSA發(fā)展的核心規(guī)范OGSI(Open Grid Services Infranstucture),它是對OGSA的主要方面具體化、規(guī)范化。OGSI規(guī)定了向網格發(fā)送處理請求時所使用的接口,相當于Web 服務中的WSDL,在網格計算相關標準中處于核心地位。OGSI規(guī)范通過擴展Web服務的問題。
2.1.3 Web服務資源框架WSRF
同五層沙漏結構一樣,OGSI體系規(guī)范也有自己的不足,主要表現在如下方面:
1)由于OGSI單個規(guī)范中的內容太多,所有接口和操作都與服務數據有關,缺乏通用性,而且OGSI規(guī)范沒有對資源和服務進行區(qū)分;
2)不能與現存的Web服務和XML工具很好地工作;
3)太多的面向對象,OGSI通過封裝資源的狀態(tài),將具有狀態(tài)的資源建模為Web服務,這種做法引起了"web服務沒有狀態(tài)和實例"的爭議,同時某些Web服務的實現不能適應網格服務的動態(tài)創(chuàng)建和銷毀;
4)網格服務的定義語言GWSDL不能作為可支持Web服務描述語言WSDL1.1的功能擴展。
要理解 WSRF ,還要必須理解 Web 服務,并以標準的形式給出一種狀態(tài)。 Web 服務是一個軟件組件,它可以支持機器到機器的交互,具有使用機器適用的格式(WSDL)描述的網絡地址接口。服務交互是使用 SOAP 消息描述的,通常由使用傳輸層協議(例如 HTTP 或其他 Web 標準)的 XML 序列化組成。從表面上看,Web Service就是一個應用程序向外界暴露出一個能夠通過Web進行調用的API。這就是說,你能夠用編程的方法通過Web調用來實現某個功能的應用程序。從本質層次來講,Web服務是放置于Web站點上的可重用構件。Web服務可以分散于互聯網上的各個地方,通過相互調用來協同完成特定任務。因此,Web Service表現的優(yōu)勢如下:
1)通過防火墻進行通信。因為Web Service的通信協議SOAP是基于http的,現有的防火墻都為http開了通道;
2)應用程序的集成;
3)B2B的集成,實現了客戶邏輯業(yè)務和企業(yè)業(yè)務的集成;
4)組件與數據重用。因為Web Service的實現模式決定了在客戶端的表示層上必須實現界面操作的重用。除此之外,在業(yè)務數據層上也可以實現數據庫的共享;
但是,隨著網格計算理論的提出和成型,Web Service也存在自身的不足,Web service只能提供基于http的應用服務,不能提供諸如網格計算之類的服務,更不用說是多元化的個性服務需求;Web service面對的一般都是永久服務,而在網格應用環(huán)境中,大量的是臨時性的短暫服務。另一方面,Web服務接口不能提供服務與使用服務的客戶之間進行某些隱含的保持狀態(tài)的交互。
因此,為了實現網格與Web服務的有效融合,2004年由IBM、Globus聯盟和HP共同提出Web服務資源框架(WS-Resouce Framwork,WSRF)和Web服務通知規(guī)范。WSRF實現了網格與Web 服務的融合,它既可以充分利用已有的Web服務領域的各種成果,又吸納了網格技術,可以支持網格的需求,為網格和Web領域的發(fā)展建立了一個共同的基礎。WSRF是和OGSI同一個層次的東西,是吸收了Web Service最新成果后,對OGSI的重構和發(fā)展。
WSRF采用了與OGSA中的網格服務完全不同的定義:資源是有狀態(tài)的,服務是無狀態(tài)的,它把有狀態(tài)的實體統稱有狀態(tài)資源,有狀態(tài)資源就具有特定生命周期和一組狀態(tài)數據,可被一個或多個 Web 服務訪問。有狀態(tài)資源是任何即使您不與之交互也存在的東西,比如文件、數據庫,或者某個具體的實體。生命周期是指資源從創(chuàng)建到消除這段時間。狀態(tài)數據用 XML 文檔來描述,通過對 XML 文檔操作來對有狀態(tài)資源的狀態(tài)進行設置。
WSRF使用了不同的結構來模型化有狀態(tài)資源和相應的Web 服務,而OGSI則是采用同一種結構來模型化狀態(tài)資源以作為一個Web服務進行表示。在這一點上,WSRF比OGSI更具有表達力,因為它允許Web服務和任何相關聯的有狀態(tài)資源之間可以形成多對多的映射,而OGSI只能形成一對一的映射關系。另外,在OGSI中能表達的模式在WSRF中也都可以表達。
2.2網格開發(fā)工具--Globus Toolkit
Gloubus Toolkit(簡稱GT)是由Globus聯盟(The Globus Alliance)開發(fā)實現網格的一組工具。Globus目前的主要工作是建立支持網格計算的通用協議,開發(fā)支持網格計算的服務,實現支持網格計算環(huán)境的軟件開發(fā)工具。
Globus系統的主要組成部分有:
1)網格安全基礎設施(GSI),負責在廣域網絡下的安全認證和加密通信,提供單點登錄功能、遠地身份鑒別功能、數據傳輸加密功能等,提供了基于GSI協議的接口,是保證網格計算安全性的核心部分。
2) Globus資源分配管理(GRAM),負責遠程應用的資源請求處理、遠程任務調度處理、遠程任務管理等工作,負責對資源描述語言信息的解析和處理工作,是網格計算環(huán)境中的任務執(zhí)行中心。
3)元計算目錄服務(MDS),主要完成對網格計算環(huán)境中信息的發(fā)現、注冊、查詢、修改等工作,提供對網格計算環(huán)境的一個真實、實時的動態(tài)反應,是網格計算環(huán)境中的信息服務中心。
4)全局二級存儲服務(GASS),簡化在Globus環(huán)境中應用程序對遠程文件I/O的操作,使得使用UNIX和標準C語言I/O庫的應用程序基本不用改動就可以在Globus環(huán)境中中興,是一個支持網格計算環(huán)境遠程I/O訪問的中間件。
5)網格FTP服務,是一個高性能、安全、可靠的數據傳輸協議,并對高帶寬的廣域網絡環(huán)境進行了優(yōu)化,是網格計算環(huán)境中的數據傳輸工具。
6)Globus復制管理,將部分相關數據只能放置在距離科學應用程序最近的位置,使得科學應用程序可以快速的對數據進行訪問。
當前,GT版本已經發(fā)展到了4.0版。
3 網格技術的應用狀況
3.1國外發(fā)展現狀
在世界范圍內,網格計算正處于飛速發(fā)展時期。在美國由自然科學基金資助的PACI(Partnership for Advanced Computational Infrastructure)項目,包括兩個重要的部分:NCSA(National Computational Science Alliance)和NPACI(National Partnership for advanced Computational Infrastructure)。這一項目通過將學術界、政府部門和工業(yè)界的力量結合起來,建立一個網格計算基礎設施的伙伴聯盟,來促進科學發(fā)現和工程研究的發(fā)展。美國的NASA(National Aeronautics and Space Administration)正在構造一個網格計算實驗床,稱為IPG(Information Power Grid)[16],它可以將NASA分布在各地的資源通過網絡(包括無線通信手段)連接起來,解決NASA目前無法解決的科學與工程。
遠程分布式計算與通信項目的目標是創(chuàng)建一個用于訪問美國能源部三個武器實驗室的具有可操作性的格網,以支持國防計劃中遠程計算和分布式計算這兩個關鍵戰(zhàn)略領域復雜的分析、設計、制造、認證功能。
地球系統格網(Earth System Grid II,ESG)項目由阿貢國家實驗室(Argonne National Laboratory)等五個國家實驗室的科學家聯合承擔。主要目標是解決從全球地球系統模型分析和發(fā)現知識所面臨的巨大挑戰(zhàn),為下一代氣候研究提供一個無縫的強大的虛擬協同環(huán)境。
此外,目前美國正在進行的格網計算研發(fā)項目還包括Globus、美國航空航天局(NASA)的信息動力格網(Information Power Grid,IPG)、美國國家技術格網(National Technology Grid)、虛擬實驗室項目(Virtual Laboratory Project)、天體物理仿真合作實驗室(Astrophysics Simulation Collaboratory,ASC)、國際虛擬數據格網實驗室(International Virtual Data Grid Laboratory,iVDGL)等。
3.2國內發(fā)展現狀
在國內,網格計算正處于快速發(fā)展時期,主要大事有:
1999~2001年,在教育部支持下,李三立院士帶領清華大學網格研究組進行了先進計算基礎設施ACI(Advanced Computational Infrastructure)的研究。ACI將分布于北京和上海的兩臺自主研制的超級計算機連接成為聚合計個計算型的網格應用系統,取得了一系列研究成果。計算所在國家高性能計算環(huán)境之后,推出了"服務網格(Service Grid)"概念,并把其網格研究統稱為"織女星網格(Vega Grid)"。其目標是使同一個平臺同時具備以下幾種能力:大規(guī)模的數據處理能力、高性能計算能力、資源共享和提高資源利用率的能力。
2002年4月5日~6日,科技部召開了“網格戰(zhàn)略研討會”,確認將網格的研究和應用列為“863計劃”的一個專項,隨即成立了專項專家組,錢德沛教授擔任專家組組長。863網格專項投資高達3億元,主要任務是研制面向網格的萬億次級高性能計算機、具有數萬億次聚合計算能力的高性能計算環(huán)境;開發(fā)具有自主知識產權的網格軟件;建設科學研究、經濟建設、社會發(fā)展和國防建設急需的重要應用網格;制定若干與網格相關的國家標準,參與制定國際標準,使一批發(fā)明專利和軟件獲得受理和登記,形成自主知識產權。這次研討會標志著由863支持的”中國國家網格“ (China National Grid,簡稱CNGrid)專項正式啟動。CNGrid將在全國設立多個網格結點,己經放置在北京中科院計算機網絡信息中心的聯想深騰6800速度達到4萬億次,即將落戶上海超級計算中心的曙光4000A速度將達10萬億次。
4 網格技術在教育行業(yè)中的應用
美國典型的大學網格項目主要包括威斯康星大學麥迪遜分校的Condor、弗杰尼亞大學的Legion、田納西大學的可伸縮的校園內部研究格網(Scalable Intracampus Research Grid,SinRG)和賓夕法尼亞大學網格。Condor項目的目標是開發(fā)支持高吞吐量計算的分布式計算資源的收集機制和工作負荷管理系統;Legion可以把不同體系結構、不同操作系統和不同物理位置的計算機資源連接成為一個系統;SinRG則用于田納西大學Knoxville校區(qū)內部的醫(yī)學圖像處理、交互式分子設計、高級機械設計等跨學科研究領域的校園高性能計算基礎設施。年8月,設在愛丁堡大學的“英國國家e-科學中心”成立,該中心將協調英國全國以及國際網格技術工作,使上網的計算機能合力進行復雜的科學運算。
現在很多科研和教學都需要用到各個大學的資源,如果沒有網格的話,勢必很難實現。網格計劃使這些資源可以隨意地集成和共享?;趯W格計算重要性的認識,2003年4月,國家教育部啟動了一項構建下一代國家教育領域分布式計算平臺計劃——中國教育網格計劃(ChinaGrid),為各所大學的科研和教學服務。中國教育科研網格是迄今為止由政府推出的最宏大的網格工程,該項目由12所大學聯合推出。國家教育部希望利用網格技術將網上的教育資源有效地聚合起來,實現網上教育資源的廣泛共享,為中國高等院校(特別是部分研究型大學)的科學研究提供先進的計算手段。
中國教育網格將在未來連接中國的100所重點高校,據初步分析,教育網格的建設將分三期工程,教育網格建設的具體時間表如下:2003年完成15個節(jié)點(即15所高校),2004年完成35個節(jié)點,2005年完成50個節(jié)點,2010年完成100個節(jié)點。目前,第一期工程的規(guī)劃已經做完,首批入選的12所院校已開始構建各自的高性能計算平臺。教育部計劃投資1.3億元,首期2500萬元,計算平臺采用英特爾奔騰2處理器,建成后可以實現每秒15~20萬億次計算能力,成為全球性能最高的網格計算平臺之一。
中國教育科研網格將大大簡化學生與研究人員共享全國教育與計算資源的方式,應用領域包括從生命科學、圖象處理到遠程教育等眾多領域,從而發(fā)揮國內高校優(yōu)秀教育科研資源的共享,大大節(jié)省投資。
5 總結
作為下一代Internet的關鍵技術,網格技術可以消除信息孤島和知識孤島,實現信息資源的智能共享,是目前對資源共享問題的較好的解決方案。在網絡環(huán)境下建立網格平臺,實現校園網內資源整合,對學校的信息化、數字化起到積極的促進作用。網格技術作為一種新技術,也在不斷成熟中,它在未來網絡中的應用前景,值得繼續(xù)研究。