張 艷,鄧琳瑩
(中國金融電子化公司,北京,100054)
統(tǒng)計數(shù)據和元數(shù)據交換(SDMX)標準是SDMX國際組織于2001年發(fā)起并提出的。SDMX組織由國際清算銀行(BIS)、歐盟統(tǒng)計局(Eurostat)、經濟合作與發(fā)展組織(OECD)、歐洲中央銀行(ECB)、國際貨幣基金組織(IMF)、聯(lián)合國(UN)和世界銀行(WB)七個國際組織聯(lián)合發(fā)起并建立,核心基礎是其制定發(fā)布的《統(tǒng)計數(shù)據和元數(shù)據交換標準》,用于數(shù)據收集與分發(fā),目的是提升國際組織和成員國之間統(tǒng)計數(shù)據和元數(shù)據的交換或共享的便利性及效率。
2001年9月,SDMX工作組在華盛頓成立,2003年發(fā)布SDMX標準V1.0,2005年國際標準化組織(ISO)將SDMX技術標準V1.0采標為ISO/TS 17369:2005。SDMX主辦方2005年發(fā)布了SDMX技術標準V2.0以及元數(shù)據常用詞匯表,詞匯表規(guī)范了元數(shù)據詞匯。2009年SDMX標準得到第39屆聯(lián)合國統(tǒng)計委員會大會認可和支持,SDMX標準被稱為“全球統(tǒng)計社區(qū)中的優(yōu)選標準”。2011年,SDMX國際組織發(fā)布了SDMX技術標準V2.1征求意見稿。2011年5月,第三次SDMX全球大會在華盛頓召開,為推動標準研究與應用推廣,SDMX國際組織成立了統(tǒng)計工作組(SWG)和技術工作組(TWG)。SDMX標準明確了統(tǒng)計人員在采集、處理和交換統(tǒng)計數(shù)據時所使用的統(tǒng)計概念和方法,規(guī)范了統(tǒng)計數(shù)據及元數(shù)據交換和共享的標準化格式。它一方面解決了一般性的統(tǒng)計問題,另一方面通過網絡服務達到了一種標準化的數(shù)據交互。
SDMX信息模型(SDMX-IM)是一個概念化的元模型,開發(fā)了語法的具體實現(xiàn)。該模型由一組功能包構成,這種構造形式有助于理解、重新使用和維護模型(見圖1)。另外,為了幫助理解,每個包都可以被認為是在三個概念層之一中:
(1)SDMX基礎層(SDMX Base layer)由結構定義層(Structural Definitions layer)和報告和分發(fā)層(Reporting and Dissemination layer)使用的基本塊組成。
(2)結構定義層由所需的支持數(shù)據和元數(shù)據報告和分發(fā)的結構化工具的定義組成。
(3)報告和分發(fā)層由用于報告和分發(fā)的數(shù)據和元數(shù)據容器的定義組成。
實際上,層沒有隱式或顯式的結構功能,因為任意包能使用其他包里的任何部分。
圖1 SDMX信息模型包結構
SDM X標準通過數(shù)據結構定義(DSD)來描述數(shù)據和元數(shù)據,其中,數(shù)據結構定義決定了維度(dimensions)、屬性(attributes)、代碼表(codelists)等描述數(shù)據結構的概念。比較類似的概念有元數(shù)據結構定義(MSD),該定義描述與元數(shù)據相關的觀測值(observation)、系列(series)、組別(group)、數(shù)據集等級(dataset levels)等。SDMX的數(shù)據交換方面有XML和EDI兩種,XML是更加通用的數(shù)據交換方式。
SDMX通過信息模型提供了對統(tǒng)計數(shù)據、結構化元數(shù)據和數(shù)據交換過程的模型化處理方式,同時定義了參考元數(shù)據。為成為能夠支持多個數(shù)據交換模型的技術標準,SDMX信息模型包含了大量正式的對象,包括行為(actor)、過程(process)和資源(resource)。
SDMX信息模型結構圖(見圖2)主要包括:數(shù)據結構定義、元數(shù)據結構定義、數(shù)據集、元數(shù)據集、數(shù)據供應方、提供協(xié)議等多主要元素,其概念如下:
(1)代碼表(Code list):枚舉維度、屬性和SDMX其他結構部分的表示形式中使用的一系列值。
(2)數(shù)據結構定義(DSD):數(shù)據結構定義(DSD)描述了數(shù)據集的結構,定義的一系列的概念。
(3)元數(shù)據結構定義(MSD):元數(shù)據結構定義描述了元數(shù)據集(包含參考元數(shù)據)的組織方式。
圖2 SDMX信息模型的主要元素
(4)數(shù)據集(data set):是固定的時間段中,相似或共用相同結構的數(shù)據的集合。
(5)元數(shù)據集(metadata set):是關于統(tǒng)計交換的SDMX視圖方面的信息集合。
上述元素中,代碼表可用于其他結構元數(shù)據的補充。數(shù)據結構定義(DSD)給每一個概念添加了附件屬性。元數(shù)據結構定義(MSD)確定了哪些元數(shù)據能夠進入數(shù)據交換、各概念之間的相互聯(lián)系、概念表述方式(用文本方式還是代碼方式),關聯(lián)方(代理機構、數(shù)據流、數(shù)據提供方、數(shù)據流子集等)對象類型等內容。數(shù)據集由時間序列、或者由許多與時間序列相關的數(shù)據構成。元數(shù)據集可描述數(shù)據或結構定義的維護方、數(shù)據發(fā)布的計劃安排、一段時間內單一類型數(shù)據流、數(shù)據質量等內容。
SDMX標準規(guī)定了統(tǒng)計人員在采集、處理和交換統(tǒng)計數(shù)據時所使用的統(tǒng)計概念和方法,規(guī)范了對外披露統(tǒng)計信息時統(tǒng)計數(shù)據的機構范圍、地理區(qū)域、存流量性質、時間屬性、頻度以及對外披露信息文件格式等內容。SDMX標準包括如下七部分:
(1)第一部分:框架。本部分規(guī)定了統(tǒng)計數(shù)據和元數(shù)據交換的框架結構、流程和業(yè)務范圍、SDMX信息模型、SDMX-EDI、SDMX-ML、一致性、對于SDMX標準的依賴性等內容。
(2)第二部分:信息模型UML概念設計。本部分規(guī)定了SDMX信息模型,包括SDMX基礎包、具體項目方案、關鍵字族、立方體、元數(shù)據結構定義、元數(shù)據集、層級編碼方案、結構集和映射、數(shù)據約束和供應等。
(3)第三部分:SDMX-ML模式和文檔。本部分主要是針對金融統(tǒng)計數(shù)據和元數(shù)據的交換和共享,分別描述了標準的背景、設計內容、非特定結構定義的通用模式、特定數(shù)據結構定義模式與元數(shù)據結構定義模式的XML規(guī)范性內容,并提供了XML方案和XML文件范例,幫助解答有關統(tǒng)計數(shù)據和元數(shù)據交換內模式和文檔的相關問題。
(4)第四部分:SDMX-EDI語法和文檔。本部分主要介紹了SDMX-EDI的使用方法、所有的UN/EDIFACT GESMES報文以及使用該報文滿足用戶特殊需求的方法,通過中心機構管理SDMX-EDI數(shù)據交換的過程。同時說明使用SDMX-EDI進行數(shù)據和元數(shù)據交換時主要是建立在統(tǒng)計結構定義、統(tǒng)計概念以及統(tǒng)計概念賦值的代碼列表基礎之上,使讀者及用戶在了解標準的同時理解統(tǒng)計數(shù)據和元數(shù)據交換內語法和文檔的使用方法。
(5)第五部分:注冊表、規(guī)范邏輯功能和邏輯接口。本部分基于SDMX信息模型定義了SDMX注冊機構應提供的基本服務:數(shù)據和元數(shù)據的注冊、數(shù)據和元數(shù)據的查詢、注冊機構相關信息的更新和訂閱,并且定義了SDMX注冊表的邏輯接口,以便于用戶選擇任何規(guī)定方式進行SDMX一致性注冊。
(6)第六部分:技術說明事項。本部分描述了數(shù)據結構定義和數(shù)據集,并通過圖表及用戶界面等形式解釋了SDMX信息模型及實現(xiàn),特別是SDMX-ML和SDMX-EDI格式之間互用性實現(xiàn)等技術內容。
(7)第七部分:Web服務指南。本部分規(guī)定了Web服務和SDMX-ML、SDMX Web服務的交換模式、WS-I符合性和大型數(shù)據和元數(shù)據集及其查詢。
SDMX起初是規(guī)范SDMX組織成員國數(shù)據交換的標準,隨著技術的不斷完善,各國應用SDMX的案例逐漸增多。除SDMX的七大發(fā)起組織成功實施SDMX標準以外,其他一些國際組織(如國際糧農組織、世界衛(wèi)生組織)以及部分國家的統(tǒng)計局和中央銀行也開始在統(tǒng)計系統(tǒng)中運用SDMX標準,技術應用涵蓋了勞動統(tǒng)計、教育統(tǒng)計、衛(wèi)生統(tǒng)計、國民賬戶、國際收支平衡表、農業(yè)生產統(tǒng)計、外部債務統(tǒng)計、金融統(tǒng)計、環(huán)境和多領域統(tǒng)計等多個統(tǒng)計領域。例如,在衛(wèi)生領域,世界衛(wèi)生組織構建了SDMX衛(wèi)生域(Health Domain)的定義,在集合數(shù)據系統(tǒng)中對指標定義和數(shù)據的交換做了規(guī)定,為SDMX標準在社區(qū)的應用提供了指導。除國際組織外,SDMX標準在一些國家也經過驗證并取得良好的應用實施效果,如圖3所示,地圖上標藍的國家已于2009年完成SDMX的實施,標紅的國家也于2009年后開始實現(xiàn)SDMX計劃,充分證明其在國際上具有廣泛的實施應用基礎和一定的優(yōu)越性。
圖3 SDMX標準全球實施情況
SDMX標準在國內的推廣和應用任重道遠。從2010年起,中國人民銀行成為SDMX國際組織統(tǒng)計工作組成員,跟蹤SDMX技術動態(tài),為SDMX標準的技術完善作出了相應貢獻。下一步,標準的實施應用應是工作的重點方向,對此應結合我國數(shù)據交換的基本情況,整合各方優(yōu)勢,借助SDMX國際組織、國內相關政府主管部門和相關技術組織的力量,加大對金融機構內部系統(tǒng)的標準化,優(yōu)化金融機構的數(shù)據披露模式,采取“整合資源,有序推進”的方式,逐步推進SDMX標準在我國的應用。從國際組織及有關國家實施SDMX的情況來看,我國實施SDMX應注意以下幾點:
(1)加大對標準的跟蹤及研究力度。SDMX作為目前國際間統(tǒng)計數(shù)據和元數(shù)據的交換標準,從開始制定到現(xiàn)在已歷時10年之久,雖已相對成熟,但隨著技術的進步和發(fā)展,仍處在不斷完善和維護過程中,特別是代碼表、數(shù)據元和元數(shù)據等內容隨著業(yè)務的變化而處在不斷的動態(tài)維護中,為此,必須積極跟蹤SDMX標準的發(fā)展動態(tài),同時要加大對SDMX標準、IT工具、數(shù)據倉庫、技術架構、內容導則等內容的研究力度。
(2)加大標準國際間交流合作。吸取國際組織和發(fā)達國家實施SDMX標準的經驗,可以更好地指導我國SDMX實施路線圖的構建,為此應積極參加SDMX組織的各項活動,增進與發(fā)起組織和已實施SDMX標準國家的交流合作,分享各組織和國家的實施經驗,探索在我國實施SDMX標準的解決方案,從而規(guī)范我國金融統(tǒng)計標準體系的內部處理和對外發(fā)布,提高信息共享的效率。
(3)加強統(tǒng)計業(yè)務與IT技術的協(xié)調。統(tǒng)計業(yè)務和IT技術的協(xié)調一致是實施SDMX標準的前提和基礎,統(tǒng)計業(yè)務需求為技術實現(xiàn)提供指導方向,而技術反過來促進業(yè)務的完善,二者同等重要,不可偏廢。為此,應加強統(tǒng)計業(yè)務與IT技術的協(xié)調,統(tǒng)計業(yè)務人員側重于SDMX信息模型的建立和SDMX的應用,而IT技術人員則重點在于統(tǒng)計數(shù)據和元數(shù)據的建模、數(shù)據管理系統(tǒng)的開發(fā)、數(shù)據交換格式的實施和處理,只有二者協(xié)調一致,才能提高SDMX實施的效率和質量。