王昱元,趙懷鑫,張紹陽,宋文麗(.長安大學信息工程學院,陜西西安70064;.陜西省交通運輸廳綜合規(guī)劃處,陜西西安700;.西安興網(wǎng)通信科技有限公司,陜西西安70075)
交通運輸信息系統(tǒng)數(shù)據(jù)庫字段命名及屬性定義規(guī)范化研究
王昱元1,趙懷鑫2,張紹陽1,宋文麗3
(1.長安大學信息工程學院,陜西西安710064;2.陜西省交通運輸廳綜合規(guī)劃處,陜西西安710021;3.西安興網(wǎng)通信科技有限公司,陜西西安710075)
為促進交通運輸行業(yè)數(shù)據(jù)的共享交換,加強共享交換信息的可理解性和信息系統(tǒng)的可維護性,結(jié)合交通運輸行業(yè)信息化發(fā)展現(xiàn)狀,提出統(tǒng)一交通運輸信息系統(tǒng)數(shù)據(jù)庫字段命名方法以及屬性定義。在字段命名方面,考慮字段名的業(yè)務(wù)屬性、標準性及可理解性,給出了包括基本業(yè)務(wù)領(lǐng)域標識、引用標準類別標識和字段名縮寫等部分的字段命名規(guī)則,其中字段名縮寫采用中文名稱拼音縮寫和英文名稱縮寫兩種方法。在屬性定義方面,根據(jù)《交通信息基礎(chǔ)數(shù)據(jù)元》(JT/T 697—2013)中的數(shù)據(jù)屬性定義方法,對常見的5類數(shù)據(jù)庫管理系統(tǒng)的字段類型、格式及備注等屬性定義作了推薦。相關(guān)交通運輸信息化項目應(yīng)用表明,通過對字段名和屬性定義的規(guī)范,保證了數(shù)據(jù)交換和共享雙方的相互識別,提高了在標準符合性檢測方面的準確率。
交通運輸行業(yè);字段命名方法;字段屬性;數(shù)據(jù)共享交換;名稱縮寫
“十二五”期間,交通運輸信息化的主要目標是實現(xiàn)“從效率到效能、從分散到集約、從封閉到開放”的三個轉(zhuǎn)變,因此共享交換在避免重復(fù)建設(shè)、落實協(xié)同機制、實現(xiàn)資源共享等方面具有深遠的意義。從數(shù)據(jù)的交換和共享角度,規(guī)范的數(shù)據(jù)庫字段名在數(shù)據(jù)交換中是保證雙方相互識別的主要標識,同時,字段屬性在同一數(shù)據(jù)庫的統(tǒng)一定義也會給交換和共享帶來便利。
《交通信息基礎(chǔ)數(shù)據(jù)元》(JT/T 697—2013)[1]是交通運輸行業(yè)重要的數(shù)據(jù)標準,遵守ISO/IEC 11179—1的規(guī)定,在數(shù)據(jù)元的屬性中,給出了分類編號。該編號采用“字母+數(shù)字”分類序號的方式,但沒有字段名屬性。在字段名稱設(shè)計中,使用該數(shù)據(jù)元標準的中文名稱或分類編號存在很多弊端,不符合軟件開發(fā)習慣,通常開發(fā)人員傾向于使用自定義的字段名,這樣造成了數(shù)據(jù)字段和標準不對應(yīng)的問題;在屬性規(guī)定方面,《交通信息基礎(chǔ)數(shù)據(jù)元》出于統(tǒng)一數(shù)據(jù)屬性的目的對數(shù)據(jù)的類型、格式等屬性進行了規(guī)定,但為了避免特定數(shù)據(jù)庫管理系統(tǒng)的限制,規(guī)定的類型和格式使用通用的方法描述。然而在實際編程中參照標準進行數(shù)據(jù)庫字段設(shè)計時,由于數(shù)據(jù)庫系統(tǒng)不同、表達方式不同、編程階段不同等,開發(fā)人員存在理解差異,造成數(shù)據(jù)字段的屬性定義不統(tǒng)一,影響了標準的執(zhí)行效果。
目前,其他一些行業(yè)已不同程度地開展了數(shù)據(jù)庫字段命名及屬性定義方法的研究工作。如劉麗等[2]針對國土資源數(shù)據(jù)庫命名缺乏整體協(xié)調(diào)統(tǒng)一的問題,結(jié)合國土資源數(shù)據(jù)具有多業(yè)務(wù)、多時相、多領(lǐng)域、海量性等重要特征推薦了兩類命名規(guī)則:以行政區(qū)為基礎(chǔ)的命名規(guī)則和以標準圖幅為基礎(chǔ)的命名規(guī)則。這兩類規(guī)則皆采用三十位數(shù)字的編碼方法,使不同時間、不同業(yè)務(wù)、不同空間上的數(shù)據(jù)命名達到標準上的統(tǒng)一。張永波等[3]制訂了《中國地下水資源空間數(shù)據(jù)庫標準》,其中采用了“八位數(shù)字+字母”的圖元編碼方法對相關(guān)地下水資源數(shù)據(jù)進行統(tǒng)一規(guī)范,提高了全國地下水資源評價的效率與準確率。王霞等[4]提出了衛(wèi)生信息編碼標準代碼體系,對衛(wèi)生信息進行分類并加以編碼,該信息編碼標準遵循國際標準、國家標準和行業(yè)標準的原則,建立和制訂了適合、滿足行業(yè)需要的信息編碼體系和標準。
另外,一些通用的字段命名方法在各種數(shù)據(jù)庫管理系統(tǒng)以及編程語言中都得到了廣泛的應(yīng)用,如駝峰命名法、Pascal命名法、匈牙利命名法。Ora?cle推薦了字段名命名方法,其中規(guī)定英文單詞可以采用縮寫命名,單詞之間用下劃線連接,對于存儲特殊內(nèi)容的字段可以將具有特殊含義的單詞加在結(jié)尾;MYSQL也推薦了字段命名規(guī)則,規(guī)定表別名加單詞的方法,首字母小寫,后面單詞的首字母大寫。
現(xiàn)有數(shù)據(jù)庫字段命名方法及其混合方法雖然在眾多數(shù)據(jù)庫中可滿足編程人員的要求和習慣,但由于交通運輸行業(yè)的行業(yè)特點,并不能滿足或符合行業(yè)內(nèi)的數(shù)據(jù)共享與交換要求。而事實上當前交通運輸行業(yè)數(shù)據(jù)庫字段命名方法的不統(tǒng)一的確給數(shù)據(jù)共享和交換帶來諸多不便,為此本文將參考其他行業(yè)在字段名統(tǒng)一方面的成果,提出對交通類數(shù)據(jù)庫字段命名和數(shù)據(jù)屬性定義進行統(tǒng)一規(guī)定,并對主流數(shù)據(jù)庫中不同存儲對象的字段類型、格式和備注等屬性信息進行推薦,以期推動業(yè)界數(shù)據(jù)的共享與交換工作。
1.1 數(shù)據(jù)組織粒度
數(shù)據(jù)的產(chǎn)生可以分為以下兩種情況。第一種情況:產(chǎn)生自客觀事物信息的數(shù)據(jù)化。客觀事物信息的數(shù)據(jù)化過程就是將現(xiàn)實世界中的信息轉(zhuǎn)化為計算機中存儲數(shù)據(jù)的過程。第二種情況:從其他系統(tǒng)交換而來的數(shù)據(jù),屬信息的互聯(lián)互通,也是信息化發(fā)揮綜合效益的重要途徑??梢姡瑥钠渌到y(tǒng)交換數(shù)據(jù)是信息系統(tǒng)數(shù)據(jù)的重要來源之一。
信息有粒度,數(shù)據(jù)也是有粒度的。從數(shù)據(jù)的產(chǎn)生過程可知,客觀事物信息數(shù)據(jù)化時,即產(chǎn)生了單個的獨立數(shù)據(jù);同一類獨立數(shù)據(jù)的集合,形成數(shù)據(jù)組織的最原始單位,即數(shù)據(jù)項;對多個數(shù)據(jù)的有序組織,就形成了數(shù)據(jù)集。因此,從數(shù)據(jù)組織角度,可將數(shù)據(jù)分為三個粒度:獨立數(shù)據(jù)、數(shù)據(jù)項、數(shù)據(jù)集。
(1)獨立數(shù)據(jù)
獨立數(shù)據(jù)是指單個的、具體的客觀事物的屬性值。例如“張三”,該數(shù)據(jù)代表某個人的姓名。獨立數(shù)據(jù)具有數(shù)量龐大、分散的特點,不易管理。歸類是人類認識事物的一個基本方法。在數(shù)據(jù)管理中,一般也對數(shù)據(jù)進行歸類。
(2)數(shù)據(jù)項
數(shù)據(jù)項是對客觀事物某個屬性標識及其內(nèi)容的總稱,也稱為數(shù)據(jù)元素,可以理解為同一類數(shù)據(jù)的集合,數(shù)據(jù)項的定義即為該類數(shù)據(jù)的定義。例如,“姓名”代表了一個數(shù)據(jù)項,“張三”是該數(shù)據(jù)項的一個特定值,該值必須服從“姓名”數(shù)據(jù)項的定義。數(shù)據(jù)項將數(shù)據(jù)按類別進行有效組織,起到了提綱挈領(lǐng)的作用。數(shù)據(jù)項的定義包括類型、格式等,是計算機中對數(shù)據(jù)進行組織的最小單位。數(shù)據(jù)項的定義對獨立數(shù)據(jù)形成了約束。在關(guān)系型數(shù)據(jù)庫中,數(shù)據(jù)項與“字段”的定義相對應(yīng)。
(3)數(shù)據(jù)集
數(shù)據(jù)集是指有限數(shù)據(jù)項及其內(nèi)容的集合。在交換中,一般是以數(shù)據(jù)集的方式進行交換,數(shù)據(jù)集是交換數(shù)據(jù)的集合,可大可小。數(shù)據(jù)集的屬性包括其組織方式、內(nèi)容、表示方式等。
1.2 數(shù)據(jù)交換中的數(shù)據(jù)概念及其粒度
信息的價值是在交換中體現(xiàn)的。從前文可知,從其他系統(tǒng)交換數(shù)據(jù)是信息系統(tǒng)數(shù)據(jù)的一個重要來源。下面針對關(guān)系型數(shù)據(jù)庫之間的數(shù)據(jù)交換過程進行分析。
在關(guān)系型數(shù)據(jù)庫中,所有數(shù)據(jù)都存儲在關(guān)系(通常所說的二維表)中??陀^事物的同一特性的數(shù)據(jù)存儲在二維表的一個列中,該列稱為一個字段(或?qū)傩裕?,字段的概念與數(shù)據(jù)項的概念相對應(yīng)。每一行對應(yīng)著一個客觀事物對象,稱為記錄(或元組)。因此,在以關(guān)系型為主的數(shù)據(jù)存儲中,數(shù)據(jù)的標準化就是對關(guān)系表的字段(即列)定義的統(tǒng)一規(guī)定。
在交換過程中,單個數(shù)據(jù)是最基本的交換內(nèi)容。數(shù)據(jù)的組織可分為以下三個層次。
(1)第一層次:采用以“行”為主的組織方式。由于單個數(shù)據(jù)自身信息的不完整性,例如,數(shù)據(jù)庫A中的字段A112中存儲了人員的身高數(shù)據(jù),需要傳遞到目標數(shù)據(jù)庫中,但大多情況下僅傳遞身高數(shù)據(jù)到目標數(shù)據(jù)庫中是無意義的,目標數(shù)據(jù)庫不知道身高數(shù)據(jù)是誰的數(shù)據(jù)。因此,一般情況下,數(shù)據(jù)及其識別信息(數(shù)據(jù)表的主鍵)需要一起傳遞,如果將數(shù)據(jù)和其識別信息分離,在入庫時將增加復(fù)雜性。因此,交換數(shù)據(jù)集的數(shù)據(jù)結(jié)構(gòu)以“記錄”(一組相互關(guān)聯(lián)的數(shù)據(jù))為組織更為合理,便于數(shù)據(jù)的識別。
(2)第二層次:以相互獨立的交換單元容納多組關(guān)系數(shù)據(jù)。一個表的多條記錄能夠構(gòu)成一個內(nèi)部循環(huán)的交換單元,由于各個表的結(jié)構(gòu)不同,放在一起會增加數(shù)據(jù)解析的復(fù)雜性,因此,使多個單元相互獨立,在一個交換數(shù)據(jù)集中就可容納多個表的數(shù)據(jù)。
(3)第三層次:在交換數(shù)據(jù)集和交換單元中都增加描述信息,使數(shù)據(jù)集成為自描述的。這樣,在一個交換數(shù)據(jù)集便可自由地、完整地表示出包含多個數(shù)據(jù)關(guān)系(表)、多個屬性(字段)中任意數(shù)據(jù)(記錄)的一次交換。
關(guān)系型數(shù)據(jù)庫的交換數(shù)據(jù)集的數(shù)據(jù)結(jié)構(gòu)如圖1所示。
圖1所示模型體現(xiàn)了交換數(shù)據(jù)組織的相關(guān)性(相關(guān)數(shù)據(jù)使用“記錄”方式組織)、包容性(多個交換單元的數(shù)據(jù)共同交換)、靈活性(交換記錄的數(shù)量和內(nèi)容未受限定)、通用性(采用XML描述格式,適宜于異構(gòu)系統(tǒng)之間的交換),因此,該模型同樣也適用于其他的數(shù)據(jù)存儲方式。
可見,數(shù)據(jù)是以“記錄”為最小單元進行共享交換的,因此,從交換信息的可識別性的角度,數(shù)據(jù)字段屬性的統(tǒng)一規(guī)定具有重要的作用。
2.1 交通運輸數(shù)據(jù)庫字段名組成規(guī)則
字段名設(shè)計的目的是讓用戶能夠更好地理解該字段所包含數(shù)據(jù)的含義。字段名應(yīng)盡量采用自然語言的方式,但同時又要便于形式化處理。通俗來講,就是既要便于理解,又要簡潔。前綴和后綴可以提高字段名的可理解性,本文在設(shè)計字段名時選擇增加前綴的方式。在編程中,通常采用表名、字段類型等前綴進行表示。這些類型的前綴僅能提供字段本身的屬性,屬于編程層次的識別性問題。
圖1 通用的交換模型示意圖
交通行業(yè)業(yè)務(wù)領(lǐng)域眾多,因此通過對業(yè)務(wù)領(lǐng)域進行標識,使用者可以較容易地分辨該數(shù)據(jù)項所屬的業(yè)務(wù)領(lǐng)域,從而對數(shù)據(jù)項的范圍等相關(guān)信息進行了解。另外,通過標識,可以較好地解決字段名重復(fù)的問題。對業(yè)務(wù)領(lǐng)域按照系統(tǒng)或者子系統(tǒng)所在業(yè)務(wù)領(lǐng)域的大類進行劃分,可免除用戶對每個數(shù)據(jù)進行確認的繁瑣。
交通行業(yè)所頒布的標準眾多,僅僅交通運輸數(shù)據(jù)方面的標準已發(fā)布一百多項,隨著行業(yè)的發(fā)展將會產(chǎn)生更新、更多的標準。因此,通過對應(yīng)用標準類別標識,使用者可以了解到數(shù)據(jù)項所采用的標準,繼而進一步理解字段的含義。
本文提出的交通運輸數(shù)據(jù)庫字段名包含三個部分,如圖2所示。
圖2 交通運輸數(shù)據(jù)庫字段名組成規(guī)則
2.2 交通運輸業(yè)務(wù)領(lǐng)域的標識
2.2.1 基本業(yè)務(wù)領(lǐng)域的標識方法
在現(xiàn)有的交通信息化標準中,共有兩個標準對交通信息資源的業(yè)務(wù)領(lǐng)域進行了劃分。
《交通信息基礎(chǔ)數(shù)據(jù)元》(JT/T 697—2013)[1]對交通運輸業(yè)務(wù)領(lǐng)域進行了劃分,并對業(yè)務(wù)領(lǐng)域的代碼進行了簡寫,如表1所示。
表1 交通運輸業(yè)務(wù)領(lǐng)域及其字母代碼[1]
《公路水路交通信息資源業(yè)務(wù)分類》(JT/T 748—2009)[5]對交通運輸信息資源進行了分類,為資源目錄體系的建立提供參考,如表2所示。
表2 公路水路交通信息資源業(yè)務(wù)分類方法[5]
兩種分類方法在類別和代碼規(guī)定方面都有些區(qū)別。由于數(shù)據(jù)元在行業(yè)中認可度更高,所以本文數(shù)據(jù)庫字段采用JT/T 697—2013中的數(shù)據(jù)元分類方法來進行交通信息數(shù)據(jù)所在的業(yè)務(wù)領(lǐng)域的標識,即業(yè)務(wù)領(lǐng)域采用兩個字母進行標識,據(jù)此,可在數(shù)據(jù)字段中保留兩位業(yè)務(wù)領(lǐng)域的標識作為字段前綴。
2.2.2 自定義業(yè)務(wù)領(lǐng)域的標識方法
對于表1中未能覆蓋的交通運輸業(yè)務(wù)領(lǐng)域或具有特殊數(shù)據(jù)定義要求的系統(tǒng),用戶可采用自定義的兩位大寫字母進行標識。
自定義交通運輸業(yè)務(wù)領(lǐng)域標識編寫應(yīng)滿足如下要求:
(1)采用關(guān)鍵詞的漢語拼音縮寫;
(2)不與現(xiàn)有標識重復(fù)。
2.3 引用標準的類別標識
在交通運輸行業(yè)中,ITS標準化組織、全國集裝箱標準化技術(shù)委員會、全國智能運輸標準化技術(shù)委員會制訂了大量的國家標準,如《產(chǎn)品數(shù)據(jù)字典的維護規(guī)范》(GB/T 28040—2011)、《信息技術(shù)數(shù)據(jù)元的規(guī)范與標準化》(GB/T 18391—2001);交通運輸部信息通信及導(dǎo)航標準化技術(shù)委員會、交通運輸部航測標準化委員會等也制訂了大量的交通運輸行業(yè)標準,如《交通信息基礎(chǔ)數(shù)據(jù)元》(JT/T 697—2013)以及各業(yè)務(wù)領(lǐng)域的接口標準;除此以外,還有用戶引用的本地數(shù)據(jù)字段相關(guān)標準。
以上標準為交通運輸行業(yè)的發(fā)展奠定了良好的基礎(chǔ),因此本文擬將數(shù)據(jù)字段名的第三位作為標準的分類標識,用數(shù)字表示,具體意義如下:
0:國家標準;
1:交通運輸行業(yè)標準;
2:其他行業(yè)標準;
3:地方標準;
4:國際標準;
5:保留將來使用;
6:保留將來使用;
7:保留將來使用;
8:保留將來使用;
9:用戶自定義的數(shù)據(jù)字段。
2.4 字段中文/英文名稱縮寫方法
根據(jù)我國信息化行業(yè)習慣和國際發(fā)展趨勢,本文給出兩種交通運輸信息數(shù)據(jù)字段名稱縮寫方法:字段中文名稱拼音縮寫法和字段英文名稱縮寫法。
2.4.1 中文名稱拼音縮寫的字段命名方法
中文名稱縮寫,即將名稱中每個漢字拼音縮寫為其聲母的首字母,這些首字母順序組合形成該字段的縮寫,其中首字母全部采用大寫。例如:“船舶登記號”數(shù)據(jù)項名稱,其拼音首字母可以縮寫為:CBDJH。該數(shù)據(jù)項的業(yè)務(wù)領(lǐng)域為“船舶”,在JT/T 697.5中對該數(shù)據(jù)項進行了定義,則其字段可命名為CB1_CBDJH。
當字段名在一個數(shù)據(jù)表或者數(shù)據(jù)集中重復(fù)出現(xiàn)時,采用以下方法解決[6]。
(a)重復(fù)字段的中文名稱全拼不同。這種情況下可將后規(guī)定的中文名稱中不同字的全拼用小寫拼寫出來。例如:中文名稱為“加載船舶數(shù)量”和“減載船舶數(shù)量”的兩個字段,按照命名規(guī)則,它們的字段名都為:CB1_JZCBSL,但它們的中文全拼不完全相同,可將后面一個數(shù)據(jù)元命名為CB1_JianZCBSL。
(b)重復(fù)字段的中文名稱全拼完全相同。將重復(fù)的字段命名后面依次添加“_1”、“_2”等后綴。例如:“航行作業(yè)性質(zhì)”數(shù)據(jù)項,第一個的同名字段可命名為CB1_HXZYXZ_1,第二個的同名字段可命名為CB1_HXZYXZ_2。
2.4.2 英文名稱縮寫的字段命名方法
牛津字典給出的英文縮寫方法有如下幾種[]:
(1)壓縮是一種省略單詞中間字母的縮寫類型;
(2)縮略詞是一種省略單詞開頭或結(jié)尾的縮寫類型,有些情況下開頭與結(jié)尾皆省略;
(3)首字母縮略詞是一種保留單詞中最初發(fā)音字母的縮寫類型;
(4)縮略語是一種由單詞的首字母組成一個新單詞的縮寫類型,并且縮略語按照新單詞的拼寫發(fā)音。
《JCR收錄的英文刊名常用詞縮寫分析》給出下述縮寫規(guī)則[]:
(1)少于五個(含五個)字母的單詞一般不縮寫;
(2)單詞縮寫應(yīng)省略在輔音之后,元音之前;
(3)英文單詞縮寫一般以輔音結(jié)尾,而不以元音結(jié)尾,如American省略為Am,而不省略為Ame或Amer。
結(jié)合上述,參考《牛津字典》中的英文縮寫方法,以明確字段名含義、便于用戶理解數(shù)據(jù)所存儲內(nèi)容為目的,從易于編程實現(xiàn)的角度,本文建議選取單詞的第一個音節(jié)作為其縮寫,并總結(jié)出以下英文縮寫規(guī)則。
(1)字段英文名稱為單個單詞,直接用該單詞作為字段名。
(2)字段英文名稱為兩個及兩個以上單詞,則采用縮寫拼接法,即對每個單詞進行縮寫后拼接,每個縮寫單詞首字母大寫,其余字母小寫,縮寫單詞之間無分隔符。英文單詞的縮寫常用規(guī)則為:
①英文單詞縮寫一般規(guī)則為:省略在輔音之后,元音之前;
②英文單詞縮寫至少保留一個元音;
③英文單詞縮寫一般以輔音結(jié)尾,而不以元音結(jié)尾,如American省略為Am,而不省略為Ame或Amer;
④當單詞的第二個字母為元音時,省略在第二個元音之前,如Medicine或Medical縮寫為Med,European縮寫為Eur等;
⑤當遇到兩個相連的元音時,以第一個元音結(jié)尾,省略第二個,如Science,縮寫為Sci;
⑥英文名稱中的虛詞省略。
(3)當字段名縮寫出現(xiàn)重復(fù)時,全部拼寫英文名稱中的第一個單詞。如果仍然重復(fù),依次向后使用單詞的全部拼寫。所有單詞全部拼寫后仍然重復(fù)的情況下,可在縮寫的字段名后面依次添加“_1”、“_2”等后綴。
例如:機動車道最大寬度的英文推薦名是CK1_DrMW;機動車道最小寬度的英文推薦名是CK1_DrMinW。
3.1 字段類型和格式屬性推薦
理論上,用戶可以采用任何合法的數(shù)據(jù)類型和格式進行數(shù)據(jù)存儲。但為了方便共享交換,需對數(shù)據(jù)元標準規(guī)定的數(shù)據(jù)格式具有統(tǒng)一的理解,在字段類型和格式定義時,本文給出表3推薦的要求,對其他類型的用戶存儲要求未做規(guī)定,用戶可以自行設(shè)計。
表3 字段類型屬性推薦表[9-11]
表3 (續(xù))
3.2 字段備注屬性推薦
在各類數(shù)據(jù)庫的字段定義中,一般都有備注屬性。但在數(shù)據(jù)庫建立時,絕大部分設(shè)計人員都未對字段的備注屬性進行填寫,使得設(shè)計階段的信息難以傳遞到實現(xiàn)階段,造成代碼維護困難。本文建議在備注屬性中填入字段的中文描述、對應(yīng)標準項編號、值域、單位和備注等內(nèi)容。
備注屬性內(nèi)容的格式可表示為:
[{中文描述:××××××}][{標準項編號:××××××}] [{值域:××××××}][{單位:××××××}][{備注:××××××}]
其中:[]表示可選項內(nèi)容的分界符;{}表示不同內(nèi)容之間的分界符;××××××表示相應(yīng)部分的具體內(nèi)容,且不能是“{”、“}”、“:”;冒號(:)表示連接符,銜接備注屬性和其具體內(nèi)容。
示例:“{中文描述:船型標準標識}{值域:0,是;1,否}{備注:真假二值數(shù)據(jù)}”、“{中文描述:行政區(qū)域代碼}{備注:GB/T2260}”都是符合規(guī)則的備注字段格式。
“十二五”期間,某省交通運輸廳為提高本省公路水路交通運輸運行效能,促進其公路水路交通運輸又好又快發(fā)展,提出要大力推動交通運輸信息化建設(shè),充分利用現(xiàn)代信息技術(shù)手段,提升交通運輸運行管理、預(yù)警預(yù)控、應(yīng)急指揮、決策支持和信息服務(wù)能力,為此在全省范圍內(nèi)實施了交通信息化建設(shè)工程。在此過程中,以本文及其他相關(guān)內(nèi)容為主體的幾項標準正在進行編制和意見征求。為了提高工程的標準化程度,促進共享交換,該工程中運用本文主要研究成果對原有的部分設(shè)計進行了改進,舉例分析如下。表4是用戶以前自定義的數(shù)據(jù)字典樣例,表5是運用本文規(guī)則改進后的數(shù)據(jù)字典樣例。
表4 用戶自定義的數(shù)據(jù)庫字典部分內(nèi)容
表5 改進后的數(shù)據(jù)庫字典部分內(nèi)容
表5是按照本文所介紹的字段命名方法及屬性定義推薦給出了表4中的中英文字段名,從給出的字段名中,用戶可以很容易分辨出是否為標準字段。例如,表5中的“行政區(qū)域”和“歸屬單位”,其字段名以DY1開頭,說明其遵從《交通信息基礎(chǔ)數(shù)據(jù)元第7部分:道路運輸信息基礎(chǔ)數(shù)據(jù)元》(JT/T 697.7—2013)的規(guī)定,屬于標準字段,其數(shù)據(jù)類型和格式都按照標準規(guī)定進行定義;“經(jīng)度”、“緯度”采用《交通信息基礎(chǔ)數(shù)據(jù)元第10部分:交通統(tǒng)計信息基礎(chǔ)數(shù)據(jù)元》(JT/T 697.10—2013)的規(guī)定;其他字段名以DY9開頭,說明其屬于道路運輸領(lǐng)域,為用戶自定義的數(shù)據(jù)字段。這樣,在交換時,接收方可以分類進行處理。
另外,《交通信息基礎(chǔ)數(shù)據(jù)元》(JT/T 697—2013)中的數(shù)據(jù)屬性缺乏針對特定數(shù)據(jù)庫的規(guī)定,使得用戶對于標準規(guī)定難以執(zhí)行。例如,標準規(guī)定“經(jīng)度”的格式為an..14,在數(shù)據(jù)庫管理系統(tǒng)中有不同的實現(xiàn)方法,按照表3的規(guī)定,用戶則能夠準確地執(zhí)行標準。
在對數(shù)據(jù)字段和屬性改進之后,項目數(shù)據(jù)字典文檔與《交通運輸信息系統(tǒng)數(shù)據(jù)字典規(guī)范》的符合度達到100%,標準符合性檢測檢測率提高了20%,與交通信息數(shù)據(jù)元標準的符合程度提高了52%。
本文提出了兩種交通運輸信息系統(tǒng)數(shù)據(jù)庫字段命名方法及字段屬性推薦,首次統(tǒng)一規(guī)范了交通運輸數(shù)據(jù)庫字段的命名規(guī)則,便于存儲、交換、共享龐大的交通運輸數(shù)據(jù),便于數(shù)據(jù)元標準的引用,為信息的交換和共享奠定了良好的基礎(chǔ)。本文的主要內(nèi)容已編制成為相關(guān)標準并已報批。由于行業(yè)內(nèi)長期存在不統(tǒng)一的多種命名方法,本文的研究成果存在不能及時生效的問題,所以下一步將通過標準的宣貫培訓,加大宣傳力度,使標準能夠真正發(fā)揮作用,促進交通運輸信息系統(tǒng)數(shù)據(jù)庫構(gòu)建的合理發(fā)展。
[1]中華人民共和國交通運輸部.JT/T 697—2013交通信息基礎(chǔ)數(shù)據(jù)元[S].北京:人民交通出版社,2007.
[2]劉麗,岳建偉,戴家文.省級國土資源數(shù)據(jù)中心數(shù)據(jù)庫命名規(guī)則研究[J].地理信息世界,2010(3):2-5.
[3]張永波,梁國玲,張禮中,等.中國地下水資源空間數(shù)據(jù)庫標準化研究[J].地球?qū)W報,2003,24(4):1-4.
[4]王霞,徐勇勇,劉丹紅.我國衛(wèi)生信息編碼標準化可利用的標準代碼體系[J].中國衛(wèi)生質(zhì)量管理,2005,12(6):1-5.
[5]中華人民共和國交通運輸部.JT/T 748—2009公路水路交通信息資源業(yè)務(wù)分類[S].北京:人民交通出版社,2009.
[6]施曉林.數(shù)據(jù)庫設(shè)計中的重復(fù)字段和冗余字段[J].軟件技術(shù)研究,2006(11):1-2.
[7]皮爾素.牛津英語詞典[M].上海:上海外語教育出版社,2001.
[8]羅承麗.JCR收錄的英文刊名常用詞縮寫分析[J].編輯學報,2006,18(2):1-3.
[9]明日科技.Oracle從入門到精通[M].北京:清華大學出版社,2012.
[10]賀特克.SQL Server2008從入門到精通[M].北京:清華大學出版社,2011.
[11]辛運幃.Java語言程序設(shè)計[M].北京:人民郵電出版社,2009.
Specification for Field Naming and Attribute Definition of Database for Traffic&Transportation Information System
WANG Yu-yuan1,ZHAO Huai-xin2,ZHANG Shao-yang1,SONG Wen-li3
(1.School of Information Engineering,Chang′an University,Xi′an 710064,China; 2.Comprehensive Planning Office of Shaanxi Provincal Transport Department,Xi′an 710021,China; 3.Xingwang Communication Technology Co.,Ltd.,Xi′an 710075,China)
In order to promote the quality of data sharing and exchanging in traffic&transportation industry,and to enhance the comprehensibility of information and maintainability of information system, the method which unified field naming and attribute definition of database was developed,combining with the current situation of traffic&transportation informatization.In field naming,considering the service attribute,standardization and comprehensibility of field name,the field naming rule was introduced, which consisted of the identifier of basic service field,the category identifier of quoted standard and the abbreviation of field name.The field name was abbreviated from Chinese name or English name.In attribute definition,some attributes such as the type,format and memo etc.of filed in 5 common database management systems were recommended,according to the definition method of data attribute in"Basic Data Element of Transportation Information".The application in projects of traffic&transportation informatization indicated that it not only ensures mutual recognition in data sharing and exchanging,but also increases the accuracy of standard conformance test by using the developed method.
traffic&transportation industry;field naming;field attribute;data sharing and ex?change;name abbreviation
U-9
B
2095-9931(2015)03-0089-08
10.16503/j.cnki.2095-9931.2015.03.016
2015-03-13
交通運輸科技項目(2012364223500)
王昱元(1990—),女,新疆烏魯木齊人,碩士研究生,研究方向為交通信息工程。
E-mail:844719819@qq.com。