張顯政,張華秋
基于元數(shù)據(jù)的檢察機(jī)關(guān)與政法部門信息共享方法研究*
張顯政,張華秋
(甘肅省人民檢察院網(wǎng)絡(luò)信息處,甘肅蘭州730000)
基于元數(shù)據(jù)的檢察機(jī)關(guān)與政法部門信息共享方法研究是分析檢察機(jī)關(guān)信息共享實(shí)際業(yè)務(wù),提出并建立基于檢察業(yè)務(wù)信息共享實(shí)際的元數(shù)據(jù)字典,在元數(shù)據(jù)字典的基礎(chǔ)上建立數(shù)據(jù)交換平臺(tái),對(duì)各單位提供交換數(shù)據(jù)進(jìn)行檢測(cè)、清洗、分類、入庫,對(duì)各單位交換請(qǐng)求進(jìn)行數(shù)據(jù)相應(yīng)。數(shù)據(jù)交換平臺(tái)負(fù)責(zé)對(duì)元數(shù)據(jù)進(jìn)行存儲(chǔ)、管理和共享,同時(shí)廣播發(fā)布交換數(shù)據(jù)格式,對(duì)各單位應(yīng)用系統(tǒng)提供信息資源共享接口。系統(tǒng)交換平臺(tái)根據(jù)各單位數(shù)據(jù)交換內(nèi)容定義各元數(shù)據(jù)實(shí)體,通過元數(shù)據(jù)實(shí)體提取中心庫的元數(shù)據(jù)信息,生成相應(yīng)交換數(shù)據(jù)包。為確保數(shù)據(jù)安全性,系統(tǒng)平臺(tái)對(duì)各交換數(shù)據(jù)包采用3DES加密算法進(jìn)行加密控制,防止系統(tǒng)數(shù)據(jù)泄密。
元數(shù)據(jù);信息共享;檢察信息;數(shù)據(jù)加密
隨著信息化的發(fā)展,政法機(jī)關(guān)各單位逐步建立起比較完善的辦案系統(tǒng);但是在不同單位之間存在信息交叉點(diǎn)、信息共享點(diǎn)和信息協(xié)同處理點(diǎn),由于各自建設(shè)的信息系統(tǒng)無法實(shí)現(xiàn)信息共享和交換,形成了各自信息孤島[1]。在此條件下,檢察機(jī)關(guān)對(duì)外信息共享的需求也日趨明顯,全國各檢察機(jī)關(guān)為此遇到了很多現(xiàn)實(shí)的問題和困難,如何解決檢察機(jī)關(guān)對(duì)外信息共享的需求,是檢察機(jī)關(guān)急需解決的問題。在此基礎(chǔ)上研究制定具有兼容性和實(shí)用性的對(duì)外信息共享方法,具有非常重要的意義。
基于元數(shù)據(jù)的檢察機(jī)關(guān)與政法部門信息共享通過檢察機(jī)關(guān)對(duì)外信息共享業(yè)務(wù)需求進(jìn)行定位、分析、研究,對(duì)檢察機(jī)關(guān)元數(shù)據(jù)和元數(shù)據(jù)元素進(jìn)行設(shè)計(jì),以滿足檢察機(jī)關(guān)與政法機(jī)關(guān)之間數(shù)據(jù)共享,同時(shí)結(jié)合現(xiàn)有成熟異構(gòu)數(shù)據(jù)信息共享方法,實(shí)現(xiàn)異構(gòu)數(shù)據(jù)間信息的存儲(chǔ)、管理和交換共享。
1.1元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范
檢察機(jī)關(guān)和政法部門信息共享的關(guān)鍵在于元數(shù)據(jù)標(biāo)準(zhǔn),特別是核心元數(shù)據(jù)的定義和擴(kuò)展。元數(shù)據(jù)即數(shù)據(jù)的數(shù)據(jù)元素,用以標(biāo)識(shí)、管理及維護(hù)共享交換的基本數(shù)據(jù)項(xiàng)[2]。元數(shù)據(jù)元素是在系統(tǒng)中定義一組說明在檢察機(jī)關(guān)和政法部門之間共享數(shù)據(jù)項(xiàng)的元數(shù)據(jù)元素,元數(shù)據(jù)元素在系統(tǒng)中具有唯一性,在本交換方法中元數(shù)據(jù)元素包含元數(shù)據(jù)的中文名稱、英文名稱、數(shù)據(jù)類型、取值范圍、短名、注解。在元數(shù)據(jù)元素定義規(guī)則的基礎(chǔ)上建立用于檢察機(jī)關(guān)和政法部門信息共享的元數(shù)據(jù),作為交換平臺(tái)的數(shù)據(jù)保障。
1.2檢察機(jī)關(guān)元數(shù)據(jù)擴(kuò)展原則和方法
檢察機(jī)關(guān)元數(shù)據(jù)隨著業(yè)務(wù)需求的增加進(jìn)行擴(kuò)展,通過元數(shù)據(jù)實(shí)體,擴(kuò)充元數(shù)據(jù)表,元數(shù)據(jù)的擴(kuò)展遵循元數(shù)據(jù)元素定義規(guī)則。當(dāng)元數(shù)據(jù)元素不能滿足元素?cái)U(kuò)展需要時(shí),系統(tǒng)將定義新的元數(shù)據(jù)代碼表,并自動(dòng)生成新的元數(shù)據(jù)實(shí)體,創(chuàng)建新的元素,默認(rèn)值域?yàn)椤白杂晌谋尽保瑫r(shí)通過對(duì)最大出現(xiàn)次數(shù)限制和取值范圍的定義,來實(shí)現(xiàn)對(duì)現(xiàn)有元數(shù)據(jù)可選性進(jìn)行嚴(yán)格限制。
檢察機(jī)關(guān)元數(shù)據(jù)擴(kuò)展原則:根據(jù)實(shí)際檢察業(yè)務(wù)與政法部門信息共享特點(diǎn),在確定共享元數(shù)據(jù)時(shí),充分考慮業(yè)務(wù)復(fù)雜度、數(shù)據(jù)權(quán)值,充分滿足數(shù)據(jù)共享、業(yè)務(wù)辦理、信息查詢。同時(shí)考慮業(yè)務(wù)數(shù)據(jù)的復(fù)雜性,可定義元數(shù)據(jù)實(shí)體為復(fù)合實(shí)體,即可將現(xiàn)有元數(shù)據(jù)實(shí)體作為新實(shí)體的組成部分,允許在元數(shù)據(jù)代表代替值域?yàn)樽杂晌谋镜默F(xiàn)有元數(shù)據(jù)元素值域。同時(shí)可對(duì)代碼表中參數(shù)的數(shù)量進(jìn)行增加,但擴(kuò)充后的代碼表需和擴(kuò)充前具有邏輯一致性。同時(shí)可對(duì)元數(shù)據(jù)元素取值范圍進(jìn)行縮小,對(duì)現(xiàn)有元數(shù)據(jù)的可選性和最大出現(xiàn)次數(shù)進(jìn)行嚴(yán)格限制。
1.3數(shù)據(jù)交換標(biāo)準(zhǔn)
檢察機(jī)關(guān)與政法部門間信息共享采用定義數(shù)據(jù)交換統(tǒng)一格式,實(shí)現(xiàn)部門間異構(gòu)數(shù)據(jù)交換和業(yè)務(wù)流程對(duì)接。通過數(shù)據(jù)對(duì)接平臺(tái),實(shí)現(xiàn)全量、增量數(shù)據(jù)在各個(gè)平臺(tái)之間的交換,數(shù)據(jù)對(duì)接平臺(tái)對(duì)各單位業(yè)務(wù)需求數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,清洗后數(shù)據(jù)按照平臺(tái)元數(shù)據(jù)格式進(jìn)行入庫,同時(shí)生成相應(yīng)系統(tǒng)接口及對(duì)應(yīng)實(shí)體。數(shù)據(jù)對(duì)接平臺(tái)支持XML、Excel、CSV、Txt、Access等,可實(shí)現(xiàn)各個(gè)應(yīng)用系統(tǒng)間的數(shù)據(jù)核查比對(duì)、數(shù)據(jù)挖掘及分析等[3]。交換時(shí)對(duì)文件名和核心字段數(shù)據(jù)進(jìn)行校驗(yàn),同時(shí)應(yīng)提供共享所需的元表結(jié)構(gòu),數(shù)據(jù)項(xiàng)順序應(yīng)保持一致。
檢察機(jī)關(guān)與政法部門信息共享中,可根據(jù)數(shù)據(jù)交換類型分為加載更新類、查詢檢索類、數(shù)據(jù)比對(duì)類、廣播通知類等[4]。其中加載更新類主要適用于XML、CSV和Access格式的交換數(shù)據(jù),由信息共享交換部門主動(dòng)向信息交換平臺(tái)發(fā)生數(shù)據(jù)更新操作。查詢檢索類適用于XML、CVS和Txt格式的交換數(shù)據(jù),數(shù)據(jù)交換由各共享單位主動(dòng)發(fā)起,信息交換平臺(tái)被動(dòng)響應(yīng),完成數(shù)據(jù)交換。廣播通知類適用于XML、Excel和Access格式的交換數(shù)據(jù),由信息交換中心主動(dòng)發(fā)起,檢索數(shù)據(jù)庫發(fā)現(xiàn)各應(yīng)用單位系統(tǒng),進(jìn)行數(shù)據(jù)廣播通知。
在系統(tǒng)交換平臺(tái)中,系統(tǒng)按照元數(shù)據(jù)標(biāo)準(zhǔn),對(duì)各交換數(shù)據(jù)包格式進(jìn)行檢測(cè),生成數(shù)據(jù)對(duì)比日志記錄,系統(tǒng)交換平臺(tái)根據(jù)記錄日志進(jìn)行響應(yīng)。對(duì)于符合數(shù)據(jù)格式的數(shù)據(jù)包進(jìn)行數(shù)據(jù)解析,完成數(shù)據(jù)清洗和入庫,同時(shí)對(duì)需要交換的數(shù)據(jù),根據(jù)元數(shù)據(jù)實(shí)體調(diào)用交換平臺(tái)中交換數(shù)據(jù),生成相應(yīng)數(shù)據(jù)格式文件,完成數(shù)據(jù)交換操作[4]。
檢察機(jī)關(guān)與政法部門間信息共享數(shù)據(jù)交換流程如下:
(1)首次加載時(shí),系統(tǒng)采用集中上傳加載方式,交換對(duì)象為系統(tǒng)數(shù)據(jù)交換標(biāo)準(zhǔn)規(guī)定的基本信息,系統(tǒng)交換平臺(tái)根據(jù)需要加載其他系統(tǒng)提供的全量信息,數(shù)據(jù)格式統(tǒng)一采用XML文件方式上傳。
(2)在首次加載后,系統(tǒng)平臺(tái)采用批量上傳方式加載,各單位系統(tǒng)根據(jù)業(yè)務(wù)變更,定時(shí)完成增量數(shù)據(jù)包的上傳,同時(shí)對(duì)增量數(shù)據(jù)包格式進(jìn)行定義,來約束和維護(hù)其他單位系統(tǒng)交換數(shù)據(jù)。
(3)在數(shù)據(jù)加載入庫時(shí),系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行檢測(cè),避免臟數(shù)據(jù)生成,檢測(cè)重復(fù)數(shù)據(jù)和格式錯(cuò)誤數(shù)據(jù)時(shí),系統(tǒng)自動(dòng)跳過該條數(shù)據(jù)的入庫,并進(jìn)行日志記錄。根據(jù)日志反饋信息,各單位系統(tǒng)對(duì)數(shù)據(jù)檢驗(yàn)校對(duì),修改后重新處理上傳。
交換文件數(shù)據(jù)結(jié)構(gòu)示意如下:
<?xmlversion=”1.0”encoding=”UTF-8”?>
<Package>
<Head>
<BBH>1.00</BBH>
...
</Head>
<Data>
<Record>
<XM>...</XM>
...
</Record>
...
</Data>
</package>
包體部分由數(shù)據(jù)包描述和交換數(shù)據(jù)組成[5]。包體部分的所有內(nèi)容放置在標(biāo)記<Package>...</package>之間;數(shù)據(jù)包描述中的所有內(nèi)容放置在標(biāo)記<Head>...</ Head>之間。所用的交換數(shù)據(jù)放置在標(biāo)記<Data>...</ Data>之間;每一條數(shù)據(jù)記錄放置在標(biāo)記<Record>...</ Record>之間;每一個(gè)交換數(shù)據(jù)項(xiàng)放置在該數(shù)據(jù)項(xiàng)的標(biāo)記之間,各數(shù)據(jù)項(xiàng)標(biāo)記符合本部分交換數(shù)據(jù)包數(shù)據(jù)項(xiàng)內(nèi)容所規(guī)定。交換數(shù)據(jù)由多條數(shù)據(jù)記錄組成,數(shù)據(jù)包頭描述部分包含版本號(hào)、單位代碼、單位名稱、記錄數(shù)、文件名等內(nèi)容。
基于元數(shù)據(jù)的檢察機(jī)關(guān)與政法部門信息共享通過采用構(gòu)建元數(shù)據(jù)字典方式,構(gòu)建自身的參考文獻(xiàn):
數(shù)據(jù)交換平臺(tái),一方面用于對(duì)各單位共享數(shù)據(jù)進(jìn)行清洗、分類、入庫,另一方面由系統(tǒng)定義元數(shù)據(jù)實(shí)體方式,生成個(gè)單位所需的交換數(shù)據(jù),從而在元數(shù)據(jù)層面完成異構(gòu)系統(tǒng)間數(shù)據(jù)的共享及訪問控制。各單位用戶向系統(tǒng)交換平臺(tái)發(fā)出請(qǐng)求后,交換平臺(tái)自動(dòng)進(jìn)行相應(yīng),對(duì)各單位請(qǐng)求信息進(jìn)行格式檢測(cè)和數(shù)據(jù)比對(duì),提取交換平臺(tái)元數(shù)據(jù),并將數(shù)據(jù)結(jié)果發(fā)送給用戶,完成數(shù)據(jù)交換。為確保數(shù)據(jù)安全性,系統(tǒng)平臺(tái)對(duì)各交換數(shù)據(jù)包采用3DES加密算法進(jìn)行加密控制,防止系統(tǒng)數(shù)據(jù)泄密。
[1]肖瓏,趙亮,馮項(xiàng)云,等.專門元數(shù)據(jù)規(guī)范設(shè)計(jì)指南[EB/ OL].[2010-03-05].http://cdls.nsd.gov.cn/cdls2/w3c/2003/ SpcMetadata/
[2]張曉林.元數(shù)據(jù)開發(fā)應(yīng)用的標(biāo)準(zhǔn)化框架[EB/OL].http:// 202.96.31.113/sztsg/POWERPIONT/zhangxiaolin/1.htm,2002-3-8.
[3]樊勝.C/S與B/S的結(jié)構(gòu)比較及web數(shù)據(jù)庫的訪問方式[J].情報(bào)科學(xué),2001,19(4).
[4]戴蓓潔,余雙,金蓓弘.基于DOM解析器的XML編輯器研究[J].計(jì)算機(jī)工程與設(shè)計(jì),200711,28(22):5334-5338.
[5]鄧子云.精通J2EE網(wǎng)絡(luò)編程[M].北京:清華大學(xué)出版社,2007.
TP393
A
10.3969/j.issn.1672-6375.2016.09.005
2016-5-10
最高人民檢察院2015年基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金課題“檢察機(jī)關(guān)與政法部門信息共享方法研究”,項(xiàng)目編號(hào):JBKY20150401。
張顯政(1983-),男,漢族,山東滕州人,研究生,主要從事檢察機(jī)關(guān)應(yīng)用系統(tǒng)的研發(fā)工作。