張磊 徐寧 李新艷 周培瑩
(江蘇省衛(wèi)生健康發(fā)展研究中心 江蘇省南京市 210036)
目前,網(wǎng)絡(luò)與人們的工作、生活息息相關(guān),因此人們需要借助網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行管理,以便使用數(shù)據(jù)來(lái)滿足自身各方面的需求,但隨著網(wǎng)絡(luò)的普及與應(yīng)用的不斷深化,網(wǎng)絡(luò)環(huán)境中的數(shù)據(jù)量級(jí)龐大,且增長(zhǎng)速度極快,導(dǎo)致傳統(tǒng)數(shù)據(jù)管理方法不適用,因此為了在新時(shí)代下做好數(shù)據(jù)管理工作,需要重新選擇數(shù)據(jù)管理方法,原有技術(shù)手段亟待更新。在這一情況下,多項(xiàng)計(jì)算機(jī)數(shù)據(jù)庫(kù)技術(shù)應(yīng)運(yùn)而出,從中擇優(yōu)而選,再圍繞技術(shù)進(jìn)行數(shù)據(jù)庫(kù)設(shè)計(jì),即可解決當(dāng)下難題,因此有必要展開相關(guān)研究。
數(shù)據(jù)管理的前提是得到相關(guān)數(shù)據(jù),因此需要進(jìn)行數(shù)據(jù)采集工作。但在新時(shí)代下,隨著網(wǎng)絡(luò)在工作中的不斷深入、普及,需要采集的數(shù)據(jù)項(xiàng)目飛速增長(zhǎng),且數(shù)據(jù)更新頻率也有大幅提升,故數(shù)據(jù)量級(jí)龐大、增長(zhǎng)速度極快,如何儲(chǔ)存龐大數(shù)據(jù)成為了一大難題,即傳統(tǒng)數(shù)據(jù)庫(kù)雖然種類繁多,但容量均有限,而當(dāng)前數(shù)據(jù)管理中的數(shù)據(jù)具有單次量級(jí)龐大、增長(zhǎng)速度快的特征,因此傳統(tǒng)數(shù)據(jù)庫(kù)并不滿足數(shù)據(jù)儲(chǔ)存需求[1]。在這種情況下,新時(shí)代數(shù)據(jù)管理需要一個(gè)能滿足當(dāng)下數(shù)據(jù)儲(chǔ)存容量需要的數(shù)據(jù)庫(kù),且考慮到數(shù)據(jù)量級(jí)會(huì)不斷增長(zhǎng),數(shù)據(jù)庫(kù)的容量還要具備良好的可拓展性。
數(shù)據(jù)管理工作的第一步就是對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,目的是去除重復(fù)的無(wú)用數(shù)據(jù)、修復(fù)錯(cuò)誤或不全數(shù)據(jù)、完成數(shù)據(jù)分類,因此工作人員需要在預(yù)處理中對(duì)數(shù)據(jù)進(jìn)行整理,識(shí)別數(shù)據(jù)特征,以便進(jìn)行處理。但龐大的數(shù)據(jù)量級(jí)、繁多的數(shù)據(jù)種類導(dǎo)致人工不能直接對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,即龐大的量級(jí)會(huì)導(dǎo)致數(shù)據(jù)預(yù)處理工作量大幅增長(zhǎng),而人工工作效率有限,不可能在規(guī)定時(shí)間內(nèi)對(duì)所有數(shù)據(jù)進(jìn)行處理,同時(shí)繁多的數(shù)據(jù)種類會(huì)增大數(shù)據(jù)預(yù)處理難度,故人工難以進(jìn)行整理[2]。在這種情況下,人們就需要使用技術(shù)手段來(lái)完成數(shù)據(jù)整理工作,以便做好數(shù)據(jù)預(yù)處理,故存在數(shù)據(jù)整理技術(shù)需要。
下文將對(duì)計(jì)算機(jī)數(shù)據(jù)庫(kù)技術(shù)應(yīng)用進(jìn)行全面分析,涉及技術(shù)選型與應(yīng)用方法,同時(shí)還包括數(shù)據(jù)安全管理。
計(jì)算機(jī)數(shù)據(jù)庫(kù)的關(guān)鍵技術(shù)有二,分別為數(shù)據(jù)庫(kù)技術(shù)、數(shù)據(jù)管理技術(shù),下文將結(jié)合新時(shí)代數(shù)據(jù)管理需要進(jìn)行技術(shù)選型。
2.1.1 數(shù)據(jù)庫(kù)技術(shù)
自數(shù)據(jù)庫(kù)概念提出以來(lái),人們就一直在開發(fā)計(jì)算機(jī)數(shù)據(jù)庫(kù)技術(shù),故經(jīng)過(guò)多年發(fā)展該項(xiàng)技術(shù)有了多種形式,現(xiàn)今主要使用的技術(shù)是基于云計(jì)算的SQL 數(shù)據(jù)庫(kù)技術(shù)。該項(xiàng)技術(shù)與云計(jì)算結(jié)合后具有兩大特征:第一近乎無(wú)限,且拓展性的儲(chǔ)存空間,即該數(shù)據(jù)庫(kù)的數(shù)據(jù)儲(chǔ)存空間位于網(wǎng)絡(luò),而網(wǎng)絡(luò)空間無(wú)限延伸,因此理論上該數(shù)據(jù)庫(kù)的儲(chǔ)存空間無(wú)限,全面滿足數(shù)據(jù)儲(chǔ)存需要。同時(shí)在近乎無(wú)限的儲(chǔ)存容量下,人們可以隨意設(shè)定容量大小,且在容量較小的情況下能隨時(shí)擴(kuò)張,故儲(chǔ)存空間可拓展性強(qiáng)[3];第二分布式部署,即該數(shù)據(jù)技術(shù)由1 個(gè)總系統(tǒng)、若干個(gè)子系統(tǒng)組成,所有子系統(tǒng)相互獨(dú)立,但均與總系統(tǒng)保持聯(lián)系,圖1為分布式部署的拓?fù)鋱D。在這種部署格局下,每個(gè)計(jì)算機(jī)可以利用子系統(tǒng)對(duì)自身數(shù)據(jù)進(jìn)行管理,而數(shù)據(jù)管理總管理員可以通過(guò)總系統(tǒng)了解子系統(tǒng)運(yùn)作情況,同時(shí)能對(duì)各子系統(tǒng)進(jìn)行一對(duì)一、一對(duì)多的管理,可實(shí)現(xiàn)子系統(tǒng)協(xié)同運(yùn)作,并保障子系統(tǒng)運(yùn)作正常,全面做好數(shù)據(jù)管理工作。
圖1:數(shù)據(jù)庫(kù)分布式部署的拓?fù)鋱D
2.1.2 數(shù)據(jù)管理技術(shù)
數(shù)據(jù)庫(kù)技術(shù)主要負(fù)責(zé)數(shù)據(jù)儲(chǔ)存,并提供基本的數(shù)據(jù)管理邏輯,但并不能應(yīng)對(duì)數(shù)據(jù)預(yù)處理等方面的實(shí)操需求,因此還需要進(jìn)行數(shù)據(jù)管理技術(shù)選型。面對(duì)龐大的數(shù)據(jù)量以及復(fù)雜的數(shù)據(jù)關(guān)系,普通數(shù)據(jù)管理技術(shù)并不能起到良好作用,故本文主要選擇智能技術(shù)作為數(shù)據(jù)管理技術(shù)。智能技術(shù)能夠根據(jù)預(yù)設(shè)的智能邏輯自主完成相關(guān)工作,在數(shù)據(jù)管理的預(yù)處理環(huán)節(jié)中該項(xiàng)技術(shù)的基本邏輯見圖2。根據(jù)圖2,智能技術(shù)會(huì)依照知識(shí)庫(kù)進(jìn)行運(yùn)作,首先提取各項(xiàng)數(shù)據(jù)的特征,諸如關(guān)鍵詞等,隨后將數(shù)據(jù)特征與知識(shí)庫(kù)內(nèi)的特征做對(duì)比,可以對(duì)數(shù)據(jù)進(jìn)行識(shí)別。其次會(huì)依照數(shù)據(jù)特征對(duì)比結(jié)果判斷數(shù)據(jù)是否重復(fù),同時(shí)檢測(cè)數(shù)據(jù)是否完整,即數(shù)據(jù)是否滿足知識(shí)庫(kù)內(nèi)對(duì)完整數(shù)據(jù)的定義,若不滿足則數(shù)據(jù)不完整,若發(fā)現(xiàn)重復(fù)則刪除其中任意一項(xiàng),若發(fā)現(xiàn)數(shù)據(jù)不完整則會(huì)通知人工補(bǔ)充[4]。最后將對(duì)數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析,若發(fā)現(xiàn)數(shù)據(jù)關(guān)聯(lián)性不對(duì)稱或不存在關(guān)聯(lián)性,則判定數(shù)據(jù)組存在錯(cuò)誤,單獨(dú)列出待人工處理。
圖2:數(shù)據(jù)管理技術(shù)的基本邏輯
本文結(jié)合數(shù)據(jù)管理需求,利用計(jì)算機(jī)數(shù)據(jù)庫(kù)技術(shù)進(jìn)行了數(shù)據(jù)庫(kù)設(shè)計(jì),該數(shù)據(jù)庫(kù)總體框架見圖3。
圖3:數(shù)據(jù)庫(kù)總體框架
結(jié)合三大關(guān)鍵技術(shù),可展開方案設(shè)計(jì)工作,該項(xiàng)工作可分為兩個(gè)部分,分別是數(shù)據(jù)庫(kù)搭建、數(shù)據(jù)管理功能設(shè)計(jì),具體如下。
2.3.1 數(shù)據(jù)庫(kù)搭建
采用基于云計(jì)算的SQL 數(shù)據(jù)庫(kù)技術(shù)搭建數(shù)據(jù)庫(kù):第一統(tǒng)計(jì)單次數(shù)據(jù)導(dǎo)入總量,在網(wǎng)絡(luò)空間內(nèi)劃分出對(duì)等儲(chǔ)存資源,生成初始數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)容量可滿足單次數(shù)據(jù)導(dǎo)入需求,便于人機(jī)交互;第二分布式部署,結(jié)合現(xiàn)場(chǎng)計(jì)算機(jī)數(shù)量、從屬、級(jí)別,開發(fā)對(duì)應(yīng)子系統(tǒng),并完成子系統(tǒng)安裝、子系統(tǒng)等級(jí)劃分等工作,諸如上級(jí)部門計(jì)算機(jī)等級(jí)較高,有權(quán)對(duì)下級(jí)部門計(jì)算機(jī)進(jìn)行管理,故對(duì)應(yīng)子系統(tǒng)也要符合這種等級(jí)關(guān)系[5]。完成后將所有子系統(tǒng)與總系統(tǒng)連接,使得子系統(tǒng)內(nèi)產(chǎn)生的數(shù)據(jù)會(huì)自動(dòng)進(jìn)入總數(shù)據(jù)庫(kù),且子系統(tǒng)可以從總數(shù)據(jù)庫(kù)中調(diào)度出數(shù)據(jù),以便針對(duì)性管理;第三數(shù)據(jù)分類項(xiàng)目設(shè)計(jì),主要根據(jù)部門職能差異,對(duì)數(shù)據(jù)進(jìn)行初步的分類定義,同步設(shè)立分類項(xiàng)目,諸如財(cái)務(wù)部門與財(cái)務(wù)數(shù)據(jù)對(duì)應(yīng),因此要設(shè)計(jì)財(cái)務(wù)數(shù)據(jù)分類項(xiàng)目,以便數(shù)據(jù)分類清晰,避免數(shù)據(jù)混亂的現(xiàn)象發(fā)生。另外,在之后的應(yīng)用中如果出現(xiàn)單次數(shù)據(jù)量級(jí)增大的現(xiàn)象,則再次加大資源,可使容量提升,滿足當(dāng)下需求。
2.3.2 數(shù)據(jù)管理功能設(shè)計(jì)
根據(jù)數(shù)據(jù)管理需要,數(shù)據(jù)管理功能大體有四項(xiàng):第一數(shù)據(jù)查詢檢索功能,主要通過(guò)編程技術(shù)開發(fā)數(shù)據(jù)查詢檢索窗口,結(jié)合智能技術(shù),人工在窗口輸入數(shù)據(jù)關(guān)鍵詞,例如數(shù)據(jù)的某個(gè)字段、數(shù)據(jù)生成日期等,即可得到所有包含關(guān)鍵詞的數(shù)據(jù),關(guān)鍵詞越精確,則檢索結(jié)果越精確,以便人工查詢數(shù)據(jù);第二數(shù)據(jù)分類功能,主要根據(jù)智能技術(shù)得到各項(xiàng)數(shù)據(jù)的特征,將數(shù)據(jù)自動(dòng)導(dǎo)入對(duì)應(yīng)的分類項(xiàng)目中,諸如財(cái)務(wù)數(shù)據(jù)將自動(dòng)被導(dǎo)入財(cái)務(wù)數(shù)據(jù)分類項(xiàng)。關(guān)于數(shù)據(jù)分類功能的實(shí)現(xiàn)方法,主要是設(shè)計(jì)對(duì)應(yīng)的智能邏輯,邏輯包含識(shí)別流程與識(shí)別特征,其中識(shí)別流程與圖2“數(shù)據(jù)特征提取系列”相同,此處不多加贅述,而識(shí)別特征見表1(表1僅展示一部分內(nèi)容)。另外,關(guān)于數(shù)據(jù)完整性、關(guān)聯(lián)分析功能的實(shí)現(xiàn)方法相同,區(qū)別僅限于智能邏輯,故此處同樣不進(jìn)行贅述;第三數(shù)據(jù)權(quán)限管理功能,在子系統(tǒng)部署基礎(chǔ)上不同數(shù)據(jù)只能為對(duì)應(yīng)部門或人員所用,否則可能會(huì)出現(xiàn)數(shù)據(jù)混亂或其他不良影響,因此需要設(shè)計(jì)數(shù)據(jù)權(quán)限管理功能。該功能主要采用編程方法實(shí)現(xiàn),編輯部門賬號(hào)身份屬性以及數(shù)據(jù)分類項(xiàng)目屬性,并通過(guò)智能技術(shù)對(duì)賬號(hào)身份進(jìn)行識(shí)別,同步獲取賬號(hào)身份屬性,在得到身份屬性的基礎(chǔ)上開放對(duì)應(yīng)屬性的數(shù)據(jù)分類項(xiàng)目,用戶可獲取分類項(xiàng)目中的相關(guān)數(shù)據(jù),其他數(shù)據(jù)則無(wú)法查看。針對(duì)高層或系統(tǒng)管理員的賬號(hào)身份屬性,每個(gè)數(shù)據(jù)分類項(xiàng)目中都應(yīng)當(dāng)包含對(duì)應(yīng)屬性,使相關(guān)用戶能查閱所有數(shù)據(jù)。另外,數(shù)據(jù)權(quán)限管理功能的基本邏輯比較復(fù)雜,除了要針對(duì)數(shù)據(jù)查閱等需求以外,還要考慮到數(shù)據(jù)修改等權(quán)限,而權(quán)限所指雖然不同,但基本實(shí)現(xiàn)方法相似,只要細(xì)心設(shè)計(jì)即可;第四數(shù)據(jù)修改功能,因?yàn)樵趯?shí)際工作中可能會(huì)遇到錯(cuò)誤數(shù)據(jù)或不完整數(shù)據(jù),這一類數(shù)據(jù)無(wú)法起到實(shí)用效果,所以管理人員要對(duì)此類數(shù)據(jù)進(jìn)行修改。在權(quán)限允許的情況下,數(shù)據(jù)管理人員可雙擊需修改數(shù)據(jù),隨即進(jìn)行修改,該功能實(shí)現(xiàn)方法同樣需編程。所有數(shù)據(jù)管理功能都依托于云計(jì)算資源,相關(guān)人員可以將這些資源在界面上進(jìn)行部署、設(shè)計(jì),若技術(shù)水平有限,也可以通過(guò)云供應(yīng)商服務(wù)直接獲取對(duì)應(yīng)功能,以豐富數(shù)據(jù)管理功能。
表1:數(shù)據(jù)分類項(xiàng)目的識(shí)別特征
新時(shí)代下數(shù)據(jù)管理與網(wǎng)絡(luò)關(guān)系緊密,諸如數(shù)據(jù)管理人員需要通過(guò)網(wǎng)絡(luò)搜集數(shù)據(jù),或者要將數(shù)據(jù)存放到網(wǎng)絡(luò)環(huán)境中,因此網(wǎng)絡(luò)內(nèi)的一些風(fēng)險(xiǎn)因素會(huì)對(duì)數(shù)據(jù)造成安全威脅,故數(shù)據(jù)安全保護(hù)成為了數(shù)據(jù)管理的重點(diǎn)。針對(duì)數(shù)據(jù)安全問(wèn)題,現(xiàn)代數(shù)據(jù)管理人員一般會(huì)采用殺毒軟件、防火墻等安全防護(hù)手段來(lái)管理,但因?yàn)轱L(fēng)險(xiǎn)因素層出不窮,且數(shù)據(jù)管理人員使用手段的方式簡(jiǎn)陋,所以并不能有效保護(hù)數(shù)據(jù),實(shí)際風(fēng)險(xiǎn)水平依然居高不下,故如何進(jìn)一步加強(qiáng)數(shù)據(jù)安全保護(hù)力度成為了數(shù)據(jù)管理的一大問(wèn)題,說(shuō)明存在數(shù)據(jù)安全保護(hù)需要。
為滿足安全防護(hù)需要,需要在數(shù)據(jù)庫(kù)基礎(chǔ)上增設(shè)數(shù)據(jù)庫(kù)安全防護(hù)體系,該體系主要有數(shù)據(jù)庫(kù)安全防護(hù)技術(shù)實(shí)現(xiàn)??傮w上數(shù)據(jù)安全防護(hù)要求比較復(fù)雜,故單獨(dú)使用某一項(xiàng)技術(shù)并不能起到應(yīng)有效果,因此本文將選擇智能技術(shù)與云計(jì)算技術(shù)進(jìn)行安全防護(hù)。云計(jì)算技術(shù)主要負(fù)責(zé)提供防護(hù)邏輯,諸如利用云計(jì)算技術(shù)可以生成用戶認(rèn)證機(jī)制、權(quán)限管理機(jī)制,該機(jī)制作用下能夠?qū)τ脩羯矸葸M(jìn)行識(shí)別,判斷用戶身份是否合法、用戶身份類型,再根據(jù)判斷結(jié)果賦予對(duì)應(yīng)權(quán)限,即若用戶身份不合法這不賦予任何權(quán)限,拒絕其訪問(wèn),若用戶身份合法,則根據(jù)身份類型予以對(duì)應(yīng)權(quán)限[6]。而智能技術(shù)主要根據(jù)機(jī)制執(zhí)行用戶身份識(shí)別工作,即根據(jù)用戶身份信息進(jìn)行判斷,再依照判斷結(jié)果決定功能開閉,同時(shí)智能技術(shù)能夠?qū)ν饨鐞阂夤舻冗M(jìn)行識(shí)別與學(xué)習(xí),若知識(shí)庫(kù)中具有某種惡意攻擊的記錄,則會(huì)直接處理,若沒(méi)有記錄則會(huì)控制惡意攻擊程序,并且學(xué)習(xí),待人工處理完成后,知識(shí)庫(kù)內(nèi)會(huì)生成對(duì)應(yīng)記錄,下一次即可直接防護(hù),故能夠應(yīng)對(duì)層出不窮的網(wǎng)絡(luò)風(fēng)險(xiǎn)。
另外,因?yàn)榛谠茢?shù)據(jù)庫(kù)的SQL 數(shù)據(jù)庫(kù)技術(shù)的數(shù)據(jù)儲(chǔ)存空間位于網(wǎng)絡(luò),而網(wǎng)絡(luò)的公共性、公共性會(huì)使得數(shù)據(jù)風(fēng)險(xiǎn)增大,可能會(huì)帶來(lái)大量安全攻擊,所以在安全防護(hù)基礎(chǔ)上,建議通過(guò)智能技術(shù)與計(jì)算機(jī)數(shù)據(jù)庫(kù)結(jié)合,實(shí)現(xiàn)用戶認(rèn)證功能,該功能可構(gòu)成封閉式環(huán)境,只留下一個(gè)接口,用戶必須通過(guò)身份認(rèn)證才能進(jìn)入數(shù)據(jù)庫(kù),因此借助用戶認(rèn)證機(jī)制,智能技術(shù)可以與計(jì)算機(jī)數(shù)據(jù)庫(kù)相結(jié)合,幫助管理人員對(duì)數(shù)據(jù)安全進(jìn)行管理。同時(shí)數(shù)據(jù)安全管理要考慮全面,例如針對(duì)交換機(jī)要借助智能技術(shù)開發(fā)反入侵功能、針對(duì)數(shù)據(jù)通信渠道要借助加密技術(shù)、反監(jiān)聽技術(shù)進(jìn)行防護(hù),通過(guò)這些技術(shù)與功能能讓數(shù)據(jù)管理更加完善,計(jì)算機(jī)數(shù)據(jù)庫(kù)技術(shù)的作用也能充分發(fā)揮[7]。
綜上,數(shù)據(jù)管理工作內(nèi)容復(fù)雜,且在新時(shí)代下該項(xiàng)工作難度、量級(jí)龐大,遠(yuǎn)非人工力所能及,因此需要使用技術(shù)手段來(lái)進(jìn)行管理,而計(jì)算機(jī)數(shù)據(jù)庫(kù)技術(shù)自然是不二之選。計(jì)算機(jī)數(shù)據(jù)庫(kù)技術(shù)并不是單指某一項(xiàng)技術(shù),諸如智能技術(shù)、云技術(shù)等都在其列,因此在技術(shù)應(yīng)用中要結(jié)合實(shí)際需求進(jìn)行選擇,組合,在搭建數(shù)據(jù)庫(kù)的同時(shí)豐富數(shù)據(jù)庫(kù)功能,并關(guān)注數(shù)據(jù)安全問(wèn)題,這樣才能幫助人工全面做好各項(xiàng)數(shù)據(jù)庫(kù)管理工作。