◆梁慧妍
(大慶油田第二采油廠信息中心 黑龍江 163000)
數(shù)字油田是石油科學(xué)與現(xiàn)代石油信息技術(shù)結(jié)合而形成的一個(gè)概念,及時(shí)針對(duì)油田集體配套領(lǐng)域進(jìn)行的一種數(shù)字化描述,也是一個(gè)綜合性的現(xiàn)代化管理信息系統(tǒng)。在各大油田系統(tǒng)生產(chǎn)規(guī)模以及業(yè)務(wù)需求急劇增加的情況下,數(shù)字油田建設(shè)面臨著更大的挑戰(zhàn),在這種情況下就必須要建立起能夠滿足現(xiàn)代油田各項(xiàng)業(yè)務(wù)快速發(fā)展的數(shù)字化系統(tǒng)。在現(xiàn)在數(shù)字油田建設(shè)過程中,大數(shù)據(jù)技術(shù)和云計(jì)算技術(shù)的應(yīng)用發(fā)揮出了巨大作用。而在數(shù)字油田建設(shè)的全過程中數(shù)據(jù)始終都是非常重要的一個(gè)因素,任何一個(gè)數(shù)據(jù)出現(xiàn)問題都可能會(huì)對(duì)數(shù)字油田系統(tǒng)后期應(yīng)用和拓展產(chǎn)生嚴(yán)重影響。
從信息系統(tǒng)層面來看,數(shù)據(jù)質(zhì)量問題主要有單數(shù)據(jù)源以及多數(shù)據(jù)源問題等兩種。單數(shù)據(jù)源問題主要有以下幾種:一是數(shù)據(jù)缺失。數(shù)據(jù)缺失很可能是因人工錄入數(shù)據(jù)的誤操作而導(dǎo)致數(shù)據(jù)缺失,因此數(shù)據(jù)輸入時(shí)必須要進(jìn)行嚴(yán)格檢驗(yàn),從源頭杜絕數(shù)據(jù)缺失問題出現(xiàn)。二是數(shù)據(jù)重復(fù)。數(shù)據(jù)重復(fù)問題需要在數(shù)據(jù)錄入過程中對(duì)關(guān)鍵屬性唯一性進(jìn)行嚴(yán)格檢驗(yàn)。三是數(shù)據(jù)關(guān)聯(lián)錯(cuò)誤。內(nèi)屬性關(guān)聯(lián)和實(shí)體關(guān)聯(lián)是數(shù)據(jù)關(guān)聯(lián)的兩種形式,上述兩種形式都可能會(huì)存在屬性值不一致的問題。多元數(shù)據(jù)問題主要包括以下一些:1)數(shù)據(jù)模式?jīng)_突。數(shù)據(jù)模式?jīng)_突主要包括命名沖突和結(jié)構(gòu)沖突的兩種。命名沖突主要指的是針對(duì)不同實(shí)體或者是不同的名稱表利用同一個(gè)名稱進(jìn)行表示,或者是針對(duì)同一實(shí)體或?qū)傩岳貌煌Q來進(jìn)行表示。結(jié)構(gòu)沖突主要指的是在不同數(shù)據(jù)源中針對(duì)同一對(duì)象來通過多種方式進(jìn)行表達(dá)。2)數(shù)據(jù)語言沖突。數(shù)據(jù)語言沖突主要指的是針對(duì)具體客觀對(duì)象進(jìn)行闡述過程中不同系統(tǒng)所采取的描述方法不同;3)數(shù)據(jù)冗余。數(shù)據(jù)冗余主要指的是在不同系統(tǒng)中同一數(shù)據(jù)重復(fù)出現(xiàn)。4)數(shù)據(jù)沖突。數(shù)據(jù)沖突主要指的是在不同系統(tǒng)中同樣數(shù)據(jù)數(shù)值不同,由此導(dǎo)致沖突。
數(shù)據(jù)質(zhì)量會(huì)受到很多方面因素的影響,其中不僅包括了系統(tǒng)管理方面的影響,也會(huì)存在技術(shù)方面的影響。其中主要有以下幾種因素:1)歷史原因。傳統(tǒng)模式下不同信息系統(tǒng)之間相互處于獨(dú)立狀態(tài),各信息系統(tǒng)設(shè)計(jì)實(shí)施并未形成統(tǒng)一的標(biāo)準(zhǔn),因此其在技術(shù)構(gòu)架、業(yè)務(wù)范圍、數(shù)據(jù)模式上也會(huì)存在較大差異,在這種情況下就很可能會(huì)導(dǎo)致出現(xiàn)數(shù)據(jù)分散,甚至是不完整等一些沖突。2)技術(shù)水平限制,如果技術(shù)水平?jīng)]有達(dá)到系統(tǒng)建設(shè)標(biāo)準(zhǔn)要求,很可能會(huì)出現(xiàn)數(shù)據(jù)不準(zhǔn)確、不一致以及惡意性等一些問題。目前在針對(duì)原始數(shù)據(jù)進(jìn)行處理的過程中存在多種標(biāo)準(zhǔn),不同標(biāo)準(zhǔn)之間雖存在類似之處,但是也都存在各自特征。
根據(jù)當(dāng)前數(shù)字油田建設(shè)的現(xiàn)狀可以看出,多數(shù)油田企業(yè)建設(shè)數(shù)據(jù)庫系統(tǒng)都存在分散性的特點(diǎn),例如,企業(yè)業(yè)務(wù)部門和其他部門之間經(jīng)常會(huì)出現(xiàn)標(biāo)準(zhǔn)不統(tǒng)一、重復(fù)采集以及重復(fù)建設(shè)的問題,業(yè)務(wù)經(jīng)營數(shù)據(jù)以及各項(xiàng)生產(chǎn)數(shù)據(jù)也經(jīng)常會(huì)出現(xiàn)多個(gè)版本,而且油田信息系統(tǒng)存在嚴(yán)重信息孤島問題,這在很大程度上對(duì)數(shù)字油田可持續(xù)發(fā)展產(chǎn)生極大影響。而要想有效解決當(dāng)前油田信息系統(tǒng)所面臨的信息孤島問題,就必須要建立起更加完善、規(guī)范、科學(xué)、標(biāo)準(zhǔn)的數(shù)據(jù)集成方案,這樣才能有效提升信息數(shù)據(jù)庫的應(yīng)用效率。
隨著計(jì)算機(jī)技術(shù)在油田領(lǐng)域的推廣應(yīng)用,油田企業(yè)的各項(xiàng)生產(chǎn)數(shù)據(jù)呈現(xiàn)出指數(shù)級(jí)增長模式,而且在企業(yè)經(jīng)營發(fā)展過程中行程的各項(xiàng)數(shù)據(jù)逐漸向著動(dòng)態(tài)變化、復(fù)雜化、龐大化的方向發(fā)展,在很大程度上使得各項(xiàng)生產(chǎn)數(shù)據(jù)統(tǒng)計(jì)分析以及實(shí)際應(yīng)用難度進(jìn)一步增加。而要想有效解決這些問題,首先就必須要構(gòu)建起標(biāo)準(zhǔn)統(tǒng)一、可拓展的數(shù)據(jù)集成平臺(tái)。但是目前各大油田實(shí)際應(yīng)用的傳統(tǒng)數(shù)據(jù)采集方法很難滿足油田數(shù)據(jù)集成的實(shí)際需求,當(dāng)數(shù)據(jù)一旦產(chǎn)生波動(dòng),整個(gè)系統(tǒng)就面臨著需要重新修改的情況,這導(dǎo)致實(shí)際工作量急劇增加。因此在數(shù)字油田建設(shè)過程中,必須要對(duì)不斷增長的各項(xiàng)業(yè)務(wù)需求進(jìn)行充分滿足,才能夠真正從根本上實(shí)現(xiàn)數(shù)據(jù)集成和應(yīng)用需求的有效分離,在此基礎(chǔ)上才能夠讓數(shù)字化系統(tǒng)實(shí)現(xiàn)穩(wěn)定、可靠運(yùn)行,才能夠進(jìn)一步控制數(shù)字化系統(tǒng)的運(yùn)營成本。
數(shù)字油田發(fā)展早期階段主要是有油田各二級(jí)單位來全面負(fù)責(zé)數(shù)據(jù)的采集工作,而各二級(jí)單位之間并未建立起統(tǒng)一的采集系統(tǒng)專業(yè)數(shù)據(jù)庫標(biāo)準(zhǔn),這導(dǎo)致各項(xiàng)數(shù)據(jù)在采集過程中不能充分保證數(shù)據(jù)質(zhì)量。
數(shù)字油田不同發(fā)展階段所對(duì)應(yīng)的數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)也會(huì)存在較大差異。例如,20 世紀(jì)80 年代以前主要是利用數(shù)據(jù)的準(zhǔn)確性來衡量數(shù)據(jù)質(zhì)量。而自80 年代開始,數(shù)據(jù)質(zhì)量內(nèi)涵也在實(shí)現(xiàn)持續(xù)延伸,利用準(zhǔn)確性來衡量數(shù)據(jù)質(zhì)量已經(jīng)不能滿足實(shí)際需求,其不再成為唯一的衡量標(biāo)準(zhǔn),信息技術(shù)發(fā)展至今已經(jīng)出現(xiàn)以下三個(gè)方面的數(shù)據(jù)質(zhì)量衡量標(biāo)準(zhǔn):1)站在用戶需求的角度來進(jìn)行數(shù)據(jù)質(zhì)量衡量,這一衡量標(biāo)準(zhǔn)重點(diǎn)考慮的是用戶對(duì)于數(shù)據(jù)的滿意度;2)將數(shù)據(jù)質(zhì)量作為一個(gè)綜合性概念,在評(píng)價(jià)數(shù)據(jù)質(zhì)量過程中需要從多角度開展;3)大多數(shù)情況下對(duì)數(shù)據(jù)質(zhì)量描述的過程中會(huì)使用完整性、準(zhǔn)確性、規(guī)范性、及時(shí)性以及統(tǒng)一性等幾個(gè)要素。因此數(shù)字油田在建設(shè)過程中也要從以下幾個(gè)方面對(duì)數(shù)據(jù)質(zhì)量進(jìn)行控制。
技術(shù)水平限制、設(shè)計(jì)數(shù)據(jù)不準(zhǔn)確、監(jiān)督措施不合理以及歷史原因是數(shù)據(jù)質(zhì)量的幾個(gè)主要影響因素。從油田企業(yè)當(dāng)前發(fā)展?fàn)顩r來看,存在很多數(shù)據(jù)質(zhì)量的控制目標(biāo),但完整性、一致性、及時(shí)性和規(guī)范性是最為關(guān)鍵的幾項(xiàng)控制目標(biāo)。完整性主要指的是專業(yè)范圍、專業(yè)數(shù)據(jù)等內(nèi)容要確保涵蓋全方位內(nèi)容;規(guī)范性主要指的是要保障各項(xiàng)數(shù)據(jù)填寫格式和內(nèi)容與當(dāng)前數(shù)字油田建設(shè)需求相符;一致性主要指的是不同專業(yè)之間、不同數(shù)據(jù)之間、不同數(shù)據(jù)表之間要具備相互統(tǒng)一性;及時(shí)性主要指的是要保證及時(shí)實(shí)現(xiàn)數(shù)據(jù)提交、審核以及應(yīng)用。
數(shù)字油田建設(shè)的數(shù)據(jù)質(zhì)量控制流程如下:首先對(duì)各采集點(diǎn)收集數(shù)據(jù)進(jìn)行初始審核,并針對(duì)各項(xiàng)數(shù)據(jù)使之持續(xù)監(jiān)測,并實(shí)現(xiàn)數(shù)據(jù)優(yōu)化。在具體確定數(shù)據(jù)質(zhì)量控制解決方案的過程中,油田主管業(yè)務(wù)部門需要加強(qiáng)與IT 部門的結(jié)合,要實(shí)現(xiàn)兩個(gè)部門之間數(shù)據(jù)的集中統(tǒng)一,采取取長補(bǔ)短的方式來實(shí)現(xiàn)數(shù)據(jù)質(zhì)量控制方案的科學(xué)性和合理性。
1)數(shù)據(jù)初始審核主要工作包括數(shù)據(jù)內(nèi)容、結(jié)構(gòu)以及異常情況的審核,隨后要進(jìn)行全面數(shù)據(jù)分析;
2)要結(jié)合油田企業(yè)具體發(fā)展?fàn)顩r構(gòu)建起相應(yīng)的質(zhì)量控制度量,實(shí)現(xiàn)控制目標(biāo)的明確;
3)針對(duì)數(shù)據(jù)質(zhì)量實(shí)施和設(shè)計(jì)過程制定出相應(yīng)的業(yè)務(wù)規(guī)則;
4)經(jīng)過上述幾個(gè)步驟控制形成的數(shù)據(jù)最終集中會(huì)遇到低系統(tǒng)中,同時(shí)構(gòu)建及相應(yīng)的質(zhì)量控制工具;
5)針對(duì)數(shù)據(jù)檢測過程中發(fā)現(xiàn)的異常狀況進(jìn)行全面檢查,并進(jìn)一步完善應(yīng)用規(guī)則,同時(shí)要結(jié)合數(shù)據(jù)質(zhì)量具體控制目標(biāo)編制出相應(yīng)的評(píng)估報(bào)告。
數(shù)據(jù)完整性控制的關(guān)鍵是項(xiàng)目覆蓋數(shù)據(jù)專業(yè)范圍、文檔范圍、表格數(shù)據(jù)范圍等,要及時(shí)關(guān)注其中是否存在數(shù)據(jù)缺失情況,同時(shí)要對(duì)各項(xiàng)數(shù)據(jù)是否與計(jì)劃相符進(jìn)行明確。一般情況下,任何項(xiàng)目數(shù)據(jù)完整性都會(huì)涉及項(xiàng)目專業(yè)數(shù)以及具體專業(yè)表數(shù)量等一些因素,因此在進(jìn)行控制的過程中需要充分結(jié)合項(xiàng)目數(shù)據(jù)計(jì)劃來制定出各項(xiàng)控制指標(biāo)。因此,在數(shù)字油田建設(shè)實(shí)踐中,首要的工作是針對(duì)各項(xiàng)收集數(shù)據(jù)制定出相應(yīng)的計(jì)劃,在此基礎(chǔ)上才能充分保障數(shù)字油田數(shù)據(jù)的完整性。
數(shù)字油田建設(shè)中數(shù)據(jù)規(guī)范性主要指的是在各生產(chǎn)現(xiàn)場以及各業(yè)務(wù)環(huán)節(jié)所提交的實(shí)際數(shù)據(jù)值必須要在一定程度上與假定規(guī)范數(shù)據(jù)要求相符。一般情況下,數(shù)據(jù)一致性程度利用語言設(shè)定的業(yè)務(wù)規(guī)則檢驗(yàn)和判斷。在實(shí)際進(jìn)行數(shù)據(jù)規(guī)范性控制的過程中,應(yīng)該將控制重點(diǎn)放在項(xiàng)目數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)化要求的一致性方面,同時(shí)也要充分保障數(shù)據(jù)格式和規(guī)范要求。
數(shù)字油田建設(shè)過程中的項(xiàng)目數(shù)據(jù)一致性主要指的是從各個(gè)數(shù)據(jù)源所采集的數(shù)據(jù)與數(shù)字油田建設(shè)項(xiàng)目約束所達(dá)到的滿意程度。對(duì)這一環(huán)節(jié)的控制方法:首先需要針對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行明確,同時(shí)編制出相應(yīng)的文檔報(bào)告,在數(shù)據(jù)采集系統(tǒng)中要納入勘探開發(fā)成果數(shù)據(jù),隨后選擇合理的數(shù)據(jù)質(zhì)量控制工具來針對(duì)數(shù)據(jù)表、專業(yè)內(nèi)、專業(yè)間實(shí)施平均加權(quán)處理,通過處理找出其中存在差異的數(shù)據(jù),并利用工具進(jìn)行反復(fù)交合,這樣才能充分保證數(shù)字油田建設(shè)數(shù)據(jù)的一致性。
總而言之,在數(shù)字油田建設(shè)過程中,數(shù)據(jù)質(zhì)量是各項(xiàng)決策科學(xué)性和正確性的基本保障,也是油田企業(yè)在新時(shí)期發(fā)展過程中極具價(jià)值的一項(xiàng)無形資產(chǎn)。因此我國在全面推動(dòng)數(shù)字油田建設(shè)的過程中要主動(dòng)構(gòu)建起更加科學(xué)有效的數(shù)字質(zhì)量管控體系,同時(shí)針對(duì)控制方法進(jìn)行逐步完善,這樣才能確保數(shù)字油田在建設(shè)過程中獲取真實(shí)有效數(shù)據(jù)。
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2021年7期