張 敏
(天津市大港油田信息中心大數(shù)據(jù)技術(shù)部,天津 300280)
隨著互聯(lián)網(wǎng)(或者物聯(lián)網(wǎng))、云計算、大數(shù)據(jù)和人工智能等新技術(shù)的興起與應(yīng)用,人們的工作和生活都在發(fā)生改變。大數(shù)據(jù)技術(shù)以其高效的信息處理能力、技術(shù)分析能力、多樣的模型算法等,在石油行業(yè)勘探開發(fā)生產(chǎn)中輔助相關(guān)人員開展工作。近幾年,隨著大港油田大數(shù)據(jù)技術(shù)應(yīng)用的不斷深化,大數(shù)據(jù)技術(shù)已經(jīng)在協(xié)同研究環(huán)境、數(shù)字井筒應(yīng)用和數(shù)據(jù)治理以及數(shù)字油藏技術(shù)研究等方面取得了一系列成績。目前,針對智慧油田建設(shè),大港油田制定了頂層設(shè)計方案,明確了大數(shù)據(jù)建設(shè)的目標(biāo)、框架、內(nèi)容、實施方案和制度機(jī)制5 部分內(nèi)容。在頂層設(shè)計方案推動中,為保證大數(shù)據(jù)工作有效落地,大港油田采取了多部門聯(lián)合推動、多業(yè)務(wù)協(xié)調(diào)開展、多節(jié)點全面實踐等措施,使得大數(shù)據(jù)技術(shù)在儲層預(yù)測、油氣層識別、地震數(shù)據(jù)管理等方面發(fā)揮了重要作用。大數(shù)據(jù)處理過程主要包括數(shù)據(jù)采集、提取、清洗,在數(shù)據(jù)分析中發(fā)現(xiàn)規(guī)律、建立分析模型、展示結(jié)果并表達(dá)、驗證結(jié)果、優(yōu)化模型等步驟。大港油田基于私有云環(huán)境,通過分別搭建Hadoop 平臺和大數(shù)據(jù)同步數(shù)字體系(Synchronous Digital Hierarchy,SDH),為石油勘探開發(fā)應(yīng)用搭建了基礎(chǔ)的應(yīng)用研究環(huán)境,并在此基礎(chǔ)上進(jìn)行了中心數(shù)據(jù)庫大數(shù)據(jù)環(huán)境實驗,開展了與勘探開發(fā)相關(guān)的幾十種算法適應(yīng)性研究。下面將在儲層預(yù)測、油氣層識別以及地震數(shù)據(jù)管理和智能油藏建設(shè)幾個方面闡述大數(shù)據(jù)技術(shù)的具體應(yīng)用。
在油氣田勘探開發(fā)領(lǐng)域中,構(gòu)造認(rèn)識、儲層識別是核心內(nèi)容,儲層預(yù)測是油氣勘探開發(fā)的難點。在實際應(yīng)用中,如果因地質(zhì)意義模糊、地震屬性混亂,造成無法對數(shù)據(jù)進(jìn)行分析利用的問題,就需要地質(zhì)和地球物理研究人員通過分析現(xiàn)有的大量數(shù)據(jù),結(jié)合大數(shù)據(jù)分析技術(shù)和模型,進(jìn)行儲層的定性、定量和預(yù)測工作。目前,應(yīng)用于大數(shù)據(jù)分析處理主要有兩類技術(shù):一類是大數(shù)據(jù)抽取及預(yù)處理,另一類是大數(shù)據(jù)分析。
數(shù)據(jù)抽取及預(yù)處理主要是把多種結(jié)構(gòu)和類型的數(shù)據(jù)抽取轉(zhuǎn)化成單一的或便于處理的結(jié)構(gòu)類型。其要求不同時間、不同地點、不同名稱的相同數(shù)據(jù)的內(nèi)涵和算法一致,以方便計算機(jī)處理,因此是數(shù)據(jù)提取的關(guān)鍵。對于數(shù)據(jù)抽取的標(biāo)準(zhǔn)化、規(guī)范化的檢查,則需要利用數(shù)據(jù)清洗技術(shù)進(jìn)行處理。數(shù)據(jù)清洗的主要目的是確定有用記錄和字段,檢查數(shù)據(jù)是否存在缺失和異常等情況。在使用數(shù)據(jù)清洗技術(shù)時,主要采用剔除法或使用估計值、平均值填補(bǔ)錯誤數(shù)據(jù)等方法,有時也可利用邏輯關(guān)系進(jìn)行手動替換。除此之外,還需要通過數(shù)據(jù)構(gòu)建技術(shù)來輔助大數(shù)據(jù)建模需求而創(chuàng)建新字段,以及通過數(shù)據(jù)轉(zhuǎn)換技術(shù)將原始數(shù)據(jù)轉(zhuǎn)換為下一步處理應(yīng)用所需要的數(shù)據(jù)格式。
大數(shù)據(jù)分析技術(shù)常用的方法主要有回歸分析、聚類分析、因子分析、相關(guān)分析以及數(shù)據(jù)挖掘等方法。這些方法在油田中都較為常用。其中最為關(guān)鍵的技術(shù)是數(shù)據(jù)挖掘技術(shù),它是大數(shù)據(jù)時代的核心處理技術(shù)。數(shù)據(jù)挖掘技術(shù)可以將海量非完整的、有噪音的、模糊且隨機(jī)的數(shù)據(jù)通過模型和算法分析,挖掘出有用的數(shù)據(jù)信息進(jìn)行處理應(yīng)用。數(shù)據(jù)挖掘主要有兩類功能,一種稱為描述性挖掘,主要用于分析數(shù)據(jù)的普通特性,展現(xiàn)集體數(shù)據(jù)的一般特性;另一種是預(yù)測性挖掘,主要應(yīng)用于預(yù)測性研究,通過推算處理數(shù)據(jù),完成預(yù)測等任務(wù)。
大數(shù)據(jù)技術(shù)在油田勘探開發(fā)中的應(yīng)用可以通過處理和抽取技術(shù),對現(xiàn)有數(shù)據(jù)進(jìn)行對比篩查及轉(zhuǎn)換,通過分析和計算研究,從中找出有價值的數(shù)據(jù)進(jìn)行預(yù)測和描述,并分析得出結(jié)果。目前,大港油田在儲層預(yù)測中主要應(yīng)用的就是數(shù)據(jù)挖掘思路,通過進(jìn)行數(shù)據(jù)可視化全流程實踐,為石油勘探開發(fā)和生產(chǎn)提供依據(jù)。
目前,大港油田各個區(qū)域都存在石油儲量、開發(fā)產(chǎn)能、生產(chǎn)成本等多方面壓力。利用大數(shù)據(jù)技術(shù)可以輔助決策者和技術(shù)人員進(jìn)行分析和處理,從儲集層快速找到具有二次開發(fā)價值的油氣層,并采取補(bǔ)孔及壓裂等手段,增加油井產(chǎn)量。利用大數(shù)據(jù)技術(shù)的數(shù)據(jù)挖掘方法,可以幫助科研人員基于數(shù)據(jù)建立模型,由專家對模型進(jìn)行分析,解析出實際所需的數(shù)據(jù),最終幫助高層決策者做出準(zhǔn)確的勘探開發(fā)決策,取得滿意的效果。
在具體應(yīng)用中,針對數(shù)據(jù)量過多無法識別有效信息、數(shù)據(jù)量過少無法根據(jù)模型得到有效結(jié)果的情況,需要科學(xué)識別有效數(shù)據(jù)。當(dāng)前,油氣層的識別和預(yù)測利用鉆井、錄井、測井、生產(chǎn)、試油和分析化驗等多類型的數(shù)據(jù),并根據(jù)需要對所需數(shù)據(jù)進(jìn)行歸一化、標(biāo)準(zhǔn)化處理。近幾年,基于對大數(shù)據(jù)技術(shù)的成熟應(yīng)用,大港油田已開始建立油藏數(shù)據(jù)成果圖庫和精細(xì)油藏描述成果庫,通過對地震解釋、測井解釋、地質(zhì)建模、數(shù)值模擬等油描成果的深入研究,實現(xiàn)成果數(shù)據(jù)的邏輯校驗,數(shù)據(jù)完整性、一致性的自動檢查,自動生成質(zhì)量報告,為科研及工程人員利用數(shù)據(jù)成果進(jìn)一步分析和研究奠定良好的數(shù)據(jù)基礎(chǔ)。
伴隨大港油田智慧井場的建設(shè),對于多維地震采集技術(shù)的應(yīng)用不斷深化,地震勘探所產(chǎn)生的數(shù)據(jù)量也呈幾何級增長。為滿足地震數(shù)據(jù)管理的需要,大港油田開發(fā)了地震采集處理工區(qū)信息管理與發(fā)布系統(tǒng),并通過協(xié)同研究環(huán)境及專業(yè)數(shù)據(jù)庫進(jìn)行大數(shù)據(jù)存儲和處理。利用大數(shù)據(jù)技術(shù)的數(shù)據(jù)挖掘和處理,可以高效實現(xiàn)地震數(shù)據(jù)的處理解釋,同時對成果數(shù)據(jù)的分析、解釋及轉(zhuǎn)化都有了更深入的應(yīng)用。
綜合利用地震大數(shù)據(jù)技術(shù),建立地震大數(shù)據(jù)信息系統(tǒng),同時利用分布式架構(gòu)的方式,采用分布式讀取和存儲數(shù)據(jù),可以高效快捷地對數(shù)據(jù)進(jìn)行管理。大港油田開展的大數(shù)據(jù)實驗表明,采樣點地震數(shù)據(jù)在多節(jié)點Linux 的大數(shù)據(jù)環(huán)境中較單節(jié)點Windows 環(huán)境的處理速度有數(shù)量級的提升。在數(shù)據(jù)挖掘方面,地震數(shù)據(jù)由于其分辨率較小,利用大數(shù)據(jù)技術(shù)能建立井與井之間的聯(lián)系,能夠從平面和三維空間較好地描述整個區(qū)塊的含油氣性質(zhì)。在利用不同數(shù)據(jù)類型進(jìn)行建模時,結(jié)合時間屬性及空間屬性技術(shù),通過數(shù)據(jù)挖掘模型,可以更深入地獲取地震數(shù)據(jù)處理和解釋潛在數(shù)據(jù)信息。
隨著物聯(lián)網(wǎng)系統(tǒng)在大港油田油井開發(fā)生產(chǎn)的使用,每天都會有海量的數(shù)據(jù)需要存儲和分析。如何利用大數(shù)據(jù)技術(shù)對海量數(shù)據(jù)進(jìn)行分析處理,幫助專業(yè)技術(shù)人員更為直觀地獲取信息,使勘探開發(fā)領(lǐng)域的各類數(shù)據(jù)可以直接指導(dǎo)實際的油氣勘探,即數(shù)據(jù)勘探,對下一步智能油田建設(shè)發(fā)展有著重要意義。在這個多學(xué)科交叉、多背景綜合的領(lǐng)域區(qū)間,大數(shù)據(jù)技術(shù)不僅需要各種數(shù)據(jù)存儲的采集方案,更需要多種數(shù)據(jù)挖掘方法和數(shù)學(xué)模型,還要有專業(yè)技術(shù)人員的地球物理和地質(zhì)專業(yè)知識作支撐。只有滿足了這些需求,才能更好地保證大數(shù)據(jù)技術(shù)的正確使用,才能得到有效的大數(shù)據(jù)分析結(jié)果。這一結(jié)果可以用來指導(dǎo)二次、多次開發(fā)和精細(xì)解釋,在勘探開發(fā)生產(chǎn)領(lǐng)域所產(chǎn)生的深層作用,具有很重要的現(xiàn)實意義。當(dāng)前,國內(nèi)很多油田都在嘗試和探索將人工智能技術(shù)和大數(shù)據(jù)技術(shù)相結(jié)合來組建智慧油田系統(tǒng)。大港油田通過采油廠的試點應(yīng)用,已逐步建立了全天候的監(jiān)測控制、無人值守操控、重點部位無人機(jī)巡視、組織運維、層級簡化的新型站庫。利用物聯(lián)網(wǎng)技術(shù)遠(yuǎn)程采集信息,利用大數(shù)據(jù)技術(shù)分析挖掘信息,利用云數(shù)據(jù)計算處理中心存儲分析信息,加上移動數(shù)據(jù)的處理應(yīng)用、油田生產(chǎn)經(jīng)營管理平臺建設(shè),都為保證油田實現(xiàn)穩(wěn)產(chǎn)高產(chǎn)奠定了良好的信息化數(shù)據(jù)基礎(chǔ)。
大數(shù)據(jù)技術(shù)應(yīng)用作為油田企業(yè)的一次創(chuàng)新,強(qiáng)有力地推動了企業(yè)發(fā)展,數(shù)據(jù)逐漸成為企業(yè)的戰(zhàn)略性核心資源。智能油田業(yè)務(wù)是基于數(shù)據(jù)驅(qū)動的,為發(fā)揮數(shù)據(jù)資源優(yōu)勢,數(shù)據(jù)應(yīng)用成為智能油田建設(shè)的關(guān)鍵環(huán)節(jié)。
油田企業(yè)的環(huán)境和地質(zhì)工程一體化建設(shè)、數(shù)據(jù)信息采集,對企業(yè)信息技術(shù)和智能化發(fā)展提出了更高的要求。如何高效處理油田各采油廠在生產(chǎn)運行中所形成的大數(shù)據(jù)信息,實現(xiàn)對大數(shù)據(jù)的安全利用,為高層決策者提供決策依據(jù),是當(dāng)前急需解決的問題。日益突出的油氣供需問題以及存儲的大量油氣開發(fā)數(shù)據(jù),要求科研技術(shù)人員能夠通過大數(shù)據(jù)技術(shù)高效應(yīng)用剩余油氣分布規(guī)律及油氣數(shù)據(jù)之間的內(nèi)在、有跡可循的聯(lián)系,從而推動油氣勘探大數(shù)據(jù)技術(shù)的廣泛應(yīng)用,以滿足企業(yè)生產(chǎn)經(jīng)營的實際需求。大數(shù)據(jù)技術(shù)的應(yīng)用可有效促進(jìn)油田智能化發(fā)展和建設(shè),從而實現(xiàn)互聯(lián)網(wǎng)技術(shù)與油田業(yè)務(wù)的深度融合,為油氣勘探開發(fā)提供更好的思路和方法。