張熔
摘 要:近年來,隨著計算機應用技術的成熟和信息系統(tǒng)硬件的不斷進步,互聯(lián)網加、云計算、大數據等概念陸續(xù)出爐,并迅速得以廣泛傳播,在筆者看來,這是一個循序漸進的必然發(fā)展過程,但其發(fā)展之快也著實出乎意料?!盎ヂ?lián)網加”重在數據的共享和收集,使社會的一個獨立個體融入網絡共享體系中,在獲得網絡集合資源的同時,也被網絡自動集合為共享資源的一部分;如果說“互聯(lián)網加”是信息資源的共享,那么“云計算”就可以說是計算資源的共享,“云計算”的推出在很大程度上突破了個體硬件計算能力的限制,使得高計算能力實現了普及化和經濟性,進而推進“互聯(lián)網加”的巨大信息量實現了個體性的資源整合;“大數據”是在“互聯(lián)網加”和“云計算”蓬勃發(fā)展的基礎上應運而生的,就是將共享資源進行歸集、整合、計算、分析,并最終運用于所需領域。本文從信息統(tǒng)計系統(tǒng)的特性入手,結合大數據的理念,從功能性和實用性兩個角度重點論述大數據在信息系統(tǒng)建設方面的作用和應用。
關鍵詞:大數據;石油石化;信息系統(tǒng)
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1671-2064(2019)05-0020-02
本文筆者目前正在籌備建設石油石化行業(yè)統(tǒng)計信息系統(tǒng),經過一段時間的研究和摸索,于系統(tǒng)的初始設計方面頗有些感想。筆者認為,要想將大數據的理念充分運用于統(tǒng)計信息系統(tǒng),有必要先簡單論述統(tǒng)計信息系統(tǒng)存在的一些共同特性,這些特性并不局限于某個行業(yè),具有一定的普適性,但這也正是系統(tǒng)需求的基礎,一切的系統(tǒng)開發(fā)和理念運用難免以此為基石,且簡述如下:
1 可靠性
可靠性包括了真實性和全面性。對于統(tǒng)計數據而言,準確的說應該是相對真實性和相對全面性,由于統(tǒng)計數據本身并不具有嚴格的核對邏輯,一般也不對外進行披露和評審,從數據監(jiān)管的角度也很難形成有效的強制性和約束性,而且,統(tǒng)計系統(tǒng)本身對數據的需求也具有樣本性特征,所以,對統(tǒng)計數據要求精確性,既沒有必要也不太現實,否則難免造成成本的增加,影響系統(tǒng)的經濟性。但是,雖不要求數據精確,但數據的相對準確和全面是必要的,此為核心要求,對統(tǒng)計系統(tǒng)的結果具有重大影響。所謂數據的可靠性是指數據的收集流程和收集途徑是合理且真實的,是來源于與數據應用需求直接或正向相關的應用領域,數據是可收集、可統(tǒng)計的,并且統(tǒng)計手段是真實、合理、有效的;所謂數據的真實性是數據的收集在相關性可確定的基礎上并不對數據進行人為的篩選和統(tǒng)計干擾,雖然數據的后期整理可以排除邊緣性樣本的特殊性和不合理性,但并不代表在初期數據收集時即可具有傾向性的初步數據排除,原始數據的統(tǒng)計和收集還是應該以確保全面性為首要目標。
2 相關性
相關性即是指有用性,這就對系統(tǒng)設計者的業(yè)務能力和前瞻性提出了較高的要求,數據的相關性和可靠性是互相影響、相輔相成的。首先相關性是以可靠性為基礎的,數據如果達不到基本的可靠性要求,更不用考慮其相關性;其次合理選取有效性的信息進行統(tǒng)計和抽取,在降低工作成本和提高工作效率的同時,有效降低數據不真實或者不準確的概率,間接提高數據的可靠性。對于相關性的判斷是需要一個企業(yè)或者一個集團在系統(tǒng)設計時根據實際工作經驗和歷史數據特點進行合乎邏輯的職業(yè)判斷,該特性的應用更多的來源于企業(yè)內部技術骨干及管理人員的頂層設計,合理的設計理念和通暢的數據收集途徑是保證統(tǒng)計數據能夠實現相關性的必要前提,而“大”和“云”對于數據的相關性而言只不過是技術手段和輔助方式而已。如果不能保證數據的相關性,那么全面的數據恐怕反而會帶來令人困惑的統(tǒng)計結果。
3 可比性
可比性要求統(tǒng)計數據應當相互可比,可比性包括橫向和縱向兩個方面。
3.1 不同期間產生的數據可比,即縱向可比
為達到此要求,系統(tǒng)在抽取數據時,應保證前后期一致,即使發(fā)生了統(tǒng)計政策的變更,也應當按規(guī)定方法進行追溯調整,以保證數據的前后一致。當然,數據統(tǒng)計手段的一致性并不是說系統(tǒng)邏輯一旦設定,就不能進行修改或不應進行修改,恰恰相反,要想讓系統(tǒng)數據發(fā)揮應有的功能,需要不斷對系統(tǒng)進行完善和升級,但是在升級和修改的同時,需要注意對歷史數據的調整,對于有重大影響的,考慮是否需要進行追溯既往,或者對于只影響未來數據或者邏輯變動對整體統(tǒng)計系統(tǒng)不構成重大影響的,也可以使用未來適用法。
3.2 同一期間內,不同個體之間的數據可比,即橫向可比
為了達到此要求,應結合行業(yè)特點制定相對通用的取數邏輯和統(tǒng)計標準,避免統(tǒng)計數據的過分獨立性,無法與其他資源進行有效的整合,無法與大數據體系相融合。
4 時效性
對于任何統(tǒng)計性工作來說,時效性都是一個不可忽視的指標,一旦超過了有效時限,實時數據就會變成歷史數據,歷史數據固然對事物規(guī)律的探求和數據模型的建立有重要的意義,但對于需要依靠現實數據進行的分析和決策輔助的意義就不是太大,因此,要想充分發(fā)揮大數據的效用,時效性必須得到某種程度的保障。
在統(tǒng)計信息系統(tǒng)具備了以上基礎特性的基礎上,筆者認為,對于石油行業(yè)來說,還應該在以下幾個方面進行補充和強化,以更好的適用于本行業(yè)的分析和決策。
4.1 兼顧歷史性
上文已經提到,數據的統(tǒng)計應具有可比性,其中包括縱向可比性,也就是與其他期間數據的可進行對比分析。對于石油行業(yè)來說,這項特性尤其重要,故而筆者認為,在設計該行業(yè)的統(tǒng)計信息系統(tǒng)時,更應該注意對歷史數據的兼容。石油行業(yè)具有投入周期長,持續(xù)生產周期長,技術基礎穩(wěn)定周期長的特點,所以,石油行業(yè)的歷史數據往往具備更大的可參考性,同時雖然開采技術發(fā)展迅速,勘探設備日益完善,分析理念日趨成熟,但是對于現場作業(yè)和即時決策而言,豐富的經驗和深厚的閱歷依然具備非常大的可借鑒價值,對歷史數據的統(tǒng)計和對歷史事件的分析依然能對現代開采決策做出較大的貢獻,因此,對于如此悠久,又創(chuàng)造出如此多奇跡的石油行業(yè)來說,注重歷史應與關注未來同等重要。
4.2 可擴展性
前文說到注重歷史與關注未來同等重要,對于未來的關注就體現在系統(tǒng)的可擴展性上。現今而言,石油行業(yè)處于相對穩(wěn)定和成熟的階段,雖然原油價格受國際形勢變動影響巨大,但單獨針對石油行業(yè)的技術和決策體系來看,還是相對制度化和固定化的。同時,我們也不可不對未來進行一定的技術性前瞻,目前頁巖油、新能源等技術正處于行業(yè)爆發(fā)期,一旦某項具有比較強的替代性的資源產生了創(chuàng)新性的變革,難免會對整個石油行業(yè)產生巨大的影響,所以,筆者認為,石油行業(yè)的統(tǒng)計信息系統(tǒng)應該重視可擴展性,簡而言之,原因有二。一是從目前來看,石油行業(yè)還有很長的發(fā)展階段,現在的數據對未來的行業(yè)發(fā)展是筆具有相當價值的財富,所以需要能適用于未來的發(fā)展變化;二是不排除重大變革的產生對石油行業(yè)造成毀滅性變革的可能性,那么在這種情況下,無論是石油行業(yè)進行轉型,還是新生行業(yè)展開徹底顛覆,系統(tǒng)的可擴展性都是對未來的一種主動適應準備。
4.3 整體性
石油行業(yè)普遍的一個特點就是縱向一體化,每一個成熟的有競爭力的石油經濟體都是巨無霸的體量,因此在該行業(yè)設計統(tǒng)計信息系統(tǒng)時應通盤考量集團性企業(yè)的整體需求,從上游到下游,從建造到科研,從開采到煉化,應從整體的角度進行頂層設計。筆者認為,對于小型企業(yè),系統(tǒng)的設計應該是自下而上的,從最終需求端提出具體需求開始,這樣才能更好的體現系統(tǒng)的實用性,但是,對于大型集團化企業(yè)來說,系統(tǒng)的設計應該是自上而下的,由頂層從總體需求的角度進行需求設計,一方面可以規(guī)避個體需求矛盾性的,達到集團利益最大化,另一方面可以統(tǒng)一基礎操作單元,避免由于不同的軟件體系基礎造成的數據不可共享。
4.4 銜接性
石油行業(yè)從某種程度上看是一個相對簡單的行業(yè),沒有繁復無常的花樣與套路,無非建、采、煉、銷四大板塊,所以從這個角度看,石油行業(yè)的需求是固定而且明確的,所以石油行業(yè)的統(tǒng)計信息系統(tǒng)在設計時就需要確定服務的指向性,根據具體需求和希望達到的效果,將數據的統(tǒng)計分析與實際業(yè)務緊密的銜接起來,切不可閉門造車,單干蠻干苦干。此處大數據的應用具有一定的借鑒價值,從目前大數據的應用來看,大數據分析與軟件基礎建模具有互相輔助的特性,通過對大數據的應用,可以分析基礎行業(yè)的需求以及達到此需求可使用的數據路徑;而通過對軟件模型的不斷完善,可以更有針對性的抽取有價值的大數據,對軟件的實用性和針對性具有重大意義。
對于石油行業(yè)而言,一方面要根據行業(yè)特點對系統(tǒng)記性針對性的設計,另一方面也要針對時代的發(fā)展和進步,做出合適的應對,對大數據的應用可謂是不可忽視的研究課題之一,對此,筆者認為可以從以下幾個具體的層面進行統(tǒng)計信息系統(tǒng)與大數據應用的融合。
4.4.1 操作運用層
從最基層的操作層面而言,數據的集合性,信息的共享性和強大的計算性這些大數據應用所具備的最基本特征就可以滿足諸多方面的具體需求,最典型的應用是在與后勤服務板塊,前文已經提到,石油行業(yè)是個普遍縱向一體化的集團性企業(yè)充斥的行業(yè),大型集團型石油企業(yè)一般都有強大的后勤供給支持團隊,無論從物流配送、物料采辦,還是從船舶調度、勞工調配的角度,大數據的應用都直接的做出了突出的貢獻,將大數據體系結合到企業(yè)自身開發(fā)設計的統(tǒng)計信息系統(tǒng)中可以顯著節(jié)約企業(yè)運營成本,提高企業(yè)配給效率,降低企業(yè)經營風險。
4.4.2 統(tǒng)計分析層
前文所述,歷史數據對石油行業(yè)具有重要的地位,對歷史數據的統(tǒng)計和分析可以借古塑今,擴展工作思路;對即時數據的統(tǒng)計和分析可以預先警示,及時發(fā)現問題。而大數據應用的特點就是數據的集合和數據的計算,在建立大數據應用統(tǒng)計信息系統(tǒng)的基礎上,石油行業(yè)企業(yè)需要做的更多的是根據實際業(yè)務特點和需求設計分析模型和預警機制,從根本上為數據的實際應用性提供了可靠地支持和堅實的基礎。
4.4.3 輔助決策層
石油行業(yè)的特點之一是不確定性較強,投資具有一定的風險性,而收益又往往具有集中性和爆發(fā)性的特點,所以石油行業(yè)投資從某種程度上來看是一種比較高風險、高投入、高回報的投資。針對這一行業(yè)特點,投資決策就顯得格外重要,不論是勘探、開發(fā)還是生產,投資決策都是重中之重。而大數據應用的共享性和全面性可以在一定程度上作為決策制定的有效輔助手段,通過對更多元化更多層次更多角度的數據的綜合運用和整體分析,可以有效的對不符合既定目標的選項進行篩選,進而提高決策的正確性和可靠性,從更根源的層面對行業(yè)的健康穩(wěn)定蓬勃發(fā)展做出貢獻。
綜上所述,在石油石化行業(yè)設計統(tǒng)計信息系統(tǒng)需要結合石油石化行業(yè)的具體需求和業(yè)務特點,并且充分利用大數據應用理念的數據優(yōu)勢和計算優(yōu)勢,同時從多個層次多個角度綜合發(fā)揮大數據應用的不同特性,從而建立通用性、擴展性、整體性和銜接性相互結合的大數據統(tǒng)計應用體系。