周政宇
摘 要 隨著信息技術(shù)不斷發(fā)展,各種新進(jìn)技術(shù)不斷被應(yīng)用于我國各個行業(yè),促進(jìn)了我國各個行業(yè)的快速發(fā)展。大數(shù)據(jù)挖掘技術(shù)和信息管理技術(shù)應(yīng)用于各個行業(yè)生產(chǎn)的各個環(huán)節(jié),大大提升了各個行業(yè)生產(chǎn)的經(jīng)濟(jì)效益。因此本文在此技術(shù)上重點(diǎn)研究了大數(shù)據(jù)挖掘技術(shù)和信息管理在各個行業(yè)的應(yīng)用前景展望,從而更好促進(jìn)我國各個行業(yè)的發(fā)展。
關(guān)鍵詞 大數(shù)據(jù)挖掘技術(shù);信息管理;應(yīng)用前景展望
中圖分類號 G2 文獻(xiàn)標(biāo)識碼 A 文章編號 1674-6708(2019)236-0114-02
1 大數(shù)據(jù)挖掘技術(shù)
1.1 數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘就是通過一定的技術(shù)手段來研究數(shù)據(jù)背后的規(guī)律,學(xué)界一般這樣表述,數(shù)據(jù)挖掘技術(shù)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的工業(yè)生產(chǎn)數(shù)據(jù)中,通過一定的算法來提出數(shù)據(jù)背后隱含的、不為人知、同時又具有價值的規(guī)律的過程。數(shù)據(jù)挖掘任務(wù)有不同的分類,一般可以概括地分成:數(shù)據(jù)挖掘的任務(wù)一般可以分為兩類:分類和回歸。對于這種任務(wù)對于不同的算法可能二者又有一定的統(tǒng)一性。在進(jìn)行數(shù)據(jù)挖掘任務(wù)時,一般需要根據(jù)具體的任務(wù)來進(jìn)行判斷該任務(wù)是屬于哪一種任務(wù),是回歸還是分類,然后根據(jù)不同的任務(wù)來選擇合適的算法,從而使得數(shù)據(jù)挖掘出來的效果更加優(yōu)異。在開展數(shù)據(jù)挖掘時,要意識到數(shù)據(jù)是數(shù)據(jù)挖掘的基礎(chǔ),只有通過對于當(dāng)前數(shù)據(jù)的學(xué)習(xí),得到數(shù)據(jù)潛在的規(guī)律,才能更好對于未來的數(shù)據(jù)執(zhí)行一定的操作。但是這種預(yù)測是一定的概率,因此通過數(shù)據(jù)挖掘得出來的結(jié)論一般是具有統(tǒng)計規(guī)律的。一般來說,數(shù)據(jù)量越大,算法一定時,所發(fā)掘的規(guī)律更加準(zhǔn)確,在進(jìn)行預(yù)測時也會更加精準(zhǔn)。
1.2 各個行業(yè)的數(shù)據(jù)挖掘
為了更好促進(jìn)各個行業(yè)領(lǐng)域的發(fā)展,很多數(shù)據(jù)挖掘技術(shù)被廣泛應(yīng)用于各個行業(yè)生產(chǎn)的各個環(huán)節(jié)。對于不同的環(huán)節(jié)往往采用不同的數(shù)據(jù)模型,一般國內(nèi)外在把數(shù)據(jù)挖掘技術(shù)應(yīng)用于各個行業(yè)產(chǎn)業(yè)的過程中,主要是通過建立不同的數(shù)據(jù)挖掘模型,從而提高各個行業(yè)產(chǎn)業(yè)的發(fā)展。
我國主要將數(shù)據(jù)挖掘的相關(guān)技術(shù)應(yīng)用于各個行業(yè)儲層評價、施工方式的選擇、生產(chǎn)指標(biāo)的預(yù)測以及各個行業(yè)系統(tǒng)的診斷。對于不同環(huán)節(jié)的工作往往采用的算法不盡相同,基于傳統(tǒng)的機(jī)器學(xué)習(xí)的算法包括了決策樹、隨機(jī)森林、聚類算法以及粗糙集等,基于深度學(xué)習(xí)的方法可以應(yīng)用于分類和回歸等各個環(huán)節(jié)。但是深度學(xué)習(xí)的數(shù)據(jù)挖掘算法往往需要很大的數(shù)據(jù)集進(jìn)行訓(xùn)練,同時還需要人為進(jìn)行數(shù)據(jù)集的標(biāo)定等等,但是基于深度學(xué)習(xí)的方法往往在準(zhǔn)確率方面的性能遠(yuǎn)超于傳統(tǒng)的機(jī)器學(xué)習(xí)。這是因?yàn)樯疃葘W(xué)習(xí)的算法能夠具有以下的特點(diǎn),第一學(xué)習(xí)深度特征、第二自主學(xué)習(xí),第三非線性映射、第四較強(qiáng)泛化能力。雖然深度學(xué)習(xí)的模型在訓(xùn)練和調(diào)試方面需要投入大量的人力物力,但是一旦模型被訓(xùn)練好之后就可以一直使用。我國很多研究人員將深度學(xué)習(xí)的數(shù)據(jù)挖掘技術(shù)應(yīng)用在稠油開采方式進(jìn)行篩選,取得了很好的效果,在各項(xiàng)性能方面都超過了傳統(tǒng)的數(shù)據(jù)挖掘算法。
2 信息管理技術(shù)概述
根據(jù)相關(guān)調(diào)查,現(xiàn)階段信息管理技術(shù)已經(jīng)被廣泛應(yīng)用于我國各個行業(yè),通過信息管理技術(shù)能夠整合企業(yè)的資源,優(yōu)化企業(yè)的辦事效率,提高對于知識、材料管理的效率,大大提高了各個環(huán)節(jié)的生產(chǎn)和工作效率,從而保障了企業(yè)的經(jīng)濟(jì)效益。很多企業(yè)都已意識到信息化管理能夠極大提升了管理的效率,但是沒有去大力發(fā)展這個技術(shù),很大原因是信息化技術(shù)管理存在著很大的安全隱患。不法分子能夠利用信息化技術(shù)去竊取信息系統(tǒng)的信息,信息安全受到很大的威脅。另一方面,由于信息技術(shù)的開放性,目前的技術(shù)很難保證信息技術(shù)的絕對安全,同時我國對于信息化監(jiān)管制度不夠完善,監(jiān)管部門對于信息化安全的監(jiān)察力度不夠,導(dǎo)致了很多不法分子利用信息技術(shù)盜取公司機(jī)密案件的發(fā)生,給公司帶來了嚴(yán)重的經(jīng)濟(jì)損失。
3 基于大數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)特點(diǎn)
3.1 大數(shù)據(jù)技術(shù)的特點(diǎn)
相關(guān)性是大數(shù)據(jù)技術(shù)很重要的一個特征。在大數(shù)據(jù)環(huán)境下,通過分析數(shù)據(jù)之間的相關(guān)性,往往可以得出來很重要的結(jié)論。具體的實(shí)現(xiàn)過程就是通過相關(guān)分析大量數(shù)據(jù)來挖掘數(shù)據(jù)背后存在的顯著性的統(tǒng)計因素,然后利用這些統(tǒng)計因素進(jìn)一步分析得到預(yù)期結(jié)果。進(jìn)行相關(guān)分析的技術(shù)手段有很多,常見的手段有基于最小二乘方法或者利用多回歸模型來構(gòu)建大數(shù)據(jù)模型,然后進(jìn)行回歸分析得到影響變量的主要因素,然后這些因素就可以廣泛應(yīng)用于各個行業(yè)勘測的風(fēng)險預(yù)測工程中,這個過程就不用使用基于風(fēng)險評估的手段進(jìn)行了。往往通過大數(shù)據(jù)得出來的影響因素可以直接用在各個行業(yè)生產(chǎn)的各個環(huán)節(jié)的過程中,可以有效預(yù)測出各個行業(yè)生產(chǎn)各個指標(biāo)的發(fā)展趨勢。因此,在大數(shù)據(jù)技術(shù)的背景下,大量的數(shù)據(jù)為各個行業(yè)生產(chǎn)的各個環(huán)節(jié)的發(fā)展奠定了基礎(chǔ),通過相關(guān)分析就可以很快得到各個行業(yè)生產(chǎn)各項(xiàng)指標(biāo)的參數(shù)以及風(fēng)險評估情況,以此制定的各個行業(yè)生產(chǎn)計劃更加的科學(xué)合理。
3.2 云計算為大數(shù)據(jù)挖掘技術(shù)提供了可靠支持
云計算技術(shù)使得大數(shù)據(jù)技術(shù)計算實(shí)現(xiàn)了可能,同時它擴(kuò)展了虛擬技術(shù)、分布式技術(shù)、并行技術(shù)等技術(shù)框架,為大數(shù)據(jù)計算提供了靈活性和可擴(kuò)展性的應(yīng)用程序服務(wù)、資源存儲服務(wù)等云服務(wù),幾乎涵蓋了所有的信息資源。包括數(shù)據(jù)資源、應(yīng)用程序、計算資源、存儲資源和基礎(chǔ)設(shè)施等都可以從云服務(wù)中獲得。但是云計算存在著很大的安全隱患,這也是限制它發(fā)展的很重要的一個因素,但是云計算提供了很大的快捷性和可靠性。通過云服務(wù),工程審計人員可以構(gòu)建數(shù)據(jù)云,從而利用數(shù)據(jù)云的大量數(shù)據(jù)進(jìn)行審計業(yè)務(wù)的開展與實(shí)施。
4 大數(shù)據(jù)挖掘技術(shù)和信息管理技術(shù)的應(yīng)用
4.1 能夠有效提高各個行業(yè)產(chǎn)量
隨著信息技術(shù)不斷發(fā)展,各個行業(yè)生產(chǎn)的各個環(huán)節(jié)已經(jīng)實(shí)現(xiàn)了自動化、智能化和信息化。本文以信息管理技術(shù)和數(shù)據(jù)挖掘技術(shù)在石油行業(yè)的應(yīng)用為例,通過各種智能傳感器和物聯(lián)網(wǎng)技術(shù)能夠采集油田生產(chǎn)環(huán)節(jié)的各種數(shù)據(jù),這些數(shù)據(jù)包括了采油與地面工程的生產(chǎn)、作業(yè)等各個類型的數(shù)據(jù),這些數(shù)據(jù)能夠儲存在數(shù)據(jù)庫中,為開展數(shù)據(jù)挖掘算法研究了提供了第一手?jǐn)?shù)據(jù)。通過信息管理系統(tǒng)對于各個生產(chǎn)管理環(huán)節(jié)的管理對于行業(yè)環(huán)節(jié),尤其以中各個行業(yè)A5系統(tǒng)為代表的。A5系統(tǒng)的推廣和油氣生產(chǎn)物聯(lián)網(wǎng)系統(tǒng)A11的實(shí)施,為采集各個行業(yè)生產(chǎn)環(huán)節(jié)的數(shù)據(jù)做出了重要貢獻(xiàn),然后通過數(shù)據(jù)挖掘技術(shù)來提出數(shù)據(jù)背后隱藏的規(guī)律,從而更好地指導(dǎo)各個行業(yè)生產(chǎn),能夠保障各個行業(yè)企業(yè)的經(jīng)濟(jì)效率。把數(shù)據(jù)挖掘技術(shù)應(yīng)用各個行業(yè)生產(chǎn)的環(huán)節(jié)具有很多優(yōu)點(diǎn),能夠保障管理人員根據(jù)預(yù)測的指標(biāo)和風(fēng)險評估來制定相應(yīng)的生產(chǎn)技術(shù),同時這些預(yù)測的指標(biāo)往往是基于大數(shù)據(jù)得出來的統(tǒng)計規(guī)律,往往更具有一般性。管理者利用這些指標(biāo)來指導(dǎo)各個行業(yè)生產(chǎn),往往可以有效提升油田產(chǎn)量、采收率、效率、效益。
4.2 網(wǎng)絡(luò)化發(fā)展
近些年隨著各個行業(yè)信息技術(shù)的不斷發(fā)展,行業(yè)的基于信息管理的物聯(lián)網(wǎng)技術(shù)也得到了很大的提升。監(jiān)督管理人員在任何地點(diǎn)都可以對于各個行業(yè)生產(chǎn)的各個環(huán)節(jié)進(jìn)行有效的監(jiān)督,這一技術(shù)得以實(shí)現(xiàn)主要由于網(wǎng)絡(luò)化技術(shù)的發(fā)展。另外一方面,隨著工業(yè)化網(wǎng)絡(luò)系統(tǒng)的發(fā)展,各個行業(yè)生產(chǎn)環(huán)節(jié)也越來越智能化,智能傳感器通過使用數(shù)據(jù)挖掘技術(shù)能夠?qū)τ谙到y(tǒng)的相關(guān)參數(shù)進(jìn)行合理分析,一般發(fā)現(xiàn)異常就通過控制系統(tǒng)向相關(guān)管理系統(tǒng)發(fā)送錯誤報告,從而對于故障進(jìn)行合理的修復(fù)。網(wǎng)絡(luò)化的技術(shù)使得人們加強(qiáng)了對于生產(chǎn)環(huán)節(jié)的控制力度,從而更好促進(jìn)我國各個行業(yè)的發(fā)展。
4.3 環(huán)保工藝生產(chǎn)制造
目前,我國經(jīng)濟(jì)發(fā)展對于我國環(huán)境產(chǎn)生了一定的破壞作用,但是基于大數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)地應(yīng)用為解決這個問題提供了可行的解決方案,使用基于數(shù)據(jù)的信息管理和數(shù)據(jù)挖掘技術(shù)充分符合我國的綠色設(shè)計理念,提高了產(chǎn)品設(shè)計科學(xué)性和合理性,以最小的資源獲得最大的經(jīng)濟(jì)發(fā)展,同時在生產(chǎn)技術(shù)和生產(chǎn)工藝方面都得到了優(yōu)化,減少了廢料廢氣的排放,更好促進(jìn)了我國產(chǎn)業(yè)的綠色發(fā)展,符合我國可持續(xù)發(fā)展理念。
5 結(jié)論
綜上所述,信息管理技術(shù)和大數(shù)據(jù)挖掘技術(shù)能夠最大程度提高各個行業(yè)企業(yè)的經(jīng)濟(jì)效益。通過大數(shù)據(jù)得出來的結(jié)論往往比人主觀得出來的結(jié)論更加可靠,得到的規(guī)律更加具有普遍性。同時能夠保證信息管理技術(shù)的高效性,提高企業(yè)的管理效率,從而保障企業(yè)的經(jīng)濟(jì)效益。
參考文獻(xiàn)
[1]蔣孝明.基于LINQ的人事檔案管理系統(tǒng)的設(shè)計與實(shí)現(xiàn)[J].計算機(jī)與現(xiàn)代化,2014(3):69-72.
[2]王培吉,趙玉琳,呂劍峰.基于Apriori算法的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘研究[J].統(tǒng)計與決策,2011(23):19-21.
[3]崔海福,何貞銘,王寧.大數(shù)據(jù)在石油行業(yè)中的應(yīng)用[J].石油化工自動化,2016(2):43-45.
[4]鄭曉蓮.各個行業(yè)企業(yè)開展“互聯(lián)網(wǎng)+培訓(xùn)”的探討[J].各個行業(yè)教育,2016(02).
[5]檀朝東,陳見成,劉志海,等.大數(shù)據(jù)挖掘技術(shù)在石油工程的應(yīng)用前景展望[J].中國石油和化工,2015(1):49-51.
[6]李智鵬,許京國,焦?jié)?如何運(yùn)用大數(shù)據(jù)技術(shù)優(yōu)化石油上游產(chǎn)業(yè)[J].石油工業(yè)計算機(jī)應(yīng)用,2015(1):8-12.