劉昆
摘要:近些年來(lái),物聯(lián)網(wǎng)以及移動(dòng)通信互聯(lián)網(wǎng)技術(shù)的突飛猛進(jìn),使得人類社會(huì)有著翻天覆地的變化,海量數(shù)據(jù)同時(shí)也呈現(xiàn)爆炸式的增長(zhǎng),加快了大數(shù)據(jù)時(shí)代的發(fā)展。對(duì)于如何從海量數(shù)據(jù)中提取價(jià)值的信息始終是各個(gè)企業(yè)部門(mén)關(guān)注的焦點(diǎn)之一。本研究則對(duì)計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)展開(kāi)研究。
關(guān)鍵詞:計(jì)算機(jī);數(shù)據(jù)挖掘;技術(shù)
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)01-0257-02
隨著人類進(jìn)入信息化時(shí)代,越來(lái)越多的數(shù)據(jù)需要處理,人類進(jìn)入“大數(shù)據(jù)時(shí)代”,人類對(duì)信息的掌握達(dá)到前所未有的速度、厚度、細(xì)度和準(zhǔn)確度。面對(duì)大量的數(shù)據(jù),對(duì)這些數(shù)據(jù)進(jìn)行挖掘和分析,并將這些運(yùn)用到各行各業(yè)的發(fā)展中,推動(dòng)社會(huì)的不斷發(fā)展,成為當(dāng)今大數(shù)據(jù)時(shí)代的必行之路。在此環(huán)境下計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)也有廣泛應(yīng)用及發(fā)展。
1大數(shù)據(jù)挖掘技術(shù)的應(yīng)用及發(fā)展
數(shù)據(jù)挖掘的實(shí)際應(yīng)用功能大致分為分類去隔法、推算預(yù)測(cè)法、序列規(guī)則法等三類。具體又分為分類、聚類、回歸、時(shí)間、關(guān)聯(lián)、序列六個(gè)分項(xiàng)。數(shù)據(jù)挖掘利用這些分項(xiàng)功能對(duì)大量數(shù)據(jù)進(jìn)行挖掘,發(fā)現(xiàn)那些被隱藏的信息對(duì)于社會(huì)的發(fā)展有巨大潛在價(jià)值[1]。
數(shù)據(jù)挖掘過(guò)程是一個(gè)復(fù)雜的建模過(guò)程。大量的復(fù)雜數(shù)據(jù)為建模提供依據(jù),各種數(shù)理模型能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行有效的分析和整理,從而獲取有用的信息數(shù)據(jù)幫助用戶了解情況,為客戶劃分市場(chǎng)尋找對(duì)策提供最基礎(chǔ)最有效的數(shù)據(jù)支持。在數(shù)據(jù)挖掘中也需要得到相關(guān)知識(shí)及技術(shù)的支持。數(shù)據(jù)挖掘過(guò)程是一個(gè)復(fù)雜而細(xì)致的過(guò)程,數(shù)據(jù)挖掘過(guò)程還需要聯(lián)機(jī)分析與處理系統(tǒng)、專家系統(tǒng)及模式識(shí)別系統(tǒng)等科學(xué)方法的支持。數(shù)據(jù)挖掘是一種運(yùn)用數(shù)據(jù)搜素技術(shù)分析整理企業(yè)所需技術(shù)的方法[2]。規(guī)律性的聯(lián)系被隱藏在大量的數(shù)據(jù)中,數(shù)據(jù)挖掘就是把這種隱藏關(guān)系進(jìn)行搜索和分析,在數(shù)據(jù)挖掘過(guò)程中,通過(guò)數(shù)據(jù)建模對(duì)大量數(shù)據(jù)進(jìn)行分析,利用數(shù)據(jù)模型把隱藏在大量數(shù)據(jù)之中的關(guān)聯(lián)性、規(guī)律性從數(shù)據(jù)中提取出來(lái)。
當(dāng)今社會(huì)已經(jīng)進(jìn)入大數(shù)據(jù)時(shí)代,從數(shù)據(jù)的發(fā)展現(xiàn)狀來(lái)看,工業(yè)、農(nóng)業(yè)以及軍事等各行各業(yè)的信息化發(fā)展環(huán)境下,必定會(huì)出現(xiàn)海量信息數(shù)據(jù)需要處理,這就對(duì)數(shù)據(jù)挖掘和數(shù)據(jù)分析提出更高的要求。隨著社會(huì)的發(fā)展,數(shù)據(jù)在不斷地增加和更新,數(shù)據(jù)挖掘和分析的技術(shù)也在不斷的進(jìn)步?,F(xiàn)行條件下數(shù)據(jù)分析方法大致分為描述性分析、推斷性分析、差異性分析、相關(guān)性分析、預(yù)測(cè)分析五大類。這幾種數(shù)據(jù)分析方法相互配合,為企業(yè)或機(jī)構(gòu)的發(fā)展和需求提供必要的數(shù)據(jù)分析結(jié)構(gòu)和信息資源,促進(jìn)企業(yè)或機(jī)構(gòu)的高效管理和競(jìng)爭(zhēng)力[3]。
大數(shù)據(jù)處理中,應(yīng)用系統(tǒng)的根本建設(shè),紀(jì)要做好融合式架構(gòu)結(jié)構(gòu)的合理應(yīng)用,在客戶/服務(wù)器架構(gòu)的應(yīng)用中,服務(wù)器主要是實(shí)現(xiàn)整個(gè)應(yīng)用系統(tǒng)的一種管理和控制,在調(diào)度的過(guò)程中,實(shí)現(xiàn)相關(guān)程序邏輯數(shù)據(jù)的應(yīng)用??蛻舳送窃谟脩艚换サ娜孑斎牒洼敵鲞^(guò)程中,對(duì)相關(guān)的任務(wù)進(jìn)行完成,并結(jié)合客戶點(diǎn)的服務(wù)器請(qǐng)求發(fā)出,借助于服務(wù)器的實(shí)現(xiàn)過(guò)程。融合式的協(xié)同,在實(shí)際的架構(gòu)應(yīng)用中,有著簡(jiǎn)單性的基本特點(diǎn),實(shí)際的維護(hù)過(guò)程中,對(duì)于服務(wù)器依賴性相對(duì)較強(qiáng),并對(duì)于整個(gè)系統(tǒng)的有著直接性的維護(hù)過(guò)程[4]。
分散式的架構(gòu)應(yīng)用中,通過(guò)做好節(jié)點(diǎn)的協(xié)同控制,在系統(tǒng)的相關(guān)控制管理過(guò)程中,注重客戶段模塊的分散,在系統(tǒng)自治實(shí)現(xiàn)中,始終本著靈活性和開(kāi)放性的基本特點(diǎn),做好數(shù)據(jù)分布存儲(chǔ),實(shí)現(xiàn)各個(gè)系統(tǒng)的一種獨(dú)立處理。混合式結(jié)構(gòu)在實(shí)際的應(yīng)用中,將數(shù)據(jù)信息的一致性維護(hù)綜合實(shí)現(xiàn),并做好用戶管理和信息的全面轉(zhuǎn)發(fā),而用戶和客戶端實(shí)現(xiàn)的交互過(guò)程中,注重客戶段計(jì)算機(jī)資源的充分利用,將服務(wù)器的工作壓力有效減輕,并將服務(wù)器的瓶頸效應(yīng)有效減輕,實(shí)現(xiàn)系統(tǒng)的一種靈活性運(yùn)動(dòng),實(shí)現(xiàn)系統(tǒng)信息的一致性發(fā)展和應(yīng)用[5]。
2計(jì)算機(jī)數(shù)據(jù)深度挖掘?qū)崿F(xiàn)對(duì)策
在企業(yè)發(fā)展過(guò)程中,必須要有效開(kāi)發(fā)大數(shù)據(jù)資源,在此環(huán)境下也就出現(xiàn)了數(shù)據(jù)深度挖掘。企業(yè)中具有海量寶貴數(shù)據(jù)資源,這些資源的有效應(yīng)用對(duì)其企業(yè)發(fā)展具有重要作用,因此均希望能夠在海量數(shù)據(jù)中提取有效信息。其中深度數(shù)據(jù)挖掘則可以分成三個(gè)階段,分別是:準(zhǔn)備階段、挖掘階段和結(jié)果表達(dá)解釋工作。在數(shù)據(jù)挖掘過(guò)程中有關(guān)聯(lián)分析、聚類分析和演變態(tài)勢(shì)分析等多種方式,可以依照數(shù)據(jù)的不同特點(diǎn),構(gòu)建相應(yīng)的分類模型,這樣不但能夠詳細(xì)分析數(shù)據(jù)種類,并且還能夠?qū)崿F(xiàn)數(shù)據(jù)狀態(tài)細(xì)化,從而制定相應(yīng)的營(yíng)銷(xiāo)對(duì)策,確定更具有價(jià)值的客戶群體。在上進(jìn)行數(shù)據(jù)分類之前可以首先進(jìn)行評(píng)估,之后基于評(píng)估結(jié)果實(shí)施數(shù)據(jù)預(yù)分類,并再次進(jìn)行優(yōu)化修正[6]。
數(shù)據(jù)預(yù)測(cè)具有重要應(yīng)用價(jià)值,在數(shù)據(jù)深度挖掘中是一個(gè)重要流程,同時(shí)在數(shù)據(jù)挖掘中也具有高級(jí)應(yīng)用價(jià)值。預(yù)測(cè)不但是進(jìn)行大數(shù)據(jù)估計(jì),主要是要實(shí)現(xiàn)大數(shù)據(jù)的準(zhǔn)確預(yù)判,預(yù)測(cè)需要對(duì)之前所收集的信息數(shù)據(jù)進(jìn)行分類整理,抽象性分析現(xiàn)實(shí)世界中的應(yīng)用價(jià)值,從而構(gòu)建初步模型。之后既可以從信度和效度兩方面實(shí)現(xiàn)數(shù)據(jù)模型的相關(guān)檢驗(yàn),以能夠顯著提升模型的準(zhǔn)確性。構(gòu)建模型本身也就屬于是一個(gè)數(shù)據(jù)模擬過(guò)程,主要作用也就是通過(guò)數(shù)據(jù)進(jìn)行企業(yè)未來(lái)的發(fā)展趨勢(shì)預(yù)測(cè),并最大化的提高其預(yù)測(cè)結(jié)果的準(zhǔn)確性。所收集的信息數(shù)據(jù)屬于是過(guò)去,所代表的也只能是過(guò)去,但是在數(shù)據(jù)模型下則可以對(duì)這些數(shù)據(jù)的基本機(jī)制找出,從而對(duì)未來(lái)起到預(yù)測(cè)作用。過(guò)去的數(shù)據(jù)不但能夠代表過(guò)去,同時(shí)對(duì)于未來(lái)預(yù)測(cè)也具有重要價(jià)值。數(shù)據(jù)預(yù)測(cè)本身具有一定復(fù)雜性,據(jù)不完全統(tǒng)計(jì),數(shù)據(jù)預(yù)測(cè)方法已經(jīng)有幾百種模型,常用模型就能夠達(dá)到好幾十種,所以對(duì)于數(shù)據(jù)預(yù)測(cè)模型則還需要進(jìn)一步優(yōu)化改進(jìn)。現(xiàn)實(shí)世界相當(dāng)復(fù)雜,目前數(shù)據(jù)模型預(yù)測(cè)技術(shù)已經(jīng)迅速發(fā)展,但是要對(duì)其作用有全面認(rèn)識(shí),預(yù)測(cè)并不能夠徹底代表現(xiàn)實(shí),目前已經(jīng)存在的模型則無(wú)法有效滿足當(dāng)前業(yè)務(wù)所需。在當(dāng)前企業(yè)中常用的模型中種類比較多,其中有AR模型、MA模型以及非線性回歸等預(yù)測(cè)模型。同時(shí)也會(huì)應(yīng)用到專業(yè)級(jí)統(tǒng)計(jì)應(yīng)用軟件,包括有SPSS、MATLAB以及矩陣實(shí)驗(yàn)室等等,進(jìn)一步方便進(jìn)行數(shù)據(jù)深度挖掘。
3計(jì)算機(jī)數(shù)據(jù)精細(xì)管理
數(shù)據(jù)挖掘技術(shù)的應(yīng)用能夠顯著提升企業(yè)的洞察力,大數(shù)據(jù)的精細(xì)化管理能夠?yàn)槠髽I(yè)提供重要保障。當(dāng)前,只有在大型企業(yè)中才出現(xiàn)大數(shù)據(jù)的精細(xì)管理,特別是在一些互聯(lián)網(wǎng)或其他高科技企業(yè),大數(shù)據(jù)深度挖掘技術(shù)無(wú)法滿足企業(yè)海量數(shù)據(jù)處理要求。就算是有些企業(yè)有數(shù)十年的數(shù)據(jù)量,但是依舊沒(méi)有實(shí)現(xiàn)大數(shù)據(jù)水平。在企業(yè)發(fā)展中,不管是經(jīng)濟(jì)利潤(rùn)還是客戶為中心,大數(shù)據(jù)精細(xì)管理均能夠產(chǎn)生相應(yīng)的促進(jìn)作用,從而確保企業(yè)健康發(fā)展。大數(shù)據(jù)精細(xì)管理則能夠?yàn)槠髽I(yè)管理提供重要參考意見(jiàn),為企業(yè)市場(chǎng)競(jìng)爭(zhēng)發(fā)展提供理論支持。
4 結(jié)束語(yǔ)
“大數(shù)據(jù)”這個(gè)概念雖然在近幾年內(nèi)才出現(xiàn),但是這個(gè)概念卻迅速地被世界各地人民所接受和應(yīng)用。大數(shù)據(jù)挖掘和分析技術(shù)需要各地人民進(jìn)行努力。我國(guó)在大數(shù)據(jù)挖掘和分析的道路上需要加強(qiáng)對(duì)大數(shù)據(jù)的獲取與掌握的重視,加快對(duì)大數(shù)據(jù)挖掘和分析。
參考文獻(xiàn):
[1] 余方興.淺談?dòng)?jì)算機(jī)數(shù)據(jù)挖掘[J].計(jì)算機(jī)光盤(pán)軟件與應(yīng)用,2013(14):298-298,300.
[2] 宋偉瑩.計(jì)算機(jī)病毒數(shù)據(jù)庫(kù)的修改和挖掘[J].軍民兩用技術(shù)與產(chǎn)品,2016(4):47-47,48.
[3] 欒華,周明全,付艷等.多核處理器上的頻繁圖挖掘方法[J].計(jì)算機(jī)研究與發(fā)展,2015(12):2844-2856.
[4] 毛國(guó)君,宗東軍.基于多維數(shù)據(jù)流挖掘技術(shù)的入侵檢測(cè)模型與算法[J].計(jì)算機(jī)研究與發(fā)展,2009,46(4):602-609.
[5] 林培利.淺析計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)在煤礦行業(yè)中的應(yīng)用[J].江西建材,2014(9):229-229.
[6] 劉春娟.淺談?dòng)?jì)算機(jī)數(shù)據(jù)挖掘[J].電子測(cè)試,2014(6):35-36,14.