王洪飛
摘 要:隨著信息技術(shù)的快速發(fā)展,計(jì)算機(jī)功能也逐漸融入了一些統(tǒng)計(jì)學(xué)理論,計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,并且該技術(shù)也隨著云計(jì)算、云存儲(chǔ)技術(shù)的發(fā)展而發(fā)展,為人們解決了很多問(wèn)題?;诖?,本文從計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的過(guò)程入手,對(duì)計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開發(fā)和應(yīng)用進(jìn)行了探討,旨在促進(jìn)計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的進(jìn)一步發(fā)展。
關(guān)鍵詞:計(jì)算機(jī);數(shù)據(jù)挖掘技術(shù);開發(fā);應(yīng)用
中圖分類號(hào): G2 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1673-1069(2016)27-147-2
0 引言
所謂數(shù)據(jù)挖掘技術(shù),就是幫助人們?cè)诒姸嘈畔⒅胁檎页鏊枰畔⒌囊环N技術(shù),該技術(shù)在我國(guó)出現(xiàn)的時(shí)間比較晚,但卻以其特殊的功能得到了快速發(fā)展。該技術(shù)不僅具備計(jì)算機(jī)技術(shù)的特性,同時(shí)還兼具了統(tǒng)計(jì)學(xué)功能。在信息數(shù)量不斷增加的今天,想要從中搜索到需要的信息不是一件簡(jiǎn)單的事,計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)成功地為人們解決了這個(gè)困擾,受到了越來(lái)越多人的歡迎。
1 計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的過(guò)程簡(jiǎn)介
1.1 確定數(shù)據(jù)庫(kù)和數(shù)據(jù)挖掘的目的
數(shù)據(jù)挖掘技術(shù)功能比較多,而想要充分的利用該技術(shù),首先必須確定本次數(shù)據(jù)挖掘的目的,進(jìn)而根據(jù)目的選擇相應(yīng)的數(shù)據(jù)庫(kù)。因?yàn)橛?jì)算機(jī)數(shù)據(jù)挖掘技術(shù)中包含多種數(shù)據(jù)挖掘方法,不同的數(shù)據(jù)挖掘目的應(yīng)該采用不同的數(shù)據(jù)挖掘方法,否則會(huì)直接影響數(shù)據(jù)挖掘結(jié)果的準(zhǔn)確性,可見確定數(shù)據(jù)挖掘的目的和相應(yīng)的數(shù)據(jù)庫(kù)是利用數(shù)據(jù)挖掘技術(shù)的關(guān)鍵點(diǎn)。
1.2 數(shù)據(jù)選擇和預(yù)處理
確定了數(shù)據(jù)挖掘的目的和相應(yīng)的數(shù)據(jù)庫(kù)之后,接下來(lái)就需要在該數(shù)據(jù)庫(kù)中提取一部分目標(biāo)數(shù)據(jù),需要注意的是,必須要確保目標(biāo)數(shù)據(jù)中包含需要的信息,并將該目標(biāo)數(shù)據(jù)作為數(shù)據(jù)挖掘的一個(gè)主要范圍,這個(gè)過(guò)程叫作數(shù)據(jù)選擇。確定了目標(biāo)數(shù)據(jù)之后,需要對(duì)目標(biāo)數(shù)據(jù)進(jìn)一步處理,將大部分的無(wú)用信息和錯(cuò)誤信息進(jìn)行刪除,保留有用信息,這個(gè)過(guò)程叫作預(yù)處理,其實(shí)際作用就是精簡(jiǎn)目標(biāo)數(shù)據(jù)。
1.3 數(shù)據(jù)挖掘
首先,根據(jù)數(shù)據(jù)挖掘的目的確定數(shù)據(jù)挖掘技術(shù)的類型和采用的算法,算法是數(shù)據(jù)挖掘的精髓所在,合適的算法能夠使數(shù)據(jù)挖掘結(jié)果可靠性提高,更有實(shí)際借鑒意義。其次,由于數(shù)據(jù)挖掘的算法針對(duì)的是一個(gè)數(shù)學(xué)模型,應(yīng)根據(jù)數(shù)據(jù)挖掘的算法構(gòu)建數(shù)學(xué)模型,以便實(shí)現(xiàn)數(shù)據(jù)挖掘算法對(duì)目標(biāo)數(shù)據(jù)的處理。最后,在計(jì)算機(jī)上利用算法進(jìn)行數(shù)據(jù)挖掘并得到相應(yīng)結(jié)果。
1.4 評(píng)估結(jié)果
該階段的主要目的就是對(duì)數(shù)據(jù)挖掘的結(jié)果進(jìn)行科學(xué)分析、合理評(píng)估。盡管我們利用數(shù)據(jù)挖掘技術(shù)得到了結(jié)果,但是結(jié)果正確與否還需要進(jìn)一步驗(yàn)證,如果結(jié)果不符合本次數(shù)據(jù)挖掘的目的,則需要對(duì)數(shù)據(jù)挖掘算法和數(shù)學(xué)模型進(jìn)行重新選擇;如果結(jié)果符合本次要求,就可以將這些數(shù)據(jù)結(jié)果應(yīng)用到實(shí)踐過(guò)程中,進(jìn)而達(dá)到指導(dǎo)工作或者提高工作效率的目的。
2 計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開發(fā)及工具
2.1 傳統(tǒng)統(tǒng)計(jì)方法
傳統(tǒng)的統(tǒng)計(jì)方法比較多,例如抽樣技術(shù)、多元統(tǒng)計(jì)分析、統(tǒng)計(jì)預(yù)測(cè)等都屬于傳統(tǒng)統(tǒng)計(jì)方法。其中,抽樣技術(shù)就是在眾多數(shù)據(jù)中提取部分信息作為樣本數(shù)據(jù),目的就是減少數(shù)據(jù)分析量;多元統(tǒng)計(jì)分析主要針對(duì)對(duì)象是結(jié)構(gòu)復(fù)雜并且維數(shù)較高的數(shù)據(jù)或因子;而統(tǒng)計(jì)預(yù)測(cè)主要分為序列分析和回歸分析兩種預(yù)測(cè)分析方法。
2.2 可視化技術(shù)
利用數(shù)據(jù)挖掘技術(shù)可以得到想要的數(shù)據(jù)結(jié)果,但是通常情況下,想要發(fā)現(xiàn)這些數(shù)據(jù)結(jié)果中隱含的某些特征,就需要借助一些圖表、散點(diǎn)圖等方式,將其直觀地表現(xiàn)出來(lái)。當(dāng)前可視化技術(shù)的難點(diǎn)主要集中在對(duì)高維數(shù)據(jù)的可視化方面。
2.3 聯(lián)機(jī)分析處理
聯(lián)機(jī)分析處理主要用于分析多維數(shù)據(jù),在該分析過(guò)程中,需要多個(gè)用戶的積極配合,同時(shí),用戶主動(dòng)對(duì)分析算法進(jìn)行分析篩選,也有助于對(duì)數(shù)據(jù)的深入探索。
2.4 決策樹
決策樹的建立基礎(chǔ)是具有一定規(guī)則的,主要用來(lái)對(duì)數(shù)據(jù)進(jìn)行各種分類和預(yù)測(cè)。決策樹包含的算法也比較多,例如SLIQ、SPRINT、CHAID、CART、ID3、C4.5等等。其中,前兩種算法還可以處理分類屬性和連續(xù)性屬性,并由極大的訓(xùn)練集對(duì)決策樹進(jìn)行歸納。
2.5 計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)
將醫(yī)學(xué)界對(duì)人體神經(jīng)元的研究成果作為參考,我們也對(duì)計(jì)算機(jī)進(jìn)行了深入研究,并形成了計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)。計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)可以大致分為輸入、輸出和處理單元三個(gè)層面。利用計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)技術(shù),可以實(shí)現(xiàn)對(duì)數(shù)據(jù)的調(diào)整、計(jì)算和整理。
2.6 遺傳算法
在自然界中,基因可以通過(guò)突變、聯(lián)合或者選擇等不同的過(guò)程進(jìn)行自我優(yōu)化,以這種進(jìn)化論為基礎(chǔ),可以將現(xiàn)代群體按照一定規(guī)則進(jìn)行重新組合,進(jìn)而得出新的群體。按照這種思想,我們可以對(duì)數(shù)據(jù)模型進(jìn)行重新組合,得到更加適合并且得到優(yōu)化的一種新的數(shù)據(jù)算法。
3 計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的應(yīng)用
3.1 市場(chǎng)營(yíng)銷方面的應(yīng)用
現(xiàn)代消費(fèi)者在購(gòu)物的時(shí)候,利用POS機(jī)刷卡結(jié)賬的行為非常普遍,而在這個(gè)過(guò)程中,關(guān)于這些消費(fèi)者的一些信息就可以被銷售商所采集,并且消費(fèi)者越多,銷售商所采集到的有用信息就越多,這些信息對(duì)于市場(chǎng)營(yíng)銷具有非常重要的作用。不同的銷售商或者生產(chǎn)商,可以根據(jù)所采集到的有用信息,分析消費(fèi)者的各種不同需求、購(gòu)物習(xí)慣,從而進(jìn)一步分析消費(fèi)者的消費(fèi)心理,最終對(duì)消費(fèi)者的下一步消費(fèi)行為進(jìn)行推斷。例如,企業(yè)可以利用消費(fèi)者使用信用卡的情況分析商品的銷售情況,也可以通過(guò)某些促銷活動(dòng),確認(rèn)消費(fèi)者的消費(fèi)意向等等。以上種種分析結(jié)果,都離不開計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù),由此可見,計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)不僅能夠幫助相關(guān)企業(yè)了解顧客需求,而且還能夠?yàn)槠髽I(yè)進(jìn)行重大商業(yè)決策提供準(zhǔn)確數(shù)據(jù)信息,大大增強(qiáng)了企業(yè)的市場(chǎng)競(jìng)爭(zhēng)力。
3.2 金融投資方面的應(yīng)用
數(shù)據(jù)挖掘技術(shù)在金融投資方面的應(yīng)用,主要利用模型預(yù)測(cè)法和統(tǒng)計(jì)回歸技術(shù),集中在對(duì)投資進(jìn)行評(píng)估以及對(duì)股票交易市場(chǎng)的預(yù)測(cè)。眾所周知,金融投資的風(fēng)險(xiǎn)性較大,因此在投資之前,有必要對(duì)各種數(shù)據(jù)進(jìn)行分析、統(tǒng)計(jì)、總結(jié),規(guī)避可能存在的各種風(fēng)險(xiǎn),確保投資方向的準(zhǔn)確性。由于一切事物的發(fā)展都具有趨向性,我們可以根據(jù)這種趨向?qū)ζ溥M(jìn)行預(yù)測(cè)。也就是說(shuō),我們可以通過(guò)對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行深度分析,挖掘其中可能存在的一些數(shù)據(jù)關(guān)系,然后根據(jù)這些關(guān)系實(shí)現(xiàn)對(duì)投資評(píng)估、股票市場(chǎng)等的預(yù)測(cè),幫助投資者做出科學(xué)合理的選擇。
3.3 其他領(lǐng)域的應(yīng)用
在半導(dǎo)體領(lǐng)域,利用數(shù)據(jù)挖掘技術(shù)可以發(fā)現(xiàn)有問(wèn)題的半導(dǎo)體元件,極大提高了產(chǎn)品的生產(chǎn)質(zhì)量;而在電子商務(wù)領(lǐng)域,數(shù)據(jù)挖掘技術(shù)也加快了用戶查找數(shù)據(jù)的速率,并能夠根據(jù)用戶的瀏覽記錄對(duì)用戶的需求和喜好進(jìn)行深入分析,適時(shí)為用戶推薦需要的產(chǎn)品,實(shí)現(xiàn)了獨(dú)特的個(gè)性化服務(wù)。此外,數(shù)據(jù)挖掘技術(shù)還被廣泛地應(yīng)用到了一些生產(chǎn)型企業(yè),幫助企業(yè)實(shí)現(xiàn)企業(yè)利潤(rùn)最大化,為企業(yè)提供風(fēng)險(xiǎn)參考依據(jù)等等,總之,數(shù)據(jù)挖掘技術(shù)在各種領(lǐng)域都得到了普遍應(yīng)用。
4 結(jié)束語(yǔ)
作為一種重要的分析方法和有效工具,計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)在各個(gè)領(lǐng)域都得到了快速發(fā)展,并且廣受歡迎。利用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù),用戶可以得到自己想要的數(shù)據(jù)結(jié)果,并通過(guò)對(duì)這些結(jié)果的進(jìn)一步分析,為用戶制定決策提供參考依據(jù)。未來(lái),我們相信,隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)能夠?yàn)橛脩艚鉀Q更加棘手的問(wèn)題,該技術(shù)的應(yīng)用范圍將會(huì)越來(lái)越廣。
參 考 文 獻(xiàn)
[1] 夏天維.計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開發(fā)及其應(yīng)用探究[A].決策與信息雜志社,北京大學(xué)經(jīng)濟(jì)管理學(xué)院.“決策論壇——管理科學(xué)與工程研究學(xué)術(shù)研討會(huì)”論文集(下)[C].決策與信息雜志社,北京大學(xué)經(jīng)濟(jì)管理學(xué)院,2016:1.
[2] 宋金城.計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開發(fā)及其應(yīng)用探究[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2013,23:130+132.
[3] 沈文淵,丁穎.計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開發(fā)及其應(yīng)用探究[J].信息系統(tǒng)工程,2014,06:87.
[4] 郝園園.計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開發(fā)及其應(yīng)用探究[J].信息化建設(shè),2015,10:105.