崔雪輝
【摘要】隨著我國信息化建設(shè)的不斷完善和科學(xué)技術(shù)的不斷推進(jìn),互聯(lián)網(wǎng)技術(shù)和大數(shù)據(jù)應(yīng)用成為人們當(dāng)下最為主要的信息交流措施,而通過數(shù)據(jù)挖掘能夠一定程度的幫助數(shù)據(jù)進(jìn)行篩選及整理,通過云計算的數(shù)據(jù)庫能夠保證其數(shù)據(jù)的穩(wěn)定性,同時對其進(jìn)行必要的調(diào)節(jié)。另外,相較傳統(tǒng)數(shù)據(jù)的儲存方式而言,云計算數(shù)據(jù)庫具有時間與空間的特性,并且能夠?qū)崿F(xiàn)對數(shù)據(jù)的挖掘。為提升數(shù)據(jù)挖掘的效率,需要建立全新的數(shù)據(jù)挖掘方法,分析數(shù)據(jù)的特點。本文將就重點闡述云計算的概念及特點,云計算的數(shù)據(jù)挖掘和數(shù)據(jù)分析,以及對云數(shù)據(jù)庫的建立策略進(jìn)行必要的簡述。
【關(guān)鍵詞】數(shù)據(jù)挖掘;方法與分析;云計算
一、數(shù)據(jù)挖掘概述
隨著我國數(shù)據(jù)庫建設(shè)速度的不斷加快,人口增加速度的不斷提升,數(shù)據(jù)應(yīng)用和技術(shù)更新的不斷普及,全世界每天每時每刻所產(chǎn)生的信息和需要儲存的信息都以萬兆計算。數(shù)據(jù)就像一股洪水滾滾向人們涌來,如今我們太多的數(shù)據(jù)需要儲存,但實際的固態(tài)儲存空間卻遠(yuǎn)遠(yuǎn)不足,面對浩如煙海的數(shù)據(jù)庫,人們希望能夠從數(shù)據(jù)庫中尋找到一條去偽存真、去粗取精的數(shù)據(jù)挖掘技術(shù),從數(shù)據(jù)庫中發(fā)現(xiàn)其核心數(shù)據(jù)的采集以及數(shù)據(jù)的挖掘,這一技術(shù)就應(yīng)運而生。但是由于其信息核載量較少,實現(xiàn)數(shù)據(jù)信息之間的對接出現(xiàn)空缺信息,數(shù)據(jù)與信息之間還存在較大差距,以及對數(shù)據(jù)挖掘工具的需求日益凸顯,因此將數(shù)據(jù)轉(zhuǎn)化成信息知識,進(jìn)行必要的儲存,是當(dāng)下解決信息儲存的一大難題。
采用數(shù)據(jù)挖掘的方式,不僅能夠?qū)崿F(xiàn)數(shù)據(jù)模型的建立,同時對于商務(wù)決策、發(fā)展方向預(yù)估、風(fēng)險評估等有重大的作用。簡單而言,數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)中提取出客戶需要的數(shù)據(jù),并且能夠通過人工智能的方式,實現(xiàn)系統(tǒng)的優(yōu)化,從而保證系統(tǒng)中信息的儲存更有條理性,能夠有針對性的服務(wù)于某一特定人群。數(shù)據(jù)挖掘是數(shù)據(jù)庫研究開發(fā)和應(yīng)用最為廣泛和最為繁瑣的一個環(huán)節(jié),它涉及領(lǐng)域較多,設(shè)計層次較廣,需要多學(xué)科進(jìn)行合作才能完成。這些技術(shù)包括數(shù)據(jù)庫的建立、人工智能的應(yīng)用、神經(jīng)網(wǎng)絡(luò)構(gòu)架、統(tǒng)計學(xué)、模型識別、信息檢索和數(shù)據(jù)可視化等多學(xué)科的參與。
二、云計算數(shù)據(jù)庫概述
云計算數(shù)據(jù)庫是最近幾年才流行起來的一個概念,其最具代表性的定義為:通過虛擬資源的豐富下載和虛擬儲存,實現(xiàn)資源的整合和配置,以一個全息虛擬的云盤進(jìn)行承載;云計算的客戶可以從自己的資源庫中提取,相較傳統(tǒng)的數(shù)據(jù)處理而言,云盤信息數(shù)據(jù)的提取等過程是對于云盤的應(yīng)用,而不涉及電腦Pc端的數(shù)據(jù)處理,因此不會導(dǎo)致系統(tǒng)出現(xiàn)負(fù)載過高,致使整個系統(tǒng)的崩潰。硬件設(shè)施的固定能夠有效的解決這一問題,并且能夠通過軟件來彌補(bǔ)傳統(tǒng)儲存設(shè)備的不足,由于計算機(jī)的儲存空間有限,用戶可以不斷進(jìn)行數(shù)據(jù)實時更新,同時還可以通過利用云數(shù)據(jù)庫的強(qiáng)大運算能力完成數(shù)據(jù)的整合和運算。
云數(shù)據(jù)對于用戶來說是透明的,用戶可以不需要過多的了解云計算過程中的具體流程,而是直接使用并尋找屬于自己的服務(wù),同時云計算由于對數(shù)據(jù)的收集處理及整理能力較強(qiáng),可以通過對這些數(shù)據(jù)的簡單整理,實現(xiàn)對用戶的即時性應(yīng)用。將計算機(jī)本身的數(shù)據(jù)轉(zhuǎn)移到云盤上,能夠增大用戶的信息承載量,并且將計算機(jī)的負(fù)擔(dān)轉(zhuǎn)移到云盤上,實現(xiàn)大數(shù)據(jù)資源傳輸?shù)母咝院陀嬎銠C(jī)的高速運轉(zhuǎn)。同時由于云計算本身的編譯程序較為簡單,用戶可以通過個人需要進(jìn)行有針對性的編程,在完成之后可以在云系統(tǒng)上進(jìn)行使用,在一定程度上實現(xiàn)了用戶的定制化服務(wù)和有針對性的開展相關(guān)業(yè)務(wù),同時由于云計算其節(jié)點較多,能夠在同一時間進(jìn)行超多的數(shù)據(jù)計算和系統(tǒng)運行,在提高計算能力的同時增強(qiáng)收集數(shù)據(jù)的穩(wěn)定性。
三、云計算數(shù)據(jù)庫的數(shù)據(jù)挖掘常用方法
數(shù)據(jù)挖掘通過對數(shù)據(jù)的數(shù)量、出現(xiàn)幾率以及歷史數(shù)據(jù)進(jìn)行整合,從中找出潛在的價值進(jìn)而被人們不斷挖掘,形成新的信息鏈。早在上世紀(jì)80年代,國際上就有人提出了對于數(shù)據(jù)庫的有效整合,解決數(shù)據(jù)庫當(dāng)前硬盤存儲空間不夠的問題,要想真正的實現(xiàn)數(shù)據(jù)挖掘,就需要人們通過多階段的技術(shù)革新,多層次的系統(tǒng)整合進(jìn)行云數(shù)據(jù)挖掘。
(一)建立云計算數(shù)據(jù)庫的多層矢量空間模型。想要真正實現(xiàn)云數(shù)據(jù)的數(shù)據(jù)挖掘,就需要提前建立預(yù)估模型和分類,通過數(shù)據(jù)分類整合,能夠有效的找到數(shù)據(jù)中的必然聯(lián)系和客觀規(guī)律,通過對數(shù)據(jù)處理能夠進(jìn)行有效分類,把數(shù)據(jù)進(jìn)行有規(guī)律的排序。將一些無效信息進(jìn)行篩除,將那些真正有效的信息進(jìn)行存儲,并利用這些規(guī)律,把對象放在特定的環(huán)境中進(jìn)行分析。通過分析,能夠預(yù)估事件發(fā)生的可能性以及事件發(fā)生的方向,對于企業(yè)而言,其利潤和預(yù)估方式能夠增強(qiáng)企業(yè)制定策略的合理性,實現(xiàn)企業(yè)經(jīng)濟(jì)利益最大化。
(二)異構(gòu)數(shù)據(jù)挖掘。通過找出數(shù)據(jù)模板中的差異性,可以將一些有關(guān)聯(lián)的數(shù)據(jù)進(jìn)行差異下的橫向?qū)Ρ?,例如在進(jìn)行用戶的數(shù)據(jù)采集時,既要考慮選點合理,也要考慮年齡分布和職業(yè)分布等,通過該方法能夠得出用戶的傾向性消費,來幫助企業(yè)制定更加合理的營銷方式和營銷方向,通過對于數(shù)據(jù)的集中處理和挖掘能夠展現(xiàn)出全新的數(shù)據(jù),給人們提供更加高效便捷的服務(wù),為當(dāng)今互聯(lián)網(wǎng)的大數(shù)據(jù)構(gòu)建提供新的動力。
四、基于云計算數(shù)據(jù)庫的數(shù)據(jù)挖掘策略
(一)加強(qiáng)數(shù)據(jù)管理技術(shù)。云計算的數(shù)據(jù)庫一定程度上給人們帶來了更加便利的信息獲取渠道,同時能夠加速信息的更新?lián)Q代。通過云計算的高效運算能夠?qū)崿F(xiàn)數(shù)據(jù)的有效化整合,雖然云計算的優(yōu)點較多,但是在儲存數(shù)據(jù)上還應(yīng)該加強(qiáng)其安全性能的管理,隨著互聯(lián)網(wǎng)絡(luò)的發(fā)展,各種信息繁雜,想要從繁雜的信息中迅速梳理出人們需要的有效信息,就顯得尤為重要。各種信息,對于用戶而言沒有針對性,用戶可以利用現(xiàn)代化的管理技術(shù)來管理自己的數(shù)據(jù),同時能夠利用先進(jìn)的分類方法,實現(xiàn)數(shù)據(jù)管理能力的提升。在加強(qiáng)數(shù)據(jù)結(jié)構(gòu)化調(diào)整的同時,也應(yīng)擴(kuò)大數(shù)據(jù)規(guī)模的收集,將其儲存在云系統(tǒng)中提高用戶的使用頻率,很好地幫助用戶提供更加具有針對性的優(yōu)質(zhì)服務(wù),實現(xiàn)用戶的私人定制。
(二)建立全面的存儲空間。隨著我國科學(xué)技術(shù)的進(jìn)步和互聯(lián)網(wǎng)構(gòu)建速度的不斷加快,行業(yè)的發(fā)展對于網(wǎng)絡(luò)的發(fā)展要求也更高,大數(shù)據(jù)的出現(xiàn)在一定程度上解放了計算機(jī)的運行能力,但是想要真正保證云計算能夠儲存大量的數(shù)據(jù),就需要利用云計算的儲存功能來實現(xiàn)信息的更新。通過分析可以得出,云計算系統(tǒng)因具有一定的經(jīng)濟(jì)性和可靠性等特點,相較采用傳統(tǒng)的固態(tài)硬盤儲存方式而言,雖然能保證數(shù)據(jù)的可靠性,但是由于硬件設(shè)備參差不齊,導(dǎo)致其在數(shù)據(jù)傳輸上具有一定的短板,需要通過更加可靠的軟件開發(fā)來實現(xiàn)硬件的存儲。
想要真正保證數(shù)據(jù)的可靠性,實現(xiàn)傳輸效率和吞并效率的提升,通過云計算技術(shù)的更新和云空間的拓展能夠滿足大部分用戶的要求。但是由于互聯(lián)網(wǎng)發(fā)展速度較快,與全領(lǐng)域的合作也在不斷加強(qiáng),真正實現(xiàn)全面的數(shù)據(jù)庫構(gòu)建,那么就應(yīng)該加強(qiáng)數(shù)據(jù)庫與全領(lǐng)域的合作,通過與各領(lǐng)域的合作,實現(xiàn)數(shù)據(jù)收集的有效性和真實性,從而幫助客戶制定更加科學(xué)合理的經(jīng)營模式和經(jīng)營方向,為確保企業(yè)的高速發(fā)展奠定基礎(chǔ)。
(三)利用web進(jìn)行數(shù)據(jù)挖掘。要加強(qiáng)云空間的儲存速度和運算能力,通過云計算實現(xiàn),對網(wǎng)絡(luò)中的文檔進(jìn)行提取分析。利用互聯(lián)網(wǎng)方式能夠?qū)⒂嬎銠C(jī)中大量的數(shù)據(jù)進(jìn)行有效的整合,用戶可以通過連接服務(wù)器的方式來獲取自身所需的資源,在數(shù)據(jù)挖掘時主要通過服務(wù)器來實現(xiàn)上述功能,這些功能的實現(xiàn),用戶僅需要通過關(guān)鍵詞的查找篩選以及分析該數(shù)據(jù)是否滿足用戶需求即可。通過在網(wǎng)站的挖掘,相關(guān)數(shù)據(jù)能夠?qū)崿F(xiàn)資源的快速整合和信息的迅速交流,在人為的瀏覽信息的過程中,實現(xiàn)信息的交互。并且通過這種方式,讓用戶在數(shù)據(jù)庫中更加高效的尋找到自己的信息,利用網(wǎng)絡(luò)先進(jìn)的計算能力和資源整合能力,加強(qiáng)對云數(shù)據(jù)庫的整理,同時實現(xiàn)了信息更有針對性的使用,節(jié)省了社會資源,實現(xiàn)了社會資源的更優(yōu)化配置。
(四)建立分層云計算數(shù)據(jù)庫。由于當(dāng)前數(shù)據(jù)量龐大,想要真正適應(yīng)網(wǎng)絡(luò)大環(huán)境的發(fā)展加強(qiáng)網(wǎng)絡(luò)數(shù)據(jù)的監(jiān)管,那么進(jìn)行分層數(shù)據(jù)監(jiān)管就顯得尤為必要。通過網(wǎng)絡(luò)人員建立分層云計算庫,不僅能將絕大多數(shù)的數(shù)據(jù)進(jìn)行分層管理,而且還能方便用戶有針對性的進(jìn)行數(shù)據(jù)搜索。加強(qiáng)分層數(shù)據(jù)庫的管理,讓用戶有針對性的搜索數(shù)據(jù),實現(xiàn)信息的最優(yōu)化使用。用戶通過關(guān)鍵詞搜索自己想要的信息,快速找到信息,進(jìn)行相應(yīng)評判,減少了信息檢索的時間,進(jìn)而完成數(shù)據(jù)的使用,提高了數(shù)據(jù)的使用效率。
五、小結(jié)
在當(dāng)前的數(shù)據(jù)采集與應(yīng)用,大多數(shù)是通過云數(shù)據(jù)處理實現(xiàn)的,傳統(tǒng)數(shù)據(jù)的處理與儲存已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足當(dāng)前時代的發(fā)展要求。通過進(jìn)行數(shù)據(jù)挖掘的方法與分析能夠?qū)崿F(xiàn)計算機(jī)資源的有效整合,對于Pc端用戶而言則是最大限度地解放了計算機(jī)的運算功能,提高了數(shù)據(jù)收集、挖掘、整理篩選等工作的效率。通過不斷優(yōu)化云數(shù)據(jù)庫的運算能夠為用戶提供更加科學(xué)快捷的數(shù)據(jù)檢索系統(tǒng),并且能夠為用戶提供更有針對性的數(shù)據(jù)。