褚小龍
(克拉瑪依安控科技有限公司,克拉瑪依 834000)
數(shù)據(jù)挖掘是知識(shí)探尋領(lǐng)域當(dāng)中的重要技術(shù),其涉及各方面的領(lǐng)域知識(shí),其中對(duì)于機(jī)器學(xué)習(xí)、人工智能、模式識(shí)別在數(shù)據(jù)挖掘當(dāng)中都有涉及。具體的操作包含分類、估計(jì)、預(yù)測(cè)、相關(guān)性分組和聚類等。
云計(jì)算是信息時(shí)代的互聯(lián)網(wǎng)計(jì)算方式,其以快速簡(jiǎn)單的計(jì)算方式創(chuàng)建大型IT基礎(chǔ)設(shè)施建設(shè),文章闡述的數(shù)據(jù)挖掘平臺(tái)就是通過數(shù)據(jù)挖掘來處理技術(shù)的。云計(jì)算主要分為IaaS(基礎(chǔ)設(shè)施即時(shí)服務(wù))、PaaS(系統(tǒng)平臺(tái)即時(shí)服務(wù))和SaaS。此外,云計(jì)算還具有通用性和虛擬性特點(diǎn),其不針對(duì)特定應(yīng)用支持商業(yè)運(yùn)營(yíng),主要在“云”的支持下構(gòu)造多種互聯(lián)網(wǎng)信息應(yīng)用。云計(jì)算的用戶可以任何位置自由使用互聯(lián)網(wǎng)終端,并因此獲取專業(yè)化服務(wù)。
在協(xié)同云計(jì)算環(huán)境下,差異區(qū)域數(shù)據(jù)采用區(qū)間概念格當(dāng)中節(jié)點(diǎn)模型進(jìn)行儲(chǔ)存機(jī)制構(gòu)架,用有向圖模型,敘述差異區(qū)域數(shù)據(jù)儲(chǔ)存結(jié)構(gòu)的分布層次模型,將作為信息采樣時(shí)間序列,數(shù)據(jù)挖掘結(jié)構(gòu)為五元組O=(C,I,P,Hc,R,A0)。其中I為字符串實(shí)例集,C標(biāo)識(shí)數(shù)據(jù)語義本體模型階數(shù)。
其中協(xié)同元計(jì)算下差異區(qū)域數(shù)據(jù)儲(chǔ)存數(shù)據(jù)頻帶分量為x(ηn)。相鄰點(diǎn)待檢數(shù)據(jù)塊具有相關(guān)性,云儲(chǔ)存服務(wù)中相同態(tài)標(biāo)簽數(shù)據(jù)為φ:X→Y,其滿足
其中·為X運(yùn)算,°為Y上運(yùn)算。數(shù)據(jù)款Hash表示為
其中ρ∈(0,1),代表數(shù)據(jù)完整性的系數(shù)。
式中γ0為協(xié)同云計(jì)算下差異區(qū)域數(shù)據(jù)單位區(qū)域分布噪音比。
信息節(jié)點(diǎn)和數(shù)據(jù)負(fù)載之間有如下關(guān)系
其中CCS,Css分別表示協(xié)同云計(jì)算數(shù)據(jù)挖掘平臺(tái)節(jié)點(diǎn)信息分布可靠度和空間模態(tài)。
CDKmeans分析是當(dāng)下提出的基于云計(jì)算的數(shù)據(jù)挖掘平臺(tái)分布式算法,這種技術(shù)一共有四種不同算法:(1)基于地域性路由優(yōu)化程序;(2)資源約束的自適應(yīng)程序;(3)云計(jì)算環(huán)境下局部數(shù)據(jù)挖掘;(4)云計(jì)算中全局挖掘算法。
其中聚類半徑臨界值表達(dá)為
(ub表示最高閾值,X_crit_thresthold表示資源X臨界閾值百分比)
3.2.1 降低管理負(fù)擔(dān)
云計(jì)算技術(shù)的應(yīng)用環(huán)境下數(shù)據(jù)挖掘平臺(tái)使得互聯(lián)網(wǎng)的云計(jì)算用戶的管理費(fèi)用得到大大降低,商業(yè)模式的管理運(yùn)營(yíng)成本也大大下降。相應(yīng)的工作當(dāng)中,投入數(shù)據(jù)挖掘平臺(tái)就節(jié)省了人員管理、技術(shù)管理和設(shè)備管理的大量成本支出,降低管理負(fù)擔(dān)的同時(shí),能夠使資金得到合理的應(yīng)用。3.2.2 優(yōu)化安裝
云計(jì)算技術(shù)的應(yīng)用環(huán)境下數(shù)據(jù)挖掘平臺(tái)安裝簡(jiǎn)單、快速是其一大特點(diǎn),這種便捷性的特點(diǎn)使得云計(jì)算技術(shù)的應(yīng)用環(huán)境下數(shù)據(jù)挖掘平臺(tái)得到廣泛的推廣和應(yīng)用。其中優(yōu)化安裝主要體現(xiàn)在互聯(lián)網(wǎng)用戶使用的過程當(dāng)中不需要對(duì)云計(jì)算技術(shù)的應(yīng)用環(huán)境下數(shù)據(jù)挖掘平臺(tái)進(jìn)行安裝,一些硬件和軟件的安裝得到省略,相應(yīng)的用戶通過網(wǎng)絡(luò)配置接入云計(jì)算系統(tǒng)網(wǎng)址當(dāng)中即可實(shí)現(xiàn)對(duì)數(shù)據(jù)挖掘平臺(tái)的應(yīng)用。
3.2.3 維護(hù)成本低
在云計(jì)算的網(wǎng)絡(luò)背景下,數(shù)據(jù)挖掘網(wǎng)絡(luò)系統(tǒng)平臺(tái)為互聯(lián)網(wǎng)用戶節(jié)約大量的維護(hù)成本。該系統(tǒng)平臺(tái)建立在云計(jì)算體系當(dāng)中,和傳統(tǒng)的系統(tǒng)平臺(tái)相比,云計(jì)算的平臺(tái)可以實(shí)現(xiàn)實(shí)時(shí)在線,并保持系統(tǒng)最新版本和最佳防御能力。
這種分布式儲(chǔ)存應(yīng)用技術(shù)是數(shù)據(jù)挖掘平臺(tái)當(dāng)中的優(yōu)勢(shì)是互聯(lián)網(wǎng)云計(jì)算技術(shù)的體現(xiàn),其適應(yīng)當(dāng)下信息時(shí)代高速發(fā)展的需求。在網(wǎng)站上采用云計(jì)算互聯(lián)網(wǎng)信息應(yīng)用技術(shù),其成本消耗較大,不利于小型網(wǎng)站穩(wěn)定發(fā)展,因此這種云計(jì)算互聯(lián)網(wǎng)信息技術(shù)適用于大規(guī)模的互聯(lián)網(wǎng)專項(xiàng)服務(wù)提供工作上,進(jìn)而在大規(guī)模的工作當(dāng)中發(fā)揮數(shù)據(jù)挖掘的優(yōu)勢(shì)。
綜上所述,基于協(xié)同云計(jì)算下研究差異區(qū)域數(shù)據(jù)挖掘平臺(tái)設(shè)計(jì)將會(huì)大大提升互聯(lián)網(wǎng)的運(yùn)行效率,進(jìn)而降低數(shù)據(jù)挖掘平臺(tái)支持下故障的產(chǎn)生?;趨f(xié)同云計(jì)算下研究差異區(qū)域數(shù)據(jù)挖掘平臺(tái)應(yīng)用能夠使大型企業(yè)的網(wǎng)絡(luò)管理機(jī)構(gòu)數(shù)據(jù)中心向大容量?jī)?chǔ)存中心演變,提高計(jì)算中心的高效云計(jì)算,最終達(dá)到網(wǎng)絡(luò)管理的一體化高速集中。用戶在使用云儲(chǔ)存和本地文件時(shí)保持一致,在應(yīng)用上支持各種平臺(tái)應(yīng)用程序,其可直接讀取云儲(chǔ)存當(dāng)中的數(shù)據(jù),類似于播放視頻等操作不需要下載就可播放,為人們生活提供便利的同時(shí)減輕了數(shù)據(jù)管理人員整理數(shù)據(jù)的工作負(fù)擔(dān)。