摘 要 在云計(jì)算環(huán)境下進(jìn)行分布式數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì),提高數(shù)據(jù)的并行網(wǎng)格式調(diào)度和計(jì)算能力,傳統(tǒng)的數(shù)據(jù)挖掘方法采用關(guān)聯(lián)特征匹配方法,當(dāng)數(shù)據(jù)存儲(chǔ)空間中干擾強(qiáng)度較大時(shí),數(shù)據(jù)挖掘的精度不高。在云計(jì)算環(huán)境下,提出一種基于分布式自適應(yīng)特征調(diào)度和高階累積量后置聚焦的數(shù)據(jù)挖掘算法,并在嵌入式Linux的內(nèi)核下進(jìn)行數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)。首先進(jìn)行了云計(jì)算的分布式數(shù)據(jù)結(jié)構(gòu)分析和數(shù)據(jù)挖掘算法設(shè)計(jì),然后進(jìn)行分布式數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì),系統(tǒng)包括程序加載模塊、數(shù)據(jù)存儲(chǔ)模塊、數(shù)據(jù)緩存調(diào)度模塊和數(shù)據(jù)通信傳輸模塊等。實(shí)驗(yàn)結(jié)果表明,采用該方法進(jìn)行基于云計(jì)算的分布式數(shù)據(jù)挖掘,數(shù)據(jù)挖掘的準(zhǔn)確配準(zhǔn)性能較好,系統(tǒng)的可靠性較好。
【關(guān)鍵詞】云計(jì)算 數(shù)據(jù)挖掘 系統(tǒng)設(shè)計(jì)
隨著網(wǎng)絡(luò)大數(shù)據(jù)信息處理技術(shù)的發(fā)展,對(duì)數(shù)據(jù)處理的規(guī)模不斷增大,對(duì)數(shù)據(jù)信息處理的精度要求不斷提升,采用云計(jì)算進(jìn)行數(shù)據(jù)分布式網(wǎng)格計(jì)算,能提高數(shù)據(jù)的并行處理和調(diào)度性能,根本上提高數(shù)據(jù)的計(jì)算速度,因此,云計(jì)算成為未來大數(shù)據(jù)信息處理的主要趨勢(shì)。在云計(jì)算環(huán)境下進(jìn)行數(shù)據(jù)挖掘,是進(jìn)行大數(shù)據(jù)信息特征提取和數(shù)據(jù)開采的基本技術(shù),相關(guān)的算法研究受到人們的重視。
文獻(xiàn)采用云計(jì)算環(huán)境下分布式數(shù)據(jù)模糊C均值聚類的挖掘算法,在受到較強(qiáng)的毗連特征干擾時(shí),數(shù)據(jù)挖掘的精度不高。針對(duì)上述問題,本文提出一種基于分布式自適應(yīng)特征調(diào)度和高階累積量后置聚焦的數(shù)據(jù)挖掘算法,并進(jìn)行了仿真實(shí)驗(yàn)性能分析,得出了較好的數(shù)據(jù)挖掘效果的結(jié)論。
1 基于云計(jì)算的分布式數(shù)據(jù)挖掘算法設(shè)計(jì)
為了實(shí)現(xiàn)對(duì)基于云計(jì)算的分布式數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì),其中,數(shù)據(jù)挖掘算法設(shè)計(jì)是關(guān)鍵,本文提出一種基于分布式自適應(yīng)特征調(diào)度和高階累積量后置聚焦的數(shù)據(jù)挖掘算法,假設(shè)數(shù)據(jù)信息流為,數(shù)據(jù)信息流通過噪聲濾波,得到數(shù)據(jù)流聚類相似性函數(shù)表示為,其是一組準(zhǔn)平穩(wěn)隨機(jī)的時(shí)間序列,對(duì)數(shù)據(jù)庫中的存儲(chǔ)信息流進(jìn)行能量譜密度特征提取,得到輸出數(shù)據(jù)x(t)的第n個(gè)寬頻帶分量,分布式自適應(yīng)特征調(diào)度模型表示為:
2 嵌入式Linux的內(nèi)核下數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)描述
在上述進(jìn)行了算法設(shè)計(jì)的基礎(chǔ)上,進(jìn)行數(shù)據(jù)挖掘系統(tǒng)的軟件開發(fā)設(shè)計(jì),基于云計(jì)算的分布式數(shù)據(jù)挖掘系統(tǒng)總體模型中,采用ST 超低功耗 ARM CortexTM-M0 微控制器,系統(tǒng)建立在嵌入式Linux的內(nèi)核平臺(tái)上,系統(tǒng)包括程序加載模塊、數(shù)據(jù)存儲(chǔ)模塊、數(shù)據(jù)緩存調(diào)度模塊和數(shù)據(jù)通信傳輸模塊等,通過配置CAN_IMASK寄存器,采用LabWindows/CVI進(jìn)行數(shù)據(jù)遠(yuǎn)程控制和信息通信,基于云計(jì)算的分布式數(shù)據(jù)挖掘系統(tǒng)給用戶提供一個(gè)簡(jiǎn)單、統(tǒng)一的系統(tǒng)調(diào)用接口,系統(tǒng)可配置4路組聯(lián)合Cache,基于云計(jì)算的分布式數(shù)據(jù)挖掘系統(tǒng)的寄存器系統(tǒng)時(shí)鐘120 MHz。嵌入式Linux的內(nèi)核下數(shù)據(jù)挖掘系統(tǒng)通過VISA軟件接口發(fā)送Flash設(shè)備上的文件系統(tǒng)內(nèi)核到HP E1562D/E SCSI數(shù)據(jù)硬盤進(jìn)行數(shù)據(jù)存儲(chǔ),調(diào)用s3c2440_adc_read()函數(shù),進(jìn)行程序加載和基于云計(jì)算的分布式數(shù)據(jù)挖掘系統(tǒng)的嵌入式控制,使用Qt/Embedded作為GUI,利用開源Linux操作系統(tǒng)的豐富網(wǎng)絡(luò)資源,實(shí)現(xiàn)數(shù)據(jù)挖掘系統(tǒng)的遠(yuǎn)程通信信息傳輸和控制。
3 仿真實(shí)驗(yàn)
為了測(cè)試本文設(shè)計(jì)的基于云計(jì)算的分布式數(shù)據(jù)挖掘系統(tǒng)在實(shí)現(xiàn)數(shù)據(jù)挖掘中的優(yōu)越性能,進(jìn)行仿真實(shí)驗(yàn),分布式數(shù)據(jù)信息采樣的時(shí)寬為10 ms, 分布式數(shù)據(jù)的隨機(jī)采樣率為KHz,調(diào)控因子λ=0.25。根據(jù)上述仿真環(huán)境和參數(shù)設(shè)定,進(jìn)行基于云計(jì)算的分布式數(shù)據(jù)挖掘系統(tǒng)的數(shù)據(jù)挖掘和處理性能分析,首先進(jìn)行數(shù)據(jù)挖掘的輸出時(shí)域波形采樣,結(jié)果如圖1所示。
從圖可見,采用本文算法進(jìn)行數(shù)據(jù)挖掘的準(zhǔn)確度較高,為了對(duì)比性能,采用本文方法和傳統(tǒng)方法,以數(shù)據(jù)挖掘的準(zhǔn)確配準(zhǔn)性為測(cè)試指標(biāo),得到對(duì)比結(jié)果如圖2所示。
實(shí)驗(yàn)結(jié)果表明,采用該方法進(jìn)行基于云計(jì)算的分布式數(shù)據(jù)挖掘,數(shù)據(jù)挖掘的準(zhǔn)確配準(zhǔn)性能較好,系統(tǒng)的可靠性較好。
4 結(jié)束語
本文提出一種基于分布式自適應(yīng)特征調(diào)度和高階累積量后置聚焦的數(shù)據(jù)挖掘算法,并進(jìn)行了實(shí)驗(yàn)分析。結(jié)果表明,采用該方法進(jìn)行數(shù)據(jù)挖掘,數(shù)據(jù)挖掘的準(zhǔn)確配準(zhǔn)性能較好,系統(tǒng)的可靠性較好,具有較好的應(yīng)用價(jià)值。
參考文獻(xiàn)
[1]陸興華,謝輝迪,許劍銳.基于近場(chǎng)通訊和物聯(lián)網(wǎng)的飯?zhí)米詣?dòng)計(jì)價(jià)系統(tǒng)[J].智能計(jì)算機(jī)與應(yīng)用,2015,5(06):18-21.
[2]童崢嶸,郭尊禮,曹曄,等.小波包變換對(duì)CO-OFDM系統(tǒng)高峰均比的抑制性能研究[J].光子學(xué)報(bào),2015,44(12):1206001-1206001.
[3]譚營(yíng)軍,王俊平.基于MEACO的無線傳感器網(wǎng)絡(luò)路由光通信算法研究[J].激光雜志,2016,37(02):131-133.
作者簡(jiǎn)介
李穎(1977-),女,廣東省韶關(guān)市人。碩士研究生學(xué)歷?,F(xiàn)為廣東科學(xué)技術(shù)職業(yè)學(xué)院講師。主要研究方向?yàn)樘摂M化與云計(jì)算。
作者單位
廣東科學(xué)技術(shù)職業(yè)學(xué)院計(jì)算機(jī)工程技術(shù)學(xué)院 廣東省珠海市 519090