周賢來(lái)
(廣州松田職業(yè)學(xué)院,廣東 廣州 511370)
智慧物聯(lián)網(wǎng)建設(shè)和發(fā)展過(guò)程中,多采用異構(gòu)多核平臺(tái)進(jìn)行物聯(lián)網(wǎng)層次化結(jié)構(gòu)設(shè)計(jì),以提高物聯(lián)網(wǎng)大數(shù)據(jù)的信息分布式存儲(chǔ)和檢測(cè)能力。在進(jìn)行物聯(lián)網(wǎng)構(gòu)造過(guò)程中,需要進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘,進(jìn)行物聯(lián)網(wǎng)的分布節(jié)點(diǎn)的信息優(yōu)化存儲(chǔ)設(shè)計(jì),故采用大數(shù)據(jù)信息融合技術(shù),實(shí)現(xiàn)對(duì)異構(gòu)多核平臺(tái)大數(shù)據(jù)特征的量化分析,構(gòu)建異構(gòu)多核平臺(tái)大數(shù)據(jù)的優(yōu)化挖掘模型,結(jié)合模糊相關(guān)性分析方法進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘和特征提取,分析異構(gòu)多核平臺(tái)大數(shù)據(jù)信息傳輸穩(wěn)定性特征分量,以實(shí)現(xiàn)異構(gòu)多核平臺(tái)的大數(shù)據(jù)挖掘和檢測(cè)[1]。研究異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘算法,在異構(gòu)多核平臺(tái)的存儲(chǔ)優(yōu)化設(shè)計(jì)中具有重要意義。
對(duì)異構(gòu)多核平臺(tái)進(jìn)行大數(shù)據(jù)挖掘,在數(shù)據(jù)融合和特征提取方法基礎(chǔ)上,采用異構(gòu)多核平臺(tái)大數(shù)據(jù)處理方法進(jìn)行信息管理調(diào)度,進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)的采集、統(tǒng)計(jì)、匯總,建立大數(shù)據(jù)信息處理平臺(tái)進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)的自動(dòng)挖掘[2-3],其中,Sierociuk等[4]提出基于嵌入式Linux內(nèi)核和B/S構(gòu)架的進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)可視化挖掘方法,以MySQL為數(shù)據(jù)庫(kù)進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)可視化系統(tǒng)的數(shù)據(jù)庫(kù)底層構(gòu)造,在B/S構(gòu)架體系下,采用程序加載控制方法,進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)可視化挖掘系統(tǒng)的Tomcat服務(wù)器開(kāi)發(fā),提高數(shù)據(jù)挖掘的精度,但該方法的計(jì)算開(kāi)銷較大,信息融合度不高。曲琦等[5]提出基于模糊聚類的大數(shù)據(jù)挖掘方法,采用大數(shù)據(jù)挖掘和模糊信息融合聚類方法進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘設(shè)計(jì),提高數(shù)據(jù)挖掘的精度,但該方法的模糊度較大,抗干擾性不好[6]。針對(duì)上述問(wèn)題,本文提出基于語(yǔ)義分割的異構(gòu)多核平臺(tái)大數(shù)據(jù)精準(zhǔn)挖掘方法。構(gòu)建異構(gòu)多核平臺(tái)大數(shù)據(jù)的模糊信息檢測(cè)模型,采用關(guān)聯(lián)特征提取方法進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)的模糊指向性聚類分析,構(gòu)建異構(gòu)多核平臺(tái)大數(shù)據(jù)的輸出自相關(guān)特征匹配模型,結(jié)合語(yǔ)義特征提取方法進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)的特征提取和統(tǒng)計(jì)分析,建立異構(gòu)多核平臺(tái)大數(shù)據(jù)的語(yǔ)義動(dòng)態(tài)特征分析模型,提取異構(gòu)多核平臺(tái)大數(shù)據(jù)的統(tǒng)計(jì)特征量,實(shí)現(xiàn)異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘。最后進(jìn)行仿真實(shí)驗(yàn),得出有效性結(jié)論。
為了實(shí)現(xiàn)異構(gòu)多核平臺(tái)大數(shù)據(jù)精準(zhǔn)挖掘,構(gòu)建異構(gòu)多核平臺(tái)大數(shù)據(jù)的模糊信息檢測(cè)模型。當(dāng)前,對(duì)異構(gòu)多核平臺(tái)的數(shù)據(jù)挖掘方法主要有基于模糊神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法、PSO數(shù)據(jù)挖掘方法、關(guān)聯(lián)屬性特征挖掘方法和統(tǒng)計(jì)信息挖掘方法等。其中文獻(xiàn)[7]提出基于模糊神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法,根據(jù)異構(gòu)多核平臺(tái)大數(shù)據(jù)的混合分類屬性進(jìn)行相似度分析,提取異構(gòu)多核平臺(tái)大數(shù)據(jù)的數(shù)值屬性特征和分類屬性特征,完成異構(gòu)多核平臺(tái)大數(shù)據(jù)優(yōu)化挖掘,提高數(shù)據(jù)的挖掘精度。文獻(xiàn)[8]提出基于簡(jiǎn)化梯度算法的異構(gòu)多核平臺(tái)數(shù)據(jù)挖掘模型,采用匹配濾波器進(jìn)行網(wǎng)絡(luò)通信數(shù)據(jù)的干擾濾波,結(jié)合自適應(yīng)的信道均衡控制方法進(jìn)行數(shù)據(jù)挖掘,提高數(shù)據(jù)的挖掘自適應(yīng)性。本文采用關(guān)聯(lián)特征提取方法進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)的模糊相關(guān)性分析,采用云信息處理平臺(tái)進(jìn)行異構(gòu)大數(shù)據(jù)的特征檢測(cè),構(gòu)建異構(gòu)多核平臺(tái)大數(shù)據(jù)的自動(dòng)挖掘模型,采用模糊信息聚類分析方法,進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)的統(tǒng)計(jì)信息類別分析,采用點(diǎn)、線、面狀要素聯(lián)合分析方法,建立信息屬性鏈模型,建立異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘的模糊決策模型,采用自適應(yīng)尋優(yōu)方法,進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)的優(yōu)化挖掘。建立異構(gòu)多核平臺(tái)大數(shù)據(jù)的屬性鏈表,得到異構(gòu)多核平臺(tái)大數(shù)據(jù)的空間分布結(jié)構(gòu)模型如圖1所示。
圖1 異構(gòu)多核平臺(tái)大數(shù)據(jù)的空間分布結(jié)構(gòu)模型
在圖1所示的異構(gòu)多核平臺(tái)大數(shù)據(jù)的空間分布結(jié)構(gòu)模型中,采用融合性聚類分析方法,進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)優(yōu)化挖掘,結(jié)合指針識(shí)別方法,進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘的指針?lè)治?,得到異?gòu)多核平臺(tái)大數(shù)據(jù)挖掘的指針?lè)植既鐖D2所示。
圖2 異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘的指針?lè)植?/p>
采用分塊區(qū)域融合方法進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)精準(zhǔn)定位,建立異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘的存儲(chǔ)模塊和信息查詢模塊,提取異構(gòu)多核平臺(tái)大數(shù)據(jù)的統(tǒng)計(jì)特征量,進(jìn)行數(shù)據(jù)優(yōu)化挖掘[9]。
構(gòu)建異構(gòu)多核平臺(tái)大數(shù)據(jù)的模糊信息聚類模型,采用特征匹配方法,進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)的模糊特征聚類,采用語(yǔ)義分割模型建立異構(gòu)多核平臺(tái)大數(shù)據(jù)的自適應(yīng)加權(quán)學(xué)習(xí)模型[10]。異構(gòu)多核平臺(tái)大數(shù)據(jù)的模糊聚類分布為:
(1)
其中:z0為異構(gòu)多核平臺(tái)大數(shù)據(jù)的關(guān)聯(lián)估計(jì)值;zi為點(diǎn)i處采集的異構(gòu)多核平臺(tái)大數(shù)據(jù)的實(shí)測(cè)值;di為點(diǎn)i和點(diǎn)0的距離;S為異構(gòu)多核平臺(tái)大數(shù)據(jù)的實(shí)測(cè)點(diǎn)統(tǒng)計(jì)特征量;K為異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘的插值權(quán)重[11]。
根據(jù)自適應(yīng)加權(quán)學(xué)習(xí)結(jié)果,進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)空間特征的自適應(yīng)加權(quán),構(gòu)建異構(gòu)多核平臺(tái)大數(shù)據(jù)的模糊加權(quán)學(xué)習(xí)式[12-14],提高其自適應(yīng)挖掘能力,得到空間聚類模型定義為:
(2)
其中,x、y、z分別表示異構(gòu)多核平臺(tái)大數(shù)據(jù)在三維空間的語(yǔ)義相似度特征量,σ表示語(yǔ)義本體集,b表示數(shù)據(jù)挖掘的模糊度系數(shù),r表示粗糙特征匹配集。
通過(guò)挖掘異構(gòu)多核平臺(tái)大數(shù)據(jù)的語(yǔ)義關(guān)聯(lián)特征量,結(jié)合模糊屬性特征檢測(cè)方法,實(shí)現(xiàn)異構(gòu)多核平臺(tái)大數(shù)據(jù)統(tǒng)計(jì)檢測(cè)。采用統(tǒng)計(jì)分析方法,建立異構(gòu)多核平臺(tái)大數(shù)據(jù)的語(yǔ)義分割模型[15],計(jì)算式定義為:
(3)
其中:wij為第i個(gè)點(diǎn)的異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘的全局加權(quán)值,dij表示異構(gòu)多核平臺(tái)大數(shù)據(jù)分布節(jié)點(diǎn)的聚類中心。構(gòu)建異構(gòu)多核平臺(tái)大數(shù)據(jù)的特征提取模型,根據(jù)特征提取結(jié)果進(jìn)行數(shù)據(jù)挖掘。在STARMA(1,1)網(wǎng)絡(luò)模型中,得到信息異構(gòu)多核平臺(tái)大數(shù)據(jù)可視化分割模型,構(gòu)建異構(gòu)多核平臺(tái)大數(shù)據(jù)的輸出自相關(guān)特征匹配模型,結(jié)合模糊特征聚類分析方法進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)的統(tǒng)計(jì)分析[16],采用語(yǔ)義分割方法進(jìn)行模糊信息特征提取,在特征點(diǎn)i處,得到t時(shí)刻的特征分布集表示為(w1j,w2j,…,wtj),其中t表示異構(gòu)多核平臺(tái)大數(shù)據(jù)的編號(hào)數(shù)目,wtj為異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘的加權(quán)系數(shù)。結(jié)合語(yǔ)義特征分析方法,建立模糊語(yǔ)義特征規(guī)則集[17],得到自適應(yīng)加權(quán)系數(shù)為:
(4)
其中,F(xiàn)reqij為異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘?qū)?yōu)的模糊約束特征量[18]。定義異構(gòu)多核平臺(tái)搜索的信息素濃度:
(5)
其中:
wij=tfij
(6)
其中,N表示大數(shù)據(jù)挖掘節(jié)點(diǎn)的維數(shù),ni表示第i個(gè)節(jié)點(diǎn)的信息嵌入維數(shù),fij表示大數(shù)據(jù)采用節(jié)點(diǎn)i和節(jié)點(diǎn)j采樣數(shù)據(jù)的關(guān)聯(lián)信息,t為采樣時(shí)間間隔。
采用異構(gòu)多核平臺(tái)大數(shù)據(jù)特征提取方法進(jìn)行大數(shù)據(jù)挖掘。
建立異構(gòu)多核平臺(tái)大數(shù)據(jù)的語(yǔ)義動(dòng)態(tài)特征分析模型,提取異構(gòu)多核平臺(tái)大數(shù)據(jù)的統(tǒng)計(jì)特征量,進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘的自適應(yīng)尋優(yōu)[19],其計(jì)算式為:
(7)
其中,di和dj為異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘的模糊規(guī)則特征量。采用統(tǒng)計(jì)信息分析方法,建立異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘的模糊特征分布集,表示為:
(8)
其中,m和n表示樣本嵌入維數(shù)和分割網(wǎng)格數(shù),amn為待挖掘異構(gòu)多核平臺(tái)大數(shù)據(jù)的有用信息的統(tǒng)計(jì)幅值,gmn(t)為數(shù)據(jù)統(tǒng)計(jì)平均值,n(t)為干擾項(xiàng)。綜上分析,構(gòu)建異構(gòu)多核平臺(tái)大數(shù)據(jù)的精準(zhǔn)挖掘模型為:
(9)
其中,Xkj為語(yǔ)義分割的關(guān)聯(lián)維數(shù),F(xiàn)j表示挖掘的輸出特征量,Qj表示數(shù)據(jù)挖掘的語(yǔ)義信息分量。
在決策樹(shù)模型下,采用語(yǔ)義分割進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘過(guò)程中的自適應(yīng)尋優(yōu),提取統(tǒng)計(jì)特征量,根據(jù)特征提取結(jié)果采用模糊C均值聚類方法進(jìn)行大數(shù)據(jù)聚類[20-21],實(shí)現(xiàn)對(duì)異構(gòu)多核平臺(tái)大數(shù)據(jù)的數(shù)據(jù)挖掘。
為了驗(yàn)證本文方法在實(shí)現(xiàn)異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘中的應(yīng)用性能,采用Matlab進(jìn)行仿真測(cè)試分析。對(duì)異構(gòu)多核平臺(tái)大數(shù)據(jù)采樣的物聯(lián)網(wǎng)節(jié)點(diǎn)數(shù)為120,數(shù)據(jù)挖掘的根節(jié)點(diǎn)數(shù)為12,異構(gòu)多核平臺(tái)大數(shù)據(jù)分布的空間維數(shù)為5,數(shù)據(jù)聚類屬性類別數(shù)為10,對(duì)大數(shù)據(jù)采樣的初始頻率f1=1.5 Hz,終止頻率f2=2.3 Hz。根據(jù)上述仿真參數(shù)設(shè)定,進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘,得到數(shù)據(jù)樣本的時(shí)域分布如圖3所示。
以圖3所示的數(shù)據(jù)為研究對(duì)象,提取統(tǒng)計(jì)特征量,特征提取結(jié)果采用模糊C均值聚類方法進(jìn)行大數(shù)據(jù)聚類,得到數(shù)據(jù)挖掘的直方圖分布如圖4所示。
分析圖4得知,本文方法進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘的特征聚斂性較好,提高了數(shù)據(jù)挖掘的抗干擾能力。通過(guò)測(cè)試數(shù)據(jù)挖掘的精度,得到對(duì)比結(jié)果見(jiàn)表1。分析表1得知,本文方法進(jìn)行數(shù)據(jù)挖掘的精度較高。
(a) 樣本數(shù)據(jù)1
(b) 樣本數(shù)據(jù)2
(a) 樣本數(shù)據(jù)1
(b) 樣本數(shù)據(jù)2
表1 數(shù)據(jù)挖掘的精度對(duì)比
構(gòu)建異構(gòu)多核平臺(tái)大數(shù)據(jù)的優(yōu)化挖掘模型,結(jié)合模糊相關(guān)性分析方法進(jìn)行數(shù)據(jù)挖掘和特征提取,提出基于語(yǔ)義分割的異構(gòu)多核平臺(tái)大數(shù)據(jù)精挖掘方法。采用分塊區(qū)域融合方法進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)精準(zhǔn)定位,采用語(yǔ)義分割方法進(jìn)行模糊信息特征提取,建立異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘的模糊語(yǔ)義特征規(guī)則集,進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘的尋優(yōu)控制,采用統(tǒng)計(jì)信息分析方法,建立異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘的模糊特征分布集,在決策樹(shù)模型下,采用語(yǔ)義分割進(jìn)行異構(gòu)多核平臺(tái)大數(shù)據(jù)挖掘,實(shí)現(xiàn)數(shù)據(jù)挖掘優(yōu)化。分析得知,本文方法進(jìn)行數(shù)據(jù)挖掘的精度較高,根據(jù)數(shù)據(jù)挖掘的直方圖分布得知,本文方法進(jìn)行數(shù)據(jù)挖掘的特征聚斂性較好和抗干擾能力較強(qiáng)。