程瑞鵬
(山西潞安礦業(yè)(集團(tuán))有限責(zé)任公司信息科技分公司,山西 長(zhǎng)治 046204)
隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,DDR存儲(chǔ)器性能也隨之提高,這也意味著存儲(chǔ)控制器工作頻率也越快,而這則導(dǎo)致存儲(chǔ)控制器有效數(shù)據(jù)窗口變得越來越小。數(shù)據(jù)捕獲技術(shù)可以通過大數(shù)據(jù)挖掘和資源優(yōu)化配置,實(shí)現(xiàn)數(shù)據(jù)優(yōu)化挖掘和自主控制,提高數(shù)據(jù)分類管理能力。因此優(yōu)化數(shù)據(jù)捕獲技術(shù),實(shí)現(xiàn)數(shù)據(jù)高效準(zhǔn)確捕獲對(duì)提高數(shù)據(jù)信息融合和挖掘等方面的能力具有重要意義。
目前,計(jì)算機(jī)系統(tǒng)常見存儲(chǔ)器數(shù)據(jù)寬度為64位,而大部分?jǐn)?shù)據(jù)存儲(chǔ)器具備ECC功能,在數(shù)據(jù)存儲(chǔ)過程中就有72位來自不同SDRAM、DDR存儲(chǔ)器數(shù)據(jù),再加上傳輸長(zhǎng)度、阻抗等參數(shù)影響,進(jìn)一步增加了數(shù)據(jù)到達(dá)存儲(chǔ)控制器的離散,導(dǎo)致數(shù)據(jù)同步困難,甚至可導(dǎo)致數(shù)據(jù)窗口消失[1]。為減少數(shù)據(jù)離散程度,實(shí)現(xiàn)數(shù)據(jù)的有效捕獲,同時(shí)提高存儲(chǔ)器控制器存儲(chǔ)服務(wù)效能,建立以分布式結(jié)構(gòu)為主的結(jié)構(gòu)模型,并融合ACSESS存儲(chǔ)和云存儲(chǔ)結(jié)構(gòu),實(shí)現(xiàn)存儲(chǔ)數(shù)據(jù)的信息調(diào)度和分區(qū)融合。該存儲(chǔ)器結(jié)構(gòu)模型集成了映射關(guān)系分析和數(shù)據(jù)融合兩種功能,根據(jù)數(shù)據(jù)動(dòng)態(tài)標(biāo)簽實(shí)現(xiàn)數(shù)據(jù)快速檢測(cè)和鏈路設(shè)計(jì),即將作為數(shù)據(jù)檢測(cè)序列模型,利用超融合架構(gòu)模型對(duì)存儲(chǔ)控制器數(shù)據(jù)進(jìn)行挖掘和分析,進(jìn)而獲取數(shù)據(jù)關(guān)聯(lián)向量。在該結(jié)構(gòu)模型下,根據(jù)Map/Reduce編程計(jì)算方法得到非結(jié)構(gòu)數(shù)據(jù)庫(kù)時(shí)態(tài)集合E=U/RC={Ei|i=1,2,…,n}和聚類分布模型。
(1)
式中:z為數(shù)據(jù)訪問比特率,z=[z1,z2,…,zn]∈Pmn(其中zn為存儲(chǔ)控制器數(shù)據(jù)分布狀態(tài)集)。
(2)
式中:τ為數(shù)據(jù)捕獲延遲;d為時(shí)間;x(t)為存儲(chǔ)控制器數(shù)據(jù)時(shí)間序列。
為準(zhǔn)確表達(dá)超融合存儲(chǔ)控制器數(shù)據(jù)多樣性特征,重構(gòu)數(shù)據(jù)庫(kù)信息流特征,進(jìn)而得到數(shù)據(jù)輸出控制函數(shù)l(t):
(3)
式中:vn為數(shù)據(jù)傳輸速率;f為數(shù)據(jù)采樣頻率;un為數(shù)據(jù)獲取時(shí)間窗口寬度。
根據(jù)上述數(shù)據(jù)訪問模型,利用數(shù)據(jù)挖掘和數(shù)據(jù)頻譜分析方法可以實(shí)現(xiàn)數(shù)據(jù)的快速、有效捕獲[2]。
存儲(chǔ)控制器數(shù)據(jù)捕捉存在不確定延時(shí)影響因素和輸入延時(shí)因素,并且數(shù)據(jù)傳輸至存儲(chǔ)控制器寄存器的時(shí)間與核心時(shí)鐘的相位關(guān)系為非固定狀態(tài),而存儲(chǔ)控制器數(shù)據(jù)捕獲需要精準(zhǔn)的時(shí)間和有效窗口。為提高超融合存儲(chǔ)控制器數(shù)據(jù)捕獲能力,借助超融合架構(gòu)建立數(shù)據(jù)特征信息流[3]。由于超融合存儲(chǔ)控制器本身存在鄰階向量等影響因素,為消除以上干擾,利用波束冗余濾波法濾除數(shù)據(jù)傳輸過程中存在的干擾,進(jìn)而達(dá)到提高數(shù)據(jù)分析和辨識(shí)能力的目的,超融合存儲(chǔ)控制器數(shù)據(jù)濾波函數(shù)為:
(4)
為進(jìn)一步提高有效數(shù)據(jù)挖掘效率和質(zhì)量,采用相位差分識(shí)別法計(jì)算數(shù)據(jù)融合誤差平方,如式(5):
ε2(k)=d2(k)-2d(k)XT(k)W+
WTX(k)XT(k)W.
(5)
式中:d(k)為數(shù)據(jù)迭代次數(shù);W為比特序列識(shí)別率。
根據(jù)式(5)建立多重假設(shè)判斷標(biāo)準(zhǔn),深入挖掘超融合存儲(chǔ)控制器數(shù)據(jù)信息。對(duì)于數(shù)據(jù)融合和跟蹤處理,采用混合差分進(jìn)化法建立不同尺度下的存儲(chǔ)控制器數(shù)據(jù)分布關(guān)聯(lián)維x(t)=λRe{an(t)e-j2πfcτn(t)sl(t-τn(t))e-j2πfc},其中λ=LEQKL/LEQw+pL是頻數(shù)特征值。在確定數(shù)據(jù)挖掘頻數(shù)特征值和待捕獲數(shù)據(jù)特征量的情況下,利用超融合方法計(jì)算存儲(chǔ)控制器數(shù)據(jù)增益特征值:
(6)
存儲(chǔ)控制器數(shù)據(jù)融合過程中,為進(jìn)一步提高數(shù)據(jù)挖掘速度和質(zhì)量,建立數(shù)據(jù)融合函數(shù):
(7)
式中:A為聚類幅值;ρ為加權(quán)系數(shù);m為濾波器階數(shù);ejφ為期望值;z為隨機(jī)變量zφ(0,1)。
根據(jù)超融合存儲(chǔ)控制器數(shù)據(jù)模糊調(diào)度和分布結(jié)構(gòu)模型,對(duì)數(shù)據(jù)捕獲技術(shù)進(jìn)行優(yōu)化,進(jìn)一步提高數(shù)據(jù)捕獲精度和數(shù)據(jù)挖掘精度[6]。根據(jù)數(shù)據(jù)挖掘過程中存在的干擾信息特征,對(duì)存儲(chǔ)控制器中的數(shù)據(jù)進(jìn)行模糊調(diào)度處理,充分挖掘存儲(chǔ)控制器中有效數(shù)據(jù)和干擾數(shù)據(jù)的信息特征和關(guān)聯(lián)關(guān)系,然后按照數(shù)據(jù)序列對(duì)數(shù)據(jù)重新排序。采用數(shù)據(jù)統(tǒng)計(jì)融合方法,對(duì)數(shù)據(jù)進(jìn)行處理,假設(shè)數(shù)據(jù)采樣寬度為Tc=1/Re,則存儲(chǔ)控制器數(shù)據(jù)高階統(tǒng)計(jì)量為:
(8)
式中:cn為數(shù)據(jù)捕獲過程中優(yōu)化分類尺度,cn取值為1或-1;gc為數(shù)據(jù)特征值。
為簡(jiǎn)化分析過程,基于存儲(chǔ)控制器高階統(tǒng)計(jì)量,將數(shù)據(jù)挖掘問題轉(zhuǎn)換為假設(shè)檢驗(yàn)問題,如下所示:
(9)
式中:r(t)為數(shù)據(jù)指數(shù)分布;n(t)為平均統(tǒng)計(jì)信息量;g(t)為數(shù)據(jù)聚類中心矢量。
根據(jù)數(shù)據(jù)模糊分區(qū)調(diào)度和高階統(tǒng)計(jì)量,計(jì)算存儲(chǔ)控制器數(shù)據(jù)采樣時(shí)間,假設(shè)采樣時(shí)間間隔,結(jié)合時(shí)間開銷算法計(jì)算出存儲(chǔ)控制器數(shù)據(jù)分塊匹配函數(shù)為:
(10)
在存儲(chǔ)控制器中,采用逆向檢索方式獲取有效數(shù)據(jù),并獲取數(shù)據(jù)輸出狀態(tài)矢量x(t)=R(a(t)eiθ(t)=a(t)cos(t)),根據(jù)該矢量算法對(duì)存儲(chǔ)控制器中的相同信息屬性和語(yǔ)義的數(shù)據(jù)分類,進(jìn)而獲得數(shù)據(jù)挖掘分類屬性和特征辨識(shí)函數(shù):
(11)
(12)
根據(jù)存儲(chǔ)控制器數(shù)據(jù)特征、模糊分區(qū)調(diào)度和高階統(tǒng)計(jì)量分析結(jié)果,得到經(jīng)過優(yōu)化后的存儲(chǔ)控制器數(shù)據(jù)挖掘結(jié)果輸出相頻特性:
φl(shuí)(f)=-[π(f-f0)2]/k+arctan[s(v2)+
s(v2)/c(v1)+c(v2)].
(13)
對(duì)超融合存儲(chǔ)控制器數(shù)據(jù)捕獲優(yōu)化后,可以實(shí)現(xiàn)存儲(chǔ)控制器的自我學(xué)習(xí),并根據(jù)數(shù)據(jù)關(guān)聯(lián)特征,結(jié)合數(shù)據(jù)模糊分區(qū)調(diào)度和高階統(tǒng)計(jì)量分析結(jié)果,快速捕獲有效數(shù)據(jù)。
為測(cè)試超融合存儲(chǔ)控制器數(shù)據(jù)捕獲效果,搭建計(jì)算機(jī)仿真平臺(tái)展開測(cè)試分析,仿真平臺(tái)配置包括兩臺(tái)10M存儲(chǔ)控制器、云平臺(tái)組件、Intel Core i5處理器等。存儲(chǔ)控制器為Eucalyputs結(jié)構(gòu)模型,通過云平臺(tái)對(duì)存儲(chǔ)控制器數(shù)據(jù)進(jìn)行挖掘和捕獲。數(shù)據(jù)捕獲過程中,設(shè)置數(shù)據(jù)采樣時(shí)間間隔為0.1 s,干擾強(qiáng)度為-10 dB,帶寬為120 Buad。分別選取不同數(shù)量的數(shù)據(jù)塊與未優(yōu)化的數(shù)據(jù)捕獲技術(shù)進(jìn)行對(duì)比分析,以此來驗(yàn)證優(yōu)化后的數(shù)據(jù)捕獲技術(shù)的高效性和準(zhǔn)確性。本文分別對(duì)深度學(xué)習(xí)算法標(biāo)簽生成方法、空間學(xué)習(xí)語(yǔ)義標(biāo)簽生成方法和本文提出大數(shù)據(jù)用戶畫像標(biāo)簽生成方法進(jìn)行仿真測(cè)試。
表1所示存儲(chǔ)控制器捕獲技術(shù)優(yōu)化前后數(shù)據(jù)辨識(shí)測(cè)試結(jié)果,從表中可以看出,采用數(shù)據(jù)模糊分區(qū)調(diào)度和高階統(tǒng)計(jì)量方法對(duì)數(shù)據(jù)捕獲技術(shù)進(jìn)行優(yōu)化后,數(shù)據(jù)辨識(shí)系數(shù)較高,并且隨著數(shù)據(jù)塊識(shí)別數(shù)量增加,優(yōu)化后的數(shù)據(jù)辨識(shí)系數(shù)也有一定程度提升,相較于優(yōu)化前的數(shù)據(jù)捕獲技術(shù),優(yōu)化后的數(shù)據(jù)捕獲技術(shù)在數(shù)據(jù)辨識(shí)方面的優(yōu)勢(shì)明顯,由此可見優(yōu)化后的數(shù)據(jù)捕獲技術(shù)可以準(zhǔn)確識(shí)別數(shù)據(jù)類型。
表1 存儲(chǔ)控制器數(shù)據(jù)辨識(shí)系數(shù)測(cè)試結(jié)果
表2所示優(yōu)化前后可靠性測(cè)試結(jié)果,從表中可以看出,經(jīng)過優(yōu)化后數(shù)據(jù)捕獲技術(shù)辨識(shí)準(zhǔn)確性明顯高于優(yōu)化前的數(shù)據(jù)捕獲技術(shù)。本文提取了存儲(chǔ)控制器同類數(shù)據(jù)標(biāo)簽特征共性,并根據(jù)提取結(jié)果對(duì)數(shù)據(jù)模糊分區(qū)調(diào)度和高階統(tǒng)計(jì)量分析,實(shí)現(xiàn)了數(shù)據(jù)有效識(shí)別,因此經(jīng)過優(yōu)化后的數(shù)據(jù)捕獲技術(shù)在數(shù)據(jù)辨識(shí)方面的可信度得到了一定程度的提升。
表2 數(shù)據(jù)辨識(shí)可靠性測(cè)試結(jié)果
表3所示數(shù)據(jù)捕獲精度測(cè)試結(jié)果,從表中可以看出,經(jīng)過優(yōu)化后的數(shù)據(jù)捕獲精度得到了一定程度的提升,并且隨著數(shù)據(jù)塊數(shù)量的增加,測(cè)試結(jié)果精度也有所提升。由此可見,經(jīng)過優(yōu)化后的數(shù)據(jù)捕獲技術(shù)在數(shù)據(jù)辨識(shí)度和捕獲精度方面具有較高的可靠性。
表3 數(shù)據(jù)捕獲精度測(cè)試結(jié)果
綜上所述,本文研究了以超融合架構(gòu)為基礎(chǔ)的存儲(chǔ)控制器數(shù)據(jù)分布與捕獲技術(shù),基于超融合架構(gòu)建立了存儲(chǔ)控制器數(shù)據(jù)分布結(jié)構(gòu)模型,并提取了存儲(chǔ)控制器數(shù)據(jù)特征量,根據(jù)數(shù)據(jù)特征提取結(jié)果對(duì)數(shù)據(jù)進(jìn)行模糊分區(qū)調(diào)度和高階統(tǒng)計(jì)量分析。為進(jìn)一步提高數(shù)據(jù)捕獲辨識(shí)精度和捕獲精度,對(duì)干擾因素進(jìn)行濾除,進(jìn)而實(shí)現(xiàn)數(shù)據(jù)高效、準(zhǔn)確捕獲。