童 星
(青島理工大學(xué),山東 臨沂 273400)
數(shù)據(jù)采集是計(jì)算機(jī)應(yīng)用的重要領(lǐng)域,通過數(shù)據(jù)處理與采集能夠改善復(fù)雜信息量激增的問題。常見的數(shù)據(jù)采集方法為利用ADC多通道系統(tǒng)實(shí)現(xiàn)采集過程,但該方法無法確保數(shù)據(jù)同步采集的時(shí)間間隔合理性,會(huì)對(duì)后續(xù)數(shù)據(jù)分析造成影響,并且對(duì)計(jì)算機(jī)系統(tǒng)的運(yùn)行速度利用不夠充分,占用大量CPU時(shí)間,采集效率較低,不能實(shí)現(xiàn)高速采集。因此,如何實(shí)現(xiàn)多通道通信網(wǎng)絡(luò)數(shù)據(jù)跨層高速采集,已經(jīng)成為該領(lǐng)域急需解決的問題。
為滿足通信數(shù)據(jù)采集的精準(zhǔn)性與實(shí)時(shí)性,相關(guān)學(xué)者提出如下研究。文獻(xiàn)[1]提出基于FPGA的多通道實(shí)時(shí)高速數(shù)據(jù)采集方法。對(duì)采集系統(tǒng)的信號(hào)監(jiān)測(cè)、前端數(shù)據(jù)處理、核心控制與數(shù)據(jù)顯示等結(jié)構(gòu)進(jìn)行設(shè)計(jì),并分析該系統(tǒng)的工作原理;把獲取的數(shù)據(jù)儲(chǔ)存到FPGA儲(chǔ)存器中等待處理,此時(shí)設(shè)計(jì)信號(hào)調(diào)制電路,使調(diào)整后的電路能夠確保電壓信號(hào)的平穩(wěn);另外設(shè)置軟件功能,降低數(shù)據(jù)與時(shí)鐘之間的偏斜程度,待系統(tǒng)判讀生效后,將上述待處理的數(shù)據(jù)傳輸?shù)娇刂破鬟M(jìn)行處理,從而實(shí)現(xiàn)了數(shù)據(jù)的采集功能。文獻(xiàn)[2]針對(duì)現(xiàn)有方法無法有效匹配事件序列的不足,提出基于TCN的量化時(shí)序約束表示模型,運(yùn)用該模型將事件轉(zhuǎn)化為簡(jiǎn)單的時(shí)序約束問題,使復(fù)雜事件檢測(cè)方法更加高效,從而實(shí)現(xiàn)數(shù)據(jù)采集的有效控制。
上述采集方法在一定程度上減少了數(shù)據(jù)沖突,達(dá)到了延長(zhǎng)系統(tǒng)使用壽命的目的,但不能實(shí)現(xiàn)采集精度與效率之間的平衡。因此,本文在時(shí)序控制的基礎(chǔ)上,對(duì)多通道通信網(wǎng)絡(luò)數(shù)據(jù)跨層采集方法進(jìn)行研究。在許多領(lǐng)域中存在按照時(shí)間順序發(fā)生的具有概率特征的隨機(jī)事件,根據(jù)先后順序?qū)l(fā)生的事件記錄下來,就形成了時(shí)間序列。本文通過對(duì)多層數(shù)據(jù)的挖掘,確定數(shù)據(jù)采集原理,根據(jù)該原理對(duì)時(shí)序進(jìn)行設(shè)計(jì),實(shí)現(xiàn)對(duì)時(shí)序的控制,最后通過對(duì)比實(shí)驗(yàn)驗(yàn)證了所提方法的優(yōu)越性能。
在多通道跨層冗余通信網(wǎng)絡(luò)數(shù)據(jù)挖掘過程中,不同通道與層次的取值和閾值存在密切關(guān)系,取值數(shù)量和閾值大小存在反比關(guān)系,將通道最底層的不同數(shù)值當(dāng)作先驗(yàn)知識(shí),在此基礎(chǔ)上對(duì)所有通道中最底層的閾值進(jìn)行定義,每個(gè)通道的高層閾值根據(jù)對(duì)比所在層中的不同取值產(chǎn)生,并對(duì)其閾值上限進(jìn)行限定,確保閾值小于等于1。因此獲取第i個(gè)通信到最底層最小支持度與最低可信度[3,4]的表達(dá)式分別為
(1)
(2)
因此第i個(gè)通道j層的閾值表達(dá)式為
(3)
(4)
式中,n表示多通道多層數(shù)據(jù)的通道數(shù)量,dij代表第i通道j層具有的不同取值數(shù)量;X表示集合規(guī)則結(jié)構(gòu)。
利用免疫遺傳算法[5],將關(guān)聯(lián)原則作為依據(jù)對(duì)跨層數(shù)據(jù)進(jìn)行挖掘,挖掘過程包括最小支持向量的頻繁規(guī)則選擇與強(qiáng)度關(guān)聯(lián)原則的發(fā)生兩部分。
假設(shè)一個(gè)多通道跨層數(shù)據(jù)集合{Ai,Bj},Ai與Bj分別代表決策與任務(wù)屬性,集合規(guī)則結(jié)構(gòu)生成一串編碼X={b1…bm.x1…xn},b1…bm與跨層數(shù)據(jù)的任務(wù)屬性相對(duì)應(yīng),x1…xn與決策屬性相對(duì)應(yīng),則適應(yīng)度函數(shù)表達(dá)式為
(5)
對(duì)式(5)進(jìn)行遺傳操作,將免疫原則選取策略作為基礎(chǔ),結(jié)合濃度概率[6]Pd與適應(yīng)度概率Pf確定跨層數(shù)據(jù)的選取機(jī)率P,個(gè)體濃度d通過群體中相同個(gè)體數(shù)目q與數(shù)據(jù)群體規(guī)模M之比獲得,因此,Pd與Pf可以通過以下描述進(jìn)行表示
(6)
(7)
式中,fij表示多通道跨層群體中個(gè)體的適應(yīng)值;ftotal表示群體中全部個(gè)體適應(yīng)值之和。
根據(jù)上述公式獲得跨層數(shù)據(jù)的選擇機(jī)率P的表達(dá)式為
P=aPf+(1-a)Pd
(8)
式中,a為一個(gè)常數(shù),滿足a∈(0,1)的條件。
由于會(huì)產(chǎn)生濃度較高的抗體,因此必須對(duì)濃度群體進(jìn)行更新,確保適應(yīng)度較好的個(gè)體被選擇出來的機(jī)率更高,假設(shè)抗體濃度為W,它代表群體中適應(yīng)度最強(qiáng)的抗體數(shù)量和全部抗體數(shù)量的比值,則調(diào)控個(gè)體的選擇機(jī)率p(i)的表達(dá)式為
(9)
式中,β表示可以調(diào)整的參數(shù),并且β∈[0,1]。通過上述分析得出抗體最大程度的適應(yīng)性,因此完成多通道數(shù)據(jù)無冗余跨層挖掘[7]。
根據(jù)數(shù)據(jù)挖掘結(jié)果,依據(jù)最短路徑原則對(duì)數(shù)據(jù)進(jìn)行跨層采集。在對(duì)通信網(wǎng)絡(luò)數(shù)據(jù)采集的過程中,獲取通信網(wǎng)絡(luò)實(shí)際傳輸數(shù)據(jù)的總數(shù)量,并取得數(shù)據(jù)采集總數(shù)量最大化的限制條件和全部網(wǎng)絡(luò)節(jié)點(diǎn)接收信息總量與跳數(shù)存在的關(guān)系。將通信網(wǎng)絡(luò)數(shù)據(jù)采集問題轉(zhuǎn)變成最大數(shù)據(jù)量采集的最優(yōu)路徑選擇問題,確定通信數(shù)據(jù)采集的目標(biāo)函數(shù),在此基礎(chǔ)上實(shí)現(xiàn)對(duì)通信網(wǎng)絡(luò)數(shù)據(jù)的采集。具體過程如下:
(10)
(11)
(12)
(13)
(14)
(15)
根據(jù)上述通信網(wǎng)絡(luò)數(shù)據(jù)采集原理實(shí)現(xiàn)對(duì)多通道通信網(wǎng)絡(luò)數(shù)據(jù)的跨層采集,但是采集過程耗能較高,容易出現(xiàn)延時(shí)現(xiàn)象,下面結(jié)合時(shí)序控制方法對(duì)其進(jìn)行改善。
結(jié)合上述對(duì)數(shù)據(jù)采集原理的描述,時(shí)序控制應(yīng)該提供和接收下述時(shí)序信號(hào)內(nèi)容:
主機(jī)系統(tǒng)存在的啟動(dòng)脈沖TTR;信息緩沖帶發(fā)生器原始脈沖TRS;定時(shí)脈沖TSH;轉(zhuǎn)換器的啟動(dòng)脈沖TST;轉(zhuǎn)換器的結(jié)束信號(hào)EOC;通道地址的統(tǒng)計(jì)數(shù)量脈沖TCA;信息緩沖帶脈沖TWE,地址記錄脈沖TBA,采集結(jié)束脈沖TCE。
結(jié)合采集原理,上述信號(hào)的時(shí)序關(guān)系圖如圖1所示。
圖1 數(shù)據(jù)采集工作時(shí)序圖
定時(shí)采集脈沖TSH的時(shí)間間隔Δt可以根據(jù)具體程序設(shè)置,從上圖中可以看出Δt不能小于ΔT。ΔT由采集系統(tǒng)的工作速度決定,它可以體現(xiàn)采集系統(tǒng)的時(shí)序關(guān)系操控采集過程所達(dá)到的最快速度,根據(jù)圖1的工作時(shí)序圖實(shí)現(xiàn)通信網(wǎng)絡(luò)數(shù)據(jù)采集。
根據(jù)圖1中顯示的工作時(shí)序,獲取多通道通信網(wǎng)絡(luò)數(shù)據(jù)跨層采集的控制原理圖,如圖2所示。
圖2 時(shí)序控制原理實(shí)現(xiàn)圖
圖2中,主系統(tǒng)利用一條輸出命令就可以觸動(dòng)啟發(fā)器脈沖TTR,它將主系統(tǒng)數(shù)據(jù)總線DBO中的數(shù)據(jù)“1”傳輸?shù)接|發(fā)器D1的Q端,因此能夠啟動(dòng)系統(tǒng)中的定時(shí)器與計(jì)數(shù)器的控制信號(hào)GATE,表明此時(shí)這兩個(gè)程序開始工作,觸發(fā)器D1的Q端啟動(dòng)了單穩(wěn)3,令其出現(xiàn)一個(gè)初始?xì)w零脈沖TRS,此時(shí)脈沖信息緩沖帶地址發(fā)生器為清零狀態(tài),并將DMA請(qǐng)求信號(hào)同時(shí)清零。
采集系統(tǒng)啟動(dòng)后,定時(shí)器發(fā)生的定時(shí)脈沖TSH控制每個(gè)通道數(shù)據(jù)的自動(dòng)采集過程。每條通道地址發(fā)生器是通過一個(gè)3bit的二進(jìn)制計(jì)數(shù)工具完成的,在被定時(shí)脈沖每進(jìn)行一次清零時(shí),所有的統(tǒng)計(jì)數(shù)量脈沖都會(huì)加1,此時(shí)輸出的計(jì)數(shù)情況可以當(dāng)作每條通道地址。按照上述過程,每個(gè)定時(shí)脈沖實(shí)現(xiàn)一個(gè)時(shí)間段的數(shù)據(jù)采集,同時(shí)定時(shí)脈沖還會(huì)觸發(fā)單穩(wěn)2,經(jīng)過與單穩(wěn)2的聯(lián)通,產(chǎn)生ADC的啟動(dòng)脈沖,此時(shí)該通道的A/D轉(zhuǎn)換也被啟動(dòng)。在轉(zhuǎn)換結(jié)束后,ADC將產(chǎn)生轉(zhuǎn)換結(jié)束信號(hào)EOC,該信號(hào)不但出現(xiàn)各通道地址的統(tǒng)計(jì)數(shù)量脈沖,使通道地址加1,并連接下一通道,而且啟動(dòng)單穩(wěn)1出現(xiàn)數(shù)據(jù)緩沖帶的脈沖信號(hào),將轉(zhuǎn)換結(jié)果記錄在緩沖帶中。信息緩沖帶脈沖結(jié)束時(shí)出現(xiàn)的地址記錄脈沖信號(hào)會(huì)使緩沖帶的地址啟動(dòng)器加1,并指向下一個(gè)緩沖區(qū)。此時(shí),緩沖區(qū)地址啟動(dòng)器同樣通過二進(jìn)制計(jì)數(shù)器實(shí)現(xiàn),它的計(jì)數(shù)位數(shù)和緩沖區(qū)的容量相對(duì),將計(jì)數(shù)狀態(tài)當(dāng)作緩沖帶地址,并利用信息緩沖區(qū)啟動(dòng)器的原始脈沖將其清零,再由地址記錄脈沖令其加1。
同時(shí),地址記錄脈沖觸發(fā)單穩(wěn)2,獲取下一通道的轉(zhuǎn)換啟動(dòng)信號(hào)。按照上述過程,實(shí)現(xiàn)高速通信網(wǎng)絡(luò)數(shù)據(jù)采集的信號(hào)轉(zhuǎn)換與結(jié)果儲(chǔ)存。當(dāng)每層數(shù)據(jù)的最后通道采集結(jié)束后,地址計(jì)數(shù)器輸出Q2變?yōu)椤?”,此時(shí)結(jié)束信號(hào)TGE,禁止產(chǎn)生轉(zhuǎn)換啟動(dòng)信號(hào),直到下一個(gè)定時(shí)脈沖啟動(dòng)下一通道的數(shù)據(jù)采集。此時(shí)實(shí)現(xiàn)了時(shí)序控制的多通道通信網(wǎng)絡(luò)數(shù)據(jù)采集的全部過程。
在實(shí)驗(yàn)過程中,為更好驗(yàn)證基于時(shí)序控制的通信網(wǎng)絡(luò)數(shù)據(jù)采集方法的可行性,進(jìn)行對(duì)比實(shí)驗(yàn)。選取模擬數(shù)據(jù)集My-Sea作為基礎(chǔ)數(shù)據(jù)集,并通過在線數(shù)據(jù)分析軟件MOA進(jìn)行數(shù)據(jù)處理。
由于多通道跨層數(shù)據(jù)采集是基于計(jì)算機(jī)網(wǎng)絡(luò)實(shí)現(xiàn)的,因此,會(huì)造成網(wǎng)絡(luò)擁塞現(xiàn)象,降低計(jì)算機(jī)運(yùn)行效率,所以,首先利用所提方法與文獻(xiàn)[1]、文獻(xiàn)[2]方法對(duì)網(wǎng)絡(luò)運(yùn)行的擁塞率進(jìn)行對(duì)比實(shí)驗(yàn),計(jì)算公式如下所示
(16)
式中,v表示數(shù)據(jù)采集過程中計(jì)算機(jī)運(yùn)行速度;v0表示原始計(jì)算機(jī)運(yùn)行速度。
三種方法實(shí)驗(yàn)結(jié)果對(duì)比圖如圖3所示。
圖3 不同方法的擁塞率對(duì)比圖
從上圖可以看出,所提方法在進(jìn)行數(shù)據(jù)采集時(shí),擁塞率保持在25%以下,而文獻(xiàn)[1]方法的擁塞率最高值達(dá)到了47%,文獻(xiàn)[2]方法的擁塞率最高值達(dá)到了36%,從上述數(shù)據(jù)可以看出,現(xiàn)有方法的擁塞率明顯高于所提方法,說明該方法對(duì)網(wǎng)絡(luò)的依賴程度不高,運(yùn)行速度較快。這是由于所提方法在進(jìn)行數(shù)據(jù)采集時(shí)序控制之前,采用免疫遺傳算法對(duì)通信數(shù)據(jù)中的冗余數(shù)據(jù)進(jìn)行了剔除,實(shí)現(xiàn)了跨層無冗余數(shù)據(jù)挖掘,因此擁塞率較低。
為了突出所提方法的全面性與合理性,將數(shù)據(jù)采集延時(shí)作為評(píng)價(jià)指標(biāo),進(jìn)行對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)對(duì)比圖如圖4所示。
圖4 不同方法數(shù)據(jù)采集延時(shí)對(duì)比圖
根據(jù)圖4可以看出,隨著數(shù)據(jù)采集量的不斷增多,與其它兩種方法相比,所提方法的數(shù)據(jù)采集延時(shí)更短,說明該方法具有很好的采集效率,能夠滿足對(duì)數(shù)據(jù)采集的要求。這是由于所提方法在數(shù)據(jù)挖掘的基礎(chǔ)上,參考最短路徑原則,將數(shù)據(jù)采集問題進(jìn)行了轉(zhuǎn)變,轉(zhuǎn)換為最優(yōu)路徑選擇問題,并通過設(shè)計(jì)時(shí)序控制邏輯,繪制工作時(shí)序圖,設(shè)計(jì)時(shí)序控制方案等步驟實(shí)現(xiàn)對(duì)多通道通信網(wǎng)絡(luò)數(shù)據(jù)跨層采集的時(shí)序控制。
為提升通信數(shù)據(jù)采集能力,本文對(duì)多通道通信網(wǎng)絡(luò)數(shù)據(jù)跨層采集時(shí)序控制方法進(jìn)行研究。首先通過免疫遺傳算法去除大量的冗余數(shù)據(jù),完成跨層信息挖掘;其次將最短路徑理論與數(shù)據(jù)采集相結(jié)合,分析采集原理;最后在該原理基礎(chǔ)上對(duì)時(shí)序進(jìn)行設(shè)計(jì),并實(shí)現(xiàn)高速采集通信數(shù)據(jù)的目的。測(cè)試結(jié)果表明,所提方法可以在保證數(shù)據(jù)安全的基礎(chǔ)上,大幅度提升多通道通信網(wǎng)絡(luò)數(shù)據(jù)跨層采集的能力,可以實(shí)現(xiàn)對(duì)整個(gè)采集程序的有效管理。