廣西電網(wǎng)有限責任公司信息中心 萬義飛 梁彪 周迪貴
目前分流系統(tǒng)分流大數(shù)據(jù)信息效率較低,為此提出基于優(yōu)化聚類算法的大數(shù)據(jù)信息分流系統(tǒng)設計。根據(jù)博弈論,建立信道選擇模型;設計信道選擇步驟,選擇信息分流信道;采用優(yōu)化聚類算法,聚類大數(shù)據(jù)信息,生成混沌序列,分流大數(shù)據(jù)信息。實驗結果:設計系統(tǒng)相較此次實驗選擇系統(tǒng),平均信息分流效率更高。
大數(shù)據(jù)信息分流,是通過不同的網(wǎng)絡,制定數(shù)據(jù)傳輸方案,增強網(wǎng)絡容量。國內外十分重視大數(shù)據(jù)信息分流技術,目前國外已經研究出PBP、貪婪算法、DH算法、TH算法、TRH算法、快速交換算法等信息分流技術;國內雖然從整體上的研究成果上看,落后于國外研究成果,但是,也研究出FDLB算法、負載自適應均衡算法、網(wǎng)絡入侵檢測算法等信息分流技術[1]。在國內外研究基礎上,文獻[2]在系統(tǒng)中設計了信息特征采取及調度模塊,實現(xiàn)數(shù)據(jù)分流。將這一研究方法,應用在大數(shù)據(jù)信息分流中,其信息分流效率較低,為此,引入優(yōu)化聚類算法,聚類大數(shù)據(jù)信息,加快信息分流效率,設計基于優(yōu)化聚類算法的大數(shù)據(jù)信息分流系統(tǒng)。
在當前分流系統(tǒng)硬件設計基礎上,設計系統(tǒng)軟件??紤]系統(tǒng)主要功能,建立信道選擇模型,通過優(yōu)化聚類算法,聚類大數(shù)據(jù)信息,依據(jù)聚類結果,實現(xiàn)大數(shù)據(jù)信息分流。
大數(shù)據(jù)信息分流,需要先選擇信息分流信道,而信道的選擇是一個博弈的過程,因此采用博弈論,建立信道選擇模型,則有:
(1)式中, 表示大數(shù)據(jù)信息的移動設備選擇信道策略,其中,nb表示第 n臺移動設備,選擇的信道策略;nE表示設備在選擇策略過程中,所產生的能量消耗;N表示傳遞大數(shù)據(jù)信息的移動設備總數(shù)量。
從(1)式中可以看出,當多個移動通信設備,在選擇信道傳輸大數(shù)據(jù)信息時,若存在空閑信道,則這些用戶都會考慮是否要轉移到空閑信道上,移動通信設備所產生的能量消耗,就會發(fā)生變化。但是,每一個信道上的用戶,都只能感知自身能量的消耗,并不了解總體上的消耗,產生的信道選擇博弈,屬于不對稱博弈。在這一博弈下,移動設備產生的能量消耗的負方程 nE- 為:
(2)式中, b-n表示除第 n個移動設備外,其他移動設備選擇的信道集合;Un表示效用方程。結合(1)式和(2)式,將信道選擇模型定義為策略博弈 Γ,則有:
(3)式中,n?表示策略博弈空間。綜合上述3個公式,即為此次設計建立的信道選擇模型。為了讓信道選擇效用達到最大,需要將移動設備產生的能量消耗控制在最小范圍內,因此,在此次計算中,-表示統(tǒng)一。
根據(jù)此次設計,建立的信道選擇模型,其選擇信息分流信道過程,如下式所示:
(4)式中, bn'表示第 n個移動設備,相較于 b-n信道選擇集,選擇的最佳信道;dn表示第 n個移動設備到基站的距離; Φ表示潛方程; Sn表示移動設備需要發(fā)送的信息量;表示大數(shù)據(jù)信息傳輸路徑損耗系數(shù)[3]。
從(4)式中可以看出,移動通信設備改變信道選擇策略后, Φ的變化與 nU的權值一致?;诖?設計的信道選擇分流過程如下:
第二步,所有移動設備選擇的信道策略均為bn;
第三步,在同一信道上,移動設備均要將大數(shù)據(jù)信息傳輸給用戶h,需要信道中的信頭采集所有移動設備大數(shù)據(jù)信息;
第四步,信頭通過信道,將采集到的大數(shù)據(jù)信息傳輸給基站。在這一過程中,每一個移動設備都會在信道bn上,產生能量消耗,根據(jù)(2)式計算設備消耗;
第五步,隨機選擇一個新的信道策略bn',再次根據(jù)(2)式計算設備消耗;
第七步,重復步驟5和步驟6,計算每一個移動設備,實現(xiàn)每一個移動設備傳輸大數(shù)據(jù)信息的信道選擇。
當移動設備完成信道選擇后,需要在信道中搜索 D維大數(shù)據(jù)信息,為此,假設信道屬于一個種群,其中存在的大數(shù)據(jù)信息,為若干個粒子,則信道中,大數(shù)據(jù)信息高維映射矢量 χ,所對應的函數(shù) fi(t)為:
在(5)式的作用下,數(shù)據(jù)聚類中心,會聚集信道中的大數(shù)據(jù)信息,此時,得到的聚類目標函數(shù) A的表達式為:
(7)式中, Yn+1表示混沌序列;Yn表示 Yn+1中的子序列。依據(jù)(7)式產生的混沌序列,采用擾動的方式,提高粒子群的搜索能力,則得到的粒子擾動向量為:
(8)式中,id D∈ ,表示第 i個粒子的維度; g表示最高適應度的搜索空間維度;表示任何維度中的粒子上限值;δ表示任何維度中的粒子下限值。此時,重新迭代計算粒子,得到的混沌序列 Y為:
(9)式中, m表示數(shù)據(jù)分流選擇的信道,md表示信道所處維度;mY表示信道中分流的大數(shù)據(jù)信息。
綜合上述計算過程,選擇大數(shù)據(jù)信息分流信道,依據(jù)選擇的信道,聚類大數(shù)據(jù)信息,將聚類的大數(shù)據(jù)信息,按照選擇的信道分流。
將云計算平臺下的大數(shù)據(jù)分流系統(tǒng),作為此次設計對比測試對象,在仿真平臺上,測試兩組系統(tǒng)的大數(shù)據(jù)信息分流算法,驗證此次設計的大數(shù)據(jù)信息分流系統(tǒng)。比較兩組系統(tǒng),分流大數(shù)據(jù)信息效率。
此次實驗,選擇ONE平臺作為兩組系統(tǒng)分流算法的運行平臺,在平臺上,設置的仿真參數(shù),如表1所示。
基于表1所示的ONE平臺仿真參數(shù),選擇宗教、文化、經濟、政治、體育五種類型的大數(shù)據(jù)信息,每種信息10000條,作為此次系統(tǒng)測試實驗驗證對象。
表1 仿真參數(shù)Tab.1 Simulation parameters
采用兩組系統(tǒng),分別分流五種類型的大數(shù)據(jù)信息,計算兩組系統(tǒng)劃分每種類型大數(shù)據(jù)信息的分流效率η,其計算公式如下式所示:(10)式中, N表示分流的數(shù)據(jù)量; M表示每種類型大數(shù)據(jù)信息的總數(shù)量。根據(jù)(10)式所示的分流效率計算公 式,得到兩組系統(tǒng),分流五種類型大數(shù)據(jù)信息的分流效率,如表2所示。
表2 兩組系統(tǒng)信息分流效率對比表(%)Tab.2 Comparison table of information shunt efficiency between two groups of systems (%)
從表2中可以看出,云計算平臺下的大數(shù)據(jù)分流系統(tǒng)的平均信息分流效率為88.7%;設計系統(tǒng)的平均信息分流效率為97.7%,較云計算平臺下的大數(shù)據(jù)分流系統(tǒng)的平均信息分流效率高了9%??梢?此次設計系統(tǒng),具有較高的大數(shù)據(jù)信息分流效率。
綜上所述,此次設計,充分利用優(yōu)化聚類算法,聚類大數(shù)據(jù)信息,讓其可以根據(jù)選擇的分流信道,進行信息分流。經實驗驗證,此次設計的系統(tǒng),提高了信息分流效率。
引用
[1] 郭威,廖丹,王建永,等.雙鏈接無線網(wǎng)絡海量電力大數(shù)據(jù)合理分流方法[J].電子設計工程,2019,27(21):112-116.
[2] 解艷.云計算平臺下的大數(shù)據(jù)分流系統(tǒng)的設計研究[J].電子設計工程,2019,27(9):119-122.
[3] 趙旭,李艷梅,羅建,等.基于Docker容器動態(tài)遷移數(shù)據(jù)分流框架[J].西華師范大學學報(自然科學版),2019,40(2):210-216.