陳國(guó)艷
摘 要: 提出基于有向圖模型設(shè)計(jì)的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)高效檢索節(jié)點(diǎn)分布設(shè)計(jì)方法。首先構(gòu)建網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)的分布模型,分析數(shù)據(jù)結(jié)構(gòu),對(duì)檢索節(jié)點(diǎn)的存儲(chǔ)數(shù)據(jù)語(yǔ)義特征進(jìn)行信息融合處理;然后采用有向圖模型分析方法檢索網(wǎng)絡(luò)數(shù)據(jù)庫(kù)節(jié)點(diǎn)屬性聚類和自適應(yīng)調(diào)度,實(shí)現(xiàn)數(shù)據(jù)庫(kù)的高效檢索節(jié)點(diǎn)有向圖模型設(shè)計(jì);最后設(shè)計(jì)仿真實(shí)驗(yàn)進(jìn)行性能測(cè)試,實(shí)驗(yàn)結(jié)果表明,該方法有效提高了網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的檢索效率,尤其對(duì)超大規(guī)模數(shù)據(jù)庫(kù)檢索的執(zhí)行效率更高。
關(guān)鍵詞: 網(wǎng)絡(luò)數(shù)據(jù)庫(kù); 數(shù)據(jù)庫(kù)檢索; 節(jié)點(diǎn)分布設(shè)計(jì); 有向圖模型
中圖分類號(hào): TN911?34; TP391 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)05?0139?04
Abstract: A directed graph model based design method of the network database efficient retrieval mode distribution is proposed. The distribution model of the network database retrieval node was constructed to analyze the data structure, and perform the information fusion for the storage data semantic feature of the retrieval mode. The analysis method of the directed graph model is used to retrieve the node attribute clustering and adaptive dispatching of the network database to design the directed graph model of the database efficient retrieve node. The performance was tested with simulation experiment. The experiment results show this method has improved the retrieval efficiency of the network database effectively, and has high execution efficiency especially for the super?large scale database retrieval.
Keywords: network database; database retrieval; node distribution design; directed graph model
0 引 言
網(wǎng)絡(luò)數(shù)據(jù)庫(kù)是存儲(chǔ)網(wǎng)絡(luò)數(shù)據(jù)的重要載體,網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的檢索效率高低決定了大數(shù)據(jù)的訪問(wèn)與調(diào)度性能,研究網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的高效檢索方法具有重要意義,相關(guān)的模型研究受到人們的重視[1?2]。
構(gòu)建網(wǎng)絡(luò)數(shù)據(jù)庫(kù)信息管理系統(tǒng)的基礎(chǔ)是優(yōu)化設(shè)計(jì)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型。通過(guò)對(duì)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖優(yōu)化,提高數(shù)據(jù)訪問(wèn)效能。網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型設(shè)計(jì)方法主要有支持向量機(jī)算法[3]、ARMA模型算法[4]、混合高斯模型算法以及分布式結(jié)構(gòu)控制算法[5],優(yōu)化采集網(wǎng)絡(luò)數(shù)據(jù)庫(kù)存儲(chǔ)節(jié)點(diǎn)的輸入輸出數(shù)據(jù),進(jìn)行數(shù)據(jù)信息流的特征提取,實(shí)現(xiàn)數(shù)據(jù)訪問(wèn),取得了較好的訪問(wèn)精度。文獻(xiàn)[6]提出大型電氣數(shù)據(jù)庫(kù)的云存儲(chǔ)資源與服務(wù)高效調(diào)配機(jī)制,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型中的自適應(yīng)分區(qū)調(diào)度與訪問(wèn),提高網(wǎng)絡(luò)大數(shù)據(jù)訪問(wèn)吞吐量,降低訪問(wèn)開銷,但是該算法計(jì)算開銷較大,網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型占有的冗余空間較多。文獻(xiàn)[7]采用基于語(yǔ)義相似度的數(shù)據(jù)庫(kù)自適應(yīng)查詢松弛方法,提高網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型的訪問(wèn)性能,但該方法的抗干擾性能不好。文獻(xiàn)[8]提出基于統(tǒng)計(jì)特征分析實(shí)現(xiàn)對(duì)云格環(huán)境的網(wǎng)絡(luò)數(shù)據(jù)訪問(wèn)機(jī)制,檢索節(jié)點(diǎn)分布較合理。但是該方法對(duì)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索精度不高、數(shù)據(jù)收斂性不好。
針對(duì)上述問(wèn)題,提出基于有向圖模型設(shè)計(jì)的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)高效檢索節(jié)點(diǎn)分布設(shè)計(jì)方法。結(jié)果表明,該方法有效地提高了網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的檢索效率,特別是對(duì)超大規(guī)模數(shù)據(jù)庫(kù)檢索的執(zhí)行效率尤為突出。
1 數(shù)據(jù)結(jié)構(gòu)的分析
1.1 構(gòu)建網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)的分布模型
假設(shè)分布式網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型中的特征空間采樣數(shù)據(jù)集為[X=x1,x2,…,xn,]進(jìn)行分布式網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型的數(shù)據(jù)訪問(wèn)機(jī)制體系分析時(shí),采用有向圖和語(yǔ)義本體結(jié)構(gòu)模型構(gòu)建分布式多層網(wǎng)絡(luò)空間中的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)存儲(chǔ)結(jié)構(gòu)模型,如圖1所示。
采用SN,sink和跳數(shù)hop?Count進(jìn)行分布式多層網(wǎng)絡(luò)空間中數(shù)據(jù)節(jié)點(diǎn)圖的設(shè)計(jì)以及建模。網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索結(jié)構(gòu)中,大數(shù)據(jù)分布有向圖的邊[(u,v)∈E,]設(shè)分布式多層網(wǎng)絡(luò)數(shù)據(jù)庫(kù)數(shù)據(jù)檢索陣列節(jié)點(diǎn)[A?V,][B?V]且[A?B=?,]抽取網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型訪問(wèn)特征序列的相空間模糊度點(diǎn)集,在網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型設(shè)計(jì)中,用戶節(jié)點(diǎn)通過(guò)云服務(wù)器進(jìn)行模糊隸屬度匹配。網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型采樣的時(shí)間序列為[{x(t0+iΔt)},][i=0,1,2,…,N-1,]數(shù)據(jù)信息流矢量長(zhǎng)度為[N,]得到網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型采集輸出的狀態(tài)矢量表達(dá)式為:
式中:[x(t)]表示分布式多層網(wǎng)絡(luò)空間中網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型采集數(shù)據(jù)信息流的時(shí)間序列;[J]是時(shí)間窗函數(shù);[m]是網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的嵌入維數(shù);[Δt]表示數(shù)據(jù)采集的時(shí)間間隔。
令[A=a1,a2,…,an]為分布式多層網(wǎng)絡(luò)數(shù)據(jù)庫(kù)信息流的初始向量,訓(xùn)練集的屬性集為[B=b1,b2,…,bm,]分布式多層網(wǎng)絡(luò)數(shù)據(jù)庫(kù)時(shí)態(tài)屬性[ai]的屬性值為[c1,c2,…,ck。]分布式多層網(wǎng)絡(luò)數(shù)據(jù)庫(kù)信息流矢量長(zhǎng)度為[N。]在數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)分布的圖模型中,通過(guò)屬性集分類得到檢索信息特征的表達(dá)式為:
通過(guò)構(gòu)建高效檢索節(jié)點(diǎn)圖模型,進(jìn)行數(shù)據(jù)采集,優(yōu)化設(shè)計(jì)云訪問(wèn)。
1.2 網(wǎng)絡(luò)數(shù)據(jù)庫(kù)數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)分析
為了提高數(shù)據(jù)的檢索性能,在進(jìn)行節(jié)點(diǎn)圖優(yōu)化設(shè)計(jì)之前,需要分析數(shù)據(jù)存儲(chǔ)結(jié)構(gòu),用非線性時(shí)間序列分析方法設(shè)計(jì)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型的優(yōu)化訪問(wèn)結(jié)構(gòu),網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型采集輸出的信息流時(shí)間序列模型為:
采用模糊迭代算法使數(shù)據(jù)的融合中心不斷更替,進(jìn)行檢索節(jié)點(diǎn)的尋優(yōu)。
2 算法的具體設(shè)計(jì)
2.1 存儲(chǔ)數(shù)據(jù)語(yǔ)義特征信息融合
設(shè)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型中任意兩個(gè)聚類簇[Mi]與[Mj]的數(shù)據(jù)融合中心距離分布為[Clustdist(Mi,Mj),]當(dāng)[(i≠j,1≤i≤q,1≤j≤q),]網(wǎng)絡(luò)大數(shù)據(jù)中訪問(wèn)數(shù)據(jù)信息流模型能惟一地描述語(yǔ)義本體信息[9]。采用語(yǔ)義本體模型構(gòu)建方法得到網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型的語(yǔ)義融合分布空間向量為:
式中:[Xp]為網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖的調(diào)配狀態(tài)系數(shù);[u]為網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型的尺度系數(shù);[v]為數(shù)據(jù)檢索語(yǔ)義信息的正交基函數(shù)。
采用匹配投影法進(jìn)行數(shù)據(jù)庫(kù)檢索過(guò)程中的干擾抑制,數(shù)據(jù)庫(kù)檢索的均衡控制矩陣為[q,][n]表示自適應(yīng)加權(quán)權(quán)重,選定迭代變量[k=0,]進(jìn)行語(yǔ)義信息特征提取,假設(shè)數(shù)據(jù)庫(kù)的檢索語(yǔ)義差異度范圍為[2≤z≤m。]計(jì)算第[k+1]次迭代的數(shù)據(jù)庫(kù)語(yǔ)義信息差異性特征函數(shù)隸屬度矩陣[v,]即有:
3 性能測(cè)試
采用Cloudsim平臺(tái)來(lái)模擬網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型的分布結(jié)構(gòu),數(shù)據(jù)檢索節(jié)點(diǎn)分布為均勻分布,檢索節(jié)點(diǎn)的個(gè)數(shù)設(shè)定為250,網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型的特征采集時(shí)間間隔為0.1 s,存儲(chǔ)數(shù)據(jù)的結(jié)構(gòu)長(zhǎng)度為5 000;網(wǎng)絡(luò)空間中信息干擾為高斯白噪聲干擾,信噪比為?10 dB;分布式多層網(wǎng)絡(luò)數(shù)據(jù)訪問(wèn)負(fù)荷復(fù)雜度大小為10 GB;數(shù)據(jù)檢索的信道帶寬[B=1 028]Hz。首先進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的數(shù)據(jù)信息檢索時(shí)間序列采樣,得到的采樣時(shí)序波形如圖3所示。
采樣的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索時(shí)間序列為測(cè)試樣本集,融合處理存儲(chǔ)數(shù)據(jù)語(yǔ)義特征信息,得到數(shù)據(jù)融合輸出,如圖4所示,從圖4可知網(wǎng)絡(luò)數(shù)據(jù)庫(kù)語(yǔ)義特征信息融合結(jié)果,以此作為信息特征輸入,進(jìn)行檢索節(jié)點(diǎn)的有向圖分析,構(gòu)建檢索節(jié)點(diǎn)圖模型,實(shí)現(xiàn)數(shù)據(jù)庫(kù)高效檢索。
采用本文算法和傳統(tǒng)算法進(jìn)行不同數(shù)據(jù)規(guī)模下網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索的耗時(shí)對(duì)比如圖5所示。由圖5可知,當(dāng)數(shù)據(jù)量低于10 000 GB時(shí),兩種算法的執(zhí)行效能相當(dāng)。隨著數(shù)據(jù)量的進(jìn)一步增大,本文方法的執(zhí)行耗時(shí)明顯低于傳統(tǒng)方法,說(shuō)明采用本文算法進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖模型優(yōu)化設(shè)計(jì)可提高檢索效率,減少執(zhí)行耗時(shí),特別是在對(duì)大規(guī)模數(shù)據(jù)檢索的效率方面表現(xiàn)出明顯的優(yōu)勢(shì)。
4 結(jié) 語(yǔ)
為了優(yōu)化網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索節(jié)點(diǎn)圖,提高數(shù)據(jù)訪問(wèn)效能,提出基于有向圖模型設(shè)計(jì)的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)高效檢索節(jié)點(diǎn)分布設(shè)計(jì)方法,仿真結(jié)果表明,該方法可以有效提高網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的檢索效率,特別是對(duì)超大規(guī)模數(shù)據(jù)庫(kù)檢索的執(zhí)行效率優(yōu)越性比較突出。
參考文獻(xiàn)
[1] 楊照峰,王啟明,呂海蓮.基于任務(wù)延遲的云計(jì)算資源調(diào)度算法研究[J].計(jì)算機(jī)測(cè)量與控制,2014,22(2):499?502.
[2] 騰書華,魯敏,楊阿峰,等.基于一般二元關(guān)系的粗糙集加權(quán)不確定性度量[J].計(jì)算機(jī)學(xué)報(bào),2014,37(3):649?665.
[3] 何倩,胡啟偉,王勇,等.基于軟件定義網(wǎng)絡(luò)的反飽和分組云負(fù)載均衡[J].計(jì)算機(jī)應(yīng)用,2016,36(6):1520?1525.
[4] EL?MEZOUAR M C, KPALMA K, TALEB N, et al. A pan?sharpening based on the non?subsampled contourlet transform: application to WorldView?2 imagery [J]. IEEE journal of selected topics in applied earth observations and remote sensing, 2014, 7(5): 1806?1815.
[5] XU L, JIA J Y, MATSUSHITA Y. Motion detail preserving optical flow estimation [J]. IEEE transactions on pattern analysis and machine intelligence, 2012, 34(9): 1744?1757.
[6] 曾志,王晉,杜震洪,等.一種云格環(huán)境下可計(jì)算資源與服務(wù)高效調(diào)配機(jī)制[J].浙江大學(xué)學(xué)報(bào)(理學(xué)版),2014,41(3):353?357.
[7] 孟祥福,嚴(yán)麗,馬宗民,等.基于語(yǔ)義相似度的數(shù)據(jù)庫(kù)自適應(yīng)查詢松弛方法[J].計(jì)算機(jī)學(xué)報(bào),2011,34(5):812?824.
[8] 陸興華,李國(guó)恒,余文權(quán).基于模糊C均值聚類的科研管理數(shù)據(jù)庫(kù)調(diào)度算法[J].計(jì)算機(jī)與數(shù)字工程,2016,44(6):1011?1015.
[9] 劉俊,劉瑜,何友,等.雜波環(huán)境下基于全鄰模糊聚類的聯(lián)合概率數(shù)據(jù)互聯(lián)算法[J].電子與信息學(xué)報(bào),2016,38(6):1438?1445.
[10] JIANG X, HARISHAN K, THAMARASA R, et al. Integra?ted track initialization and maintenance in heavy clutter using probabilistic data association [J]. Signal processing, 2014, 94(1): 241?250.