李淑蘭 王景珊
(景德鎮(zhèn)學(xué)院 江西景德鎮(zhèn) 335100)
分布式數(shù)據(jù)庫是一種運用物理存儲介質(zhì)的分散單元存儲方式進行數(shù)據(jù)的存儲及耦合性融合的數(shù)據(jù)庫,具有儲存空間大、數(shù)據(jù)整合能力強等特征,能夠滿足規(guī)模較大及云數(shù)據(jù)的存儲需求。在云計算等技術(shù)不斷發(fā)展的情況下,分布式數(shù)據(jù)可能夠發(fā)揮出更大的優(yōu)勢。但隨著儲存量的不斷增加,分布式數(shù)據(jù)在數(shù)據(jù)查詢上可能會受數(shù)據(jù)耦合關(guān)系的影響而出現(xiàn)誤差問題。因此,為了有效保障分布式數(shù)據(jù)庫在查詢數(shù)據(jù)上的準(zhǔn)確性,必須要對其查詢技術(shù)進行優(yōu)化。本文將對分片關(guān)系變化為基礎(chǔ)的自適應(yīng)查詢技術(shù)在分布式數(shù)據(jù)庫中的實現(xiàn)進行簡單探討,通過建立模型、數(shù)據(jù)提取、仿真測試等方式檢驗自適應(yīng)查詢技術(shù)的運用效果。
要做到分布式數(shù)據(jù)可分片關(guān)系變化自適應(yīng)查詢,首先需要對分布式數(shù)據(jù)庫在數(shù)據(jù)存儲方面的結(jié)構(gòu)展開分析,分析方式主要以數(shù)據(jù)分段屬性辨識與特征分解兩種為主。此時需要對分布式數(shù)據(jù)庫的存儲樣本集及數(shù)據(jù)庫中存儲數(shù)據(jù)的種類進行定義,同時對分布式數(shù)據(jù)庫中需要查詢的樣本和分簇聚類模型進行定義,并列出定義式。之后將定義式中分布式數(shù)據(jù)庫存儲數(shù)據(jù)樣本采樣幅值和樣本集維數(shù)利用分段融合方法進行模糊聚類,得出數(shù)據(jù)庫的存儲向量空間,并得出幾何矩。將幾何矩中的分片中心點用自適應(yīng)特征分解法進行信息整合,得出數(shù)據(jù)庫樣本查詢的聚類中心式。運用領(lǐng)域搜索法對分布式數(shù)據(jù)庫中所存儲信息的詞語、節(jié)點等特加以分解,得出特征分解的目標(biāo)函數(shù)式。在該目標(biāo)函數(shù)中設(shè)定一個數(shù)據(jù)圖和一組查詢關(guān)鍵詞,利用查詢節(jié)點權(quán)重自適應(yīng)法得出模糊度點集以及數(shù)據(jù)庫查詢的聚類交叉項。由此構(gòu)建出數(shù)據(jù)庫結(jié)構(gòu)模型,結(jié)合數(shù)據(jù)庫結(jié)構(gòu)及查詢節(jié)點對其查詢方法進行設(shè)計。
在分簇聚類模型構(gòu)建的前提下,利用數(shù)據(jù)關(guān)系集特征融合方式完成數(shù)據(jù)庫的狀態(tài)向量空間組合,并得出本體特征分布式。利用向量量化分解法進行分片處理,得出分片變換輸出式。利用自適應(yīng)融合對數(shù)據(jù)集的分片結(jié)果進行處理,得出數(shù)據(jù)融合聚類結(jié)果。結(jié)合數(shù)據(jù)庫中關(guān)系元組的梳理得出數(shù)據(jù)查詢的模糊聚類中心向量,結(jié)合分片屬性分解自適應(yīng)特征和改進型耦合關(guān)系的變換,得出兩個聚類簇,用數(shù)據(jù)關(guān)系集的本體特征分量提取出二階、三階以及中心距,最終實現(xiàn)通分布式數(shù)據(jù)庫自適應(yīng)查詢效果。
在完成分簇聚類模型構(gòu)建以及狀態(tài)向量空間組合、特征提取之后,需要對數(shù)據(jù)庫查詢技術(shù)進行優(yōu)化。首先列出數(shù)據(jù)特征分部向量集的分片關(guān)系變換式,并根據(jù)分片屬性對自適應(yīng)特征進行分解,得出分布式,在該式中,具有絕不是數(shù)據(jù)庫查詢數(shù)據(jù)集的規(guī)范正交基,提取出互信息熵特征量。在進行分片屬性、門限值設(shè)置時,需要通過對提出的信息熵進行自適應(yīng)配置,自聚類中心就能得出數(shù)據(jù)庫查詢輸出式??衫米赃m應(yīng)全局概率搜索法對其中的最優(yōu)迭代步長進行數(shù)據(jù)集搜索,搜索后得出查詢數(shù)據(jù)集的中心分量。在輸出查詢的樣本值中選擇適應(yīng)度最高的作為訓(xùn)練集。結(jié)合數(shù)據(jù)的指向性聚類結(jié)果得出數(shù)據(jù)庫查詢的輸出特征融合向量集,迭代步長增量出現(xiàn)。由此實現(xiàn)分布式數(shù)據(jù)庫的優(yōu)化查詢。
要確保查詢技術(shù)的應(yīng)用效果,需要通過仿真實驗加以驗證。首先,確定實驗所用的查詢數(shù)據(jù)庫類型、分布式數(shù)據(jù)庫中待查詢的數(shù)據(jù)樣本集數(shù)量、數(shù)據(jù)的規(guī)模長度、數(shù)據(jù)集采樣帶寬、數(shù)據(jù)庫查詢節(jié)點連接關(guān)系數(shù)量,進行多次查詢實驗后得出查詢數(shù)據(jù)集的時域波形圖。將時域波形圖的數(shù)據(jù)集作為樣本,進行數(shù)據(jù)分片變換處理及信息融合處理,得出特征分布圖。最后,根據(jù)特征分布圖的數(shù)據(jù)分布情況對融合聚類、特征進行提取,完成對數(shù)據(jù)庫查詢的優(yōu)化,利用多種方式對其查詢準(zhǔn)確率進行檢測,得出檢測結(jié)果。從檢測結(jié)果中可以看出,利用分片關(guān)系變換自適應(yīng)查詢技術(shù)進行數(shù)據(jù)庫查詢,準(zhǔn)確率會隨著分片尺度的增加而增加,同時可以看出其準(zhǔn)確率在特定分片尺度情況下可以達到100%,這比傳統(tǒng)查詢技術(shù)要高出很多。由此可見,在分布式數(shù)據(jù)庫查詢中利用分片關(guān)系變換自適應(yīng)查詢技術(shù)進行數(shù)據(jù)查詢,能夠有效提高查詢結(jié)果的準(zhǔn)確性,同時也說明了現(xiàn)有的數(shù)據(jù)庫查詢技術(shù)有待完善。[1-3]
隨著互聯(lián)網(wǎng)與計算機技術(shù)的飛速發(fā)展,信息數(shù)據(jù)的儲存需求越來越大,數(shù)據(jù)庫的應(yīng)用需求也隨之不斷增加。分布式數(shù)據(jù)庫具有存儲量大等優(yōu)點,在很多具有大規(guī)模存儲需求中得到了廣泛運用,但因為其存儲數(shù)據(jù)量巨大,在數(shù)據(jù)查詢上會存在效率及準(zhǔn)確率問題。加強對分布式數(shù)據(jù)庫數(shù)據(jù)查詢技術(shù)的進一步研究,是保障數(shù)據(jù)查詢準(zhǔn)確性的重要途徑,同時也是提高分布式數(shù)據(jù)庫運用效果的重要方式。通過研究,分片關(guān)系變換自適應(yīng)查詢技術(shù)能夠有效改善分布式數(shù)據(jù)庫在查詢準(zhǔn)確率方面的問題,在分布式數(shù)據(jù)庫查詢中開應(yīng)該加強對此查詢技術(shù)的運用。