孫偉
摘要:關鍵詞查詢有利于用戶從數(shù)據(jù)庫中更加便捷的查詢到所感興趣的內容,用戶不用具備專業(yè)的數(shù)據(jù)庫結構化查詢語言就能夠獲取到自身所剛興趣的內容,這在很大程度上使其門檻得到了有效降低。本文就關系數(shù)據(jù)庫中關鍵詞查詢結果動態(tài)優(yōu)化進行簡要分析,深入探討了蟻群優(yōu)化算法求解關鍵詞查詢問題和基于概念漂移的查詢結果動態(tài)優(yōu)化。
關鍵詞:關系數(shù)據(jù)庫 關鍵詞查詢結果 動態(tài)優(yōu)化
中圖分類號:TP311 文獻標識碼:A 文章編號:1007-9416(2016)09-0228-01
關系數(shù)據(jù)庫隨著不斷的發(fā)展和創(chuàng)新,其數(shù)據(jù)儲存及管理技術已經(jīng)日漸成熟,且應用范圍也在不斷擴大,在各個領域中的應用越發(fā)普遍。在關系數(shù)據(jù)庫中,相關的數(shù)據(jù)信息大都存儲在“關系”中,所具備的數(shù)據(jù)結構十分規(guī)范。所以這種數(shù)據(jù)的另外一個名稱則為結構化數(shù)據(jù)。而針對于該種數(shù)據(jù),通過結構化查詢語言的強大功能能夠將滿足其需求的記錄集合查找出來,其中最為常見的有SQL語句等。隨著SQL語句查詢法的不斷創(chuàng)新,與其相應的性能優(yōu)化算法也越來越多,因此通過SQL語句查詢,能夠更快的幫助客戶獲取到所需要的只是,具有較高的查詢性能。但是,這種方法也存在一定不足之處,它需要用戶具備一定水平的數(shù)據(jù)庫專業(yè)只是才能熟練掌握和使用,這對于很對普通客戶而言則存在著較大的難度。
1 運用蟻群優(yōu)化算法求解關鍵詞查詢問題
1.1 蟻群優(yōu)化算法的基本原理分析
蟻群算法是在二十世紀九十年代有意大利學者Dorrgo等人所提出的一種優(yōu)化方法,從其字面意思就不難看出,這種算法是借鑒自然界螞蟻搜索食物的行為,經(jīng)過多年努力而研發(fā)出來的一種智能進化算法,將其在圖中進行使用,能夠將最為優(yōu)化的方法挖掘出來出來。自然界螞蟻在找尋食物的過程中,開始均都不會得到有關食物的相關信息,每只螞蟻在找尋食物的過程中,所選擇的路徑從表面上看屬于一種隨機行為,一旦其中某只螞蟻找到食物,其就會將信息素釋放到環(huán)境中,其余螞蟻則能夠結合信息素的指引找到食物所在之地。由于螞蟻數(shù)量較多,大量的螞蟻尋找必然會找到很多食物,則其他沒有尋找到食物的螞蟻則會按照信息素濃度來尋找最近的食物位置,信息濃度和路徑長度成正比例,長度也腸信息素濃度則越低,因此一段時間后其中最短的路徑則會被絕大部分螞蟻“光顧”,由此可見,單個螞蟻的行為雖然較為簡單,但是眾多螞蟻通過信息素則能夠更加快速的找尋到最佳解[1]。
螞蟻優(yōu)化算法最開始大都運用于旅行商問題的解決,而且還獲取到了較為顯著的效果。后隨著其不斷發(fā)展和眾多學者的不懈努力,越來越多的研究成果被研發(fā)出來,從而也就逐漸成為了一種優(yōu)化技術。蟻群優(yōu)化算法針對于傳統(tǒng)搜索算法中的一系列無法解決的復雜問題,能夠起到很好的效果。這種方法具有正反饋性,且多適用于分布式環(huán)境。
1.2 蟻群優(yōu)化算法求解關鍵詞查詢問題的正確運用方法
關系數(shù)據(jù)庫中關鍵詞查詢問題,從某種角度上而言,能夠將其轉化成Steiner樹問題。據(jù)國內外的相關文獻,Steiner樹問題從客觀上來看,屬于一種NP-hard問題,因此當下我國一系列研究中,大都是選擇啟發(fā)方法來讓搜索空間縮小。據(jù)相關研究實驗顯示,針對于諸多的NP-complete和NP-hard問題而言,運用蟻群算法來進行求解更加高效。就目前而言,運用蟻群優(yōu)化算法求解Steiner樹問題的相關研究項目數(shù)量越來越多,不一樣的研究所使用的方法也都存在一定差異,但是從總體上而言,這些研究都是為了探討和分析Steiner樹這個理論問題及其他應用場景,對于關系數(shù)據(jù)中的關鍵詞查詢并沒有做到有效考慮,所以這種方法并不適用于關系數(shù)據(jù)庫的關鍵詞查詢上。
2 基于概念漂移的查詢結果動態(tài)優(yōu)化
2.1 基于概念漂移的查詢結果動態(tài)優(yōu)化的核心思想
在機器學習領域研究中,概念漂移屬于重要課題之一。概念漂移主要是指隨著時間變化數(shù)據(jù)分布也會出現(xiàn)變化,這些改變會在一定程度上促使原本建立在舊數(shù)據(jù)上的模型,在新數(shù)據(jù)的特點上,出現(xiàn)了一定的不適應現(xiàn)象,因此也就必須對模型進行進一步的創(chuàng)新和完善[2]。就目前我國所處的現(xiàn)狀而言,越來越多的領域都開始普遍的引起概念漂移理論的研究成果,例如:在一系列的零售行業(yè)中,如超市、商場等,可以借助于概念漂移理論的研究成果,對消費者的購買行為進行綜合分析,針對于其購買行為變化做到第一時間發(fā)現(xiàn),從而也就能夠及時運用相應的措施來進行有效處理。在用戶查詢興趣出現(xiàn)一次變化,則就意味著出現(xiàn)了一次概念轉移,由此原本多運用于機器學習領域的概念漂移理論,逐漸在用戶的興趣變化探測上得到普及。借助于對概念漂移理論進行充分利用,能夠對用戶興趣的轉變做到及時發(fā)現(xiàn),并以動態(tài)優(yōu)化查詢結構核心,促使其能夠更加符合用戶查詢語氣,這是基于概念漂移的查詢結果動態(tài)優(yōu)化的重要核心思想。簡單而言,就是先通過概念漂移理論,將用戶的興趣節(jié)點集找到、并確認,然后只需要ACOKS算法進行簡單的修改,就能夠獲得一種全新的ACOKS算法[3]??偠灾?,就是在螞蟻移動時,引導其以更大的概率移動到興趣節(jié)點集中的節(jié)點,以較小的概率,讓其移動到非興趣節(jié)點集中的節(jié)點上,從而讓查詢結果中逐漸在展現(xiàn)出更多的興趣節(jié)點集中的內容,進而和用戶興趣更加貼切。
2.2 動態(tài)優(yōu)化過程
通過用戶興趣節(jié)點集,促使用戶的查詢興趣能夠得以展現(xiàn)出來,簡單而言,就是將一系列查詢結果,向用戶進行反饋的一個過程,在該過程中各個查詢結果,均都是由眾多元組連接而成的一個元組樹,另一種名稱被稱為Steiner樹,查詢關鍵詞隱藏在樹的節(jié)電中,當用戶對某個查詢結果進行點擊訪問時,則就代表這個結果,是大多數(shù)用戶較為感興趣的,從而也就能夠將查詢結果中,與之相對應的元組樹上所有節(jié)點都儲存到用戶興趣節(jié)點集上。(見圖1)
3 結語
綜上所述,本文將關系數(shù)據(jù)庫中的元組建模成數(shù)據(jù)圖,將關鍵詞查詢問題轉變成相似的最小Steiner樹問題,并將已經(jīng)通過一系列試驗研究,良好性能已然得到認可的蟻群優(yōu)化算法求解引入到其中,借此來使得該問題得到有效解決。同時對基于概念漂移理論的用戶查詢興趣的探查方法進行了簡要分析,希望通過這種方法,能夠第一時間發(fā)現(xiàn)并處理妥善用戶興趣的變化問題,從而達到查詢結果的動態(tài)優(yōu)化的目的,促使查詢結果和用戶預期之間,能夠更加統(tǒng)一、更加貼切,使查詢結果的有效性得到有效保障。
參考文獻
[1]教巍巍,董萬鑫,李昕.關系數(shù)據(jù)庫上的關鍵詞查詢系統(tǒng)[J].遼寧工程技術大學學報(自然科學版),2014,07:960-964.
[2]劉晨,尚博祥,倪家明.關系數(shù)據(jù)庫的關鍵詞查詢性能優(yōu)化[J].電子技術與軟件工程,2015,22:176-177.
[3]楊路明,王佳宜,謝東.關系數(shù)據(jù)庫上基于非數(shù)值屬性關鍵詞的模糊查詢[J].計算機科學,2008,06:236-239.