• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      實(shí)例檢索中基于關(guān)聯(lián)函數(shù)和D-HS索引的改進(jìn)與融合

      2021-05-07 03:42:26趙燕偉任設(shè)東桂方志
      關(guān)鍵詞:實(shí)例區(qū)間關(guān)聯(lián)

      趙燕偉,徐 晨,任設(shè)東,桂方志,朱 芬

      (1.浙江工業(yè)大學(xué) 機(jī)械工程學(xué)院,浙江 杭州 310014;2.浙江工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,浙江 杭州 310023)

      0 引言

      實(shí)現(xiàn)國(guó)家現(xiàn)代化的基礎(chǔ)在于發(fā)展實(shí)體經(jīng)濟(jì),制造業(yè)是其支柱和核心[1]。隨著德國(guó)工業(yè)4.0及中國(guó)制造2025等戰(zhàn)略的提出,智能制造已成為全球制造業(yè)發(fā)展的共同趨勢(shì)與目標(biāo)[2],但在經(jīng)濟(jì)全球化的趨勢(shì)下,制造業(yè)市場(chǎng)的競(jìng)爭(zhēng)日趨激烈,用戶對(duì)產(chǎn)品的個(gè)性化需求也越來(lái)越高[3]。在此背景下,產(chǎn)品設(shè)計(jì)周期變的越來(lái)越短,這給企業(yè)帶來(lái)了繁重的產(chǎn)品開(kāi)發(fā)任務(wù),設(shè)計(jì)人員面臨的壓力與日俱增[4-5]。產(chǎn)品設(shè)計(jì)者在分析3種產(chǎn)品設(shè)計(jì)類型(變型設(shè)計(jì)、適應(yīng)性設(shè)計(jì)和創(chuàng)新設(shè)計(jì))時(shí)發(fā)現(xiàn),變型設(shè)計(jì)和適應(yīng)性設(shè)計(jì)占比較大,這意味著產(chǎn)品設(shè)計(jì)經(jīng)常以原有設(shè)計(jì)為基礎(chǔ),適當(dāng)進(jìn)行修改。因此,根據(jù)用戶個(gè)性化需求,在產(chǎn)品實(shí)例庫(kù)中高效、準(zhǔn)確地檢索來(lái)獲得相似實(shí)例是設(shè)計(jì)人員借助計(jì)算機(jī)輔助設(shè)計(jì)系統(tǒng)對(duì)現(xiàn)有實(shí)例進(jìn)行修改和重用的關(guān)鍵[6-7]。

      實(shí)例推理(Case-based Reasoning, CBR)[8-9]是指利用過(guò)去解決同類問(wèn)題的方案和經(jīng)驗(yàn)來(lái)獲得當(dāng)前問(wèn)題解決辦法的一項(xiàng)在人工智能領(lǐng)域興起的技術(shù)。實(shí)例檢索是實(shí)例推理系統(tǒng)的中心環(huán)節(jié),其檢索速度及精度關(guān)系著整個(gè)系統(tǒng)的質(zhì)量[10]。因此,眾多專家學(xué)者對(duì)該環(huán)節(jié)展開(kāi)了深入的研究,文獻(xiàn)[11-12]針對(duì)低碳設(shè)計(jì)中的實(shí)例檢索問(wèn)題,提出一種基于多維關(guān)聯(lián)函數(shù)的多屬性相似實(shí)例檢索方法,并將其應(yīng)用于螺桿空壓機(jī)的低碳屬性需求檢索中;朱芳來(lái)等[13]將基于混合屬性距離的相似性度量方法應(yīng)用于實(shí)例檢索中,以閥門概念設(shè)計(jì)中實(shí)例檢索為例,驗(yàn)證了該應(yīng)用對(duì)提高CBR系統(tǒng)的有效性和可靠性的幫助;蔣占四等[14]針對(duì)最近鄰實(shí)例檢索中實(shí)例屬性相似度和權(quán)重的計(jì)算問(wèn)題,提出了區(qū)間值屬性相似度的計(jì)算模型和基于相似度離差信息的客觀賦權(quán)方法;殷亮等[15]基于子空間法的實(shí)例分類,提出一種多級(jí)實(shí)例檢索方法,將檢索過(guò)程分為實(shí)例模板的檢索和模板內(nèi)的實(shí)例檢索,并采用最鄰近法計(jì)算實(shí)例相似度。

      綜合分析上述文獻(xiàn)不難得出,如何衡量實(shí)例間的距離是實(shí)例檢索的核心問(wèn)題。關(guān)聯(lián)函數(shù)、混合屬性距、最近鄰法及其改進(jìn)研究等相繼被提出,且在索引精度提升的基礎(chǔ)上成效斐然。但實(shí)例檢索是索引精度和索引速度這一對(duì)基本矛盾的有機(jī)結(jié)合,日趨復(fù)雜的計(jì)算方法在提高精度的同時(shí)帶來(lái)了龐大的計(jì)算量,導(dǎo)致索引速度下降。此外,索引速度不僅受索引精度的制約,還受實(shí)例庫(kù)內(nèi)實(shí)例數(shù)目的影響,在實(shí)例庫(kù)的構(gòu)建過(guò)程中,為使實(shí)例知識(shí)盡可能豐富,設(shè)計(jì)者往往會(huì)不斷地更新實(shí)例庫(kù)。因此,實(shí)例檢索中存在一部分影響索引速度且無(wú)益于索引精度的冗余計(jì)算,文獻(xiàn)[16]稱此為檢索效用問(wèn)題。

      本文針對(duì)索引速度與索引精度間的矛盾問(wèn)題,結(jié)合模糊數(shù)與關(guān)聯(lián)函數(shù),提出模糊關(guān)聯(lián)函數(shù)的概念,并推導(dǎo)出相應(yīng)計(jì)算公式,同時(shí)摒棄面對(duì)多屬性產(chǎn)品時(shí)計(jì)算量龐大的全維關(guān)聯(lián)函數(shù)計(jì)算方法,結(jié)合層次分析法建立單維關(guān)聯(lián)函數(shù)組合相似性度量模型;此外,基于Sigmoid函數(shù)對(duì)D-HS索引進(jìn)行改進(jìn),并融合改進(jìn)后的D-HS索引和關(guān)聯(lián)函數(shù)度量模型,避免了實(shí)例檢索中的部分冗余計(jì)算,有效解決了檢索效用問(wèn)題。

      1 相關(guān)知識(shí)

      1.1 關(guān)聯(lián)函數(shù)

      關(guān)聯(lián)函數(shù)[17-18]類比于模糊集理論中的隸屬度函數(shù),能夠定量刻畫(huà)事物屬于某區(qū)間或者擁有某性質(zhì)的程度,相較于傳統(tǒng)歐式幾何距方法、K最近鄰(K-Nearest Neighbor, KNN)分類檢索方法,將關(guān)聯(lián)函數(shù)應(yīng)用于實(shí)例檢索能更為準(zhǔn)確地反映產(chǎn)品間的相似程度[12]。關(guān)聯(lián)函數(shù)k(x)的表達(dá)式如式(1)所示:

      (1)

      式中ρ(x,x0,X)和ρ(x,x0,X0)表示側(cè)距,

      (2)

      式中:x,x0分別表示空間上某點(diǎn)及最優(yōu)點(diǎn);X表示空間中的范圍約束;X1,X2分別表示點(diǎn)x與x0的連線與區(qū)間X邊界的交點(diǎn),其中X1為離x0較近的點(diǎn);Ext(x0X1)表示沿直線x0X1并以X1為起點(diǎn)的射線,Ext(x0X2)同理;x=x0表示點(diǎn)x和最優(yōu)點(diǎn)x0重合;-max{|x0M|}中M表示區(qū)間X各頂點(diǎn),-max{|x0M|}意為取最優(yōu)點(diǎn)x0與區(qū)間各頂點(diǎn)距離最大值的負(fù)數(shù)。側(cè)距ρ(x,x0,X0)與側(cè)距ρ(x,x0,X)僅在區(qū)間約束上存在差異,計(jì)算方法相同(即將X1,X2替換為x1,x2),故此處略去其具體公式。D(x,X0,X)表示位值,

      D(x,X0,X)=ρ(x,x0,X)-ρ(x,x0,X0)。

      (3)

      由式(3)可知,位值D(x,X0,X)等于以X為區(qū)間的側(cè)距ρ(x,x0,X)與以X0為區(qū)間的側(cè)距ρ(x,x0,X0)的差值。

      1.2 D-HS索引

      最高離散化相似度(Discretized-Highest Similarity, D-HS)[19-20]索引方法的核心思想是對(duì)實(shí)例庫(kù)中實(shí)例的各屬性值進(jìn)行離散化處理,劃定每個(gè)屬性對(duì)應(yīng)的區(qū)間長(zhǎng)度及數(shù)目,判斷實(shí)例庫(kù)實(shí)例與目標(biāo)實(shí)例是否落入相同區(qū)間并計(jì)算屬性匹配度(計(jì)算方法如式(4)),提取出與目標(biāo)實(shí)例存在共同區(qū)間的相似實(shí)例組成初步索引集SP,再對(duì)SP內(nèi)元素按照屬性匹配度的大小進(jìn)行降序排序,最后剔除其中屬性匹配度較低的實(shí)例,形成最終索引集SE。

      (4)

      式中:SA(ci,T)表示實(shí)例庫(kù)實(shí)例ci與目標(biāo)實(shí)例T的屬性匹配度;vj(ci)和vj(T)分別表示實(shí)例庫(kù)實(shí)例ci的第j個(gè)屬性對(duì)應(yīng)的屬性值和目標(biāo)實(shí)例T的第j個(gè)屬性對(duì)應(yīng)的屬性值;當(dāng)vj(ci)和vj(T)落入同一區(qū)間時(shí)Match(vj(ci),vj(T))取1,否則取0;M表示實(shí)例屬性總數(shù)。

      2 基于關(guān)聯(lián)函數(shù)的相似性度量

      由1.1節(jié)中關(guān)聯(lián)函數(shù)和側(cè)距的求解公式可知,直線xx0與約束X、X0間交點(diǎn)(即點(diǎn)x1、x2、X1、X2)的獲取是問(wèn)題的核心,也是計(jì)算工作量的關(guān)鍵部分,而交點(diǎn)的獲取本質(zhì)上是對(duì)線性方程組的求解,由參考文獻(xiàn)[21]可知采用高斯消元法求解線性方程組的時(shí)間復(fù)雜度為O(n3),其中n指代方程的個(gè)數(shù)(高斯消元法求解線性方程組可以分為消去過(guò)程與回代過(guò)程兩個(gè)步驟,其中消去過(guò)程的計(jì)算工作量為[n(n+1)(2n+1)/6]-1,回代過(guò)程的計(jì)算工作量為n(n+1)/2,總計(jì)算工作量為n3+n2+2n/3-1,時(shí)間復(fù)雜度僅以最高次冪為代表,故記為O(n3)),即算法計(jì)算工作量與方程個(gè)數(shù)的立方成正比。因此傳統(tǒng)的關(guān)聯(lián)函數(shù)計(jì)算方法在面對(duì)高維檢索時(shí)計(jì)算工作量較大,導(dǎo)致索引速度較低。

      此外,線性方程組的求解僅為整個(gè)關(guān)聯(lián)函數(shù)求解過(guò)程中的一部分,即線性方程組是關(guān)聯(lián)函數(shù)的簡(jiǎn)化模型,在面對(duì)高維檢索時(shí),關(guān)聯(lián)函數(shù)的求解比線性方程組的求解更復(fù)雜,因?yàn)楹?jiǎn)化模型略去了各方程的獲取步驟、直線與約束所產(chǎn)生的冗余交點(diǎn)(約束外交點(diǎn))的取舍步驟(檢索維度越高,冗余交點(diǎn)越多)以及從交點(diǎn)到側(cè)距再到關(guān)聯(lián)函數(shù)的計(jì)算步驟等操作。

      綜合上述定量和定性分析,將關(guān)聯(lián)函數(shù)應(yīng)用于高維檢索時(shí)存在效率低下的問(wèn)題。針對(duì)該問(wèn)題,已有部分學(xué)者展開(kāi)了相關(guān)研究,文獻(xiàn)[6]提出了基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的產(chǎn)品實(shí)例分類方法,該方法確實(shí)在很大程度上提高了索引速度,但是鑒于訓(xùn)練樣本的不足,犧牲了一定的索引精度;文獻(xiàn)[12]對(duì)此展開(kāi)了關(guān)聯(lián)函數(shù)計(jì)算的降維研究,提出了降維規(guī)則,但當(dāng)構(gòu)建的空間為超多面體時(shí),降維規(guī)則仍需進(jìn)一步完善。

      此外,關(guān)聯(lián)函數(shù)的計(jì)算為定量化計(jì)算,而產(chǎn)品屬性可能存在多種表現(xiàn)形式,具體可以分為確定數(shù)值型、確定區(qū)間型、模糊數(shù)值型、模糊區(qū)間型和模糊概念型。因此,關(guān)聯(lián)函數(shù)在面對(duì)模糊型參數(shù)時(shí)還缺乏有效的方法,導(dǎo)致索引精度不高。表1所示為某型號(hào)真空泵的部分屬性,表中包括多種屬性表現(xiàn)形式:抽氣速率與運(yùn)行功率分別為確定區(qū)間型和確定數(shù)值型,噪聲為模糊數(shù)值型,環(huán)保性能為模糊概念型,故障率為模糊區(qū)間型。

      表1 某型號(hào)真空泵屬性(部分)

      針對(duì)上述問(wèn)題,本文將模糊數(shù)和層次分析法分別與關(guān)聯(lián)函數(shù)相結(jié)合,提出模糊關(guān)聯(lián)函數(shù)的概念并建立單維關(guān)聯(lián)函數(shù)組合相似性度量模型,具體將在第2.2節(jié)和第2.3節(jié)中展開(kāi)。

      2.1 確定型參數(shù)關(guān)聯(lián)函數(shù)度量

      當(dāng)產(chǎn)品屬性為確定數(shù)值型時(shí),該數(shù)值即關(guān)聯(lián)函數(shù)最優(yōu)點(diǎn)x0,根據(jù)用戶需求并結(jié)合設(shè)計(jì)標(biāo)準(zhǔn),由最優(yōu)點(diǎn)x0形成理想?yún)^(qū)間X0,再借鑒可拓學(xué)中可拓域與經(jīng)典域的思想[17],由理想?yún)^(qū)間X0外擴(kuò)形成可行區(qū)間X;當(dāng)產(chǎn)品屬性為確定區(qū)間值型時(shí),該區(qū)間即關(guān)聯(lián)函數(shù)理想?yún)^(qū)間X0,由理想?yún)^(qū)間可獲取最優(yōu)點(diǎn)x0和可行區(qū)間X。根據(jù)獲取的相關(guān)數(shù)據(jù),代入式(1)~式(3)即可計(jì)算各實(shí)例對(duì)應(yīng)屬性的關(guān)聯(lián)函數(shù)值。

      2.2 模糊型參數(shù)關(guān)聯(lián)函數(shù)度量

      目前,關(guān)聯(lián)函數(shù)對(duì)模糊型參數(shù)的度量尚處空白階段,本文將模糊數(shù)的表達(dá)方式類比至關(guān)聯(lián)函數(shù)計(jì)算三要素(最優(yōu)點(diǎn),理想?yún)^(qū)間,可行區(qū)間),提出了模糊關(guān)聯(lián)函數(shù)的概念和相關(guān)計(jì)算公式。

      X2],結(jié)合上述區(qū)間獲取最優(yōu)點(diǎn)x0。如圖1所示為基于模糊數(shù)的關(guān)聯(lián)函數(shù)計(jì)算圖示。

      (1)模糊數(shù)值型參數(shù)關(guān)聯(lián)函數(shù)度量

      根據(jù)圖1a三角模糊數(shù)—關(guān)聯(lián)函數(shù)的計(jì)算圖示,再結(jié)合1.1節(jié)中側(cè)距的計(jì)算公式,本文提出模糊數(shù)值型側(cè)距ρ(x,x0,X)表達(dá)式如下:

      (5)

      式中:S△Qxx0表示三角形Qxx0的面積;S表示梯形Qx0xM的面積(其余同理);-max{S△QX1x0,S△QX2x0}意為取三角形QX1x0面積與三角形QX2x0面積中的較大值,因本文規(guī)定X1為離x0較近點(diǎn),故-max{S△QX1x0,S△QX2x0}=-S△QX2x0。如圖2所示為式(5)對(duì)應(yīng)圖示。

      關(guān)聯(lián)函數(shù)需要分別計(jì)算可行區(qū)間X與理想?yún)^(qū)間X0的側(cè)距,在面對(duì)模糊數(shù)值型參數(shù)時(shí)兩者計(jì)算方法類似,即將可行區(qū)間X替換為理想?yún)^(qū)間X0,因此本文不再贅述側(cè)距ρ(x,x0,X0)的表達(dá)式和計(jì)算圖示。

      將側(cè)距ρ(x,x0,X)和側(cè)距ρ(x,x0,X0)的計(jì)算結(jié)果代入式(1)與式(3)即可求得模糊數(shù)值型參數(shù)對(duì)應(yīng)的關(guān)聯(lián)函數(shù)值。

      (2)模糊區(qū)間型參數(shù)關(guān)聯(lián)函數(shù)度量

      根據(jù)圖1b梯形模糊數(shù)—關(guān)聯(lián)函數(shù)的計(jì)算圖示,再結(jié)合側(cè)距的計(jì)算公式,本文提出模糊區(qū)間型側(cè)距表達(dá)式如式(6)所示,圖3所示為式(6)對(duì)應(yīng)圖示。

      (6)

      與模糊數(shù)值型參數(shù)不同,模糊區(qū)間型參數(shù)的兩側(cè)距計(jì)算方法并不相同,理想?yún)^(qū)間X0的側(cè)距ρ(x,x0,X0)的表達(dá)式如式(7)所示,圖4所示為式(7)對(duì)應(yīng)圖示。

      (7)

      將側(cè)距ρ(x,x0,X)和側(cè)距ρ(x,x0,X0)的計(jì)算結(jié)果代入式(1)和式(3)即可求得模糊區(qū)間型參數(shù)對(duì)應(yīng)的關(guān)聯(lián)函數(shù)值。

      (3)模糊概念型參數(shù)關(guān)聯(lián)函數(shù)度量

      針對(duì)模糊概念型參數(shù),本文引入模糊語(yǔ)義轉(zhuǎn)化表(如表2)對(duì)模糊語(yǔ)進(jìn)行量化,再將量化后的值與模糊數(shù)值型參數(shù)相結(jié)合,即用三角模糊數(shù)進(jìn)行表示,再根據(jù)對(duì)應(yīng)公式即可求得關(guān)聯(lián)函數(shù)值。

      表2 模糊語(yǔ)義轉(zhuǎn)化表

      2.3 單維關(guān)聯(lián)函數(shù)組合相似性度量

      根據(jù)上文給出的式(5)~式(7),可以求得不同類型參數(shù)間的側(cè)距,然后將所得數(shù)值帶入式(1)及式(3)中,即可求得實(shí)例間各維屬性的關(guān)聯(lián)函數(shù)值,再結(jié)合由層次分析法得到的各屬性權(quán)重(層次分析法具體步驟可參考文獻(xiàn)[22])即可獲取目標(biāo)實(shí)例與實(shí)例庫(kù)實(shí)例的組合關(guān)聯(lián)函數(shù),以此刻畫(huà)兩者相似度,計(jì)算公式如下:

      (8)

      式中:k(A*)表示組合關(guān)聯(lián)函數(shù);k(Ai)表示屬性i的關(guān)聯(lián)函數(shù),wi為對(duì)應(yīng)權(quán)重。

      因各維屬性的關(guān)聯(lián)函數(shù)相互獨(dú)立且單獨(dú)計(jì)算,故從簡(jiǎn)化模型的角度可得該算法的時(shí)間復(fù)雜度為O(n),即算法計(jì)算工作量與檢索維度成正比,如圖5所示為本文所提方法與原方法的時(shí)間復(fù)雜度對(duì)比圖。另外,單維關(guān)聯(lián)函數(shù)在方程獲取,其余計(jì)算步驟較全維關(guān)聯(lián)函數(shù)簡(jiǎn)單,且無(wú)冗余交點(diǎn)出現(xiàn),因此該方法在面對(duì)高維檢索時(shí)能夠大幅提高索引速度。

      3 D-HS索引方法改進(jìn)及與關(guān)聯(lián)函數(shù)融合

      第2章提出的模糊關(guān)聯(lián)函數(shù)解決了模糊型參數(shù)間的相似性度量問(wèn)題,提高了的索引精度,同時(shí)結(jié)合層次分析法的單維關(guān)聯(lián)函數(shù)組合相似性度量方法提高了索引速度。但該方法在檢索時(shí)仍需遍歷全實(shí)例庫(kù)實(shí)例,即檢索效用問(wèn)題仍然存在。鑒于此,本文對(duì)1.2節(jié)中介紹的D-HS索引進(jìn)行了基于Sigmoid函數(shù)的改進(jìn)研究,并對(duì)兩種方法進(jìn)行了融合。如圖6所示為關(guān)聯(lián)函數(shù)與D-HS索引的改進(jìn)與融合圖示。

      分析1.2節(jié)中D-HS索引原理可知,該方法是對(duì)實(shí)例庫(kù)實(shí)例進(jìn)行分區(qū)間存取,無(wú)需進(jìn)行相似度計(jì)算,且受實(shí)例庫(kù)實(shí)例數(shù)目影響較小,因此該方法不僅效率較高,還能有效避免檢索效用問(wèn)題,但是存在準(zhǔn)確率低下問(wèn)題,具體體現(xiàn)為以下兩點(diǎn):

      (1)D-HS索引采用的離散化方法僅適用于屬性值均勻或近似均勻分布的情況,當(dāng)產(chǎn)品屬性值非均勻分布時(shí),各區(qū)間內(nèi)實(shí)例數(shù)目會(huì)出現(xiàn)較大的差異,甚至?xí)霈F(xiàn)某區(qū)間內(nèi)無(wú)實(shí)例的情況,該情況下索引準(zhǔn)確率會(huì)大幅下降。

      (2)屬性匹配度指代實(shí)例庫(kù)實(shí)例的屬性與目標(biāo)實(shí)例屬性位于相同區(qū)間的個(gè)數(shù)。一般而言,實(shí)例間越相似,相同區(qū)間個(gè)數(shù)也會(huì)越多,因此屬性匹配度可以從整體上反映實(shí)例間的相似度,但考慮到存在屬性恰好位于區(qū)間邊緣等特殊情況,若將其作為檢索的唯一衡量指標(biāo),則存在嚴(yán)謹(jǐn)性不足問(wèn)題,同樣影響準(zhǔn)確率。

      3.1 基于Sigmoid函數(shù)的D-HS索引方法改進(jìn)

      針對(duì)實(shí)例庫(kù)實(shí)例屬性值的非均勻分布現(xiàn)象導(dǎo)致的索引準(zhǔn)確率低下問(wèn)題,本文利用Sigmoid函數(shù)對(duì)屬性值進(jìn)行非線性變換,該變換能夠在不改變數(shù)據(jù)整體分布及排列情況的前提下,對(duì)數(shù)據(jù)稠密及稀疏區(qū)域分別進(jìn)行擴(kuò)大和壓縮,提高數(shù)據(jù)的辨識(shí)性和劃分層級(jí)的能力[23-24]。Sigmoid函數(shù)表達(dá)式為:

      (9)

      式中:系數(shù)β為樣本數(shù)據(jù)的中位數(shù);系數(shù)α=ln9/t,其中參數(shù)t為樣本數(shù)據(jù)90%分位點(diǎn)及10%分位點(diǎn)到中位點(diǎn)的距離中的較小值。

      D-HS索引區(qū)別于關(guān)聯(lián)函數(shù)的定量化計(jì)算,因此當(dāng)屬性為模糊型時(shí)可以將其視為確定型。此外,屬性為區(qū)間型時(shí)可以取區(qū)間中點(diǎn)代替對(duì)應(yīng)區(qū)間進(jìn)行非線性變換和屬性匹配度的計(jì)算。

      本文以真空泵關(guān)鍵屬性—抽氣速率為例,驗(yàn)證上述方法對(duì)提高屬性值非均勻分布時(shí)D-HS索引準(zhǔn)確率的優(yōu)勢(shì)。具體步驟如下:

      步驟1調(diào)取某真空泵實(shí)例庫(kù)中150種不同型號(hào)真空泵的抽氣速率為原始數(shù)據(jù)。

      步驟2對(duì)原始數(shù)據(jù)進(jìn)行以自然對(duì)數(shù)e為底的對(duì)數(shù)處理,得到ln數(shù)據(jù),再對(duì)ln數(shù)據(jù)進(jìn)行降序排列。

      步驟3根據(jù)ln數(shù)據(jù)計(jì)算式(9)中系數(shù)α與系數(shù)β的值,再將ln數(shù)據(jù)代入式(9)得Sigmoid數(shù)據(jù)。

      步驟4為統(tǒng)一量綱,將原始數(shù)據(jù)和ln數(shù)據(jù)分別進(jìn)行歸一化,得到ln歸一化數(shù)據(jù)和原始?xì)w一化數(shù)據(jù),并與Sigmoid數(shù)據(jù)對(duì)比。

      如圖7所示為各組數(shù)據(jù)對(duì)比圖,其中圖7a~圖7c分別代表原始?xì)w一化數(shù)據(jù)、ln歸一化數(shù)據(jù)和Sigmoid數(shù)據(jù)的散點(diǎn)圖和直方圖。由上述對(duì)比可知,基于Sigmoid函數(shù)的非線性變換能夠細(xì)化數(shù)據(jù)稠密區(qū)間,整合數(shù)據(jù)稀疏區(qū)間,對(duì)非均勻分布的數(shù)據(jù)有較好的處理能力。

      3.2 D-HS索引與關(guān)聯(lián)函數(shù)的融合

      針對(duì)D-HS索引中將屬性匹配度作為實(shí)例檢索的唯一指標(biāo)而帶來(lái)的嚴(yán)謹(jǐn)性不足、準(zhǔn)確率低下問(wèn)題,以及關(guān)聯(lián)函數(shù)在檢索時(shí)需遍歷全實(shí)例庫(kù)實(shí)例而造成的檢索效用問(wèn)題,本文將3.1節(jié)中提出的改進(jìn)D-HS索引方法和第2章建立的結(jié)合模糊數(shù)和層次分析法的單維關(guān)聯(lián)函數(shù)組合相似性度量模型相融合,如圖8所示為兩者融合示意圖。

      圖8中由實(shí)例庫(kù)至最終索引集SE的檢索過(guò)程共分為兩個(gè)步驟。步驟1為D-HS索引:根據(jù)目標(biāo)實(shí)例計(jì)算實(shí)例庫(kù)實(shí)例的屬性匹配度SA,并分類形成各實(shí)例集(SA=0,SA=1,…,SA=n),再取屬性匹配度較高的實(shí)例集組成初步索引集SP(根據(jù)實(shí)例數(shù)目而定,一般剔除后60%~后80%,圖8中取SA≥x);步驟2為關(guān)聯(lián)函數(shù)索引:根據(jù)本文所提的關(guān)聯(lián)函數(shù)改進(jìn)方法,計(jì)算SP內(nèi)實(shí)例的組合關(guān)聯(lián)函數(shù),以此獲取最終索引集SE。

      融合后的檢索方法無(wú)需計(jì)算實(shí)例庫(kù)中每個(gè)實(shí)例的關(guān)聯(lián)函數(shù),可以在一定程度上避免檢索效用問(wèn)題,同時(shí)關(guān)聯(lián)函數(shù)的應(yīng)用解決了傳統(tǒng)D-HS索引面臨的嚴(yán)謹(jǐn)性不足、準(zhǔn)確率低下問(wèn)題。

      相似實(shí)例經(jīng)檢索、重用和修改后可作為新實(shí)例重新入庫(kù),故在此過(guò)程中實(shí)例庫(kù)實(shí)例各維屬性值的分布情況不斷變化,屬性值非線性變化后的分布情況亦隨之不斷變化,因此對(duì)應(yīng)區(qū)間的劃分不是一成不變的,而對(duì)于區(qū)間的劃分操作可以在實(shí)例庫(kù)更新維護(hù)時(shí)完成,不必在每次檢索前進(jìn)行。如圖9所示為實(shí)例檢索流程圖。

      4 實(shí)例驗(yàn)證與對(duì)比分析

      4.1 實(shí)例驗(yàn)證

      本文以面向用戶需求的真空泵檢索選型為例對(duì)所提方法進(jìn)行了驗(yàn)證,首先從用戶處獲取目標(biāo)實(shí)例的相關(guān)屬性值,并結(jié)合層次分析法獲取對(duì)應(yīng)權(quán)重;然后從實(shí)例庫(kù)中直接調(diào)取各型號(hào)真空泵的原始數(shù)據(jù)和非線性變換后的各區(qū)間劃分情況;最后計(jì)算實(shí)例庫(kù)中各實(shí)例相對(duì)于目標(biāo)實(shí)例的屬性匹配度。

      表3列出了目標(biāo)實(shí)例屬性值及對(duì)應(yīng)權(quán)重,其中區(qū)間型參數(shù)的Sigmoid數(shù)據(jù)為區(qū)間中點(diǎn)對(duì)應(yīng)值。

      表3 目標(biāo)實(shí)例屬性值及對(duì)應(yīng)權(quán)重

      圖10所示為真空泵關(guān)鍵屬性—抽氣速率、運(yùn)行功率和噪聲對(duì)應(yīng)的不同類型數(shù)據(jù)分布圖(限于篇幅,未將所有屬性全部列出);表4所示為屬性匹配度計(jì)算結(jié)果。

      根據(jù)表4中各實(shí)例的屬性匹配度分布情況,本文取SA≥4的相似實(shí)例組成初步索引集SP,并依照第2章提出的計(jì)算方法獲得SP內(nèi)實(shí)例各維屬性的關(guān)聯(lián)函數(shù),再與對(duì)應(yīng)權(quán)重結(jié)合即可求得組合關(guān)聯(lián)函數(shù)。表5所示為SP內(nèi)各實(shí)例的單維關(guān)聯(lián)函數(shù)和組合關(guān)聯(lián)函數(shù)計(jì)算結(jié)果。

      表4 屬性匹配度計(jì)算結(jié)果

      表5 單維和組合關(guān)聯(lián)函數(shù)計(jì)算結(jié)果(初步索引集SP)

      比較表5中的組合關(guān)聯(lián)函數(shù)k(A*)可知,實(shí)例c39,c44與目標(biāo)實(shí)例相似度最高,可優(yōu)先作為后續(xù)實(shí)例重用和修改的對(duì)象。

      4.2 對(duì)比分析

      (1)模糊關(guān)聯(lián)函數(shù)與關(guān)聯(lián)函數(shù)

      當(dāng)產(chǎn)品的屬性為模糊型時(shí),該屬性對(duì)應(yīng)參數(shù)之間的差異往往較小,甚至?xí)霈F(xiàn)眾多實(shí)例間無(wú)差異的情況,同時(shí)參數(shù)的分布也會(huì)集中在一個(gè)區(qū)域內(nèi),如圖11所示為模糊關(guān)聯(lián)函數(shù)與關(guān)聯(lián)函數(shù)擬合圖示。對(duì)比圖11a與圖11b可知,模糊關(guān)聯(lián)函數(shù)的提出有助于擴(kuò)大模糊數(shù)間的微小差異,即增加其區(qū)分度。

      盡管確定型參數(shù)也存在部分實(shí)例集中的現(xiàn)象,但確定型參數(shù)往往分布較廣,即參數(shù)上下限差距較大,導(dǎo)致可行區(qū)間X范圍過(guò)大,沒(méi)有實(shí)際意義,故無(wú)法用模糊關(guān)聯(lián)函數(shù)對(duì)確定型參數(shù)進(jìn)行相似性度量。此外,關(guān)聯(lián)函數(shù)較傳統(tǒng)歐式幾何距方法、KNN分類檢索方法的優(yōu)勢(shì)在文獻(xiàn)[12]中已作詳細(xì)討論,本文不再贅述。

      (2)屬性匹配度與SP內(nèi)外組合關(guān)聯(lián)函數(shù)

      本文提出將D-HS索引中的屬性匹配度作為檢索的初級(jí)指標(biāo),以此獲取初步索引集SP,再計(jì)算其內(nèi)實(shí)例的組合關(guān)聯(lián)函數(shù)獲取最終索引集SE。為驗(yàn)證該方法的優(yōu)勢(shì),本文計(jì)算了全實(shí)例庫(kù)實(shí)例的組合關(guān)聯(lián)函數(shù),并與屬性匹配度結(jié)合做了相應(yīng)的統(tǒng)計(jì),統(tǒng)計(jì)結(jié)果如圖12所示。

      圖12中,曲線LAVG表示對(duì)應(yīng)屬性匹配度的實(shí)例集中各實(shí)例組合關(guān)聯(lián)函數(shù)平均值的連線(擬合后)。由圖12可知:組合關(guān)聯(lián)函數(shù)的均值隨屬性匹配度的增加而增加,因此屬性匹配度可以從整體上反映實(shí)例間的相似度。

      此外,本文對(duì)初步索引集SP內(nèi)外組合關(guān)聯(lián)函數(shù)進(jìn)行了對(duì)比,表6所示為SP外部分實(shí)例組合關(guān)聯(lián)函數(shù)計(jì)算結(jié)果。

      表6 SP外實(shí)例組合關(guān)聯(lián)函數(shù)計(jì)算結(jié)果(部分)

      對(duì)比表5與表6中數(shù)據(jù)不難發(fā)現(xiàn),SP外實(shí)例的組合關(guān)聯(lián)函數(shù)整體上小于SP內(nèi)實(shí)例的組合關(guān)聯(lián)函數(shù),盡管表6中存在少數(shù)實(shí)例的組合關(guān)聯(lián)函數(shù)大于表5中部分實(shí)例(如實(shí)例c35,c40),但并不影響最終索引集SE的獲取。綜合上述對(duì)比可知,融合關(guān)聯(lián)函數(shù)與D-HS索引的檢索方法能夠在保證索引精度的同時(shí)避免部分冗余計(jì)算,在一定程度上解決了檢索效用問(wèn)題。

      5 結(jié)束語(yǔ)

      本文將模糊數(shù)與關(guān)聯(lián)函數(shù)相結(jié)合,提出了模糊關(guān)聯(lián)函數(shù)的概念,擴(kuò)大了模糊數(shù)間的微小差異,增加了相似實(shí)例間的區(qū)分度,提高了索引精度;同時(shí)結(jié)合層次分析法建立單維關(guān)聯(lián)函數(shù)組合相似性度量模型,并從定量比較和定性分析的角度論證了所提方法在索引速度上的優(yōu)勢(shì),相較于過(guò)去的全維關(guān)聯(lián)函數(shù)計(jì)算方法,結(jié)合模糊數(shù)和層次分析法的關(guān)聯(lián)函數(shù)在面對(duì)高維檢索時(shí)既保證了索引精度又提高了索引速度。

      利用Sigmoid函數(shù)對(duì)原始數(shù)據(jù)進(jìn)行非線性變換,對(duì)數(shù)據(jù)稠密及稀疏區(qū)域分別進(jìn)行擴(kuò)大和壓縮,提高了數(shù)據(jù)的辨識(shí)性和劃分層級(jí)的能力,有效解決了傳統(tǒng)D-HS索引中因數(shù)據(jù)分布不均導(dǎo)致的索引準(zhǔn)確率低下問(wèn)題。

      融合關(guān)聯(lián)函數(shù)和D-HS索引,提出根據(jù)屬性匹配度獲取初步索引集SP,再計(jì)算SP內(nèi)組合關(guān)聯(lián)函數(shù)獲取最終索引集SE的檢索步驟,融合后的相似實(shí)例檢索方法提高了傳統(tǒng)D-HS索引的嚴(yán)謹(jǐn)性和準(zhǔn)確性,且在確保不出現(xiàn)相似實(shí)例遺漏現(xiàn)象的同時(shí)避免了關(guān)聯(lián)函數(shù)需對(duì)全實(shí)例庫(kù)實(shí)例進(jìn)行相似度計(jì)算的繁瑣,在一定程度上解決了檢索效用問(wèn)題。在檢索到與目標(biāo)最相近的相似實(shí)例后需要對(duì)該實(shí)例進(jìn)行不同程度的變更,而在變更過(guò)程中勢(shì)必存在變更風(fēng)險(xiǎn)同時(shí)帶來(lái)變更矛盾。因此,后續(xù)將針對(duì)產(chǎn)品變更風(fēng)險(xiǎn)的預(yù)測(cè)以及產(chǎn)品變更矛盾的求解兩方面做具體展開(kāi),以實(shí)現(xiàn)產(chǎn)品對(duì)市場(chǎng)的快速響應(yīng)。

      猜你喜歡
      實(shí)例區(qū)間關(guān)聯(lián)
      解兩類含參數(shù)的復(fù)合不等式有解與恒成立問(wèn)題
      你學(xué)會(huì)“區(qū)間測(cè)速”了嗎
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      奇趣搭配
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      區(qū)間對(duì)象族的可鎮(zhèn)定性分析
      完形填空Ⅱ
      完形填空Ⅰ
      語(yǔ)言學(xué)與修辭學(xué):關(guān)聯(lián)與互動(dòng)
      單調(diào)區(qū)間能否求“并”
      百色市| 晴隆县| 泸水县| 城口县| 太康县| 建瓯市| 台中市| 黎川县| 镇平县| 胶州市| 玉山县| 瑞丽市| 建始县| 噶尔县| 巴南区| 兴和县| 石首市| 华宁县| 洛浦县| 镇赉县| 凤山市| 行唐县| 康定县| 武川县| 五河县| 青浦区| 阳泉市| 东乡族自治县| 新泰市| 舞钢市| 榕江县| 平凉市| 三都| 镇远县| 湛江市| 重庆市| 宜兴市| 邹平县| 保亭| 台南市| 睢宁县|