• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于遺傳算法進行特征選擇和權(quán)重設(shè)置的圖像檢索

    2021-01-12 11:49:42姜雪
    關(guān)鍵詞:特征選擇遺傳算法變異

    姜雪

    (淄博職業(yè)學(xué)院 信息工程系, 山東 淄博 255314)

    基于內(nèi)容的圖像檢索CBIR(content based image retrieval),直接利用圖像的顏色、底紋、形狀等底層圖像內(nèi)容作為檢索特征來進行圖像檢索[1]。在特征提取方面,為了更全面地描述圖像信息,提高圖像檢索精度,需要多提取圖像的各種特征,如顏色特征、紋理特征、形狀特征、角點特征[2],語義特征[3]等。但實際情況表明,并非提取的特征越多檢索效果越好。本文運用遺傳算法對提取的圖像特征進行選擇,旨在去除冗余特征以降低特征的維數(shù),減小計算的復(fù)雜性,縮短程序運行的時間,以提高圖像檢索效率;同時運用遺傳算法設(shè)置多檢索特征的權(quán)重,使特征有效融合,以達到更好的檢索效果。

    1 遺傳算法

    遺傳算法(genetic algorithm,GA)是借鑒適者生存、優(yōu)勝劣汰的生物界進化規(guī)律的隨機化搜索方法,由美國的Holland教授于1969年提出[4]。遺傳算法從代表問題可能解的一個初始種群開始,種群由經(jīng)過基因編碼的一定數(shù)目的個體組合而成。初始種群產(chǎn)生后,根據(jù)適者生存和優(yōu)勝劣汰的原理,一代一代演化出越來越好的近似解。在每一代中,根據(jù)問題集中每個個體的適應(yīng)度大小來選擇個體,借助遺傳算子按照一定的概率進行交叉和變異,產(chǎn)生下一代種群。這個過程將導(dǎo)致后代種群比前代更加適應(yīng)環(huán)境,最后一代種群中的最優(yōu)個體經(jīng)過解碼,可以作為解決問題的最優(yōu)解。遺傳算法流程如圖1所示。

    圖1 遺傳算法流程Fig.1 Flow chart of genetic algorithm

    遺傳算法的研究受到了國內(nèi)外學(xué)者的廣泛關(guān)注,近年來該算法已被成功地應(yīng)用于工業(yè)、經(jīng)濟管理、交通運輸、工業(yè)設(shè)計等不同領(lǐng)域,解決了很多實際問題[5-7]。本文將遺傳算法用于圖像檢索的特征選擇和權(quán)重設(shè)置兩個環(huán)節(jié),以提高圖像檢索效率。

    2 特征選擇

    特征選擇[8-9]是指從一個初始特征集中選出一些特征組成最優(yōu)特征子集[10],依據(jù)這些最優(yōu)子集構(gòu)成檢索特征能夠使檢索結(jié)果的評估標(biāo)準(zhǔn)達到最優(yōu),使檢索過程具有較高的檢索效率。本文選用Caltech256數(shù)據(jù)集和Corel1000數(shù)據(jù)集,分別提取了圖像的11個特征,即RGB、HSV直方圖特征、顏色相關(guān)圖特征、顏色矩特征,LBP特征、灰度共生矩陣特征、gabor小波的3個特征,以及角點的Hu矩特征和灰度共生矩陣特征,采用查準(zhǔn)率和查全率作為評價特征子集的標(biāo)準(zhǔn),通過遺傳算法進行特征選擇,得到最優(yōu)特征子集。該最優(yōu)特征子集作為圖像的檢索特征,用相對曼哈頓距離[11]進行相似性度量。特征選擇的步驟如下:

    1)對初始種群的個體進行編碼。首先,將提取的n個圖像特征對應(yīng)的特征值進行歸一化處理;然后,隨機產(chǎn)生n位二進制數(shù)作為個體編碼,其中1代表選擇該特征,0代表不選擇該特征[12]。

    2)設(shè)定初始種群的規(guī)模。不同問題采用的初始種群規(guī)模各不相同,規(guī)模越大所得最優(yōu)特征子集越接近最優(yōu)解,但耗時會越多,初始種群的取值一般在30~100,本文將初始種群設(shè)定為100個個體。

    3)確定適應(yīng)度函數(shù)?;趦?nèi)容的圖像檢索旨在提高檢索的效率,即在人能夠接受的一般時間范圍內(nèi),盡可能地提高圖像檢索的查準(zhǔn)率和查全率,所以本文適應(yīng)度函數(shù)定義為查準(zhǔn)率和查全率之和,其公式如下:

    F=Pn+Rn,

    4)根據(jù)個體適應(yīng)度的大小,選擇算子采用輪盤賭算法進行種群個體的選擇,即個體的適應(yīng)度越大被選擇的幾率越大,被選擇的個體進入下一代種群。

    5)在滿足一定交叉概率的前提下,依次從種群中抽出兩個個體,進行隨機位的交叉,交叉概率一般取值為0.4~0.99,本文選取的交叉概率為0.7。

    6)在滿足一定變異概率的前提下,依次對種群中的個體進行隨機位的變異。原來為1,變異為0;原來為0,變異為1。變異概率一般取值為0.001~0.1,本文選取的變異概率為0.05。

    7)算法終止條件的設(shè)定。算法終止條件的設(shè)定有多種,如所求解達到了精度要求或算法達到了最大運行時間等,本文選擇的算法終止條件為所求解達到最大的迭代次數(shù)100,即從初始種群開始要進化100代。

    3 權(quán)重設(shè)置

    依然采用遺傳算法,對通過特征選擇得到的多個最優(yōu)特征進行權(quán)重設(shè)置,使得多個圖像特征能夠有效融合。具體操作步驟如下:

    1)根據(jù)特征選擇得到的最優(yōu)檢索特征的個數(shù)k,首先將這k個特征對應(yīng)的特征值進行歸一化處理,然后進行初始種群個體的二進制編碼。假設(shè)權(quán)重系數(shù)要精確到小數(shù)點后兩位,則每個權(quán)重系數(shù)至少要編碼成7位二進制數(shù)[13],k個檢索特征的權(quán)重系數(shù)就要編碼成7k位二進制數(shù),即初始種群中的個體為7k位二進制數(shù)。

    2)初始種群的個數(shù)仍設(shè)定為100。個體適應(yīng)度函數(shù)與特征選擇的適應(yīng)度函數(shù)相同,為查全率和查準(zhǔn)率之和。

    3)選擇、交叉和變異過程均與特征選擇的過程相同,其中交叉概率為0.7,變異概率為0.05,種群進化代數(shù)為300。

    4)編碼的解碼,是將7k位二進制數(shù)解碼為k個權(quán)重系數(shù)。依次將每7位二進制數(shù)轉(zhuǎn)化成對應(yīng)的十進制數(shù)a1,a2…,ak,k個檢索特征的權(quán)重系數(shù)為

    4 實驗及結(jié)果分析

    本文的實驗環(huán)境為:Intel(R) Core(TM) i5-4460 CPU @ 3.20 GHz,8.00GBRAM,Windows7操作系統(tǒng),MATLAB R2016a軟件。

    實驗選用了Caltech256數(shù)據(jù)集和Corel1000數(shù)據(jù)集,分為如下四個階段來進行:

    1)提取圖像的顏色特征(HSV直方圖特征、顏色相關(guān)圖特征、顏色矩特征)和紋理特征(gabor小波特征中的3個特征)共6個特征,構(gòu)成的特征向量為190維進行圖像檢索實驗。

    2)再提取圖像的顏色特征(RGB直方圖特征)、紋理特征(LBP特征、灰度共生矩陣特征)以及角點的Hu矩特征和灰度共生矩陣特征共11個特征,構(gòu)成的特征向量為321維,對這11個特征對應(yīng)的特征值進行歸一化處理,并將其作為檢索特征進行圖像檢索實驗。

    3)用遺傳算法對這11個圖像特征進行特征選擇,其中初始種群個數(shù)為100、交叉概率為0.7、變異概率為0.05、迭代次數(shù)為100,將得到的多個最優(yōu)特征作為檢索特征進行圖像檢索實驗。

    4)用遺傳算法為特征選擇得到的最優(yōu)特征設(shè)置權(quán)重,其中初始種群個數(shù)為100、交叉概率為0.7、變異概率為0.05、迭代次數(shù)為300,將得到的權(quán)重系數(shù)有效融合多個最優(yōu)特征并進行圖像檢索實驗。

    4.1 在Caltech256數(shù)據(jù)集上的表現(xiàn)

    在Caltech256數(shù)據(jù)集中,選擇了Backpack、Bear、Binoculars、Bonsai、Butterfly五個語義類,每類100幅共500幅圖像作為數(shù)據(jù)庫圖像,從五類中各選10幅共50幅圖像作為查詢圖像,檢索結(jié)果返回20幅圖像。

    在實驗的第三階段,通過特征選擇得到了gabor小波的2個特征和角點的Hu矩特征共3個最優(yōu)特征,構(gòu)成的特征向量為71維;在實驗的第四階段,通過權(quán)重設(shè)置得到的權(quán)重系數(shù)為[0.23,0.39,0.38]。

    在四個階段的圖像檢索中,所得數(shù)據(jù)見表1,各階段的檢索精度對比如圖2所示。

    表1 各類圖像在四個階段的檢索精度Tab.1 Retrieval accuracy of all kinds of images in four stages

    圖2 各階段的檢索精度對比Fig.2 Comparison of retrieval accuracy in different stages

    從實驗數(shù)據(jù)來看,僅僅增加檢索特征并不能使檢索精度得到有效改善。如在增加5個檢索特征后,Bear類和Bonsai類的檢索精度反而降低了,其他類的檢索精度略有提升。用遺傳算法進行特征選擇后,得到了3個最優(yōu)特征,用這3個特征進行圖像檢索的精度提高了。當(dāng)用遺傳算法賦予這3個最優(yōu)特征適當(dāng)權(quán)重之后,檢索精度又有所提升。

    4.2 在Corel1000數(shù)據(jù)集上的表現(xiàn)

    在Corel1000數(shù)據(jù)集中,從每類中各選10幅共100幅圖像作為查詢圖像,檢索結(jié)果返回20幅圖像。

    在實驗的第三階段,通過特征選擇得到了RGB、HSV直方圖特征、顏色矩特征、灰度共生矩陣特征和gabor小波(其中1個特征)共5個最優(yōu)特征,構(gòu)成的特征向量為118維;在實驗的第四階段,通過權(quán)重設(shè)置得到的權(quán)重系數(shù)為[0.21,0.13,0.01,0.40,0.26]。

    在四個階段的圖像檢索中,所得數(shù)據(jù)見表2,各階段的檢索精度對比如圖3所示。

    圖3 各階段的檢索精度對比Fig.3 Comparison of retrieval accuracy in different stages

    實驗數(shù)據(jù)說明,在增加5個檢索特征后,Africa類、Elephant類、Mountain類和Food類的檢索精度降低了,其他類的檢索精度略有提升。用遺傳算法進行特征選擇和權(quán)重設(shè)置后,有效融合了5個最優(yōu)特征,優(yōu)化了檢索效率。

    5 結(jié)束語

    在基于內(nèi)容的圖像檢索中,提取的圖像特征越多,雖然對于圖像的描述更加全面和細(xì)致了,但是并非圖像檢索的效果就越好。本文對于圖像中提取的11種特征,通過用遺傳算法進行特征選擇后僅僅選出了少數(shù)最優(yōu)特征,降低了特征向量的維度,而檢索精度卻提升了,這充分說明在特征提取后先進行特征選擇是十分必要的;而當(dāng)用遺傳算法進行了權(quán)重設(shè)置后,檢索精度又有了提高,這也說明了對多個特征進行有效融合同樣很重要。同時要注意到,經(jīng)過特征選擇,各類圖像檢索精度的提升幅度各不相同,如本文中Bear類圖像提升的幅度就比較小,如何進一步優(yōu)化特征選擇算法,以使各類圖像的檢索精度都有效提升,將是今后工作的重點。

    猜你喜歡
    特征選擇遺傳算法變異
    變異危機
    變異
    基于自適應(yīng)遺傳算法的CSAMT一維反演
    一種基于遺傳算法的聚類分析方法在DNA序列比較中的應(yīng)用
    基于遺傳算法和LS-SVM的財務(wù)危機預(yù)測
    Kmeans 應(yīng)用與特征選擇
    電子制作(2017年23期)2017-02-02 07:17:06
    聯(lián)合互信息水下目標(biāo)特征選擇算法
    基于改進的遺傳算法的模糊聚類算法
    變異的蚊子
    百科知識(2015年18期)2015-09-10 07:22:44
    基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
    东城区| 道孚县| 安新县| 新丰县| 朝阳县| 体育| 讷河市| 长垣县| 余干县| 德州市| 宁河县| 织金县| 丹寨县| 河间市| 广南县| 九江市| 高陵县| 平阴县| 凤冈县| 南乐县| 平南县| 丹寨县| 成都市| 河西区| 东明县| 万安县| 易门县| 霍城县| 东方市| 北碚区| 新和县| 蓬莱市| 望奎县| 新晃| 三河市| 牡丹江市| 府谷县| 九龙县| 石林| 门头沟区| 张掖市|