• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于任務(wù)特征的一種小樣本學(xué)習(xí)方法

    2021-08-20 01:00:18龔澤凱范兆倫崔海波
    關(guān)鍵詞:準(zhǔn)確率神經(jīng)網(wǎng)絡(luò)樣本

    龔澤凱,范兆倫,崔海波

    (湖北大學(xué)計(jì)算機(jī)與信息工程學(xué)院, 湖北 武漢 430062)

    0 引言

    隨著機(jī)器學(xué)習(xí)的發(fā)展,出現(xiàn)了各種各樣的深度學(xué)習(xí)網(wǎng)絡(luò),比如卷積神經(jīng)網(wǎng)絡(luò),生成對(duì)抗網(wǎng)絡(luò)和長(zhǎng)短期記憶網(wǎng)絡(luò)等.這些優(yōu)秀的神經(jīng)網(wǎng)絡(luò)模型在圖像方面取得了非常良好的效果,然而這些網(wǎng)絡(luò)都得益于大量帶標(biāo)簽的訓(xùn)練數(shù)據(jù).數(shù)據(jù)成本也是現(xiàn)在應(yīng)該關(guān)注的問(wèn)題,對(duì)所有數(shù)據(jù)都進(jìn)行標(biāo)注是不經(jīng)濟(jì)的.例如,稀有生物的圖片和新型產(chǎn)業(yè)數(shù)據(jù)樣本非常少,所以讓機(jī)器自己學(xué)會(huì)學(xué)習(xí)是非常重要的一步.對(duì)于一個(gè)年紀(jì)不大的孩子,讓他去識(shí)別不認(rèn)識(shí)的動(dòng)物,只需給他少量的樣本,比如幾張熊貓和貓的圖片,他就能非常準(zhǔn)確地識(shí)別熊貓和貓.所以人工智能關(guān)鍵的一步就是如何像人一樣學(xué)會(huì)如何去識(shí)別未知的類(lèi)別.元學(xué)習(xí)就是基于機(jī)器如何在類(lèi)人學(xué)習(xí)的基礎(chǔ)上提出來(lái)的,即從少量帶有標(biāo)簽的數(shù)據(jù)中學(xué)習(xí)如何去區(qū)分類(lèi)別.小樣本學(xué)習(xí)是元學(xué)習(xí)在監(jiān)督學(xué)習(xí)領(lǐng)域的應(yīng)用,實(shí)際上,很多元學(xué)習(xí)的問(wèn)題都是小樣本學(xué)習(xí)的問(wèn)題.

    小樣本學(xué)習(xí)具有類(lèi)人學(xué)習(xí)能力,減少了數(shù)據(jù)收集、成本開(kāi)支、學(xué)習(xí)的樣本數(shù)量有限等特點(diǎn)[1].由于小樣本學(xué)習(xí)的任務(wù)樣本非常少,傳統(tǒng)的監(jiān)督學(xué)習(xí)非常容易過(guò)擬合.文獻(xiàn)[2]中提出了一種孿生神經(jīng)網(wǎng)絡(luò),通過(guò)將圖片進(jìn)行向量化處理得到特征函數(shù),然后通過(guò)比較余弦相似度來(lái)進(jìn)行判斷兩個(gè)圖片是否為同一類(lèi)別,這種神經(jīng)網(wǎng)絡(luò)更適合于小樣本學(xué)習(xí)的領(lǐng)域.但是小樣本學(xué)習(xí)上可能有上百個(gè)學(xué)習(xí)任務(wù),為了追求模型網(wǎng)絡(luò)更好的泛用性和快速適應(yīng)的效果,Vinyals等在建模上引入了注意力和記憶網(wǎng)絡(luò)提出了匹配網(wǎng)絡(luò),并且在數(shù)據(jù)上要求測(cè)試集和訓(xùn)練集都相同的數(shù)據(jù)分布,以此來(lái)達(dá)到更好的效果.Finn等[3]提出了一種快速適應(yīng)的深度神經(jīng)網(wǎng)絡(luò)MAML,只需要更新模型初始化參數(shù)就可以在多個(gè)任務(wù)上表現(xiàn)出非常好的表現(xiàn).本研究在此基礎(chǔ)上,提出了使用任務(wù)特征嵌入的方式來(lái)達(dá)到追求更好的實(shí)驗(yàn)效果[4].

    1 研究背景介紹

    目前小樣本學(xué)習(xí)網(wǎng)絡(luò)主要分為基于循環(huán)神經(jīng)網(wǎng)絡(luò)的模型、基于度量方法的網(wǎng)絡(luò)和基于最優(yōu)化的參數(shù)網(wǎng)絡(luò)等3種網(wǎng)絡(luò).

    1.1 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的方法早期用于小樣本學(xué)習(xí)的方法是基于卷積神經(jīng)網(wǎng)絡(luò)模型的,比如RNN和LSTM.文獻(xiàn)[6]中提出的MANN,通過(guò)篩選權(quán)值的大小來(lái)記錄信息進(jìn)行記憶更新,但是經(jīng)過(guò)任務(wù)類(lèi)別過(guò)多的時(shí)候,LSTM處理就顯得些許吃力,隨后文獻(xiàn)[7]中提出了SNAIL模型,SNAIL提出加入注意力的機(jī)制來(lái)提高網(wǎng)絡(luò)能力.

    1.2 基于度量方法的網(wǎng)絡(luò)如果在小樣本學(xué)習(xí)的任務(wù)中用普通的神經(jīng)網(wǎng)絡(luò)分類(lèi),其結(jié)果就會(huì)導(dǎo)致過(guò)擬合,因?yàn)樯窠?jīng)網(wǎng)絡(luò)分類(lèi)器中需要優(yōu)化的參數(shù)太多,而非參數(shù)的方法是不需要優(yōu)化參數(shù)的.通過(guò)對(duì)樣本數(shù)據(jù)間的距離建立模型,文獻(xiàn)[8]的匹配網(wǎng)絡(luò)提出訓(xùn)練和測(cè)試在同一個(gè)條件下進(jìn)行,在訓(xùn)練的時(shí)候不斷地讓網(wǎng)絡(luò)看觀察一個(gè)類(lèi)別的少量樣本.文獻(xiàn)[9]中提出原型網(wǎng)絡(luò)將每個(gè)類(lèi)別中的樣本數(shù)據(jù)映射到一個(gè)空間中,并且提取他們的“均值”來(lái)表示為該類(lèi)的原型.使用歐幾里得距離作為距離度量,對(duì)數(shù)據(jù)類(lèi)別距離判斷歸類(lèi).

    1.3 基于最優(yōu)化的參數(shù)網(wǎng)絡(luò)基于最優(yōu)化的參數(shù)網(wǎng)絡(luò)方法通過(guò)之前大量的相似任務(wù)的學(xué)習(xí),網(wǎng)絡(luò)模型學(xué)習(xí)到一個(gè)表現(xiàn)最好的參數(shù)作為初始值,然后再用于其他任務(wù)的訓(xùn)練,通常不需要或者微調(diào)幾次就可以在新任務(wù)上收斂,其中具有代表性的就是文獻(xiàn)[3]中的MAML.

    2 算法設(shè)計(jì)

    2.1 任務(wù)嵌入在目前的一些小樣本學(xué)習(xí)中,通常將圖像映射到嵌入空間,然后利用特征嵌入進(jìn)行后續(xù)的操作,存在通用的特征嵌入不適用于某些任務(wù)的問(wèn)題,會(huì)影響預(yù)測(cè)的結(jié)果.而基于元學(xué)習(xí)的參數(shù)生成器將通用的圖片特征嵌入轉(zhuǎn)化為動(dòng)態(tài)的任務(wù)感知功能嵌入,如圖1所示.

    圖1 動(dòng)態(tài)的任務(wù)感知功能嵌入

    在同一個(gè)圖像邊界上,不同的任務(wù)分類(lèi)處理不同.它采用一個(gè)簡(jiǎn)單的二值分類(lèi)器來(lái)學(xué)習(xí)一個(gè)獨(dú)立于任務(wù)的線(xiàn)性邊界,從而分開(kāi)正負(fù)樣本,并且泛化到任務(wù)中[10].

    2.2 基于任務(wù)特征的小樣本學(xué)習(xí)模型在網(wǎng)絡(luò)中有兩個(gè)子模塊組成,如圖2所示.任務(wù)感知元學(xué)習(xí)器G采用任務(wù)描述t∈T生成預(yù)測(cè)網(wǎng)絡(luò)中里特征層的權(quán)重.對(duì)于一個(gè)輸入圖像x,預(yù)測(cè)網(wǎng)絡(luò)根據(jù)F(x;θt)=y來(lái)預(yù)測(cè)二值標(biāo)簽y,表示輸入圖像和任務(wù)描述t的相似度,其中參數(shù)θt由權(quán)值生成器生成.雖然t作為任務(wù)描述并沒(méi)有直接作用于預(yù)測(cè)網(wǎng)絡(luò)的輸入,但是影響了網(wǎng)絡(luò)層的參數(shù)從而將任務(wù)信息注入到任務(wù)感知功能嵌入中.

    圖2 基于任務(wù)特征的小樣本學(xué)習(xí)模型

    在預(yù)測(cè)網(wǎng)絡(luò)中,用f代表學(xué)習(xí)模型,樣本x通過(guò)f得到輸出a.在訓(xùn)練階段,模型被訓(xùn)練后能夠快速適應(yīng)任務(wù).任務(wù)學(xué)習(xí)過(guò)程為T(mén)={L(x1,a1,x2,a2,…,xH,aH),q(x1),q(xt+1|xt,at),H},L是損失函數(shù),q(x1)是初始x服從的分布,q(xt+1|xt,at)是x過(guò)渡時(shí)期服從的分布,模型在t時(shí)刻選擇一個(gè)at輸出一個(gè)長(zhǎng)度為H(在監(jiān)督學(xué)習(xí)中H=1)的樣本.在模型學(xué)習(xí)的時(shí)候,首先需要一個(gè)模型去適應(yīng)的任務(wù)分布p(T).在小樣本學(xué)習(xí)問(wèn)題中,從任務(wù)分布中抽樣一個(gè)任務(wù)Ti,從qi中抽取N個(gè)樣本用于訓(xùn)練,得到任務(wù)Ti的損失L(Ti),然后再抽取新樣本進(jìn)行測(cè)試.模型關(guān)注測(cè)試中誤差值的變化情況,并以此為依據(jù)來(lái)提高模型性能.實(shí)際上,在所有的抽樣任務(wù)Ti上的測(cè)試誤差構(gòu)成了學(xué)習(xí)訓(xùn)練階段的訓(xùn)練誤差,在最后階段,從p(T)中抽樣一些新的任務(wù),每個(gè)任務(wù)含有N個(gè)樣本,通過(guò)這N個(gè)樣本的學(xué)習(xí)后,模型的性能作為訓(xùn)練階段的模型能力評(píng)估.

    考慮一個(gè)用參數(shù)θ表示的模型f(θ),當(dāng)在一個(gè)新任務(wù)Ti上學(xué)習(xí)時(shí),參數(shù)θ是在任務(wù)Ti經(jīng)過(guò)一次或多次梯度下降更新得到的θ′i.在該方法中,模型梯度更新表示為:

    (1)

    其中,φ是模型初始化參數(shù),β是用于更新初始化參數(shù)的超參數(shù)學(xué)習(xí)率.

    2.3 任務(wù)權(quán)重分解在任務(wù)感知元學(xué)習(xí)器中,輸入一個(gè)任務(wù)后在任務(wù)嵌入中類(lèi)似word2vec的方式將任務(wù)轉(zhuǎn)化為向量.在其中有3層FC網(wǎng)絡(luò)(2*(Linear+BatchNorm+ReLu)+(Linear+ReLu)).在權(quán)值生成器(generator)中有一個(gè)權(quán)重分解方案來(lái)簡(jiǎn)化生成器的設(shè)計(jì),如圖3所示.Wi∈Rk×k×Cin×Cout(k是卷積核大小,Cin和Cout分別是輸入和輸出通道數(shù))是第i個(gè)生成器生成的權(quán)重,Xi是圖片特征處理生成的image features,那么輸出Xi+1為:

    圖3 任務(wù)權(quán)值生成

    xi+1=Wi*xi

    (2)

    其中Wi是第i個(gè)生成器的輸出,它可以被分解為:

    (3)

    2.4 損失函數(shù)由于在元學(xué)習(xí)器上用于訓(xùn)練任務(wù)的數(shù)量遠(yuǎn)小于訓(xùn)練網(wǎng)絡(luò)的圖像數(shù)量,所以元學(xué)習(xí)器中設(shè)有一個(gè)嵌入損失防止退化,對(duì)于一個(gè)任務(wù)嵌入et=T(t)和任務(wù)感知功能嵌入TF(x;θt)投影到一個(gè)聯(lián)合嵌入空間中,如果樣本是正樣本,那么對(duì)應(yīng)的任務(wù)感知功能嵌入就和et接近,如果樣本是負(fù)樣本,那么對(duì)應(yīng)任務(wù)感知功能嵌入和et就遠(yuǎn)離.使用hinged cosine similarity作為距離的度量,那么損失公式L1為:

    (4)

    其中,xi是第i個(gè)樣本,yi∈{0,1}是標(biāo)簽的one-hot編碼,T是任務(wù)數(shù)量.

    在預(yù)測(cè)網(wǎng)絡(luò)的分類(lèi)過(guò)程中,預(yù)測(cè)出來(lái)的標(biāo)簽和真實(shí)值之間的誤差采用多分類(lèi)交叉熵形式,那么其損失公式L2為:

    (5)

    故,總損失函數(shù)公式L為:

    L=L1+L2

    (6)

    3 實(shí)驗(yàn)過(guò)程及結(jié)果

    3.1 數(shù)據(jù)集介紹本次實(shí)驗(yàn)使用的數(shù)據(jù)集是Omniglot和MiniImagenet.

    Omniglot是小樣本學(xué)習(xí)中常用的數(shù)據(jù)集,包含來(lái)自50個(gè)不同字母表的1 623類(lèi)不同的手寫(xiě)字符.1 623類(lèi)字符中的每一個(gè)都是由20個(gè)不同的人通過(guò)亞馬遜的Turk平臺(tái)在線(xiàn)繪制的.

    MiniImagenet從ImageNet數(shù)據(jù)集中隨機(jī)采樣的100個(gè)類(lèi)別組成,其中每個(gè)類(lèi)別具有600張尺寸為84×84的圖像.

    3.2 實(shí)驗(yàn)過(guò)程在實(shí)驗(yàn)中,使用SGD(momentum=0.9)作為優(yōu)化方法,初始學(xué)習(xí)率設(shè)置為0.001,每經(jīng)過(guò)4 000次迭代學(xué)習(xí)率減半,預(yù)測(cè)網(wǎng)絡(luò)中卷積網(wǎng)絡(luò)大小設(shè)置均為3×3×32,每層用Batchnorm來(lái)增強(qiáng)收斂速度和穩(wěn)定性,激活函數(shù)為ReLu,作為對(duì)比實(shí)驗(yàn)組的模型均與參考文獻(xiàn)保持一致.在Omniglot數(shù)據(jù)集中,采用1 200類(lèi)用于訓(xùn)練,423類(lèi)用于測(cè)試,所有圖像均設(shè)置為28×28.MiniImagenet數(shù)據(jù)集分為3個(gè)部分,64類(lèi)用于訓(xùn)練,16類(lèi)用于驗(yàn)證,20類(lèi)用于測(cè)試.Omniglot數(shù)據(jù)集上5-way1-shot和5-way5-shot設(shè)置15張圖片作為查詢(xún)圖像.20-way1-shot和20-way5-shot分類(lèi)任務(wù)使用5張圖片作為查詢(xún)圖像,用隨機(jī)的一千個(gè)測(cè)試批次的平均值準(zhǔn)確率作為準(zhǔn)確率.MiniImagenet上用5-way1-shot和5-way5-shot設(shè)置15張圖片作為查詢(xún)圖像,隨機(jī)六百個(gè)測(cè)試批次的平均準(zhǔn)確率作為準(zhǔn)確率.

    3.3 實(shí)驗(yàn)結(jié)果本文中實(shí)驗(yàn)結(jié)果如表1和表2所示,其中匹配網(wǎng)絡(luò)采用了文獻(xiàn)[8]的結(jié)構(gòu),基于度量方法的網(wǎng)絡(luò)采用了文獻(xiàn)[2]的結(jié)構(gòu),基于最優(yōu)化的參數(shù)網(wǎng)絡(luò)采用文獻(xiàn)[3]的結(jié)構(gòu).在Omniglot上,5-way1-shot,20-way1-shot,20-way5-shot取得了不錯(cuò)的分類(lèi)準(zhǔn)確率.隨著分類(lèi)任務(wù)的復(fù)雜度增加,本文中模型在準(zhǔn)確率上要高于其他模型.在MiniImagenet上的兩個(gè)分類(lèi)任務(wù),均設(shè)置了比較多的查詢(xún)圖像,保證模型的表現(xiàn)出了略?xún)?yōu)于其他模型的分類(lèi)準(zhǔn)確率.

    表1 Omniglot上分類(lèi)準(zhǔn)確率比較

    表2 MiniImagenet上分類(lèi)準(zhǔn)確率比較(95%置信區(qū)間)

    4 結(jié)語(yǔ)

    本研究提出了基于任務(wù)特征的小樣本學(xué)習(xí)方法,目前主流的模型方法類(lèi)型有3種,即度量模型、匹配模型和參數(shù)模型,MAML是參數(shù)模型的代表.通過(guò)元學(xué)習(xí)的策略,引用任務(wù)特征嵌入來(lái)搭配快速學(xué)習(xí)的模型MAML,來(lái)提高應(yīng)對(duì)不同任務(wù)的能力,更好地提高了模型的泛化能力.實(shí)驗(yàn)結(jié)果證明在Omniglot和MiniImagenet上有提高分類(lèi)結(jié)果的準(zhǔn)確性.待改進(jìn)的工作:(1)可以尋找更好的任務(wù)嵌入的方式,或許會(huì)有更好的效果;(2)小樣本學(xué)習(xí)樣本庫(kù)的規(guī)模變得復(fù)雜,學(xué)習(xí)模型執(zhí)行效率會(huì)有所降低.

    猜你喜歡
    準(zhǔn)確率神經(jīng)網(wǎng)絡(luò)樣本
    乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
    健康之家(2021年19期)2021-05-23 11:17:39
    不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
    2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
    用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
    神經(jīng)網(wǎng)絡(luò)抑制無(wú)線(xiàn)通信干擾探究
    電子制作(2019年19期)2019-11-23 08:42:00
    推動(dòng)醫(yī)改的“直銷(xiāo)樣本”
    高速公路車(chē)牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
    隨機(jī)微分方程的樣本Lyapunov二次型估計(jì)
    基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
    村企共贏的樣本
    大邑县| 河西区| 正镶白旗| 青阳县| 马公市| 延长县| 苍梧县| 社旗县| 江达县| 武功县| 奉化市| 平顺县| 松潘县| 洞头县| 苍溪县| 汨罗市| 磐石市| 天柱县| 民权县| 泊头市| 巢湖市| 福海县| 吉水县| 凤山市| 准格尔旗| 兴文县| 东至县| 密云县| 平潭县| 天水市| 苍南县| 左权县| 洛阳市| 仁寿县| 陆丰市| 阳春市| 保定市| 朝阳县| 南康市| 华坪县| 都兰县|