• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于加權(quán)核范數(shù)的低秩矩陣補(bǔ)全算法研究

      2022-06-17 01:22:20石瑩黃華王智高超
      關(guān)鍵詞:范數(shù)集上正則

      石瑩, 黃華, 王智, 高超

      1.西南大學(xué) 信息化建設(shè)辦公室,重慶 400715;2.重慶工程職業(yè)技術(shù)學(xué)院,現(xiàn)代教育技術(shù)中心,重慶 402260;3.西南大學(xué) 計(jì)算機(jī)與信息科學(xué)學(xué)院,重慶 400715;4.西北工業(yè)大學(xué) 光電與智能研究院,西安 710072

      在諸如協(xié)同過(guò)濾[1-2]、降維處理[3]、子空間聚類[4]、圖像和信號(hào)處理[5-6]等機(jī)器學(xué)習(xí)或數(shù)據(jù)分析領(lǐng)域,人們通常需要求解如下優(yōu)化問(wèn)題

      (1)

      其中:M∈Rm×n為僅知道部分觀察元素的待恢復(fù)矩陣,X∈Rm×n為目標(biāo)矩陣,Ω表示已知的觀察元素的位置,PΩ為正交投影算子,定義為

      (2)

      求解優(yōu)化問(wèn)題(1)的主要任務(wù)是尋找一個(gè)最小秩矩陣X*∈Rm×n,使其滿足PΩ(X*)=PΩ(M)且使得秩函數(shù)rank(X)最小.利用正則化方法,問(wèn)題(1)可等價(jià)地轉(zhuǎn)換為如下非約束最小化問(wèn)題

      (3)

      這里‖·‖F(xiàn)表示F范數(shù),λ>0為正則化參數(shù).

      基于非凸正則化方法的優(yōu)良性能,本文對(duì)基于加權(quán)核范數(shù)正則化模型進(jìn)行進(jìn)一步的分析和探討,并借鑒Soft-Impute算法的思想提出一個(gè)擁有更快收斂速率和能夠得到更高精度解的低秩矩陣補(bǔ)全算法.在本文提出WNNM-Impute(weighted nuclear norm minimization impute)算法的迭代過(guò)程中,需要進(jìn)行費(fèi)時(shí)的SVD分解.針對(duì)這一問(wèn)題,通過(guò)引入不精確的近鄰算子極大地降低WNNM-Impute算法的時(shí)間復(fù)雜度,從而使得算法收斂更快.同時(shí),在算法中引入Nesterov加速策略,使得算法的總體迭代次數(shù)進(jìn)一步減少.本文提出的算法基于Soft-Impute算法,但是實(shí)驗(yàn)結(jié)果表明,它比Soft-Impute算法收斂更快且得到的解的精度更高.因此,本文提出的算法適合用于求解大規(guī)模低秩矩陣補(bǔ)全問(wèn)題.

      1 基礎(chǔ)知識(shí)

      當(dāng)使用核范數(shù)去松弛秩函數(shù)rank(X)時(shí),數(shù)學(xué)上可將低秩矩陣補(bǔ)全問(wèn)題建模為

      (4)

      這里‖X‖*表示核范數(shù),定義為

      (5)

      其中r=min(m,n),σi(X)為矩陣X的第i個(gè)奇異值.

      模型(4)能夠被SVT等算法快速求解.在SVT算法中,需要求解如下奇異值閾值算子

      (6)

      該算子的求解需要如下引理.

      引理1若記矩陣Y的SVD分解為Y=UΣVT,則(6)式的最優(yōu)解為

      X*=Sλ(Y)=UDVT

      (7)

      其中Sλ(·)為軟閾值函數(shù),Dii=max(Σii-λ,0).

      從上述引理可以看出,主要的計(jì)算集中在求解矩陣Y的SVD分解,其時(shí)間復(fù)雜度為O(mn2),因此它不適合求解大規(guī)模矩陣補(bǔ)全問(wèn)題.針對(duì)這一問(wèn)題,文獻(xiàn)[13]注意到

      PΩ(M)+PΩ⊥(Xk)=PΩ(M-Xk)+Xk

      (8)

      其中:Xk為第k次迭代值,PΩ⊥(·)表示Ω的補(bǔ)集中的元素.顯然,(8)式右邊的第一部分具有稀疏的特性,第二部分具有低秩的特性.因此,利用SVT算法的思想提出了Soft-Impute算法,在第k+1次迭代時(shí)有

      Xk+1=Sλ(PΩ(M)+PΩ⊥(Xk))

      (9)

      該算法的詳細(xì)步驟如算法1所示.

      算法1Soft-Impute算法[13]

      輸入:部分觀察矩陣M,參數(shù)λ>0

      輸出:秩為r的矩陣X

      1)初始化X1=0;

      2)fork=1,2,… do

      3)Y=PΩ(M)+PΩ⊥(Xk)

      4)Xk+1=Sλ(Y)

      5)end for

      6)returnXk+1

      然而,在核范數(shù)極小化模型中,它同等對(duì)待目標(biāo)矩陣的所有奇異值,這導(dǎo)致該模型不能很好地刻畫矩陣的低秩結(jié)構(gòu).為了解決這一困難,近年來(lái)加權(quán)核范數(shù)[21]被提出來(lái)用于更好地刻畫目標(biāo)矩陣的低秩結(jié)構(gòu).對(duì)目標(biāo)低秩矩陣,加權(quán)核范數(shù)模型盡可能地對(duì)較大奇異值進(jìn)行較小懲罰,而對(duì)較小奇異值進(jìn)行較大懲罰.對(duì)于任一矩陣X∈Rm×n,加權(quán)核范數(shù)可定義為

      (10)

      其中w=[w1,w2,…,wr]T和wi≥0為分配給σi(X)的非負(fù)加權(quán).核范數(shù)極小化方法為了刻畫矩陣的低秩結(jié)構(gòu)同等對(duì)待目標(biāo)矩陣的奇異值,而(10)式考慮對(duì)較小奇異值進(jìn)行更多懲罰,而較大的奇異值得到更少懲罰.基于此,利用(10)式去松弛秩函數(shù)rank(X),將原始低秩矩陣補(bǔ)全問(wèn)題建模為

      (11)

      模型(11)比模型(4)能夠更好地刻畫目標(biāo)矩陣的低秩結(jié)構(gòu),但是由于加權(quán)核范數(shù)的引入,得到非凸、非光滑的優(yōu)化問(wèn)題,使得對(duì)該問(wèn)題的求解變得非常困難.傳統(tǒng)的針對(duì)核范數(shù)正則化模型的求解方法不能直接用于求解非凸正則化模型.因此,如何設(shè)計(jì)出快速、穩(wěn)健、可擴(kuò)展和可靠的算法是一個(gè)至關(guān)重要的挑戰(zhàn).本文針對(duì)這一問(wèn)題,利用Soft-Impute的求解思想,融入不精準(zhǔn)近鄰算法和Nesterov優(yōu)化理論,提出一個(gè)快速高效的低秩矩陣補(bǔ)全算法用于求解模型(11),理論和實(shí)驗(yàn)結(jié)果都表明所提出的算法能夠得到更快的收斂速率和更高精度的解.

      2 WNNM-Impute算法

      受到Soft-Impute算法的啟發(fā),本節(jié)將融入不精準(zhǔn)近鄰算法和Nesterov優(yōu)化理論,構(gòu)建用于求解優(yōu)化模型(11)的一階梯度算法.然而,由于加權(quán)核范數(shù)的引入,優(yōu)化模型(11)是非凸和非光滑的.因此,為了得到該模型的閉式解,需要求解如下加權(quán)核范數(shù)近鄰算子.

      (12)

      下面的定理表明,加權(quán)核范數(shù)近鄰問(wèn)題(12)可轉(zhuǎn)化為線性約束的二次規(guī)劃問(wèn)題,從而得到它的閉式解.

      (13)

      (14)

      s.t.d1≥d2≥…≥dr≥0

      該定理的證明見(jiàn)文獻(xiàn)[21].基于定理1,如取w1≤w2≤…≤wr,可以得到如下推論.

      推論1對(duì)任意給定λ>0,Y∈Rm×n且其SVD分解為Y=UΣVT,w1≤w2≤…≤wr,r為矩陣Y的秩,則極小化問(wèn)題

      (15)

      的最優(yōu)解為

      X*=Sλ(Y)=UDVT

      (16)

      其中Dii=max(Σii-λwi,0).

      該推論的證明見(jiàn)文獻(xiàn)[21].該推論表明,雖然極小化問(wèn)題(15)是非凸和非光滑的,但是它仍然存在全局最優(yōu)閉式解.利用定理1和推論1的結(jié)論,我們提出如下算法用于求解優(yōu)化模型(11).

      算法2WNNM-Impute算法

      1)初始化V1,V2∈Rm×n為隨機(jī)的高斯矩陣,X0=X1=0,Y1=X0,λ0=η‖PΩ(M)‖2,θ0=1;

      2)fork=1,2,…,Tdo

      3)Rk=QR([Vk,Vk-1])//QR()表示QR分解

      4)G=Yk-μ(PΩ(Yk-M))

      5)Q=PowerMethod(G,Rk)

      6) [U,Σ,V]=SVD(QTG)

      7)U={uk|Σii>λwi}

      8)V={vk|Σii>λwi}

      9)D={dii|max(Σii-λk-1wi,0)}

      13) else

      14)Xk+1=Yk

      15) end if

      20) break

      21) end if

      22)Vk+1=V

      23)end for

      24)returnXk+1

      從定理2和推論1可以看出,在對(duì)極小化模型(11)的求解過(guò)程中,需要對(duì)觀察矩陣Y∈Rm×n做SVD分解,它的時(shí)間復(fù)雜度為O(mn2).因此,當(dāng)矩陣的規(guī)模較大時(shí),這是相當(dāng)費(fèi)時(shí)的.為此,在算法2中,我們引入PowerMethod算法得到一個(gè)正交矩陣Q∈Rm×t,其中t>r且t?n.這樣,對(duì)矩陣G的SVD分解可以轉(zhuǎn)為對(duì)矩陣QTG的SVD分解.但是,QTG的規(guī)模僅為m×t,遠(yuǎn)小于矩陣G的規(guī)模m×n.從而,時(shí)間復(fù)雜度降為O(mt2).該過(guò)程可概述為如下引理.

      引理2假定矩陣G∈Rm×n有r個(gè)奇異值大于λw,G=QQTG,其中Q∈Rm×t為正交矩陣且t>r,則

      1)range(G)?range(Q);

      2)Sλ(G)=QSλ(QTG).

      該引理的證明過(guò)程與文獻(xiàn)[22]中的引理1類似,這里省略.需要指出的是,引理2是處理的加權(quán)核范數(shù)正則子,而非核范數(shù)正則子.

      由于PowerMethod算法[22]的引入,得到閾值算子的值將是不精確的.因此,需要判斷當(dāng)前值是否可行.于是,在算法2中,我們采用如下式子來(lái)確保目標(biāo)函數(shù)F是單調(diào)遞減的,從而保證目標(biāo)函數(shù)收斂到某一穩(wěn)定點(diǎn):

      (17)

      為了提升算法的收斂速率,在算法2中引入Nesterov加速準(zhǔn)則,該準(zhǔn)則被廣泛地應(yīng)用于機(jī)器學(xué)習(xí)算法中,如nmAPG,F(xiàn)aNCL-acc,niAPG等.基于此,在算法2中采用如下加速策略

      (18)

      (19)

      實(shí)驗(yàn)部分將進(jìn)一步表明,由于(18)和(19)式加速策略的引入,使得算法2的收斂速率得到大幅地提高.

      (20)

      這里0<η<1.

      在算法2的迭代過(guò)程中,得到的解Xk不斷地逼近真實(shí)解,且目標(biāo)函數(shù)F單調(diào)遞減,直到收斂到某一穩(wěn)定點(diǎn).下面的定理保證了算法2的收斂性,該定理的證明參照文獻(xiàn)[20].

      定理2假定{Xk}為算法2在迭代過(guò)程中產(chǎn)生的解序列,則

      2)目標(biāo)函數(shù)F單調(diào)遞減,且收斂到F(X*),這里X*為序列{Xk}的任一聚點(diǎn);

      3 實(shí)驗(yàn)仿真

      為了測(cè)試WNNM-Impute算法的效率和準(zhǔn)確性,本節(jié)將在模擬數(shù)據(jù)集和真實(shí)數(shù)據(jù)集上進(jìn)行一系列的對(duì)比實(shí)驗(yàn).在接下來(lái)的實(shí)驗(yàn)中,將包括如下經(jīng)典或最新算法.

      1)SVT算法:經(jīng)典的、被廣泛應(yīng)用于低秩矩陣補(bǔ)全問(wèn)題中的方法,它將線性Bregman迭代用于求解低秩矩陣優(yōu)化問(wèn)題;

      2)APG算法:基于核范數(shù)的低秩矩陣補(bǔ)全方法,是快速迭代收縮閾值算法的矩陣版本;

      3)R1MP算法:該方法是將正交匹配追蹤算法用于求解低秩矩陣補(bǔ)全問(wèn)題;

      4)Soft-Impute算法:該方法是在SVT方法的基礎(chǔ)上,利用迭代過(guò)程存在“低秩+稀疏”的特性,達(dá)到快速求解低秩補(bǔ)全問(wèn)題的目的;

      5)WNNM算法:基于加權(quán)核范數(shù)的低秩矩陣補(bǔ)全方法.

      1)計(jì)算

      其中:X為結(jié)果矩陣,Ω⊥為除觀察值以外的位置;

      2)結(jié)果矩陣X的秩r;

      3)運(yùn)行時(shí)間t.

      在實(shí)驗(yàn)中,我們對(duì)不同規(guī)模的矩陣進(jìn)行了測(cè)試,即m∈{500,1 000,1 500,3 000}.每個(gè)算法獨(dú)立運(yùn)行10次,報(bào)告其平均NMSE值.

      實(shí)驗(yàn)結(jié)果如表1所示.從表1可以看出,WNNM-Impute算法無(wú)論是精度還是效率都要優(yōu)于其他算法.具體來(lái)說(shuō),WNNM-Impute算法在所有的數(shù)據(jù)集上均得到了最小的NMSE,且運(yùn)行的平均時(shí)間是最短的.此外,在實(shí)驗(yàn)中,SVT,WNNM和WNNM-Impute算法能夠得到秩為5的近似解,而APG,R1MP和Soft-Impute算法得到的近似解的秩遠(yuǎn)高于5.實(shí)驗(yàn)同時(shí)揭示了在WNNM-Impute算法中引入不精確的近鄰算法和Nesterov加速準(zhǔn)則能夠極大地提升算法的效率.

      表1 不同算法在不同規(guī)模和不同采樣率下的矩陣補(bǔ)全結(jié)果

      第二組實(shí)驗(yàn)為在真實(shí)圖像數(shù)據(jù)集上的低秩矩陣補(bǔ)全.實(shí)驗(yàn)中所使用的圖像數(shù)據(jù)如圖1所示,每張圖片的大小為512×512.

      在實(shí)驗(yàn)中,我們直接對(duì)原始圖像進(jìn)行處理.由于原始圖像可能不是嚴(yán)格低秩的,因此使用秩為50的矩陣去近似原始圖像.對(duì)于每一張圖像,隨機(jī)地去掉圖像中50%的數(shù)據(jù),余下的數(shù)據(jù)作為觀察值.在本組實(shí)驗(yàn)中,采用如下方式來(lái)評(píng)估所有算法的性能:

      1)PSNR(peak signal-to-noise ratio);

      2)運(yùn)行時(shí)間t.

      實(shí)驗(yàn)結(jié)果如表2和圖2所示.

      圖2 WNNM-Impute算法在Lena圖像上的恢復(fù)結(jié)果

      表2 不同算法在圖像數(shù)據(jù)集上的恢復(fù)結(jié)果

      從表2可以看出,在大多數(shù)測(cè)試圖像數(shù)據(jù)上WNNM-Impute算法得到更大的PNSR值.進(jìn)一步分析發(fā)現(xiàn),雖然WNNM-Impute算法的效率略低于R1MP算法,但是本文提出的算法得到的PNSR值遠(yuǎn)好于R1MP算法.因此,綜合考慮精度和效率,本次實(shí)驗(yàn)再一次證實(shí)本文提出的WNNM-Impute算法的有效性.

      為了進(jìn)一步測(cè)試WNNM-Impute算法的有效性,接下來(lái)將在真實(shí)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn).這些數(shù)據(jù)集包括:Jester1,Jester2,Jester3,MovieLens-100K,MovieLens-1M和MovieLens-10M.這些數(shù)據(jù)集的特性如表3所示,其中Jester數(shù)據(jù)集來(lái)源于一個(gè)笑話推薦系統(tǒng),而MovieLens數(shù)據(jù)集來(lái)自于MovieLens網(wǎng)站.

      表3 協(xié)同過(guò)濾數(shù)據(jù)集的特征

      1)Jester1:包括24 983名用戶對(duì)36個(gè)或更多笑話的評(píng)價(jià);

      2)Jester2:包括23 500名用戶對(duì)36個(gè)或更多笑話的評(píng)價(jià);

      3)Jester3:包括24 983名用戶評(píng)價(jià)了15到35個(gè)笑話;

      4)MovieLens-100K:包含942名用戶對(duì)1 682部影片的100 000個(gè)評(píng)價(jià);

      5)MovieLens-1M:包含6 040名用戶對(duì)3 900部影片的1 000 000個(gè)評(píng)價(jià);

      6)MovieLens-10M:包含69 878名用戶對(duì)10 677部影片的1 000 000個(gè)評(píng)價(jià).

      在本組實(shí)驗(yàn)中,采用如下方式來(lái)評(píng)估所有算法的性能:

      1)計(jì)算

      其中:這里Ω⊥表示測(cè)試數(shù)據(jù)集,X為結(jié)果矩陣;

      2)結(jié)果矩陣的秩r;

      3)運(yùn)行時(shí)間t.

      在實(shí)驗(yàn)中,隨機(jī)地從每個(gè)協(xié)調(diào)過(guò)濾數(shù)據(jù)集中選取50%的數(shù)據(jù)作為觀察數(shù)據(jù),余下的為測(cè)試數(shù)據(jù).實(shí)驗(yàn)結(jié)果如表4和表5所示.

      表4 不同算法在Jester笑話數(shù)據(jù)集上的恢復(fù)結(jié)果

      表5 不同算法在MovieLens數(shù)據(jù)集上的恢復(fù)結(jié)果

      從表4和表5可以看出,在6個(gè)協(xié)調(diào)過(guò)濾數(shù)據(jù)集上WNNM-Impute算法幾乎總能得到最小的RMSE值,在效率方面僅比R1MP慢一點(diǎn).在實(shí)驗(yàn)中發(fā)現(xiàn)SVT,WNNM和WNNM-Impute算法能夠得到秩更低的解,而APG,R1MP和Soft-Impute算法不能得到近似低秩矩陣解.該組實(shí)驗(yàn)進(jìn)一步說(shuō)了,WNNM-Impute算法在真實(shí)協(xié)調(diào)過(guò)濾數(shù)據(jù)集上是高效的.

      4 結(jié)束語(yǔ)

      本文利用加權(quán)核范數(shù)去松弛原始低秩極小化問(wèn)題,得到一個(gè)非凸非光滑的優(yōu)化問(wèn)題.為了高效地求解該問(wèn)題,文中利用Soft-Impute的算法思想,融入不精確近鄰算子和Nesterov優(yōu)化理論,提出了一個(gè)快速、準(zhǔn)確的低秩矩陣補(bǔ)全算法.實(shí)驗(yàn)結(jié)果表明,在不同規(guī)模和不同采樣率的模擬數(shù)據(jù)集上WNNM-Impute算法能夠得到更加精確的解且效率更高;在采樣率相同和不同規(guī)模的協(xié)同過(guò)濾數(shù)據(jù)集上WNNM-Impute算法能夠得到秩更低且更好質(zhì)量的解.因此,本文提出的WNNM-Impute算法是一個(gè)具有較強(qiáng)競(jìng)爭(zhēng)力的低秩矩陣補(bǔ)全算法.

      猜你喜歡
      范數(shù)集上正則
      Cookie-Cutter集上的Gibbs測(cè)度
      鏈完備偏序集上廣義向量均衡問(wèn)題解映射的保序性
      剩余有限Minimax可解群的4階正則自同構(gòu)
      類似于VNL環(huán)的環(huán)
      復(fù)扇形指標(biāo)集上的分布混沌
      基于加權(quán)核范數(shù)與范數(shù)的魯棒主成分分析
      矩陣酉不變范數(shù)H?lder不等式及其應(yīng)用
      有限秩的可解群的正則自同構(gòu)
      一類具有準(zhǔn)齊次核的Hilbert型奇異重積分算子的范數(shù)及應(yīng)用
      幾道導(dǎo)數(shù)題引發(fā)的解題思考
      江源县| 如东县| 涞水县| 德保县| 兰西县| 赤峰市| 新乡县| 西吉县| 友谊县| 张家港市| 白山市| 凤翔县| 博罗县| 思茅市| 乌什县| 澜沧| 镇宁| 泰宁县| 临西县| 上高县| 红安县| 唐河县| 瓦房店市| 崇左市| 潮州市| 湘乡市| 庆云县| 闵行区| 抚顺县| 宿州市| 阿拉善左旗| 沁源县| 揭阳市| 威信县| 忻城县| 千阳县| 锡林浩特市| 巴里| 沈丘县| 新昌县| 河津市|