• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      人工指導(dǎo)與機(jī)器學(xué)習(xí)相結(jié)合的黑白影像上色方法研究

      2021-09-19 08:08:18
      現(xiàn)代電影技術(shù) 2021年8期
      關(guān)鍵詞:機(jī)器顏色圖像

      王 崢

      (中國電影資料館(中國電影藝術(shù)研究中心),北京 100082)

      1 引言

      隨著經(jīng)濟(jì)的發(fā)展,科技的進(jìn)步,電影制作也在逐漸發(fā)生各種新變化。黑白膠片電影早已成為過去,但經(jīng)典影片在經(jīng)過歷史的沉淀后,擁有自己獨(dú)特的歷史價值。因此對黑白影像上色,使其更好地發(fā)揮歷史價值和商業(yè)價值是極其必要的。傳統(tǒng)的上色處理方式是使用后期視頻處理軟件對電影幀進(jìn)行處理和上色。這一過程對操作人員有很強(qiáng)的依賴性,也對上色人員提出很高的專業(yè)要求。除此之外,完成一整部黑白電影的上色需要操作人員逐幀進(jìn)行手動上色,工作量巨大,成片速度慢,無法滿足當(dāng)前電影工業(yè)對于黑白老影片上色的巨大需求。

      近年來,隨著機(jī)器學(xué)習(xí)以及神經(jīng)網(wǎng)絡(luò)的深入研究和廣泛使用,圖像處理技術(shù)不斷發(fā)展以及硬件設(shè)備的不斷進(jìn)步,機(jī)器學(xué)習(xí)在圖像處理方面有了很大的進(jìn)步,當(dāng)前已經(jīng)廣泛使用在圖像修復(fù)、圖像生成、語義分割等方面。應(yīng)用機(jī)器學(xué)習(xí)為黑白影像自動化上色成為可能。當(dāng)前的機(jī)器學(xué)習(xí)算法本身具有強(qiáng)大的特征提取能力,但是要想完成自動化上色的任務(wù),還需要建立大規(guī)模的相對應(yīng)訓(xùn)練的數(shù)據(jù)集。當(dāng)前的深度學(xué)習(xí)算法在進(jìn)行數(shù)據(jù)處理的時候往往會對圖片進(jìn)行隨機(jī)裁剪,加入噪聲,或者旋轉(zhuǎn)等操作以達(dá)到數(shù)據(jù)增廣的目的。但是這種數(shù)據(jù)增強(qiáng)的方式并不能改善在黑白影像上色中的某些問題。例如,不同年代的戰(zhàn)爭題材電影,軍裝會有不同的顏色,而機(jī)器學(xué)習(xí)并沒有年代的概念,只會根據(jù)數(shù)據(jù)集中數(shù)量較多的軍裝顏色進(jìn)行權(quán)重上色,可能會上色為與訓(xùn)練集相同的藍(lán)色,但是實際情況應(yīng)該為綠色。因此,單純通過機(jī)器學(xué)習(xí)的算法無法取得較好的上色效果。除此之外,由于電影場景較為復(fù)雜,傳統(tǒng)的機(jī)器學(xué)習(xí)方法在上色過程中還會出現(xiàn)顏色不均勻、有異常色塊、顏色閃動等問題。

      針對以上情況,本文提出一種人工指導(dǎo)與機(jī)器學(xué)習(xí)相結(jié)合的方式完成為黑白影像上色的任務(wù)。在完成任務(wù)中,以“人”的專業(yè)知識為指導(dǎo),感性認(rèn)知為評判標(biāo)準(zhǔn),在“人”與“機(jī)器”之間尋求協(xié)調(diào)與平衡。在本文提出的方法中,人工將原始黑白電影進(jìn)行分鏡頭、分場景的劃分,并根據(jù)劃分好的片段準(zhǔn)備素材、建立訓(xùn)練集、進(jìn)行專項訓(xùn)練。同時優(yōu)化了機(jī)器學(xué)習(xí)上色模型,選擇生成式對抗網(wǎng)絡(luò)(GAN,Generative Adversarial Networks)作為上色的算法,設(shè)計了更符合電影上色任務(wù)的損失函數(shù),確保單幀上色顏色的均衡以及多幀連成視頻后顏色的穩(wěn)定。

      2 國內(nèi)外研究現(xiàn)狀

      針對黑白影像的機(jī)器上色方法已經(jīng)成為當(dāng)前的一個研究熱點。崔永成將生成對抗網(wǎng)絡(luò)(GANs)原理應(yīng)用到黑白電影幀的渲染中,把黑白電影幀轉(zhuǎn)換到彩色電影幀。成梓銳針對上色問題,反對人為的干預(yù),提出一種基于殘差網(wǎng)絡(luò)的批量化上色方案。然而缺乏人為的干預(yù)的自動化上色方法泛化性較差,難以滿足復(fù)雜多變的上色任務(wù)。馬騁等人提出一種觀點,現(xiàn)有的彩色化算法存在對曝光偏差的圖像彩色化效果不佳,并針對該問題,提出一種在彩色化存在曝光偏差的灰度圖像時,使用直方圖均衡化預(yù)處理輸入圖像方法,以達(dá)到更好的彩色化效果。呂維帥提出了在上色模型中加入了自注意力機(jī)制,以提升上色過程中某些細(xì)節(jié)的上色效果。劉建民等人采用了端到端的編碼與解碼架構(gòu),能夠從大規(guī)模數(shù)據(jù)學(xué)習(xí)顏色的分布,實現(xiàn)顏色傳播與預(yù)測,從而把灰度圖像映射為彩色圖像。鄭鑫毅使用輕量級具有聯(lián)合特征的圖像識別網(wǎng)絡(luò)作為近紅外圖像的識別網(wǎng)絡(luò)。該方法降低了訓(xùn)練的時間和對硬件設(shè)備的需求,同時還能夠保證一定的上色效果。李智敏等人提出了一種全自動的兩階段式灰度圖像著色算法。結(jié)合分類網(wǎng)絡(luò)和采樣上色網(wǎng)絡(luò),并使它們共享部分相同的網(wǎng)絡(luò)結(jié)構(gòu)和權(quán)值,將平均平方誤差和交叉熵函數(shù)的加權(quán)作為損失函數(shù)。劉昌通等人提出了聯(lián)合一致循環(huán)生成對抗網(wǎng)絡(luò)的人像著色方法。杜康寧等人提出了一種結(jié)合循環(huán)生成對抗網(wǎng)絡(luò)與聯(lián)合一致性損失函數(shù)進(jìn)行人臉著色模型訓(xùn)練的方法,改善了著色圖像的真實感與細(xì)節(jié)。張娜基于密集神經(jīng)網(wǎng)絡(luò)構(gòu)建并訓(xùn)練了一個端到端的深度學(xué)習(xí)模型,改善了著色過程中的漏色、細(xì)節(jié)信息損失、對比度低等問題。劉揚(yáng)東等人針對CT 檢疫設(shè)備在識別檢疫物時出現(xiàn)誤報、漏報等問題,提出一種基于深度學(xué)習(xí)的CT 圖像著色和自動識別方法,使用多輸入的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行三維物體識別。田影等人提出了一種以用戶引導(dǎo)方式為黑白人物圖片著色的深度學(xué)習(xí)方法。針對端到端的方式學(xué)習(xí)整個框架。徐中輝等人結(jié)合深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)設(shè)計了一個全自動的著色網(wǎng)絡(luò)模型,使用卷積神經(jīng)網(wǎng)絡(luò)SE-Inception-ResNet-v2作為高水平的特征提取器,提取圖像的全局信息。張政等人在上色模型中融入了圖像語義分割算法。以圖像的語義信息作為上色的指定,提升上色效果的準(zhǔn)確性。Safa Messaoud等人提出了一種基于條件隨機(jī)場的變分自動編碼器,實現(xiàn)在考慮結(jié)構(gòu)一致性的同時實現(xiàn)多樣性。Jianbo Chen 等人針對基于語言的圖像編輯問題的基于語言的圖像分割和圖像彩色化這兩個子任務(wù),提出了一個采用循環(huán)注意模型融合圖像和語言特征的框架。

      3 人工指導(dǎo)與機(jī)器學(xué)習(xí)結(jié)合的黑白電影上色方法

      該章節(jié)將詳細(xì)描述本文提出的人工指導(dǎo)與機(jī)器學(xué)習(xí)相結(jié)合的針對黑白影像上色的方法。主要分為兩個部分:一是上色模型的構(gòu)建和優(yōu)化,二是如何針對機(jī)器學(xué)習(xí)的上色模型進(jìn)行人工指導(dǎo)。在下面的章節(jié)中,將針對這兩個方面進(jìn)行詳細(xì)描述。

      3.1 生成式對抗網(wǎng)絡(luò)上色模型

      本文采用生成式對抗網(wǎng)絡(luò) (GAN)作為黑白影像自動上色的基礎(chǔ)模型。該模型由生成器模型(Generative Model)和判別器模型 (Discriminative Model)兩部分組成。通過生成器和判別器相互競爭對抗完成上色任務(wù)的訓(xùn)練。生成器的目標(biāo)是生成樣本去擬合真實的樣本。判別器的輸入由真實樣本和生成器網(wǎng)絡(luò)生成的樣本組成。經(jīng)過判別器網(wǎng)絡(luò)判斷樣本是來自真實樣本,還是來自于生成器生成的樣本。在多次訓(xùn)練循環(huán)后,生成器和判別器之間的對抗訓(xùn)練可以達(dá)到一個納什均衡狀態(tài)。這樣生成器就可以生成與真實樣本相近且判別器判斷不出真假的樣本。

      本文所使用的黑白電影上色任務(wù)的GAN 網(wǎng)絡(luò)的模型架構(gòu)如圖1所示。將黑白圖片輸入到色彩生成網(wǎng)絡(luò)中。色彩生成網(wǎng)絡(luò)主要由卷積神經(jīng)網(wǎng)絡(luò)(convolutional Neural network)構(gòu)成。通過共享參數(shù)的卷積核在訓(xùn)練網(wǎng)絡(luò)中不斷地移動,提取特征信息,得到輸入數(shù)據(jù)的高級特征。同時,為了提高網(wǎng)絡(luò)的特征提取能力,使用殘差網(wǎng)絡(luò) (Residual Network)加深神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)層數(shù)。最終通過模型中的色彩生成網(wǎng)絡(luò)可以生成針對黑白輸入圖片的彩色圖片。判別網(wǎng)絡(luò)則同時接受生成的彩色圖片和真實圖片彩色部分作為輸入,經(jīng)過判別處理產(chǎn)生真或者假的結(jié)果。判別網(wǎng)絡(luò)主要由反卷積層和全連接層組成。整個模型通過色彩生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)不斷地進(jìn)行博弈,最終使得生成器網(wǎng)絡(luò)可以得到與真實圖片相近的結(jié)果,判別器網(wǎng)絡(luò)的判別能力也更加強(qiáng)大。

      圖1 對抗式生成網(wǎng)絡(luò)模型架構(gòu)

      傳統(tǒng)的GAN 網(wǎng)絡(luò)的損失函數(shù)無法適應(yīng)黑白電影上色的任務(wù)。傳統(tǒng)損失函數(shù)針對每個像素向量的類預(yù)測進(jìn)行評估。這種損失函數(shù)的設(shè)定在圖像的語義分割等任務(wù)中有較好的表現(xiàn),但是不適用于黑白影片上色的任務(wù)。將目標(biāo)聚焦于單一的像素點,有可能會損失圖片原本的結(jié)構(gòu)信息、語義信息等內(nèi)容。最終反映在上色結(jié)果中,可能會出現(xiàn)邊界不清、異常色塊等問題。除此之外,僅僅考慮像素點的上色,將上好顏色的彩色圖片連成影片之后,可能會出現(xiàn)相鄰幀顏色跳變的情況。

      本文使用感知損失函數(shù) (Perceptual Loss)進(jìn)行網(wǎng)絡(luò)的訓(xùn)練。該函數(shù)用于比較看起來相似的兩個不同的圖像,但是圖像結(jié)構(gòu)相似。例如,一部影片中相鄰的兩幀,看起來十分相似,但實際上像素發(fā)生了偏移。在這種情況下,雖然圖像非常相似,使用MSE 損失函數(shù)可能會輸出一個較大的誤差值。而Perceptual損失函數(shù)比較圖像之間的高級感知和語義差異,能夠獲得更好的上色效果。

      3.2 上色過程中的人工指導(dǎo)

      通過機(jī)器學(xué)習(xí)的算法進(jìn)行自動上色有其局限性。上色模型只能夠根據(jù)訓(xùn)練數(shù)據(jù)中的顏色進(jìn)行上色。而真實的影片中,場景多且復(fù)雜,機(jī)器難以學(xué)習(xí)到全部細(xì)節(jié)。另一方面,機(jī)器上色具有盲目性,在缺乏人工干預(yù)、指導(dǎo)的情況下,機(jī)器無法判定所上顏色的正確性。例如,軍裝的顏色是否符合史實、風(fēng)景色彩是否符合季節(jié)等。這類機(jī)器無法判定的情況需要進(jìn)行人工指導(dǎo),為機(jī)器學(xué)習(xí)模型指明訓(xùn)練方向,同時判定其上色結(jié)果的正確與否。

      由于黑白電影分布在各個年代,其服裝樣式、建筑風(fēng)格、歷史環(huán)境都有巨大的變化。而且,影片中往往會包含多種截然不同的場景。為了應(yīng)對這種情況,本研究收集大量的描寫不同場景的圖片,例如自然風(fēng)景、建筑、街道、市內(nèi)場景等。同時,對于某些特殊的歷史場景圖片,本研究采取拍攝的方式,對某些特殊物件如燃?xì)鉄?、特殊軍裝進(jìn)行拍攝取樣。為了避免取樣影本過于相似,拍攝時還要采取不同的拍攝位置、角度、明暗環(huán)境進(jìn)行拍攝取樣。圖2-圖7展示了部分訓(xùn)練數(shù)據(jù)劃分的樣例,根據(jù)場景不同,大致分為了自然風(fēng)景、建筑、室內(nèi)場景等。根據(jù)人物服飾的不同,分為了軍裝和西服。在實際的上色過程中,訓(xùn)練數(shù)據(jù)集還會進(jìn)行更為細(xì)致的劃分。例如,針對軍裝的數(shù)據(jù)集,還會進(jìn)行根據(jù)年代、國家等因素進(jìn)行劃分。大規(guī)模的,多樣化的影片數(shù)據(jù)集可以有效增強(qiáng)深度學(xué)習(xí)的泛化能力,提升上色的效果。

      圖2 模型訓(xùn)練數(shù)據(jù)集劃分樣例:自然風(fēng)景

      圖3 模型訓(xùn)練數(shù)據(jù)集劃分樣例:建筑

      圖4 模型訓(xùn)練數(shù)據(jù)集劃分樣例:室內(nèi)場景

      圖5 模型訓(xùn)練數(shù)據(jù)集劃分樣例:軍裝

      圖6 模型訓(xùn)練數(shù)據(jù)集劃分樣例:西服

      圖7 模型訓(xùn)練數(shù)據(jù)集劃分樣例:特殊道具

      4 實驗與結(jié)果

      在本文的實驗訓(xùn)練過程中,選取100648張分類在歷史不同時期的圖片分別進(jìn)行上色訓(xùn)練。輸入圖像通道為Lab顏色空間的黑白通道(L通道),輸出為具有顏色的圖片通道 (ab通道),初始學(xué)習(xí)速率為0.0001,最大學(xué)習(xí)速率為0.00015。選用批次規(guī)模為40的隨機(jī)梯度下降(SGD)模型優(yōu)化器。經(jīng)過大規(guī)模的數(shù)據(jù)集訓(xùn)練,能夠訓(xùn)練出分別對應(yīng)不同服裝、不同風(fēng)格的圖像上色模型。在經(jīng)過修改損失函數(shù)后,本研究的上色圖像在數(shù)據(jù)集上的上色質(zhì)量更高,人物邊界會更加清晰,顏色更加豐富、飽滿。上色圖像中的色塊更少,上色結(jié)果更加合理。

      本文所提出的人工指導(dǎo)和機(jī)器學(xué)習(xí)相結(jié)合的黑白影像上色方法主要有兩個優(yōu)點:一是能夠?qū)诎子捌M(jìn)行正確上色,符合史實的要求;二是顏色更加均衡、穩(wěn)定。

      圖8對比了本文所使用的方法與傳統(tǒng)未加人工指導(dǎo)的機(jī)器學(xué)習(xí)方法的上色結(jié)果對比。第一排為黑白原始影片截圖,第二排為未加入人工指導(dǎo)的上色結(jié)果,第三排為本文提出的方法的上色結(jié)果??梢钥闯?在未加人工指導(dǎo)的情況下,軍裝的顏色為藍(lán)色。而實際軍裝的顏色應(yīng)該為綠色。本文提出的方法,根據(jù)史實,在人工指導(dǎo)的情況下,專門建立相應(yīng)的訓(xùn)練數(shù)據(jù)集,針對軍裝的顏色進(jìn)行專項訓(xùn)練,從而能夠完成更符合史實的上色效果。

      圖8 上色正確性對比

      圖9展示了本文提出的上色方法與之前的方法在穩(wěn)定性上的對比。上色結(jié)果顏色對比后,與其他上色方案相比,在高分辨率圖像上色時,本方案更為穩(wěn)定,上色較為穩(wěn)定、均勻,沒有顏色跳動和異常色塊的問題。

      圖9 上色穩(wěn)定性對比

      5 結(jié)論

      本文提出一種結(jié)合人工指導(dǎo)和機(jī)器學(xué)習(xí)的針對黑白影像自動上色的方法。在人工的指導(dǎo)下進(jìn)行數(shù)據(jù)集的分類,引導(dǎo)機(jī)器進(jìn)行學(xué)習(xí)和訓(xùn)練,能夠極大地提升上色效果的準(zhǔn)確性?;诤诎子跋竦拿靼捣植?使用對抗生成網(wǎng)絡(luò)可以對生成的顏色進(jìn)行最大可能的預(yù)測。在具有分類合理的大量數(shù)據(jù)的訓(xùn)練下,基本可以實現(xiàn)對不同影片的顏色預(yù)測,能達(dá)到利用深度網(wǎng)絡(luò)提高黑白影像上色制作的工作效率的目的。在今后的研究中,將考慮如何優(yōu)化圖像質(zhì)量,改善影像質(zhì)量不好的問題,同時也能處理融合語義信息進(jìn)行指導(dǎo)上色,更加合理快捷地微調(diào)修改圖片上色效果。

      注釋

      ①本文中所提到的方法,中國電影資料館 (中國電影藝術(shù)研究中心)已完成應(yīng)用開發(fā)并已申請“計算機(jī)軟件著作權(quán)登記證書”,登記號:2021SR0031841。

      猜你喜歡
      機(jī)器顏色圖像
      改進(jìn)的LapSRN遙感圖像超分辨重建
      機(jī)器狗
      機(jī)器狗
      有趣的圖像詩
      未來機(jī)器城
      電影(2018年8期)2018-09-21 08:00:06
      認(rèn)識顏色
      特殊顏色的水
      和顏色捉迷藏
      兒童繪本(2015年8期)2015-05-25 17:55:54
      無敵機(jī)器蛛
      遙感圖像幾何糾正中GCP選取
      万载县| 安远县| 肃宁县| 宁国市| 纳雍县| 开远市| 舞钢市| 江城| 隆昌县| 天峻县| 苍南县| 巩留县| 开鲁县| 方山县| 什邡市| 清流县| 思南县| 霍林郭勒市| 涟源市| 贺州市| 剑阁县| 西林县| 桐柏县| 布尔津县| 邵阳县| 东乡县| 乌兰察布市| 盐城市| 都安| 越西县| 江口县| 翁牛特旗| 刚察县| 靖安县| 尼玛县| 宁德市| 高雄市| 鲁山县| 邵阳县| 治县。| 彰化市|