尹琴麗,王 笑,耿 丹,李丹彤
(建設(shè)綜合勘察研究設(shè)計(jì)院有限公司,北京 100007)
隨著時(shí)間的流逝,古書(shū)畫(huà)由于環(huán)境氣候改變、人為損壞等因素的影響會(huì)出現(xiàn)發(fā)霉、污損、破損、褪色等情況。為了更好地留存和展示古書(shū)畫(huà)作品的價(jià)值,往往需要對(duì)其進(jìn)行顏色修復(fù)和復(fù)制,濃墨重彩的中國(guó)畫(huà)在繪制過(guò)程中往往是幾種礦物顏料混合調(diào)配使用,因而混合顏料種類(lèi)分析一直是文物保護(hù)和修復(fù)中的重要環(huán)節(jié)。
目前有很多技術(shù)手段可用于古書(shū)畫(huà)顏料類(lèi)別的鑒定,如激光拉曼光譜[1-2]、X射線熒光[3],但因受儀器試樣尺寸大小、樣品表面平整度等因素的限制,加上一定量的取樣分析,使得古書(shū)畫(huà)顏料分析面臨嚴(yán)峻的挑戰(zhàn)。光譜分析技術(shù)由于具有快速、無(wú)損等特點(diǎn),被廣泛應(yīng)用在古書(shū)畫(huà)顏料分析中。
王麗琴等[4]利用光導(dǎo)纖維反射光譜法對(duì)彩繪文物中的表面顏料進(jìn)行了研究,總結(jié)了常見(jiàn)的純凈顏料的反射光譜特性,并將其一階導(dǎo)數(shù)峰作為鑒定顏料種類(lèi)的依據(jù)。補(bǔ)雅晶等[5]通過(guò)光譜輻射度計(jì)采集敦煌壁畫(huà)的光譜,然后與敦煌典型色彩光譜樣本集中的顏料進(jìn)行相似度判別,識(shí)別壁畫(huà)顏料信息。武望婷等[6]通過(guò)將采集的古畫(huà)顏料波譜曲線與標(biāo)準(zhǔn)波譜庫(kù)進(jìn)行匹配,結(jié)合拉曼、熒光等測(cè)試結(jié)果,分析得出紅色、黑色、黃色和藍(lán)色的主要成分分別是朱砂、炭黑、雄黃以及群青。武鋒強(qiáng)等[7]利用拉曼與高光譜特征擬合方法識(shí)別古畫(huà)顏料成分,結(jié)果表明受混合像元的影響,顏料的光譜曲線與標(biāo)準(zhǔn)曲線相差甚大,直接與標(biāo)準(zhǔn)波譜庫(kù)(USGS)相匹配,識(shí)別精度較低。
事實(shí)上,混合顏料的鑒定比單一顏料的鑒定更為復(fù)雜,考慮到實(shí)際繪畫(huà)過(guò)程中多種顏料混合使用的情況[8],若將采集的顏料光譜視為純凈顏料直接與光譜庫(kù)中的光譜進(jìn)行匹配,而沒(méi)有考慮混合顏料對(duì)光譜的影響,則難以實(shí)現(xiàn)準(zhǔn)確的顏料識(shí)別效果。
本文將混合光譜看作是多源混合信號(hào),把混合光譜中端元提取的問(wèn)題轉(zhuǎn)換成統(tǒng)計(jì)信號(hào)的分離問(wèn)題,從而提出了一種基于NMF的混合顏料光譜分析算法。該算法在端元光譜未知的情況下,首先使用NMF對(duì)混合顏料光譜直接進(jìn)行分離,得到構(gòu)成混合顏料光譜的端元光譜,然后將分離得到的端元光譜與顏料光譜庫(kù)進(jìn)行對(duì)比分析,最終確定混合顏料的組成成分。該算法在模擬仿真數(shù)據(jù)和實(shí)測(cè)混合顏料樣本數(shù)據(jù)中進(jìn)行了驗(yàn)證,實(shí)驗(yàn)結(jié)果表明:該算法能夠?qū)旌项伭瞎庾V的組成成分進(jìn)行準(zhǔn)確的分析。
礦物之間的混合可分為線性混合和非線性混合,區(qū)分這兩種作用類(lèi)型的標(biāo)準(zhǔn)就在于入射光子與礦物間是否發(fā)生多次折射或反射等情況[9]。若礦物之間混合非常緊密,可認(rèn)為是非線性混合,其他則可以視為是線性混合。王潤(rùn)生等[10]通過(guò)研究不同礦物組合對(duì)應(yīng)的混合光譜特征結(jié)果表明,混合礦物的光譜反射率近似為混合單礦物光譜反射率的線性混合。古書(shū)畫(huà)中使用的礦物顏料本質(zhì)上是礦物,遵循礦物混合的規(guī)律。因此在對(duì)混合顏料光譜數(shù)據(jù)進(jìn)行分析時(shí),可以將其視為線性混合模型來(lái)處理。線性混合模型可表示為:
式中:X∈R^(l×n)表示混合顏料光譜矩陣;A∈R^(l×m)表示端元光譜矩陣;S∈R^(m×n)為端元光譜的豐度矩陣。l,m,n分別表示光譜波段數(shù),組成混合顏料光譜的端元個(gè)數(shù),混合顏料光譜的采集數(shù)量。Q∈R^(l×n)為誤差矩陣。根據(jù)光譜數(shù)據(jù)的實(shí)際物理意義,端元光譜矩陣需要滿(mǎn)足非負(fù)性的約束條件(a_ij≥0,a_ij∈A),豐度矩陣則需要同時(shí)滿(mǎn)足非負(fù)性以及和為1 的約束條件(s_ij≥0,∑_(i=1)^m〖s_ij=1〗,s_ij∈S)。
NMF是在矩陣中所有元素均為非負(fù)數(shù)的約束條件之下的矩陣分解方法,能夠?qū)⒁粋€(gè)非負(fù)矩陣兩個(gè)低秩非負(fù)矩陣相乘的形式。NMF的數(shù)學(xué)模型為:已知V為一個(gè)非負(fù)矩陣,尋找兩個(gè)非負(fù)矩陣W和H,使其滿(mǎn)足
式中:V∈R^(l×n);W∈R^(l×m);H∈R^(m×n);E∈R^(l×n)。矩陣V可以看作是一個(gè)由采集到的樣本列向量組成的觀測(cè)數(shù)據(jù)集合,矩陣W由構(gòu)成樣本列向量的基向量組成,矩陣H表示每個(gè)基向量在樣本列向量所占的權(quán)重系數(shù),E為誤差矩陣。
若不考慮誤差的情況下,NMF的數(shù)學(xué)模型可簡(jiǎn)化為:
在已知矩陣V需要求解矩陣W和H時(shí),可以將其視為一個(gè)優(yōu)化問(wèn)題,通過(guò)定義目標(biāo)函數(shù)和選擇合適的優(yōu)化方法來(lái)求解矩陣W和H。常用目標(biāo)函數(shù)為最小化歐式距離:
對(duì)目標(biāo)函數(shù)使用梯度下降法進(jìn)行迭代求解,使目標(biāo)函數(shù)最小化,就可求得矩陣W和H。
混合顏料光譜的線性混合模型與NMF的數(shù)學(xué)模型一致,從而可以將NMF應(yīng)用于混合光譜數(shù)據(jù)分離。純凈顏料的光譜就是一組基向量,使用NMF求解出這組基向量,就可以得到了構(gòu)成混合光譜的端元光譜。
為了驗(yàn)證基于NMF的混合顏料光譜分析算法的有效性,算法會(huì)在模擬仿真數(shù)據(jù)和實(shí)測(cè)混合顏料樣本數(shù)據(jù)中進(jìn)行驗(yàn)證。實(shí)驗(yàn)首先將利用NMF算法對(duì)混合光譜進(jìn)行分離,得到分離出來(lái)的分量光譜,通過(guò)計(jì)算分量光譜與標(biāo)準(zhǔn)波譜庫(kù)中光譜的相似性來(lái)確定顏料的種類(lèi)。光譜相似性評(píng)價(jià)的指標(biāo)有相關(guān)系數(shù)、均方根誤差等,其中相關(guān)系數(shù)為:
均方根誤差為:
式中:A和B為進(jìn)行相似性比較的光譜;n為波段數(shù)。相關(guān)系數(shù)越大,代表兩條光譜之間相似度越高;均方根誤差越小,表示兩條光譜之間的距離越接近,偏離越小,相似度越高。
為研究不同濃度的差異對(duì)分離結(jié)果的影響,采用美國(guó)地質(zhì)勘探局礦物波譜庫(kù)中的朱砂和石青為端元光譜進(jìn)行模擬實(shí)驗(yàn)(圖1)。按照端元豐度非負(fù)和端元豐度之和為1的約束條件,模擬生成5條豐度不同的混合光譜(圖2)。
模擬混合光譜經(jīng)過(guò)算法分離后進(jìn)行光譜歸一化的結(jié)果表明,不同豐度的光譜確實(shí)能夠引起分離出的端元光譜的變化,主要表現(xiàn)在隨著豐度的不斷變化,分離出來(lái)的光譜在波譜的吸收深度、吸收峰面積等參數(shù)上有不同之處,經(jīng)過(guò)歸一化處理后差異較小,從整體的波形來(lái)看走向幾乎一致,具有良好的穩(wěn)定性(圖3)。
判斷分離質(zhì)量的優(yōu)劣,穩(wěn)定性是一個(gè)重要的指標(biāo),其次還需要衡量分離出來(lái)的分量與端元光譜之間的相似程度。以75%朱砂、25%石青和25%朱砂、75%石青的混合光譜為例,計(jì)算了分離出來(lái)的分量與端元光譜之間的相關(guān)系數(shù)(圖4)。
從圖4的結(jié)果來(lái)看,分離出來(lái)的分量與端元光譜的相似性較高,其中分量NMF2與石青相關(guān)系數(shù)高達(dá)0.999,朱砂與分量NMF1的相關(guān)系數(shù)也達(dá)到了0.971。從模擬數(shù)據(jù)的分離結(jié)果來(lái)看,在不考慮誤差的情況下,NMF算法的穩(wěn)定性好,重復(fù)性高,分離出來(lái)的分量的精度也相對(duì)較高,能夠適用于混合光譜分離的需要。
為了研究非負(fù)矩陣分解算法在實(shí)際礦物顏料混合光譜分離的效果,進(jìn)一步驗(yàn)證算法的有效性、實(shí)用性,制作了石青與石黃的混合顏料樣本,將其按照一定的比例相混合,得到5條豐度不同的混合光譜(表1)。
表1 混合顏料豐度值
將礦物顏料石青和石黃粉末,通過(guò)缽體研磨過(guò)篩之后,利用千分位0.001 g精密分析電子天平進(jìn)行精準(zhǔn)稱(chēng)量。然后將所稱(chēng)量的顏料加入等量的膠液繪制于4 cm×4 cm宣紙上,模擬實(shí)際繪畫(huà)環(huán)境。采集光譜數(shù)據(jù)所用的儀器是地物波譜儀(ASD),光譜范圍為350 ~ 2 500 nm,光譜分辨率可在350 ~ 1 000 nm波段之間為3 nm,在1 000~2 500 nm波段之間為8 nm(圖5、圖6)。
以制備的5種豐度不同混合顏料光譜的實(shí)測(cè)數(shù)據(jù)作為原始輸入光譜數(shù)據(jù),圖7給出了石青與石黃的混合顏料光譜經(jīng)過(guò)NMF算法分離出來(lái)的結(jié)果。為了更客觀地評(píng)價(jià)該算法的分離效果,分別計(jì)算了分離出來(lái)的分量1和分量2與實(shí)測(cè)端元光譜的相關(guān)系數(shù)和均方根誤差(表2)。
表2 NMF算法分離效果評(píng)價(jià)結(jié)果
從匹配結(jié)果來(lái)看(圖7),實(shí)測(cè)的混合顏料光譜的分離出來(lái)的分量光譜與端元光譜相似度較高,光譜形狀基本一致,相關(guān)系數(shù)均較高,而且從分離出來(lái)的分量的精度、重現(xiàn)性以及穩(wěn)定性來(lái)看,NMF算法較好實(shí)現(xiàn)了混合光譜的分離,分離的結(jié)果能夠滿(mǎn)足顏料識(shí)別的要求。
混合顏料分離是混合顏料分析的基礎(chǔ),本文通過(guò)采集混合顏料的光譜,利用非負(fù)矩陣分解算法對(duì)光譜進(jìn)行分離,將分離得到的結(jié)果作為構(gòu)成混合顏料光譜的端元光譜,突破了端元未知對(duì)混合顏料光譜分離的限制,進(jìn)而通過(guò)分離出來(lái)的端元光譜與顏料光譜庫(kù)的光譜進(jìn)行匹配,確定顏料的種類(lèi),為古書(shū)畫(huà)混合顏料的分析提供了一種更為高效、無(wú)損的分析方法。但由于NMF算法采用的目標(biāo)函數(shù)非凸性的特點(diǎn),具有多個(gè)極值點(diǎn),計(jì)算得到的結(jié)果可能不是全局最優(yōu)解,后續(xù)將研究如何選擇更合適的初值矩陣,以獲得更好的分離效果。