孫合楊, 周 越, 2, 黎思佳, 2, 李 麗, 閆靈通, 馮向前*
1. 中國科學(xué)院高能物理研究所, 北京 100049 2. 中國科學(xué)院大學(xué), 北京 100049
中國古陶瓷一直以來都被視為是實用器與藝術(shù)的完美結(jié)合, 作為中國古代燦爛文化的載體, 具有極高的藝術(shù)價值和經(jīng)濟價值。 不僅在中國歷朝歷代受到追捧, 經(jīng)由絲綢之路和海上絲綢之路被銷往海外各國后, 更是享譽全世界。 貿(mào)易的繁榮使得中國各窯廠生產(chǎn)的陶瓷在全世界范圍內(nèi)流通。 縱觀中國古陶瓷史, 各個窯場并不是孤立存在, 他們彼此之間或多或少會在燒制工藝以及產(chǎn)品風(fēng)格類型上互相影響, 從古至今出于各種目的對于一些典型名窯的模仿更是從未停止過。 這些原因使得對流傳至今的古陶瓷溯源、 斷代極為困難。 在中國古陶瓷研究飛速發(fā)展的這幾十年間, 除了燒制工藝[1]、 呈色機理[2-4]以及微觀結(jié)構(gòu)[5-7]等方面的研究外, 不同窯口產(chǎn)品對比、 同一窯口不同年代產(chǎn)品特征對比等產(chǎn)地溯源和年代甄別方面的研究一直都是重點[8-9]。 由于古代窯場在制瓷時大多就地取材, 不同地域窯場所獲取當(dāng)?shù)卦现懈鞣N元素的所占比例存在差異, 制瓷工藝的不同尤其是對于原料的處理不同也會造成陶瓷原料中元素含量的差異, 這些最終體現(xiàn)在燒制完成的古陶瓷中各種元素的含量不同, 基于此元素分析被廣泛應(yīng)用于不同窯口古陶瓷的甄別中。 在幾種能元素定量分析的方法中, X射線熒光(XRF)由于其快速無損的特點被廣泛應(yīng)用于古陶瓷的產(chǎn)地窯口甄別中。 此外古陶瓷微觀特征對于分類是否能夠在溯源分類中起到作用一直以來也是人們關(guān)注的問題。 近年來光譜技術(shù)的發(fā)展使得紫外-可見-近紅外光譜技術(shù)也開始逐漸應(yīng)用于陶瓷分析中, 尤其是釉中不同價態(tài)金屬元素對各個波段光的吸收研究, 而將其應(yīng)用于古陶瓷甄別的相關(guān)研究也有進展[10]。 各種機器學(xué)習(xí)方法的成熟, 也使得處理大量數(shù)據(jù)、 提取不同特征、 準(zhǔn)確分類成為可能[11]。 目前關(guān)于古陶瓷窯口甄別的研究多為通過改進算法來提高準(zhǔn)確率。 本文以四個窯所生產(chǎn)的青釉瓷為研究對象, 將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于古陶瓷窯口甄別, 探索將古陶瓷紫外-可見-近紅外光譜、 數(shù)碼顯微鏡等可無損獲取的古陶瓷特征應(yīng)用于古陶瓷甄別的可行性, 并將其與XRF測得的成分?jǐn)?shù)據(jù)融合, 建立多特征古陶瓷甄別模型, 來提高準(zhǔn)確率。
選取來自耀州窯、 龍泉楓洞巖窯、 寺龍口窯、 后司岙窯四個窯址所出土的106個古陶瓷樣品(典型代表樣品如圖1, 樣品信息如表1), 其中寺龍口窯、 后司岙窯同屬越窯直線距離約3 km。 樣品化學(xué)成分在美國EDAX 所生產(chǎn)的Eagle Ⅲ型能量色散X射線熒光(EDXRF)光譜儀上完成測量, 共采集光譜106條, 典型光譜圖如圖2(a)。 所有樣品的測量均在相同的實驗條件下進行, 電壓為40 kV, 電流為100 mA, 初級X射線束斑為1 mm。 所有古陶瓷樣品的紫外-可見-近紅外光譜數(shù)據(jù)均在Agilent Cary5000分光光度計上完成測量, 測量波長范圍是200~2 500 nm, 間隔為1 nm, 掃描速度為600 nm·min-1, 共采集光譜126條。 采用Dino-lite AM4113便攜式數(shù)碼顯微鏡以約215倍的放大倍數(shù)對古陶瓷微觀氣泡特征進行圖像采集, 每個樣品不同位置采集4張圖像, 來自龍泉楓洞巖窯典型代表樣品釉中氣泡的微觀圖像如圖2(b)。
表1 樣品信息表
圖1 越窯后司岙(a)、 龍泉楓洞巖窯(b)、 耀州窯(c)以及越窯寺龍口窯(d)典型代表樣品
圖2 典型樣品的XRF光譜圖和氣泡特征圖
由于古陶瓷釉屬于玻璃基質(zhì), 而玻璃在紫外-可見-近紅外光譜曲線中的紫外波段吸收強烈, 信號受到的干擾因素多, 因此如圖3(a)所示曲線平滑性差, 存在劇烈跳變, 噪聲多等現(xiàn)象。 根據(jù)紫外波段光譜特點采用臨近點比較法設(shè)置合理閾值對劇烈跳變點進行處理, 并結(jié)合臨近點比較法設(shè)置寬度為15的窗口對紫外波段進行平滑以降低噪聲提高信噪比, 并采用標(biāo)準(zhǔn)正態(tài)變換(SNV)來進一步消除由光程變化以及表面散射等因素帶來的影響, 處理后的光譜如圖3(b)所示, 噪聲得到明顯抑制, 將處理后的光譜數(shù)據(jù)作為模型訓(xùn)練的變量。
圖3 典型樣品紫外可見近紅外光譜圖
對于X射線熒光光譜而言, 光譜中各元素特征峰的凈峰面積與含量存在明確的對應(yīng)關(guān)系, 以實驗室研制的古陶瓷標(biāo)準(zhǔn)樣為參考, 對儀器進行古陶瓷成分分析精準(zhǔn)定量的標(biāo)定, 并以此為基礎(chǔ)解出古陶瓷中各種成分(Al2O3, SiO2, P2O5, K2O, CaO, TiO2, MnO, Fe2O3, Rb2O, SrO)的含量作為輸入模型的變量。 對數(shù)碼顯微鏡采集的古陶瓷微觀圖像中氣泡的尺寸進行測量, 由于采集圖像的放大倍數(shù)有所差別(主要集中于210~220倍), 圖像所代表的實際面積并不相同, 對小氣泡(半徑小于0.1 mm)數(shù)量影響較大因此將不同尺寸區(qū)間(如0.05~0.06 mm)氣泡數(shù)占總氣泡數(shù)量的百分比作為特征, 而大氣泡(半徑大于0.1 mm)數(shù)量受放大倍數(shù)影響小, 因此將其在不同尺寸區(qū)間(如0.1~0.125 mm)內(nèi)的數(shù)量作為特征進行模型訓(xùn)練。
建模方法采用的是卷積神經(jīng)網(wǎng)絡(luò)(CNN), CNN是一種帶有卷積計算的深度神經(jīng)網(wǎng)絡(luò), 通過局部感受野、 權(quán)值共享、 池化層等來減少網(wǎng)絡(luò)的參數(shù)個數(shù), 緩解模型的過擬合問題。 將樣品數(shù)據(jù)按照7∶3的比例劃分為訓(xùn)練集和驗證集對模型結(jié)構(gòu)和參數(shù)進行優(yōu)化, 對不同單一特征以及多特征模型進行了30次不同隨機訓(xùn)練集和驗證集劃分的模型訓(xùn)練, 最后以五折交叉驗證法對模型預(yù)測具體類別的效果進行評估, 其中模型的搭建、 訓(xùn)練與評估都是基于Python 3.7實現(xiàn)的。
以氣泡特征為基礎(chǔ)的卷積神經(jīng)網(wǎng)絡(luò)模型30次訓(xùn)練結(jié)果如表2, 訓(xùn)練集平均精準(zhǔn)度為75.0%, 驗證集平均精準(zhǔn)度為70.4%, 圖4(a)是其中一次的訓(xùn)練結(jié)果, 訓(xùn)練集與驗證集均收斂, 這說明古陶瓷微觀氣泡尺寸分布特征是一個有效的分類特征, 但是有效性不強。 五折交叉驗證的混淆矩陣如圖5(a)所示對于鄰近窯址的寺龍口和后司岙樣品錯分比例較高。
表2 卷積神經(jīng)網(wǎng)絡(luò)30次訓(xùn)練準(zhǔn)確率
圖4 古陶瓷單一特征模型
圖5 古陶瓷單一特征模型混淆矩陣
基于紫外-可見-近紅外光譜數(shù)據(jù)的CNN模型30次訓(xùn)練平均準(zhǔn)確率為89.2%驗證集平均準(zhǔn)確率為82.5%, 其中一次的訓(xùn)練結(jié)果如圖4(b)所示, 與氣泡特征相比紫外-可見-近紅外光譜特征對分類準(zhǔn)確率更高, 五折交叉驗證的結(jié)果[圖5(b)]也表明模型對于不同窯的分類準(zhǔn)確率都有提升, 但對于鄰近窯的后司岙和寺龍口樣品分類錯誤率也是較高。
基于古陶瓷釉成分的CNN模型30次訓(xùn)練平均準(zhǔn)確率達到了92.1%, 驗證集平均準(zhǔn)確率也達到了90.6%, 訓(xùn)練集與驗證集的分類精準(zhǔn)度相差更小。 具體一次的訓(xùn)練結(jié)果[圖4(c)]較前兩種模型收斂更迅速, 綜合來看單一化學(xué)成分特征對古陶瓷分類最為有效, 五折交叉驗證結(jié)果[圖5(c)]中對于鄰近窯樣品的分類精準(zhǔn)度有提升。
以訓(xùn)練好的氣泡特征、 光譜特征、 成分特征模型為基礎(chǔ)進行融合, 將模型對應(yīng)參數(shù)導(dǎo)入, 凍結(jié)相應(yīng)部分, 添加分類層進行再訓(xùn)練。 氣泡尺寸分布與紫外可見近紅外光譜兩種特征的模型進行融合時, 分類精準(zhǔn)度達到了93.7%, 驗證集精準(zhǔn)度也達到了91.4%, 這比精準(zhǔn)最高的單一成分特征模型效果更優(yōu)。 將氣泡、 紫外可見近紅外光譜以及成分這三種特征的模型融合時, 訓(xùn)練集與驗證集平均準(zhǔn)確率高達97.4%與94.2%, 如圖6所示由于融合模型是在原有訓(xùn)練好的模型基礎(chǔ)上再訓(xùn)練, 因此收斂迅速, 圖7多特征融合模型混淆矩陣對比單一特征模型混淆矩陣, 總體分類準(zhǔn)確率有明顯提升, 對鄰近窯址的樣品也能達到精準(zhǔn)溯源分類的水平。
圖7 多特征融合模型混淆矩陣
基于不同的古陶瓷特征建立了卷積神經(jīng)網(wǎng)絡(luò)分類模型, 結(jié)果表明: (1)古陶瓷氣泡尺寸分布特征、 紫外可見近紅外光譜特征、 成分特征均是有效特征, 但是基于不同特征的模型分類準(zhǔn)確率方面: 成分特征>紫外可見近紅外光譜特征>氣泡尺寸分布特征; (2)多種有效特征融合能有效提升分類精度, 分類特征越多準(zhǔn)確率越高。 綜合來看, 探索和量化更多的古陶瓷特征結(jié)合卷積神經(jīng)網(wǎng)絡(luò)建立分類模型對于實現(xiàn)古陶瓷精準(zhǔn)溯源是可行的, 尤其是對于同一地區(qū)近鄰窯址樣品的區(qū)分, 這對沉船打撈或墓葬出土古陶瓷的產(chǎn)地精準(zhǔn)溯源有重要意義。