董賀文,李 偉,黎世瑩,鄧愷飛,曹 楠,羅儀文,孫其然,林漢成,,黃景鋒,劉寧國,黃 平
(1.司法鑒定科學(xué)研究院 上海市法醫(yī)學(xué)重點(diǎn)實(shí)驗(yàn)室 上海市司法鑒定專業(yè)技術(shù)服務(wù)平臺(tái),上海 200063;2.鐵道警察學(xué)院公安技術(shù)系,河南 鄭州 450053;3.北京市公安局司法鑒定中心,北京 100192;4.西安交通大學(xué)醫(yī)學(xué)部法醫(yī)學(xué)院,陜西 西安 710061)
電流損傷是一種特殊形式的燒傷,是全球燒傷病人入院的第四大常見原因[1],且具有很強(qiáng)的破壞性,我國電損傷的發(fā)生率和死亡率較高[2]。目前法醫(yī)學(xué)實(shí)踐中主要根據(jù)典型的電流斑以及皮膚金屬化來認(rèn)定電流損傷[3],此外亦開展了光鏡[4-6]、計(jì)算機(jī)圖像技術(shù)[7]、組織化學(xué)方法[8]以及原子吸收光譜法[9-10]對(duì)電流損傷時(shí)皮膚及重要器官的改變進(jìn)行研究,并取得了一定的進(jìn)展,但多局限于電流引起的差異,對(duì)不同電壓的觀察較少,且缺乏特異性[11-12]。
傅里葉變換紅外顯微光譜(Fourier transform infrared-microspectroscopy,F(xiàn)TIR-MSP)成像技術(shù)是一種強(qiáng)大的生物醫(yī)學(xué)工具,被廣泛運(yùn)用于生物組織分析和疾病分子診斷中[13-15]。有法醫(yī)學(xué)者使用FTIR-MSP成像技術(shù)檢測死亡后的化學(xué)變化來推斷死亡時(shí)間[16-18]。隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)算法被引入紅外光譜數(shù)據(jù)處理領(lǐng)域,在數(shù)據(jù)分析方面發(fā)揮出獨(dú)特優(yōu)勢,目前,機(jī)器學(xué)習(xí)結(jié)合紅外光譜技術(shù)已廣泛應(yīng)用于多個(gè)領(lǐng)域[19],比較常用的方法包括主成分分析(principal component analysis,PCA)、偏最小二乘法-判別分析(partial least squares-discriminant analysis,PLS-DA)等。
本研究旨在利用FTIR-MSP成像技術(shù)研究豬不同電壓所致皮膚電流損傷的紅外光譜特征,結(jié)合機(jī)器學(xué)習(xí)算法對(duì)光譜進(jìn)行分析和建模,并使用建模波段優(yōu)選和光譜預(yù)處理的方法對(duì)模型進(jìn)行優(yōu)化,最后比較分析各方法所建模型的分類效果,以期為不同電壓所致皮膚電流損傷的鑒別提供新的思路。
本研究動(dòng)物實(shí)驗(yàn)經(jīng)司法鑒定科學(xué)研究院科學(xué)與倫理委員會(huì)批準(zhǔn)。由上海甲干生物科技有限公司提供巴馬小型豬4只,用于建立皮膚電流損傷動(dòng)物模型,所采用的電壓分別為110V、220V及380V。具體步驟:應(yīng)用3%戊巴比妥鈉麻醉后備皮,采用不同電壓交流電電擊豬左前肢皮膚,持續(xù)電擊30 s死后,即刻進(jìn)行取材,對(duì)照組取損傷對(duì)應(yīng)部位皮膚組織,取材大小均為10 mm×10 mm。皮膚組織經(jīng)磷酸鹽緩沖液漂洗后即放入液氮中冷凍保存。
利用低溫恒冷凍切片機(jī)(美國Thermo Fisher Scientific公司)對(duì)上述皮膚組織進(jìn)行連續(xù)切片,厚6 μm,一張行常規(guī)HE染色,一張平鋪至特制的氟化鋇載玻片行FTIR-MSP成像檢測。應(yīng)用Nicolet 6700傅里葉變換紅外光譜儀(美國Thermo Fisher Scientific公司)結(jié)合NicoletTMContinuμmTM顯微紅外光譜儀(美國Thermo Fisher Scientific公司)對(duì)皮膚組織切片上10mm×10mm范圍內(nèi)的區(qū)域進(jìn)行光譜數(shù)據(jù)采集。該儀器配有液氮冷卻的汞-鎘-碲化物半導(dǎo)體檢測器,其數(shù)據(jù)采集空間分辨率最小可達(dá)到50μm×50μm,設(shè)置光譜掃描范圍為4000~1000cm-1,分辨率為8cm-1。比對(duì)連續(xù)切片HE染色結(jié)果,隨機(jī)采集電擊組及對(duì)照組皮膚組織的光譜數(shù)據(jù)并確保采集數(shù)據(jù)的重復(fù)性和均一性。110V、220V、380V電擊組及對(duì)照組均采集25張紅外光譜圖像,以4∶1的比例將獲得的光譜數(shù)據(jù)隨機(jī)分成訓(xùn)練集和驗(yàn)證集。
運(yùn)用Omnic 8.2軟件(美國Thermo Fisher Scientific公司)、The Unscrambler? X 10.4軟件(挪威CAMO公司)對(duì)各組原始光譜數(shù)據(jù)進(jìn)行預(yù)處理,包括光譜頻率范圍截取、正交信號(hào)校正(orthogonal signal correction,OSC)、標(biāo)準(zhǔn)正態(tài)變量(standard normal variate,SNV)、多元散射校正(multiplicative scatter correction,MSC)、歸一化(normalization)及平滑(smoothing)等。
對(duì)原始光譜數(shù)據(jù)進(jìn)行非監(jiān)督型PCA模式分析,觀察各組間光譜變量的差異性。其次運(yùn)用監(jiān)督型PLS-DA模式分析,根據(jù)決定系數(shù)R2及均方根誤差(root mean square error,RMSE)評(píng)估模型的穩(wěn)定性及預(yù)測能力。上述分析過程均由The Unscrambler?X 10.4軟件實(shí)現(xiàn)。采用Hotelling’sT2檢驗(yàn)、F檢驗(yàn)及殘差分析對(duì)離群樣本進(jìn)行剔除。
如圖1所示,與對(duì)照組皮膚組織相比,電擊組所致的皮膚電流損傷均表現(xiàn)出典型的電流斑組織形態(tài)學(xué)改變,即表皮、真皮局部分離,表皮層細(xì)胞核拉長,呈柵欄、釘突狀排列,真皮層膠原纖維凝固性壞死,皮膚附件亦呈極化改變。
如圖2所示,對(duì)照組及電擊各組均表現(xiàn)出相似的紅外光譜譜圖特征,譜圖中不同峰位的吸收峰反映了對(duì)應(yīng)官能團(tuán)的振動(dòng)模式。本研究將紅外光譜譜圖分為四個(gè)分波段(4 000~3 600 cm-1、3 600~2 800 cm-1、2 800~1 800 cm-1、1 800~1 000 cm-1)及 1 個(gè)全波段(4000~1000cm-1)進(jìn)行研究。
本研究以散點(diǎn)聚類圖的形式對(duì)PCA結(jié)果進(jìn)行呈現(xiàn),即每個(gè)樣本以散點(diǎn)的形式投射在不同主成分二維空間內(nèi),通過觀察各組在該空間的聚類情況,從而對(duì)光譜差異性進(jìn)行評(píng)估。
如圖3所示,主成分(principal component,PC)1和2能夠解釋對(duì)照組和電擊組98%的光譜差異性(PC1:95%;PC2:3%)。在對(duì)照組與電擊組形成的二維空間上,對(duì)照組與電擊組聚類散點(diǎn)沿PC1坐標(biāo)軸得到了顯著區(qū)分。
如圖4所示,PC1和PC2解釋了電擊各組90%的光譜差異性(PC1:79%;PC2:11%)。盡管電擊各組的聚類散點(diǎn)在大體上可以區(qū)分,但是彼此之間存在相互重疊,且聚類散點(diǎn)過于松散。
圖1 對(duì)照組和電擊各組的組織病理學(xué)改變(HE×10)
圖2 對(duì)照組和電擊各組的紅外光譜圖
圖3 對(duì)照組和電擊組原始光譜全波段PCA得分圖
圖4 電擊各組原始光譜全波段PCA得分圖
本研究進(jìn)一步采用PLS-DA這一經(jīng)典的監(jiān)督型數(shù)學(xué)模型對(duì)不同電壓電擊組進(jìn)行區(qū)分。表1顯示了不同波段原始光譜數(shù)據(jù)的PLS-DA建模結(jié)果。與其他波段比較,1800~1000cm-1波段建立的PLS-DA模型在校正和驗(yàn)證過程中具有較高的R2值及較低的RMSE值,該模型的校正和驗(yàn)證散點(diǎn)聚類圖亦直觀地表現(xiàn)了電擊各組聚類在二維空間內(nèi)的分布,相對(duì)而言,110V電擊組的散點(diǎn)較為分散(圖5)。
表1 電擊各組不同波段的原始光譜PLS-DA結(jié)果
圖5 電擊各組原始光譜1800~1000cm-1波段PLS-DA得分圖和模型驗(yàn)證圖
本研究對(duì)不同波段原始光譜數(shù)據(jù)進(jìn)行不同方法的預(yù)處理,從而實(shí)現(xiàn)對(duì)PLS-DA模型的優(yōu)化,以期改善電擊各組個(gè)體間的差異。如表2所示,與其他預(yù)處理及波段比較,1800~1000cm-1及3600~2800cm-1波段經(jīng)OSC預(yù)處理后具有較高的R2值及較低的RMSE值,但1800~1000cm-1波段模型的訓(xùn)練集數(shù)據(jù)離群值較多。3 600~2 800 cm-1波段模型的校正及驗(yàn)證散點(diǎn)聚類得分圖顯示了電擊各組數(shù)據(jù)沿變量1自左向右均勻排列(圖6)。
表2 電擊各組原始光譜不同波段經(jīng)不同預(yù)處理后PLS-DA結(jié)果
圖6 電擊各組原始光譜3600~2800cm-1波段經(jīng)OSC預(yù)處理后的PLS-DA得分圖和模型驗(yàn)證圖
本研究結(jié)果顯示,電流損傷后的皮膚組織具有顯著的組織病理學(xué)改變,能夠通過常規(guī)顯微鏡檢查進(jìn)行診斷,但難以進(jìn)一步明確電流損傷的性質(zhì),即何種電壓觸電所致。眾所周知,分子水平上的改變往往相較于組織形態(tài)學(xué)改變更為敏感,通常在形態(tài)學(xué)未發(fā)生明顯變化時(shí),即可出現(xiàn)顯著的分子差異性。鑒于此,本研究應(yīng)用FTIR-MSP成像技術(shù)對(duì)未經(jīng)染色的皮膚組織切片進(jìn)行無損性生物化學(xué)分析,以期能夠在分子水平上對(duì)皮膚電流斑進(jìn)行診斷并進(jìn)一步區(qū)分不同電壓所致的皮膚電流損傷。通過對(duì)紅外光譜譜圖的觀察,發(fā)現(xiàn)電擊各組及對(duì)照組均表現(xiàn)出較為一致的光譜吸收峰模式,難以通過單純識(shí)別某一特征性吸收峰的變化對(duì)電擊各組進(jìn)行鑒別。因此,為了獲取更多且更為敏感的光譜差異性信息,本研究將機(jī)器學(xué)習(xí)算法引入光譜數(shù)據(jù)的分析研究中。將紅外光譜譜圖按照上述結(jié)果進(jìn)行分段,其中,3 600~2 800 cm-1的吸收峰主要由脂質(zhì)?;溂谆皝喖谆倌軋F(tuán)振動(dòng)引起;1800~1000cm-1的吸收峰主要由蛋白質(zhì)、糖類、核酸及磷酸等分子物質(zhì)振動(dòng)引起;4000~3600cm-1、2800~1800cm-1的吸收峰大多為光學(xué)噪聲、CO2、空氣和水蒸氣等因素的干擾。
本研究對(duì)全波段原始光譜數(shù)據(jù)進(jìn)行了PCA分析,該方法屬于一種非監(jiān)督型機(jī)器學(xué)習(xí)模型,能夠根據(jù)數(shù)據(jù)自身結(jié)構(gòu)特點(diǎn)逐一提取差異性信息并以PC的形式進(jìn)行呈現(xiàn),從而達(dá)到區(qū)分各組的目的。本研究對(duì)照組與電擊組PCA結(jié)果顯示,PC1和PC2蘊(yùn)含了對(duì)照組及電擊組98%的光譜差異性,能夠?qū)山M的生物化學(xué)信息進(jìn)行闡釋,且得分圖也直觀地顯示了兩組有明顯的區(qū)分。該結(jié)果提示,相較于肉眼光譜圖觀察,PCA具有更為強(qiáng)大的信息捕捉能力,能夠?qū)庾V中吸收峰位、半寬寬度及吸收強(qiáng)度等諸多指標(biāo)的微小變化進(jìn)行識(shí)別、放大。更為重要的是,PCA與傳統(tǒng)組織病理學(xué)檢驗(yàn)相比,往往不依賴于操作者的個(gè)人技術(shù)經(jīng)驗(yàn),僅通過數(shù)據(jù)內(nèi)在結(jié)構(gòu)特征客觀地呈現(xiàn)結(jié)果,能夠讓使用者更為清晰地了解樣本組間的差異性,因此在技術(shù)的普及、使用便利性等方面具有明顯的優(yōu)勢。本研究PCA結(jié)果對(duì)于不同電壓電擊組的鑒別則相對(duì)不理想,主要表現(xiàn)為電擊各組聚類顯著性不足(重疊效應(yīng)較大)、組內(nèi)數(shù)據(jù)離散性較大等。其原因可能與PCA對(duì)電擊各組中個(gè)體差異性變化的限制性不足有關(guān),難以很好地降低組內(nèi)光譜的差異或是將其錯(cuò)誤地當(dāng)作組間差異進(jìn)行信息提取。
針對(duì)非監(jiān)督型機(jī)器學(xué)習(xí)模型在不同電壓電擊組間鑒別的局限性,本研究應(yīng)用PLS-DA監(jiān)督型機(jī)器學(xué)習(xí)模型對(duì)其進(jìn)行鑒別。相較于傳統(tǒng)非監(jiān)督型方法,該監(jiān)督型數(shù)學(xué)模型可根據(jù)事先獲取的分組信息,提取潛在變量(latent variable,LV),進(jìn)一步放大組間光譜差異性并縮小組內(nèi)差異性,最終獲得最佳的分類效果。本研究電擊各組不同波段原始光譜的PLS-DA建模結(jié)果顯示,1800~1000cm-1波段建立的模型具有更好的穩(wěn)定性和預(yù)測能力(校正過程R2值較高、RMSE值較低,且校正及預(yù)測過程中R2、RMSE更為接近),故認(rèn)為PLS-DA模型分析中,該波段較其他波段更為理想,從其PLS-DA得分圖也進(jìn)一步證實(shí)了這一結(jié)論,而且,相較于電擊各組PCA得分圖,電擊各組間亦得到了更為顯著的區(qū)分。盡管PLS-DA在分類效果上明顯優(yōu)于PCA,但在1800~1000cm-1波段原始光譜PLS-DA得分圖上仍然觀察到電擊各組聚類分布缺乏一定的規(guī)律性,難以通過某一具體提取變量進(jìn)行解釋,且110 V電擊組散點(diǎn)離散性較大,可能在預(yù)測該電壓的損傷時(shí)存在較大的誤差,提示其在不同電壓電擊組鑒別時(shí)存在不足。
本研究通過比較電擊各組不同波段原始光譜數(shù)據(jù)不同的預(yù)處理方法,實(shí)現(xiàn)了對(duì)上述PLS-DA模型的進(jìn)一步優(yōu)化。經(jīng)過對(duì)比,綜合分析認(rèn)為經(jīng)OSC預(yù)處理的3600~2800cm-1波段建模效果較好,具有較好的穩(wěn)定性及預(yù)測能力,能夠明顯改善上述1800~1000cm-1波段原始光譜PLS-DA存在的不足。提示經(jīng)OSC預(yù)處理后3600~2800cm-1波段數(shù)據(jù)能夠用于不同電壓電擊組的鑒別,而且該預(yù)處理方法在優(yōu)化模型效能方面具有獨(dú)特的優(yōu)勢,這是因?yàn)橄噍^于其他信號(hào)校正技術(shù),OSC可高效地對(duì)噪聲進(jìn)行濾除,提高機(jī)器學(xué)習(xí)模式識(shí)別的分類效果,并在模型擬合時(shí)提高模型的有效性[20-21]。此外,從該模型的聚類得分圖中可以看出,電擊各組沿變量1坐標(biāo)軸方向具有一定的分布規(guī)律性,提示OSC在規(guī)范數(shù)據(jù)內(nèi)在特征結(jié)構(gòu)方面亦具有一定的優(yōu)勢。同時(shí),這也為后續(xù)研究提供了一定的方向,結(jié)合相關(guān)分子生物學(xué)方法,明確變量1載荷數(shù)據(jù)點(diǎn)對(duì)應(yīng)的大分子物質(zhì)并進(jìn)行特異性篩選,最終尋找可用于法醫(yī)學(xué)實(shí)踐中鑒別不同電壓皮膚損傷的生物學(xué)指標(biāo)。
本研究運(yùn)用FTIR-MSP成像技術(shù)初步探討了豬皮膚不同電壓電流損傷的生物光譜學(xué)特征,同時(shí)結(jié)合相關(guān)機(jī)器學(xué)習(xí)算法,通過建立預(yù)測數(shù)學(xué)模型用于診斷不同電壓所致皮膚電流損傷,為法醫(yī)病理學(xué)實(shí)踐提供了新的思路。后續(xù)研究將在本研究的基礎(chǔ)上,進(jìn)一步觀察電流損傷與其他常見皮膚損傷(如擦傷、燒傷及燙傷等)的鑒別。