潘琨琨, 張朝霞, 秦 潔, 呂小毅
(新疆醫(yī)科大學(xué)1第一臨床醫(yī)學(xué)院, 烏魯木齊 830011, 2第一附屬醫(yī)院檢驗(yàn)科, 烏魯木齊 830054, 3新疆大學(xué), 烏魯木齊 830000)
自1989 年以來,丙型肝炎(HCV)感染已成為全世界關(guān)注的問題。 據(jù) WHO 報(bào)道,全球有 1.7 億感染者,流行率約為3%[1-2]。HCV感染后病情隱匿,50%~80%會(huì)轉(zhuǎn)變成慢性肝炎,如不進(jìn)行合理治療,10~20 年后有10%~30%會(huì)發(fā)展成為肝硬化,1%~5%甚至?xí)l(fā)展為肝癌[3-4],嚴(yán)重危害患者的健康和生命。影響抗病毒治療效果的因素很多,丙肝的不同基因亞型與干擾素,直接抗病毒藥物的抗病毒效果有一定的相關(guān)性[5-6]。1993年Simmonds等通過對(duì)NS5B區(qū)擴(kuò)增測(cè)序后進(jìn)行系統(tǒng)進(jìn)化樹分析確定了6種基因型及一系列基因亞型。我國慢性丙型肝炎患者基因亞型分布總體上主要以1b亞型為主,流行率超過 HCV 感染病例的 70%;由于檢測(cè)丙肝的基因亞型,在確定抗病毒藥物治療劑量、療程、療效判斷方面具有重要的指導(dǎo)意義[7]。故本文試圖以拉曼光譜檢測(cè)手段分析HCV患者血清幫助診斷及初步1b分型鑒別有重要意義。
拉曼光譜是印度物理學(xué)家拉曼在1928年研究純苯溶液的光散射現(xiàn)象時(shí)發(fā)現(xiàn)的,能反映物質(zhì)內(nèi)部分子的振動(dòng)和轉(zhuǎn)動(dòng)能級(jí)等結(jié)構(gòu)信息。每一種物質(zhì)分子都有自己特定的拉曼光譜,可根據(jù)不同樣品特性選擇不同的激發(fā)波長,且不受水溶液影響。將任何一種物質(zhì)材料作為散射物質(zhì),幾乎都可以得到相應(yīng)的拉曼光譜。既往在測(cè)量時(shí)發(fā)現(xiàn)待測(cè)物質(zhì)的拉曼光譜可能被其自身發(fā)出的強(qiáng)烈熒光所覆蓋[8-9]。這一現(xiàn)象曾經(jīng)限制了拉曼光譜在物質(zhì)檢測(cè)領(lǐng)域的應(yīng)用,但經(jīng)過十幾年的發(fā)展,將拉曼光譜檢測(cè)技術(shù)與紅外,先進(jìn)的電子光學(xué)及計(jì)算機(jī)技術(shù)相結(jié)合。使應(yīng)用拉曼光譜檢測(cè)物質(zhì)的技術(shù)逐步提升,并因其簡單(不需要復(fù)雜的前期處理),微量和快速等優(yōu)點(diǎn)在醫(yī)學(xué)領(lǐng)域被廣泛開展[10]。目前拉曼光譜技術(shù)已用于HCV的診斷[11]及乙肝診斷[12]等體內(nèi)多種肝炎的早期診斷。但利用非表面增強(qiáng)拉曼光譜檢進(jìn)行HCV分型的報(bào)道較少見。本研究通過將拉曼光譜技術(shù)與統(tǒng)計(jì)學(xué)方法學(xué)相結(jié)合,研究探討血清拉曼光譜的特點(diǎn),建立了HCV診斷模型和1b亞型的鑒別。
1.1 樣品制備實(shí)驗(yàn)樣本:選取原始數(shù)據(jù)共424例,其中健康對(duì)照組200例,HCV患者實(shí)驗(yàn)組224例,其中1b 139例,其他數(shù)據(jù)79例(包括:2a: 55例,3a: 17例,3b: 7例),6例未檢出,每例數(shù)據(jù)測(cè)試3次,然后取平均值。以上所有血清標(biāo)準(zhǔn)樣本均來自新疆醫(yī)科大學(xué)第一附屬醫(yī)院,參與本研究的所有受試者都被詳細(xì)告知實(shí)驗(yàn)?zāi)康模⒃谘芯块_始時(shí)簽署書面知情同意書。本研究經(jīng)倫理審查委員會(huì)批準(zhǔn),遵循赫爾辛基宣言的指導(dǎo)原則,具體信息見表1。血清樣本受試者禁食過夜至少8 h后,每人采集獲得5 mL外周血樣品至沒有任何抗凝血?jiǎng)┑牟裳苤小4撼浞帜毯笠? 000 r/min轉(zhuǎn)速充分離心10 min除去血細(xì)胞,纖維蛋白原等成分獲得血清。收集500 μL于EP管中并保存在-80℃環(huán)境下待測(cè)量。待測(cè)標(biāo)本制備:將待測(cè)樣本于22℃環(huán)境下靜置30 min,待樣本充分溶解后,用毛細(xì)血管(泰州市宇杰醫(yī)療器械有限公司)吸取30 μL血清,隨后進(jìn)行測(cè)量[13]。
1.2 拉曼光譜采集將血液充分凝固后以3 000 r/min轉(zhuǎn)速充分離心10 min,除去血細(xì)胞,纖維蛋白原等成分獲得的血清成分用于拉曼測(cè)量。本實(shí)驗(yàn)采用激光拉曼光譜儀(LabRAM HR Evolution RAMAN SPECTROMETER,HORIBA Scientific Ltd.),其最低波數(shù)10 cm-1,光譜分辨率≤0.35 cm-1,光譜范圍50~9 000 cm-1,并配備有開放式顯微鏡。于50倍物鏡下觀察并記錄拉曼光譜。測(cè)量開始前,采用質(zhì)控品硅片于532 nm處激光條件下,記錄在300~3 000 cm-1拉曼位移范圍內(nèi)光譜數(shù)據(jù),以進(jìn)行對(duì)儀器的校準(zhǔn)。隨后進(jìn)行樣本測(cè)量,使用激光拉曼光譜儀(HORIBA Scientific Ltd.)在532 nm處產(chǎn)生激光。光譜記錄在300~3 000 cm-1拉曼位移范圍內(nèi),光譜分辨率為5 cm-1,記錄時(shí)間1.0 s。每個(gè)毛細(xì)管樣本在不同位置分別測(cè)量3次。獲得圖譜使用HORIBA Scientific的新版光譜分析軟件包LabSpec 6進(jìn)行記錄分析并轉(zhuǎn)換為數(shù)據(jù),取均值后進(jìn)行進(jìn)一步處理。
表1 患者基本信息
1.3 數(shù)據(jù)處理實(shí)驗(yàn)采集的拉曼光譜用自適應(yīng)迭代重加權(quán)懲罰最小二乘(airPLS)算法扣除熒光背景處理,采用偏最小二乘算法(PLS)模型進(jìn)行模型構(gòu)建及支持向量機(jī)分類算法(SVC)判別分析。數(shù)據(jù)分析使用軟件Matlab 2016a、origin 2018。
1.4 數(shù)據(jù)分析
1.4.1 對(duì)HCV診斷的數(shù)據(jù)分析 在數(shù)據(jù)統(tǒng)計(jì)分析之前,已將所有原始圖像利用LabSpec 6軟件進(jìn)行處理分析獲得原始數(shù)據(jù)。對(duì)原始數(shù)據(jù)取均值后使用Matlab軟件繪圖,圖1a中紅線表示224例丙肝樣本的平均譜圖,黑線表示200例正常樣本平均譜圖,圖1b顯示了扣除背景前所有光譜數(shù)據(jù)的譜圖,其中紅線表示224例丙肝樣本的平均譜圖,黑線表示200例正常樣本平均譜圖,從圖中可以明顯看出熒光背景對(duì)數(shù)據(jù)的影響較大,因此扣除熒光背景很有必要,采用airPLS(自適應(yīng)迭代重加權(quán)懲罰最小二乘)算法扣除熒光背景如圖1c,并采用origin2018軟件對(duì)拉曼光譜歸一化處理。得出HCV患者血清與非HCV感染者拉曼光譜數(shù)據(jù)之間存在差異如圖1d。對(duì)扣除熒光背景后的數(shù)據(jù)使用PLS(偏最小二乘)算法進(jìn)行降維處理,共提取5個(gè)主成分進(jìn)行分析,圖2為降維后的散點(diǎn)圖,其中訓(xùn)練集297例(健康145例、HCV 152例),測(cè)試集127例(健康55例、HCV 72例),使用網(wǎng)格尋優(yōu)法對(duì)支持向量機(jī)算法(SVM)中相關(guān)參數(shù)c、g(懲罰因子、核函數(shù))進(jìn)行尋優(yōu),獲得等高線圖,見圖3a,最終采用SVM算法對(duì)數(shù)據(jù)進(jìn)行判別分析,得到特異性、靈敏度及總判別正確率,最后采用ROC曲線進(jìn)行評(píng)價(jià)PLS算法及SVM對(duì)數(shù)據(jù)的分類統(tǒng)計(jì)分析得出的結(jié)果,見圖3b。
1.4.2 對(duì)HCV 1b型及其他型鑒別的數(shù)據(jù)分析 對(duì)1b型及其他型數(shù)據(jù)合計(jì)218例的原始數(shù)據(jù)取均值后使用Matlab軟件繪圖,圖4a中紅線表示139例b型樣本的平均譜圖,黑線表示其他數(shù)據(jù)79例(包括2a: 55例,3a: 17例,3b: 7例)樣本平均譜圖,從圖中可以看出存在較大熒光背景噪聲干擾,圖4b顯示了扣除背景前所有光譜數(shù)據(jù)的譜圖,其中紅線表示在扣除背景前的218例樣本的譜圖,藍(lán)線表示扣除背景后的218例樣本譜圖,從圖中可以明顯看出熒光背景對(duì)數(shù)據(jù)的影響較大,因此扣除熒光背景很有必要。并用自適應(yīng)迭代重加權(quán)懲罰最小二乘(airPLS)算法扣除熒光背景見圖4c,并對(duì)扣除熒光背景后的數(shù)據(jù)使用偏最小二乘(PLS)算法進(jìn)行降維處理,共提取6個(gè)主成分進(jìn)行分析,圖5為降維后的散點(diǎn)圖。對(duì)降維后的6個(gè)主成分?jǐn)?shù)據(jù)使用支持向量機(jī)(SVM)算法進(jìn)行判別分析,建立訓(xùn)練集和測(cè)試集,其中訓(xùn)練集152例(1b: 88例、其他:64例),測(cè)試集66例(1b: 51例、其他:15例)。使用網(wǎng)格尋優(yōu)法對(duì)SVM中相關(guān)參數(shù)c、g(懲罰因子、核函數(shù))進(jìn)行尋優(yōu),獲得等高線圖見圖6a,最終采用SVM算法對(duì)數(shù)據(jù)進(jìn)行判別分析,繪制測(cè)試集分類結(jié)果圖,根據(jù)測(cè)試集分類結(jié)果見圖6b。
注:a:未扣除背景所有拉曼數(shù)據(jù)平均譜圖,紅線表示224例丙肝樣本的平均譜圖,黑線表示200例正常樣本平均譜圖,從圖中可以看出存在較大熒光背景噪聲干擾,因此使用airPLS算法來扣除熒光背景。b:扣除背景前所有光譜數(shù)據(jù)的譜圖,其中紅線表示224例丙肝樣本的平均譜圖,黑線表示200例正常樣本平均譜圖,從圖中可以明顯看出熒光背景對(duì)數(shù)據(jù)的影響較大,因此扣除熒光背景很有必要。c :扣除背景后所有拉曼數(shù)據(jù)的平均譜圖,紅線表示224例丙肝樣本的平均譜圖,黑線表示200例正常樣本扣除背景后的平均譜圖。d :采用origin2018軟件對(duì)拉曼光譜進(jìn)行畫圖得出健康人與HCV患者血清拉曼光譜數(shù)據(jù)之間存在差異。
注:a: PLS-1、PLS-2、PLS-3 3個(gè)主成分的得分散點(diǎn)圖,b: PLS-3、PLS-4、PLS-5 3個(gè)主成分的得分散點(diǎn)圖,二個(gè)圖中紅色點(diǎn)表示表示224例丙肝樣本主成分得分,藍(lán)色點(diǎn)表示200例正常樣本主成分得分。
注:a:不同的c g 值對(duì)應(yīng)的是交叉驗(yàn)證準(zhǔn)確率,等高線圖越往右準(zhǔn)確率越高;b:采用ROC曲線進(jìn)行評(píng)價(jià)。
注:a: 紅線表示139例b型樣本的平均譜圖,黑線表示其他數(shù)據(jù)79例(包括:2a 55例,3a 17例,3b 7例)樣本平均譜圖,從圖中可以看出存在較大熒光背景噪聲干擾,因此使用airPLS算法來扣除熒光背景,b: 顯示了扣除背景前所有光譜數(shù)據(jù)的譜圖,其中紅線表示在扣除背景前的218例樣本的譜圖,藍(lán)線表示扣除背景后的218例樣本譜圖,從圖中可以明顯看出熒光背景對(duì)數(shù)據(jù)的影響較大,因此扣除熒光背景很有必要。c: 中顯示了139例b型樣本及他數(shù)據(jù)79例(包括:2a 55例,3a 17例,3b 7例)樣本扣除背景后的平均譜圖。d: 采用origin2018軟件對(duì)拉曼光譜進(jìn)行畫圖得出1b亞型與其他亞型拉曼光譜血清數(shù)據(jù)的差異。
注:對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,使用pls算法進(jìn)行降維,經(jīng)10折交互檢驗(yàn)后提取6個(gè)最優(yōu)主成分,圖a: PLS-1、PLS-2、PLS-3 3個(gè)主成分的得分散點(diǎn)圖,b: 為PLS-2、PLS-3、PLS-4 3個(gè)主成分的得分散點(diǎn)圖,c: PLS-4、PLS-5、PLS-6 3個(gè)主成分的得分散點(diǎn)圖,3個(gè)圖中紅色點(diǎn)表示139例b型樣本主成分得分,藍(lán)色點(diǎn)表示其他數(shù)據(jù)79例(包括:2a 55例,3a 17例,3b 7例)樣本主成分得分,從圖中可以大致看出1b型與其他型可以進(jìn)行區(qū)分,為此進(jìn)行進(jìn)一步診斷。
注:a:不同的c g 值對(duì)應(yīng)的是交叉驗(yàn)證準(zhǔn)確率,等高線圖越往右準(zhǔn)確率越高;b: 采用SVM算法對(duì)數(shù)據(jù)進(jìn)行判別分析,繪制測(cè)試集分類結(jié)果圖。
2.1 HCV診斷結(jié)果
2.1.1 2組血清的拉曼光譜的外形比較 圖1a和1b可以得出未使用airPLS算法來扣除熒光背景前存在較大熒光背景噪聲干擾,圖1c為扣除熒光背景后,從圖中可以明顯得出熒光背景對(duì)數(shù)據(jù)的影響較大,因此扣除熒光背景很有必要。從降維后的散點(diǎn)圖2也可以大致看出HCV與正常人可以進(jìn)行區(qū)分。圖1d得出HCV組血清與正常組血清拉曼光譜拉曼峰較類似,只是存在峰強(qiáng)度差異,特別是在1007、1155 、1508 cm-1處存在明顯差異。
2.1.2 統(tǒng)計(jì)學(xué)分析結(jié)果 圖3a可以找出最優(yōu)的c=32,g=1;最后計(jì)算丙肝診斷的特異性97.424 9% (227/233)與靈敏度93.406 6%(85/91),總判別正確率為96.296 3%(312/324)。ROC曲線下面積(AUC)為=0.981 7,表明統(tǒng)計(jì)方法具有較高的可靠性。
2.2 HCV 1b型和非1b型鑒別結(jié)果
2.2.1 2組血清的拉曼光譜的外形比較 圖4a和4b可以得出未使用airPLS算法來扣除熒光背景前存在較大熒光背景噪聲干擾,圖1c為扣除熒光背景后,從圖中可以明顯得出熒光背景對(duì)數(shù)據(jù)的影響較大,因此扣除熒光背景很有必要。從降維后的散點(diǎn)圖5也可以大致看出HCV與正常人可以進(jìn)行區(qū)分。如圖4d得出HCV血清與正常人血清拉曼光譜拉曼峰較類似,只是存在峰強(qiáng)度差異,特別是在1 007、1 154、1 519 cm-1位移處存在明顯差異。
2.2.2 統(tǒng)計(jì)學(xué)分析結(jié)果 圖6a可以找出最優(yōu)的c=90.509 7, g=1.414 2;最后計(jì)算丙肝1b亞型鑒別準(zhǔn)確率為100%(51/51),其他型鑒別準(zhǔn)確率為93.333 3%(14/15),誤診`例??倻?zhǔn)確率為98.484 8%,總誤診1例,如圖6所示。
目前對(duì)于HCV診斷的方法包括抗體檢測(cè)法、抗原檢測(cè)法、HCV核酸檢測(cè)法,雖然這些方法對(duì)于診斷丙肝都很成熟,但每種檢測(cè)方法都有不足,抗體檢測(cè)法在感染后45~68 d早期窗口期檢測(cè)靈敏度不足,且無法區(qū)分急慢性HCV(進(jìn)行性活動(dòng)性、病毒性)。同時(shí)對(duì)于來自免疫受損的患者,受低免疫應(yīng)答而導(dǎo)致不能產(chǎn)生足夠抗體的可能性無法避免??乖瓩z測(cè)法中丙肝抗體試劑制備較為單一,受HCV抗原分型、變異等影響,可發(fā)生抗原抗體反應(yīng)結(jié)合不充分,進(jìn)而出現(xiàn)假陰性結(jié)果,影響靈敏度。HCV-RNA檢測(cè)對(duì)實(shí)驗(yàn)室要求高,實(shí)驗(yàn)操作復(fù)雜,儀器昂貴,且對(duì)檢驗(yàn)技術(shù)人員要求高,否則由于操作不當(dāng)造成RNA酶降解導(dǎo)致假陰性結(jié)果出現(xiàn)。另經(jīng)治療血清抗體轉(zhuǎn)陽之后,血清中病毒載量降至極低水平,也可是使結(jié)果為陰性。激光拉曼光譜技術(shù)是一種無創(chuàng)、快速、高靈敏度的光譜檢測(cè)方法。本研究結(jié)果表明,2組血清拉曼光譜拉曼峰較類似,只是存在峰強(qiáng)度差異,通過airPLS-pls-svc模型分析可以對(duì)HCV進(jìn)行診斷,結(jié)果與Sohail等[11]基本相符合,通過ROC曲線下面積表明統(tǒng)計(jì)方法具有較高的可靠性。但是激光拉曼光譜在診斷HCV方面存在以下局限性:(1)本研究中血清樣品的數(shù)量尚偏少,雖然研究結(jié)果令人鼓舞,但需大宗樣本來檢驗(yàn)可能存在的結(jié)果偏倚;(2)本研究未將乙肝患者、艾滋病患者及細(xì)菌感染患者的血清樣本納入對(duì)比研究,故結(jié)果較局限,今后需開展其他的血清拉曼光譜對(duì)比研究;(3)本研究未用臨床化學(xué)檢驗(yàn)的干擾評(píng)價(jià)(EP7)方案做干擾實(shí)驗(yàn),評(píng)價(jià)是否膽紅素血,脂血及溶血標(biāo)本對(duì)檢測(cè)結(jié)果有影響。
由于我國慢性HCV肝炎患者基因亞型分布總體上主要以HCV1b亞型為主,流行率超過 HCV 感染病例的 70%;該研究對(duì)HCV1b亞型鑒別準(zhǔn)確率為100%,因此對(duì)于HVC1b亞型的鑒定有重要意義。但在激光拉曼光譜診斷HVC1b亞型的臨床應(yīng)用方面,本研究存在以下局限性:(1)本研究雖能有效區(qū)分HCV1b亞型和其他分型血清并診斷HCV,但目前尚未知區(qū)分他們的血清成分或生物大分子;(2)本研究未將HCV的其他亞型類型進(jìn)行區(qū)分,今后需開展其他亞型的血清拉曼光譜研究。(3)本研究未通過ROC曲線下面積表明統(tǒng)計(jì)方法的可靠性。
總之,本研究初步證明拉曼光譜可應(yīng)用于HCV診斷和HCV1b亞型的鑒定,為研發(fā)HCV新型診斷和分型技術(shù)奠定了基礎(chǔ)。