• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于多變量光譜數(shù)據(jù)分析方法的乳腺癌血清拉曼光譜特征研究

      2023-02-22 06:42:42張寶萍張富榮陳一申張占琴
      光譜學與光譜分析 2023年2期
      關鍵詞:曼光譜光譜準確率

      張寶萍, 寧 甜, 張富榮, 陳一申, 張占琴, 王 爽*

      1. 西北大學光子學與光子技術研究所, 陜西 西安 721710 2. 西安交通大學第一附屬醫(yī)院, 陜西 西安 710061

      引 言

      乳腺癌是乳腺上皮細胞在多種致癌因子作用下, 發(fā)生增值失控的現(xiàn)象[1]。 乳腺癌發(fā)病率和致死率雖位于女性惡性腫瘤首位, 但如在早期得到診斷治療, 約90%的病例可以治愈[2]。 臨床常采用影像學(鉬靶和超聲相結合)和體格檢查, 結合穿刺或切除活檢的方式, 開展乳腺癌早期篩查與病理診斷。 準確的組織學病理診斷, 對制定恰當?shù)呐R床治療方案及預后評估意義重大, 這要求檢測人員具有深厚的專業(yè)知識背景與臨床經(jīng)驗。 相比于細胞、 組織等其他臨床病理樣品, 血液更容易采集, 且其生化構成變化信息在醫(yī)學影像學中常檢測到的臨床癥狀出現(xiàn)之前, 就會出現(xiàn)較為明顯的變化[3-4]。 研究血液樣品生化分析技術, 有望發(fā)展一種針對乳腺癌早期篩查與診斷技術。

      振動光譜[包括紅外光譜和拉曼光譜(Raman spectroscopy, RS)]技術能夠以快速、 無損、 非侵入式的方式特異性闡釋生物構成信息, 已被研究證明具有提供檢測及診斷信息的能力[1], 其在研究惡性疾病病理演進、 早期診斷和預后評估等方面具有重要應用價值。 紅外光譜根據(jù)入射光頻率被分為近紅外(near-IR, NIR)、 中紅外(mid-IR, MIR)和遠紅外光譜(far-IR, FIR), 其中, MIR是分析生物材料的主要技術, 因為它涵蓋了重要生物分子的基本振動模式。 NIR光譜也可以作為生物光譜分析工具, 但由于其主要由MIR泛音組成, 使得該信號非常復雜且包含許多重疊的特征, 例如: 使用NIR進行生物標志物識別比MIR更困難、 更模糊。 而拉曼散射可以用于光譜的紫外光、 可見光或NIR區(qū)域, 因而可以在本質(zhì)上提供更高的空間分辨率[5]。 相對于紅外光譜, 水的O—H振動在拉曼光譜中極弱, 使得拉曼光譜更適合于某些生物醫(yī)學應用, 特別是體液樣本(血漿、 血清、 唾液或尿液)的分析測量[6]。 在基于血液樣本(血漿、 血清)拉曼光譜惡性腫瘤診斷方面, 許多研究團隊已開展了多項實驗探索。 其中, Lin等通過血漿表面增強拉曼光譜技術建立了鼻咽癌腫瘤病理分期方法[7]; Li等[8]結合多變量光譜數(shù)據(jù)分析方法, 探索了基于血漿共振拉曼光譜分析技術的食道癌檢測方法; Wang等[9]通過血清激光拉曼光譜技術探討了該技術在非小細胞肺癌早期篩查和臨床分期中的作用; Bilal等[10]結合偏最小二乘回歸分析, 通過血清拉曼光譜技術表明了乳腺癌從健康到癌變過程中的生化變化。

      采用顯微拉曼光譜檢測, 分析不同病變階段(健康, 早期癌變和晚期癌變)乳腺癌血清樣品生化特征信息, 采用主成分分析(principal component analysis, PCA)與線性判別分析(linear discriminant analysis, LDA)、 支持向量機(support vector machines, SVM)和偏最小二乘算法(partial least squares discriminant analysis, PLS-DA)等多種光譜分析手段, 構建多種光譜數(shù)據(jù)歸類鑒別模型。 進而, 采用留一交叉驗證方法(leave-one-out cross-validation, LOOCV)評估、 比較這些模型的靈敏度、 特異性和準確率, 最終, 闡釋血清拉曼光譜分析技術在乳腺癌早期篩查與病理分期分級中的應用基礎。

      1 實驗部分

      1.1 樣品

      血清樣品來源于西安交通大學第一附屬醫(yī)院。 根據(jù)臨床診斷, 樣品包括健康(healthy, H)、 早期癌癥(early cancer, EC)和晚期癌癥(advanced cancer, AC)三種類型, 其中, 10名健康志愿者經(jīng)檢查沒有任何疾病, 早期癌癥由20例浸潤性導管癌組成[臨床TNM分期分別為三期一級(s3g1)和三期二級(s3g2)], 晚期癌癥包括20例浸潤性導管癌[臨床TNM分期分別為三期三級(s3g3)和二期三級(s2g3)]。 早期和晚期癌癥組均在臨床通過病理學方法確診, 其中, 健康組年齡36~69歲, 平均53歲, 早期癌癥組的年齡為49~68歲, 平均為62歲, 晚期癌癥組的年齡為46~79歲, 平均為69歲。 禁食12 h后抽血采集的新鮮血液, 不添加任何抗凝劑, 用高速離心機(4 000 r·min-1)在4 ℃下離心20 min后, 提取上清液即血清, 用于拉曼光譜實驗分析。 將獲得的血清分裝于離心管中并儲存在溫度為-80 ℃的冰箱中以備實驗所需要。

      1.2 方法

      使用532 nm半導體激光器作為激發(fā)光源, 與顯微拉曼光譜系統(tǒng)(Alpha 500R, WITec GmbH, Germany)進行拉曼光譜檢測。 血清樣品室溫解凍10 min后, 放置在內(nèi)徑0.5 mm、 外徑0.8 mm、 5 μL量的石英毛細管中, 以減小在實驗過程中空氣對血清成分的影響, 降低激光對血清樣品的灼傷(樣品表面的最大激光功率約10 mW), 然后將其置于載物平臺用于光譜測量。 采用20倍顯微鏡激發(fā)樣品光譜, 并由拉曼光譜儀(UHTS300, WITec GmbH, Germany)采集600~3 000 cm-1范圍內(nèi)的光譜信息。 單個血清樣品每次光譜采集時間為5 s, 每種類型樣品獲取100條光譜。 實驗測量前使用標準鎢燈(RS-3, EG&G Gamma Scientific, USA)校準系統(tǒng)光譜響應, 并采用硅片520.7 cm-1光譜特征峰校準系統(tǒng)波長。

      1.3 數(shù)據(jù)處理

      采用本團隊自行開發(fā)的NWU-Spectral-Analysis(NWUSA)Toolbox[11], 對實驗所采集的原始光譜依次進行去宇宙射線、 扣除熒光背景、 九階多項式擬合, 以及五階Savitzky-Golay平滑等預處理。 預處理之后, 對每條光譜作曲線下面積歸一化, 以消除如激光功率不穩(wěn)定等外界因素的干擾; 然后將所有光譜特征峰的強度值矩陣進行均值中心化, 以消除樣品內(nèi)和/或樣品間光譜變異性對多變量分析的干擾; 隨后采用主成分分析方法(PCA)降低光譜數(shù)據(jù)集維度, 并結合單因素方差分析(one-way ANOVA)提取、 識別顯著差異主成分信息(principal components, PCs,p<0.01)。 最后, 將所提取的PCs作為線性判別函數(shù)(LDA)的輸入變量, 生成PCA-LDA光譜特征鑒別模型, 并采用LOOCV方法驗證此模型的分類鑒別能力。 此外, 將主成分信息輸入支持向量機(SVM)算法, 采用三種核函數(shù)(線性式、 多項式和RBF)構建PCA-SVM模型。 該模型的分類鑒別性能主要受到誤差懲罰參數(shù)C, 以及核函數(shù)形式和參數(shù)影響。 對于線性SVM內(nèi)核只需要優(yōu)化一個誤差懲罰參數(shù)C, 在確定的特征子空間中C的取值小時, 表明機器學習的復雜度小且經(jīng)驗風險值較大; 當C取無窮大時, 滿足所有約束條件, 意味著訓練樣本必須準確地分類; 當C超過一定值時, SVM的復雜度達到了特征子空間允許的最大值, 其經(jīng)驗風險值和泛化性能幾乎不再變化。 對于多項式和RBF核函數(shù), 除需優(yōu)化參數(shù)C外, 還需要分別對多項式階數(shù)(d)和RBF核函數(shù)寬度(γ)進行優(yōu)化, 其中d值越大, 多項式核矩陣元素值與核函數(shù)維度越大, 計算也越復雜, 對數(shù)據(jù)的分類能力更好, 但易出現(xiàn)過擬合現(xiàn)象; RBF核函數(shù)中的參數(shù)γ定義了單個樣本對整個分類超平面的影響, 當γ比較小時, 單個樣本對整個分類超平面的影響比較小, 反之, 當γ比較大時, 單個樣本對整個分類超平面的影響比較大, 更容易被選擇為支持向量[12]。 研究以80%實驗數(shù)據(jù)構造訓練數(shù)據(jù)集, 采用網(wǎng)格搜索結合LOOCV來優(yōu)化每個核的參數(shù), 獲取分類精度最高的參數(shù)作為構建最終SVM模型的最佳參數(shù), 并將其應用于驗證測試集數(shù)據(jù)(其他20%光譜數(shù)據(jù))。 在構建PCA-LDA和PCA-SVM模型后, 進一步通過均值中心化后的強度矩陣構建偏最小二乘分類(PLS-DA)模型。 最終, 采用LOOCV方法評估、 比較三種判別模型光譜鑒別分析性能。

      2 結果與討論

      2.1 乳腺癌血清樣品的拉曼光譜

      表1 血清拉曼光譜特征峰位及其生化分配Table 1 Raman spectral characteristic peaks of serum and their biochemical assignments

      圖1(a) 健康(H)、 早期乳腺癌變(EC, s3g1, s3g2)和晚期乳腺癌變(AC, s3g3, s2g3)血清原始拉曼光譜Fig.1(a) Original serum Raman Spectra from Healthy (H), Early Breast Cancer (EC, s3g1, s3g2), and Advanced Cancer (AC, s3g3, s2g3) groups

      圖1(b) 每一步預處理后的數(shù)據(jù)圖(以健康組為例)Fig.1(b) Plot of data after each step of pre-processing (healthy)

      圖2 健康(H)、 早期乳腺癌變(EC, s3g1, s3g2)和晚期乳腺癌變(AC, s3g3, s2g3)血清平均拉曼光譜Fig.2 Mean serum Raman spectra from Healthy (H), Early Breast Cancer (EC, s3g1, s3g2), and Advanced Cancer (AC, s3g3, s2g3) groups

      2.2 PCA-LDA模型

      從圖2可以看出, 不同血清樣品表現(xiàn)出較為相似的光譜特征, 如果僅從個別拉曼峰位、 峰值、 峰強等光譜參量特征分析, 無法準確反映樣品所隱含的組織癌變信息。 為了獲取更具代表性的分子光譜特征信息, 在有效剔除光譜背景干擾后, 采用多模數(shù)據(jù)歸類分析方法, 將大量的光譜數(shù)據(jù)約化為可管理且含有豐富信息的形式, 將主成分(PCA)和線性判別分析方法(LDA)相結合, 建立PCA-LDA分析方法, 分別對實驗光譜數(shù)據(jù)的低波數(shù)(600~1 800 cm-1)和高波數(shù)區(qū)域(2 800~3 000 cm-1)的特征信息進行分析計算, 并通過One-way ANOVA(p<0.01)識別前三個最具顯著差異的PC值(PC1, PC2和PC3), 其主成分載荷分布及其光譜如圖3所示。 PC1在光譜數(shù)據(jù)集中占總方差(52.37%)最大, 而PC2和PC3分別占總方差的18.42%和5.18%。 如圖3(a)—(c)所示, 對于不同血清樣品而言, PC1的正半軸上主要分布EC組, 負軸上分布H組與AC組; 而PC2正半軸上的載荷分布只有H和EC組中的s3g1血清樣品, 負半軸部分則分布著AC與EC組中的s3g2血清樣品載荷; PC3正半軸分布著AC組s2g3和EC組s3g1血清樣品, 負半軸則分布著EC組s3g2, AC組s3g3和H組。 圖3(d)所示為PC1, PC2和PC3載荷光譜, 與圖2中血清特征光譜相對比, 可以發(fā)現(xiàn)每個主成分載荷中的正負特征均來源于血清中生化光譜特征變化。 具體而言, PC1載荷光譜主要表現(xiàn)為, 苯基丙氨酸(1 003 cm-1)、 β型類胡蘿卜素(1 159與1 524 cm-1)和蛋白質(zhì)(2 663 cm-1)成分的負向光譜貢獻, 以及脂類成分(2 928 cm-1)的正向光譜貢獻; PC2與PC1載荷光譜之間的載荷光譜差別主要表現(xiàn)為, β型類胡蘿卜素(1 159, 1 524 cm-1)、 蛋白質(zhì)(2 663 cm-1)和脂質(zhì)(1 668, 2 928 cm-1)的負向光譜貢獻; PC3的載荷光譜噪聲相對較大, 但其與PC1和PC2的主要差別為正向的β型類胡蘿卜素(1 524 cm-1)光譜特征。 結合圖2所示血清特征光譜分析, PC1所提取的負特征主要來自H和AC組血清光譜貢獻, 而其正特征主要來自EC組患者血清光譜; PC2所提取的負特征主要來自EC組(s3g2)和AC組患者血清光譜貢獻, 而其正特征主要來自H組和EC(s3g1)患者血清的光譜貢獻; PC3所提取的負特征則主要來自EC組(s3g2)、 AC組(s3g3)和H組血清光譜貢獻, 而其正特征主要來自AC組(s2g3)和EC組(s3g1)血清光譜貢獻。 這與圖3(a), (b)和(c)圖中所顯示的分布結果一致, 表明通過主成分差異光譜信息可以來描述不同血清之間潛在的生化差異。

      圖3 健康(H)、 早期乳腺癌變(EC, s3g1, s3g2)和晚期乳腺癌變(AC, s3g3, s2g3)組血清主成分載荷分布圖(a): PC1與PC2; (b): PC1與PC3; (c): PC2與PC3; (d): PC1, PC2和PC3載荷光譜Fig.3 Scatter plots of the main components of the healthy (H), early cancer (EC, s3g1, s3g2) and advanced cancer (AC, s3g3, s2g3) groups(a): PC1 versus PC2; (b): PC1 versus PC3; (c): PC2 versus PC3; (d): The PCA loading of PC1, PC2 and PC3

      把所提取的最顯著差異主成分光譜信息, 用于H, EC(s3g1, s3g2)和AC(s3g3, s2g3)組血清的光譜特征鑒別分類, 即, 采用PC1, PC2 和PC3作為LDA的輸入變量, 構建生成PCA-LDA分類診斷模型, 如圖4所示。 H, EC和AC組不同病理階段的血清之間分離明顯, 分別被第一和第二個判別函數(shù)區(qū)分。 第一判別函數(shù)的正半軸分布著EC組s3g2與AC組s3g3血清光譜, 負半軸主要分布著H, EC組s3g1和AC組s2g3血清光譜; 第二判別函數(shù)的正半軸則分布的是H組、 AC組(s2g3, s3g3)血清光譜, 負軸上則分布的是EC組(s3g1, s2g3)血清光譜。 通過LOOCV交叉驗證, 如表2所示的混淆矩陣中, 絕大部分血清光譜特征被準確診斷分類, 只有s2g3和s3g1患者的血清光譜出現(xiàn)較小的錯誤分類結果, 這可能來源于兩者相似的光譜參量特征。 以上結果表明, 基于PCA-LDA算法鑒別靈敏度分別為100%, 100%, 100%, 100%和99%, 特異性分別為100%, 99.75%, 100%, 100%和100%, 總體分類準確率為99%。

      圖4 健康(H)、 早期乳腺癌變(EC, s3g1, s3g2)和晚期乳腺癌變(AC, s3g3, s2g3)組血清的PCA-LDA分數(shù)散點圖Fig.4 Scatter plots of the PCA-LDA scores of the serum in the healthy(H), early cancer (EC, s3g1, s3g2) and advanced cancer (AC, s3g3, s2g3) groups

      表2 PCA-LDA結合LOOCV對五種血清的拉曼光譜進行分類的結果Table 2 Results of classifying the Raman spectra of the five sera based on the PCA-LDA algorithm combined with LOOCV

      2.3 PCA-SVM模型

      采用PCA對光譜數(shù)據(jù)集進行降維并提取其特征信息后, 把最顯著特征變量PC1和PC2輸入至SVM算法, 建立PCA-SVM診斷模型, 篩選實驗所獲H、 EC和AC組血清光譜數(shù)據(jù)的特征信息。 在此基礎上, 利用網(wǎng)格搜索方法結合交叉驗證從訓練集光譜(占數(shù)據(jù)總量的80%)中確定線性核、 多項式核與RBF的最優(yōu)參數(shù), 用以觀察PCA-SVM模型訓練過程中不同參數(shù)對分類精度的影響。 如圖5(a)和(b)所示為不同參數(shù)對分類精度影響的三維曲面圖。 在圖5(a)中, RBF內(nèi)核PCA-SVM 模型中參數(shù)C在2-8~210的范圍內(nèi)變化, 參數(shù)γ在2-10~210的范圍內(nèi)變化; 并且隨著C和γ在這一變化范圍內(nèi)增大, RBF核的精度逐漸提高。 實驗結果表明, 當C=0.125,γ=256時, 模型的準確率達到了最高95.625%。 當構建多項式內(nèi)核PCA-SVM模型時, 同樣需要對兩個參數(shù)(參數(shù)C和多項式階數(shù)d)進行優(yōu)化, 如圖5(b)中所示。 當C值逐漸增大、 多項式階數(shù)d相應減小時, 光譜鑒別準確率也逐漸提高; 參數(shù)C=0.003, 多項式階數(shù)d=1時, 模型的分類準確率最高, 可以達到95.625%。 對于線性核PCA-SVM模型, 只需要優(yōu)化一個參數(shù)C, 如圖5(c)顯示了分類精度與參數(shù)C的關系, 當C=0.003時, 分類準確率達到最高值95.625%。

      圖5 (a)RBF內(nèi)核PCA-SVM模型分類準確率隨參數(shù)C和γ變化關系; (b)多項式內(nèi)核PCA-SVM模型分類準確率隨參數(shù)C和多項式階數(shù)d的變化關系; (c)線性核函數(shù)PCA-SVM算法分類準確度與參數(shù)C的關系Fig.5 (a) 3D classification accuracy plot of parameters C and γ in RBF kernel PCA-SVM model; (b) 3D classification accuracy plot of C and polynomial order d in polynomial kernel PCA-SVM model; (c) The classification accuracy of linear kernel function PCA-SVM algorithm with parameter C

      在優(yōu)化SVM算法核參數(shù)后, 對測試集光譜特征進行鑒別分析, 如表3所示。 RBF核PCA-SVM模型在測試集中的分類準確率為94%, 而線性核PCA-SVM模型和多項式核PCA-SVM模型的分類準確率均為92%。 比較三種內(nèi)核函數(shù)PCA-SVM模型的準確率, RBF核函數(shù)PCA-SVM模型明顯高于線性核函數(shù)和多項式核。 由于RBF核函數(shù)PCA-SVM算法所具有的簡單性, 以及對任意復雜度數(shù)據(jù)的建模能力, RBF核函數(shù)PCA-SVM模型被認為是SVM中更合理的選擇[19]。 此外, 三種內(nèi)核函數(shù)的PCA-SVM模型性能與訓練集相比略有差異, 但差異在允許范圍內(nèi), 說明三種SVM分類模型沒有出現(xiàn)明顯的過擬合現(xiàn)象。

      表3 基于RBF、 多項式與線性核函數(shù)的PCA-SVM診斷模型對血清測試集的光譜進行分類Table 3 The spectra of the serum test set were classified based on the PCA-SVM diagnostic models of the RBF, polynomial, and linear kernel functions, respectively

      2.4 PLS-DA模型

      分別討論PCA-LDA和PCA-SVM診斷模型對于不同血清樣品的鑒別分析性能后, 均值中心化所有光譜特征峰的強度矩陣, 構建PLS-DA模型, 并將該模型的性能與上述兩類鑒別手段進行比較。 對H, EC和AC組光譜數(shù)據(jù)進行PLS-DA算法, 計算LVs, 構建來自不同血清樣本的數(shù)據(jù)集之間的關系, 并將其顯示在評分散點圖中。 圖6(a), (b)和(c)分別顯示了數(shù)據(jù)集的前三個LVs(LV1和LV2, LV1和LV3及LV2和LV3)的散點分布。 在圖6(a)和(b)中, H組與EC組的s3g1完全分布在LV1正半軸部分, AC組分布在LV1負半軸部分。 根據(jù)圖6(a)和(c), LV2的零線將H組與EC組和AC組明顯區(qū)分。 在圖6(b)與(c)中, AC組的s2g3分布于LV3正半軸部分, EC組、 H組和AC組的s3g3均分布在LV3的負半軸部分, 分布差異不明顯。 如圖6(d)所示, 通過分析LV1, LV2與LV3載荷光譜, 提取不同病理階段乳腺癌血清中的分子特征信息。 LV1載荷光譜特征主要為正向加載, 主要表現(xiàn)為苯基丙氨酸(1 003 cm-1)、 β型類胡蘿卜素(1 159和1 524 cm-1)及蛋白質(zhì)(2 663 cm-1)的光譜特征成分; 在LV2載荷光譜中, 脂質(zhì)(2 928, 1 668 cm-1)為正向特征, 苯基丙氨酸(1 003 cm-1)和β型類胡蘿卜素(1 159和1 524 cm-1)為負向特征; LV3載荷光譜噪聲較大, 主要表現(xiàn)為LV1和LV2混合光譜特征, 即, β型類胡蘿卜素(1 524 cm-1)正向和脂質(zhì)(2 928 cm-1)負向特征。 結合圖2所示特征光譜, LV1正向特征主要來自H與EC組s3g1光譜貢獻, 負向特征則主要來自AC組的光譜貢獻; LV2的正向特征來自H組光譜貢獻, 負向特征則來自EC和AC組的光譜貢獻。 以上結果再次表明, 乳腺癌不同病理階段的苯丙氨酸、 蛋白質(zhì)和脂質(zhì)等成分含量差異。

      圖6 健康(H)、 早期乳腺癌變(EC, s3g1, s3g2)和晚期乳腺癌變(AC, s3g3, s2g3)組血清主成分載荷分布圖(a): LV1與LV2; (b): LV1與LV3; (c): LV2與LV3; (d): LV1, LV2和LV3的載荷光譜Fig.6 Scatter plots of the main components of the healthy (H), early cancer (EC, s3g1, s3g2) and advanced cancer (AC, s3g3, s2g3) groups(a): LV1 versus LV2; (b): LV1 versus LV3; (c): LV2 versus LV3; (d): The LVs loading of LV1, LV2 and LV3

      表4為LOOCV混淆矩陣表, EC(s3g1, s3g2)和AC(s3g3, s2g3)存在錯誤分類結果, 可能與這兩組血清的光譜特征差異較小有關, 也有可能是PLS-DA診斷模型的性能問題。 PLS-DA診斷模型的靈敏度分別為100%, 92%, 72%, 65%和71%, 特異性分別為99.75%, 94.25%, 97.25%, 91.75%和92%, 總體準確率為80%。 與本文中所構建的另兩種診斷模型(PCA-LDA, PCA-SVM)相比較, PLS-DA模型鑒別準確率最低。 PCA-LDA和PCA-SVM分類準確率相對較高, 可見PCA對光譜數(shù)據(jù)集進行降維并提取更具代表性的特征信息, 有助于提高診斷分類結果。 對于PCA-SVM, 對光譜數(shù)據(jù)的分類精度可以達到很高, 但是當它在處理大規(guī)模數(shù)據(jù)時耗時較長且參數(shù)選擇困難, 如何進一步提高該算法的計算速度和泛化性能, 還需要進一步通過積累光譜數(shù)據(jù)進行論證; 對于PLS-DA, 該算法易受類(所含數(shù)據(jù)量大小)的影響[5]。 相對而言PCA-LDA模型更適用于分類診斷。

      表4 基于PLS-DA算法結合LOOCV對血清的拉曼光譜進行分類的結果Table 4 Discrimination results obtained by Raman spectroscopy of serum using PLS-DA algorithms with the LOOCV method

      3 結 論

      采用拉曼光譜分析手段, 在研究多種乳腺病變(健康、 早期和晚期癌變)血清生化構成的基礎上, 采用多模數(shù)據(jù)分析手段構造多個光譜特征分類鑒別模型(PCA-LDA, PCA-SVM和PLS-DA), 進一步挖掘光譜信息中所暗含的生物組成差異信息。 由于選用了與類胡蘿卜素的π—π*電子躍遷耦合能量符的532 nm激光作為激發(fā)光源, 研究觀察到了血清β型類胡蘿卜素成分的共振拉曼光譜峰(1 159與1 524 cm-1), 在此基礎上, 分析了乳腺癌病理演變過程中的生化構成變化; 采用多種多變量光譜分析手段, 建立光譜數(shù)據(jù)分類鑒別模型(PCA-LDA, PCA-SVM和PLS-DA), 用于進一步提取更具代表性的分子光譜特征信息。 其中, PCA-LDA模型的分類準確率達99%; PCA-SVM(三個內(nèi)核函數(shù): 線性核、 多項式核及RBF核)模型中, 當線性核函數(shù)PCA-SVM模型誤差懲罰參數(shù)C為0.003時, 其分類準確率可達95.625%; 當RBF核函數(shù)PCA-SVM模型參數(shù)C和參數(shù)γ分別為0.125和256時, 模型的準確率達到了最高95.625%; 當多項式核函數(shù)PCA-SVM參數(shù)C為0.003、 多項式階數(shù)d等于1時, 其模型分類準確率為95.625%最高; 選擇此時的參數(shù)值構建模型, RBF核PCA-SVM模型在測試集中的分類準確率為94%, 而線性核PCA-SVM模型和多項式核PCA-SVM模型的分類準確率均為92%。 PLS-DA模型的分類準確率為80%。 以上結果, 不但以光譜特征的角度描述了不同病理條件下血清的物質(zhì)構成信息, 更為拓展血清拉曼光譜分析技術在乳腺癌早期篩查與病理分期分級中的應用范疇, 奠定了一定實驗與理論基礎。

      猜你喜歡
      曼光譜光譜準確率
      基于三維Saab變換的高光譜圖像壓縮方法
      乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
      健康之家(2021年19期)2021-05-23 11:17:39
      不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
      2015—2017 年寧夏各天氣預報參考產(chǎn)品質(zhì)量檢驗分析
      高速公路車牌識別標識站準確率驗證法
      星載近紅外高光譜CO2遙感進展
      中國光學(2015年5期)2015-12-09 09:00:28
      苦味酸與牛血清蛋白相互作用的光譜研究
      鋱(Ⅲ)與PvdA作用的光譜研究
      BMSCs分化為NCs的拉曼光譜研究
      便攜式薄層色譜-拉曼光譜聯(lián)用儀重大專項獲批
      凤城市| 青浦区| 庐江县| 岳西县| 娄底市| 任丘市| 甘孜| 达孜县| 璧山县| 绿春县| 滕州市| 清徐县| 五家渠市| 绵阳市| 富顺县| 吴堡县| 江源县| 枞阳县| 尖扎县| 喀什市| 普格县| 天水市| 当雄县| 克拉玛依市| 九寨沟县| 周口市| 怀来县| 报价| 海南省| 台前县| 电白县| 明光市| 镇雄县| 安泽县| 临夏市| 惠东县| 曲松县| 精河县| 德州市| 黎川县| 永仁县|