燕 芳, 李 偉, 王志春
內(nèi)蒙古科技大學信息工程學院, 內(nèi)蒙古 包頭 014010
太赫茲波的能量介于光子和電子之間, 能穿透非金屬和非極性材料, 使太赫茲時域光譜技術(THz-TDS)作為無損檢測的一項新興技術手段成為可能。 許多生物分子的集體振轉(zhuǎn)模式位于太赫茲波段, 使生物分子在太赫茲波段具有指紋性, 獲得待測物質(zhì)的太赫茲吸收譜后, 與標準譜進行對照可以實現(xiàn)對待測物質(zhì)的定性分析。 在此基礎上, 結(jié)合最小二乘法、 支持向量機等數(shù)據(jù)處理技術還可以實現(xiàn)基于太赫茲時域光譜對待測物質(zhì)的定量分析。
構(gòu)成蛋白質(zhì)的二十種氨基酸與生命活動緊密相關, 王衛(wèi)寧等[1]研究發(fā)現(xiàn), 氨基酸類物質(zhì)在實驗的有效光譜范圍內(nèi), 具有各自的特征吸收, 因此可以利用太赫茲時域光譜技術定性鑒別物質(zhì), 并對精氨酸、 組氨酸的太赫茲吸收譜與分子間集體振轉(zhuǎn)模式的對應關系做了相關研究。
目前的量子化學分析計算在國際上廣泛使用Gaussian03軟件。 Gaussian03基于從頭算理論、 半經(jīng)驗法和密度泛函等計算方法, 在氣相范圍內(nèi)研究分子結(jié)構(gòu)及能量、 分子間作用力、 IR和拉曼光譜等具有突出優(yōu)勢[2]。 研究生物分子太赫茲吸收峰的歸屬, 多采用密度泛函理論, 為不同的分子匹配不同的算法、 不同的基組(如雜化泛函算法、 6-311G++基組)計算生物分子的紅外振動譜, 為在紅外譜內(nèi)提取的太赫茲譜做簡正振動分析, 對分子結(jié)構(gòu)內(nèi)振轉(zhuǎn)與太赫茲吸收峰做出指認。
在對氨基酸樣品的太赫茲吸收譜計算中, 為了分析與樣品更為接近的構(gòu)型, 應選擇全面反映分子間作用力的晶胞構(gòu)型作為計算的初始構(gòu)型。 而晶胞構(gòu)型計算對數(shù)據(jù)處理器的要求偏高, 同時運算時間較長(30 h以上), 限于以上缺點該方法對于大量樣品的計算適用性不強。 本文通過對三種氨基酸樣品單分子構(gòu)型的分析, 找到了吸收峰所在頻率對應的原子或原子團振轉(zhuǎn)模式的一致規(guī)律, 可以為氨基酸類物質(zhì)的太赫茲定性分析提供一定的參考。
利用透射式太赫茲時域光譜系統(tǒng)獲取谷氨酰胺、 蘇氨酸和組氨酸樣品的太赫茲吸收譜, 設備詳細描述見文獻。 通過在密閉的實驗光路中充滿氮氣來降低環(huán)境濕度對太赫茲波的吸收[3], 測試溫度為室溫25 ℃。 吸收譜的獲取參照了Dorney等[4]提出的方法。
為了降低顆粒度差異引起的太赫茲波散射, 實驗所用谷氨酰胺、 蘇氨酸、 組氨酸樣品經(jīng)充分研磨后加入120 mg聚乙烯粉末混合, 以8 MPa壓力沖壓成片, 樣片厚度約0.9 mm, 直徑13 mm。
實驗中, 分別記錄太赫茲光路中有無樣品時的時域信號作為樣品信號和參考信號, 為了減小 THz-TDS系統(tǒng)測量時域樣品信號和參考信號的誤差, 每種樣品均測量三次后取其平均值。 然后對時域測量結(jié)果做傅里葉變換, 樣品信號傅里葉變換結(jié)果記為Esam(ω), 參考信號傅里葉變換結(jié)果記為Eref(ω)。 取Esam(ω)和Eref(ω)比值的幅頻特性和相頻特性, 如式(1)和式(2)所示
(1)
(2)
其中:d為樣品厚度,c為光速,ω為角頻率,φ(ω)為相位差。 折射率n(ω)和吸收系數(shù)α(ω)為
(3)
(4)
由式(4)即可計算出樣品的太赫茲吸收譜。
量子化學分析計算在Gaussian03軟件中進行, 采用密度泛函理論中的雜化泛函理論, 為不同分子選用了不同基組, 首先, 對谷氨酰胺、 蘇氨酸、 組氨酸樣品進行單分子構(gòu)型計算, 為了對氨基酸類物質(zhì)進行定性分析, 還構(gòu)建了氨基酸官能團的模型并進行了相應的量子化學計算。
氨基酸在固體樣品中以兩性離子形式存在, 故將對谷氨酰胺、 蘇氨酸、 組氨酸單分子的兩性離子進行計算分析。 分子構(gòu)型在ChemDraw中繪制, 導出分子結(jié)構(gòu)的笛卡爾坐標并導入Gaussian03進行運算。 因兩性離子帶正負兩性電荷, 故選用6-311G++(d, p)基組, 同時采用基于B3LYP雜化泛函的密度泛函理論做構(gòu)型優(yōu)化[5], 最后進行IR計算。 由于太赫茲波處于遠紅外波段, 故太赫茲吸收譜需在IR的遠紅外段提取。 圖1(a), (b)和(c)分別為谷氨酰胺、 蘇氨酸、 組氨酸兩性離子形式存在的單分子構(gòu)型。
圖1 三種氨基酸樣品的單分子構(gòu)型
三種樣品的單分子構(gòu)型在量子化學計算過程中, 選用的運算理論與基組均相同, 計算機時與收斂迭代次數(shù)限于原子個數(shù)、 分子空間結(jié)構(gòu)和數(shù)據(jù)處理器配置。 三種樣品的計算機時和收斂迭代次數(shù)示于表1, 計算所用數(shù)據(jù)處理器配置為2.6 GHz主頻, 單核四線程, 緩存數(shù)據(jù)存儲器為128 G固態(tài)硬盤(SSD)。
王衛(wèi)寧等指出, 發(fā)展較為成熟的紅外吸收譜的構(gòu)成是由固定的原子或原子基團的峰位、 峰形支撐的。 也就是說, 各原子或原子基團有特定的紅外吸收峰位和峰形。 保持氨基酸類物質(zhì)化學通性的最小基團為氨基酸官能團, 為了探索太赫茲吸收譜是否具有和紅外吸收譜相類似的性質(zhì), 研究氨基酸官能團在太赫茲波段是否具有固定峰位, 本文構(gòu)建了氨基酸官能團的單分子模型, 計算了氨基酸官能團的太赫茲吸收譜。
表1 計算機時及收斂迭代次數(shù)
氨基酸官能團由一個氨基和一個羧基構(gòu)成, 為了與氨基酸固體樣品做出更精確的對照, 將氨基酸官能團也繪制成兩性離子。 而且, 繪制了含R基和不含R基兩種結(jié)構(gòu), 其中含R基結(jié)構(gòu)用一個氫(H)原子取代R基, 不含R基為C-帶電體形式。 計算過程與三種樣品的單分子計算類似, 由ChemDraw繪制分子構(gòu)型, 導出笛卡爾坐標后, 在Gaussian03中進行優(yōu)化和IR計算。 其中氫原子取代R基的氨基酸官能團選用6-311G++(d, p)基組, 而不含R基的氨基酸官能團帶兩個單位負電荷和一個單位正電荷, 在基組選擇時考慮到不含R基的氨基酸官能團電荷個數(shù)為3, 但依然帶兩性電荷, 故仍然選用6-311G++(d, p)基組。 圖2(a)和(b)分別為含R基和不含R基氨基酸官能團的單分子構(gòu)型。
圖2 氨基酸官能團的單分子構(gòu)型
利用量子化學分析軟件計算IR后, 在遠紅外波段(波數(shù)3~333 cm-1)提取太赫茲吸收譜, 由于實驗所用儀器精度所限, 3 THz后的實驗數(shù)據(jù)受環(huán)境因素影響較大, 故只提取3 THz(波數(shù)3~100 cm-1)之前的計算數(shù)據(jù)與有效的實驗數(shù)據(jù)進行對比。
圖3 三種氨基酸的實驗和計算數(shù)據(jù)對比
(a): Comparison of experimental and computational spectra of glutamine; (b): Comparison of experimental and computational spectra of threonine; (c): Comparison of experimental and computational spectra of histidine
圖3(a), (b)和(c)中分別對比了三種氨基酸分子的實驗譜和由量子化學計算獲得的模擬譜。
對比發(fā)現(xiàn), 每種氨基酸由量子化學計算獲得的模擬譜在高頻段內(nèi)的吸收峰與實驗譜基本一致, 而低頻段吸收峰的峰位和峰形均與實驗譜有較大差距。 這是由于氨基酸單分子構(gòu)型的計算僅提供了分子內(nèi)部原子及原子基團在太赫茲頻段內(nèi)的振轉(zhuǎn)結(jié)果, 沒有體現(xiàn)物質(zhì)內(nèi)分子間的氫鍵及范德華力作用, 而分子間氫鍵及范德華力的作用在太赫茲頻段內(nèi)的振轉(zhuǎn)結(jié)果集中體現(xiàn)于實驗獲得的太赫茲吸收譜低頻段內(nèi)。
不含R基的氨基酸官能團整體電性為一個單位負電荷, 在體系中不穩(wěn)定, 自然界中不存在, 量子化學優(yōu)化結(jié)果不收斂(找不到體系能量最低點), 5 THz以下的太赫茲頻段未見吸收峰, 5.3 THz時出現(xiàn)第一個吸收峰。 含R基的氨基酸官能團整體為電中性, 可以找到體系總能最低點, 2.8 THz時出現(xiàn)第一個太赫茲吸收峰, 但由氫原子取代R基的官能團只能保持氨基酸的部分理化性質(zhì)。
研究發(fā)現(xiàn)三種氨基酸樣品的實驗譜與模擬譜在2~3 THz基本吻合, 含R基官能團在2.8 THz也出現(xiàn)吸收峰。 為了討論氨基酸類物質(zhì)2~3 THz的吸收峰是否由氨基酸官能團內(nèi)原子的振轉(zhuǎn)提供, 接下來為三種樣品單分子構(gòu)型和H-氨基酸官能團單分子構(gòu)型在2~3 THz內(nèi)吸收峰對應頻率的振轉(zhuǎn)模式做了指認。
由于H-氨基酸官能團不能完全代表實際氨基酸官能團的理化性質(zhì), 對H-氨基酸官能團與谷氨酰胺、 蘇氨酸、 組氨酸在2~3 THz內(nèi)的振轉(zhuǎn)模式的指認如圖4所示。
圖4 氨基酸官能團振轉(zhuǎn)模式指認
(a): H-氨基酸官能團2.8 THz振轉(zhuǎn)圖; (b): 谷氨酰胺內(nèi)官能團2.41 THz振轉(zhuǎn)圖;
(c): 蘇氨酸內(nèi)官能團2.49 THz振轉(zhuǎn)圖; (d): 組氨酸內(nèi)官能團2.09 THz振轉(zhuǎn)圖
Fig.4 Identification of oscillation and rotation patterns of amino acid functional groups
(a): 2.8 THz oscillation diagram of the internal functional groups of H-amino acid;
(b): 2.41 THz oscillation diagram of the internal functional group of glutamine;
(c): 2.49 THz oscillation diagram of the internal functional group of threonine;
(d): 2.09 THz oscillation diagram of the internal functional group of histidine
指認結(jié)果顯示, 在該頻段內(nèi)氨基酸官能團不發(fā)生振動, 只存在C—C鍵旋轉(zhuǎn), 旋轉(zhuǎn)角約為60°。 C—C鍵旋轉(zhuǎn)使氨基由圖示位置順時針轉(zhuǎn)動, 羧基由圖示位置逆時針轉(zhuǎn)動。
谷氨酰胺、 蘇氨酸、 組氨酸單分子構(gòu)型的太赫茲吸收譜計算結(jié)果在2~3 THz段內(nèi)的吸收峰與實驗吸收譜在該頻段的結(jié)果基本一致, 但其他吸收峰差距較大, 表明樣品的太赫茲吸收譜是分子內(nèi)原子及原子團作用、 分子間氫鍵及范德華力作用的集中體現(xiàn)。 另外, 含R基氨基酸官能團在2~3 THz段的吸收峰為2.8 THz, 而且在該段內(nèi), 含R基官能團振動模式與谷氨酰胺、 蘇氨酸、 組氨酸官能團振轉(zhuǎn)模式只發(fā)現(xiàn)C—C鍵的旋轉(zhuǎn)。 氨基酸官能團在2~3 THz段內(nèi)的振轉(zhuǎn)是氨基酸類物質(zhì)在該段內(nèi)吸收峰的主要來源, 據(jù)此可以實現(xiàn)氨基酸類物質(zhì)的定性指認。