• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于嗅覺(jué)受體激活關(guān)系模擬的氣味感知預(yù)測(cè)*

    2024-02-24 09:02:06左敏胡靜珺顏文婧王瑞東張青川范大維
    關(guān)鍵詞:嗅覺(jué)氣味卷積

    左敏, 胡靜珺, 顏文婧, 王瑞東, 張青川, 范大維

    1.北京工商大學(xué)農(nóng)產(chǎn)品質(zhì)量安全追溯技術(shù)及應(yīng)用國(guó)家工程研究中心,北京 100048

    2.北京市房山區(qū)教師進(jìn)修學(xué)校,北京 102401

    人類(lèi)生理嗅覺(jué)系統(tǒng)十分復(fù)雜,氣味分子和嗅覺(jué)受體(ORs, olfactory receptors)在氣味感知表現(xiàn)中起著關(guān)鍵性作用。氣味分子與嗅覺(jué)受體結(jié)合并激活嗅覺(jué)受體,將氣味信號(hào)傳遞給大腦(Li et al.,2018),最終,人類(lèi)對(duì)氣味信號(hào)的感知被轉(zhuǎn)化為相應(yīng)的描述性詞語(yǔ)(Lapid et al.,2011; Debnath et al.,2020;Francia et al.,2021)。受文化、語(yǔ)言和經(jīng)驗(yàn)的影響,對(duì)于同一個(gè)氣味分子人們可能會(huì)使用不同的感知詞進(jìn)行描述(Majid et al., 2018)。因此,對(duì)氣味分子的氣味感知進(jìn)行預(yù)測(cè)是一項(xiàng)極具挑戰(zhàn)性的任務(wù)。為解決這個(gè)問(wèn)題,近年來(lái)智能信息研究領(lǐng)域嘗試使用機(jī)器學(xué)習(xí)(ML, machine learning)方法構(gòu)建氣味感知預(yù)測(cè)模型(Keller et al., 2017),并獲得了較好的效果。

    目前大多數(shù)的氣味感知預(yù)測(cè)模型都是從分子結(jié)構(gòu)出發(fā)預(yù)測(cè)氣味感知,該方式強(qiáng)烈依賴(lài)于分子表征(Pattanaik et al.,2020)。通常采用的方法是利用計(jì)算機(jī)表示方法對(duì)分子特征進(jìn)行描述,進(jìn)而構(gòu)建機(jī)器學(xué)習(xí)模型。Shang et al.(2017)基于氣味分子參數(shù)(MPs, molecular parameters),采用支持向量機(jī)(SⅤM, support vector machine)對(duì)1 026 個(gè)分子的10 種氣味感知實(shí)現(xiàn)了正確率為97.08%的預(yù)測(cè)。Li et al.(2018)同樣基于MPs,并采用隨機(jī)森林算法(RF, random forest)對(duì)DREAM(dialogue on reverse engineering assessment and methods)數(shù)據(jù)集進(jìn)行氣味感知回歸預(yù)測(cè),氣味強(qiáng)度預(yù)測(cè)的皮爾遜相關(guān)性指標(biāo)達(dá)到了近似0.6。Kasyap et al.(2022)采用圖神經(jīng)網(wǎng)絡(luò)(GNNs, graph neural networks)提取分子結(jié)構(gòu)特征并在DREAM 數(shù)據(jù)集上進(jìn)行氣味感知多分類(lèi)預(yù)測(cè),模型的AUC指標(biāo)為0.89。

    然而,從生理學(xué)機(jī)制上看,僅僅考慮分子物化特性無(wú)法對(duì)氣味感知的形成進(jìn)行解釋?zhuān)嗨频姆肿咏Y(jié)構(gòu)可能產(chǎn)生不同的感知,而不同的分子結(jié)構(gòu)也可能會(huì)產(chǎn)生相同的感知。研究者已經(jīng)對(duì)人類(lèi)嗅覺(jué)生理學(xué)機(jī)制進(jìn)行揭秘,發(fā)現(xiàn)激活的嗅覺(jué)受體是氣味感知產(chǎn)生的關(guān)鍵(Buck,2008)。目前只有少數(shù)研究基于氣味分子-嗅覺(jué)受體激活關(guān)系進(jìn)行氣味感知預(yù)測(cè)。Kowalewski et al.(2020)發(fā)現(xiàn),在氣味感知預(yù)測(cè)任務(wù)上,結(jié)合嗅覺(jué)受體激活特征對(duì)氣味分子進(jìn)行感知預(yù)測(cè)更具優(yōu)勢(shì),可取得更好的效果。

    本研究首先創(chuàng)新性地構(gòu)建了嗅覺(jué)受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò),通過(guò)引入人類(lèi)嗅覺(jué)受體蛋白之間的復(fù)雜關(guān)系來(lái)學(xué)習(xí)氣味分子和嗅覺(jué)受體之間的復(fù)雜非線(xiàn)性高維關(guān)系。其次,采用圖卷積網(wǎng)絡(luò),在分子拓?fù)浣Y(jié)構(gòu)和蛋白質(zhì)網(wǎng)絡(luò)結(jié)構(gòu)上提取氣味分子和嗅覺(jué)受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)上的關(guān)鍵特征,在大規(guī)模氣味感知數(shù)據(jù)集DREAM 上實(shí)現(xiàn)對(duì)氣味感知的精準(zhǔn)預(yù)測(cè)。最后,基于預(yù)測(cè)的嗅覺(jué)受體激活信息,并結(jié)合模型正確決策的解釋性分析,對(duì)氣味分子-嗅覺(jué)受體活動(dòng)-氣味感知之間的模式進(jìn)行分析,為人類(lèi)嗅覺(jué)研究提供新的視角。

    1 研究方法

    1.1 研究框架

    本研究首先基于人類(lèi)嗅覺(jué)受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)構(gòu)建嗅覺(jué)受體激活預(yù)測(cè)模型,通過(guò)圖卷積方法分別提取氣味分子和嗅覺(jué)受體蛋白的特征。其次,基于嗅覺(jué)受體激活預(yù)測(cè)模型的模擬結(jié)果,融合分子摩根指紋,基于DREAM 數(shù)據(jù)集實(shí)現(xiàn)對(duì)氣味感知的回歸預(yù)測(cè)。

    工作流程如圖1所示。

    圖1 氣味感知預(yù)測(cè)工作流程圖Fig.1 Olfactory perception prediction workflow diagram

    1.2 蛋白質(zhì)特征構(gòu)建

    1.2.1 嗅覺(jué)受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)構(gòu)建本研究收集了43 個(gè)經(jīng)過(guò)生物實(shí)驗(yàn)驗(yàn)證的確定可以被特定配體激活的人類(lèi)嗅覺(jué)受體(Ⅴassar et al.,1993; Mata‐razzo et al.,2005; Jacquier et al.,2006; Neuhaus et al.,2006; Braun et al.,2007; Fujita et al.,2007;Keller et al.,2007; Menashe et al.,2007; Schmiede‐berg et al.,2007; Cook et al.,2009; Saito et al.,2009; Jaeger et al.,2013; Topin et al.,2014; Shirasu et al.,2014),采用One-Hot編碼表示嗅覺(jué)受體蛋白氨基酸序列。嗅覺(jué)受體蛋白質(zhì)三級(jí)結(jié)構(gòu)信息有兩個(gè)不同的來(lái)源。經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證的結(jié)構(gòu)來(lái)自于Uniport 蛋白質(zhì)數(shù)據(jù)庫(kù),未知的嗅覺(jué)受體蛋白質(zhì)三級(jí)結(jié)構(gòu)則采用AlphaFold 蛋白質(zhì)3D 結(jié)構(gòu)預(yù)測(cè)模型進(jìn)行預(yù)測(cè)。

    嗅覺(jué)受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)以嗅覺(jué)受體蛋白質(zhì)作為節(jié)點(diǎn),其氨基酸序列作為節(jié)點(diǎn)特征,嗅覺(jué)受體蛋白質(zhì)三級(jí)結(jié)構(gòu)的相似關(guān)系作為邊。根據(jù)已獲得的嗅覺(jué)受體蛋白質(zhì)三級(jí)結(jié)構(gòu),本研究采用TMscore (template modeling score)方法計(jì)算蛋白質(zhì)之間的相似度。TM-score 是一種用于評(píng)估蛋白質(zhì)結(jié)構(gòu)拓?fù)湎嗨菩缘闹笜?biāo),通過(guò)比較兩個(gè)蛋白質(zhì)全局結(jié)構(gòu)的相似性來(lái)評(píng)估它們的匹配程度,其取值范圍介于0 到1 之間。TM-score 低于0.17 被認(rèn)為對(duì)應(yīng)于隨機(jī)選擇的不相關(guān)蛋白質(zhì)(Zhang et al.,2004),而大于0.5 則表示具有相似的折疊狀態(tài)(Xu et al.,2010)。 TM-score的計(jì)算公式為

    其中Ltarget是目標(biāo)蛋白質(zhì)的氨基酸序列長(zhǎng)度,Lcommom是在模板結(jié)構(gòu)和目標(biāo)結(jié)構(gòu)中均存在的殘基數(shù)量,dt是模板和目標(biāo)結(jié)構(gòu)中第t對(duì)殘基之間的距離,d0(Ltarget)是用來(lái)歸一化距離的距離尺度。獲得嗅覺(jué)受體蛋白質(zhì)三級(jí)結(jié)構(gòu)相似度后,可以構(gòu)建嗅覺(jué)受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)。

    1.2.2 蛋白質(zhì)圖卷積特征圖卷積(graph convo‐lution)是一種適用于處理具有節(jié)點(diǎn)間關(guān)聯(lián)關(guān)系的圖數(shù)據(jù)的卷積操作方法。在本研究中,嗅覺(jué)受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)表示為Gp=(Vp,Ep),其中節(jié)點(diǎn)集合Vp表示嗅覺(jué)受體蛋白氨基酸序列集合,邊集合Ep表示嗅覺(jué)受體蛋白質(zhì)三級(jí)結(jié)構(gòu)之間的相似度集合。每個(gè)節(jié)點(diǎn)的特征向量定義為vp,vp∈Vp,邊的特征向量定義為ep,ep∈Ep。

    嗅覺(jué)受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)是通過(guò)對(duì)嗅覺(jué)受體蛋白氨基酸序列和嗅覺(jué)受體蛋白質(zhì)三級(jí)結(jié)構(gòu)相似度進(jìn)行編碼得到的。嗅覺(jué)受體蛋白氨基酸序列被編碼為一個(gè)具有20 種氨基酸和331 個(gè)序列位置的特征向量,其維度為[20,331],嗅覺(jué)受體蛋白質(zhì)三級(jí)結(jié)構(gòu)間相似度被編碼為一個(gè)維度為1 的特征向量。

    蛋白質(zhì)圖卷積特征的構(gòu)建方法如下:

    1.3 分子特征構(gòu)建

    1.3.1 分子摩根指紋在本研究中,任意分子圖表示為Gm=(Vm,Em),其中節(jié)點(diǎn)集合Vm表示原子集合,邊集合Em表示化學(xué)鍵集合。每個(gè)原子的特征向量定義為vm,vm∈Vm,化學(xué)鍵的特征向量定義為em,em∈Em。

    摩根指紋(Morgan fingerprints)方法是一種用于描述分子結(jié)構(gòu)的化學(xué)指紋方法。它基于分子的拓?fù)浣Y(jié)構(gòu),對(duì)于節(jié)點(diǎn)v通過(guò)遞歸遍歷分子的鄰居節(jié)點(diǎn)u∈Rv,Rv是與節(jié)點(diǎn)v相連的節(jié)點(diǎn)集合,并將鄰居節(jié)點(diǎn)的特征向量進(jìn)行累積求和。然后,將累積特征向量Fu與連接邊的信息Gu,v進(jìn)行異或操作,并通過(guò)哈希函數(shù)進(jìn)行映射,最終得到摩根指紋。摩根指紋計(jì)算公式

    1.3.2 分子圖卷積指紋分子圖卷積指紋基于分子拓?fù)浣Y(jié)構(gòu)進(jìn)行分子特征提取,分子和化學(xué)鍵的特征基于原子符號(hào)、相鄰原子、相鄰氫原子、隱含價(jià)、芳香性以及化學(xué)鍵類(lèi)型等進(jìn)行編碼。具體如表1所示。

    表1 分子特征向量構(gòu)成Table 1 Molecular feature vector composition

    對(duì)分子圖進(jìn)行圖卷積操作

    1.4 預(yù)測(cè)模型

    1.4.1 SⅤM支持向量機(jī)(SⅤM, support vector machine)是一種常用的監(jiān)督學(xué)習(xí)算法,其基本原理是尋找一個(gè)最優(yōu)的超平面,將樣本空間分成兩個(gè)不同類(lèi)別,并最大化樣本與超平面之間的間隔。對(duì)每一個(gè)樣本數(shù)據(jù),SⅤM決策函數(shù)

    其中x是輸入樣本特征向量,WSVM是決策函數(shù)的權(quán)重矩陣,bSVM是偏置項(xiàng),sign是符號(hào)函數(shù)。

    1.4.2 ELM極限學(xué)習(xí)機(jī)(ELM, extreme learning machine)通過(guò)隨機(jī)初始化輸入層和輸出層之間的權(quán)重,然后利用解析解的方式直接計(jì)算隱藏層的權(quán)重。這使得ELM 能夠快速地訓(xùn)練神經(jīng)網(wǎng)絡(luò),并在很短的時(shí)間內(nèi)生成準(zhǔn)確的預(yù)測(cè)結(jié)果。對(duì)每一個(gè)樣本數(shù)據(jù),ELM決策函數(shù)

    其中x是輸入樣本特征向量,HELM(x)是基于輸入特征計(jì)算得到的隱藏層輸出矩陣,WELM是輸出層到隱藏層的權(quán)重矩陣,bELM是偏置項(xiàng)。

    1.4.3 XGBoostXGBoost 是一種基于梯度提升樹(shù)的集成學(xué)習(xí)算法。它通過(guò)迭代訓(xùn)練多個(gè)弱分類(lèi)器(通常是決策樹(shù)),并將它們組合成一個(gè)強(qiáng)大的模型。對(duì)全部N個(gè)樣本數(shù)據(jù),XGBoost的目標(biāo)函數(shù)

    其中LossXGB(yn,)是第n個(gè)樣本的損失函數(shù),yn是樣本n的標(biāo)簽,是樣本n的預(yù)測(cè)值,Ω(Φ)表示模型中的每個(gè)子模型的正則化項(xiàng),Q是決策樹(shù)的個(gè)數(shù),γ是正則化系數(shù)。

    1.4.4 BP 神經(jīng)網(wǎng)絡(luò)BP(back propagation)人工神經(jīng)網(wǎng)絡(luò)模型基于反向傳播算法,通過(guò)不斷調(diào)整網(wǎng)絡(luò)中連接權(quán)重和偏置,使網(wǎng)絡(luò)能夠?qū)W習(xí)輸入與輸出之間的高維非線(xiàn)性映射關(guān)系。

    BP神經(jīng)網(wǎng)絡(luò)的標(biāo)準(zhǔn)前向傳播公式為

    其中P表示訓(xùn)練樣本的個(gè)數(shù)。

    1.5 SⅤD-PCA

    基于奇異值分解(SⅤD, singular value decom‐position)的主成分分析(PCA, principal component analysis)是一種常用的降維技術(shù)。SⅤD-PCA 的優(yōu)點(diǎn)是可以處理高維數(shù)據(jù),并且對(duì)異常值具有較好的魯棒性。

    給定一個(gè)數(shù)據(jù)矩陣XSP,首先對(duì)XSP進(jìn)行標(biāo)準(zhǔn)化處理獲得矩陣,使得每個(gè)特征均值為0,方差為1。然后,對(duì)標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣進(jìn)行SⅤD分解

    其中C和O是由SⅤD計(jì)算得到的矩陣,S是由SⅤD得到的正交矩陣。

    PCA 的結(jié)果是通過(guò)選擇奇異值及其對(duì)應(yīng)的左奇異向量來(lái)進(jìn)行降維。主成分矩陣可以通過(guò)以下公式計(jì)算得到

    其中Z是降維后的數(shù)據(jù)矩陣。

    2 實(shí)驗(yàn)過(guò)程

    2.1 實(shí)驗(yàn)數(shù)據(jù)集

    2.1.1 數(shù)據(jù)庫(kù)1:氣味分子-嗅覺(jué)受體激活關(guān)系數(shù)據(jù)庫(kù)本文基于現(xiàn)有發(fā)表文獻(xiàn)建立氣味分子-嗅覺(jué)受體激活關(guān)系數(shù)據(jù)庫(kù),所有數(shù)據(jù)都來(lái)自于截至在2023 年7 月之前Web of Science 數(shù)據(jù)庫(kù)中收錄的文獻(xiàn)。數(shù)據(jù)庫(kù)共收集了43 個(gè)人類(lèi)嗅覺(jué)受體,以及它們對(duì)選定的170個(gè)化合物的254條激活關(guān)系和61條非激活關(guān)系數(shù)據(jù)。

    2.1.2 數(shù)據(jù)庫(kù)2:氣味分子-氣味感知關(guān)系數(shù)據(jù)庫(kù)DREAM 數(shù)據(jù)集使用包括強(qiáng)度、愉悅度和熟悉度在內(nèi)的23 個(gè)感知定義氣味感知。數(shù)據(jù)集包括49 名健康參與者(沒(méi)有專(zhuān)業(yè)氣味感知訓(xùn)練)對(duì)476種氣味分子產(chǎn)生的21 種氣味感知數(shù)據(jù),評(píng)分范圍為0~100。本研究選用標(biāo)記為“高濃度”的數(shù)據(jù)共405 條。

    2.2 嗅覺(jué)受體激活預(yù)測(cè)模型訓(xùn)練

    嗅覺(jué)受體激活預(yù)測(cè)XGBoost 模型參數(shù)設(shè)置如表2所示。

    表2 XGBoost模型參數(shù)調(diào)節(jié)范圍1)Table 2 Parameter adjustment range of XGBoost model

    模型評(píng)價(jià)指標(biāo)選取準(zhǔn)確率(accuracy)、F1-score、受試者工作特征(ROC, receiver operating character‐istic curve)的曲線(xiàn)下面積(AUC, area under the curve)。

    2.3 氣味感知預(yù)測(cè)模型訓(xùn)練

    氣味感知預(yù)測(cè)模型訓(xùn)練采用5折交叉驗(yàn)證,即將數(shù)據(jù)劃分為大致相等的5個(gè)子數(shù)據(jù)集,依次采用不同數(shù)據(jù)集作為訓(xùn)練集和測(cè)試集。取5次訓(xùn)練平均精度的平均值即得到模型精度,這樣得到的模型精度更具有泛化性。

    氣味感知預(yù)測(cè)BP模型參數(shù)設(shè)置如表3所示。

    表3 BP模型參數(shù)調(diào)節(jié)范圍1)Table 3 Parameter adjustment range of BP model

    模型評(píng)價(jià)指標(biāo)選取R2-score、皮爾遜相關(guān)性、均方根誤差(RMSE, root mean square erro)。

    3 實(shí)驗(yàn)結(jié)果與分析

    3.1 嗅覺(jué)受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)

    本研究使用嗅覺(jué)受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)中100%的相似度、前70%的相似度、前50%相似度網(wǎng)絡(luò)關(guān)系,獲取相關(guān)網(wǎng)絡(luò)性質(zhì)指標(biāo),并使用基于模塊度的社區(qū)發(fā)現(xiàn)算法分析網(wǎng)絡(luò)的模塊性(Blondel et al.,2008)。分析如表4所示。本研究基于相似度排名前50%的數(shù)據(jù)繪制出嗅覺(jué)受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)圖(圖2)。使用相似度排名前50%的網(wǎng)絡(luò)呈現(xiàn)出明顯的3個(gè)子模塊,且不存在孤立節(jié)點(diǎn)。屬于同一模塊的嗅覺(jué)受體具有相似的蛋白質(zhì)結(jié)構(gòu),比如,圖2中嗅覺(jué)受體OR2J3 與OR2J2 同屬于一個(gè)社區(qū)模塊,同時(shí),研究也證實(shí)它們是人類(lèi)嗅覺(jué)受體中最為相似的嗅覺(jué)受體對(duì)之一(Crasto et al.,2002)。

    表4 嗅覺(jué)受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)概覽Table 4 Network overview of olfactory receptor protein relationship

    圖2 嗅覺(jué)受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò)(前50%)Fig.2 Olfactory receptor protein relationship network (Top 50%)

    3.2 基于不同特征提取方式的嗅覺(jué)受體激活預(yù)測(cè)結(jié)果比較

    分子的表征方式在化學(xué)領(lǐng)域中尚未形成統(tǒng)一的標(biāo)準(zhǔn),不同的表征方法各具優(yōu)勢(shì)和局限性。本文對(duì)氣味分子和嗅覺(jué)受體蛋白分別采用了兩種不同的特征提取方法,并進(jìn)行對(duì)比實(shí)驗(yàn)。結(jié)果如表5所示。結(jié)果表明,當(dāng)分別使用圖卷積進(jìn)行分子特征和嗅覺(jué)受體蛋白氨基酸序列特征提取時(shí),采用XGBoost 算法實(shí)現(xiàn)了最佳的嗅覺(jué)受體激活預(yù)測(cè)效果,準(zhǔn)確率為77%,F(xiàn)1-score 為0.78,AUC 值為0.77。4 種特征提取方式AUC 比較結(jié)果如圖3所示。

    表5 不同分子特征提取方式組合在數(shù)據(jù)庫(kù)1上的準(zhǔn)確率、 F1-score和AUCTable 5 Accuracy, F1-score, and AUC of different feature extraction methods for database 1

    圖3 不同特征提取方式組合的ROC曲線(xiàn)及AUC值Fig.3 ROC curves and AUC values of different feature extraction methods

    3.3 基于不同分類(lèi)器的嗅覺(jué)受體激活預(yù)測(cè)模型比較

    基于圖卷積特征提取,本文采用XGBoost、SⅤM 以及ELM 3 種機(jī)器學(xué)習(xí)方法進(jìn)行嗅覺(jué)受體激活預(yù)測(cè),并進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果如表6所示。實(shí)驗(yàn)結(jié)果表明,XGBoost 算法在氣味分子-嗅覺(jué)受體激活關(guān)系數(shù)據(jù)庫(kù)上表現(xiàn)結(jié)果最優(yōu),準(zhǔn)確率為77%,F(xiàn)1-score 為0.78,AUC 為0.77。3 種分類(lèi)器的嗅覺(jué)受體激活預(yù)測(cè)模型AUC比較結(jié)果如圖4所示。

    表6 不同分類(lèi)器的嗅覺(jué)受體激活預(yù)測(cè)模型在數(shù)據(jù)庫(kù)1的準(zhǔn)確率、F1-score和AUCTable 6 Accuracy, F1-score and AUC of olfactory receptor activation prediction models for different classifiers on database 1

    圖4 不同分類(lèi)器的嗅覺(jué)受體激活預(yù)測(cè)模型的ROC曲線(xiàn)和AUC值Fig.4 ROC curves and AUC values of olfactory receptor activation prediction models for different classifiers

    3.4 氣味感知預(yù)測(cè)結(jié)果比較

    本研究在嗅覺(jué)受體激活預(yù)測(cè)模型的基礎(chǔ)上,對(duì)DREAM 數(shù)據(jù)集中的化合物與43 個(gè)嗅覺(jué)受體的激活關(guān)系進(jìn)行預(yù)測(cè),將獲得的新氣味分子-嗅覺(jué)受體激活關(guān)系作為分子特征應(yīng)用于氣味感知預(yù)測(cè)模型。在數(shù)據(jù)集和回歸預(yù)測(cè)模型相同的情況下,引入氣味分子-嗅覺(jué)受體激活關(guān)系進(jìn)行氣味感知預(yù)測(cè)結(jié)果明顯優(yōu)于僅基于分子結(jié)構(gòu)進(jìn)行氣味感知預(yù)測(cè)。實(shí)驗(yàn)結(jié)果說(shuō)明在進(jìn)行氣味感知預(yù)測(cè)時(shí),考慮嗅覺(jué)受體的活動(dòng)情況是必要的。實(shí)驗(yàn)結(jié)果如表7所示。

    表7 不同特征提取方式在DREAM數(shù)據(jù)集上的R2-score、 r和RMSETable 7 R2-score, r and RMSE on the DREAM dataset with different feature extraction methods

    在3.3 節(jié)中,對(duì)于嗅覺(jué)受體激活預(yù)測(cè)任務(wù),圖卷積特征提取方法明顯優(yōu)于摩根指紋特征提取。然而,在本節(jié)的氣味感知預(yù)測(cè)任務(wù)中,摩根指紋方法表現(xiàn)更優(yōu)。這是由于圖卷積方法和摩根指紋方法對(duì)分子特征表達(dá)方式不同造成的。圖卷積方法基于圖結(jié)構(gòu)進(jìn)行特征提取,考慮了原子之間的連接關(guān)系,在捕捉分子的全局信息上具有優(yōu)勢(shì)。而摩根指紋根據(jù)分子的物理化學(xué)性質(zhì)進(jìn)行有效編碼,更擅長(zhǎng)總結(jié)分子的理化特征(Cereto-Massagué et al.,2015; Duvenaud et al.,2015; Kipf et al.,2016)。

    3.5 氣味分子-嗅覺(jué)受體激活-氣味感知模式

    本研究通過(guò)嗅覺(jué)受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò),整合了DREAM 數(shù)據(jù)集和氣味分子-嗅覺(jué)受體激活關(guān)系信息。采用基于奇異值分解的主成分分析方法對(duì)嗅覺(jué)受體在特定氣味感知中的貢獻(xiàn)進(jìn)行分析。嗅覺(jué)受體對(duì)21 種氣味感知的貢獻(xiàn)度歸一化后的結(jié)果如圖5所示。大部分嗅覺(jué)受體會(huì)對(duì)特定氣味感知產(chǎn)生較高的貢獻(xiàn)度(Audouze et al.,2014)。

    圖5 嗅覺(jué)受體對(duì)氣味感知貢獻(xiàn)度Fig.5 Olfactory receptor contribution to olfactory perception

    此外,本研究采用密度聚類(lèi)算法(Campello et al.,2020),對(duì)來(lái)自DREAM 數(shù)據(jù)集的405 個(gè)氣味分子的43 個(gè)嗅覺(jué)受體激活特征進(jìn)行聚類(lèi),將分子分為4個(gè)類(lèi)別,并繪制了氣味分子-嗅覺(jué)受體激活-氣味感知模式圖。如圖6所示,產(chǎn)生激活關(guān)系少于20條的嗅覺(jué)受體并沒(méi)有被繪制,DREAM 數(shù)據(jù)集中氣味感知評(píng)分低于5 分的氣味感知描述詞沒(méi)有被繪制。

    圖6 氣味分子-嗅覺(jué)受體激活-氣味感知模式Fig.6 Odor molecule-olfactory receptor activation-olfactory pattern

    研究結(jié)果表明,經(jīng)由氣味分子-嗅覺(jué)受體激活關(guān)系對(duì)分子進(jìn)行分類(lèi)在氣味感知上出現(xiàn)了明顯的模式上的不同。例如,“腐爛(decayed)”只與第1類(lèi)分子激活的3個(gè)嗅覺(jué)受體相連;“花(flower)”只與第4類(lèi)分子激活的4個(gè)嗅覺(jué)受體相連等,本研究部分結(jié)果與已得到的生物實(shí)驗(yàn)結(jié)果驗(yàn)證一致(Chaput et al.,2012; El Mountassir et al.,2016; Keller et al.,2016)。本研究同時(shí)嘗試了使用SMⅠLES分子表達(dá)式和摩根指紋對(duì)分子進(jìn)行聚類(lèi),所獲得的結(jié)果難以提取出明顯的氣味分子-嗅覺(jué)受體激活-氣味感知模式。

    4 結(jié) 語(yǔ)

    本研究旨在提出一種基于數(shù)據(jù)驅(qū)動(dòng)方法的氣味感知預(yù)測(cè)和分析的新解決方案。首先,構(gòu)建了嗅覺(jué)受體蛋白質(zhì)關(guān)系網(wǎng)絡(luò),采用圖卷積方法以獲得更全面有效的嗅覺(jué)受體蛋白特征。在嗅覺(jué)受體激活關(guān)系數(shù)據(jù)的基礎(chǔ)上,構(gòu)建了嗅覺(jué)受體激活預(yù)測(cè)模型。其次,面向DREAM 數(shù)據(jù)集并引入其嗅覺(jué)受體激活數(shù)據(jù),以提供必要的生理信息補(bǔ)充,實(shí)現(xiàn)對(duì)氣味分子感知的精準(zhǔn)預(yù)測(cè)。最后,對(duì)模型形成的正確決策機(jī)制進(jìn)行解釋分析,并總結(jié)了氣味分子-嗅覺(jué)受體激活-氣味感知模式。研究結(jié)果表明,綜合考慮氣味分子特征和氣味分子-嗅覺(jué)受體激活關(guān)系構(gòu)建預(yù)測(cè)模型,能夠獲得更好的預(yù)測(cè)結(jié)果,并獲得對(duì)人類(lèi)氣味感知模式的有效總結(jié)。

    盡管研究結(jié)果仍需要進(jìn)一步驗(yàn)證,但本研究為進(jìn)一步探索和理解氣味感知機(jī)制提供了有價(jià)值的參考和啟示。未來(lái)的工作將面向更多的氣味感知數(shù)據(jù)集進(jìn)一步優(yōu)化模型,基于數(shù)據(jù)驅(qū)動(dòng)技術(shù)進(jìn)一步學(xué)習(xí)氣味分子與嗅覺(jué)受體激活的對(duì)接模型,為氣味感知的預(yù)測(cè)提供更多有用的信息,進(jìn)一步推進(jìn)人類(lèi)嗅覺(jué)機(jī)理研究。

    猜你喜歡
    嗅覺(jué)氣味卷積
    基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
    好的畫(huà),通常都有氣味
    文苑(2020年7期)2020-08-12 09:35:58
    從濾波器理解卷積
    電子制作(2019年11期)2019-07-04 00:34:38
    超強(qiáng)嗅覺(jué)
    基于傅里葉域卷積表示的目標(biāo)跟蹤算法
    氣味來(lái)破案
    讓你的嗅覺(jué)降降溫吧!
    Coco薇(2016年8期)2016-10-09 19:40:47
    車(chē)禍撞沒(méi)了嗅覺(jué) 怎么賠?
    公民與法治(2016年8期)2016-05-17 04:11:46
    好濃的煤氣味
    這個(gè)“氣味”不簡(jiǎn)單
    巴彦淖尔市| 清丰县| 武夷山市| 吐鲁番市| 镇远县| 天津市| 资溪县| 台州市| 佛学| 新巴尔虎左旗| 锡林浩特市| 宁城县| 秦皇岛市| 龙泉市| 大名县| 吉隆县| 托克逊县| 镇远县| 新沂市| 青阳县| 井陉县| 礼泉县| 石景山区| 平阴县| 嘉定区| 朝阳市| 景德镇市| 常宁市| 青岛市| 宁都县| 星座| 奎屯市| 永胜县| 探索| 乌兰县| 凤阳县| 美姑县| 砀山县| 太和县| 西充县| 陇南市|