可以發(fā)生逃避中和抗體的病毒突變,被稱為病毒逃逸,這種現(xiàn)象阻礙了有效疫苗的開發(fā)。2021年1月14Science報道,美國麻省理工學(xué)院的研究人員開發(fā)了一種計算模型可以對更容易發(fā)生逃逸突變的病毒表面蛋白片段進行精準預(yù)測,識別那些不易發(fā)生逃逸突變的片段作為新疫苗研發(fā)的靶點。研究者使用最初為人類自然語言開發(fā)的機器學(xué)習(xí)算法對病毒逃逸進行建模。逃逸突變保留了病毒感染力但使病毒在免疫系統(tǒng)不能有效識別,類似于保留句子的語法性但改變其含義的單詞變化。研究者針對甲型流感血凝素、HIV-1包膜糖蛋白和SARS-CoV-2尖峰糖蛋白構(gòu)建了三種不同的無監(jiān)督語言模型。這些病毒的語義分析都準確預(yù)測了病毒的逃逸突變,這些突變產(chǎn)生的序列在語法上是正確的,但在語義上被有效改變,因此能夠逃避免疫系統(tǒng)。
該研究證實了語言模型可以僅使用序列數(shù)據(jù)就能準確預(yù)測結(jié)構(gòu)逃逸模式,在自然語言和病毒進化之間建立了一個有潛力的概念橋梁。該模型還適用于癌癥疫苗開發(fā)和不容易發(fā)生耐藥性的分子藥物研發(fā)。了解控制逃逸的復(fù)雜規(guī)則可以為疾病治療設(shè)計提供重要信息。
吳曉燕(中國科學(xué)院成都文獻情報中心)編譯自https://science.sciencemag.org/content/371/6526/284.full