用数学抗病毒:俄科学家采用推荐算法研究药物

2020年7月10日
【 字号:
【《透视俄罗斯》消息】俄罗斯斯科尔科沃科技大学计算科学与工程中心、莫斯科大学化学系和谢切诺夫医科大学科学小组6月在美国化学学会期刊《ACS Omega》发表研究成果。文章主要作者、斯科尔科沃科技大学计算科学与工程中心研究生索斯宁娜(Ekaterina Sosnina)接受采访介绍这项研究的意义。
Research on coronavirus
来源:AP
http://tsrus.cn/669859

扫一扫

你们使用推荐系统确定某种化合物抑制病毒的效果。这一机制是怎样运作的? 

索斯宁娜:几个月来我们几乎每个人都在网上买过东西。您可能会注意到,每家网店都有“热销商品”或“为您推荐”的分类。这些分类中的商品清单通常是用推荐系统筛选的。该算法对商品(类别、基本性能、评价)和买家(看过和买过的商品、对其他商品的评价)的信息进行处理,根据商品类似性信息或购物历史发现买家的偏好规律。因此,我们每个人都会收到个性化推荐清单。

这个算法是怎样适用于化合物的? 

索斯宁娜:工作原理是一样的,只是用抑制具体病毒的化合物推荐代替商品推荐。同时,这种算法并非对每种病毒进行分析,而是对大量化合物对各种病毒影响的全部现有实验室数据加以利用。这有助于我们对未经充分研究甚至全新的病毒进行预测。 

斯科尔科沃科技大学计算科学与工程中心研究生叶卡捷琳娜·索斯宁娜。

那是如何运作的呢?

索斯宁娜:算法根据病毒特点从数据库中选择其他最相似的病毒,并假设类似病毒对同一种化合物的反应是相同的,这样就可以相互确定化合物的作用特点。这个原理和在网店中一样,算法确定具有相似兴趣的买家,向其中一人推荐另一人买过的商品。这种算法能处理完整度不超过1%的数据。换言之,在25万种化合物和158种病毒之间,存在约4000万种可能的相互作用,但其中只有40万种(1%)被实验发现,并能为我们所用。因此,我们的算法有个明显优势,即能使用一个足够小的信息集对大量化合物进行预测。

如何在技术上实现对化学品的分析确定其潜在抗病毒效果? 

索斯宁娜:推荐系统的算法是多任务学习(multitask)的一种形式。为了建立一个预测化合物抗病毒活性的模型,我们使用一个多出口(靶标)数据阵列。它可以是一个化合物数据库,包含化合物在口服、静脉注射或鼻喷使用情况下,抑制不同种类病毒活性的药毒性信息。通常情况下,这些数据是非常稀疏的:构建模型我们只有化合物和数据库出口间所有可能组合的约1%可资利用。使用这种“不完善”的数据很难,但多任务学习算法能克服这一缺陷,有效处理这些数据,并利用其建立可持续预测模型。

你们测试的算法适用于正在测试的新药还是重新评估现有药物的有效性?

索斯宁娜:推荐系统的算法既能预测新化合物,也能预测已被充分研究过的化合物的效果。如果化合物已被充分研究和应用,有关其作用的信息就更多。因此,对其效果的预测比新靶标更准确。这种情况下,一个重要因素是新靶标被研究的程度以及数据库中类似靶标的多寡。

你们的算法能否分析药物对未经充分研究的新病毒的效果,尤其是现在全球关注的SARS-CoV-2? 

索斯宁娜:是的,该算法能预测对新靶标的作用,包括SARS-CoV-2。但要达到最大效果,必须有个更精确的病毒描述系统。我们使用病毒分类学确定不同种类病毒的相似性。这一信息也可用于新冠病毒。 

从与制药公司开展实际合作的角度看,你们的模型有哪些潜力?

索斯宁娜:我们研究的算法允许虚拟筛选最有效的化合物用于进一步实验室研究。这一过程被称为虚拟筛选,制药公司广泛使用能省去研究已知低效化合物的大量时间和资源。推荐系统算法的优点是其能对新靶标作出预测。因此,新病毒活跃期间这种算法有助于在已批准药物中找到最有效品种。此外,如果已知病毒产生抗药性,还可以对药物进行重组。我认为多任务预测算法不会被商业应用忽视。况且其应用范围不仅限于虚拟筛选,例如它们已被用于根据病史和药物兼容性选择合适的药物疗法。

你们计划在哪些市场推广你们的算法?

索斯宁娜:我们目前处于研究阶段,但对项目的商业化很感兴趣。中国市场对我们很有吸引力,因为那里已形成推广推荐算法的基础,无论药物开发还是医疗应用方面。应用此类算法的主要论文恰恰来自中国学者,我在文章中引用了其中一些。

本文为《透视俄罗斯》专稿

| www.tsrus.cn/669859 | 

阿列克谢·莫斯克(Alexey Mosko)

《透视俄罗斯》网站及其所有方《俄罗斯报》拥有网页发布所有信息和资讯的完全版权。未经过《透视俄罗斯》网站编辑书面同意禁止转载。联系邮箱:info@tsrus.cn