AI智能
改变未来

Insilico Medicine创始人兼CEO Alex Zhavoronkov:深度学习以及合成化学正在引领AI药物研发变革

2020 年 11 月 19 日,第四届 EmTech China 全球新兴科技峰会于苏州市相城区召开。作为在全球享有盛誉,以权威见解深度解读全球科技趋势的盛会之一,《麻省理工科技评论》 的 EmTech 系列峰会已成为全球最具影响力的科技会议风向标。今年,EmTech China 2020 继续以技术与商业的结合为主线,数十位世界顶级科学家、海内外院士、商业领袖、科创精英莅临现场,探讨新兴科技发展现状及其为人类社会带来的巨大影响。此外,《麻省理工科技评论》“50 家聪明公司” 2020 年榜单也在现场重磅发布。会上,Insilico Medicine 创始人兼 CEO Alex Zhavoronkov 发表了主题演讲。


以下为整理后的演讲实录:

非常荣幸能够在这里给大家演讲。我有 30 多张幻灯片给大家呈现,这是非常新的话题。
一个是合成生物学,一个是合成化学,这些技术是我们所研究的方向。我们进行了研究,并且已经生产出了产品。
这些技术也被《麻省理工科技评论》评选成为 2020 年全球前十大突破技术。之后我想跟大家介绍一下关于药物发现和生成强化学习的课题。
人类一直谈论的话题就是长寿,与长寿有关的科学研究层出不穷。
生成性的强化学习在各个方面推出创新。以前可能还不是特别普遍,但现在连学生都已经知道了。
这样一个技术实际上也是应用到方方面面,比如说生物的预测、鞭策,生物标记物的发展,生物码表、识别,分子筛选、分子生成以及临床实验设计等等,使用这个技术用于分子生成的应用是非常多的。比如应用在生物年龄的预测和监测上、全球实际数据的分析等。
我们公司名字叫做英矽智能,在全球有 120 多名员工,同时也有研发中心。研发中心遍布六个国家和城市。自 2014 年以来,我们融资超过 5200 万美元,这些资金用于研究新的靶点和新的药物分子,我们有靶点识别的研究工作,帮助大家尽快研发这些药物来治疗疾病。
大家可以看到阴阳图,其实软件工程,包括 AI 的软件工程,还有我们内部的研发管线来说就像阴阳图一样,我们要知道一点,即分子可以带来实际的价值。有分子的发现,才有药物的发现。分子这一环节是非常重要的。我们在大概 70 多个项目中发现了新的分子,并希望用 AI 软件帮助发现靶点,同时推动更多人把这项技术用于药物研发。
这张研发流程图显示着药物研发时间表,每一步都要花很长时间。
首先第一步就是对靶点的假设,这是发现药物非常重要的一步。我们知道这个疾病,之后才会发现相应的靶点还有靶标分子。

用生物学的方法进行验证,有时候可能需要花几个月、甚至几十年的时间,之后七年半需要进行人体临床实验。
一个药物的整个研发大概需要花 26 亿美元,以及很长时间,而且失败率也是非常高的。
我们把所有这些步骤结合成一个步骤,在一个平台上面来进行。它包含了靶点发现、生成化学、虚拟筛选、临床实验结果的预测,等等。
我们在非常顶尖的期刊上发表了论文。
有一些大型公司在做临床实验结果预测,未来 2-3 年也许会知道这个预测结果到底是怎么样的,我们的成果如何。
我们所打造 AI 技术,是可以直接引入到药物研发的每一个环节之中。
我们也花了很多的资金、时间以及努力,用于发现靶点以及靶点分子,一直到临床实验这一阶段。
假设生成靶点需要 2-3 年的时间,如果那些药物本身是失败的,我们可以快速淘汰,然后再进行新的靶点的发现,这样就可以帮助我们节省时间和成本。
通过 AI 等技术和平台,我们可以识别到非常好的靶点,这样在内部的研发管线上,我们可以快速发现、识别这些靶点并进行测试。这样不仅让整个速度提升,也增加了赢得利润的概率。
在这里看一下,我们希望简化我们的靶点,更简化我们的生物医学,这样就可以减少成本。对一些小的生物医药公司来说,他们的时间成本、金钱成本通过这些技术得以下降。
另外一个想跟大家提到的技术就是 GANs,即生成对抗网络。2016 年的时候有 GANs 相关的论文发表,那时候是早期的研究。这个方法推出的时候就好像变魔术一样非常的奇妙。大家来看一下这两个图片,同时用对抗的方法,对生成器网络进行培训。比如说用文本,通过文本的训练,不需要搜索就能生成这样的图片,这个图片其实在我们日常正常生活中是不存在的。在 2017 年的时候,另外一个文章又发表了,这篇文章说 GANs 可以生成非常高质量的数据,而且是人类的数据。所谓人类的数据就是现实生活中不存在的一个人,但通过这个文本可以生成这样的人类的数据。
但是不幸的是,现在的技术主要是用于娱乐,真是大材小用了。现在,我们可以用在分子生成上。
分子也是离散数据,分子里面小小的结构变化会造成多种属性的变化。分子结构上一个地方发生了变化或者出现了错误,会有很大的影响。

这个图像是所谓的连续流行,危险的改变不会影响图像的属性。
我们可以看一下深度学习以及合成化学的发展历史。然后从 1945 年概念的生成,2014 年推出的概念。之后谷歌、苹果使用了这个概念,我们处在早期阶段,希望可以使用 Gan 发现靶点、生成分子。我们也进行了很多理论研究,已经发表了很多论文。
去年发表的一篇论文非常有名。如果找到一个靶点,我们可以在 20 天之内,生成非常高质量的分子进行合成或者进行监测,在动物身上可以,在人类身上也可以。
在这里看到一个时间表,这个时间表表示的是我们发展自己内部的平台可供很多大型的医药公司使用。大概有 4 大品牌使用了我们的平台,用于分子的合成。
这是非常昂贵的部署,但是我们还是要这么做。它是所谓的操作系统,我们在 AI 科学家和化学家的帮助下在上面进行合成化学。
我们搭建这个系统确实花了很多时间。在设计模型时,我们必须要使用真正的化学来进行验证。分子合成化学只是一个实验模型。
如何知道它在现实世界中是否可以使用呢?我们大概需要 6 个月的时间进行 AI 建模,需要一年的时间进行测试,对于我们来说,也是花了很多的时间才能达到这样的能力。我们给客户提供的一站式服务,其实都是药物发现软件平台。
我们这周才发布了一个多组学靶点发现平台,大家都可以登录申请一个账号,它其实是一个小分子生成化学平台,我们将在明年进一步提升它。还有我们的 inconacal,是和很多的种子基金或者风投基金进行合作。我们主要有一些风投基金,他们会投资于一些初创公司来看他们的临床实验。
因为很多制药企业,尤其是小型制药企业,能够提前去了解。尤其是他们的投资者,非常希望了解这些公司的药物在临床实验中会有什么样的表现,所以我们主要是和一些金融公司一起来合作的。

药物的 AI 模式已经有了非常大的变革,在中国有很多点石成金的能力,有很多中国的教授都纷纷下海成立了自己的公司。AI 其实已经用在了生物验证上面,但还是需要一些时间。因此我们必须要有自己内生的或者嵌入式的这些算法平台。现在公司买的并不是你的软件,而是你在里面嵌入的算法。这是一个 AI 驱动药物发现的流程,现在我们已经进行了体内和体外的验证,非常期待能够看到它的下一步发展。
我们在 2018 年用 AI 发现了靶点,之后我们进行了靶点的测试,进行了 AI 生物标记的发现,然后用 AI 来设计化合物,并进行了体内和体外验证,又进行了 PCC。
当然还需要有进一步的提升,比如先导化合物的骨架设计。在这里也涉及到蛋白酶,针对现在的新冠疫情,有一个特别特殊的蛋白酶是 3CL 蛋白酶,使用 AI 马上就能够制备出这样的结构。我们可以与化学家、生化学家进行合作。其实在我们之前的化合物库里面,是找不到这种蛋白酶的架构的,所以我们完全是由 AI 来进行从零开始的骨架搭建。
在这张 PPT 当中,如果你是一个化学家或者生化学家,可以从里面找到很多信息。一言以蔽之,红色的就是不好的信息,需要我们进一步来提升的,绿色的是我们做的好的方面。

现在还有一个瓶颈,是如何在老鼠的体内去实验新冠药物。现在有很多的公司希望能够做,但是只有很少经过认证的实验室可以去做。
这是我们现在最新的蛋白酶抑制剂。有一家公司特别关注衰老过程以及衰老机制。我们想象一下,如果现在肿瘤从世界上消失了,人类平均年龄就会增长 2.3 年。为什么增幅这么小?因为还有 200 多种疾病等着杀死人类。2.3 年听上去不是很多,现在美国的平均寿命已经超过了 78 岁,如果增加 2.5 年,其实并没有太多的变化。
但这涉及到我们衰老过程中非常重要的一个问题。如果你准时睡觉、好好吃饭、好好休息,可能你的寿命会加 5 到 10 年。 
如果只是消灭一种疾病的话,并不能够极大地改变我们的平均年龄,所以我们要做的就是理解衰老背后的机制。既然能攻破 1 个,就能攻破 100 个疾病。我现在讲的科技其实跟前面那种是完全不一样的,我们现在在训练深度神经网络去预测人的生物寿命,怎么去理解?相当于有一个 DMN,当中有很多的神经原,我们可以从图片当中拿到所有的数据,它要做的只是一件事情,就是去预测寿命。 
疾病是有发病年龄阶段的,我们可以更好地利用病例数据去了解这个人的生物寿命是在哪个阶段,我们还可以进行基因的分析。它其实是有很大的潜力的。相当于使用了不同的数据员,构建生物寿命钟。现在这个系统所预测的年龄已经比人要精确度高得多了。
我们希望寻求中国的合作伙伴。我们拿不到中国的数据库,我们希望有中国合作伙伴,跟我们一起来做针对亚洲人、针对中国人寿命的时钟。在美国我们有一家公司,他们已经收集了很多的数据,希望能够构建一个平台。
我们其实希望能够跟他们合作,希望能够不仅仅收集到大家的一些生理的数据,也包括癌症等其他的数据,以更好地说明现阶段有什么问题,未来一个阶段可能会有什么样的问题,以及如何延迟发生或者如何进行修补。
我本身非常喜欢中国,我现在一直在中国香港生活工作。

自己的领域在于疾病的发现,寿命衰老机制的理解。如果说我们能够帮助大家多活一年,全球总共加起来就能够多活 78 亿年,因为现在全球有 78 亿人。谢谢大家,我很喜欢中国,我现在急需找中国的合作伙伴,如果大家有合作意向可以联系我。
-End-

赞(0) 打赏
未经允许不得转载:爱站程序员基地 » Insilico Medicine创始人兼CEO Alex Zhavoronkov:深度学习以及合成化学正在引领AI药物研发变革