优化AAV衣壳是一个具有巨大可能性的设计问题,这使其成为人工智能的理想应用。然而,即使衣壳蛋白序列上的单个氨基酸变化也会完全改变其治疗特性,大多数变化都会破坏功能,这使得人类几乎不可能理性地接近。这就是为什么Dyno正在应用人工智能来解决体内递送挑战,使药物开发人员能够将基因递送到每个器官、每个细胞和每个患者。

我们开发了一种技术,使我们能够生成大型详细的数据集,测量数十万种不同的序列及其体内递送特性。人工智能在自动识别这些数据中的模式并应用这些见解来生成具有更高性能的新序列方面非常出色。为了进一步阐述我们是如何走到这一步的,在2019年的一篇《科学》论文中,我们以前所未有的规模全面测量了蛋白质适应度景观,使用DNA条形码和NGS追踪AAV衣壳变体的大型文库,因为它们在小鼠体内生物分布和传递遗传有效载荷。

不久之后,在《自然生物技术》杂志上,我们发表了一项机器学习的开创性应用,旨在探索深度序列空间,实现蛋白质多样化,创造合成AAV衣壳,通过避免对天然AAV的预先免疫来帮助每个患者。数据集的非凡深度和复杂性也使我们能够证明,深度神经网络比随机定向进化方法更有效,这是人工智能在序列设计中的力量的早期证明。

如今,Dyno的LEAPSM技术,正如过去几年在会议和预印本中分享的那样,将这些方法与最近的建筑机器学习创新相结合,并将其应用于测量和优化非人类灵长类动物衣壳的递送特性,从而能够更有效地翻译给人类患者。如今基因递送的高昂价格是由许多因素造成的,包括递送挑战、高昂的制造和研究成本以及漫长的临床开发时间。这些因素中的每一个都会增加成本,但这也是为什么可以大幅降低成本的原因。其他行业也有先例;

例如,在过去的五十年里,计算成本呈指数级下降。我相信,降低基因递送的成本同样重要,也将产生同样的影响,使数十亿患者能够负担得起并获得基因治疗。我认为,近期最大的机会可能来自提高每个衣壳的递送效率。我们已经证明了大脑输送的100倍改善,我相信超过1000倍的改善是可能的。

从长远来看,机器学习方法也可以应用于优化基因序列以提高可制造性,并使基因疗法的存储、分发和管理更容易,所有这些都可以在整个供应链中进一步节省成本。最终,用于基因治疗的原材料(即碳、氮、氧等)的成本如此之低,以至于0美元是我们通过正确优化可以实现的合理近似值。众所周知,人工智能的好坏取决于它所训练的数据。在Dyno开始之前,没有多少高质量的数据将AAV序列与其体内功能联系起来。

为了解决这个问题,Dyno创建了新的多路复用技术和计算平台,用于大规模训练我们的机器学习模型。现在,在平均一个月内,我们进行了数十亿次不同的体内测量,这使我们能够建立更好的模型,并设计出更好的衣壳。有了更好的衣壳,我们可以进行更好的测量,从而进一步改进模型,等等。我已经在这方面工作了10年,我对Dyno迄今为止将人工智能应用于蛋白质序列设计所取得的所有进展感到非常兴奋。

感觉这只是这些技术将给基因医学带来的变革性患者影响的开始。