▎药明康德内容团队编辑
就在人工智能学者出人意料地摘得2024年诺贝尔物理学奖之后,北京时间10月9日下午,诺贝尔基金会宣布将今年的诺贝尔化学奖颁发给了三位研究领域与人工智能相关的科学家。
其中,被誉为“AlphaFold之父”的谷歌DeepMind公司Demis Hassabis博士和John Jumper博士因为蛋白质结构预测获奖,而华盛顿大学的David Baker教授因计算蛋白设计荣获殊荣。他们开发的AI解决方案成功解决了50年来蛋白质结构预测领域的重大挑战,加速了生物医药领域的科学发现。
▲David Baker教授、Demis Hassabis博士与John Jumper博士(图片来源:诺贝尔奖官网)
下面,药明康德内容团队将与大家一道回顾这个革命性的AI解决方案的诞生和成长史。
小小的蛋白质里藏着天大的疑问
在生物体内,蛋白质让很多科学家们着迷。这种分子的尺寸只有纳米大小,复杂程度却可以超过任何一台人造的机器,大自然的精妙由此也可见一斑。1983年,在哈佛大学学习哲学的Baker在一堂生物学课程上了解到蛋白质折叠问题。此前的科学家们通过试验发现,这些复杂的蛋白质只由20种简单的氨基酸经过排列组合拼接而成,而一条氨基酸序列就已包含了它能形成蛋白质的所有结构和活性信息。就像有设计图纸一样,一条氨基酸序列可以自发折叠成唯一的三维结构,然后在细胞内发挥特定的功能——有的可以结合DNA,控制基因的开关;有的可以识别病原体,启动免疫反应。在这些现象背后,一个巨大的问题随之浮现:一条氨基酸序列从理论上来说可以有无数种折叠方式,那为什么它能够自发折叠成唯一的三维结构呢?向梦想靠近,开发出蛋白质结构预测程序
1993年,Baker成功获得了华盛顿大学生物化学系助理教授的职位,开始独立工作。在他招收第二个学生后,他建议学生借助计算机的力量做蛋白质结构预测相关的课题。1996年,他与研究生们开始编写一个叫做Rosetta的程序,这个程序有潜力根据一段氨基酸序列解出蛋白质的结构。在自然界中,为了保持稳定,蛋白质总是折叠成具有“最低自由能”的形状。这就好像水会从高处往低处流,然后停留在那里一样。不过利用计算机预测蛋白质结构也并没有想象中那么简单。由于每个氨基酸至少有三种不同的构象,那么一个仅含有100个氨基酸的蛋白质,其可能的结构就高达3的100次方种,这对计算机来说都是个难以处理的运算量。不过,Rosetta的程序设计用了一种十分巧妙的方法,它不是通过穷举法从这些天文数字般的可能结构中挨个寻找自由能最低的形状,而是先分析蛋白质的生物物理特性,模拟出一个大致的形状,然后进行微调,只留下自由能更低的结果。这样一来,研究人员们可以更快预测出蛋白质的结构。好消息是,Rosetta的表现十分惊艳。自1994年起,和Baker一样想要解开蛋白折叠之谜的生物学家们会定期聚在一起,检验各自的成果:就像考试一般,他们会拿到一个蛋白质的序列,然后预测出它的结构。随后,这些预测结构会和已通过实验方法得到解析但尚未公开的真实结构进行比对,看哪一个结构更为接近。在这个被誉为蛋白质结构领域“奥林匹克”的活动中,Rosetta程序总是最有力的竞争者,并且具有统治性的优势。开发Rosetta的意外收获
在Rosetta诞生的过程中,Baker还有许多意料之外的收获。尽管Rosetta的设计经过优化,但预测蛋白质折叠所需要的运算量依然巨大。最开始,Baker只能通过不停购置新的电脑设备来扩大计算力,后来,新买的电脑把实验室的空间占满了却依然无法满足他们的需求。迫于这样的压力,Baker和他的学生们想出了一个绝妙的解决方案——借助互联网,邀请世界各地的人们用他们计算机的闲置算力来帮助进行计算。2005年,Baker团队启动了一个名为Rosetta@home的项目,基于他们开发的Rosetta软件包,利用分布式计算的力量来解析蛋白质结构。令人感到意外的是,这些“网友”们还给Baker发去了反馈意见,表示计算机折叠没有他们手动折叠来得更好。更巧的是,当他与一名计算机科学家聊起这些话题时,俩人灵感迸发,决定从Rosetta@home出发开发一款游戏,让全世界对蛋白折叠感兴趣的人能够发挥他们的才华,参与到蛋白质折叠的解谜游戏中。这款名为Foldit的游戏由于能帮助学生更好地了解蛋白质的三维性质以及蛋白质结构和功能间的关系,已被一些大学引入课堂。更令人吃惊的是,一些该游戏的高级玩家还曾通过这款游戏破解了一种逆转录病毒的蛋白结构,并将成果发表在了《自然》杂志子刊上。从预测到模拟,破解上帝之手的奥秘
虽然Baker最初的研究方向是预测蛋白质的结构,但在这个方向上取得突破之前,他已着手向另一个截然相反且更具挑战性的领域——“蛋白质的从头设计”发起了冲击。相比于预测蛋白质的结构,从头设计出一个蛋白质需要向弄清蛋白质折叠的原理再迈进一步。这要求科学家们能根据一个具有特定形状的蛋白,倒推出其DNA序列。从某种意义上讲,从头设计蛋白,要比预测蛋白结构难上几个数量级。假设要设计一个由100个氨基酸组成的蛋白质,每一种氨基酸又有20种截然不同的可能,使将得可能的氨基酸序列总数高达20的100次方。这个数字究竟有多大?它比整个宇宙中原子的总数还要多!由于Baker在Rosetta的开发中已经取得过一定的经验,这次再开发从头设计蛋白质的方法就有了良好的基础。从DNA序列到蛋白质结构,Rosetta能找到能量最低的形状。那么反过来,Rosetta也能用来推导为了构成这一形状所需的蛋白组件。在此基础上,研究人员们还学会了如何像拆解乐高玩具一样,将一个蛋白质拆成螺旋或者桶装的小块,分块击破。遇劲敌,取长补短开启新一轮进化之路
在2018年以前,Baker及其团队开发的Rosetta在蛋白质结构预测领域完全没有对手。而那一年,AlphaFold的出现令Baker嗅到了危机。尽管18年的蛋白质结构预测竞赛依然是Rosetta拔得头筹,但首次亮相就获得了第二名的AlphaFold令Baker见识到了机器学习的过人之处。于是,他要求团队紧跟时代的风向,加紧研究机器学习。Baker的预感没有错,在2020年的竞赛中,第二代AlphaFold击败了Rosetta,一举成名。不过,Baker率领着团队很快就追赶了上来。2021年7月15日,当DeepMind公司在《自然》杂志上发表论文,公开了“AlphaFold2”的源代码,并且详细描述了它的设计框架和训练方法时,Baker的团队也于《科学》杂志上介绍了其开发的RoseTTAFold算法。RoseTTAFold的神经网络能够同时考虑蛋白序列的模式、蛋白中不同氨基酸之间的相互作用,以及蛋白质可能出现的3D结构。在这个系统中,一维、二维和三维的信息能够相互交流,让神经网络综合所有信息,决定蛋白质的化学组成部分和它折叠产生的结构之间的关系。下一站,剑指新药开发
作为蛋白质从头设计的先驱者,Baker希望通过“蛋白质设计革命”开启一个全新的时代,我们将学会使用一种前所未有的方式来操控生物分子,例如从头设计出全新的药物、疫苗、疾病疗法等,拓展新药研发的边界。2022年8月,Baker及其团队在《细胞》杂志上发表论文,他们已利用AI技术平台精准地从头设计出能够穿过细胞膜的大环多肽分子,开辟了设计全新口服药物的新途径。同时,Baker团队成员联合创建的初创公司Vilya也正式亮相,并从著名风投机构ARCH Venture Partners获得5000万美元A轮融资。利用这一技术,跳过高通量筛选、直接合成候选药物的策略不再遥不可及!今年以来,Baker及其团队已在《自然》和《科学》杂志上发表了数篇重磅论文,其开发的全新的蛋白质从头设策略法可靶向不可成药靶点,并能实现按需设计生物分子,为蛋白设计提供了更广阔的可能性。[12] Baek, Minkyung et al. (2021) Accurate prediction of protein structures and interactions using a three-track neural network. Science. vol. 373,6557: 871-876. DOI:10.1126/science.abj8754
[15] Pan, Xingjie, and Tanja Kortemme. (2021) Recent advances in de novo protein design: Principles, methods, and applications. The Journal of biological chemistry 296: 100558. DOI:10.1016/j.jbc.2021.100558
[16] Mirdita, Milot et al. (2022) ColabFold: making protein folding accessible to all. Nature methods 19,6: 679-682. DOI:10.1038/s41592-022-01488-1
[18] Silva, Daniel-Adriano et al. (2019) De novo design of potent and selective mimics of IL-2 and IL-15. Nature 565,7738: 186-191. DOI:10.1038/s41586-018-0830-7
[19] Khatib F, DiMaio F; Foldit Contenders Group; Foldit Void Crushers Group; Cooper S, Kazmierczyk M, Gilski M, Krzywda S, Zabranska H, Pichova I, Thompson J, Popović Z, Jaskolski M, Baker D. Crystal structure of a monomeric retroviral protease solved by protein folding game players. Nat Struct Mol Biol. 2011 Sep 18;18(10):1175-7. doi: 10.1038/nsmb.2119. Erratum in: Nat Struct Mol Biol. 2012 Mar;19(3):364. PMID: 21926992; PMCID: PMC3705907.
免责声明:药明康德内容团队专注介绍全球生物医药健康研究进展。本文仅作信息交流之目的,文中观点不代表药明康德立场,亦不代表药明康德支持或反对文中观点。本文也不是治疗方案推荐。如需获得治疗方案指导,请前往正规医院就诊。分享,点赞,在看,聚焦全球生物医药健康创新
相关知识
2022年诺贝尔奖,将花落谁家?获奖预测!@MedSci
分子系统生物学研究中心举办第二十六期未来科学沙龙中国科学院遗传与发育生物学研究所
两名科学家因“基因剪刀”获得诺贝尔化学奖
关怀人文、赋能科研 科大讯飞展示AI如何改变生活 — 新京报
2024年诺贝尔奖即将揭晓!花落谁家?这几个“风向标”或许暗藏线索
两位科学家因发现miRNA及其调控作用获奖
AI中医香方仪 | OPENAIGC开发者大赛企业组AI创作力奖
上海首发四款垂直大模型,聚焦AI与基础科学研究的融合发展
讯飞星火开发者生态迅猛发展,科大讯飞携生态伙伴引领大模型规模化落地
张锋赢得专利、憾失诺奖,细数CRISPR基因编辑三巨头之间的爱恨情仇
网址: 诺贝尔化学奖也花落AI领域!AlphaFold开发者等人获奖 https://m.huajiangbk.com/newsview627766.html
上一篇: 【科学网】它凭啥占诺贝尔物理学奖 |
下一篇: 诺贝尔经济学奖授予阿西莫格鲁等3 |