新浪新闻客户端

DeepMind攻破生物学界50多年重大难题,AlphaFold:精确度高达92.4GDT

DeepMind攻破生物学界50多年重大难题,AlphaFold:精确度高达92.4GDT
2020年12月01日 17:32 新浪网 作者 麻省理工科技评论

  美国时间 11 月 30 日,谷歌母公司 Alphabet 旗下人工智能公司 DeepMind 公开宣布,生物学界 50 年来的重大难题——蛋白质折叠预测,已被其成功攻克。Alphabet 旗下人工智能公司 DeepMind 在预测蛋白质结构方面迈出了一大步。

  该公司的最新 AlphaFold 系统,在第 14 次 CASP 评估中的总体中位数得分达到了 92.4GDT。其中,GDT(Global Distance Test ) 是CASP 用来测量预测准确性的主要指标,其范围是从0-100。

  公司表示,其已经解决了关键的 “蛋白质折叠问题”,并将解决问题的运算时间从数月缩短至数小时,这有助于加快药物发现速度,有可能破解一个类似于绘制人类基因组的问题。

  DeepMind 首席执行官杰米斯・哈萨比斯 (Demis Hassabis),是游戏开发者、神经学家和人工智能企业家。他在电话采访中表示:“这些算法现在已经足够强大,强大到可以应用于解决科学问题。经过 4 年的发展,我们有了一个足够精确的系统,对生物学研究人员来说具有实际的生物学意义和相关性。”

  哈萨比斯表示,DeepMind 目前正在研究以 “可扩展方式” 为科学家提供访问 AlphaFold 系统的途径。

  AI 与蛋白质

  每个活细胞体内都有成千上万种不同的蛋白质,蛋白质的不同折叠程度决定了它如何与其他分子相互作用,了解蛋白质结构变化,对发现新冠肺炎等病毒如何侵入人体细胞、设计酶分解污染物、研究癌症和老年痴呆症以及提高作物产量具有重要意义。

  欧洲生物信息学研究所的珍妮特・桑顿教授表示:“蛋白质是最美丽的结构。准确预测蛋白质的折叠非常具有挑战性,多年来一直困扰着很多人。”

  从某种程度上来说,生命的本质其实就是 4 中不同碱基的排列组合。包含整个生命密码的 DNA,仅有 4 种碱基组成,翻译出 64 种密码子,对应着整个地球生命系统中仅有的 20 多种氨基酸,之间排列组合,构成了数万至数亿种不同的蛋白质。

  而真正决定不同蛋白质性质和功能的,除了不同氨基酸的排列组合,更重要的是氨基酸链的 3D 结构,已经采用了包括 X 射线晶体学、核磁共振、冷冻电镜等技术来解析蛋白质结构。

  理论上来说,知道了 DNA 序列,就已经决定了其能够翻译出的氨基酸序列和蛋白质结构,但想要实现这种预测,中间涉及的计算难度难以想象。

  近年来,随着基因测序技术和AI的发展,使通过氨基酸序列来预测蛋白质结构成为可能。

  征战 CASP

  全球蛋白质结构预测竞赛(Critical Assessment of protein Structure Prediction,CASP),由美国科学家约翰・莫尔特(John Moult)于 1994 年发起,每两年举办一届,旨在吸引计算机科学、生物物理学等不同领域的专家参与到蛋白质三维结构预测这一极具挑战性的生物信息学问题中来,共同评估发展现状和讨论未来的趋势。

  CASP 在过去 25 年中一直在关注这个领域的进展,该组织的评价方式是将参赛者提供的解决方案与 “黄金试验标准” 进行对比。

  DeepMind 开发的 AlphaFold 系统在最近结构预测关键评估(CASP)竞赛中所展现出的能力达到了 “解决” 问题的水平。

  本周一,该组织表示,DeepMind 的 AlphaFold 系统在蛋白质结构预测方面表现出了无与伦比的准确性。

  早在 2018 年第 13 届全球蛋白质结构预测竞赛 CASP 上,DeepMind 的最新人工智能程序 AlphaFold ,成功预测生命基本分子 —— 蛋白质的三维结构 。当时,首次参赛的 AlphaFold 在 98 名参赛队伍中排名第一,其预测的 43 种蛋白质中有 25 种蛋白质的结构最准确,而排名第二的团队中只有 3 种。

  AlphaFold 负责人约翰・姜普(John Jumper)认为,要想产出 “真正具有生物学相关性,或在实验上有竞争力” 的成果,还有一段路要走。

  现在,参与 CASP 的科学家们分析了大约 100 种蛋白质的氨基酸序列形状。参赛者被告知排列顺序,并负责预测蛋白质的形状。AlphaFold 对其中三分之二蛋白质结构的评估与 CASP 的分析几乎完全一致,而其他团队的评估契合度约为 10%。

  今年的比赛对 DeepMind 来说也并非一帆风顺。姜普表示,DeepMind 在 3 个月时间里毫无进展。“我们坐在那里,担心是否已经耗尽了数据。” 即使比赛结束日期临近,姜普及其团队也还在担心,他们可能出了错。他说:“机器学习系统总是会出各种错误。”

  不过,他们的努力已经获得了回报。姜普表示:“我们真的认为,我们开发了一个系统,为实验生物学家提供正确、可操作的信息。你想要寻找这样的结构是因为,你想要去理解大自然,随后去提出更多的问题。我们认为,我们开发的系统已经可以真正帮助人们去做到这一点。”

  CASP 主席约翰・墨尔特(John Moult)教授表示:“DeepMind 已经取得领先。计算机科学领域长达 50 年的重大挑战在很大程度上已得到解决。对于药物设计,以及蛋白质设计等新兴领域,这都将产生重大影响。”

  欧洲生物信息学研究所 (European Bioinformatics Institute) 名誉主任珍妮特・桑顿 (Janet Thornton) 说:“确定单个蛋白质结构通常需要多年的实验努力。”

  桑顿是使用计算方法分析蛋白质结构的先驱之一。“更好地理解蛋白质结构、能够使用计算机预测它们意味着更好地理解生命进化历程,当然,也能够更好理解还有有关人类健康和疾病的诸多问题。”

  神奇的 DeepMind

  谷歌 2014 年以 6 亿美元的价格收购了 DeepMind。成为谷歌子公司,目标是开发可以应用于更广泛问题的人工智能。该公司一直表示,希望能在科学领域发挥更大的影响力。

  2016 年,DeepMind 公司推出的 AI 围棋程序 AlphaGo 横空出世,以 4:1 的比分压倒性的战胜围棋世界冠军李世石,终结了人类职业棋手对围棋的绝对话语权;2017 年 DeepMind 团队再次推出 AlphaZero。它是一种可以从零开始,通过自我对弈强化学习在多种任务上达到超越人类水平的新算法;随后加入家族战队的 AlphaFold,中文封号为阿尔法折叠。

  DeepMind 大约有 1000 名员工,但几乎没有任何收入。谷歌母公司 Alphabet 为支持该公司投入了巨额成本。不过,DeepMind 已经与 Facebook 人工智能实验室、微软和 OpenAI 等实体一起,成为了全球人工智能竞赛的领先者之一。

  谷歌 CEO 桑达尔・皮查伊(Sundar Pichai)在 Twitter 上为此次突破点赞。DeepMind 联合创始人及 CEO 德米斯・哈萨比斯(Demis Hassabis)则表示:“DeepMind 背后的终极愿景一直是构建通用人工智能,利用通用人工智能来极大地加速科学发现的步伐,帮助我们更好地了解周围世界。”

  哈萨比斯说:“游戏是很好的试验平台,有助于高效地开发和测试通用算法。但我们希望,未来某天这些算法能应用到现实世界,例如去解决科学问题。我们认为,AlphaFold 是证明这个逻辑的第一步。这些算法现在正变得足够成熟和强大,能够应用于真正具有挑战性的科学问题。”

  -End-

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。
生物
权利保护声明页/Notice to Right Holders

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2024 SINA Corporation

All Rights Reserved 新浪公司 版权所有