人工智能带来的革命仍在继续:从沃森(Waston)机器人不到10分钟诊断出白血病,到AlphaGo击败世界排名第一的围棋选手;从战场到太空,随处都可见其身影。其实,AI也早已渗透进科研领域,成为科学家进行学术研究的新手段。
现在,科学家们已经构建出了化学界的“Alphago”:科学家们在《Nature》上发文证明,AI能够以前所未有的速率进行逆向合成反应。
在化学研究中,由简单的原料开始合成一个复杂化合物是非常困难的。而逆向合成则是设计化合物生产的标准方法,即化学家们通过逆向思维,从想要制造的化合物分子开始,然后分析可以通过哪些容易得到的试剂和反应序列来合成它,这种方法被广泛用于制造药物和其他产品。
逆合成分析法于20世纪60年代由哈佛大学教授E。 J。 Corey提出。Corey教授因发现这一技术,获得了1990年的诺贝尔化学奖。
过去,科学家们一直使用计算机辅助有机合成的方式,来完成逆合成分析过程。尽管这种方法可以提高合成效率,然而传统的计算机辅助方式合成速度仍然较慢,且提供的分子质量参差不齐。人类还是需要手动搜索化学反应数据库,来找到制造分子的最佳方法。
图丨Marwin Segler而 Segler团队开发的新AI工具则使这一过程大大缩短。在未来,人类发现新药或者其他产品的速度将有望达到全新水平。
化学反应也如同下棋
其实,化合物的产生和下棋也有异曲同工之妙。相关的化合物可以被分解成基本组成成分,这些成分便是“棋子”,而计算机程序为这些“棋子”提供不同的路径,然后再在实验室中将它们合成。
当然,理论上来看这似乎是很容易的事情,但在实践中却遇到了困难。Segler说:“化学领域比围棋界有更多的可能性,问题也要复杂得多。”
图丨和两种传统合成方法相比(红色和绿色),使用新型人工智能算法(蓝色)在较短时限内可以完成更多分子的合成路线预测。而在最新的研究中,新的AI工具通过深度学习神经网络来学习所有已知的单步有机化学反应——大约1240万个。这使它能够预测在任何单一步骤中可以使用的化学反应。AI工具重复应用这些神经网络来规划多步骤合成,解构所需的分子,直到最终得到可用的试剂。这项工作得到了德国研究基金会的资助。
图 | 逆合成分析法示意图Segler说:“逆向合成是有机化学中的终极学科,一名化学家需要数年的学习才能掌握它——这像下棋一样,除了要学习专业知识外,还需要敏锐的直觉和极强创造力。我们所展示出的是:计算机本身就可以从现有的文献中学习种种规则及这些规则的应用。”
目前,许多来自不同学科的研究人员正在着手研究将深度神经网络与蒙特卡洛搜索树相结合。蒙特卡洛搜索树是一种用来评估游戏中移动情况的方法。每走一步,计算机会模拟无数种可能发生的情况,比如如何使象棋游戏结束,计算机会选择最佳方式去走。
图丨Mike Preuss类似地,机器也可以使用这种深度神经网络,来寻找化学合成中的最佳方式。信息系统专家兼该项研究作者Mike Preuss则用一句话总结了这次的化学界“Alphago”的成功秘诀:“深度神经网络用于预测哪些分子会参加反应。蒙特卡洛搜索树来预测反应的可能性”。
具体而言,该团队开发的AI算法拥有一个包含1200万个已知反应的数据库,其深层的神经网络程序可以从1200万个已知反应中不断学习,而不是在硬性规则中进行编程。而数据库提供的数据越多,算法可以探索的化学途径就越多,预测合成路线的准确度也就越高。