杜克大学、麻省理工学院和西北大学的聚合物化学家们个个笑容满面

科学越来越多地要求人工智能机器帮助我们搜索和解释大量的数据,这正在发挥作用。

但不幸的是,聚合物化学
2由于缺乏一种清晰、连贯的语言来描述那些不整齐有序的分子,对大型复杂分子
2的研究一直受到阻碍。

认为尼龙。聚四氟乙烯。硅胶。聚酯。这些聚合物和其他聚合物被化学家们称为“随机”,它们由可预测的构建块组装而成,并遵循一组有限的附着规则,但在不同的链之间,它们的细节可能会非常不同,即使在相同的聚合物配方中也是如此。

’em塑料,爱’em或恨’em。
Foto: Mathias Cramer/temporealfoto.com

对于一个长分子来说,化学的旧棒球模型和简写的化学符号是不够的,因为长分子可以用一系列的概率来描述,其中一种分子可能在一个给定的点上,也可能不在一个给定的点上。

聚合物化学家在寻找不会对环境造成负担的医疗新材料或塑料材料时,使用了一种看起来像长串辅音、等号、方括号、插入符号和圆括号的书面语言,这在一定程度上阻碍了他们的工作。它也有些模棱两可,所以聚合物尼龙-6-6最终是这样写的:

{& lt; C = O) CCCCC (= O) & lt;,祝辞NCCCCCCN>}

或者,

{& lt; C = O) CCCCC (= O) NCCCCCCN>}

当我们谈到“连接语法”时,情况只会变得更糟。,

威廉·t·米勒(William T. Miller)化学教授斯蒂芬·克雷格(Stephen Craig)从事聚合物化学工作近20年,他说上面的符号语言对聚合物有一定的用途。但是现在领导国家科学基金会分子优化网络化学中心(MONET)的Craig和他的同事们认为他们可以做得更好。

斯蒂芬•克雷格

克雷格说:“一旦你了解了聚合物是如何生长的,你就需要定义一些符号,说明有可能在这里出现这种结构,或者在那个点出现其他结构。”“然后就把它简化成一种练习,就像定义一组符号一样。”

现在,他和他在麻省理工学院西北大学的莫奈同事们已经做到了这一点,从而产生了一种新的语言——BigSMILES——这是对现有语言smile(简化的分子输入线输入系统)的一种改进。他们认为这可以将描述聚合物的巨大组合问题简化为即使是一台愚蠢的计算机也能理解的东西。

克雷格说,这将使计算机能够做所有它们擅长的事情——搜索大型数据集的模式和在干草堆中找到针。

最初的重任是由莫奈的成员布拉德·奥尔森教授和他在麻省理工学院的同事林志洋共同完成的。聚合物及其组成部分和各种连接可以这样描述:

的例子bigSMILES符号从最近的论文

对我们来说,这当然不是最好的阅读材料,大声朗读也会非常困难,但对电脑来说,这就像小孩子的游戏。

莫奈的成员们花了几周的时间,试图用他们能想象到的最奇怪的聚合物来阻碍这门新语言的发展,这使得“字母表”中需要更多的部分。但克雷格说,总的来说,这种观点是站得住脚的。他们还建立了一个巨大的聚合物数据库,并很容易地将其翻译出来。

克雷格说:“令我兴奋的一件事是,数据录入最终可能直接与用于制造特定聚合物的合成方法相关联。”“我们有机会捕捉并处理更多关于分子的信息,而这些信息通常无法从标准的特征描述中获得。如果能做到这一点,就能实现各种各样的发现。”

上周,美国化学学会《中央科学》杂志上的一篇文章将BigSMILES介绍给了聚合物领域,莫奈的研究小组急切地想看到反应。

“其他人能使用它吗?它适用于所有东西吗?””克雷格问道。因为聚合物结构空间实际上是无限的。“这正是你需要大数据和机器学习来解决的问题。“这是一个化学和数据科学交叉的领域,可以产生巨大的影响,”克雷格说。

新闻旨在传播有益信息,英文原版地址:https://researchblog.duke.edu/2019/09/19/big-smiles-all-around-for-polymer-chemists-at-duke-mit-and-northwestern/

http://petbyus.com/14032/