金属有机框架(MOFs)因结构可调、应用广泛而备受关注,X射线衍射技术在材料表征领域的应用也已经比较成熟,但在高通量实验与自驱动实验室场景中,如何高效解析MOF材料的粉末X射线衍射(PXRD)数据,并据此预测晶体结构仍困扰着研究人员。色情文学
深圳研究生院色情文学
潘锋教授团队致力于图论结构化学、AI4S和材料基因组学的研究,成功使用人工智能解析XRD,创新性地提出了一种基于扩散模型的生成式人工智能框架Xrd2Mof。该模型以PXRD图谱、金属节点和有机配体信息为输入,以MOF结构为输出,并首次将粗粒度化表示引入该任务中,用于提取与衍射最相关的骨架几何特征,从而保留关键“材料基因”信息。相关成果以“Interpreting X-ray Diffraction Patterns of Metal–Organic Frameworks via Generative Artificial Intelligence”为题,发表于《美国化学学会杂志》(JACS, 2026, 148, 1, 869–878)。

图1. 用于生成晶体结构的模型概述
图1(a)表示用于将文本转换为作品的智能体,在训练过程中,包含文本-图像对的大型数据集被输入到智能体中,使其能够将语义描述映射到视觉表示,从而构建对场景特征的理解。然后,智能体从自身见解出发,根据潜在表示生成与描述一致的作品。(b) Xrd2Mof由特征提取、粗粒化结构生成和构建块装配三个阶段组成,其使用PXRD图案来重构高通量实验中合成的MOF晶体结构。金属节点和有机配体的信息一同作为输入。粗粒度表示可以有效表征MOF的拓扑骨架,用于优化MOF结构生成。模型在来自CSD数据库的79,658个真实MOF结构上完成训练后,在测试集结构匹配中取得了93%以上的准确率,并对多种拓扑结构展现出良好的泛化能力。研究结果表明,该方法能够有效提升大规模复杂MOF结构的解析能力,为人工智能驱动的自动化结构分析提供了新路径。

图2. Xrd2Mof的体系结构。(a)预训练特征提取模型框架。(b) Xrd2Mof总体工作框架。(c)结构生成模型框架
本文首次将粗粒度化(Coarse-grained)方法应用于基于XRD图谱的MOF结构生成过程中。粗粒度是指将MOF晶体结构中的金属团簇和有机配体进行切割并替换为其质心,从而降低特征点个数,可以看作是对材料基因的一种提取方式。借助该方法,模型可以处理包含数百乃至上千原子的MOF结构,显著提升了模型在该领域的适用性。

图3. 结构生成过程中框架拓扑结构的比较。(a)单类配体MOF的生成结果以及相应的模拟PXRD图谱。(b)两类配体MOF的结构生成结果以及相应的模拟PXRD图谱
Xrd2Mof可无缝集成到MOF的高通量合成,有效解决了PXRD图谱解析与高通量实验节奏不匹配的难题,为AI自动实验室的MOF研发提供了关键技术支撑。尽管模型存在依赖金属节点与连接体信息、未完全考虑溶剂分子与杂质信号等局限性,但对含杂质的PXRD图谱仍保持90.6%的匹配成功率,未来通过AI主动学习融入更多实验数据,有望扩展至红外、拉曼等其他表征技术的解析,为多模态表征集成的自动化材料研发奠定基础。
色情文学
深圳研究生院色情文学
硕士研究生冯彬和博士研究生王炳胥为文章共同第一作者,李舜宁和潘锋为共同通讯作者。该工作得到广东省重点实验室和广东省自然科学基金的支持。