SYNCOGEN:机器学习新框架实现可合成三维分子生成
9 days ago
SYNCOGEN是由多所大学联合开发的一种机器学习框架,旨在通过同时建模反应路径和原子坐标,生成可合成的3D分子结构。在药物发现中,生成模型虽能扩展化学空间,但许多AI生成的分子难以在实验室中合成,限制了其实际应用。传统方法依赖2D分子图,缺乏决定分子生物行为的3D结构信息,而SYNCOGEN则解决了这一问题。 该框架基于SYNSPACE数据集训练,包含超过60万种可合成分子,每个分子由93种商业原料和19种可靠反应模板构建,并附有330万种能量最小化的3D构象。SYNCOGEN采用改进的SEMLAFLOW架构,结合掩码图扩散和坐标匹配技术,在生成过程中同时考虑化学结构和合成可行性,确保生成的分子既符合物理规律,又具备实际合成路径。 在性能测试中,SYNCOGEN在无条件3D分子生成任务中表现优于现有模型,尤其在分子片段连接和药物设计任务中,能生成易于合成的药物类似物,具备良好的对接评分和逆合成可追踪性。未来,SYNCOGEN有望用于条件生成、蛋白质结合口袋设计以及与实验室机器人结合,实现自动化分子合成与筛选。 业内人士表示,SYNCOGEN的出现标志着计算分子设计向实际应用迈出重要一步,为药物研发和材料科学提供了更高效、更实用的工具。该框架将生成模型与严格的合成约束结合,提升了AI在化学领域的落地能力。