用于匹配分子对转化的检索增强基础模型以重现药物化学直觉

Gemini AI生成的图像
研究人员开发了一种新的基础模型,旨在利用匹配分子对(MMPs)生成化学类似物。该模型能够基于用户定义的转化模式生成多样化的变量,从而增强了可控性。这一方法被命名为MMPT-RAG,融入了外部参考以提高上下文的相关性。实验结果表明,所生成化合物在多样性和新颖性方面取得了显著进展,使其成为药物发现领域中药物化学的一个有价值工具。
药物化学中的机器学习进展
最近的机器学习发展通过检索增强基础模型提升了药物化学,这些模型专注于匹配分子对转化(MMPTs)。这些模型促进了与化学家设计过程一致的多样化分子类似物的生成。
匹配分子对 encapsulate 化学家常用的局部化学编辑。传统方法在这一任务上面临困难,要么分析整个分子,要么从有限的数据集中学习。新的变量对变量公式旨在通过在广泛的 MMP 转化上训练基础模型来解决这些挑战。
创新模型设计
该模型通过在输入变量上调整输出,增强了类似物生成,提高了转化的可控性。此外,提示机制允许用户指定所需的转化模式,提供了更大的灵活性。
通过引入名为 MMPT-RAG 的检索增强框架,该模型利用外部参考类似物进行上下文指导,显著提高了在特定项目系列中的泛化能力。
实验验证
对一般化学语料库和专利特定数据集的实验结果显示:
- 生成的分子结构多样性增加
- 新颖性增强,导致独特的类似物
- 可控性提高,允许定制结果
这些发现表明,该模型成功恢复了真实的类似物结构,可以简化药物化学家的工作流程。
相关主题:
增强检索匹配分子对变量到变量MMP转化提示机制
📰 原始来源: https://arxiv.org/abs/2602.16684v1
所有权利和署名均属于原出版商。