Repensando los Modelos de Difusión con Simetrías a través de la Canonicalización con Aplicaciones en la Generación de Gráficos Moleculares

Imagen generada por Gemini AI
Investigadores proponen un nuevo enfoque para tareas generativas en química, alejándose de los modelos tradicionales invariantes y equivariantes. Presentan un método de canónización que simplifica el entrenamiento y mejora el rendimiento al mapear muestras a una forma estandarizada antes de aplicar modelos no equivariantes. Este marco, probado en la generación de grafos moleculares con simetrías de $S_n \times SE(3)$, supera a los modelos existentes, especialmente en la generación de moléculas en 3D, logrando resultados de vanguardia en el conjunto de datos GEOM-DRUG.
Nuevo Enfoque en Modelos de Difusión Mejora la Generación de Grafos Moleculares
Un estudio reciente presenta un método novedoso para la generación de grafos moleculares mediante un enfoque de canonización que aprovecha las simetrías de grupo. Este método demuestra una eficiencia y rendimiento mejorados en comparación con las estrategias tradicionales.
Tradicionalmente, los modelos generativos han dependido de desruidos equivariantes para manejar distribuciones invariantes a las simetrías de grupo. La última investigación propone un proceso de tres pasos: mapear muestras a un representante de órbita, entrenar un modelo de difusión no equivariante en esta rebanada canónica y recuperar la distribución invariante a través de transformaciones de simetría aleatorias.
Resultados Clave
- La corrección y universalidad de los modelos generativos canónicos, que superan a los objetivos invariantes tradicionales.
- Aumento de la expresividad de estos modelos, lo que conduce a una mayor eficiencia en el entrenamiento.
- Aceleración del entrenamiento a través de la canonización, reduciendo la complejidad asociada con mezclas de grupo.
Aplicaciones en la Generación de Grafos Moleculares
Los autores implementaron este marco en la generación de grafos moleculares bajo las simetrías de \(S_n \times SE(3)\). Su método, Canon, superó significativamente las líneas base equivariantes existentes en tareas de generación de moléculas en 3D con demandas computacionales comparables o reducidas.
CanonFlow logró un rendimiento de vanguardia en el conjunto de datos GEOM-DRUG, mostrando ventajas incluso en escenarios de generación de pocos pasos.
Temas relacionados:
📰 Fuente original: https://arxiv.org/abs/2602.15022v1
Todos los derechos y créditos pertenecen al editor original.