Ripensare i modelli di diffusione con simmetrie tramite la canonizzazione con applicazioni alla generazione di grafi molecolari

Immagine generata da Gemini AI
I ricercatori propongono un nuovo approccio per i compiti generativi in chimica, allontanandosi dai tradizionali modelli invarianti e equivarianti. Introducono un metodo di canonicalizzazione che semplifica l'addestramento e migliora le prestazioni, mappando i campioni a una forma standardizzata prima di applicare modelli non equivarianti. Questo framework, testato nella generazione di grafi molecolari con simmetrie $S_n \times SE(3)$, supera i modelli esistenti, in particolare nella generazione di molecole 3D, dimostrando risultati all'avanguardia sul dataset GEOM-DRUG.
Nuovo Approccio ai Modelli di Diffusione Migliora la Generazione di Grafi Molecolari
Uno studio recente introduce un metodo innovativo per la generazione di grafi molecolari attraverso un approccio di canonicalizzazione che sfrutta le simmetrie di gruppo. Questo metodo dimostra un'efficienza e una prestazione migliorate rispetto alle strategie tradizionali.
Tradizionalmente, i modelli generativi si sono basati su denoiser equivarianti per gestire distribuzioni invariate rispetto alle simmetrie di gruppo. La ricerca più recente propone un processo in tre fasi: mappare i campioni a un rappresentante dell'orbita, addestrare un modello di diffusione non equivariante su questo strato canonico e recuperare la distribuzione invariata attraverso trasformazioni casuali di simmetria.
Risultati Chiave
- La correttezza e l'universalità dei modelli generativi canonici, che superano gli obiettivi invariate tradizionali.
- Aumento dell'espressività di questi modelli, che porta a efficienze di addestramento migliorate.
- Accelerazione dell'addestramento attraverso la canonicalizzazione, riducendo la complessità associata alle miscele di gruppo.
Applicazioni nella Generazione di Grafi Molecolari
Gli autori hanno implementato questo framework nella generazione di grafi molecolari sotto le simmetrie di \(S_n \times SE(3)\). Il loro metodo, Canon, ha superato significativamente le basi equivariante esistenti nei compiti di generazione di molecole 3D con richieste computazionali comparabili o ridotte.
CanonFlow ha raggiunto prestazioni all'avanguardia sul dataset GEOM-DRUG, mostrando vantaggi anche in scenari di generazione a pochi passi.
Argomenti correlati:
📰 Fonte originale: https://arxiv.org/abs/2602.15022v1
Tutti i diritti e i crediti appartengono all'editore originale.