AI
Notizie IA

Ripensare i modelli di diffusione con simmetrie tramite la canonizzazione con applicazioni alla generazione di grafi molecolari

Source:arXiv
Autore originale:Cai Zhou et al.
Ripensare i modelli di diffusione con simmetrie tramite la canonizzazione con applicazioni alla generazione di grafi molecolari

Immagine generata da Gemini AI

I ricercatori propongono un nuovo approccio per i compiti generativi in chimica, allontanandosi dai tradizionali modelli invarianti e equivarianti. Introducono un metodo di canonicalizzazione che semplifica l'addestramento e migliora le prestazioni, mappando i campioni a una forma standardizzata prima di applicare modelli non equivarianti. Questo framework, testato nella generazione di grafi molecolari con simmetrie $S_n \times SE(3)$, supera i modelli esistenti, in particolare nella generazione di molecole 3D, dimostrando risultati all'avanguardia sul dataset GEOM-DRUG.

Nuovo Approccio ai Modelli di Diffusione Migliora la Generazione di Grafi Molecolari

Uno studio recente introduce un metodo innovativo per la generazione di grafi molecolari attraverso un approccio di canonicalizzazione che sfrutta le simmetrie di gruppo. Questo metodo dimostra un'efficienza e una prestazione migliorate rispetto alle strategie tradizionali.

Tradizionalmente, i modelli generativi si sono basati su denoiser equivarianti per gestire distribuzioni invariate rispetto alle simmetrie di gruppo. La ricerca più recente propone un processo in tre fasi: mappare i campioni a un rappresentante dell'orbita, addestrare un modello di diffusione non equivariante su questo strato canonico e recuperare la distribuzione invariata attraverso trasformazioni casuali di simmetria.

Risultati Chiave

  • La correttezza e l'universalità dei modelli generativi canonici, che superano gli obiettivi invariate tradizionali.
  • Aumento dell'espressività di questi modelli, che porta a efficienze di addestramento migliorate.
  • Accelerazione dell'addestramento attraverso la canonicalizzazione, riducendo la complessità associata alle miscele di gruppo.

Applicazioni nella Generazione di Grafi Molecolari

Gli autori hanno implementato questo framework nella generazione di grafi molecolari sotto le simmetrie di \(S_n \times SE(3)\). Il loro metodo, Canon, ha superato significativamente le basi equivariante esistenti nei compiti di generazione di molecole 3D con richieste computazionali comparabili o ridotte.

CanonFlow ha raggiunto prestazioni all'avanguardia sul dataset GEOM-DRUG, mostrando vantaggi anche in scenari di generazione a pochi passi.

Argomenti correlati:

modelli di diffusionecanonizzazionegrafi molecolarisimmetrieaddestramento

📰 Fonte originale: https://arxiv.org/abs/2602.15022v1

Tutti i diritti e i crediti appartengono all'editore originale.

Condividi questo articolo