AI
Notícias IA

Reavaliando Modelos de Difusão com Simetrias por meio da Canonicalização com Aplicações na Geração de Grafos Moleculares

Source:arXiv
Autor original:Cai Zhou et al.
Reavaliando Modelos de Difusão com Simetrias por meio da Canonicalização com Aplicações na Geração de Grafos Moleculares

Imagem gerada por Gemini AI

Pesquisadores propõem uma nova abordagem para tarefas generativas na química, afastando-se dos modelos invariantes e equivariante tradicionais. Eles introduzem um método de canonicização que simplifica o treinamento e melhora o desempenho ao mapear amostras para uma forma padronizada antes de aplicar modelos não equivariante. Essa estrutura, testada na geração de grafos moleculares com simetrias $S_n \times SE(3)$, supera os modelos existentes, especialmente na geração de moléculas em 3D, apresentando resultados de ponta no conjunto de dados GEOM-DRUG.

Nova Abordagem para Modelos de Difusão Melhora a Geração de Grafos Moleculares

Um estudo recente introduz um método inovador para a geração de grafos moleculares ao empregar uma abordagem de canonização que aproveita as simetrias de grupo. Este método demonstra eficiência e desempenho aprimorados em relação às estratégias tradicionais.

Tradicionalmente, modelos generativos têm confiado em denoisers equivariantes para lidar com distribuições invariantes às simetrias de grupo. A pesquisa mais recente propõe um processo em três etapas: mapear amostras para um representante de órbita, treinar um modelo de difusão não-equivariante nesta fatia canônica e recuperar a distribuição invariável através de transformações de simetria aleatórias.

Principais Descobertas

  • A correção e a universalidade dos modelos generativos canônicos, que superam os alvos invariantes tradicionais.
  • Aumentada expressividade desses modelos, levando a eficiências de treinamento aprimoradas.
  • Aceleração do treinamento através da canonização, reduzindo a complexidade associada a misturas de grupo.

Aplicações na Geração de Grafos Moleculares

Os autores implementaram esta estrutura na geração de grafos moleculares sob as simetrias de \(S_n \times SE(3)\). O método deles, Canon, superou significativamente as linhas de base equivariantes existentes em tarefas de geração de moléculas 3D com demandas computacionais comparáveis ou reduzidas.

CanonFlow alcançou desempenho de ponta no conjunto de dados GEOM-DRUG, mostrando vantagens mesmo em cenários de geração com poucos passos.

Tópicos relacionados:

Modelos de DifusãoCanonicalizaçãoGeração de Grafos MolecularesInvariânciaPriors Alinhados

📰 Fonte original: https://arxiv.org/abs/2602.15022v1

Todos os direitos e créditos pertencem ao editor original.

Compartilhar este artigo