AI
Notícias IA

Últimas notícias de IA

Dados pan-fenômicos baseados em aprendizado profundo revelam a explosiva evolução da disparidade visual em aves

Dados pan-fenômicos baseados em aprendizado profundo revelam a explosiva evolução da disparidade visual em aves

Um estudo recente utiliza aprendizado profundo, especificamente um modelo ResNet34, para analisar a evolução morfológica das aves, reconhecendo mais de 10.000 espécies de pássaros. Os resultados revelam que o espaço de incorporação de alta dimensão do modelo captura a convergência fenotípica e a disparidade morfológica relacionadas à riqueza de espécies, ressaltando a riqueza como um fator crucial na expansão do morfospaço. As padrões pós-extinção K-Pg mostram um "explosão inicial" na diversidade. Notavelmente, o estudo também destaca a capacidade do modelo de formar estruturas hierárquicas em um contexto de treinamento com rótulos planos, desafiando suposições sobre a dependência das CNNs em texturas locais.

arXiv
SymPlex: Um Transformer Consciente de Estruturas para a Solução Simbólica de PDEs

SymPlex: Um Transformer Consciente de Estruturas para a Solução Simbólica de PDEs

A SymPlex apresentou uma nova estrutura de aprendizado por reforço para derivar soluções analíticas para equações diferenciais parciais (EDPs) sem a necessidade de dados de verdade conhecida. O método utiliza um Transformer sensível à estrutura, chamado SymFormer, para otimizar soluções com base apenas na EDP e em suas condições de contorno. Essa abordagem possibilita soluções interpretáveis que lidam de forma eficaz com comportamentos não suaves, representando um avanço significativo em relação aos métodos numéricos tradicionais. Testes empíricos demonstram que o SymPlex recupera com precisão soluções complexas de EDPs, destacando seu potencial para aplicações práticas em modelagem matemática e engenharia.

arXiv
Treinamento Eficiente Rápido-Lento para Modelos de Linguagem Multimodal de Grande Escala por meio da Poda de Tokens Visuais

Treinamento Eficiente Rápido-Lento para Modelos de Linguagem Multimodal de Grande Escala por meio da Poda de Tokens Visuais

Pesquisadores desenvolveram o DualSpeed, uma estrutura destinada a aprimorar a eficiência de treinamento de Modelos de Linguagem Multimodais de Grande Escala (MLLMs), abordando as ineficiências relacionadas ao tamanho massivo dos modelos e aos tokens visuais. O DualSpeed adota uma abordagem em dois modos: um modo rápido que utiliza a Poda de Tokens Visuais (VTP) para reduzir a quantidade de tokens visuais, e um modo lento que treina com sequências completas para garantir consistência. Esse método acelera significativamente o treinamento—em 2,1x para o LLaVA-1.5 e 4,0x para o LLaVA-NeXT—mantendo mais de 99% de desempenho. O código está disponível no GitHub.

arXiv
Dassault Systèmes e NVIDIA firmam parceria para desenvolver plataforma de IA industrial que impulsiona gêmeos virtuais

Dassault Systèmes e NVIDIA firmam parceria para desenvolver plataforma de IA industrial que impulsiona gêmeos virtuais

Uma nova arquitetura industrial de IA compartilhada integra Gêmeos Virtuais com uma infraestrutura de IA escalável, aprimorando a tomada de decisões em tempo real na manufatura. Este modelo, validado pela ciência, otimiza processos, permitindo que as indústrias utilizem a IA para manutenção preditiva e melhoria da eficiência operacional. A arquitetura posiciona a IA industrial como uma ferramenta fundamental nos ambientes de produção modernos.

Nvidia.com
Darren Aronofsky e o impacto negativo da inteligência artificial na narrativa histórica americana em 'On This Day…1776'

Darren Aronofsky e o impacto negativo da inteligência artificial na narrativa histórica americana em 'On This Day…1776'

A nova série de curtas-metragens "Neste Dia... 1776" começa com uma imagem tocante de uma mão passando pela página de título de "Sentido Comum", de Thomas Paine, ressaltando sua importância histórica. A série tem como objetivo explorar eventos cruciais da Revolução Americana, oferecendo contexto e insights sobre as figuras e ideias influentes da época.

CNET
Por que mais consumidores preferem compras aprimoradas por IA e ainda esperam o toque humano

Por que mais consumidores preferem compras aprimoradas por IA e ainda esperam o toque humano

Um recente relatório da ZDNET revela que 73% dos consumidores estão utilizando chatbots de IA para buscas de produtos, refletindo uma tendência crescente no e-commerce. O artigo destaca a necessidade de as empresas integrarem ferramentas de IA para aprimorar o engajamento com os clientes e otimizar a experiência de compra, à medida que a dependência dos consumidores por essas tecnologias aumenta.

ZDNet
A SpaceX de Elon Musk adquire oficialmente a xAI, com planos para construir centros de dados no espaço

A SpaceX de Elon Musk adquire oficialmente a xAI, com planos para construir centros de dados no espaço

A SpaceX anunciou a aquisição da startup de inteligência artificial de Elon Musk, a xAI, representando uma expansão significativa no campo da inteligência artificial. Essa fusão posiciona a SpaceX como a empresa privada mais valiosa do mundo. A integração busca aproveitar a tecnologia da xAI para aprimorar as operações e os processos de tomada de decisão da SpaceX, potencialmente agilizando seus ambiciosos projetos de exploração espacial.

TechCrunch
O HHS utiliza ferramentas de IA da Palantir para direcionar subsídios relacionados a 'DEI' e 'Ideologia de Gênero'

O HHS utiliza ferramentas de IA da Palantir para direcionar subsídios relacionados a 'DEI' e 'Ideologia de Gênero'

O Departamento de Saúde e Serviços Humanos tem utilizado ferramentas de inteligência artificial da Palantir desde março para aprimorar os processos de triagem e auditoria de subsídios e descrições de cargos. Essa iniciativa visa garantir conformidade com as regulamentações federais e melhorar a supervisão. A integração dessas ferramentas de IA deve otimizar as operações e reduzir erros na gestão de subsídios.

Wired
PixelGen: Difusão de Pixels Supera Difusão Latente com Perda Perceptual

PixelGen: Difusão de Pixels Supera Difusão Latente com Perda Perceptual

PixelGen é uma nova estrutura de difusão de pixels que contorna as limitações dos modelos tradicionais de difusão latente em duas etapas, otimizando diretamente no espaço de pixels. O framework utiliza duas perdas perceptuais—LPIPS para padrões locais e DINO para semântica global—para aprimorar a qualidade das imagens. O PixelGen alcança um FID competitivo de 5,11 no ImageNet-256 com apenas 80 épocas de treinamento e demonstra um desempenho sólido em tarefas de geração de texto para imagem em larga escala, como evidenciado por uma pontuação de GenEval de 0,79. Essa abordagem elimina a necessidade de VAEs e etapas auxiliares, oferecendo um modelo gerador mais enxuto e eficaz. O código completo está disponível no GitHub.

arXiv
Expansão das Capacidades do Aprendizado por Reforço Através de Feedback em Texto

Expansão das Capacidades do Aprendizado por Reforço Através de Feedback em Texto

Um estudo recente apresenta o RL a partir de Feedback Textual (RLTF), que utiliza críticas em texto para aprimorar modelos de linguagem de grande escala após o treinamento. Ao contrário dos métodos tradicionais, o RLTF emprega aprendizado por reforço em múltiplas interações, permitindo que os modelos assimilem o feedback sem a necessidade de demonstrações extensivas. Duas técnicas, Auto-Distilação e Modelagem de Feedback, foram testadas em diversas tarefas e superaram consistentemente as linhas de base existentes, indicando que o feedback textual pode melhorar significativamente o desempenho dos modelos de forma eficiente.

arXiv
Segmentação automatizada multi-cabeça por meio da incorporação de cabeça de detecção na rede neural de camada contextual

Segmentação automatizada multi-cabeça por meio da incorporação de cabeça de detecção na rede neural de camada contextual

Uma nova arquitetura de Transformer multi-head com portões, baseada no Swin U-Net, melhora a auto-segmentação em radioterapia ao integrar o contexto interfatias e uma cabeça de detecção paralela. Este modelo reduz eficazmente os falsos positivos, atingindo uma perda média de Dice de $0,013 \pm 0,036$, em comparação com $0,732 \pm 0,314$ para métodos tradicionais. Esse avanço aumenta a confiabilidade do contorno automatizado em ambientes clínicos.

arXiv
Otimização da Comunicação para Treinamento de Mistura de Especialistas com Paralelismo Híbrido de Especialistas

Otimização da Comunicação para Treinamento de Mistura de Especialistas com Paralelismo Híbrido de Especialistas

Um estudo recente destaca os desafios da implementação da comunicação Expert Parallel (EP) em modelos de mistura de especialistas (MoE) em larga escala durante o treinamento. O modelo de comunicação exige uma abordagem de todos para todos, o que é complicado por dinâmicas e pela esparsidade. Os resultados sugerem que aprimorar a eficiência da comunicação EP é fundamental para otimizar o desempenho dos MoEs, o que poderia melhorar significativamente os tempos de treinamento e a utilização de recursos em ambientes de aprendizado de máquina em grande escala.

Nvidia.com