AI
Notícias IA

Últimas notícias de IA

DAWN: Inferência Rápida Consciente de Dependências para LLMs de Difusão

DAWN: Inferência Rápida Consciente de Dependências para LLMs de Difusão

O artigo apresenta o DAWN, um novo método para melhorar a velocidade de inferência em modelos de linguagem de difusão de grande porte (dLLMs) sem comprometer a qualidade da saída. O DAWN aborda as ineficiências da decodificação paralela tradicional ao modelar as dependências entre os tokens, permitindo um desmascaramento de tokens mais confiável. Resultados experimentais mostram que o DAWN aumenta a velocidade de inferência em até 1,80 a 8,06 vezes em comparação com métodos existentes, enquanto mantém a qualidade da geração. O código está disponível no GitHub para implementação.

arXiv
Spotify lança recurso "Sobre a Música" que oferece contexto e curiosidades sobre faixas favoritas

Spotify lança recurso "Sobre a Música" que oferece contexto e curiosidades sobre faixas favoritas

Um novo recurso do aplicativo permite que os usuários explorem as histórias por trás de suas músicas favoritas diretamente na plataforma. Essa melhoria tem como objetivo enriquecer a experiência de escuta, oferecendo informações sobre artistas, processos de composição e elementos temáticos, sem que os usuários precisem sair do aplicativo. O lançamento dessa funcionalidade deve intensificar o envolvimento dos usuários e atrair mais pessoas em busca de uma experiência musical mais imersiva.

The Verge
Três maneiras pelas quais o NVFP4 acelera o treinamento e a inferência em IA

Três maneiras pelas quais o NVFP4 acelera o treinamento e a inferência em IA

A NVIDIA apresentou sua mais recente arquitetura de modelo de IA, projetada para atender às crescentes demandas computacionais para treinamento e inferência que superam a Lei de Moore. O novo sistema, que conta com GPUs avançadas e software otimizado, tem como objetivo melhorar a eficiência e o desempenho, atendendo às necessidades crescentes das aplicações de IA em diversos setores. Essa inovação é crucial para os desenvolvedores que buscam aproveitar as capacidades da IA sem enfrentar custos excessivos ou limitações de recursos.

Nvidia.com
O segundo maior fabricante de automóveis da China conseguirá se estabelecer nos Estados Unidos?

O segundo maior fabricante de automóveis da China conseguirá se estabelecer nos Estados Unidos?

A Geely, o segundo maior fabricante de automóveis da China, está avaliando a possibilidade de fabricar veículos nos Estados Unidos. No entanto, a empresa enfrenta o desafio de se adequar a rigorosas regulamentações de cibersegurança que regem o software automotivo. A conformidade com essas exigências será fundamental para o sucesso da Geely no competitivo mercado americano.

The Verge
OpenAI lança novo modelo de codificação agentic minutos após a Anthropic apresentar o seu próprio

OpenAI lança novo modelo de codificação agentic minutos após a Anthropic apresentar o seu próprio

Na segunda-feira, a OpenAI apresentou o Codex, uma nova ferramenta de programação voltada para desenvolvedores de software, juntamente com o lançamento do GPT-5.3 Codex, que aprimora as capacidades do Codex. Este modelo atualizado promete melhorias na geração de código e nas funcionalidades de depuração, permitindo que os desenvolvedores otimizem seus fluxos de trabalho. Os avanços da OpenAI podem ter um impacto significativo na eficiência do desenvolvimento de software, embora detalhes sobre métricas de desempenho ainda estejam pendentes.

TechCrunch
Redes Neurais Pseudo-Inversíveis

Redes Neurais Pseudo-Inversíveis

Pesquisadores apresentaram as Redes Neurais Pseudo-inversíveis Surjetivas (SPNN), uma nova arquitetura que estende a Pseudo-inversa de Moore-Penrose a sistemas não lineares, especialmente em redes neurais. Essa abordagem inclui um método denominado Retroprojeção Não Linear (NLBP), que garante consistência na resolução de problemas inversos não lineares. Ao aplicar técnicas baseadas em difusão, as SPNNs são capazes de lidar com diversas degradações não lineares, desde distorções ópticas até classificação semântica, permitindo inversão zero-shot e controle preciso sobre as saídas gerativas sem a necessidade de retrainamento.

arXiv
DFlash: Difusão de Blocos para Decodificação Especulativa de Flash

DFlash: Difusão de Blocos para Decodificação Especulativa de Flash

A DFlash apresenta um novo framework de decodificação especulativa que utiliza um leve modelo de difusão em blocos para a geração paralela de tokens, aumentando a eficiência em grandes modelos de linguagem. Ao produzir tokens preliminares em uma única passagem para frente e se condicionar ao contexto do modelo alvo, a DFlash alcança uma aceleração superior a 6x e velocidades até 2,5 vezes mais rápidas do que o EAGLE-3, melhorando a qualidade da inferência e a utilização da GPU.

arXiv
Modelos de linguagem visual podem aprender física intuitiva por meio da interação?

Modelos de linguagem visual podem aprender física intuitiva por meio da interação?

Pesquisas recentes indicam que modelos de visão-linguagem pré-treinados enfrentam dificuldades em intuitos relacionados ao mundo físico. Embora o ajuste fino supervisionado melhore o desempenho em tarefas simples, isso não resulta em regras físicas robustas e generalizáveis. Experimentos que utilizaram aprendizado por reforço para treinamento baseado em interação melhoraram o desempenho em tarefas específicas, mas não conseguiram garantir a generalização entre tarefas relacionadas, mesmo quando existiam semelhanças visuais e físicas.

arXiv
GPT-5.3-Codex

GPT-5.3-Codex

A OpenAI apresentou o GPT-5.3-Codex, um modelo avançado de codificação projetado para aprimorar significativamente as habilidades de programação. Segundo informações, esse modelo melhora o desempenho na geração de código e na compreensão de tarefas complexas de programação. Ele traz novas funcionalidades para os desenvolvedores, com potencial para otimizar fluxos de trabalho e aumentar a produtividade no desenvolvimento de software.

Openai.com
ExpressVPN recebe três grandes atualizações, incluindo um assistente de IA privado.

ExpressVPN recebe três grandes atualizações, incluindo um assistente de IA privado.

A ExpressVPN lançou duas novas funcionalidades: o ExpressKeys, um gerenciador de senhas, e o ExpressMailGuard, uma ferramenta de segurança para e-mails. O ExpressKeys gera e armazena senhas de forma segura, enquanto o ExpressMailGuard protege os usuários contra ataques de phishing. Essas adições têm como objetivo aprimorar a segurança e a privacidade dos usuários em um cenário digital cada vez mais complexo.

ZDNet
Novos recursos de proteção de privacidade com foco em IA e e-mail da ExpressVPN podem ser transformadores

Novos recursos de proteção de privacidade com foco em IA e e-mail da ExpressVPN podem ser transformadores

A ExpressVPN, a VPN mais bem avaliada pelo CNET, lançou atualizações significativas com o objetivo de aprimorar a privacidade dos usuários. Entre as principais novidades estão um novo protocolo Lightway, que proporciona velocidades mais rápidas, uma rede de servidores ampliada e um suporte melhorado para técnicas de ofuscação que permitem contornar a censura. Essas atualizações visam fortalecer a segurança e melhorar a experiência do usuário, tornando a ExpressVPN uma ferramenta ainda mais versátil para os consumidores que valorizam a privacidade.

CNET
Amazon Alexa Plus Confunde Chris Hemsworth em Anúncio do Super Bowl com Lançamento da Ferramenta de IA

Amazon Alexa Plus Confunde Chris Hemsworth em Anúncio do Super Bowl com Lançamento da Ferramenta de IA

A Amazon está prestes a apresentar ao público o Alexa Plus AI, após um ano de acesso antecipado. A prévia oficial acontecerá durante um comercial do Super Bowl com Chris Hemsworth. Esse é um passo importante para a Amazon, que busca aprimorar a interação dos usuários com a Alexa por meio de capacidades avançadas de inteligência artificial. Em breve, mais detalhes sobre os recursos e a experiência do usuário serão divulgados.

CNET