AI
Notícias IA

Últimas notícias de IA

Diffusion-DRF: Flux de Recompensa Diferenciável para Ajuste Fino de Difusão de Vídeo

Diffusion-DRF: Flux de Recompensa Diferenciável para Ajuste Fino de Difusão de Vídeo

A Otimização de Preferências Diretas (DPO) aprimora a geração de Texto para Vídeo, mas enfrenta desafios relacionados ao treinamento intensivo em rótulos e viés. O método proposto, Diffusion-DRF, utiliza um Modelo de Visão-Linguagem congelado como um crítico diferenciável, permitindo a retropropagação eficiente do feedback por meio de modelos de difusão de vídeo. Essa abordagem melhora a qualidade do vídeo e o alinhamento semântico, ao mesmo tempo em que reduz problemas de manipulação de recompensas, sendo adaptável a outras tarefas baseadas em difusão sem a necessidade de modelos de recompensa adicionais.

arXiv
Ativação Direcionada para a Fidelidade Contextual em Modelos de Linguagem de Grande Escala

Ativação Direcionada para a Fidelidade Contextual em Modelos de Linguagem de Grande Escala

O ContextFocus é uma nova abordagem desenvolvida para aprimorar a fidelidade contextual dos Modelos de Linguagem de Grande Escala (LLMs) ao lidar com informações conflitantes. Essa técnica não exige ajuste fino do modelo e impõe um overhead mínimo durante a inferência, tornando-a eficiente. Testado no benchmark ConFiQA em comparação com métodos líderes, o ContextFocus demonstra melhorias significativas na precisão das saídas e se mantém eficaz mesmo com modelos maiores. Esse avanço oferece uma solução prática para a implementação de LLMs em ambientes de conhecimento dinâmico.

arXiv

Jake Sullivan expressa frustração com a destruição da política externa de IA durante a gestão de Trump.

Jake Sullivan, conselheiro de segurança nacional de Biden, está supostamente frustrado com as decisões do ex-presidente Trump, que ele acredita terem prejudicado a política externa dos EUA em relação à inteligência artificial. Entre as ações destacadas estão as tentativas de Sullivan de impedir a Nvidia de vender chips avançados para a China, ressaltando as tensões contínuas relacionadas a exportações tecnológicas e segurança nacional.

The Verge
Mobileye adquire startup de robôs humanoides Mentee Robotics por US$ 900 milhões

Mobileye adquire startup de robôs humanoides Mentee Robotics por US$ 900 milhões

A Mobileye, líder em tecnologia de visão computacional, se tornou um fornecedor essencial para montadoras, fornecendo milhões de chips que aprimoram recursos de segurança e sistemas de assistência ao motorista. Recentemente, a empresa está expandindo suas ofertas para incluir soluções mais avançadas de condução autônoma. Essa mudança é fundamental, já que a indústria automotiva prioriza cada vez mais as capacidades de direção autônoma. A Mobileye pretende aproveitar sua experiência em inteligência artificial e aprendizado de máquina para atender às demandas em evolução do mercado e manter sua vantagem competitiva.

TechCrunch

Grok está expondo crianças — a lei pode intervir?

O artigo aborda os desafios legais em torno de imagens sexualizadas de crianças geradas por inteligência artificial, com foco especial na plataforma Grok. Destaca a dificuldade em aplicar leis contra esse tipo de conteúdo devido a ambiguidades na legislação atual e à rápida evolução da tecnologia de IA. As implicações para o consentimento e a segurança infantil são significativas, uma vez que as leis atuais frequentemente ficam atrás dos avanços tecnológicos, criando lacunas que podem ser exploradas por indivíduos mal-intencionados. O texto clama por regulamentações mais claras para lidar de forma eficaz com essas questões emergentes.

The Verge
STReasoner: Potencializando LLMs para Raciocínio Espaço-Temporal em Séries Temporais por meio de Aprendizado por Reforço Consciente do Espaço

STReasoner: Potencializando LLMs para Raciocínio Espaço-Temporal em Séries Temporais por meio de Aprendizado por Reforço Consciente do Espaço

Pesquisadores apresentaram o ST-Bench, um novo benchmark que visa aprimorar o raciocínio espaço-temporal na análise de séries temporais, fundamental para sistemas críticos como tráfego e redes de energia. O estudo introduz o STReasoner, que combina séries temporais, estruturas gráficas e texto, alcançando melhorias de precisão que variam de 17% a 135% com custos mínimos em comparação a modelos proprietários.

arXiv
Conjunto de Dados de Relatórios de Radiologia Sintética Multi-RADS e Benchmarking Comparativo de 41 Modelos de Linguagem Abertos e Proprietários

Conjunto de Dados de Relatórios de Radiologia Sintética Multi-RADS e Benchmarking Comparativo de 41 Modelos de Linguagem Abertos e Proprietários

Pesquisadores desenvolveram o RXL-RADSet, um conjunto de dados com 1.600 relatórios de radiologia sintéticos, com o objetivo de aprimorar a atribuição automatizada de RADS. O estudo comparou 41 pequenos modelos de linguagem (SLMs) com o GPT-5.2 em termos de precisão e validade. O GPT-5.2 alcançou uma validade de 99,8% e uma precisão de 81,1%, superando os SLMs, que apresentaram 96,8% de validade e 61,1% de precisão. O desempenho melhorou com o aumento do tamanho do modelo e o uso de prompts guiados, mas ainda há desafios a serem enfrentados em relação a estruturas RADS mais complexas.

arXiv
O Momento Sonar: Avaliação de Modelos de Linguagem de Áudio na Geo-Localização Auditiva

O Momento Sonar: Avaliação de Modelos de Linguagem de Áudio na Geo-Localização Auditiva

A introdução do AGL1K representa um avanço significativo na geo-localização de áudio, estabelecendo um novo padrão com 1.444 clipes de áudio selecionados de 72 países. Ao utilizar a métrica de Localizabilidade de Áudio, os pesquisadores conseguiram aprimorar a qualidade das gravações para avaliação. Os resultados indicam que modelos de linguagem de áudio de código fechado superam os seus equivalentes de código aberto, com pistas linguísticas desempenhando um papel crucial nas previsões. Esse novo benchmark pode melhorar o raciocínio geoespacial em Modelos de Linguagem de Áudio (ALMs), abordando limitações anteriores na localização baseada em áudio.

arXiv
As maiores novidades da Nvidia na CES 2026

As maiores novidades da Nvidia na CES 2026

O artigo aborda as contribuições de Vera Rubin para a astronomia, com ênfase em seu trabalho sobre a matéria escura, além dos avanços na tecnologia de direção autônoma. Também destaca as recentes atualizações de software para jogadores de PC que melhoram o desempenho e a segurança. As implicações dessas atualizações incluem experiências de jogo aprimoradas e maior estabilidade do sistema para os usuários.

The Verge
Roborock apresenta robô aspirador de dois pés que promete revolucionar o mercado na CES 2026

Roborock apresenta robô aspirador de dois pés que promete revolucionar o mercado na CES 2026

O Roborock Saros Rover, que será lançado em breve, é o primeiro aspirador robotizado de duas pernas, projetado para oferecer maior manobrabilidade e eficiência na limpeza. Ao contrário dos aspiradores tradicionais, ele consegue navegar por escadas e diferentes tipos de terreno, o que pode transformar as rotinas de limpeza doméstica. Seu design inovador visa enfrentar os obstáculos comuns encontrados nos aspiradores robotizados atuais.

ZDNet
Commonwealth Fusion Systems instala ímã de reator e fecha acordo com a Nvidia

Commonwealth Fusion Systems instala ímã de reator e fecha acordo com a Nvidia

A Commonwealth Fusion Systems (CFS) instalou com sucesso o primeiro ímã em seu reator de fusão Sparc, apresentado na CES 2026. Este marco é fundamental, pois a CFS pretende ativar o reator em 2027. O dispositivo foi projetado para impulsionar a energia de fusão, com o potencial de revolucionar a geração de energia limpa.

TechCrunch
Sensores gerados por inteligência artificial abrem novos caminhos para a detecção precoce do câncer

Sensores gerados por inteligência artificial abrem novos caminhos para a detecção precoce do câncer

Pesquisadores do MIT e da Microsoft desenvolveram uma ferramenta de IA que melhora a detecção precoce de câncer ao analisar dados de pacientes e identificar biomarcadores. Essa tecnologia tem como objetivo aumentar significativamente a precisão dos diagnósticos, o que pode resultar em intervenções mais precoces e melhores resultados de tratamento. Os primeiros testes mostram resultados promissores, indicando que pode ser um divisor de águas nos cuidados oncológicos.

Mit.edu