Últimas notícias de IA

Agentes de IA estão prontos para o ambiente de trabalho? Novo padrão gera dúvidas.

Em uma análise recente, a previsão do CEO da Microsoft, Satya Nadella, feita há dois anos, sobre o potencial da IA para substituir empregos de colarinho branco está sendo reavaliada. Apesar dos avanços nas capacidades da inteligência artificial, a esperada substituição em larga escala de funções em setores como direito, finanças e tecnologia da informação não ocorreu conforme o previsto. O artigo explora os desafios e as nuances da integração da IA nessas profissões, sugerindo que, embora a inteligência artificial possa aumentar a produtividade, pode não ser capaz de substituir completamente o elemento humano que é essencial no trabalho do conhecimento.

TechCrunch

há 141 dias

Escalonamento da Inferência NVFP4 para FLUX.2 em GPUs de Data Center NVIDIA Blackwell

A NVIDIA se uniu ao Black Forest Labs (BFL) para aprimorar a série de modelos de texto para imagem FLUX.1. Essa parceria tem como objetivo alcançar capacidades de geração de imagens FP4, especificamente para a próxima série de GPUs NVIDIA Blackwell GeForce RTX 50, programada para ser lançada em 2025. Esse avanço pode melhorar significativamente o renderização de imagens em tempo real para desenvolvedores e criadores que utilizam gráficos impulsionados por IA.

Nvidia.com

há 141 dias

CamPilot: Aprimorando o Controle de Câmera em Modelos de Difusão de Vídeo com Feedback Eficiente de Recompensa de Câmera

Pesquisas recentes aprimoram os modelos de difusão de vídeo controlados por câmeras, abordando as limitações na controlabilidade das mesmas. O estudo apresenta um decodificador 3D eficiente que transforma o vídeo latente e a pose da câmera em representações 3D, otimizando a consistência em nível de pixel para uma melhor alinhamento. Este método resolve deficiências existentes em modelos de recompensa e reduz a sobrecarga computacional, demonstrando eficácia nos benchmarks RealEstate10K e WorldScore. Para mais detalhes, visite a [página do CamPilot](https://a-bigbao.github.io/CamPilot/).

arXiv

há 141 dias

Escalonando Transformadores de Difusão Texto-Imagem com Autoencoders de Representação

Pesquisas sobre Autoencoders de Representação (RAEs) indicam que eles se destacam na geração de texto para imagem (T2I) em larga escala, superando os Autoencoders Variacionais (VAEs) de última geração em diferentes escalas de modelo. Os RAEs demonstram uma convergência mais rápida, qualidade de geração superior e estabilidade durante o ajuste fino. Isso sugere que os RAEs poderiam otimizar estruturas de T2I, melhorando modelos multimodais que integram compreensão e geração visual.

arXiv

há 141 dias

Robustez Provável em Modelos de Linguagem Multimodais de Grande Escala Através do Suavização do Espaço de Características

Uma nova abordagem chamada Suavização no Espaço de Características (Feature-space Smoothing, FS) foi proposta para aumentar a robustez de modelos de linguagem multimodais de grande porte (MLLMs) contra ataques adversariais. A técnica FS garante um limite inferior certificado na similaridade cosseno das características sob ataques limitados por $\ell_2$. A adição do módulo Purificador e Mapeador de Suavidade (PSM) melhora ainda mais a robustez sem a necessidade de retrainamento. Experimentos demonstram que o FS-PSM reduz significativamente a Taxa de Sucesso de Ataques de quase 90% para cerca de 1%, superando o treinamento adversarial tradicional em diversos MLLMs e tarefas.

arXiv

há 141 dias

Este sistema operacional alimenta silenciosamente toda a IA - e a maioria dos futuros empregos em TI também.

A mais recente matéria da ZDNET destaca que o Linux é o sistema operacional predominante para aplicações de inteligência artificial, sem alternativas viáveis. Empresas como Canonical e Red Hat desempenham papéis centrais nesse cenário, oferecendo suporte e ferramentas essenciais para o desenvolvimento de IA. O artigo ressalta a importância de as empresas adotarem o Linux para uma implementação e gestão eficazes da inteligência artificial.

ZDNet

há 142 dias

Uma linha do tempo do mercado de semicondutores dos EUA em 2025

A indústria de semicondutores dos EUA enfrentou uma turbulência significativa em 2022, marcada por mudanças de liderança em grandes empresas e discussões em evolução sobre as regulamentações de exportação de chips para inteligência artificial. Esses desdobramentos ressaltam a adaptação contínua do setor às pressões geopolíticas e aos avanços tecnológicos, moldando as estratégias futuras e a dinâmica competitiva.

TechCrunch

há 142 dias

Alerta de ironia: Citações fictícias descobertas em artigos da NeurIPS, prestigiada conferência de IA

A startup de detecção de IA, GPTZero, analisou 4.841 artigos apresentados na recente conferência NeurIPS, realizada em San Diego, e descobriu que 1.900 submissões, ou cerca de 39%, continham conteúdo gerado por inteligência artificial. Isso ressalta a crescente presença da IA na escrita acadêmica, levantando preocupações sobre a autenticidade e a originalidade nas pesquisas. Esses dados podem levar à implementação de diretrizes mais rigorosas para o uso de IA em submissões acadêmicas.

TechCrunch

há 142 dias

Estados Unidos e China Estão Colaborando Mais de Perto em IA do que se Imagina

Os EUA e a China estão imersos em uma corrida competitiva na área da inteligência artificial, com ênfase em avanços em algoritmos, modelos e hardware. Apesar da rivalidade, a colaboração continua na pesquisa acadêmica, com troca de conhecimentos e recursos. Essa dinâmica traz tanto oportunidades quanto desafios, à medida que as preocupações com a segurança nacional aumentam junto com a inovação. O equilíbrio entre competição e cooperação pode moldar o futuro do desenvolvimento e da regulamentação da IA.

Wired

há 142 dias

APPLE: Rotulagem Pseudo-Atributo-Preservante para Troca de Rosto Baseada em Difusão

Pesquisadores desenvolveram o APPLE (Atribuição de Preservação de Pseudo-Rótulos), um novo método de troca de rostos que aprimora a transferência de identidade ao mesmo tempo em que mantém atributos essenciais, como iluminação e maquiagem. Ao tratar a troca de rostos como uma tarefa de desfoque condicional e utilizar um framework de professor-aluno para uma supervisão mais eficaz, o APPLE entrega resultados fotorrealistas e estabelece um novo padrão na preservação de atributos.

arXiv

há 142 dias

Em Direção à Compreensão das Melhores Práticas para Quantização de Modelos de Linguagem-Vision

Um estudo investiga a eficácia de diversos métodos de quantização, incluindo GPTQ e AWQ, em pipelines multimodais que envolvem modelos de visão e linguagem. Os resultados indicam que tanto os modelos de Visão (ViT) quanto os Modelos de Linguagem de Grande Escala (LLM) são fundamentais para o desempenho, com a quantização em bits reduzidos do LLM preservando alta precisão. Esta pesquisa oferece insights para a otimização de memória e latência na implementação de modelos de linguagem multimodais. O código está disponível em https://github.com/gautomdas/mmq.

arXiv

há 142 dias

Detecção Robusta de Notícias Falsas utilizando Modelos de Linguagem de Grande Escala sob Ataques de Sentimento Adversário

Pesquisadores desenvolveram o AdSent, uma nova estrutura que aprimora a detecção de notícias falsas ao combater a manipulação de sentimentos, uma vulnerabilidade exposta por modelos de linguagem de grande escala. O estudo revela que a alteração de sentimentos impacta significativamente a precisão da detecção, favorecendo artigos neutros como se fossem genuínos. O AdSent adota uma estratégia de treinamento independente de sentimentos, superando modelos existentes em robustez e precisão em diversos conjuntos de dados.

arXiv

há 142 dias