Últimas notícias de IA

HexFormer: Transformador de Visão Hiperbólica com Agregação de Mapa Exponencial

Pesquisadores desenvolveram o HexFormer, um transformador hiperbólico de visão para classificação de imagens que utiliza agregação de mapeamento exponencial em seu mecanismo de atenção. A arquitetura inclui uma variante hiperbólica e uma versão híbrida que combina um codificador hiperbólico com uma cabeça de classificação euclidiana. Os experimentos mostram que o HexFormer supera modelos euclidianos padrão e transformadores hiperbólicos anteriores em diversos conjuntos de dados, sendo a variante híbrida a que apresenta os melhores resultados. O estudo também destaca que os modelos hiperbólicos oferecem maior estabilidade nos gradientes e menor sensibilidade às estratégias de treinamento, sugerindo vantagens práticas ao se utilizar a geometria hiperbólica em tarefas de visão.

arXiv

há 136 dias

Aprender e Verificar: Uma Estrutura para Verificação Rigorosa de Redes Neurais Informadas por Física

Um novo quadro de "Aprender e Verificar" aborda as limitações das redes neurais na resolução de equações diferenciais ao fornecer limites de erro computáveis. Ele combina uma perda de Máxima Duplamente Suavizada para o treinamento com aritmética de intervalos para verificação, resultando em limites de erro rigorosos a posteriori. Testes numéricos bem-sucedidos em EDOs não lineares demonstram seu potencial para aplicações confiáveis em aprendizado de máquina científico.

arXiv

há 136 dias

Difusão para De-Oclusão: Difusão de Inpainting ciente de Acessórios para Reconhecimento Biométrico de Ouvidos Robusto

Um estudo avalia uma técnica de preenchimento de orelhas baseada em difusão, com o objetivo de melhorar os sistemas de reconhecimento de orelhas que enfrentam dificuldades devido a obstruções causadas por acessórios como brincos e fones de ouvido. O modelo reconstrói as áreas da orelha que estão ocultas, mantendo a precisão anatômica. Testes realizados com diferentes modelos de transformadores de visão demonstram que essa técnica aprimora o desempenho de reconhecimento, evidenciando sua utilidade prática em aplicações biométricas.

arXiv

há 136 dias

Airtable lança Superagent, sua nova ferramenta de agente de IA

O CEO da Airtable, Howie Liu, está avançando com o lançamento de uma nova linha de produtos, apesar da avaliação da empresa ter caído em dois terços. Liu acredita que essa iniciativa posicionará a Airtable para crescimento e inovação no competitivo mercado de software. Os novos produtos têm como objetivo melhorar a experiência do usuário e expandir as capacidades da Airtable, refletindo uma mudança estratégica em meio a desafios financeiros.

TechCrunch

há 137 dias

Phoebe Gates e Sophia Kianni levantam US$ 35 milhões para tornar as compras mais divertidas com a Phia

A Phia, uma startup liderada pelas fundadoras Phoebe Gates e Sophia, está focada no desenvolvimento de um agente de compras por inteligência artificial, enquanto enfrenta os desafios impostos por uma recente tempestade de neve na cidade de Nova York. A equipe se mantém firme em seu projeto, destacando a importância da adaptabilidade tanto no ambiente de trabalho quanto no desenvolvimento do produto.

TechCrunch

há 137 dias

China lança novo modelo open-source Kimi K2.5 e um agente de codificação

A Moonshot AI da China, apoiada pela Alibaba e pela HongShan, lançou o Kimi K2.5, um modelo de IA open-source capaz de processar texto, imagens e vídeo. Esse avanço posiciona o Kimi K2.5 como uma ferramenta versátil para desenvolvedores, com potencial para aprimorar aplicações em criação de conteúdo e análise multimídia. O lançamento reflete o investimento contínuo da China em tecnologia de IA, visando fortalecer sua competitividade no mercado global.

TechCrunch

há 137 dias

Perspectivas de Líderes em Tecnologia e Estudantes sobre o Futuro da IA

O artigo aborda os desafios de lidar com a incerteza no mundo acelerado atual, caracterizado por mudanças significativas nos âmbitos político, tecnológico, cultural e científico. Enfatiza a dificuldade de prever tendências futuras e ressalta a necessidade de adaptabilidade e pensamento crítico na tomada de decisões. O texto sugere que tanto indivíduos quanto organizações devem desenvolver resiliência e manter-se informados para responder de forma eficaz às transformações em curso.

Wired

há 137 dias

Todos de pé para o JudgeGPT

Em seu artigo, Lauren Feiner explora o potencial da inteligência artificial (IA) para resolver ineficiências no sistema jurídico. Ela destaca aplicações específicas, como análise preditiva para resultados de processos e revisão de documentos impulsionada por IA, que poderiam agilizar os procedimentos e reduzir custos. No entanto, também menciona preocupações sobre viés nos modelos de IA e a necessidade de supervisão regulatória para garantir equidade e transparência nos processos legais. O artigo argumenta que, embora a IA possa melhorar a eficiência, uma implementação cuidadosa é fundamental para evitar agravar disparidades existentes.

The Verge

há 137 dias

ctELM: Decodificação e Manipulação de Embeddings de Ensaios Clínicos com Modelos de Linguagem de Embedding

Pesquisadores desenvolveram um novo framework de código aberto chamado ctELM, destinado a alinhar Modelos de Linguagem de Grande Escala (LLMs) com embeddings de ensaios clínicos por meio do método de Modelo de Linguagem de Embedding (ELM). Este framework possibilita a descrição e comparação precisas de ensaios clínicos a partir de embeddings, além de gerar resumos plausíveis de ensaios com base em vetores de conceito, como idade e sexo. A implementação visa aprimorar a transparência e as capacidades generativas em aplicações biomédicas.

arXiv

há 137 dias

Aprendizado por Reforço Multicritério para Tomada de Decisão Tática Eficiente de Caminhões no Tráfego Rodoviário

Um novo framework de aprendizado por reforço multi-objetivo, utilizando a Otimização de Política Proximal, aborda as complexas compensações no tráfego de rodovias para veículos pesados, equilibrando segurança, eficiência energética e eficiência de tempo. Ele gera um conjunto contínuo de políticas Pareto-otimais, permitindo ajustes flexíveis no comportamento de condução sem a necessidade de re-treinamento. Essa abordagem adaptável melhora a tomada de decisões em caminhões autônomos, sendo avaliada em uma plataforma de simulação escalável.

arXiv

há 137 dias

Confiança, Desconfiança ou Inversão: Aprendizado por Reforço Baseado em Preferências Robusto com Feedback de Múltiplos Especialistas

TriTrust-PBRL (TTP) é uma nova estrutura desenvolvida para aprimorar o aprendizado por reforço baseado em preferências, ao enfrentar os desafios impostos por anotadores heterogêneos. Ao contrário dos métodos existentes, o TTP aprende tanto um modelo de recompensa quanto parâmetros de confiança específicos para cada especialista, permitindo identificar e inverter feedback adverso. Isso resulta em uma robustez significativa, como demonstrado em diversas tarefas, como MetaWorld e DM Control, onde o TTP supera as abordagens atuais de PBRL, mantendo um alto desempenho mesmo diante de feedbacks não confiáveis. A estrutura opera sem a necessidade de características detalhadas dos especialistas, tornando-se uma adição fluida aos sistemas existentes.

arXiv

há 137 dias

O mais recente chip de IA da Microsoft enfrenta concorrência com Amazon e Google

A Microsoft iniciou a implementação de seu chip Maia 200 em seus data centers. Este novo chip foi desenvolvido para aprimorar as capacidades de processamento e aumentar a eficiência dos serviços em nuvem. O Maia 200 tem como objetivo dar suporte a uma variedade de cargas de trabalho, potencialmente elevando o desempenho em aplicações de inteligência artificial e aprendizado de máquina. Essa atualização está alinhada com a estratégia da Microsoft de otimizar sua infraestrutura e reduzir custos operacionais. Mais detalhes sobre métricas de desempenho e cronogramas de implantação devem ser divulgados nas próximas semanas.

The Verge

há 138 dias