AI
Noticias IA

Últimas noticias de IA

HexFormer: Transformador de Visión Hiperbólica con Agregación de Mapa Exponencial

HexFormer: Transformador de Visión Hiperbólica con Agregación de Mapa Exponencial

Investigadores han desarrollado HexFormer, un transformador visual hiperbólico para la clasificación de imágenes que utiliza agregación de mapas exponenciales en su mecanismo de atención. La arquitectura incluye tanto una variante hiperbólica como una versión híbrida que combina un codificador hiperbólico con una cabeza de clasificación euclidiana. Los experimentos demuestran que HexFormer supera a los modelos euclidianos estándar y a transformadores hiperbólicos anteriores en diversos conjuntos de datos, siendo la variante híbrida la que logra los mejores resultados. El estudio también destaca que los modelos hiperbólicos ofrecen una mayor estabilidad en los gradientes y una menor sensibilidad a las estrategias de entrenamiento, lo que sugiere ventajas prácticas en el uso de la geometría hiperbólica para tareas de visión.

arXiv
Aprender y Verificar: Un Marco para la Verificación Rigurosa de Redes Neuronales Informadas por la Física

Aprender y Verificar: Un Marco para la Verificación Rigurosa de Redes Neuronales Informadas por la Física

Un nuevo marco denominado "Aprender y Verificar" aborda las limitaciones de las redes neuronales en la resolución de ecuaciones diferenciales al ofrecer límites de error computables. Este enfoque combina una pérdida máxima suavizada doble para el entrenamiento con aritmética de intervalos para la verificación, lo que da como resultado límites de error a posteriori rigurosos. Pruebas numéricas exitosas en ODEs no lineales demuestran su potencial para aplicaciones de aprendizaje automático en ciencia que requieran alta fiabilidad.

arXiv
Difusión para la De-Oclusión: Inpainting de Difusión Consciente de Accesorios para un Reconocimiento Biométrico Auditivo Robusto

Difusión para la De-Oclusión: Inpainting de Difusión Consciente de Accesorios para un Reconocimiento Biométrico Auditivo Robusto

Un estudio evalúa una técnica de restauración de orejas basada en difusión, diseñada para mejorar los sistemas de reconocimiento de orejas afectados por oclusiones causadas por accesorios como pendientes y auriculares. El modelo reconstruye las regiones de la oreja que están ocultas, preservando la precisión anatómica. Pruebas realizadas con diferentes modelos de transformers de visión muestran que esta técnica mejora el rendimiento del reconocimiento, demostrando su utilidad práctica en aplicaciones biométricas.

arXiv
Airtable se adentra en el ámbito de los agentes de inteligencia artificial con Superagent

Airtable se adentra en el ámbito de los agentes de inteligencia artificial con Superagent

El CEO de Airtable, Howie Liu, avanza con el lanzamiento de una nueva línea de productos a pesar de que la valoración de la empresa ha caído en dos tercios. Liu confía en que esta iniciativa posicionará a Airtable para el crecimiento y la innovación en un mercado de software cada vez más competitivo. Los nuevos productos tienen como objetivo mejorar la experiencia del usuario y ampliar las capacidades de Airtable, lo que refleja un cambio estratégico en medio de desafíos financieros.

TechCrunch
Phoebe Gates y Sophia Kianni recaudan $35 millones para Phia con el objetivo de 'hacer que las compras sean divertidas nuevamente'

Phoebe Gates y Sophia Kianni recaudan $35 millones para Phia con el objetivo de 'hacer que las compras sean divertidas nuevamente'

Phia, una startup fundada por Phoebe Gates y Sophia, se centra en el desarrollo de un agente de compras basado en inteligencia artificial, mientras enfrenta los desafíos impuestos por una reciente tormenta de nieve en Nueva York. El equipo se mantiene comprometido con su proyecto, subrayando la importancia de la adaptabilidad tanto en su entorno laboral como en el desarrollo del producto.

TechCrunch
China lanza un nuevo modelo de código abierto Kimi K2.5 y un agente de codificación.

China lanza un nuevo modelo de código abierto Kimi K2.5 y un agente de codificación.

La iniciativa de inteligencia artificial Moonshot de China, respaldada por Alibaba y HongShan, ha lanzado Kimi K2.5, un modelo de IA de código abierto capaz de procesar texto, imágenes y video. Este avance posiciona a Kimi K2.5 como una herramienta versátil para desarrolladores, con el potencial de mejorar aplicaciones en la creación de contenido y el análisis multimedia. Este lanzamiento refleja la continua inversión de China en tecnología de IA, con el objetivo de fortalecer su ventaja competitiva en el mercado global.

TechCrunch
Perspectivas de líderes tecnológicos y estudiantes sobre el futuro de la IA

Perspectivas de líderes tecnológicos y estudiantes sobre el futuro de la IA

El artículo aborda los desafíos de navegar la incertidumbre en el vertiginoso mundo actual, caracterizado por cambios políticos, tecnológicos, culturales y científicos significativos. Se enfatiza la dificultad de predecir tendencias futuras y se destaca la necesidad de adaptabilidad y pensamiento crítico en la toma de decisiones. La pieza sugiere que tanto individuos como organizaciones deben cultivar la resiliencia y mantenerse informados para responder de manera efectiva a las transformaciones en curso.

Wired
Todos en pie para JudgeGPT

Todos en pie para JudgeGPT

En su artículo, Lauren Feiner examina el potencial de la inteligencia artificial (IA) para abordar las ineficiencias en el sistema legal. Destaca aplicaciones específicas, como el análisis predictivo de resultados de casos y la revisión de documentos impulsada por IA, que podrían agilizar los procesos y reducir costos. Sin embargo, también menciona las preocupaciones sobre el sesgo en los modelos de IA y la necesidad de una supervisión regulatoria para garantizar la equidad y la transparencia en los procedimientos legales. El artículo sostiene que, aunque la IA podría mejorar la eficiencia, su implementación cuidadosa es fundamental para evitar agravar las disparidades existentes.

The Verge
ctELM: Decodificación y Manipulación de Embeddings en Ensayos Clínicos con Modelos de Lenguaje de Embedding

ctELM: Decodificación y Manipulación de Embeddings en Ensayos Clínicos con Modelos de Lenguaje de Embedding

Un grupo de investigadores ha desarrollado un nuevo marco de trabajo de código abierto llamado ctELM, diseñado para alinear Modelos de Lenguaje de Gran Escala (LLMs) con incrustaciones de ensayos clínicos utilizando el método de Modelo de Lenguaje de Incrustación (ELM). Este marco permite realizar descripciones y comparaciones precisas de los ensayos clínicos a partir de estas incrustaciones, además de generar resúmenes plausibles de ensayos basados en vectores de conceptos como edad y sexo. La implementación tiene como objetivo mejorar la transparencia y las capacidades generativas en aplicaciones biomédicas.

arXiv
Aprendizaje por refuerzo multiobjetivo para la toma de decisiones tácticas eficientes de camiones en el tráfico de autopistas

Aprendizaje por refuerzo multiobjetivo para la toma de decisiones tácticas eficientes de camiones en el tráfico de autopistas

Un nuevo marco de aprendizaje por refuerzo multiobjetivo que utiliza la Optimización de Políticas Proximales aborda los complejos compromisos en la conducción por autopista de vehículos pesados, equilibrando la seguridad, la eficiencia energética y la eficiencia temporal. Este enfoque genera un conjunto continuo de políticas óptimas de Pareto, lo que permite ajustes flexibles en el comportamiento de conducción sin necesidad de reentrenamiento. Esta metodología adaptable mejora la toma de decisiones para el transporte autónomo, siendo evaluada en una plataforma de simulación escalable.

arXiv
Confianza, Desconfianza o Cambio: Aprendizaje por Refuerzo Basado en Preferencias Robusto con Retroalimentación de Múltiples Expertos

Confianza, Desconfianza o Cambio: Aprendizaje por Refuerzo Basado en Preferencias Robusto con Retroalimentación de Múltiples Expertos

TriTrust-PBRL (TTP) es un nuevo marco diseñado para mejorar el aprendizaje por refuerzo basado en preferencias al abordar los desafíos que presentan los anotadores heterogéneos. A diferencia de los métodos existentes, TTP aprende tanto un modelo de recompensa como parámetros de confianza específicos de cada experto, lo que le permite identificar e invertir la retroalimentación adversarial. Esto se traduce en una robustez significativa, como se ha demostrado en diversas tareas, como MetaWorld y DM Control, donde TTP supera los enfoques actuales de PBRL, manteniendo un alto rendimiento incluso con retroalimentación poco fiable. El marco funciona sin necesidad de características detalladas de los expertos, lo que lo convierte en una adición fluida a los sistemas ya existentes.

arXiv
El último chip de IA de Microsoft compite directamente con Amazon y Google

El último chip de IA de Microsoft compite directamente con Amazon y Google

Microsoft ha comenzado el despliegue de su chip Maia 200 en sus centros de datos. Este nuevo chip está diseñado para mejorar las capacidades de procesamiento y aumentar la eficiencia de los servicios en la nube. El Maia 200 tiene como objetivo soportar una variedad de cargas de trabajo, lo que podría incrementar el rendimiento de aplicaciones de inteligencia artificial y aprendizaje automático. Esta actualización se alinea con la estrategia de Microsoft de optimizar su infraestructura y reducir costos operativos. Se esperan más detalles sobre métricas de rendimiento y cronogramas de implementación en las próximas semanas.

The Verge