Últimas noticias de IA

DAWN: Inferencia Rápida Consciente de Dependencias para Modelos de Lenguaje de Difusión

El artículo presenta DAWN, un nuevo método para mejorar la velocidad de inferencia en modelos de lenguaje de difusión de gran tamaño (dLLMs) sin comprometer la calidad de salida. DAWN aborda las ineficiencias de la decodificación paralela tradicional al modelar las dependencias entre tokens, lo que permite un desmascaramiento de tokens más confiable. Los resultados experimentales muestran que DAWN mejora la velocidad de inferencia en un rango de 1.80 a 8.06 veces en comparación con los métodos existentes, manteniendo la calidad de generación. El código está disponible en GitHub para su implementación.

arXiv

hace 67 días

Spotify lanza "Acerca de la Canción", una función que proporciona contexto y datos curiosos sobre los temas favoritos de los usuarios.

Una nueva función de la aplicación permite a los usuarios explorar las historias detrás de sus canciones favoritas directamente en la plataforma. Esta mejora tiene como objetivo enriquecer la experiencia de escucha al ofrecer información sobre los artistas, los procesos de composición y los elementos temáticos, sin que los usuarios tengan que abandonar la aplicación. Se espera que el lanzamiento de esta función profundice el compromiso de los usuarios y atraiga a más personas que buscan una experiencia musical más inmersiva.

The Verge

hace 67 días

3 Formas en que NVFP4 Acelera el Entrenamiento y la Inferencia de IA

NVIDIA ha presentado su más reciente arquitectura de modelos de inteligencia artificial, diseñada para hacer frente a las crecientes demandas computacionales de entrenamiento e inferencia que superan la Ley de Moore. Este nuevo sistema, que incluye GPUs avanzadas y software optimizado, busca mejorar la eficiencia y el rendimiento, atendiendo las crecientes necesidades de las aplicaciones de IA en diversos sectores. Esta innovación es fundamental para los desarrolladores que buscan aprovechar las capacidades de la inteligencia artificial sin enfrentar costos prohibitivos o limitaciones de recursos.

Nvidia.com

hace 67 días

¿Puede el segundo fabricante de automóviles de China tener éxito en Estados Unidos?

Geely, el segundo mayor fabricante de automóviles de China, está explorando la posibilidad de fabricar vehículos en Estados Unidos. Sin embargo, deben enfrentar estrictas regulaciones de ciberseguridad que rigen el software automotriz. Cumplir con estos requisitos será fundamental para su éxito en el competitivo mercado estadounidense.

The Verge

hace 68 días

OpenAI lanza un nuevo modelo de codificación agente justo minutos después del lanzamiento del de Anthropic

El lunes, OpenAI presentó Codex, una nueva herramienta de programación dirigida a desarrolladores de software, junto con el lanzamiento de GPT-5.3 Codex, que mejora las capacidades de Codex. Este modelo actualizado promete ofrecer una generación de código y características de depuración más eficientes, permitiendo a los desarrolladores optimizar sus flujos de trabajo. Los avances de OpenAI podrían tener un impacto significativo en la eficiencia del desarrollo de software, aunque aún se están esperando detalles sobre las métricas de rendimiento.

TechCrunch

hace 68 días

Redes Neuronales Pseudo-Inversibles

Investigadores han presentado las Redes Neuronales Pseudo-invertibles Sobreyectivas (SPNN, por sus siglas en inglés), una arquitectura innovadora que amplía la Pseudo-inversa de Moore-Penrose a sistemas no lineales, especialmente en el ámbito de las redes neuronales. Esto incluye un método denominado Retroproyección No Lineal (NLBP), que garantiza la consistencia en la resolución de problemas inversos no lineales. A través de técnicas basadas en difusión, las SPNN pueden abordar diversas degradaciones no lineales, desde distorsiones ópticas hasta clasificación semántica, lo que permite una inversión en cero disparos y un control preciso sobre los resultados generativos sin necesidad de reentrenamiento.

arXiv

hace 68 días

DFlash: Difusión de Bloques para la Decodificación Especulativa de Flash

DFlash presenta un novedoso marco de decodificación especulativa que utiliza un modelo de difusión en bloque ligero para la generación paralela de tokens, lo que optimiza la eficiencia en los modelos de lenguaje de gran tamaño. Al generar tokens preliminares en una única pasada hacia adelante y condicionar sobre el contexto del modelo objetivo, DFlash logra una aceleración de más de 6 veces y velocidades hasta 2.5 veces más rápidas que EAGLE-3, mejorando así la calidad de la inferencia y la utilización de la GPU.

arXiv

hace 68 días

¿Pueden los modelos de lenguaje visual aprender física intuitiva a través de la interacción?

Investigaciones recientes indican que los modelos de visión-lenguaje preentrenados tienen dificultades para comprender intuiciones del mundo físico. Aunque el ajuste fino supervisado mejora el rendimiento en tareas simples, no logra generar reglas físicas robustas y generalizables. Los experimentos que utilizaron aprendizaje por refuerzo para entrenamientos basados en la interacción mejoraron el rendimiento en tareas específicas, pero no lograron garantizar la generalización entre tareas relacionadas, incluso cuando existían similitudes visuales y físicas.

arXiv

hace 68 días

GPT-5.3-Codex: Avances en la inteligencia artificial y su aplicación en la programación.

OpenAI ha presentado GPT-5.3-Codex, un modelo avanzado de codificación diseñado para mejorar significativamente las capacidades de programación. Este modelo, según informes, mejora el rendimiento en la generación de código y en la comprensión de tareas de programación complejas. Además, ofrece nuevas funcionalidades para los desarrolladores, lo que podría optimizar los flujos de trabajo y aumentar la productividad en el desarrollo de software.

Openai.com

hace 68 días

ExpressVPN recibe tres importantes actualizaciones, incluyendo un asistente de IA privado.

ExpressVPN ha lanzado dos nuevas funciones: ExpressKeys, un gestor de contraseñas, y ExpressMailGuard, una herramienta de seguridad para correos electrónicos. ExpressKeys genera y almacena contraseñas de forma segura, mientras que ExpressMailGuard protege a los usuarios de ataques de phishing. Estas incorporaciones tienen como objetivo mejorar la seguridad y la privacidad del usuario en un panorama digital cada vez más complejo.

ZDNet

hace 68 días

Las nuevas funciones de protección de privacidad de IA y correo electrónico de ExpressVPN podrían revolucionar el sector.

ExpressVPN, el VPN mejor valorado por CNET, ha implementado actualizaciones significativas con el objetivo de mejorar la privacidad de los usuarios. Entre las novedades se encuentra un nuevo protocolo Lightway que ofrece velocidades más rápidas, una red de servidores ampliada y un mejor soporte para técnicas de ofuscación que permiten sortear la censura. Estas mejoras están diseñadas para reforzar la seguridad y enriquecer la experiencia del usuario, convirtiendo a ExpressVPN en una herramienta aún más versátil para los consumidores preocupados por su privacidad.

CNET

hace 68 días

El nuevo Alexa Plus de Amazon desconcierta a Chris Hemsworth en un anuncio del Super Bowl.

Amazon está a punto de presentar al público el Alexa Plus AI, después de un año de acceso anticipado. La vista previa oficial tendrá lugar durante un anuncio del Super Bowl protagonizado por Chris Hemsworth. Este es un paso significativo para Amazon, que busca mejorar la interacción de los usuarios con Alexa a través de capacidades avanzadas de inteligencia artificial. Se esperan más detalles sobre las características y la experiencia del usuario pronto.

CNET

hace 68 días