Últimas noticias de IA

Diffusion-DRF: Flujo de Recompensa Diferenciable para el Ajuste de Difusión en Video

La Optimización de Preferencias Directas (DPO) mejora la generación de Texto a Video, pero enfrenta desafíos relacionados con el entrenamiento intensivo en etiquetas y sesgos. El método propuesto, Diffusion-DRF, utiliza un Modelo de Visión-Lenguaje congelado como crítico diferenciable, lo que permite una retropropagación eficiente de los comentarios a través de modelos de difusión de video. Este enfoque mejora la calidad del video y la alineación semántica, al mismo tiempo que reduce los problemas de manipulación de recompensas, siendo además adaptable a otras tareas basadas en difusión sin necesidad de modelos de recompensa adicionales.

arXiv

hace 97 días

Enfoque Contextual: Activación de Dirección para la Fidelidad Contextual en Modelos de Lenguaje de Gran Escala

ContextFocus es un nuevo enfoque diseñado para mejorar la fidelidad contextual de los Modelos de Lenguaje de Gran Escala (LLMs) ante información contradictoria. Este método no requiere ajustes en el modelo y añade un mínimo de sobrecarga durante la inferencia, lo que lo hace eficiente. Al ser probado en el benchmark ConFiQA en comparación con métodos líderes, ContextFocus demuestra mejoras significativas en la precisión de los resultados y se mantiene eficaz incluso con modelos de mayor tamaño. Este avance ofrece una solución práctica para el despliegue de LLMs en entornos de conocimiento dinámicos.

arXiv

hace 97 días

Jake Sullivan expresa su frustración por la destrucción de su política exterior de IA por parte de Trump

Jake Sullivan, asesor de seguridad nacional de Biden, se encuentra supuestamente frustrado por las decisiones del expresidente Trump, que considera han socavado la política exterior de EE. UU. en materia de inteligencia artificial. Entre las acciones clave se encuentran los esfuerzos de Sullivan para evitar que Nvidia venda chips avanzados a China, lo que resalta las tensiones persistentes en torno a las exportaciones tecnológicas y la seguridad nacional.

The Verge

hace 98 días

Mobileye adquiere la startup de robots humanoides Mentee Robotics por 900 millones de dólares

Mobileye, un líder en tecnología de visión por computadora, se ha convertido en un proveedor clave para los fabricantes de automóviles, suministrando millones de chips que mejoran las características de seguridad y los sistemas de asistencia al conductor. Recientemente, la empresa está ampliando su oferta para incluir soluciones de conducción autónoma más avanzadas. Este cambio es fundamental, ya que la industria automotriz prioriza cada vez más las capacidades de conducción autónoma. Mobileye busca aprovechar su experiencia en inteligencia artificial y aprendizaje automático para satisfacer las demandas cambiantes del mercado y mantener su ventaja competitiva.

TechCrunch

hace 98 días

Grok está desnudando a niños: ¿puede la ley detenerlo?

El artículo aborda los desafíos legales en torno a las imágenes sexualizadas de niños generadas por inteligencia artificial, centrándose especialmente en la plataforma Grok. Destaca la dificultad de hacer cumplir las leyes contra este tipo de contenido debido a las ambigüedades en la legislación actual y la rápida evolución de la tecnología de IA. Las implicaciones para el consentimiento y la seguridad infantil son significativas, ya que las leyes actuales a menudo no están a la par con los avances tecnológicos, dejando vacíos que pueden ser explotados por individuos vulnerables. El texto hace un llamado a establecer regulaciones más claras para abordar de manera efectiva estos problemas emergentes.

The Verge

hace 98 días

STReasoner: Potenciando LLMs para el razonamiento espaciotemporal en series temporales mediante el aprendizaje por refuerzo consciente del espacio

Investigadores han presentado ST-Bench, un nuevo conjunto de pruebas diseñado para mejorar el razonamiento espaciotemporal en el análisis de series temporales, una capacidad esencial para sistemas críticos como los de tráfico y las redes eléctricas. El estudio introduce STReasoner, que combina series temporales, estructuras gráficas y texto, logrando mejoras en precisión que oscilan entre el 17% y el 135% a costos mínimos en comparación con modelos propietarios.

arXiv

hace 98 días

Conjunto de datos de informes radiológicos sintéticos Multi-RADS y evaluación comparativa de 41 modelos de lenguaje de código abierto y propietarios.

Investigadores han desarrollado RXL-RADSet, un conjunto de datos que consta de 1,600 informes de radiología sintéticos, con el objetivo de mejorar la asignación automatizada de RADS. Este benchmark compara 41 pequeños modelos de lenguaje (SLMs) con GPT-5.2 en términos de precisión y validez. GPT-5.2 alcanzó una validez del 99.8% y una precisión del 81.1%, superando a los SLMs, que mostraron una validez del 96.8% y una precisión del 61.1%. El rendimiento mejoró con el tamaño del modelo y las indicaciones guiadas, aunque persisten desafíos para los marcos RADS más complejos.

arXiv

hace 98 días

El Momento Sonar: Evaluación de Modelos de Lenguaje de Audio en Geo-localización de Audio

La introducción de AGL1K representa un avance significativo en la geo-localización de audio, estableciendo un nuevo estándar con 1,444 clips de audio seleccionados de 72 países. Al utilizar la métrica de Localizabilidad de Audio, los investigadores han mejorado la calidad de las grabaciones para su evaluación. Los resultados indican que los modelos de lenguaje de audio de código cerrado superan a sus contrapartes de código abierto, siendo las pistas lingüísticas un factor clave en las predicciones. Este nuevo estándar podría potenciar el razonamiento geoespacial en los Modelos de Lenguaje de Audio (ALMs), abordando las limitaciones previas en la localización basada en audio.

arXiv

hace 98 días

Los anuncios más destacados de Nvidia en el CES 2026

El artículo aborda las contribuciones de Vera Rubin a la astronomía, centrándose especialmente en su trabajo sobre la materia oscura, así como en los avances en la tecnología de conducción autónoma. También destaca las recientes actualizaciones de software para jugadores de PC que mejoran el rendimiento y la seguridad. Las implicaciones de estas actualizaciones incluyen experiencias de juego mejoradas y una mayor estabilidad del sistema para los usuarios.

The Verge

hace 98 días

Un Roborock bípedo destaca en el mercado de aspiradoras robóticas en el CES 2026.

El Roborock Saros Rover, que se lanzará pronto, es el primer robot aspirador bípedo, diseñado para ofrecer una mayor maniobrabilidad y eficiencia en la limpieza. A diferencia de las aspiradoras tradicionales, puede moverse por escaleras y diferentes tipos de terrenos, lo que podría transformar las rutinas de limpieza en el hogar. Su diseño innovador busca solucionar los obstáculos comunes que enfrentan los aspiradores robóticos actuales.

ZDNet

hace 98 días

Commonwealth Fusion Systems instala imán para reactor y alcanza acuerdo con Nvidia

Commonwealth Fusion Systems ha instalado con éxito el primer imán en su reactor de fusión Sparc, presentado en el CES 2026. Este hito es fundamental, ya que CFS tiene como objetivo activar el reactor en 2027. El dispositivo está diseñado para impulsar la energía de fusión, lo que podría revolucionar la generación de energía limpia.

TechCrunch

hace 98 días

Sensores generados por IA abren nuevas vías para la detección temprana del cáncer

Investigadores del MIT y Microsoft han desarrollado una herramienta de inteligencia artificial que mejora la detección temprana del cáncer mediante el análisis de datos de pacientes e identificación de biomarcadores. Esta tecnología tiene como objetivo aumentar significativamente la precisión en los diagnósticos, lo que podría facilitar intervenciones más tempranas y mejores resultados en los tratamientos. Los primeros ensayos muestran resultados prometedores, sugiriendo que podría convertirse en un factor determinante en la atención oncológica.

Mit.edu

hace 98 días