Últimas noticias de IA

Embelezamientos Densos y Contextuales Preentrenados por Difusión

La nueva familia de modelos de incrustación multilingüe pplx-embed utiliza un aprendizaje contrastivo de múltiples etapas sobre una arquitectura preentrenada mediante difusión, lo que mejora la recuperación a escala web. Se han lanzado dos variantes: pplx-embed-v1 para tareas estándar y pplx-embed-context-v1 para incrustaciones contextuales. Esta última destaca en el benchmark ConTEB, mientras que ambos modelos muestran un buen desempeño en varios otros benchmarks de recuperación y evaluaciones internas, lo que indica su fiabilidad para aplicaciones de búsqueda a gran escala.

arXiv

hace 163 días

Más allá de las recompensas basadas en VLM: Modelado de recompensas latentes nativas de difusión

Investigadores han presentado DiNa-LRM, un modelo de recompensa latente nativo de difusión que optimiza el aprendizaje de preferencias directamente en estados de difusión ruidosos. Este enfoque emplea una verosimilitud de Thurstone calibrada por ruido para mejorar la eficiencia de alineación. DiNa-LRM supera a los sistemas de recompensa basados en difusión existentes y compite con los principales Modelos de Visión-Lenguaje, logrando mejoras significativas en velocidad y uso de recursos durante el proceso de alineación del modelo.

arXiv

hace 163 días

SCRAPL: Transformación de Dispersión con Caminos Aleatorios para el Aprendizaje Automático

Investigadores han presentado SCRAPL (Transformada de dispersión con caminos aleatorios para el aprendizaje automático), un nuevo método de optimización diseñado para agilizar el uso de transformadas de dispersión por wavelet en el entrenamiento de redes neuronales. Al emplear un enfoque estocástico, SCRAPL mejora la eficiencia de las transformadas de dispersión conjuntas en el tiempo y la frecuencia, facilitando el análisis de patrones sonoros, como en la síntesis granular y la coincidencia con la Roland TR-808. El método incluye una heurística de muestreo de importancia para optimizar la convergencia y el rendimiento del modelo. El código y muestras de audio están disponibles como un paquete de Python, lo que permite una aplicación más amplia en tareas de procesamiento de audio.

arXiv

hace 163 días

Ingenieros senior, incluidos cofundadores, abandonan xAI en medio de controversia

En la última semana, nueve ingenieros, incluidos dos cofundadores, han dejado públicamente xAI, lo que indica una posible inestabilidad dentro de la empresa. Si bien algunas salidas se habían registrado anteriormente, esta reciente ola suscita preocupaciones sobre la dirección de la firma y la retención de talento. Esta tendencia podría afectar los proyectos en curso y la confianza de los inversores.

TechCrunch

hace 163 días

CBP firma acuerdo con Clearview AI para utilizar el reconocimiento facial en "objetivos tácticos"

La Oficina de Aduanas y Protección Fronteriza de EE. UU. ha destinado $225,000 para una suscripción de un año a Clearview AI, un software de reconocimiento facial que compara imágenes con una base de datos de miles de millones de fotos de fuentes públicas. Esta decisión genera inquietudes sobre la privacidad y las prácticas de vigilancia, ya que la tecnología podría ser utilizada para identificar a personas sin su consentimiento.

Wired

hace 163 días

Meridian recauda 17 millones de dólares para reinventar la hoja de cálculo agente | TechCrunch

Meridian ha salido del modo sigiloso, presentando una plataforma innovadora basada en un entorno de desarrollo integrado (IDE) destinada a mejorar la modelización financiera mediante inteligencia artificial. Esta herramienta se centra en automatizar tareas complejas en hojas de cálculo, abordando ineficiencias comunes. El enfoque de Meridian podría optimizar los análisis financieros y los procesos de toma de decisiones en las empresas, lo que podría reducir la dependencia de los métodos tradicionales de hojas de cálculo.

TechCrunch

hace 163 días

Uber Eats incorpora un asistente de inteligencia artificial para facilitar las compras de supermercado.

El artículo aborda una nueva función lanzada recientemente que permite a los usuarios generar contenido mediante indicaciones de texto o imágenes. Se advierte a los usuarios que verifiquen sus pedidos antes de finalizarlos, lo que sugiere posibles problemas con los resultados generados. Esto resalta la importancia de la diligencia del usuario para utilizar la herramienta de manera efectiva.

The Verge

hace 164 días

Aprendizaje en el Manifold: Desbloqueo de Transformadores de Difusión Estándar con Codificadores de Representación

Un nuevo enfoque denominado Matching de Flujos Riemannianos con Regularización de Jacobi (RJF) aborda los problemas de convergencia en transformadores de difusión al generar salidas de alta fidelidad a partir de codificadores de representación. Al centrarse en las geodésicas de la variedad y corregir errores de curvatura, RJF permite que la arquitectura DiT-B (131 millones de parámetros) logre un destacado puntaje FID de 3.37, superando a métodos anteriores. El código está disponible en el enlace de GitHub proporcionado.

arXiv

hace 164 días

Atribución de datos resueltos por pasos para transformadores en bucle

Investigadores han desarrollado un nuevo método denominado Influencia Descompuesta por Pasos (SDI, por sus siglas en inglés) para analizar cómo los ejemplos de entrenamiento individuales afectan a los transformadores en bucle durante los cálculos recurrentes. A diferencia de los métodos existentes que proporcionan una única puntuación de influencia, el SDI ofrece una trayectoria de influencia detallada en cada iteración. Implementado a través de TensorSketch, el SDI evita la generación de gradientes por ejemplo, lo que lo hace escalable para modelos de transformadores. Los experimentos demuestran que el SDI se alinea estrechamente con los métodos tradicionales de gradiente completo, al tiempo que mejora la atribución de datos y la interpretabilidad en tareas de razonamiento algorítmico.

arXiv

hace 164 días

La causalidad en los difusores de video es separable de la reducción de ruido

Se ha desarrollado una nueva arquitectura, Diffusión Causal Separada (SCD, por sus siglas en inglés), para mejorar los modelos de difusión causal utilizados en la generación de video. Al desacoplar el razonamiento temporal de la renderización de múltiples fotogramas, SCD optimiza la eficiencia, logrando un mayor rendimiento y reduciendo la latencia. Los experimentos demuestran que iguala o supera la calidad de los modelos existentes, lo que la convierte en una innovación prometedora en los procesos generativos.

arXiv

hace 164 días

La última versión del núcleo de Linux cierra la era 6.x y beneficia a los administradores de la nube.

Se ha lanzado oficialmente Linux 6.19, que ofrece mejoras en rendimiento y soporte para nuevo hardware, incluyendo controladores actualizados para GPUs y redes. Mientras tanto, ha comenzado el desarrollo de Linux 7.0, lo que anticipa nuevas características y mejoras. Se recomienda a los usuarios actualizar a la versión 6.19 para disfrutar de las últimas optimizaciones y estabilidad.

ZDNet

hace 164 días

OpenAI Abandona la Marca 'io' para Su Hardware de IA

OpenAI anunció que no utilizará el nombre "io" para su próxima línea de hardware de inteligencia artificial, tras la presentación de una demanda por infracción de marca registrada iniciada por la empresa de dispositivos de audio, Audioio. Esta decisión busca evitar complicaciones legales adicionales mientras el caso sigue su curso en los tribunales.

Wired

hace 164 días