Últimas noticias de IA

Datos pan-fenómicos basados en aprendizaje profundo revelan la explosiva evolución de la disparidad visual aviar

Un estudio reciente utiliza el aprendizaje profundo, en particular un modelo ResNet34, para analizar la evolución morfológica de las aves al reconocer más de 10,000 especies de aves. Los hallazgos muestran que el espacio de incrustación de alta dimensión del modelo captura la convergencia fenotípica y la disparidad morfológica asociada a la riqueza de especies, subrayando la riqueza como un factor clave en la expansión del morfospace. Los patrones posteriores a la extinción K-Pg revelan un "estallido temprano" en la diversidad. Es importante destacar que el estudio también enfatiza la capacidad del modelo para formar estructuras jerárquicas en un contexto de entrenamiento con etiquetas planas, desafiando las suposiciones sobre la dependencia de las CNN en texturas locales.

arXiv

hace 126 días

SymPlex: Un transformador consciente de la estructura para la resolución simbólica de PDE

SymPlex presenta un novedoso marco de aprendizaje por refuerzo para derivar soluciones analíticas a ecuaciones en derivadas parciales (EDPs) sin necesidad de datos de referencia. Utiliza un Transformer consciente de la estructura, denominado SymFormer, para optimizar soluciones basadas únicamente en la EDP y sus condiciones de contorno. Este enfoque permite obtener soluciones interpretables que manejan de manera efectiva comportamientos no suaves, representando un avance significativo en comparación con los métodos numéricos tradicionales. Las pruebas empíricas demuestran que SymPlex recupera con precisión soluciones complejas de EDP, destacando su potencial para aplicaciones prácticas en modelado matemático e ingeniería.

arXiv

hace 126 días

Entrenamiento Eficiente Rápido-Lento para Modelos de Lenguaje Multimodal de Gran Escala a través de la Poda de Tokens Visuales

Investigadores han desarrollado DualSpeed, un marco diseñado para mejorar la eficiencia del entrenamiento de Modelos de Lenguaje Multimodal de Gran Tamaño (MLLMs) al abordar las ineficiencias asociadas con el tamaño masivo de los modelos y los tokens visuales. DualSpeed utiliza un enfoque de doble modo: un modo rápido que aplica Reducción de Tokens Visuales (VTP) para disminuir la cantidad de tokens visuales, y un modo lento que entrena sobre secuencias completas para garantizar la coherencia. Este método acelera significativamente el entrenamiento—2.1 veces para LLaVA-1.5 y 4.0 veces para LLaVA-NeXT—manteniendo más del 99% de rendimiento. El código está disponible en GitHub.

arXiv

hace 126 días

Dassault Systèmes y NVIDIA se asocian para desarrollar una plataforma de IA industrial que impulsa gemelos virtuales.

Una nueva arquitectura industrial de IA compartida integra Gemelos Virtuales con una infraestructura de IA escalable, mejorando la toma de decisiones en tiempo real en la manufactura. Este modelo, validado por la ciencia, optimiza los procesos y permite a las industrias aprovechar la IA para el mantenimiento predictivo y una mayor eficiencia operativa. La arquitectura posiciona la IA industrial como una herramienta esencial en los entornos de producción modernos.

Nvidia.com

hace 126 días

Darren Aronofsky critica la interpretación de la historia estadounidense en 'On This Day... 1776'

La nueva serie de cortometrajes "En este día... 1776" comienza con una imagen conmovedora de una mano acariciando la página de título de "Sentido común" de Thomas Paine, subrayando su importancia histórica. Esta serie tiene como objetivo explorar los eventos clave de la Revolución Americana, ofreciendo contexto y perspectivas sobre las figuras e ideas influyentes de la época.

CNET

hace 126 días

Por qué más consumidores prefieren las compras mejoradas por IA y aún esperan el toque humano.

Un informe reciente de ZDNET revela que el 73% de los consumidores está utilizando chatbots de inteligencia artificial para buscar productos, lo que refleja una creciente tendencia en el comercio electrónico. El artículo subraya la necesidad de que las empresas integren herramientas de IA para mejorar la interacción con los clientes y optimizar la experiencia de compra, a medida que aumenta la dependencia de los consumidores hacia estas tecnologías.

ZDNet

hace 127 días

SpaceX adquiere oficialmente xAI de Elon Musk, con planes para construir centros de datos en el espacio

SpaceX anunció la adquisición de xAI, la startup de inteligencia artificial de Elon Musk, lo que representa una expansión significativa en el ámbito de la inteligencia artificial. Esta fusión posiciona a SpaceX como la empresa privada más valiosa del mundo. La integración tiene como objetivo aprovechar la tecnología de xAI para mejorar las operaciones y los procesos de toma de decisiones de SpaceX, lo que podría facilitar sus ambiciosos proyectos de exploración espacial.

TechCrunch

hace 127 días

El HHS utiliza herramientas de IA de Palantir para enfocar subvenciones en 'DEI' e 'ideología de género'

El Departamento de Salud y Servicios Humanos ha estado utilizando herramientas de inteligencia artificial de Palantir desde marzo para mejorar los procesos de selección y auditoría relacionados con subvenciones y descripciones de puestos. Esta iniciativa tiene como objetivo garantizar el cumplimiento de las regulaciones federales y mejorar la supervisión. Se espera que la integración de estas herramientas de IA optimice las operaciones y reduzca los errores en la gestión de subvenciones.

Wired

hace 127 días

PixelGen: La Difusión de Píxeles Supera la Difusión Latente con Pérdida Perceptual

PixelGen es un novedoso marco de difusión de píxeles que supera las limitaciones de los modelos de difusión latente tradicionales de dos etapas al optimizar directamente en el espacio de píxeles. Utiliza dos pérdidas perceptuales—LPIPS para patrones locales y DINO para la semántica global—con el fin de mejorar la calidad de las imágenes. PixelGen logra un índice FID competitivo de 5.11 en ImageNet-256 tras solo 80 épocas de entrenamiento y muestra un rendimiento sólido en tareas de texto a imagen a gran escala, como lo demuestra un puntaje GenEval de 0.79. Este enfoque elimina la necesidad de VAEs y etapas auxiliares, ofreciendo un modelo generativo más ágil y efectivo. El código completo está disponible en GitHub.

arXiv

hace 127 días

Ampliación de las capacidades del aprendizaje por refuerzo mediante retroalimentación textual

Un estudio reciente presenta el aprendizaje por refuerzo a partir de retroalimentación textual (RLTF), que aprovecha las críticas textuales para mejorar los modelos de lenguaje grande después de su entrenamiento. A diferencia de los métodos tradicionales, RLTF utiliza el aprendizaje por refuerzo en múltiples turnos, lo que permite a los modelos asimilar la retroalimentación sin necesidad de demostraciones extensivas. Se probaron dos técnicas, la auto-destilación y la modelización de retroalimentación, en diversas tareas, y ambas demostraron superar de manera consistente las líneas base existentes. Esto sugiere que la retroalimentación textual puede mejorar significativamente el rendimiento de los modelos de manera eficiente.

arXiv

hace 127 días

Segmentación automática multi-cabeza mediante la incorporación de una cabeza de detección en la red neuronal de capa contextual

Una nueva arquitectura de Transformer multicabezal con compuertas, basada en Swin U-Net, mejora la auto-segmentación en radioterapia al integrar el contexto interslice y un cabezal de detección paralelo. Este modelo reduce de manera efectiva los falsos positivos, logrando una pérdida media de Dice de $0.013 \pm 0.036$ en comparación con $0.732 \pm 0.314$ de los métodos tradicionales. Este avance refuerza la fiabilidad del contorneado automatizado en entornos clínicos.

arXiv

hace 127 días

Optimización de la comunicación para el entrenamiento de Mixture-of-Experts con paralelismo híbrido de expertos

Un estudio reciente destaca los desafíos de implementar la comunicación de Expert Parallel (EP) en modelos de mezcla de expertos (MoE) a gran escala durante el proceso de entrenamiento. Este modelo de comunicación requiere un enfoque de todos a todos, lo que se complica por la dinámica y la escasez de recursos. Los hallazgos sugieren que mejorar la eficiencia de la comunicación EP es fundamental para optimizar el rendimiento de los MoE, lo que podría resultar en una mejora significativa en los tiempos de entrenamiento y en la utilización de recursos en entornos de aprendizaje automático a gran escala.

Nvidia.com

hace 127 días