Ultime notizie IA

I dati pan-fenomici basati sul deep learning rivelano l'evoluzione esplosiva della disparità visiva negli uccelli

Uno studio recente utilizza il deep learning, in particolare un modello ResNet34, per analizzare l'evoluzione morfologica degli uccelli, riconoscendo oltre 10.000 specie. I risultati mostrano che lo spazio di embedding ad alta dimensione del modello cattura la convergenza fenotipica e la disparità morfologica legate alla ricchezza delle specie, sottolineando quest'ultima come un fattore chiave nell'espansione del morfospazio. I modelli post-estinzione K-Pg rivelano un "primo scoppio" di diversità. Inoltre, lo studio evidenzia anche la capacità del modello di formare strutture gerarchiche in un contesto di addestramento a etichette piatte, contestando le assunzioni sulla dipendenza delle CNN dalle texture locali.

arXiv

126 giorni fa

SymPlex: Un Trasformatore Consapevole della Struttura per la Risoluzione Simbolica delle PDE

SymPlex presenta un nuovo framework di apprendimento per rinforzo per derivare soluzioni analitiche a equazioni differenziali parziali (PDE) senza la necessità di dati di verità fondamentale. Utilizza un Transformer consapevole della struttura, chiamato SymFormer, per ottimizzare le soluzioni basandosi esclusivamente sulla PDE e sulle sue condizioni al contorno. Questo approccio consente di ottenere soluzioni interpretabili che gestiscono efficacemente comportamenti non regolari, rappresentando un significativo progresso rispetto ai metodi numerici tradizionali. Test empirici dimostrano che SymPlex recupera con precisione soluzioni complesse delle PDE, evidenziando il suo potenziale per applicazioni pratiche nella modellizzazione matematica e nell'ingegneria.

arXiv

126 giorni fa

Formazione Efficiente Veloce-Lenta per Modelli Linguistici Multimodali di Grandi Dimensioni attraverso la Potatura dei Token Visivi

I ricercatori hanno sviluppato DualSpeed, un framework progettato per migliorare l'efficienza del training dei Modelli Linguistici Multimodali di Grandi Dimensioni (MLLM) affrontando le inefficienze legate alle enormi dimensioni dei modelli e ai token visivi. DualSpeed adotta un approccio a doppio regime: una modalità rapida che utilizza il Visual Token Pruning (VTP) per ridurre i token visivi, e una modalità lenta che si allena su sequenze complete per garantire coerenza. Questo metodo accelera significativamente il processo di addestramento—di 2,1 volte per LLaVA-1.5 e di 4,0 volte per LLaVA-NeXT—mantenendo oltre il 99% delle prestazioni. Il codice è disponibile su GitHub.

arXiv

126 giorni fa

Dassault Systèmes e NVIDIA collaborano per sviluppare una piattaforma di intelligenza artificiale industriale per alimentare i gemelli virtuali

Una nuova architettura industriale di intelligenza artificiale condivisa integra i Gemelli Virtuali con un'infrastruttura AI scalabile, migliorando il processo decisionale in tempo reale nella manifattura. Questo modello, convalidato scientificamente, ottimizza i processi, consentendo alle industrie di sfruttare l'IA per la manutenzione predittiva e un'efficienza operativa superiore. L'architettura colloca l'intelligenza artificiale industriale come uno strumento fondamentale negli ambienti di produzione moderni.

Nvidia.com

126 giorni fa

Darren Aronofsky: Il Tuo AI Slop Sta Rovinandо la Storia Americana in 'On This Day…1776'

La nuova serie di cortometraggi "On This Day…1776" si apre con un'immagine toccante di una mano che sfiora la pagina del titolo di "Common Sense" di Thomas Paine, sottolineando il suo significato storico. Questa serie ha l'obiettivo di esplorare eventi chiave della Rivoluzione Americana, offrendo contesto e approfondimenti sulle figure e le idee influenti di quel periodo.

CNET

126 giorni fa

Perché sempre più consumatori preferiscono lo shopping potenziato dall'IA, ma si aspettano comunque un tocco umano

Un recente rapporto di ZDNET rivela che il 73% dei consumatori utilizza chatbot AI per le ricerche di prodotto, evidenziando una tendenza crescente nell'e-commerce. L'articolo sottolinea l'importanza per le aziende di integrare strumenti di intelligenza artificiale per migliorare il coinvolgimento dei clienti e semplificare l'esperienza di acquisto, man mano che cresce la dipendenza dei consumatori da queste tecnologie.

ZDNet

127 giorni fa

SpaceX di Elon Musk acquisisce ufficialmente xAI, con piani per costruire centri dati nello spazio

SpaceX ha annunciato l'acquisizione di xAI, la startup di intelligenza artificiale fondata da Elon Musk, segnando un'importante espansione nel settore dell'IA. Questa fusione colloca SpaceX come la compagnia privata più preziosa al mondo. L'integrazione mira a sfruttare la tecnologia di xAI per migliorare le operazioni e i processi decisionali di SpaceX, con l'obiettivo di ottimizzare i suoi ambiziosi progetti di esplorazione spaziale.

TechCrunch

127 giorni fa

Il HHS utilizza strumenti di intelligenza artificiale di Palantir per mirare a 'DEI' e 'ideologia di genere' nei finanziamenti.

Il Dipartimento della Salute e dei Servizi Umani ha iniziato a utilizzare strumenti di intelligenza artificiale forniti da Palantir a partire da marzo, con l'obiettivo di migliorare i processi di screening e auditing per sovvenzioni e descrizioni di lavoro. Questa iniziativa mira a garantire la conformità alle normative federali e a rafforzare la supervisione. L'integrazione di questi strumenti di intelligenza artificiale dovrebbe semplificare le operazioni e ridurre gli errori nella gestione delle sovvenzioni.

Wired

127 giorni fa

PixelGen: La Diffusione dei Pixel Supera la Diffusione Latente con la Perdita Perceptuale

PixelGen è un innovativo framework di diffusione dei pixel che supera le limitazioni dei tradizionali modelli di diffusione latente a due fasi, ottimizzando direttamente nello spazio dei pixel. Utilizza due perdite percettive—LPIPS per i pattern locali e DINO per la semantica globale—per migliorare la qualità dell'immagine. PixelGen raggiunge un punteggio FID competitivo di 5.11 su ImageNet-256 con sole 80 epoche di addestramento e dimostra prestazioni elevate in compiti di generazione testo-immagine su larga scala, come evidenziato da un punteggio GenEval di 0.79. Questo approccio elimina la necessità di VAE e fasi ausiliarie, offrendo un modello generativo snello ed efficace. Il codice completo è disponibile su GitHub.

arXiv

127 giorni fa

Espansione delle capacità dell'apprendimento per rinforzo tramite feedback testuale

Un recente studio presenta il RL da Feedback Testuale (RLTF), che sfrutta le critiche testuali per migliorare i modelli di linguaggio di grandi dimensioni dopo l'addestramento. A differenza dei metodi tradizionali, il RLTF utilizza un apprendimento rinforzato multi-turno, consentendo ai modelli di interiorizzare il feedback senza necessità di dimostrazioni estese. Due tecniche, Self Distillation e Feedback Modeling, sono state testate su diversi compiti, dimostrando costantemente prestazioni superiori rispetto ai baselines esistenti. Questo suggerisce che il feedback testuale può migliorare in modo significativo l'efficacia dei modelli in maniera efficiente.

arXiv

127 giorni fa

Segmentazione automatizzata multi-testa mediante l'integrazione della testa di rilevamento nel rete neurale a strato contestuale

Una nuova architettura Transformer multi-testa a gated, basata su Swin U-Net, migliora l'auto-segmentazione nella radioterapia integrando il contesto inter-slice e una testa di rilevamento parallela. Questo modello riduce efficacemente i falsi positivi, raggiungendo una perdita media di Dice di $0.013 \pm 0.036$ rispetto a $0.732 \pm 0.314$ dei metodi tradizionali. Questo progresso aumenta l'affidabilità del contorno automatizzato in contesti clinici.

arXiv

127 giorni fa

Ottimizzazione della comunicazione per l'addestramento dei Mix di Esperti con Parallelismo Ibrido degli Esperti

Uno studio recente mette in evidenza le sfide legate all'implementazione della comunicazione Expert Parallel (EP) nei modelli di mixture-of-experts (MoE) in contesti hyperscale durante la fase di addestramento. Il modello di comunicazione richiede un approccio all-to-all, complicato da dinamiche e sparsità. I risultati suggeriscono che migliorare l'efficienza della comunicazione EP è fondamentale per ottimizzare le prestazioni dei MoE, il che potrebbe portare a un notevole miglioramento nei tempi di addestramento e nell'utilizzo delle risorse in ambienti di machine learning su larga scala.

Nvidia.com

127 giorni fa