Ultime notizie IA

DAWN: Inferenza Veloce Consapevole delle Dipendenze per Modelli di Linguaggio di Diffusione

L'articolo presenta DAWN, un nuovo metodo per migliorare la velocità di inferenza nei modelli di linguaggio di grandi dimensioni basati su diffusione (dLLM), senza compromettere la qualità dell'output. DAWN affronta le inefficienze del decodificatore parallelo tradizionale modellando le dipendenze tra i token, consentendo così un mascheramento dei token più affidabile. I risultati sperimentali dimostrano che DAWN migliora la velocità di inferenza da 1,80 a 8,06 volte rispetto ai metodi esistenti, mantenendo al contempo la qualità della generazione. Il codice è disponibile su GitHub per l'implementazione.

arXiv

67 giorni fa

Spotify presenta "About the Song", una nuova funzionalità che offre contesto e curiosità sui brani preferiti.

Una nuova funzionalità dell'app consente agli utenti di esplorare le storie dietro le loro canzoni preferite direttamente all'interno della piattaforma. Questo miglioramento mira a arricchire l'esperienza di ascolto fornendo informazioni sugli artisti, i processi di scrittura e gli elementi tematici, senza che gli utenti debbano lasciare l'app. Il lancio di questa funzionalità è previsto per approfondire il coinvolgimento degli utenti e attrarre nuovi ascoltatori in cerca di un'esperienza musicale più immersiva.

The Verge

67 giorni fa

3 Modi in cui NVFP4Accelera l'Addestramento e l'Inferenza dell'Intelligenza Artificiale

NVIDIA ha presentato la sua ultima architettura di modelli di intelligenza artificiale, concepita per far fronte alle crescenti esigenze computazionali per l'addestramento e l'inferenza che superano la Legge di Moore. Il nuovo sistema, dotato di GPU avanzate e software ottimizzato, punta a migliorare l'efficienza e le prestazioni, soddisfacendo le crescenti richieste delle applicazioni di intelligenza artificiale nei vari settori. Questa innovazione è fondamentale per gli sviluppatori che vogliono sfruttare le capacità dell'IA senza affrontare costi proibitivi o vincoli di risorse.

Nvidia.com

67 giorni fa

Il secondo produttore di automobili cinese può avere successo in America?

Geely, il secondo maggiore produttore automobilistico della Cina, sta valutando la possibilità di avviare la produzione di veicoli negli Stati Uniti. Tuttavia, l'azienda dovrà affrontare rigorose normative sulla cybersicurezza che regolano il software automobilistico. La conformità a questi requisiti sarà fondamentale per il loro successo nel competitivo mercato americano.

The Verge

68 giorni fa

OpenAI lancia un nuovo modello di codifica agentico pochi minuti dopo il rilascio di quello di Anthropic

Lunedì, OpenAI ha presentato Codex, un nuovo strumento di programmazione dedicato agli sviluppatori software, in concomitanza con il lancio di GPT-5.3 Codex, che ne potenzia le funzionalità. Questo modello aggiornato promette una generazione di codice e strumenti di debug migliorati, consentendo agli sviluppatori di ottimizzare i propri flussi di lavoro. I progressi di OpenAI potrebbero avere un impatto significativo sull'efficienza nello sviluppo software, anche se i dettagli sui parametri di prestazione sono ancora in fase di definizione.

TechCrunch

68 giorni fa

Reti Neurali Pseudo-Invertibili

I ricercatori hanno presentato le Reti Neurali Pseudo-invertibili Suriettive (SPNN), una nuova architettura che estende l'inverso pseudo di Moore-Penrose ai sistemi non lineari, in particolare nelle reti neurali. Questo approccio include un metodo chiamato Back-Projection Non-Lineare (NLBP), che garantisce coerenza nella risoluzione di problemi inversi non lineari. Grazie all'applicazione di tecniche basate sulla diffusione, le SPNN possono affrontare diverse degradazioni non lineari, dalle distorsioni ottiche alla classificazione semantica, permettendo inversioni in zero-shot e un controllo preciso sulle uscite generative senza la necessità di riaddestramento.

arXiv

68 giorni fa

DFlash: Diffusione Bloccata per la Decodifica Speculativa Flash

DFlash presenta un innovativo framework di decodifica speculativa che sfrutta un modello di diffusione a blocchi leggero per la generazione parallela di token, migliorando così l'efficienza nei modelli di linguaggio di grandi dimensioni. Grazie alla produzione di token preliminari in un unico passaggio in avanti e alla condizionamento sul contesto proveniente dal modello di riferimento, DFlash raggiunge un'accelerazione superiore a 6 volte e velocità fino a 2,5 volte più elevate rispetto a EAGLE-3, migliorando la qualità dell'inferenza e l'utilizzo della GPU.

arXiv

68 giorni fa

I modelli di linguaggio visivo possono apprendere la fisica intuitiva attraverso l'interazione?

Ricerche recenti indicano che i modelli di visione-linguaggio pre-addestrati hanno difficoltà con le intuizioni relative al mondo fisico. Sebbene il fine-tuning supervisionato migliori le prestazioni su compiti semplici, non produce regole fisiche robuste e generalizzabili. Esperimenti che hanno utilizzato il reinforcement learning per un addestramento basato sull'interazione hanno migliorato le prestazioni su compiti specifici, ma non sono riusciti a garantire la generalizzazione tra compiti correlati, anche in presenza di somiglianze visive e fisiche.

arXiv

68 giorni fa

GPT-5.3-Codex

OpenAI ha presentato GPT-5.3-Codex, un modello di programmazione avanzato progettato per migliorare significativamente le capacità di codifica. Questo modello promette di ottimizzare le performance nella generazione di codice e nella comprensione di compiti di programmazione complessi. Introduce nuove funzionalità per gli sviluppatori, con l'obiettivo di semplificare i flussi di lavoro e aumentare la produttività nello sviluppo software.

Openai.com

68 giorni fa

ExpressVPN ottiene tre importanti aggiornamenti, tra cui un assistente AI privato

ExpressVPN ha lanciato due nuove funzionalità: ExpressKeys, un gestore di password, e ExpressMailGuard, uno strumento di sicurezza per le email. ExpressKeys genera e memorizza le password in modo sicuro, mentre ExpressMailGuard protegge gli utenti dagli attacchi di phishing. Queste novità mirano a migliorare la sicurezza e la privacy degli utenti in un panorama digitale sempre più complesso.

ZDNet

68 giorni fa

Le nuove funzionalità di protezione della privacy basate su intelligenza artificiale e email di ExpressVPN potrebbero rappresentare una svolta significativa.

ExpressVPN, il VPN meglio valutato da CNET, ha introdotto aggiornamenti significativi per migliorare la privacy degli utenti. Tra le novità spiccano un nuovo protocollo Lightway per velocità superiori, una rete di server ampliata e un supporto migliorato per le tecniche di offuscamento che consentono di aggirare la censura. Questi aggiornamenti sono concepiti per rafforzare la sicurezza e ottimizzare l'esperienza utente, rendendo ExpressVPN uno strumento più versatile per i consumatori attenti alla propria privacy.

CNET

68 giorni fa

Alexa Plus di Amazon Confonde Chris Hemsworth in uno Spot del Super Bowl con il Lancio del Nuovo Strumento AI

Amazon è pronta a svelare al pubblico l'Alexa Plus AI, dopo un anno di accesso anticipato. La presentazione ufficiale avverrà durante uno spot del Super Bowl con Chris Hemsworth come protagonista. Questo rappresenta un passo significativo per Amazon, che punta a migliorare l'interazione degli utenti con Alexa grazie a capacità AI avanzate. Ulteriori dettagli su funzionalità ed esperienza utente saranno disponibili a breve.

CNET

68 giorni fa