AI
Notizie IA

Ultime notizie IA

HexFormer: Trasformatore Vision Hyperbolico con Aggregazione Mappa Esponenziale

HexFormer: Trasformatore Vision Hyperbolico con Aggregazione Mappa Esponenziale

I ricercatori hanno sviluppato HexFormer, un trasformatore visivo iperbolico per la classificazione delle immagini che utilizza l'aggregazione tramite mappa esponenziale nel suo meccanismo di attenzione. L'architettura comprende sia una variante iperbolica sia una versione ibrida che combina un codificatore iperbolico con una testa di classificazione euclidea. Gli esperimenti dimostrano che HexFormer supera i modelli euclidei standard e i precedenti trasformatori iperbolici su diversi dataset, con la variante ibrida che ottiene i risultati migliori. Lo studio evidenzia inoltre che i modelli iperbolici offrono una maggiore stabilità dei gradienti e una ridotta sensibilità alle strategie di addestramento, suggerendo vantaggi pratici nell'utilizzo della geometria iperbolica per compiti visivi.

arXiv
Imparare e Verificare: Un Framework per la Verifica Rigorosa delle Reti Neurali Ispirate alla Fisica

Imparare e Verificare: Un Framework per la Verifica Rigorosa delle Reti Neurali Ispirate alla Fisica

Un nuovo framework chiamato "Learn and Verify" affronta le limitazioni delle reti neurali nella risoluzione delle equazioni differenziali, offrendo limiti di errore calcolabili. Questo approccio combina una massima perdita doppiamente smussata per l'addestramento con l'aritmetica degli intervalli per la verifica, generando rigorosi limiti di errore a posteriori. I test numerici di successo su equazioni differenziali ordinarie non lineari dimostrano il suo potenziale per applicazioni affidabili nel campo del machine learning scientifico.

arXiv
Diffusione per la De-Occlusione: Inpainting Diffuso Consapevole degli Accessori per un Riconoscimento Biometrico Auricolare Robusto

Diffusione per la De-Occlusione: Inpainting Diffuso Consapevole degli Accessori per un Riconoscimento Biometrico Auricolare Robusto

Uno studio valuta una tecnica di inpainting per le orecchie basata sulla diffusione, progettata per migliorare i sistemi di riconoscimento delle orecchie ostacolati da occlusioni causate da accessori come orecchini e cuffie. Il modello ricostruisce le aree occluse delle orecchie mantenendo un'accuratezza anatomica. I test su diversi modelli di transformer visivi mostrano che questa tecnica migliora le prestazioni di riconoscimento, dimostrando la sua utilità pratica nelle applicazioni biometriche.

arXiv
Airtable entra nel mercato degli agenti AI con Superagent

Airtable entra nel mercato degli agenti AI con Superagent

Il CEO di Airtable, Howie Liu, sta procedendo con il lancio di una nuova linea di prodotti nonostante la valutazione dell'azienda sia diminuita di due terzi. Liu è convinto che questa iniziativa posizionerà Airtable per una crescita e un'innovazione nel competitivo mercato del software. I nuovi prodotti mirano a migliorare l'esperienza dell'utente e ad ampliare le capacità di Airtable, riflettendo una svolta strategica in un contesto finanziario difficile.

TechCrunch
Phoebe Gates e Sophia Kianni, fondatrici di Phia, raccolgono 35 milioni di dollari per "rendere di nuovo divertente lo shopping"

Phoebe Gates e Sophia Kianni, fondatrici di Phia, raccolgono 35 milioni di dollari per "rendere di nuovo divertente lo shopping"

Phia, una startup fondata da Phoebe Gates e Sophia, è concentrata nello sviluppo di un agente di shopping basato sull'intelligenza artificiale, affrontando al contempo le sfide imposte da una recente tempesta di neve a New York. Il team rimane impegnato nel proprio progetto, sottolineando l'importanza della flessibilità sia nell'ambiente di lavoro che nello sviluppo del prodotto.

TechCrunch
Il Moonshot cinese lancia un nuovo modello open-source Kimi K2.5 e un agente di codifica

Il Moonshot cinese lancia un nuovo modello open-source Kimi K2.5 e un agente di codifica

L'AI Moonshot della Cina, supportata da Alibaba e HongShan, ha lanciato Kimi K2.5, un modello di intelligenza artificiale open-source in grado di elaborare testo, immagini e video. Questo progresso colloca Kimi K2.5 come uno strumento versatile per gli sviluppatori, con il potenziale di migliorare le applicazioni nella creazione di contenuti e nell'analisi multimediale. Il rilascio del modello sottolinea l'impegno continuo della Cina nell'investimento nella tecnologia AI, mirato a rafforzare la sua competitività nel mercato globale.

TechCrunch
Dove i leader tecnologici e gli studenti vedono realmente l'evoluzione dell'IA

Dove i leader tecnologici e gli studenti vedono realmente l'evoluzione dell'IA

L'articolo affronta le sfide nel gestire l'incertezza nel mondo frenetico di oggi, caratterizzato da profondi cambiamenti politici, tecnologici, culturali e scientifici. Sottolinea la difficoltà di prevedere le tendenze future e mette in evidenza l'importanza dell'adattabilità e del pensiero critico nel processo decisionale. Si suggerisce che individui e organizzazioni debbano coltivare la resilienza e rimanere informati per rispondere in modo efficace alle trasformazioni in corso.

Wired
Tutti in piedi per JudgeGPT

Tutti in piedi per JudgeGPT

Nel suo articolo, Lauren Feiner esplora il potenziale dell'intelligenza artificiale (IA) nel risolvere le inefficienze del sistema legale. Sottolinea applicazioni specifiche, come l'analisi predittiva per i risultati delle cause e la revisione documentale guidata dall'IA, che potrebbero ottimizzare i processi e ridurre i costi. Tuttavia, evidenzia anche le preoccupazioni riguardo ai bias nei modelli di IA e la necessità di un controllo normativo per garantire equità e trasparenza nelle procedure legali. L'articolo sostiene che, sebbene l'IA possa migliorare l'efficienza, un'implementazione attenta è fondamentale per evitare di aggravare le disuguaglianze esistenti.

The Verge
ctELM: Decodifica e Manipolazione degli Embeddings delle Sperimentazioni Cliniche con Modelli di Linguaggio per Embedding

ctELM: Decodifica e Manipolazione degli Embeddings delle Sperimentazioni Cliniche con Modelli di Linguaggio per Embedding

I ricercatori hanno sviluppato un nuovo framework open-source chiamato ctELM, progettato per allineare i Modelli di Linguaggio di Grande Dimensione (LLM) con le rappresentazioni delle sperimentazioni cliniche utilizzando il metodo dell'Embedding Language Model (ELM). Questo framework consente di fornire descrizioni e confronti accurati delle sperimentazioni cliniche a partire dalle rappresentazioni e può generare abstract plausibili delle sperimentazioni basati su vettori concettuali come età e sesso. L'implementazione mira a migliorare la trasparenza e le capacità generative nelle applicazioni biomediche.

arXiv
Apprendimento per rinforzo multi-obiettivo per decisioni tattiche efficienti dei camion nel traffico autostradale

Apprendimento per rinforzo multi-obiettivo per decisioni tattiche efficienti dei camion nel traffico autostradale

Un nuovo framework di apprendimento per rinforzo multi-obiettivo basato sull'ottimizzazione della politica prossimale affronta le complesse compromissioni nella guida in autostrada per veicoli pesanti, bilanciando sicurezza, efficienza energetica e efficienza temporale. Questo sistema genera un insieme continuo di politiche Pareto-ottimali, consentendo aggiustamenti flessibili nel comportamento di guida senza necessità di riqualificazione. Questo approccio adattabile migliora il processo decisionale per i camion autonomi, valutato su una piattaforma di simulazione scalabile.

arXiv
Fiducia, Mancanza di Fiducia o Cambiamento: Apprendimento per Rinforzo Basato su Preferenze Robuste con Feedback Multi-Esperto

Fiducia, Mancanza di Fiducia o Cambiamento: Apprendimento per Rinforzo Basato su Preferenze Robuste con Feedback Multi-Esperto

TriTrust-PBRL (TTP) è un nuovo framework progettato per migliorare l'apprendimento per rinforzo basato sulle preferenze, affrontando le sfide poste da annotatori eterogenei. A differenza dei metodi esistenti, TTP apprende sia un modello di ricompensa che parametri di fiducia specifici per ogni esperto, permettendo così di identificare e invertire feedback avversi. Questo approccio porta a una robustezza significativa, come dimostrato in vari compiti, tra cui MetaWorld e DM Control, dove TTP supera le attuali metodologie PBRL, mantenendo elevate prestazioni anche in presenza di feedback inaffidabili. Il framework funziona senza la necessità di dettagliate caratteristiche degli esperti, rendendolo un'aggiunta fluida ai sistemi esistenti.

arXiv
Il nuovo chip AI di Microsoft sfida Amazon e Google

Il nuovo chip AI di Microsoft sfida Amazon e Google

Microsoft ha avviato il rollout del suo chip Maia 200 nei propri data center. Questo nuovo chip è progettato per potenziare le capacità di elaborazione e migliorare l'efficienza dei servizi cloud. Il Maia 200 si propone di supportare una varietà di carichi di lavoro, con l'obiettivo di incrementare le prestazioni delle applicazioni di intelligenza artificiale e machine learning. Questo aggiornamento si inserisce nella strategia di Microsoft di ottimizzare la propria infrastruttura e ridurre i costi operativi. Ulteriori dettagli sulle metriche di performance e sui tempi di distribuzione sono attesi nelle prossime settimane.

The Verge