FLEx: Modellazione del linguaggio con spiegazioni linguistiche a pochi esempi

•

Autore originale:Adar Avsian et al.

•

7 gennaio 2026

FLEx: Modellazione del linguaggio con spiegazioni linguistiche a pochi esempi

Immagine generata da Gemini AI

I ricercatori hanno sviluppato FLEx (Few-shot Language Explanations), un metodo che migliora le prestazioni dei modelli linguistici utilizzando un piccolo insieme di esempi esplicativi accuratamente selezionati. Attraverso il raggruppamento degli errori del modello e la sintesi delle correzioni efficaci, FLEx aumenta l'accuratezza in compiti come la risoluzione di problemi matematici e il question answering, senza modificare i pesi del modello. Valutato su dataset come CounterBench e GSM8K, FLEx ha superato significativamente i tradizionali approcci di prompting a catena di pensieri, riducendo gli errori fino all'83%. Questo approccio potrebbe semplificare il processo di correzione in settori che richiedono input esperti.

FLEx Introduce Spiegazioni in Few-shot per Migliorare l'Accuratezza dei Modelli Linguistici

Un nuovo approccio, FLEx (Spiegazioni in Few-shot), mira a migliorare l'accuratezza dei modelli linguistici utilizzando esempi esplicativi minimi. FLEx identifica e seleziona errori rappresentativi commessi dal modello attraverso metodi di clustering basati su embedding e verifica le spiegazioni associate per correggere questi errori. Il risultato è un prefisso di prompt aggiunto al momento dell'inferenza, che guida il modello ad evitare errori simili in futuri input senza modificare i suoi pesi sottostanti.

Valutazione e Prestazioni

FLEx è stato valutato utilizzando tre dataset: CounterBench, GSM8K e ReasonIF. I risultati mostrano che FLEx ha costantemente superato l'approccio tradizionale di prompting a catena di pensieri (CoT), riducendo fino all'83% degli errori che persistono con il prompting CoT.

Argomenti correlati:

FLExmodelli linguisticispiegazioni in linguaggio naturaleclustering basato su embeddingprompting di chain-of-thought

📰 Fonte originale: https://arxiv.org/abs/2601.04157v1

Tutti i diritti e i crediti appartengono all'editore originale.

Condividi questo articolo

Twitter Facebook LinkedIn WhatsApp Reddit