AI
Actualités IA

FLEx : Modélisation linguistique avec des explications linguistiques en quelques exemples

Source:arXiv
Auteur original:Adar Avsian et al.
FLEx : Modélisation linguistique avec des explications linguistiques en quelques exemples

Image générée par Gemini AI

Des chercheurs ont mis au point FLEx (Few-shot Language Explanations), une méthode qui améliore les performances des modèles linguistiques en utilisant un petit ensemble d'exemples explicatifs soigneusement sélectionnés. En regroupant les erreurs des modèles et en résumant les corrections efficaces, FLEx accroît la précision dans des tâches telles que la résolution de problèmes mathématiques et le questionnement, sans modifier les poids du modèle. Évalué sur des ensembles de données tels que CounterBench et GSM8K, FLEx a largement surpassé les méthodes traditionnelles de raisonnement en chaîne, réduisant les erreurs jusqu'à 83 %. Cette approche pourrait optimiser le processus de correction dans des domaines nécessitant des contributions d'experts.

FLEx Introduit des Explications en Peu d'Exemples pour Améliorer la Précision des Modèles Linguistiques

Une nouvelle approche, FLEx (Explications en Peu d'Exemples), vise à améliorer la précision des modèles linguistiques en utilisant un minimum d'exemples explicatifs. FLEx identifie et sélectionne les erreurs représentatives commises par le modèle grâce à des méthodes de clustering basées sur l'embedding et vérifie les explications associées pour corriger ces erreurs. Le résultat est un préfixe de prompt ajouté au moment de l'inférence, guidant le modèle pour éviter des erreurs similaires dans les entrées futures sans modifier ses poids sous-jacents.

Évaluation et Performance

FLEx a été évalué en utilisant trois ensembles de données : CounterBench, GSM8K et ReasonIF. Les résultats montrent que FLEx a systématiquement surpassé l'approche traditionnelle de prompting en chaîne de pensée (CoT), réduisant jusqu'à 83 % des erreurs qui persistent avec le prompting CoT.

Sujets connexes :

FLExmodèles linguistiquesexplications en langage naturelclustering basé sur des embeddingsévaluation sur CounterBench

📰 Source originale : https://arxiv.org/abs/2601.04157v1

Tous les droits et crédits appartiennent à l'éditeur original.

Partager cet article