Dernières actualités IA

Diffusion : Embeddings denses et contextuels pré-entraînés

La nouvelle famille de modèles d'embeddings multilingues pplx-embed utilise un apprentissage contrastif à plusieurs niveaux sur une base pré-entraînée par diffusion, permettant ainsi d'améliorer la récupération à l'échelle du web. Deux variantes ont été lancées : pplx-embed-v1 pour les tâches standards et pplx-embed-context-v1 pour des embeddings contextuels. Cette dernière se distingue particulièrement sur le benchmark ConTEB, tandis que les deux modèles affichent de bonnes performances sur plusieurs autres benchmarks de récupération et évaluations internes, attestant de leur fiabilité pour des applications de recherche à grande échelle.

arXiv

il y a 163 jours

Au-delà des récompenses basées sur les VLM : Modélisation des récompenses latentes native à la diffusion

Des chercheurs ont présenté DiNa-LRM, un modèle de récompense latent natif de diffusion qui optimise l'apprentissage des préférences directement sur des états de diffusion bruités. Cette approche utilise une vraisemblance de Thurstone calibrée sur le bruit pour améliorer l'efficacité de l'alignement. DiNa-LRM surpasse les systèmes de récompense basés sur la diffusion existants et se mesure aux meilleurs modèles de vision-langage, réalisant des améliorations significatives en termes de vitesse et d'utilisation des ressources durant l'alignement du modèle.

arXiv

il y a 163 jours

SCRAPL : Transformation par dispersion avec chemins aléatoires pour l'apprentissage automatique

Des chercheurs ont présenté SCRAPL (Scattering transform with Random Paths for machine Learning), une méthode d'optimisation novatrice destinée à simplifier l'utilisation des transformations par ondelettes dans l'entraînement des réseaux de neurones. En adoptant une approche stochastique, SCRAPL améliore l'efficacité des transformations jointes temps-fréquence pour l'analyse des motifs sonores, notamment dans la synthèse granulaire et l'appariement avec la Roland TR-808. Cette méthode intègre une heuristique d'échantillonnage par importance pour optimiser la convergence et les performances du modèle. Le code ainsi que des échantillons audio sont disponibles sous forme de package Python, facilitant une application plus large dans les tâches de traitement audio.

arXiv

il y a 163 jours

Des ingénieurs seniors, y compris des cofondateurs, quittent xAI au milieu de controverses

Au cours de la semaine dernière, neuf ingénieurs, dont deux cofondateurs, ont quitté publiquement xAI, suggérant une possible instabilité au sein de l'entreprise. Bien que certains départs aient été signalés auparavant, cette récente vague soulève des inquiétudes quant à l'orientation de la société et à la rétention des talents. Cette tendance pourrait avoir des répercussions sur les projets en cours et sur la confiance des investisseurs.

TechCrunch

il y a 163 jours

CBP conclut un accord avec Clearview AI pour utiliser la reconnaissance faciale dans le cadre du « ciblage tactique »

Les douanes et la protection des frontières des États-Unis ont alloué 225 000 dollars pour un abonnement d'un an à Clearview AI, un logiciel de reconnaissance faciale qui compare des images à une base de données de milliards de photos accessibles au public. Cette décision suscite des inquiétudes concernant la vie privée et les pratiques de surveillance, car cette technologie pourrait être utilisée pour identifier des individus sans leur consentement.

Wired

il y a 163 jours

Meridian lève 17 millions de dollars pour réinventer le tableur agentique

Meridian fait son entrée sur le marché en dévoilant une plateforme innovante basée sur un environnement de développement intégré (IDE), visant à améliorer la modélisation financière grâce à l'intelligence artificielle. Cet outil se concentre sur l'automatisation des tâches complexes liées aux tableurs, répondant ainsi à des inefficacités courantes. L'approche de Meridian pourrait rationaliser les analyses financières et les processus de prise de décision pour les entreprises, tout en réduisant potentiellement leur dépendance aux méthodes traditionnelles de tableur.

TechCrunch

il y a 163 jours

Uber Eats ajoute un assistant IA pour faciliter les courses alimentaires

L'article aborde une nouvelle fonctionnalité récemment lancée, permettant aux utilisateurs de générer du contenu à partir de prompts textuels ou d'images. Les utilisateurs sont avertis de vérifier leurs commandes avant de les finaliser, ce qui laisse entendre qu'il pourrait y avoir des problèmes avec les résultats obtenus. Cela souligne l'importance de la vigilance des utilisateurs pour tirer pleinement parti de cet outil.

The Verge

il y a 164 jours

Apprentissage sur le Manifold : Déverrouillage des transformateurs de diffusion standard avec des encodeurs de représentation

Une nouvelle approche, appelée Riemannian Flow Matching avec régularisation de Jacobi (RJF), s'attaque aux problèmes de convergence rencontrés par les transformateurs de diffusion lors de la génération de sorties de haute fidélité à partir d'encodeurs de représentation. En se concentrant sur les géodésiques des variétés et en corrigeant les erreurs de courbure, RJF permet à l'architecture DiT-B (131 millions de paramètres) d'atteindre un score FID impressionnant de 3,37, surpassant ainsi les méthodes précédentes. Le code est disponible via le lien GitHub fourni.

arXiv

il y a 164 jours

Attribution de données résolue par étape pour les transformateurs en boucle

Des chercheurs ont développé une nouvelle méthode appelée Influence Décomposée par Étapes (IDE) pour analyser comment des exemples d'entraînement individuels influencent les transformateurs lors de calculs récurrents. Contrairement aux méthodes existantes qui fournissent un score d'influence unique, l'IDE propose une trajectoire d'influence détaillée à chaque itération. Mise en œuvre via TensorSketch, l'IDE évite de générer des gradients par exemple, ce qui la rend évolutive pour les modèles de transformateurs. Les expériences montrent que l'IDE s'aligne étroitement avec les méthodes traditionnelles basées sur le gradient complet, tout en améliorant l'attribution des données et l'interprétabilité dans les tâches de raisonnement algorithmique.

arXiv

il y a 164 jours

La causalité dans les diffuseurs vidéo est dissociable du débruitage

Une nouvelle architecture, la Diffusion Causale Séparable (SCD), a été développée pour améliorer les modèles de diffusion causale utilisés dans la génération vidéo. En dissociant le raisonnement temporel du rendu d'images en plusieurs étapes, la SCD optimise l'efficacité, atteignant un débit plus élevé et une latence réduite. Les expériences montrent qu'elle égalise ou dépasse la qualité des modèles existants, ce qui en fait une innovation prometteuse dans les processus génératifs.

arXiv

il y a 164 jours

La dernière version du noyau Linux met fin à l'ère 6.x et constitue un atout pour les administrateurs cloud.

Linux 6.19 a été officiellement lancé, apportant des améliorations en matière de performance et de prise en charge de nouveaux matériels, y compris des pilotes mis à jour pour les GPU et les systèmes de réseau. Parallèlement, le développement de Linux 7.0 a débuté, annonçant des fonctionnalités et des améliorations à venir. Les utilisateurs sont vivement encouragés à passer à la version 6.19 pour bénéficier des dernières optimisations et d'une stabilité accrue.

ZDNet

il y a 164 jours

OpenAI abandonne la marque 'io' pour son matériel d'intelligence artificielle

OpenAI a annoncé qu'elle ne utilisera pas le nom "io" pour sa prochaine gamme de matériel d'intelligence artificielle, en réponse à une plainte déposée dans le cadre d'un procès pour violation de marque initié par la société de dispositifs audio, Audioio. Cette décision vise à éviter d'éventuelles complications juridiques alors que l'affaire se poursuit devant les tribunaux.

Wired

il y a 164 jours