AI
Actualités IA

Dernières actualités IA

La machine à café haut de gamme de Bosch sera équipée d'Alexa Plus.

La machine à café haut de gamme de Bosch sera équipée d'Alexa Plus.

Un nouveau modèle de cafetière de comptoir a été lancé, intégrant une fonction mains libres avec l'assistant vocal d'Amazon. Cette innovation permet aux utilisateurs de préparer leur café, d'ajuster les paramètres et d'accéder à des recettes simplement par commandes vocales. L'objectif de cette fonctionnalité est d'améliorer la commodité pour l'utilisateur et de simplifier le processus de préparation du café, séduisant ainsi les consommateurs férus de technologie en quête d'appareils de cuisine plus intelligents.

The Verge
Fermez la porte du réfrigérateur !

Fermez la porte du réfrigérateur !

Samsung a lancé des fonctionnalités de contrôle vocal pour l'ouverture et la fermeture de ses réfrigérateurs intelligents Family Hub. Cette mise à jour permet aux utilisateurs de gérer leur réfrigérateur sans les mains grâce à des commandes vocales, améliorant ainsi la commodité, notamment lors de la cuisine. La fonctionnalité est compatible avec l'assistant Bixby de Samsung et vise à simplifier les tâches culinaires. Les propriétaires actuels de Family Hub recevront cette mise à jour par le biais d'une mise à niveau logicielle, tandis que les nouveaux acheteurs bénéficieront de cette fonctionnalité dès la sortie de la boîte. Ce développement souligne l'engagement de Samsung à intégrer la technologie intelligente dans les appareils du quotidien, ce qui pourrait influencer les décisions des consommateurs sur le marché de la maison intelligente.

The Verge
Ce trackpad multifonction pourrait être le accessoire PC le plus captivant du CES (et son prix est connu)

Ce trackpad multifonction pourrait être le accessoire PC le plus captivant du CES (et son prix est connu)

Hyper a dévoilé plusieurs nouveaux accessoires informatiques au CES, notamment la série T de stations d'accueil Thunderbolt 4, conçues pour améliorer la connectivité et les performances des professionnels. Ces stations d'accueil sont dotées de plusieurs ports USB et prennent en charge des affichages 4K en double. Elles devraient être disponibles au premier trimestre 2024, avec des prix à partir de 199 $.

ZDNet
Ce robot aspirateur au CES 2026 peut localiser les objets perdus sur votre sol et vous en alerter.

Ce robot aspirateur au CES 2026 peut localiser les objets perdus sur votre sol et vous en alerter.

Le robot aspirateur Narwal Flow 2, récemment présenté au CES, se distingue par ses capacités de nettoyage avancées, notamment un système d'auto-nettoyage qui lui permet de laver ses propres lingettes. Il bénéficie d'une navigation améliorée grâce à la technologie LiDAR, optimisant ainsi la cartographie des espaces. De plus, le Flow 2 peut être contrôlé via une application mobile, offrant ainsi un confort d'utilisation accru.

ZDNet
La nouvelle méthode de DeepSeek pour former des modèles d'IA avancés pourrait tout bouleverser à nouveau

La nouvelle méthode de DeepSeek pour former des modèles d'IA avancés pourrait tout bouleverser à nouveau

DeepSeek a lancé les Hyper-Connexions Contraintes par Manifold (mHC), une nouvelle technologie conçue pour améliorer les connexions de données au sein de systèmes complexes. Cette innovation vise à optimiser l'efficacité du traitement des données et de l'analytique. Ses applications spécifiques incluent de meilleures performances dans les modèles d'apprentissage automatique et d'intelligence artificielle, ce qui pourrait révolutionner la manière dont les organisations gèrent de grands ensembles de données. D'autres détails concernant la mise en œuvre et l'impact sur l'industrie sont attendus.

ZDNet
Deux approches d'apprentissage profond pour la segmentation automatisée du ventricule gauche dans l'IRM cardiaque cinématique

Deux approches d'apprentissage profond pour la segmentation automatisée du ventricule gauche dans l'IRM cardiaque cinématique

Des chercheurs ont développé deux modèles d'apprentissage profond, LNU-Net et IBU-Net, pour la segmentation du ventricule gauche dans des images d'IRM cine en coupe courte. LNU-Net améliore le modèle U-Net en y ajoutant une normalisation de couche, tandis qu'IBU-Net combine la normalisation par instance et la normalisation par lot. Testés sur un ensemble de données comprenant 805 images d'IRM provenant de 45 patients, les deux modèles ont considérablement amélioré la précision de la segmentation, surpassant les méthodes existantes en termes de coefficient de Dice et de distance perpendiculaire moyenne. Cette avancée pourrait améliorer le diagnostic clinique et la quantification en cardiologie.

arXiv
Reparamétrisation catégorique avec des modèles de diffusion de débruitage

Reparamétrisation catégorique avec des modèles de diffusion de débruitage

Un nouvel article présente une reparamétrisation douce basée sur la diffusion pour optimiser des variables catégorielles, améliorant ainsi les relaxations continues existantes. Cette méthode utilise un processus de bruitage gaussien associé à un débruiteur efficace en forme fermée, permettant la rétropropagation sans entraînement préalable. Les expériences montrent que cette approche offre des performances compétitives, voire améliorées, sur divers benchmarks, tout en répondant aux défis de bruit et de biais rencontrés dans les méthodes d'optimisation traditionnelles.

arXiv
Étude de la faisabilité de l'utilisation de modèles de langage multimodaux dans le cadre de la détection de deepfakes audio

Étude de la faisabilité de l'utilisation de modèles de langage multimodaux dans le cadre de la détection de deepfakes audio

Une étude examine l'utilisation des Modèles de Langage Multimodaux de Grande Taille (MLLM) pour la détection des deepfakes audio, un domaine jusqu'alors peu exploré. En combinant des entrées audio avec des invites textuelles, les chercheurs ont évalué deux modèles, le Qwen2-Audio-7B-Instruct et le SALMONN, dans des modes zéro-shot et finement ajusté. Les résultats montrent qu'alors que la performance sur des données hors domaine est insuffisante, les modèles excellent dans les tâches en domaine avec un minimum de supervision, suggérant une direction prometteuse pour améliorer la détection des deepfakes audio.

arXiv
L'empire de l'IA d'Nvidia : un aperçu de ses principaux investissements dans des startups

L'empire de l'IA d'Nvidia : un aperçu de ses principaux investissements dans des startups

La performance financière de Nvidia a connu une véritable envolée suite au boom de l'IA, en particulier après le lancement de ChatGPT. L'entreprise a annoncé des revenus et des bénéfices records, avec une augmentation significative de ses réserves de liquidités. Cette croissance souligne le rôle essentiel de Nvidia dans le matériel dédié à l'IA, notamment dans la fourniture de GPU pour les applications d'intelligence artificielle, la plaçant ainsi en tête du paysage technologique.

TechCrunch
En 2026, l'IA passera de l'engouement à la pragmatique

En 2026, l'IA passera de l'engouement à la pragmatique

En 2026, le paysage de l'IA devrait privilégier les applications pratiques au détriment du développement de modèles linguistiques toujours plus volumineux. L'industrie s'orientera vers le perfectionnement de l'IA pour des cas d'utilisation concrets, mettant l'accent sur l'efficacité, l'intégration et des conceptions conviviales. Cette orientation vise à renforcer l'utilité de l'IA dans divers secteurs, afin de répondre à des besoins bien réels.

TechCrunch
GaMO : Outpainting de diffusion multi-vues sensible à la géométrie pour la reconstruction 3D à partir de vues rares

GaMO : Outpainting de diffusion multi-vues sensible à la géométrie pour la reconstruction 3D à partir de vues rares

Les avancées récentes en matière de reconstruction 3D utilisant GaMO (Geometry-aware Multi-view Outpainter) répondent aux limitations des méthodes existantes, qui peinent avec un nombre de vues d'entrée restreint. En élargissant le champ de vision à partir des poses de caméra actuelles, GaMO maintient une cohérence géométrique tout en améliorant la couverture de la scène. Dans des tests réalisés sur Replica et ScanNet++, il a démontré une qualité de reconstruction supérieure et un facteur d'accélération de 25 fois par rapport aux méthodes de diffusion les plus performantes, avec un temps de traitement inférieur à 10 minutes. Pour plus de détails, rendez-vous sur la page du projet : https://yichuanh.github.io/GaMO/.

arXiv
De nombreux esprits issus d'un seul modèle : Transformateurs bayésiens pour l'intelligence collective.

De nombreux esprits issus d'un seul modèle : Transformateurs bayésiens pour l'intelligence collective.

Des chercheurs ont présenté les Population Bayesian Transformers (B-Trans), une approche novatrice qui permet d'obtenir des comportements variés des modèles à partir d'un seul ensemble de poids pré-entraînés dans les grands modèles de langage. En considérant les décalages des couches de normalisation comme des variables stochastiques, B-Trans préserve la cohérence tout en offrant des résultats diversifiés. Les expériences ont démontré qu'elle améliore la diversité sémantique et les performances des tâches dans des scénarios de génération zéro-shot et d'apprentissage par renforcement, surpassant ainsi les modèles déterministes traditionnels. Cette méthode renforce la prise de décision collaborative en agrégeant les prédictions de plusieurs instances de modèles.

arXiv