Rechercher

GLM-5.2 open-source MIT, Qwen-Robot Suite et NVIDIA Blackwell domine MLPerf : le 16 juin 2026 en IA

16 juin 2026 — Z.ai publie les poids open-source MIT de GLM-5.2 (fenêtre 1M tokens, deux niveaux de raisonnement), Alibaba Qwen dévoile la Qwen-Robot Suite composée de trois modèles fondamentaux pour la robotique, NVIDIA Blackwell domine l’intégralité des benchmarks MLPerf Training 6.0 — dont DeepSeek-V3 671B entraîné en 2,02 minutes sur 8 192 GPU. GitHub annonce la disponibilité générale (general availability) payante de Code Quality le 20 juillet à $10 par développeur actif par mois, le June Pixel Drop apporte Gemini Omni vidéo et la génération musicale sur les appareils Pixel, et la recherche économique d’Anthropic quantifie pour la première fois l’impact de l’expertise métier sur Claude Code.


Z.ai GLM-5.2 — poids open-source MIT disponibles

16 juin — Z.ai (anciennement Zhipu AI) publie officiellement les poids open-source de GLM-5.2 sous licence MIT, concrétisant l’annonce du 13 juin. Les poids sont désormais disponibles au téléchargement sur la plateforme de la société.

“Introducing GLM-5.2: Frontier Intelligence, Open Weights

  • Significant improvements in coding and agentic tasks
  • Strong long-horizon capabilities with a 1M context window
  • Two levels of reasoning effort: GLM-5.2 (max) pushes the limits, while GLM-5.2 (high) strikes a strong balance”

🇫🇷 Présentation de GLM-5.2 : Intelligence de frontier, poids ouverts. Améliorations significatives sur les tâches de codage et agentiques. Capacités robustes sur les longues séquences avec une fenêtre de contexte de 1 million de tokens. Deux niveaux d’effort de raisonnement : GLM-5.2 (max) repousse les limites, tandis que GLM-5.2 (high) offre un solide équilibre.@Zai_org sur X

Points clés de GLM-5.2 :

  • Améliorations significatives sur les tâches de codage (coding) et agentiques
  • Fenêtre de contexte de 1 million de tokens — utile pour les agents de codage à grande échelle et le traitement de longs documents
  • Deux niveaux d’effort de raisonnement complémentaires
  • Surpasse GLM-5.1 sur le codage, l’utilisation d’outils et le raisonnement
  • Disponible via chat.z.ai
VarianteRaisonnementContexteLicence
GLM-5.2 (max)Performances maximales1M tokensMIT open-source
GLM-5.2 (high)Équilibre fort performance/vitesse1M tokensMIT open-source

La licence MIT est le marqueur le plus important : elle autorise l’usage commercial sans restriction, rendant GLM-5.2 directement utilisable par les entreprises qui ne peuvent pas ou ne souhaitent pas dépendre de modèles propriétaires américains. Le tweet a atteint 515 000 vues en quelques heures — un signal fort de l’intérêt de la communauté pour les modèles open-source de frontier avec de grandes fenêtres de contexte.

🔗 Blog Z.ai — GLM-5.2


Qwen-Robot Suite — trois modèles fondamentaux pour la robotique incarnée

16 juin — Alibaba Qwen annonce la Qwen-Robot Suite, une pile complète pour l’intelligence incarnée (embodied intelligence) composée de trois modèles fondamentaux distincts et complémentaires : navigation, manipulation et modèle de monde.

Qwen-RobotNav — spécialiste de la navigation mobile :

  • Unifie 5 tâches en un seul modèle : suivi d’instructions, navigation vers un point cible (point-goal), navigation vers un objet cible (object-goal), pistage d’objets et conduite autonome
  • Protocole d’observation contrôlable
  • Interface outil pour les systèmes agentiques

Qwen-RobotManip — spécialiste de la manipulation :

  • Espace état-action unifié pour robots hétérogènes
  • Poses delta en repère caméra pour un apprentissage cohérent entre différents corps robotiques (cross-embodiment)
  • Pré-entraîné sur un corpus open-source de plus de 38 100 heures

Qwen-RobotWorld — modèle de monde physique :

  • Un seul modèle couvrant plus de 20 types de corps robotiques
  • Interface d’action en langage naturel
  • Prédit des futurs physiquement ancrés pour la manipulation, la conduite et la navigation

Chaque modèle est utilisable indépendamment et peut être composé comme un outil du monde physique. Ensemble, ils forment la boîte à outils bas niveau pour des systèmes agentiques à vocation généraliste.

ModèleSpécialitéDonnée clé
Qwen-RobotNavNavigation multi-tâches (5 tâches unifiées)Interface outil pour systèmes agentiques
Qwen-RobotManipManipulation robotique cross-embodimentCorpus open-source 38 100+ heures
Qwen-RobotWorldWorld model physique20+ types de corps robotiques

🔗 Qwen-Robot Suite — annonce


NVIDIA Blackwell domine MLPerf Training 6.0 — clean sweep

16 juin — NVIDIA a remporté l’intégralité des benchmarks MLPerf Training 6.0, la référence industrielle de l’entraînement IA établie par le consortium MLCommons. C’est la seule plateforme à avoir soumis des résultats sur chaque test, y compris les deux nouveaux benchmarks introduits dans cette édition : DeepSeek-V3 (671 milliards de paramètres, architecture MoE) et GPT-OSS-20B.

Les performances du système GB300 NVL72 (72 GPU Blackwell Ultra interconnectés) sont remarquables :

ModèlePlateformeGPUTemps
DeepSeek-V3 671B (MoE)GB300 NVL728 1922,02 min
GPT-OSS 20B (MoE)GB300 NVL725127,43 min
Llama 3.1 405BGB200 NVL728 1927,07 min
Llama 3.1 8BGB200 NVL721 0244,46 min
Llama 2 70B LoRAGB300 NVL725120,40 min
FLUX.1 (génération d’images)GB300 NVL7251217,1 min
DLRM-dcnv2GB300 NVL72640,67 min

L’inclusion de FLUX.1 (modèle de génération d’images de Black Forest Labs) dans les benchmarks officiels est notable : elle confirme que l’infrastructure Blackwell est l’étalon de référence pour entraîner les modèles de génération d’images les plus avancés.

Sur le plan logiciel, NVIDIA a déployé plusieurs innovations dans la pile NeMo 26.06 : graphes CUDA sur itération complète pour les MoE, fusions de noyaux via CuTe DSL, précision MXFP8 pour le bloc d’attention, et optimisations du routeur MoE (accélération noyau 5×). Ces améliorations logicielles ont permis un gain de 1,3× sur le débit DeepSeek-V3 en trois mois sans modification du matériel, passant de 1 298 à 1 648 TFLOPS/GPU — un rappel que la performance matérielle n’est qu’une partie de l’équation.

🔗 NVIDIA — MLPerf Training 6.0


June Pixel Drop 2026 — Gemini Omni vidéo, génération musicale, Daily Brief

16 juin — Le June Pixel Drop 2026 introduit plusieurs fonctionnalités majeures intégrant Gemini directement dans les appareils Pixel, avec le déploiement progressif qui débutera dans les prochaines semaines.

Gemini Omni — création et édition vidéo IA : il suffit de dialoguer naturellement avec Gemini pour mélanger texte, images et vidéos. Possibilité de partir de zéro, de remixer des contenus de la pellicule, d’utiliser des modèles prédéfinis, ou même de créer un avatar IA personnalisé à l’image et à la voix de l’utilisateur.

Génération musicale dans Gemini : l’utilisateur décrit une idée ou importe une photo, transformée en piste audio originale avec paroles. Style, voix et tempo sont personnalisables depuis le menu Outils → “Créer de la musique” de l’application Gemini.

Daily Brief — agent matinal IA : disponible pour tous les abonnés Google AI Plus, Pro et Ultra (18+, États-Unis uniquement pour l’instant). Cet agent organise la journée de l’utilisateur avant même son réveil. Voice Translate, qui traduit les appels en temps réel, s’étend au Pixel 10a (7 langues dont le français).

FonctionnalitéDisponibilitéNotes
Gemini Omni vidéoPixel (déploiement progressif)Création/remix par conversation
Génération musicalePixel (app Gemini)Audio + paroles, personnalisable
Daily BriefGoogle AI Plus/Pro/Ultra, 18+, États-UnisAgent matinal IA
Voice TranslatePixel 10a7 langues + hindi en préversion
Edit with Ask PhotosUK, Allemagne, France, Espagne, ItalieÉdition photo par conversation

🔗 June Pixel Drop 2026 — blog officiel Google


GitHub Code Quality — disponibilité générale le 20 juillet, $10 par développeur actif

16 juin — GitHub annonce que GitHub Code Quality passera de la prévisualisation publique à la disponibilité générale (general availability) le 20 juillet 2026, en tant que produit payant. Plus de 10 000 entreprises ont participé à la prévisualisation.

Tarification au 20 juillet :

ComposantTarification
Licence par développeur actif (committer)$10 / développeur actif / mois
Fonctionnalités IA (Copilot code review, détection IA, Copilot Autofix)Facturation à l’usage
Analyse déterministe CodeQLMinutes GitHub Actions

Nouvelles fonctionnalités disponibles dès le GA :

  • Déploiement à l’échelle de l’organisation (un seul toggle admin)
  • Tableaux de bord qualité au niveau organisation
  • Mise en application de la couverture de code via les ensembles de règles (rulesets)
  • Score de qualité par dépôt et par organisation
  • API pour l’activation et la gestion des résultats

Disponibilité : GitHub Enterprise Cloud et GitHub Team uniquement. Non disponible sur GitHub Enterprise Server. Les clients souhaitant se désengager avant la facturation peuvent désactiver Code Quality sur leurs dépôts avant le 20 juillet.

🔗 GitHub Code Quality — annonce GA


Recherche économique Anthropic — l’expertise métier prime sur la maîtrise du code

16 juin — Anthropic publie une étude économique sur l’utilisation de Claude Code, basée sur l’analyse confidentielle d’environ 400 000 sessions entre octobre 2025 et avril 2026. Premiers résultats chiffrés sur la façon dont l’expertise détermine le succès avec un agent de codage IA.

Résultats clés de l’étude (auteurs : Zoe Hitzig, Maxim Massenkoff, Eva Lyubich, Ryan Heller, Peter McCrory) :

IndicateurValeur
Sessions analysées~400 000
Utilisateurs distincts~235 000
Période couverteOct 2025 – Avr 2026
Décisions planification (utilisateur)~70 %
Décisions exécution (Claude)~80 %
Hausse valeur économique moyenne des tâches+25 %
Taux de succès vérifié (expert métier)28–33 %
Taux de succès vérifié (novice)15 %
Part sessions débogage oct → avr33 % → 19 %

Conclusion centrale : dans une session typique, l’utilisateur prend ~70 % des décisions de planification (quoi faire) tandis que Claude prend ~80 % des décisions d’exécution (comment le faire). Les experts métier — pas nécessairement des développeurs — dirigent Claude vers des chaînes d’actions deux fois plus longues avec cinq fois plus de contenu par instruction. Le taux de réussite des professions non techniques (juristes, managers, scientifiques) se situe à moins de 7 points de pourcentage des ingénieurs logiciels. C’est la compréhension du problème métier, et non la maîtrise du code, qui détermine le succès.

🔗 Recherche économique Anthropic — Claude Code


Anthropic et OpenAI — agents en production et déploiement Europe

Claude Managed Agents — guide de mise en production

16 juin — L’équipe Applied AI d’Anthropic publie un guide pratique sur la mise en production des agents avec Claude Managed Agents. Le post explique l’évolution des surfaces d’interaction : du chatbot classique vers des agents autonomes planifiés, persistants, avec accès à des environnements d’exécution (stateful runtime environments). Deux fonctionnalités disponibles depuis le 9 juin : exécution d’agents sur planning défini et stockage de variables d’environnement dans des coffres (vaults).

🔗 Building with Claude Managed Agents

Claude Code v2.1.178 — permissions granulaires et skills imbriqués

15 juin — Claude Code v2.1.178 introduit la syntaxe Tool(param:value) pour les règles de permission — par exemple Agent(model:opus) pour bloquer les sous-agents Opus. Les skills dans les répertoires .claude/skills/ imbriqués se chargent automatiquement lors du travail dans ces dossiers. L’auto mode évalue désormais les lancements de sous-agents par le classificateur avant démarrage, fermant une faille où un sous-agent pouvait demander une action bloquée sans révision préalable.

🔗 Claude Code v2.1.178

Codex app en EEA, UK et Suisse — Computer Use, Memories, Chronicle

16 juin — OpenAI déploie quatre fonctionnalités avancées de Codex dans l’Espace économique européen (EEE), le Royaume-Uni et la Suisse : Computer Use (macOS + Windows), l’extension Chrome Codex, Memories et Chronicle.

Computer Use permet à Codex d’interagir avec les applications de bureau — voir, cliquer, saisir du texte. L’extension Chrome permet d’effectuer des tâches nécessitant un contexte navigateur connecté, travaillant sur plusieurs onglets en arrière-plan. Memories mémorise les préférences et conventions de dépôt récurrentes, mais est désactivée par défaut dans les trois régions pour conformité réglementaire. Chronicle, aperçu opt-in réservé aux abonnés Pro macOS, aide Codex à construire des souvenirs depuis le contexte récent de l’écran. Ces fonctionnalités étaient déjà disponibles pour les utilisateurs Enterprise hors EEE/UK/CH.

🔗 OpenAI — déploiement Codex EEA/UK/Suisse

Simulation de Déploiement OpenAI — prédire le comportement avant la sortie

16 juin — OpenAI publie sa méthode Deployment Simulation (Simulation de déploiement) : rejouer de vraies conversations anonymisées issues de déploiements précédents avec un modèle candidat, pour détecter les comportements indésirables avant la mise en production. Testée sur les déploiements GPT-5-series Thinking (~1,3 million de conversations), l’erreur médiane de prédiction est de 1,5×, nettement meilleure que les évaluations synthétiques. La méthode a permis de détecter le “calculator hacking” (une forme de dérive (reward hacking)) avant la sortie de GPT-5.1.

🔗 Deployment Simulation — OpenAI

Codex CLI 0.140.0 — /usage, /import depuis Claude Code, Bedrock auth

15 juin — La version 0.140.0 du Codex CLI apporte plusieurs fonctionnalités substantielles. /usage affiche les activités tokens quotidiennes, hebdomadaires et cumulées du compte. /import permet d’importer sélectivement configuration, paramètres de projet et discussions récentes depuis Claude Code — une interopérabilité directe entre deux outils concurrents. codex delete supprime définitivement une session avec confirmation de sécurité et nettoyage des sous-agents associés. L’authentification Amazon Bedrock gérée stocke les clés API de façon chiffrée localement, et couvre également les identifiants OAuth MCP. En parallèle, corrections de fiabilité MCP (nouvelles tentatives sur démarrages transitoires) et récupération automatique des bases SQLite corrompues.

🔗 Codex CLI 0.140.0 — release GitHub


Meta AI — AI Mode sur Facebook avec Muse Spark

16 juin — Meta déploie de nouveaux outils d’intelligence artificielle sur Facebook. AI Mode est un nouveau mode de recherche alimenté par Meta AI (propulsé par Muse Spark) qui ancre ses réponses dans ce que les utilisateurs disent publiquement sur les applications Meta — Groupes, Reels — offrant des perspectives contextualisées plutôt que des résultats génériques. Accessible depuis le fil d’actualité ou la recherche.

Nouveaux outils créatifs : suggestions de partage depuis la pellicule avec modèles de collage (cutout templates), effets de transition vidéo, préréglages photo (photo presets) permettant de modifier virtuellement vêtements et coiffure, et l’option “Wear It” pour porter virtuellement un maillot de sport dans les Stories. Toutes ces fonctionnalités sont opt-in et désactivables.

🔗 Meta — nouveaux outils IA sur Facebook


NVIDIA SpatialClaw — agent de raisonnement spatial sans entraînement

16 juin — NVIDIA Research publie SpatialClaw, un agent de raisonnement spatial visuel training-free (sans entraînement supplémentaire). Plutôt que d’appeler un ensemble fixe d’outils prédéfinis, l’agent écrit directement du Python dans un noyau persistant, composant dynamiquement des modules de perception et révisant sa stratégie au fil des étapes. Les sorties deviennent des variables Python réutilisables avec NumPy et SciPy.

Résultats : +11,2 points sur 20 benchmarks de raisonnement spatial visuel par rapport à un agent précédent récent, de façon cohérente sur 6 architectures de modèles différentes, sans ajustement spécifique à un benchmark.

🔗 SpatialClaw — @NVIDIAAI sur X


Cohere — afflux de demandes après la restriction US sur Anthropic

15 juin — Cohere, entreprise canadienne d’IA générative, signale recevoir un nombre élevé de demandes entrantes (inbounds) d’entreprises cherchant des alternatives suite à la directive US restreignant l’accès à Anthropic (couverte le 13 juin). La firme a répondu avec humour en citant le tweet de Polymarket : “The world needs more Canada 🇨🇦”. Le tweet a atteint 56 000 vues, 797 likes. Ce positionnement confirme que la directive américaine crée une opportunité commerciale directe pour les fournisseurs souverains non-américains.

🔗 Cohere — tweet


GitHub Models retiré pour les nouveaux clients

16 juin — GitHub annonce le retrait progressif de GitHub Models. À partir du 16 juin, les nouveaux clients (organisations et entreprises sans usage préexistant) n’ont plus accès au service, ni sur les plans gratuits ni sur les plans payants. Les clients existants avec un usage actif ne sont pas impactés pour l’instant et peuvent continuer d’utiliser le terrain de jeu (playground), l’API et les modèles disponibles. GitHub précise qu’il communiquera les délais détaillés de la fermeture complète ultérieurement. Pour les nouveaux projets nécessitant un accès aux modèles d’IA, GitHub oriente vers Azure AI Foundry, qui propose un catalogue étendu de modèles.

🔗 GitHub Models retirement


Brèves

  • Claude Code v2.1.179 — 9 correctifs de stabilité (16 juin) : coupures de connexion en cours de flux (mid-stream) préservées, défilement à la molette corrigé dans WSL2 sous Windows Terminal et VS Code (régression depuis v2.1.172), correction sandbox Linux sur grands arbres de répertoires. 🔗 v2.1.179

  • Gemini Trusted Tester Program — inscriptions ouvertes : Google ouvre un nombre limité de places pour des power users souhaitant tester des fonctionnalités Gemini inédites avant leur lancement public. 🔗 Inscription

  • Gemini — microphone multilingue 70+ langues (Android et iOS) : l’icône microphone supporte désormais plus de 70 langues avec mélange libre sans changer de paramètres. Annonce via @joshwoodward (Director of Product, Gemini App).

  • GitHub Code Quality — activation organisation en un clic (16 juin) : les admins organisation peuvent activer ou désactiver Code Quality sur tous leurs dépôts d’un seul toggle dans les paramètres de sécurité. 🔗 Changelog

  • Copilot usage metrics — enrichissement par télémétrie serveur (15 juin) : les rapports d’utilisation Copilot Enterprise intègrent désormais les utilisateurs actifs détectés côté serveur (en plus de la télémétrie client), améliorant la couverture des DAU dans les rapports journaliers et sur 28 jours. 🔗 Changelog

  • Manus — file d’attente de messages pendant l’exécution (16 juin) : Manus permet désormais de mettre en file d’attente des messages à envoyer à l’agent pendant qu’une tâche est en cours. Les messages sont traités dans l’ordre dès la fin de la tâche courante. 🔗 Annonce

  • ChatGPT iOS 1.2026.160 (15 juin) : explorateur de fichiers workspace, sélecteur de dossier, contrôles de diff, approbation MCP par chat ou global, et rendu LaTeX dans les messages et plans Codex.


Ce que ça signifie

L’ouverture des poids MIT de GLM-5.2 et les trois modèles robotiques Qwen-Robot Suite illustrent l’accélération de l’offre open-source chinoise sur les créneaux où les acteurs américains restent en grande partie propriétaires. GLM-5.2 avec sa fenêtre de 1M tokens sous licence MIT s’installe directement en concurrent des modèles commerciaux pour les entreprises qui cherchent une alternative souveraine — précisément le créneau que la directive US restreignant Anthropic a rendu stratégiquement visible, comme le confirme l’afflux de demandes signalé par Cohere. La robotique est le prochain terrain de cette compétition : Qwen-Robot Suite propose une pile complète navigation-manipulation-world model, tandis que SpatialClaw de NVIDIA Research démontre qu’un raisonnement spatial avancé peut être atteint sans fine-tuning — deux approches complémentaires qui dessinent l’architecture des systèmes robotiques agentiques de la prochaine génération.

Sur le front du matériel, les résultats MLPerf Training 6.0 confirment la domination de l’architecture Blackwell à une échelle industrielle : entraîner DeepSeek-V3 (671 milliards de paramètres) en 2 minutes sur 8 192 GPU n’est pas un exploit académique, c’est une capacité de production réelle déployée dans des datacenters cloud. Le gain logiciel de 1,3× sur le débit DeepSeek-V3 en trois mois sans changement de matériel rappelle que la course à la performance IA est autant une compétition de piles logicielles (NeMo, CuTe DSL, MXFP8) que de puces — une dynamique qui amplifie les positions déjà dominantes.

La recherche économique d’Anthropic sur Claude Code apporte un éclairage contre-intuitif important : l’expertise dans le domaine métier (droit, management, sciences) détermine le succès avec un agent de codage presque autant que la maîtrise du code lui-même. Les taux de succès vérifiés montrent un écart de seulement 7 points entre les ingénieurs et les non-développeurs experts dans leur domaine. C’est une information structurante pour les équipes produit : la cible des outils de codage IA n’est plus uniquement les développeurs, et la conception des interfaces doit en tenir compte.

Du côté de l’outillage développeur, la journée du 16 juin concentre plusieurs signaux convergents : le GA payant de GitHub Code Quality ($10/développeur actif), la disponibilité de Codex avec Computer Use dans l’EEE/UK/Suisse, les permissions granulaires de Claude Code v2.1.178, et la méthode Deployment Simulation d’OpenAI. La qualité du code et la sécurité des déploiements passent de sujets de recherche à des produits facturés — une normalisation qui reflète la maturité croissante du marché des outils IA pour les équipes de développement.


Sources