Le 4 juin 2026 s’ouvre sur une publication historique de l’Anthropic Institute : l’IA accélère déjà son propre développement, avec plus de 80 % du code d’Anthropic écrit par Claude et un gain de productivité ×8. NVIDIA livre en même temps Nemotron 3 Ultra, un modèle MoE de 550 milliards de paramètres entièrement open-source pour les agents. OpenAI déploie Dreaming v3, une nouvelle architecture mémoire pour ChatGPT 5× moins coûteuse. GitHub Copilot franchit le cap d’un million de tokens de contexte. Et Suno annonce une levée de fonds Série D de $400 millions, portant sa valorisation à $5,4 milliards.
Anthropic Institute — “When AI builds itself” : l’auto-amélioration récursive documentée
4 juin — The Anthropic Institute publie “When AI builds itself”, la première documentation officielle, chiffres internes à l’appui, de la progression vers une possible auto-amélioration récursive de l’IA. Les co-auteurs Marina Favaro et Jack Clark présentent des données internes de mai 2026 qui montrent que Claude écrit désormais la majorité du code d’Anthropic.
| Indicateur | Valeur (mai 2026) |
|---|---|
| Part du code Anthropic écrit par Claude | >80% des lignes mergées en production |
| Gain de productivité code/ingénieur | ×8 en Q2 2026 vs 2024 |
| Taux de succès tâches ouvertes | 76% (+50 points en 6 mois) |
| Speedup optimisation code (Mythos Preview) | ~52× vs ~3× pour Opus 4 (mai 2025) |
| Décisions de recherche meilleures que l’humain | 64% (Mythos Preview vs 51% pour Opus 4.5 en nov. 2025) |
| Sondage interne — gain de productivité estimé | ×4 avec Mythos Preview (130 employés, mars 2026) |
La progression de la durée de tâche autonome est particulièrement marquante : Claude Opus 3 gérait des tâches d’environ 4 minutes en mars 2024, Claude Sonnet 3.7 atteignait 1h30 en mars 2025, Claude Opus 4.6 opère sur 12 heures en mars 2026, et Mythos Preview dépasse 16 heures (limite de mesure du benchmark METR) en mai 2026. La durée double tous les 4 mois environ.
Un résultat concret : en avril 2026, des agents Claude ont résolu un problème ouvert de sécurité IA de bout en bout — hypothèses, tests, itérations — et récupéré 97% du gain de performance, contre 23% pour deux chercheurs humains sur une semaine, pour un coût d’environ $18 000 de calcul sur 800 heures cumulées.
L’article explore trois scénarios : un plateau (jugé le moins probable), une automatisation substantielle avec direction humaine stratégique, et l’auto-amélioration récursive complète où les modèles construisent leurs successeurs sans intervention humaine. L’article se conclut par un appel explicite à une pause coordonnée et vérifiable du développement IA frontier, conditionnée à la participation des autres labs majeurs.
“Our internal data shows Claude is accelerating AI development—a possible path to recursive self-improvement, or AI autonomously building a more capable successor. It’s happening faster than we thought, and the implications deserve greater attention.”
🇫🇷 Nos données internes montrent que Claude accélère le développement de l’IA — une voie possible vers l’auto-amélioration récursive, ou l’IA construisant de manière autonome un successeur plus capable. Cela arrive plus vite que prévu, et les implications méritent une attention accrue. — @AnthropicAI
NVIDIA Nemotron 3 Ultra — 550B MoE open-source pour les agents de longue durée
4 juin — NVIDIA livre Nemotron 3 Ultra, un modèle frontier open-source de 550 milliards de paramètres conçu spécifiquement pour les agents d’IA de longue durée (long-running agents). Ce lancement est la concrétisation effective des poids open-source — après l’annonce initiale lors de Microsoft Build le 2 juin, les poids sont désormais disponibles sur HuggingFace et via Ollama Cloud.
| Caractéristique | Valeur |
|---|---|
| Architecture | Hybride Mamba-Transformer MoE |
| Paramètres totaux | 550 milliards |
| Paramètres actifs | 55 milliards (NVFP4) |
| Vitesse d’inférence | 5× plus rapide que les modèles frontier open-source comparables |
| Réduction de coût agentique | -30% |
| Poids HuggingFace | nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4 |
| Accès cloud | Ollama Cloud |
| Harnesses d’agents supportés | OpenClaw, Hermes Agent (NousResearch), LangChain |
L’architecture hybride Mamba-Transformer MoE permet d’effectuer davantage de cycles de raisonnement dans le même budget de temps — c’est ce qui explique le gain de vitesse. Nemotron 3 Ultra est post-entraîné pour les tâches complexes : coding avancé, recherche approfondie, planification, utilisation d’outils et récupération après échecs.
NVIDIA publie également les données synthétiques et les recettes de post-entraînement, ce qui permet à des équipes extérieures de reproduire ou d’affiner le processus.
“Today we’re shipping Nemotron 3 Ultra. A 550B MoE frontier-intelligence open model built for long-running agents. It delivers 5x faster inference and lowers the cost of complex agentic tasks by up to 30% versus other open frontier models.”
🇫🇷 Aujourd’hui nous livrons Nemotron 3 Ultra. Un modèle MoE open-source de niveau frontier à 550 milliards de paramètres, conçu pour les agents de longue durée. Il offre une inférence 5× plus rapide et réduit le coût des tâches agentiques complexes de 30% par rapport aux autres modèles frontier open-source. — @NVIDIAAI
🔗 HuggingFace — Nemotron 3 Ultra
Dreaming v3 — une nouvelle architecture mémoire pour ChatGPT
4 juin — OpenAI déploie Dreaming v3, une architecture de mémoire autonome entièrement repensée pour ChatGPT. Le système résout les trois limites du mécanisme précédent : la fraîcheur des informations, leur correction au fil du temps, et le passage à l’échelle vers les utilisateurs Free.
| Objectif | Description |
|---|---|
| Continuité contextuelle | Mémoriser les informations une fois, les réutiliser dans de futures conversations |
| Respect des préférences | Appliquer les contraintes personnelles (régime alimentaire, fuseau horaire, etc.) |
| Mise à jour temporelle | Réviser automatiquement les mémoires — après un voyage, l’IA sait que vous êtes rentré |
L’historique du système : les saved memories sont arrivées en avril 2024 (déclaration manuelle), puis “Dreaming v0” en avril 2025 (synthèse automatique en arrière-plan). La version 3 est architecturalement autonome, ~5× moins coûteuse à servir — c’est cette réduction de coût qui a rendu possible l’extension aux utilisateurs Free.
Disponibilité : aujourd’hui pour les abonnés Plus et Pro aux États-Unis ; extension prévue aux autres pays et aux utilisateurs Free et Go dans les prochaines semaines.
Une page “Memory Summary” permet de consulter un résumé lisible de ce que ChatGPT sait de l’utilisateur, d’ajouter ou corriger des informations, et de définir des règles sur les sujets à aborder.
Suno Série D — $400 millions à une valorisation de $5,4 milliards
3 juin — Suno annonce une levée de fonds Série D de $400 millions, portant la valorisation de la plateforme de musique générative à $5,4 milliards. Le tour de table est mené par Bond Capital, avec la participation de nouveaux investisseurs (IVP, USV — Union Square Ventures, Forerunner Ventures) et le soutien reconduit de Matrix VC, Lightspeed et Menlo Ventures.
La trajectoire de valorisation est remarquable : $125 millions levés en mai 2024, puis $250 millions en novembre 2025 à $2,45 milliards de valorisation, et désormais $5,4 milliards — soit plus du double en sept mois.
Suno s’affirme comme l’une des plateformes créatives IA les mieux financées au monde, avec une mission restée constante : permettre à davantage de personnes de vivre la joie de créer de la musique, sans contrainte technique.
“We’re thrilled to announce Suno’s next chapter: a $400M Series D at a $5.4B valuation!”
🇫🇷 Nous sommes ravis d’annoncer le prochain chapitre de Suno : une Série D de $400 millions pour une valorisation de $5,4 milliards ! — @suno
🔗 Blog Suno — The Next Chapter
GitHub Copilot — fenêtre de contexte 1M tokens et raisonnement configurable
4 juin — GitHub Copilot intègre deux nouvelles capacités majeures disponibles dès aujourd’hui dans VS Code, Copilot CLI et l’application GitHub Copilot.
| Capacité | Disponibilité | Impact crédits IA |
|---|---|---|
| Fenêtre de contexte 1M tokens | VS Code, Copilot CLI, app Copilot | Plus élevé |
| Niveaux de raisonnement configurables | VS Code, Copilot CLI, app Copilot | Plus élevé |
La fenêtre de contexte d’un million de tokens permet de travailler sur des bases de code plus larges, des documents plus longs et des projets multi-fichiers complexes sans perdre le fil. Jusqu’ici, les limites de contexte forçaient les développeurs à fragmenter leur travail ou à simplifier leurs requêtes sur des projets complexes.
Les niveaux de raisonnement configurables permettent de calibrer l’équilibre vitesse/profondeur et d’activer la “pensée étendue” (extended thinking) pour les défis architecturaux et de débogage les plus complexes. GitHub recommande de réserver les paramètres maximaux aux problèmes complexes multi-fichiers — l’usage de contexte étendu ou de raisonnement supérieur consomme plus de crédits IA par interaction.
L’extension à d’autres surfaces Copilot est prévue dans les prochaines semaines.
🔗 GitHub Changelog — Larger context windows
GitHub Copilot — mises à jour du 4 juin
Copilot in Visual Studio — Mise à jour de mai 2026
4 juin — La mise à jour de mai 2026 pour Copilot dans Visual Studio 2026 renforce la planification et la revue collaborative.
- Agent Plan : explore le dépôt en lecture seule, pose des questions de clarification et génère un plan détaillé sauvegardé en
.copilot/plans/plan-{titre}.md. Un bouton “Implement plan” bascule vers le mode agent. - Panneau Skills : liste toutes les compétences d’agents détectées depuis l’espace de travail et le profil utilisateur, avec recherche par nom ou mot-clé.
- Diff résumé multi-fichiers : après des modifications Copilot sur plusieurs fichiers, une vue “change summary” pour accepter ou annuler les changements au niveau global, par fichier ou par bloc.
- Indicateur d’utilisation de la fenêtre de contexte : icône en haut de la boîte de saisie avec option “Summarize conversation” pour libérer de l’espace.
- Ajout de commits en contexte : clic droit sur un commit dans Git History pour l’attacher comme contexte dans Copilot Chat.
🔗 GitHub Changelog — Visual Studio May update
Copilot Chat sur github.com — contexte PR enrichi (disponibilité générale)
4 juin — Copilot Chat passe de l’aperçu public à la disponibilité générale pour tous les détenteurs d’une licence Copilot, avec des capacités enrichies lors du travail sur des diffs et des pull requests sur github.com.
- Code et chat côte à côte : consultation de la conversation directement à côté du code, commentaires et modifications en ligne sans basculer entre la PR et la fenêtre de chat.
- Contexte chargé automatiquement : quand une question porte sur un diff ou une PR, le contexte pertinent est injecté automatiquement — plus besoin de copier-coller des extraits.
- Accès : bouton “Ask about this diff” en haut de chaque diff, ou via le menu dropdown en surlignant une ligne de code.
🔗 GitHub Changelog — Copilot Chat PR context
Claude Code v2.1.162
3 juin — La version v2.1.162 de Claude Code apporte plusieurs améliorations UX et correctifs agents importants.
| Fonctionnalité | Description |
|---|---|
claude agents --json + waitingFor | Le JSON inclut désormais le motif de blocage d’une session en attente (ex : prompt de permission) |
/effort persistance confirmée | Confirmation explicite quand le niveau choisi devient le défaut pour les nouvelles sessions |
| Autocomplete slash command | Un clic remplit la commande dans le prompt sans l’exécuter — Enter pour confirmer |
| Remote Control footer pill | Remote Control s’affiche comme pill persistante en bas avec lien vers la session |
| Renommage Windsurf → Devin Desktop | Mis à jour dans /ide, /terminal-setup, /scroll-speed |
Parmi les correctifs : blocage silencieux au démarrage si le répertoire de config est en lecture seule (Claude Code démarre maintenant avec une config en mémoire), règles WebFetch non appliquées sur les domaines pré-approuvés, permissions Windows avec backslashes, et plusieurs correctifs agents (Ctrl+V images, sessions perdues lors du backgrounding, largeur de terminal sur sessions longues).
🔗 Releases Claude Code v2.1.162
ElevenLabs — Flows Agent et partenariat Hasbro
Flows Agent dans ElevenCreative
4 juin — ElevenLabs lance Flows Agent dans son interface ElevenCreative. L’utilisateur décrit ce qu’il veut créer et l’agent construit automatiquement le pipeline complet — en connectant plus de 50 modèles d’image et de vidéo aux outils de voix, musique et effets sonores disponibles sur la plateforme, sur un seul canvas unifié.
Un mode “assist” permet à l’agent de demander une validation avant chaque opération payante pour garder le contrôle des coûts. Les équipes marketing peuvent ainsi enchaîner les modalités et tester des variantes créatives à travers différents produits, langues et formats sans configurer manuellement chaque étape.
ElevenLabs × Hasbro — voix de personnages sous licence dans l’Iconic Marketplace
3 juin — ElevenLabs s’associe à Hasbro pour proposer des voix officielles de personnages (My Little Pony, Transformers, G.I. Joe) via l’Iconic Marketplace. Les voix sont construites en partenariat avec Hasbro et les talents vocaux originaux, avec des droits d’utilisation clairement définis pour les développeurs, entreprises et créateurs d’applications. L’offre vise à combiner créativité IA et protection des droits de propriété intellectuelle des marques.
GPT-Rosalind — nouvelles capacités pour les sciences de la vie
3 juin — OpenAI annonce une mise à jour majeure de GPT-Rosalind, son modèle spécialisé pour la recherche en sciences de la vie à l’échelle enterprise. Le modèle combine les capacités agentiques de GPT-5.5 avec une intelligence renforcée en chimie médicinale et génomique.
| Benchmark | Domaine | Score GPT-Rosalind | Score GPT-5.5 | Réduction de tokens |
|---|---|---|---|---|
| LifeSciBench | Sciences de la vie (6 domaines) | Meilleur | — | — |
| MedChemBench | Chimie médicinale | 27,5% | 25,1% | -7,2% |
| GeneBench | Génomique | 21,6% | 20,4% | -31% |
| LabWorkBench | Protocoles wet lab | 63,2% | 55,8% | -5,3% |
Deux nouveaux plugins sont désormais accessibles à tous les utilisateurs Codex : Life Sciences Research plugin (récupération de preuves sourcées) et Life Sciences NGS Analysis plugin (workflows bioinformatiques scRNA-seq, bulk RNA-seq). Novo Nordisk est le premier partenaire annoncé. L’accès est élargi globalement aux organisations qualifiées (recherche scientifique légitime, gouvernance solide).
Perplexity lance le Main Street AI Accelerator avec la SBA américaine
4 juin — Perplexity lance le Main Street AI Accelerator en partenariat avec la U.S. Small Business Administration (SBA). Le programme met $25 millions de crédits Perplexity Computer à disposition : $250 de crédits pour jusqu’à 100 000 entreprises éligibles, en référence au 250e anniversaire des États-Unis.
Sont éligibles les entreprises bénéficiaires des prêts 7(a), 504 et micro-prêts de la SBA. Les candidatures ne sont pas encore ouvertes ; une liste d’attente est disponible sur la page dédiée. L’initiative s’inscrit dans la stratégie de Perplexity d’étendre Computer au tissu économique local américain, après avoir annoncé la semaine précédente les 400+ intégrations enterprise de Computer (Intuit QuickBooks, Vercel, Shopify, Canva).
Cohere remporte le 1er prix du challenge OTAN sur l’IA agentique
4 juin — Cohere remporte la première place du concours NATO Agentic AI for Cognitive Warfare Innovation Challenge. Le podium complet :
- Cohere (1re place)
- OpenMinds (2e place)
- Ipsos & Thoughtworks (3e place, ex aequo)
La compétition met en lumière le rôle croissant de l’IA agentique pour aider les nations démocratiques à comprendre, anticiper et répondre aux menaces informationnelles. Pour Cohere, cette reconnaissance de l’OTAN confirme son positionnement sur l’IA souveraine pour le secteur défense et gouvernemental — un axe majeur depuis sa fusion transatlantique avec Aleph Alpha en avril 2026.
Pika — Group Chat avec agent IA sur iOS
4 juin — Pika lance le premier Group Chat intégré avec un agent IA dans son application. Les utilisateurs invitent leurs contacts dans un chat de groupe où le Pika Agent participe à la conversation créative — aide pour configurer un téléphone, créer des mèmes en groupe, collaborer sur de courts formats vidéo. Disponible dès maintenant sur iOS via https://pika.me.
Brèves
-
Article Anthropic — analytics en libre-service avec Claude — L’équipe Anthropic publie ses bonnes pratiques pour construire des agents d’analyse de données en libre-service avec Claude : compétences (skills), fondations de données et évaluations. 🔗 Blog Claude
-
Google Antigravity v2.0.11 — Patch de stabilité pour l’IDE propulsé par Gemini : deux correctifs (blocages au démarrage et bouton “Open IDE”), aucune nouvelle fonctionnalité. 🔗 Antigravity Changelog
-
GitHub Enterprise Teams GA — Enterprise Teams passe en disponibilité générale sur GitHub Enterprise Cloud : groupes définis une seule fois au niveau entreprise, assignables à toutes les organisations, avec SCIM, GitHub Apps et audit complet. Jusqu’à 2 500 équipes et 5 000 membres par équipe. 🔗 GitHub Changelog
-
Genspark — partenaire de lancement Agent365 à Microsoft Build — Le co-fondateur Ray Zhong est intervenu sur scène à Microsoft Build en tant que partenaire stratégique mondial et partenaire de lancement d’Agent365, intégrant l’IA agentique dans l’infrastructure enterprise Microsoft existante. 🔗 Tweet Genspark
-
Cohere soutient la stratégie nationale d’IA du Canada — Le CEO Aidan Gomez réaffirme l’ancrage canadien de Cohere, saluant la nouvelle stratégie nationale d’IA du Canada comme une étape importante vers la souveraineté technologique et la construction de l’IA de prochaine génération au pays. 🔗 Tweet Cohere
Ce que ça signifie
L’auto-amélioration de l’IA passe du scénario théorique aux données internes mesurées. La publication de l’Anthropic Institute n’est pas une spéculation — c’est un rapport de terrain avec des chiffres précis : >80% du code, ×8 de productivité, 76% de taux de succès sur tâches ouvertes. La durée de tâche autonome qui double tous les 4 mois est le signal le plus concret de la dynamique en cours. Ce qui était discuté dans les cercles de sécurité IA comme un risque futur est désormais documenté comme une réalité présente. L’appel à une pause coordonnée — avec Anthropic comme premier demandeur — illustre la tension entre compétition commerciale et prudence régulatoire.
L’open-source de niveau frontier change de dimension. Nemotron 3 Ultra à 550 milliards de paramètres — entièrement open-source, poids téléchargeables, données synthétiques et recettes publiées — redéfinit ce que “open-source” signifie pour les modèles frontier. La vitesse d’inférence 5× supérieure et la réduction de coût de 30% pour les tâches agentiques ne sont pas marginales : elles rendent viable l’exécution d’agents complexes en dehors des grandes clouds propriétaires. Pour les équipes qui construisent des agents autonomes, c’est une infrastructure nouvelle qui s’installe.
L’outillage développeur se consolide autour de l’agent à longue durée. GitHub Copilot à 1M tokens de contexte, Claude Code v2.1.162 avec waitingFor dans le JSON agents, Flows Agent d’ElevenLabs qui construit des pipelines multimodaux — ces trois annonces partagent le même paradigme : l’agent doit gérer des contextes longs, communiquer son état à d’autres systèmes, et orchestrer plusieurs outils sans intervention humaine. Le “raisonnement configurable” de Copilot et le /effort persistant de Claude Code répondent à la même question : comment l’utilisateur peut-il calibrer la profondeur de réflexion selon la complexité de la tâche ?
L’économie de l’IA créative franchit un palier symbolique. La valorisation de Suno à $5,4 milliards en sept mois — avec un doublement de valeur — signale que les investisseurs parient sur une plateforme de création musicale générative à l’échelle grand public. Combiné aux levées récentes dans la vidéo (Runway, Pika), le secteur de la création IA dispose désormais d’une capitalisation comparable à celle des grands éditeurs de logiciels créatifs traditionnels. L’entrée de Hasbro dans l’Iconic Marketplace d’ElevenLabs illustre comment les détenteurs de droits de propriété intellectuelle s’adaptent : plutôt que de bloquer l’IA, ils la monétisent sous licence.
Sources
- Anthropic Institute — When AI builds itself
- Tweet @AnthropicAI — auto-amélioration
- NVIDIA Nemotron 3 Ultra — @NVIDIAAI
- HuggingFace — Nemotron 3 Ultra
- OpenAI — Dreaming v3 (mémoire ChatGPT)
- Suno — Série D $400M
- Suno Blog — The Next Chapter
- GitHub Changelog — Copilot 1M context + raisonnement
- GitHub Changelog — Copilot Visual Studio May update
- GitHub Changelog — Copilot Chat PR context GA
- Claude Code v2.1.162 — GitHub Releases
- ElevenLabs Flows Agent — @ElevenLabs
- ElevenLabs Iconic Marketplace
- ElevenLabs × Hasbro — @ElevenLabs
- OpenAI — GPT-Rosalind nouvelles capacités
- Perplexity — Main Street AI Accelerator
- Main Street AI Accelerator — page dédiée
- Cohere — Challenge OTAN 1re place
- Pika — Group Chat iOS
- Anthropic blog — self-service analytics
- Google Antigravity v2.0.11 changelog
- GitHub Enterprise Teams GA
- Genspark — Agent365 Microsoft Build
- Cohere — stratégie nationale IA Canada