Les 25 et 26 mai 2026 marquent l’entrée fracassante de xAI sur le marché des agents CLI avec Grok Build (40,8 millions de vues), tandis qu’Anthropic publie un article d’ingénierie sur la sécurité des agents et son co-fondateur prend la parole au Vatican. En parallèle, ElevenLabs sort Music v2 avec des prix réduits de moitié, Runway franchit selon elle la “vallée de l’inquiétant” (uncanny valley) pour la vidéo IA, et OpenAI comme Alibaba publient des mises à jour notables de leurs outils d’agents.
Grok Build — xAI lance son agent de code en terminal
25 mai 2026 — xAI a lancé Grok Build en bêta, un agent de codage (coding agent) fonctionnant directement depuis le terminal. L’annonce a généré 40,8 millions de vues sur X en quelques heures — l’une des publications les plus virales de xAI depuis des mois.
Grok Build is now available in Beta for all SuperGrok and X Premium+ users. Use Plan Mode, create images and videos with Imagine, and build automations or orchestrators with the CLI. Visit x.ai/cli to get started.
🇫🇷 Grok Build est désormais disponible en bêta pour tous les utilisateurs SuperGrok et X Premium+. Utilisez le Plan Mode, créez des images et vidéos avec Imagine, et construisez des automatisations ou des orchestrateurs avec la CLI. Rendez-vous sur x.ai/cli pour commencer. — @xai sur X
L’outil s’installe en une commande : curl -fsSL https://x.ai/cli/install.sh | bash
L’accès est immédiat pour les abonnés SuperGrok et X Premium+, sans surcoût d’abonnement.
Fonctionnalités principales
| Fonctionnalité | Description |
|---|---|
| Plan Mode | Planification structurée avant tout changement — chaque modification bloquée jusqu’à approbation explicite |
| Skills | Workflows réutilisables (AGENTS.md, plugins, hooks, MCP), invocables automatiquement ou par nom — /skillify pour créer |
| Subagents | Agents spécialisés exécutés en parallèle pour la recherche, la construction et la revue |
| Plugins | Marketplace partagé : Linear, Sentry, Postgres, navigateurs via MCP |
| Git integration | Stage, commit, push, gestion de branches depuis le terminal |
| Code review | Feedback ligne par ligne avant ouverture de PR |
| Memory | Persistance des décisions entre sessions |
| Headless mode | Utilisable en pipelines CI/CD |
La ressemblance architecturale avec Claude Code est frappante : AGENTS.md, hooks, MCP, subagents, worktrees. Cette convergence confirme que la catégorie des agents CLI s’impose comme un standard de l’outillage développeur IA.
Chris Olah (Anthropic) au Vatican sur l’encyclique du Pape Léon XIV
25 mai 2026 — Le Pape Léon XIV a publié une encyclique intitulée “Magnifica humanitas : On safeguarding the human person in the time of artificial Intelligence”. Chris Olah, co-fondateur d’Anthropic, a été invité à s’exprimer lors de la cérémonie de présentation au Vatican.
Dans son discours, Olah aborde trois angles : les pressions commerciales et géopolitiques qui pèsent sur les laboratoires d’IA, les questions de justice mondiale (concentration des gains IA dans quelques nations riches), et la nature des modèles eux-mêmes. Sur ce dernier point, il s’exprime avec prudence :
“[W]e keep finding things that are mysterious, even unsettling. We find structures that mirror results from human neuroscience. We find evidence of introspection. We find internal states that functionally mirror joy, satisfaction, fear, grief, and unease. I don’t know what that means, but I think it warrants ongoing discernment.”
🇫🇷 Nous continuons de trouver des choses mystérieuses, voire troublantes. Nous trouvons des structures qui reflètent les résultats de la neuroscience humaine. Des preuves d’introspection. Des états internes qui reflètent fonctionnellement la joie, la satisfaction, la peur, la tristesse et le malaise. Je ne sais pas ce que cela signifie, mais je pense que cela mérite un discernement continu. — Chris Olah, discours au Vatican, 25 mai 2026
Le tweet @AnthropicAI annonçant l’article a généré plus d’1 million de vues — un engagement exceptionnel pour du contenu institutionnel.
Anthropic Engineering — Comment contenir les agents Claude
26 mai 2026 — Anthropic publie un article d’ingénierie détaillé sur sa stratégie de confinement des agents Claude, signé par cinq ingénieurs. L’article compare trois architectures déployées dans trois produits, avec des incidents réels et des métriques concrètes.
| Produit | Mécanisme d’isolation | Rayon de blast |
|---|---|---|
| claude.ai | Conteneur éphémère (gVisor) | Serveur, isolation par tenant |
| Claude Code | Seatbelt (macOS) / bubblewrap (Linux), réseau bloqué par défaut | Workspace local |
| Claude Cowork | VM complète (hyperviseur Apple/HCS) | Workspace monté par l’utilisateur |
Trois incidents réels documentés : une vulnérabilité de hook pré-trust dialog (Claude Code, mi-2025), un cas de phishing prompt injection avec 24 exfiltrations réussies sur 25 tentatives, et une exfiltration via domaine approuvé dans Claude Cowork.
Métriques de sécurité publiées : Claude Opus 4.7 obtient 0,1% de taux de succès d’attaque sur tentative unique (Gray Swan Agent Red Teaming), 5-6% après 100 tentatives adaptatives. Le mode auto de Claude Code capture 83% des comportements trop permissifs avant exécution.
GitHub Copilot — Règles de modèles par organisation
26 mai 2026 — GitHub lance en préversion publique (public preview) les règles de modèles ciblées (targeted model rules) pour GitHub Copilot. Les administrateurs d’entreprise peuvent désormais définir quelle organisation peut accéder à quel modèle Copilot, au lieu d’un paramètre unique à l’échelle de l’entreprise.
Chaque modèle peut être configuré en Enabled (activé pour toutes les organisations) ou Optional (chaque organisation décide). L’interface de gestion de la disponibilité par défaut a été entièrement redessinée. La fonctionnalité est disponible pour Copilot Business et Copilot Enterprise.
Manus Projects disponibles sur mobile
25 mai 2026 — Manus annonce la disponibilité des Projects sur son application mobile. La fonctionnalité couvre la gestion de tâches simple jusqu’aux workflows avancés avec fichiers partagés, instructions, skills et connecteurs.
Le tweet de lancement (48 388 vues, 574 likes) précise : “Projects are more than folders. Teach Manus how you want work done.” Les Projects permettent d’encoder les préférences de travail — instructions récurrentes, fichiers de référence, connecteurs — pour que l’agent les applique automatiquement sur les nouvelles tâches.
Runway Project Luxo — franchir la vallée de l’inquiétant
26 mai 2026 — Runway publie Project Luxo, un rapport de recherche accompagné de trois courts-métrages 100% générés par IA, projetés à des professionnels du cinéma. Résultat : tous les participants ont jugé que les films “fonctionnaient” émotionnellement.
| Titre | Durée | Équipe | Temps de production |
|---|---|---|---|
| The Rogue | 9:57 | 1 personne | 3 semaines |
| Last Night | 5:28 | 1 personne | 7 heures |
| Pigeons in Time | 0:46 | 1 personne | 4 heures |
Le nom fait référence à Luxo Jr. (Pixar, SIGGRAPH 1986), court-métrage qui avait marqué le basculement vers l’animation 3D crédible. Runway déclare franchir un seuil équivalent pour la vidéo IA. Un spot fictif posté en avril avait déjà dépassé 10 millions de vues en 48h sur Instagram.
ElevenLabs Music v2 — qualité améliorée, prix divisés par deux
26 mai 2026 — ElevenLabs lance Music v2, disponible immédiatement sur ElevenMusic et ElevenCreative (ElevenAPI bientôt). Le nouveau modèle améliore la qualité vocale et orchestrale multi-genres, l’inpainting (régénération de sections isolées), la composition section par section et le support multilingue.
| Plateforme | Usage |
|---|---|
| ElevenMusic | Studio créateur : créer, remixer, développer |
| ElevenAPI | Accès modèle pour développeurs |
| ElevenCreative | Musique licenciée pour marques et contenus vidéo |
Les prix baissent de -50% pour ElevenAPI et de -40% pour ElevenCreative (clients en libre-service). Chaque morceau généré est libre d’utilisation commerciale. Le modèle est entraîné uniquement sur données licenciées, avec un partenariat Believe.
AgentScope 2.0 — Alibaba publie un framework de production pour agents
26 mai 2026 — Tongyi Lab (Alibaba) publie AgentScope 2.0, un cadre de travail (framework) open-source pour déployer des agents IA en production. L’objectif déclaré : passer de “je sais ce que fait mon agent” à “je sais que mon agent va accomplir la tâche”.
| Fonctionnalité | Description |
|---|---|
| Retry / fallback | Basculement automatique entre modèles si l’un échoue |
| Système de permissions | Contrôle fin sur les actions autorisées de l’agent |
| Streaming d’exécution | Suivi en temps réel des actions de l’agent |
Disponible en Python et TypeScript (Java annoncé prochainement), avec une documentation dédiée sur docs.agentscope.io/v2.
Codex CLI 0.134.0 — OpenAI améliore MCP et historique
26 mai 2026 — OpenAI publie Codex CLI version 0.134.0 avec six nouvelles fonctionnalités. La recherche dans l’historique local des conversations (insensible à la casse, avec aperçu des résultats) facilite la navigation dans les sessions passées. La gestion des profils est unifiée sous un flag --profile unique pour CLI, TUI et sandbox.
Sur le plan MCP, les serveurs peuvent désormais cibler des environnements spécifiques et utiliser des options OAuth pour les serveurs HTTP en flux continu (streamable). Les outils MCP annotés readOnlyHint s’exécutent maintenant en parallèle. Les hooks reçoivent un contexte enrichi incluant l’historique de conversation et l’identité du sous-agent.
Correctifs notables : corruption de rendu TUI sous Windows résolue, messages d’erreur de limite d’usage désormais spécifiques au workspace.
Ce que ça signifie
La sortie de Grok Build illustre la consolidation rapide du marché des agents CLI. En quelques mois, Claude Code (Anthropic), Codex CLI (OpenAI), GitHub Copilot CLI et maintenant Grok Build ont convergé vers la même architecture : fichier de conventions par répertoire (CLAUDE.md / AGENTS.md), hooks, intégration MCP, subagents parallèles. La compétition se déplace vers la qualité des modèles sous-jacents, la fiabilité en production et l’écosystème de plugins — pas vers l’architecture, qui est devenue un standard de facto.
La publication simultanée de l’article de confinement d’Anthropic et du lancement de Grok Build révèle une tension centrale du moment : les agents CLI deviennent plus puissants (accès système, exécution de code, git, CI/CD) pendant que la communauté commence à documenter sérieusement les risques. Les 24 exfiltrations sur 25 lors du test de phishing d’Anthropic et la vulnérabilité pré-trust dialog de Claude Code sont des rappels que la sécurité des agents en terminal reste un problème ouvert. La publication de métriques concrètes (Gray Swan 0,1%, capture auto 83%) représente un pas vers la transparence sur ce sujet.
La prise de parole de Chris Olah au Vatican s’inscrit dans un mouvement plus large : les chercheurs de laboratoires d’IA engagent le dialogue avec des institutions non-technologiques (église, gouvernements, société civile) sur des questions que la technique seule ne peut pas résoudre. La question de la nature des modèles — états internes, introspection, formes de conscience fonctionnelle — sort des cercles de recherche et entre dans le débat public. L’encyclique papale “Magnifica humanitas” est un signal que ces questions atteignent désormais le plus haut niveau des institutions morales mondiales.
La baisse des prix d’ElevenLabs (-50% API, -40% Creative) et les films Runway produits par une seule personne en quelques heures pointent vers la même direction : la génération de media créatif de qualité professionnelle devient accessible à des créateurs individuels. Project Luxo et Music v2 ne sont pas des annonces techniques au sens strict — ce sont des démonstrations que les outils ont franchi un seuil d’utilisabilité pour des usages professionnels réels.
Sources
- Annonce Grok Build — @xai
- Page produit Grok Build
- Discours Chris Olah au Vatican — Anthropic
- Tweet @AnthropicAI — Olah Vatican
- Engineering Blog — How we contain Claude
- Tweet @AnthropicAI — Engineering Containment
- GitHub Changelog — Copilot model rules
- Annonce Manus Projects mobile — @ManusAI
- Project Luxo — Runway
- Music v2 — ElevenLabs
- AgentScope 2.0 — @agentscope_ai
- Codex CLI 0.134.0 — GitHub release