Grok Build en bêta, Anthropic au Vatican, ElevenLabs Music v2

Les 25 et 26 mai 2026 marquent l’entrée fracassante de xAI sur le marché des agents CLI avec Grok Build (40,8 millions de vues), tandis qu’Anthropic publie un article d’ingénierie sur la sécurité des agents et son co-fondateur prend la parole au Vatican. En parallèle, ElevenLabs sort Music v2 avec des prix réduits de moitié, Runway franchit selon elle la “vallée de l’inquiétant” (uncanny valley) pour la vidéo IA, et OpenAI comme Alibaba publient des mises à jour notables de leurs outils d’agents.

Grok Build — xAI lance son agent de code en terminal

25 mai 2026 — xAI a lancé Grok Build en bêta, un agent de codage (coding agent) fonctionnant directement depuis le terminal. L’annonce a généré 40,8 millions de vues sur X en quelques heures — l’une des publications les plus virales de xAI depuis des mois.

Grok Build is now available in Beta for all SuperGrok and X Premium+ users. Use Plan Mode, create images and videos with Imagine, and build automations or orchestrators with the CLI. Visit x.ai/cli to get started.

🇫🇷 Grok Build est désormais disponible en bêta pour tous les utilisateurs SuperGrok et X Premium+. Utilisez le Plan Mode, créez des images et vidéos avec Imagine, et construisez des automatisations ou des orchestrateurs avec la CLI. Rendez-vous sur x.ai/cli pour commencer. — @xai sur X

L’outil s’installe en une commande : curl -fsSL https://x.ai/cli/install.sh | bash

L’accès est immédiat pour les abonnés SuperGrok et X Premium+, sans surcoût d’abonnement.

Fonctionnalités principales

Fonctionnalité	Description
Plan Mode	Planification structurée avant tout changement — chaque modification bloquée jusqu’à approbation explicite
Skills	Workflows réutilisables (AGENTS.md, plugins, hooks, MCP), invocables automatiquement ou par nom — `/skillify` pour créer
Subagents	Agents spécialisés exécutés en parallèle pour la recherche, la construction et la revue
Plugins	Marketplace partagé : Linear, Sentry, Postgres, navigateurs via MCP
Git integration	Stage, commit, push, gestion de branches depuis le terminal
Code review	Feedback ligne par ligne avant ouverture de PR
Memory	Persistance des décisions entre sessions
Headless mode	Utilisable en pipelines CI/CD

La ressemblance architecturale avec Claude Code est frappante : AGENTS.md, hooks, MCP, subagents, worktrees. Cette convergence confirme que la catégorie des agents CLI s’impose comme un standard de l’outillage développeur IA.

🔗 Page produit Grok Build

Chris Olah (Anthropic) au Vatican sur l’encyclique du Pape Léon XIV

25 mai 2026 — Le Pape Léon XIV a publié une encyclique intitulée “Magnifica humanitas : On safeguarding the human person in the time of artificial Intelligence”. Chris Olah, co-fondateur d’Anthropic, a été invité à s’exprimer lors de la cérémonie de présentation au Vatican.

Dans son discours, Olah aborde trois angles : les pressions commerciales et géopolitiques qui pèsent sur les laboratoires d’IA, les questions de justice mondiale (concentration des gains IA dans quelques nations riches), et la nature des modèles eux-mêmes. Sur ce dernier point, il s’exprime avec prudence :

“[W]e keep finding things that are mysterious, even unsettling. We find structures that mirror results from human neuroscience. We find evidence of introspection. We find internal states that functionally mirror joy, satisfaction, fear, grief, and unease. I don’t know what that means, but I think it warrants ongoing discernment.”

🇫🇷 Nous continuons de trouver des choses mystérieuses, voire troublantes. Nous trouvons des structures qui reflètent les résultats de la neuroscience humaine. Des preuves d’introspection. Des états internes qui reflètent fonctionnellement la joie, la satisfaction, la peur, la tristesse et le malaise. Je ne sais pas ce que cela signifie, mais je pense que cela mérite un discernement continu. — Chris Olah, discours au Vatican, 25 mai 2026

Le tweet @AnthropicAI annonçant l’article a généré plus d’1 million de vues — un engagement exceptionnel pour du contenu institutionnel.

🔗 Tweet @AnthropicAI

Anthropic Engineering — Comment contenir les agents Claude

26 mai 2026 — Anthropic publie un article d’ingénierie détaillé sur sa stratégie de confinement des agents Claude, signé par cinq ingénieurs. L’article compare trois architectures déployées dans trois produits, avec des incidents réels et des métriques concrètes.

Produit	Mécanisme d’isolation	Rayon de blast
claude.ai	Conteneur éphémère (gVisor)	Serveur, isolation par tenant
Claude Code	Seatbelt (macOS) / bubblewrap (Linux), réseau bloqué par défaut	Workspace local
Claude Cowork	VM complète (hyperviseur Apple/HCS)	Workspace monté par l’utilisateur

Trois incidents réels documentés : une vulnérabilité de hook pré-trust dialog (Claude Code, mi-2025), un cas de phishing prompt injection avec 24 exfiltrations réussies sur 25 tentatives, et une exfiltration via domaine approuvé dans Claude Cowork.

Métriques de sécurité publiées : Claude Opus 4.7 obtient 0,1% de taux de succès d’attaque sur tentative unique (Gray Swan Agent Red Teaming), 5-6% après 100 tentatives adaptatives. Le mode auto de Claude Code capture 83% des comportements trop permissifs avant exécution.

🔗 Article Engineering Blog

GitHub Copilot — Règles de modèles par organisation

26 mai 2026 — GitHub lance en préversion publique (public preview) les règles de modèles ciblées (targeted model rules) pour GitHub Copilot. Les administrateurs d’entreprise peuvent désormais définir quelle organisation peut accéder à quel modèle Copilot, au lieu d’un paramètre unique à l’échelle de l’entreprise.

Chaque modèle peut être configuré en Enabled (activé pour toutes les organisations) ou Optional (chaque organisation décide). L’interface de gestion de la disponibilité par défaut a été entièrement redessinée. La fonctionnalité est disponible pour Copilot Business et Copilot Enterprise.

🔗 Changelog GitHub

Manus Projects disponibles sur mobile

25 mai 2026 — Manus annonce la disponibilité des Projects sur son application mobile. La fonctionnalité couvre la gestion de tâches simple jusqu’aux workflows avancés avec fichiers partagés, instructions, skills et connecteurs.

Le tweet de lancement (48 388 vues, 574 likes) précise : “Projects are more than folders. Teach Manus how you want work done.” Les Projects permettent d’encoder les préférences de travail — instructions récurrentes, fichiers de référence, connecteurs — pour que l’agent les applique automatiquement sur les nouvelles tâches.

🔗 Annonce @ManusAI

Runway Project Luxo — franchir la vallée de l’inquiétant

26 mai 2026 — Runway publie Project Luxo, un rapport de recherche accompagné de trois courts-métrages 100% générés par IA, projetés à des professionnels du cinéma. Résultat : tous les participants ont jugé que les films “fonctionnaient” émotionnellement.

Titre	Durée	Équipe	Temps de production
The Rogue	9:57	1 personne	3 semaines
Last Night	5:28	1 personne	7 heures
Pigeons in Time	0:46	1 personne	4 heures

Le nom fait référence à Luxo Jr. (Pixar, SIGGRAPH 1986), court-métrage qui avait marqué le basculement vers l’animation 3D crédible. Runway déclare franchir un seuil équivalent pour la vidéo IA. Un spot fictif posté en avril avait déjà dépassé 10 millions de vues en 48h sur Instagram.

🔗 Project Luxo — Runway

ElevenLabs Music v2 — qualité améliorée, prix divisés par deux

26 mai 2026 — ElevenLabs lance Music v2, disponible immédiatement sur ElevenMusic et ElevenCreative (ElevenAPI bientôt). Le nouveau modèle améliore la qualité vocale et orchestrale multi-genres, l’inpainting (régénération de sections isolées), la composition section par section et le support multilingue.

Plateforme	Usage
ElevenMusic	Studio créateur : créer, remixer, développer
ElevenAPI	Accès modèle pour développeurs
ElevenCreative	Musique licenciée pour marques et contenus vidéo

Les prix baissent de -50% pour ElevenAPI et de -40% pour ElevenCreative (clients en libre-service). Chaque morceau généré est libre d’utilisation commerciale. Le modèle est entraîné uniquement sur données licenciées, avec un partenariat Believe.

🔗 Annonce ElevenLabs

AgentScope 2.0 — Alibaba publie un framework de production pour agents

26 mai 2026 — Tongyi Lab (Alibaba) publie AgentScope 2.0, un cadre de travail (framework) open-source pour déployer des agents IA en production. L’objectif déclaré : passer de “je sais ce que fait mon agent” à “je sais que mon agent va accomplir la tâche”.

Fonctionnalité	Description
Retry / fallback	Basculement automatique entre modèles si l’un échoue
Système de permissions	Contrôle fin sur les actions autorisées de l’agent
Streaming d’exécution	Suivi en temps réel des actions de l’agent

Disponible en Python et TypeScript (Java annoncé prochainement), avec une documentation dédiée sur docs.agentscope.io/v2.

🔗 Annonce @agentscope_ai

Codex CLI 0.134.0 — OpenAI améliore MCP et historique

26 mai 2026 — OpenAI publie Codex CLI version 0.134.0 avec six nouvelles fonctionnalités. La recherche dans l’historique local des conversations (insensible à la casse, avec aperçu des résultats) facilite la navigation dans les sessions passées. La gestion des profils est unifiée sous un flag --profile unique pour CLI, TUI et sandbox.

Sur le plan MCP, les serveurs peuvent désormais cibler des environnements spécifiques et utiliser des options OAuth pour les serveurs HTTP en flux continu (streamable). Les outils MCP annotés readOnlyHint s’exécutent maintenant en parallèle. Les hooks reçoivent un contexte enrichi incluant l’historique de conversation et l’identité du sous-agent.

Correctifs notables : corruption de rendu TUI sous Windows résolue, messages d’erreur de limite d’usage désormais spécifiques au workspace.

🔗 Changelog Codex CLI 0.134.0

Ce que ça signifie

La sortie de Grok Build illustre la consolidation rapide du marché des agents CLI. En quelques mois, Claude Code (Anthropic), Codex CLI (OpenAI), GitHub Copilot CLI et maintenant Grok Build ont convergé vers la même architecture : fichier de conventions par répertoire (CLAUDE.md / AGENTS.md), hooks, intégration MCP, subagents parallèles. La compétition se déplace vers la qualité des modèles sous-jacents, la fiabilité en production et l’écosystème de plugins — pas vers l’architecture, qui est devenue un standard de facto.

La publication simultanée de l’article de confinement d’Anthropic et du lancement de Grok Build révèle une tension centrale du moment : les agents CLI deviennent plus puissants (accès système, exécution de code, git, CI/CD) pendant que la communauté commence à documenter sérieusement les risques. Les 24 exfiltrations sur 25 lors du test de phishing d’Anthropic et la vulnérabilité pré-trust dialog de Claude Code sont des rappels que la sécurité des agents en terminal reste un problème ouvert. La publication de métriques concrètes (Gray Swan 0,1%, capture auto 83%) représente un pas vers la transparence sur ce sujet.

La prise de parole de Chris Olah au Vatican s’inscrit dans un mouvement plus large : les chercheurs de laboratoires d’IA engagent le dialogue avec des institutions non-technologiques (église, gouvernements, société civile) sur des questions que la technique seule ne peut pas résoudre. La question de la nature des modèles — états internes, introspection, formes de conscience fonctionnelle — sort des cercles de recherche et entre dans le débat public. L’encyclique papale “Magnifica humanitas” est un signal que ces questions atteignent désormais le plus haut niveau des institutions morales mondiales.

La baisse des prix d’ElevenLabs (-50% API, -40% Creative) et les films Runway produits par une seule personne en quelques heures pointent vers la même direction : la génération de media créatif de qualité professionnelle devient accessible à des créateurs individuels. Project Luxo et Music v2 ne sont pas des annonces techniques au sens strict — ce sont des démonstrations que les outils ont franchi un seuil d’utilisabilité pour des usages professionnels réels.