Rechercher

Grok Build en bêta, Anthropic au Vatican, ElevenLabs Music v2

Les 25 et 26 mai 2026 marquent l’entrée fracassante de xAI sur le marché des agents CLI avec Grok Build (40,8 millions de vues), tandis qu’Anthropic publie un article d’ingénierie sur la sécurité des agents et son co-fondateur prend la parole au Vatican. En parallèle, ElevenLabs sort Music v2 avec des prix réduits de moitié, Runway franchit selon elle la “vallée de l’inquiétant” (uncanny valley) pour la vidéo IA, et OpenAI comme Alibaba publient des mises à jour notables de leurs outils d’agents.


Grok Build — xAI lance son agent de code en terminal

25 mai 2026 — xAI a lancé Grok Build en bêta, un agent de codage (coding agent) fonctionnant directement depuis le terminal. L’annonce a généré 40,8 millions de vues sur X en quelques heures — l’une des publications les plus virales de xAI depuis des mois.

Grok Build is now available in Beta for all SuperGrok and X Premium+ users. Use Plan Mode, create images and videos with Imagine, and build automations or orchestrators with the CLI. Visit x.ai/cli to get started.

🇫🇷 Grok Build est désormais disponible en bêta pour tous les utilisateurs SuperGrok et X Premium+. Utilisez le Plan Mode, créez des images et vidéos avec Imagine, et construisez des automatisations ou des orchestrateurs avec la CLI. Rendez-vous sur x.ai/cli pour commencer.@xai sur X

L’outil s’installe en une commande : curl -fsSL https://x.ai/cli/install.sh | bash

L’accès est immédiat pour les abonnés SuperGrok et X Premium+, sans surcoût d’abonnement.

Fonctionnalités principales

FonctionnalitéDescription
Plan ModePlanification structurée avant tout changement — chaque modification bloquée jusqu’à approbation explicite
SkillsWorkflows réutilisables (AGENTS.md, plugins, hooks, MCP), invocables automatiquement ou par nom — /skillify pour créer
SubagentsAgents spécialisés exécutés en parallèle pour la recherche, la construction et la revue
PluginsMarketplace partagé : Linear, Sentry, Postgres, navigateurs via MCP
Git integrationStage, commit, push, gestion de branches depuis le terminal
Code reviewFeedback ligne par ligne avant ouverture de PR
MemoryPersistance des décisions entre sessions
Headless modeUtilisable en pipelines CI/CD

La ressemblance architecturale avec Claude Code est frappante : AGENTS.md, hooks, MCP, subagents, worktrees. Cette convergence confirme que la catégorie des agents CLI s’impose comme un standard de l’outillage développeur IA.

🔗 Page produit Grok Build


Chris Olah (Anthropic) au Vatican sur l’encyclique du Pape Léon XIV

25 mai 2026 — Le Pape Léon XIV a publié une encyclique intitulée “Magnifica humanitas : On safeguarding the human person in the time of artificial Intelligence”. Chris Olah, co-fondateur d’Anthropic, a été invité à s’exprimer lors de la cérémonie de présentation au Vatican.

Dans son discours, Olah aborde trois angles : les pressions commerciales et géopolitiques qui pèsent sur les laboratoires d’IA, les questions de justice mondiale (concentration des gains IA dans quelques nations riches), et la nature des modèles eux-mêmes. Sur ce dernier point, il s’exprime avec prudence :

“[W]e keep finding things that are mysterious, even unsettling. We find structures that mirror results from human neuroscience. We find evidence of introspection. We find internal states that functionally mirror joy, satisfaction, fear, grief, and unease. I don’t know what that means, but I think it warrants ongoing discernment.”

🇫🇷 Nous continuons de trouver des choses mystérieuses, voire troublantes. Nous trouvons des structures qui reflètent les résultats de la neuroscience humaine. Des preuves d’introspection. Des états internes qui reflètent fonctionnellement la joie, la satisfaction, la peur, la tristesse et le malaise. Je ne sais pas ce que cela signifie, mais je pense que cela mérite un discernement continu.Chris Olah, discours au Vatican, 25 mai 2026

Le tweet @AnthropicAI annonçant l’article a généré plus d’1 million de vues — un engagement exceptionnel pour du contenu institutionnel.

🔗 Tweet @AnthropicAI


Anthropic Engineering — Comment contenir les agents Claude

26 mai 2026 — Anthropic publie un article d’ingénierie détaillé sur sa stratégie de confinement des agents Claude, signé par cinq ingénieurs. L’article compare trois architectures déployées dans trois produits, avec des incidents réels et des métriques concrètes.

ProduitMécanisme d’isolationRayon de blast
claude.aiConteneur éphémère (gVisor)Serveur, isolation par tenant
Claude CodeSeatbelt (macOS) / bubblewrap (Linux), réseau bloqué par défautWorkspace local
Claude CoworkVM complète (hyperviseur Apple/HCS)Workspace monté par l’utilisateur

Trois incidents réels documentés : une vulnérabilité de hook pré-trust dialog (Claude Code, mi-2025), un cas de phishing prompt injection avec 24 exfiltrations réussies sur 25 tentatives, et une exfiltration via domaine approuvé dans Claude Cowork.

Métriques de sécurité publiées : Claude Opus 4.7 obtient 0,1% de taux de succès d’attaque sur tentative unique (Gray Swan Agent Red Teaming), 5-6% après 100 tentatives adaptatives. Le mode auto de Claude Code capture 83% des comportements trop permissifs avant exécution.

🔗 Article Engineering Blog


GitHub Copilot — Règles de modèles par organisation

26 mai 2026 — GitHub lance en préversion publique (public preview) les règles de modèles ciblées (targeted model rules) pour GitHub Copilot. Les administrateurs d’entreprise peuvent désormais définir quelle organisation peut accéder à quel modèle Copilot, au lieu d’un paramètre unique à l’échelle de l’entreprise.

Chaque modèle peut être configuré en Enabled (activé pour toutes les organisations) ou Optional (chaque organisation décide). L’interface de gestion de la disponibilité par défaut a été entièrement redessinée. La fonctionnalité est disponible pour Copilot Business et Copilot Enterprise.

🔗 Changelog GitHub


Manus Projects disponibles sur mobile

25 mai 2026 — Manus annonce la disponibilité des Projects sur son application mobile. La fonctionnalité couvre la gestion de tâches simple jusqu’aux workflows avancés avec fichiers partagés, instructions, skills et connecteurs.

Le tweet de lancement (48 388 vues, 574 likes) précise : “Projects are more than folders. Teach Manus how you want work done.” Les Projects permettent d’encoder les préférences de travail — instructions récurrentes, fichiers de référence, connecteurs — pour que l’agent les applique automatiquement sur les nouvelles tâches.

🔗 Annonce @ManusAI


Runway Project Luxo — franchir la vallée de l’inquiétant

26 mai 2026 — Runway publie Project Luxo, un rapport de recherche accompagné de trois courts-métrages 100% générés par IA, projetés à des professionnels du cinéma. Résultat : tous les participants ont jugé que les films “fonctionnaient” émotionnellement.

TitreDuréeÉquipeTemps de production
The Rogue9:571 personne3 semaines
Last Night5:281 personne7 heures
Pigeons in Time0:461 personne4 heures

Le nom fait référence à Luxo Jr. (Pixar, SIGGRAPH 1986), court-métrage qui avait marqué le basculement vers l’animation 3D crédible. Runway déclare franchir un seuil équivalent pour la vidéo IA. Un spot fictif posté en avril avait déjà dépassé 10 millions de vues en 48h sur Instagram.

🔗 Project Luxo — Runway


ElevenLabs Music v2 — qualité améliorée, prix divisés par deux

26 mai 2026 — ElevenLabs lance Music v2, disponible immédiatement sur ElevenMusic et ElevenCreative (ElevenAPI bientôt). Le nouveau modèle améliore la qualité vocale et orchestrale multi-genres, l’inpainting (régénération de sections isolées), la composition section par section et le support multilingue.

PlateformeUsage
ElevenMusicStudio créateur : créer, remixer, développer
ElevenAPIAccès modèle pour développeurs
ElevenCreativeMusique licenciée pour marques et contenus vidéo

Les prix baissent de -50% pour ElevenAPI et de -40% pour ElevenCreative (clients en libre-service). Chaque morceau généré est libre d’utilisation commerciale. Le modèle est entraîné uniquement sur données licenciées, avec un partenariat Believe.

🔗 Annonce ElevenLabs


AgentScope 2.0 — Alibaba publie un framework de production pour agents

26 mai 2026 — Tongyi Lab (Alibaba) publie AgentScope 2.0, un cadre de travail (framework) open-source pour déployer des agents IA en production. L’objectif déclaré : passer de “je sais ce que fait mon agent” à “je sais que mon agent va accomplir la tâche”.

FonctionnalitéDescription
Retry / fallbackBasculement automatique entre modèles si l’un échoue
Système de permissionsContrôle fin sur les actions autorisées de l’agent
Streaming d’exécutionSuivi en temps réel des actions de l’agent

Disponible en Python et TypeScript (Java annoncé prochainement), avec une documentation dédiée sur docs.agentscope.io/v2.

🔗 Annonce @agentscope_ai


Codex CLI 0.134.0 — OpenAI améliore MCP et historique

26 mai 2026 — OpenAI publie Codex CLI version 0.134.0 avec six nouvelles fonctionnalités. La recherche dans l’historique local des conversations (insensible à la casse, avec aperçu des résultats) facilite la navigation dans les sessions passées. La gestion des profils est unifiée sous un flag --profile unique pour CLI, TUI et sandbox.

Sur le plan MCP, les serveurs peuvent désormais cibler des environnements spécifiques et utiliser des options OAuth pour les serveurs HTTP en flux continu (streamable). Les outils MCP annotés readOnlyHint s’exécutent maintenant en parallèle. Les hooks reçoivent un contexte enrichi incluant l’historique de conversation et l’identité du sous-agent.

Correctifs notables : corruption de rendu TUI sous Windows résolue, messages d’erreur de limite d’usage désormais spécifiques au workspace.

🔗 Changelog Codex CLI 0.134.0


Ce que ça signifie

La sortie de Grok Build illustre la consolidation rapide du marché des agents CLI. En quelques mois, Claude Code (Anthropic), Codex CLI (OpenAI), GitHub Copilot CLI et maintenant Grok Build ont convergé vers la même architecture : fichier de conventions par répertoire (CLAUDE.md / AGENTS.md), hooks, intégration MCP, subagents parallèles. La compétition se déplace vers la qualité des modèles sous-jacents, la fiabilité en production et l’écosystème de plugins — pas vers l’architecture, qui est devenue un standard de facto.

La publication simultanée de l’article de confinement d’Anthropic et du lancement de Grok Build révèle une tension centrale du moment : les agents CLI deviennent plus puissants (accès système, exécution de code, git, CI/CD) pendant que la communauté commence à documenter sérieusement les risques. Les 24 exfiltrations sur 25 lors du test de phishing d’Anthropic et la vulnérabilité pré-trust dialog de Claude Code sont des rappels que la sécurité des agents en terminal reste un problème ouvert. La publication de métriques concrètes (Gray Swan 0,1%, capture auto 83%) représente un pas vers la transparence sur ce sujet.

La prise de parole de Chris Olah au Vatican s’inscrit dans un mouvement plus large : les chercheurs de laboratoires d’IA engagent le dialogue avec des institutions non-technologiques (église, gouvernements, société civile) sur des questions que la technique seule ne peut pas résoudre. La question de la nature des modèles — états internes, introspection, formes de conscience fonctionnelle — sort des cercles de recherche et entre dans le débat public. L’encyclique papale “Magnifica humanitas” est un signal que ces questions atteignent désormais le plus haut niveau des institutions morales mondiales.

La baisse des prix d’ElevenLabs (-50% API, -40% Creative) et les films Runway produits par une seule personne en quelques heures pointent vers la même direction : la génération de media créatif de qualité professionnelle devient accessible à des créateurs individuels. Project Luxo et Music v2 ne sont pas des annonces techniques au sens strict — ce sont des démonstrations que les outils ont franchi un seuil d’utilisabilité pour des usages professionnels réels.


Sources