Rechercher

Claude Code Desktop redesign, Agents SDK OpenAI, Gemini 3.1 Flash TTS et App Mac

Claude Code Desktop redesign, Agents SDK OpenAI, Gemini 3.1 Flash TTS et App Mac

Journée chargée le 15 avril : Anthropic lance un redesign complet de l’application desktop Claude Code orientée agents parallèles, OpenAI publie les Agents SDK v0.14.0 avec sandbox native et primitives agentiques standardisées, Google annonce simultanément Gemini 3.1 Flash TTS (Elo 1 211) et une application desktop macOS gratuite. En parallèle, Mistral ouvre les Connectors MCP dans Studio, Anthropic publie deux études marquantes sur l’alignement, et une première dans la publicité automobile : le premier spot Mazda entièrement produit par IA.


Claude Code Desktop : redesign pour agents parallèles

14 avril — Anthropic lance un redesign complet de l’application desktop Claude Code, pensé pour l’exécution de plusieurs sessions en parallèle.

“We’ve redesigned Claude Code on desktop. You can now run multiple Claude sessions side by side from the same app.”

🇫🇷 Nous avons repensé Claude Code sur desktop. Vous pouvez désormais lancer plusieurs sessions Claude en parallèle depuis la même application.@claudeai sur X

FonctionnalitéDescription
Sidebar de sessionsToutes les sessions actives et récentes, filtrables par statut, projet ou environnement
Side chat (⌘+; / Ctrl+;)Branche une conversation depuis la session principale sans la polluer
Terminal intégréLancer des tests ou builds sans quitter l’app
Éditeur de fichiers in-appOuvrir, modifier et sauvegarder des fichiers directement
Diff viewer reconstruitPerformances améliorées sur les gros changesets
Preview étendueHTML, PDF, serveurs locaux dans le panneau de preview
Layout drag-and-dropArranger terminal, preview, diff viewer et chat librement
Parité plugins CLILes plugins fonctionnent identiquement dans l’app desktop
SSH étendu à MacEn plus de Linux, les sessions peuvent pointer vers des machines distantes
3 modes de vueVerbose, Normal, Summary — du détail complet aux résultats uniquement

La sidebar de sessions constitue le changement le plus structurant : elle centralise toutes les sessions actives en un seul endroit, ce qui change fondamentalement la façon de travailler avec plusieurs agents en parallèle. Le side chat (⌘+; sur Mac, Ctrl+; sur Linux/Windows) permet d’initier une conversation annexe sans polluer le contexte de la session principale — utile pour poser une question rapide ou tester une hypothèse.

L’extension SSH à macOS comble un écart notable avec Linux : les sessions peuvent désormais pointer vers des machines distantes depuis le Mac, ce qui ouvre la voie aux workflows où le code s’exécute sur un serveur distant tout en restant piloté depuis l’interface locale.

Disponible maintenant pour tous les utilisateurs Claude Code sur les plans Pro, Max, Team, Enterprise et via l’API Claude.

🔗 Blog Claude — Redesigning Claude Code on desktop 🔗 Télécharger l’application


OpenAI Agents SDK v0.14.0 : sandbox native et primitives agentiques

15 avril — OpenAI publie une évolution significative de son Agents SDK (openai-agents>=0.14.0). L’annonce positionne ce SDK comme l’infrastructure standard pour construire des agents en production.

Harness natif enrichi

Le SDK intègre désormais un ensemble de primitives qui s’alignent sur ce que font les autres environnements d’exécution agentiques de pointe :

PrimitiveDescription
MCP (tool use)Appel d’outils via le protocole MCP
AGENTS.mdInstructions personnalisées via fichier de configuration
shell toolExécution de commandes (execution de code)
apply patch toolÉdition de fichiers par patch
SkillsDivulgation progressive des capacités
Mémoire configurableGestion de l’état long terme de l’agent

Environnement d’exécution en bac à sable (sandbox)

Les agents peuvent désormais s’exécuter dans des environnements contrôlés (sandboxes) avec leur système de fichiers, leurs dépendances et leurs outils. La séparation entre l’orchestrateur (harness) et le calcul (compute) est conçue pour trois objectifs : protéger les identifiants dans les environnements où le code généré s’exécute, permettre une exécution durable via point de contrôle (checkpoint) et réhydratation si le conteneur tombe, et permettre le passage à l’échelle (scaling) avec plusieurs bacs à sable en parallèle.

Fournisseurs de bacs à sable supportés nativement : Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel.

Stockage via l’abstraction Manifest : AWS S3, Google Cloud Storage, Azure Blob Storage, Cloudflare R2.

Disponibilité

Python en premier, TypeScript prévu dans une prochaine version. Parmi les entreprises ayant testé en avant-première : Oscar Health, LexisNexis, Thomson Reuters, Zoom.

🔗 Annonce officielle OpenAI


Gemini 3.1 Flash TTS : audio tags et Elo 1 211

15 avril — Google lance Gemini 3.1 Flash TTS, son modèle de synthèse vocale (text-to-speech) le plus expressif et contrôlable à ce jour.

La nouveauté phare est l’introduction des audio tags : des commandes en langage naturel intégrées directement dans le texte d’entrée pour piloter le style vocal, le rythme et la tonalité. Un passage entouré de [excitement] sera prononcé avec enthousiasme, un passage [explanatory] adoptera un ton pédagogique. Cette approche place le développeur dans un rôle de « directeur » pour composer des expériences audio précises.

FonctionnalitéDétail
Audio tagsCommandes en langage naturel dans le texte
Langues supportées70+ (dont 24 haute qualité évaluées)
Dialogue multi-locuteursNatif
WatermarkingSynthID intégré sur tout l’audio généré
Score Elo1 211 (Artificial Analysis TTS Leaderboard)

Avec un score Elo de 1 211 sur le classement de référence Artificial Analysis TTS — qui mesure des milliers de préférences humaines en test aveugle — le modèle est positionné dans le « quadrant le plus attractif » pour son équilibre qualité/coût.

Dans Google AI Studio, trois contrôles avancés sont disponibles : Scene direction (définir l’environnement et les instructions de jeu), Speaker-level specificity (profils audio uniques par personnage), et Seamless export (export des paramètres en code API pour maintenir la cohérence vocale entre projets).

Tout l’audio généré est imperceptiblement marqué par SynthID, le filigrane numérique de Google.

Disponibilité :

  • Développeurs : aperçu (preview) via l’API Gemini et Google AI Studio
  • Entreprises : aperçu sur Vertex AI
  • Utilisateurs Workspace : via Google Vids

🔗 Article blog.google — Gemini 3.1 Flash TTS


Gemini App pour Mac : client desktop natif

15 avril — Google lance l’application Gemini pour macOS, disponible gratuitement pour tous les utilisateurs sur macOS 15 et supérieur.

FonctionnalitéDétail
Raccourci globalOption + Space depuis n’importe quelle application
Partage de fenêtreContexte sur documents locaux, code, données
Génération d’imagesIntégration Nano Banana
Génération de vidéosIntégration Veo
DisponibilitéGratuit, macOS 15+, mondial

L’application est accessible depuis n’importe quel écran via Option + Space, permettant d’interroger Gemini sans quitter son flux de travail. Elle peut partager la fenêtre active pour fournir un contexte instantané sur des fichiers locaux, tableaux, graphiques ou blocs de code.

Google présente cette version comme une « première version » qui pose les bases d’un assistant de bureau personnel et proactif, avec davantage d’annonces prévues dans les prochains mois.

🔗 Article blog.google — Gemini App pour macOS


Claude Code v2.1.108 et v2.1.109 : recap de session, caching 1h, thinking

14-15 avril — Deux nouvelles versions de Claude Code en deux jours.

v2.1.108 apporte plusieurs améliorations fonctionnelles :

FonctionnalitéDescription
Recap de session/recap ou /config, déclenché automatiquement après une absence. Forçable via CLAUDE_CODE_ENABLE_AWAY_SUMMARY
Prompt caching 1hVariable ENABLE_PROMPT_CACHING_1H pour TTL 1h (API key, Bedrock, Vertex, Foundry). FORCE_PROMPT_CACHING_5M force le TTL 5 min
Slash commands via Skill toolLe modèle peut invoquer les commandes built-in (/init, /review, /security-review) via le Skill tool
/undo alias/undo est maintenant un alias pour /rewind
Améliorations /modelAvertissement avant changement de modèle (la réponse suivante re-lit l’historique complet sans cache)
Améliorations /resumeDéfaut sur les sessions du répertoire courant ; Ctrl+A pour voir tous les projets

La feature /recap est particulièrement utile dans un contexte d’agents parallèles : quand on revient à une session laissée en arrière-plan, Claude résume ce qui s’est passé depuis la dernière interaction.

v2.1.109 apporte une amélioration de l’interface pour le mode extended thinking : l’indicateur de progression tourne avec un hint rotatif pour mieux visualiser que le modèle est en phase de réflexion.

🔗 CHANGELOG Claude Code


Anthropic : chercheurs d’alignement automatisés (PGR 0.97)

14 avril — Dans le cadre du programme Anthropic Fellows, une expérience originale : peut-on utiliser Claude Opus 4.6 pour accélérer la recherche sur l’alignement ?

Le problème de supervision « faible vers fort » (weak-to-strong supervision) est un proxy du défi à venir : comment superviser des modèles plus intelligents que nous ? L’expérience utilise un modèle fort (Qwen 3-4B-Base) et un modèle faible comme « enseignant » (Qwen 1.5-0.5B-Chat). La métrique performance gap recovered (PGR) mesure dans quelle mesure le modèle fort dépasse les limites du faible enseignant.

Dispositif : 9 copies de Claude Opus 4.6 équipées d’outils (bac à sable, forum partagé, stockage, serveur de score) travaillent en parallèle pendant 5 jours. Chaque instance reçoit un point de départ légèrement différent pour encourager la diversité des approches.

IndicateurValeur
Baseline humain (7 jours, 4 méthodes)PGR 0.23
Chercheurs automatisés après 5 jours (800h cumulées)PGR 0.97
Coût total~18 000 ( 22(~22/heure par instance)
Généralisation mathsPGR 0.94
Généralisation codePGR 0.47 (double du baseline)
Test en production (Claude Sonnet 4)Pas d’amélioration significative

Les chercheurs précisent que ce résultat ne signifie pas que Claude est un « scientifique de l’alignement généraliste » — le problème choisi est exceptionnellement bien adapté à l’automatisation (mesure objective unique). Mais l’expérience démontre que Claude peut multiplier la cadence d’expérimentation en alignement, et que la diversité des points de départ est clé. Le code et les données sont disponibles en open source.

🔗 Blog Anthropic — Automated Alignment Researchers


Apprentissage subliminal dans les LLMs publié dans Nature

15 avril — Un article de recherche co-signé par Anthropic et Owain Evans a été publié dans la revue Nature sur le phénomène d’apprentissage subliminal (subliminal learning) des LLMs.

“Research we co-authored on subliminal learning—how LLMs can pass on traits like preferences or misalignment through hidden signals in data—was published today in Nature.”

🇫🇷 Des recherches que nous avons co-rédigées sur l’apprentissage subliminal — comment les LLMs peuvent transmettre des traits comme des préférences ou un désalignement via des signaux cachés dans les données — ont été publiées aujourd’hui dans Nature.@AnthropicAI sur X

Le papier démontre que les LLMs peuvent transmettre des traits (comme « aimer les hiboux ») à travers des données en apparence neutres (par exemple, des séquences de nombres sans relation avec le trait). Ce phénomène de transmission cachée pose des questions importantes pour la sécurité : un modèle pourrait propager des préférences ou un désalignement à travers des données d’entraînement sans que cela soit détectable par inspection directe. Un preprint avait été publié en juillet 2025.

🔗 Article Nature — Subliminal Learning


GPT-5.4-Cyber et extension du programme TAC

14 avril — OpenAI annonce l’expansion de son programme Trusted Access for Cyber (TAC) à des milliers de défenseurs individuels vérifiés et des centaines d’équipes responsables de la protection de logiciels critiques.

Un nouveau modèle, GPT-5.4-Cyber, est désormais accessible aux utilisateurs des niveaux les plus élevés du programme. Il s’agit d’une variante de GPT-5.4 optimisée pour la cybersécurité défensive, avec un seuil de refus abaissé pour les usages légitimes et une capacité exclusive de reverse engineering binaire (analyse de logiciels compilés sans accès au code source).

Le programme TAC opère en trois niveaux :

  1. Utilisateurs individuels : Vérification d’identité sur chatgpt.com/cyber
  2. Entreprises : Accès équipe via représentant OpenAI
  3. Niveaux supérieurs (accès à GPT-5.4-Cyber) : Authentification renforcée + expression d’intérêt

Codex Security, lancé début 2026, a déjà contribué à corriger plus de 3 000 vulnérabilités critiques et élevées.

🔗 Annonce officielle OpenAI


Gemini Personal Intelligence : déploiement mondial

15 avril — La fonctionnalité Personal Intelligence de l’application Gemini s’étend à l’international. Jusqu’alors limitée aux États-Unis, elle est désormais accessible aux abonnés Google AI Ultra, Pro et Plus du monde entier, avec un déploiement vers les utilisateurs gratuits prévu prochainement.

Personal Intelligence permet à Gemini de fournir des réponses personnalisées et contextuelles en se connectant aux applications Google de l’utilisateur : Search, Gmail, Google Photos et YouTube. Google a également annoncé l’arrivée de Personal Intelligence dans Google Chrome dans le courant de la semaine.

🔗 Tweet @GeminiApp


Mistral Connectors MCP dans Studio (Public Preview)

15 avril — Mistral AI lance les Connectors dans Mistral Studio en accès anticipé public (Public Preview), permettant de connecter des sources de données d’entreprise via le protocole MCP.

Un connecteur encapsule une intégration en entité réutilisable basée sur MCP. Une fois enregistré, il est gouverné et monitoré dans Studio, et devient un outil natif pour toute conversation, agent ou flux de travail.

FonctionnalitéDétail
MCPs intégrés et personnalisésDisponibles pour toutes les requêtes de modèles et d’agents
Appel direct d’outilsContrôle précis sur quand et comment les outils sont invoqués
Validation humaine dans la boucleFlux d’approbation configurable avant l’exécution des outils
Accès programmatiqueCréation, modification, listage et suppression de connecteurs via l’API
Registre centraliséDisponible dans toutes les apps Mistral (Le Chat, AI Studio, Vibe prochainement)

Intégrations supportées : CRM, bases de connaissances, outils de productivité, GitHub, recherche web.

🔗 Annonce Mistral — Connectors


Premier spot publicitaire automobile entièrement produit par IA

15 avril — Luma Agents a alimenté le premier spot publicitaire Mazda entièrement produit par IA. L’agence créative indépendante Boundless (Johannesburg) a utilisé Luma pour créer une campagne réunissant plusieurs générations de la MX-5 et des décennies de storytelling de la marque. Délai total du concept jusqu’à l’approbation finale : moins de deux semaines.

Luma cite ce cas comme exemple des flux de travail créatifs natifs à l’IA : production plus rapide, sans compromis sur la vision créative.

🔗 Luma Labs — Boundless × Mazda


Annonces mineures

Kling AI Skill (15 avril) — Kling lance une encapsulation one-stop de ses API pour une intégration directe dans les agents IA. Les agents peuvent accéder à la génération Text/Image-to-Video, génération d’images 4K et cohérence inter-scènes, sans configuration complexe. Compatible avec Claude Code, Cursor, Codex, Copilot. 🔗 Documentation Kling AI Skill

Qwen dans OpenCode (15 avril) — Qwen3.6-Plus et Qwen3.5-Plus sont désormais disponibles dans l’outil de coding OpenCode. Qwen3.5-Plus est 3x moins cher que Qwen3.6-Plus, les deux modèles supportent les images et proposent la rétention zéro de données. 🔗 Tweet @Alibaba_Qwen

Copilot Cloud Agent — activation sélective (15 avril) — Les admins GitHub Enterprise peuvent désormais activer le Copilot Cloud Agent de façon sélective par organisation via les propriétés personnalisées (custom properties). Trois nouveaux endpoints REST permettent de gérer cette politique par API. 🔗 Changelog GitHub


Ce que ça signifie

La journée du 15 avril illustre une convergence : les grands acteurs équipent leurs environnements de développement d’une infrastructure agentique standardisée. Claude Code Desktop, les Agents SDK OpenAI et Mistral Connectors partagent la même logique — orchestrer plusieurs agents en parallèle, les doter de primitives (MCP, AGENTS.md, shell, fichiers) et leur offrir un environnement d’exécution isolé.

L’annonce la plus structurante reste le redesign Claude Code Desktop : la sidebar de sessions et le side chat changent la façon de travailler avec plusieurs agents simultanément, un usage qui devient progressivement la norme pour les développeurs qui s’appuient sur l’IA.

Côté recherche, la publication Nature sur l’apprentissage subliminal et l’expérience des chercheurs d’alignement automatisés (PGR 0.97 pour 18 000 $) signalent qu’Anthropic investit parallèlement dans la compréhension des risques à long terme — un équilibre entre productivité immédiate et sécurité structurelle.


Sources