Rechercher

Karpathy rejoint Anthropic, Google I/O 2026 lance l'ère agentique Gemini 3.5, Cohere acquiert Reliant AI

Karpathy rejoint Anthropic, Google I/O 2026 lance l'ère agentique Gemini 3.5, Cohere acquiert Reliant AI

Le 19 mai 2026 est une journée chargée pour l’IA : Andrej Karpathy quitte la scène pour rejoindre Anthropic, Google I/O 2026 lance un ensemble d’annonces agentiques autour de la série Gemini 3.5, xAI déploie Grok Skills avec génération de documents Office, et Cohere fait une acquisition stratégique dans la biopharma. En parallèle, OpenAI renforce la provenance des contenus IA et le monde génératif médias s’enrichit de nouvelles capacités.


Andrej Karpathy rejoint Anthropic

19 mai — Andrej Karpathy a annoncé sur X avoir rejoint Anthropic. La nouvelle a généré plus de 11,3 millions de vues, 102 000 mentions “j’aime” et 13 000 partages en quelques heures — un engagement exceptionnel qui mesure l’impact de ce recrutement dans la communauté.

“Personal update: I’ve joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D. I remain deeply passionate about education and plan to resume my work on it in time.”

🇫🇷 Mise à jour personnelle : j’ai rejoint Anthropic. Je pense que les prochaines années à la frontière des LLM seront particulièrement formatrices. Je suis très enthousiaste à l’idée de rejoindre l’équipe et de retourner à la R&D. Je reste profondément passionné par l’éducation et prévois de reprendre ce travail en temps voulu.@karpathy sur X

Karpathy est l’une des figures les plus reconnues du domaine. Son parcours : doctorat à Stanford, membre fondateur d’OpenAI, directeur de l’IA chez Tesla, puis figure indépendante avec la série pédagogique nanoGPT et ses cours d’apprentissage automatique suivis par des millions de personnes.

Son arrivée chez Anthropic renforce considérablement l’équipe de recherche fondamentale au moment précis où la compétition entre les laboratoires frontières s’intensifie. Ex-OpenAI qui rejoint Anthropic — le signal est fort sur les dynamiques de talent dans le secteur.

Anthropic n’a pas précisé son rôle exact. L’annonce coïncide avec l’événement Code with Claude London et plusieurs lancements majeurs du même jour.


Google I/O 2026 — L’ère agentique Gemini 3.5

19 mai — Google I/O 2026 a lieu aujourd’hui, avec pour thème central l’ère Gemini agentique (agentic Gemini era). Google annonce lors du keynote un ensemble cohérent d’annonces qui gravitent toutes autour de la capacité de Gemini à agir de manière autonome, proactive et persistante.

“Three years ago, Gemini started by understanding the world. With Gemini 2, models learned to think and reason. Late last year, Gemini 3 brought any idea to life. Today, we’re continuing that journey with our Gemini 3.5 series, starting with Gemini 3.5 Flash, delivering frontier performance for agents and coding.”

🇫🇷 “Il y a trois ans, Gemini a commencé par comprendre le monde. Avec Gemini 2, les modèles ont appris à penser et raisonner. Fin de l’année dernière, Gemini 3 a donné vie à n’importe quelle idée. Aujourd’hui, nous poursuivons ce parcours avec notre série Gemini 3.5, en commençant par Gemini 3.5 Flash, offrant des performances de pointe pour les agents et le codage.”@GoogleAI sur X

Les annonces principales du keynote I/O 2026 :

AnnonceCatégorie
Gemini 3.5 FlashNouveau modèle (agents + coding)
Gemini OmniModèle vidéo multimodal
Gemini SparkAgent personnel 24/7
Daily BriefAgent matinal personnalisé
Neural ExpressiveNouveau design de l’app
Managed Agents APIInfrastructure Antigravity pour développeurs
Google AI StudioRenouvelé avec templates agents

🔗 Blog Google I/O 2026


Gemini 3.5 Flash — Vitesse et intelligence pour les agents

19 maiGemini 3.5 Flash est le premier modèle de la nouvelle génération 3.5. Il est conçu pour combiner intelligence de pointe (frontier intelligence) et vitesse d’action fulgurante (lightning-fast action), spécialement optimisé pour les cas d’usage agents et codage.

Gemini 3.5 Flash est le moteur sous-jacent de l’agent Antigravity (Managed Agents API) et de Gemini Spark. Il est disponible via l’API Gemini et dans Google AI Studio dès le 19 mai.

GénérationCapacité clé
Gemini 1Compréhension du monde
Gemini 2Raisonnement et pensée
Gemini 3Création multimodale
Gemini 3.5 FlashAgents, coding, vitesse fulgurante

Le modèle est également disponible en disponibilité générale (generally available) dans GitHub Copilot le jour même de son lancement — sur les plans Pro, Pro+, Business et Enterprise. GitHub rapporte des performances proches du niveau Pro à la vitesse Flash, avec une utilisation efficace des outils, des temps de réponse rapides et une haute efficacité de cache. Le déploiement est graduel ; les administrateurs Copilot Enterprise et Business doivent activer la politique Gemini 3.5 Flash dans les paramètres.

Attribut CopilotValeur
Plans concernésPro, Pro+, Business, Enterprise
IDEs supportésVS Code, Visual Studio, JetBrains, Xcode, Eclipse, GitHub Mobile
Multiplicateur premium14× (provisoire, susceptible d’évoluer)

🔗 Annonce GitHub Copilot


Gemini Omni — Créer n’importe quoi depuis n’importe quoi

19 mai — Google DeepMind lance Gemini Omni, présenté comme “la première étape vers un modèle capable de créer n’importe quoi depuis n’importe quoi — en commençant par la vidéo”. Il combine l’intelligence de Gemini avec les systèmes de médias génératifs de Google (Veo, Imagen).

“We’re dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video. It combines Gemini’s intelligence with our generative media systems - representing a leap forward in world understanding, multimodality, and editing.”

🇫🇷 “Nous lançons Gemini Omni : notre première étape vers un modèle capable de créer n’importe quoi depuis n’importe quoi — en commençant par la vidéo. Il combine l’intelligence de Gemini avec nos systèmes de médias génératifs, représentant un bond en avant dans la compréhension du monde, la multimodalité et l’édition.”@GoogleDeepMind sur X

Dans l’app Gemini, Gemini Omni permet la génération de vidéo cinématographique haute qualité depuis texte, images ou vidéos existantes, l’édition vidéo par conversation naturelle (zooms cinématiques, changements de fond par simple prompt), la création d’avatars IA personnalisés ressemblant à l’utilisateur et l’application de templates intégrés d’un tap.

Disponibilité : Déploiement progressif dès le 19 mai pour les abonnés Google AI Plus, Pro et Ultra dans le monde entier.


Gemini Spark — Agent personnel 24/7

19 mai — Google annonce Gemini Spark, un agent IA personnel disponible 24h/24 et 7j/7. C’est un changement fondamental dans la nature de Gemini : il passe d’un assistant réactif à un partenaire actif qui travaille en arrière-plan même quand l’utilisateur ferme son appareil (architecture cloud).

Spark fonctionne sur Gemini 3.5 Flash via l’infrastructure Antigravity. Il est profondément intégré aux outils Workspace (Gmail, Docs, Slides, Calendar).

CapacitéDétail
Tâches récurrentesDéclencheurs automatiques (ex. : analyser les relevés mensuels)
Apprentissage de compétencesSur instruction de l’utilisateur
Workflows completsSynthèse réunion → Google Doc → email de suivi
Connexions MCPCanva, OpenTable, Instacart dès le lancement
Contrôle utilisateurConfirmation demandée avant les actions à fort impact

Disponibilité : Tests en confiance cette semaine ; bêta pour les abonnés Google AI Ultra aux États-Unis la semaine suivante. Arrivée dans l’app macOS Gemini prévue pour l’été 2026.


Managed Agents dans l’API Gemini — Infrastructure Antigravity ouverte

19 mai — Google lance les Managed Agents dans l’API Gemini, permettant aux développeurs de déployer des agents avec une seule ligne de code dans un environnement Linux isolé et éphémère. L’infrastructure est alimentée par l’agent Antigravity, construit sur Gemini 3.5 Flash.

C’est l’ouverture de l’infrastructure interne d’agents de Google aux développeurs externes. Le premier agent géré était Deep Research (décembre 2025) ; maintenant les développeurs peuvent créer les leurs.

Fonctionnalité développeurDétail
DéploiementUn seul appel API — environnement Linux distant
CapacitésNavigation web, exécution code, gestion fichiers
PersonnalisationFichiers AGENTS.md et SKILL.md
Sessions persistantesReprise d’état complète
Agents réutilisablesEnregistrement via client.agents.create()
EnterpriseGemini Enterprise Agent Platform (preview privée)

Disponibilité : Preview dans l’API Gemini dès le 19 mai au soir ; templates dans Google AI Studio.

🔗 Annonce Managed Agents API


Claude Managed Agents — Sandboxes auto-hébergés et tunnels MCP

19 mai — Depuis l’événement Code with Claude London, Anthropic a lancé deux nouvelles fonctionnalités majeures pour Claude Managed Agents.

Self-hosted sandboxes (bêta publique) — Les agents Claude peuvent désormais s’exécuter dans des bacs à sable (sandboxes) hébergés sur l’infrastructure du client. Les équipes gardent les fichiers sensibles, paquets et services dans leur propre périmètre, avec leurs politiques réseau, journaux d’audit et outils de sécurité déjà en place.

MCP tunnels (aperçu de recherche) — Les agents peuvent atteindre des serveurs MCP situés dans un réseau privé sans les exposer publiquement. Les tunnels MCP sont gérés depuis la Claude Console et supportés à la fois dans Managed Agents et dans la Messages API.

FonctionnalitéStatutFournisseurs
Self-hosted sandboxesBêta publiqueCloudflare, Daytona, Modal, Vercel
MCP tunnelsAperçu de recherche (accès sur demande)Via Claude Console

🔗 Annonce Claude Managed Agents


Grok Skills — Expertise persistante et documents Office

18 mai — xAI a lancé Skills pour Grok 4.3, une fonctionnalité de mémorisation persistante qui permet à Grok d’apprendre des préférences, règles de formatage et étapes de workflow une seule fois, puis de les appliquer dans toutes les conversations suivantes.

“I’m leveling up my Skills. Automate your workflows and get things done in record time with prebuilt and custom Skills.”

🇫🇷 “Je monte en compétences grâce aux Skills. Automatisez vos workflows et accomplissez vos tâches à vitesse record avec des Skills préconstruits et personnalisés.”@grok sur X

Type de documentCapacités
Word (.docx)Création et édition avec formatage complet (titres, tableaux, puces)
PowerPointDiapositives avec hiérarchie visuelle et notes d’orateur
ExcelFormules, sections colorées, structure claire
PDFCréation, fusion, découpage et extraction
Skill CreatorConstruction de nouveaux skills personnalisés via la conversation

Les Skills sont disponibles sur grok.com, iOS et Android. Les skills personnalisés de l’utilisateur prennent toujours la priorité sur les skills intégrés par défaut.

🔗 Annonce Grok Skills


Cohere acquiert Reliant AI — IA souveraine pour la biopharma

19 mai — Cohere annonce l’acquisition de Reliant AI, une entreprise spécialisée en IA pour la biopharmacie, avec des bureaux à Montréal et Berlin. Cette opération renforce la stratégie d’IA souveraine (sovereign AI) de Cohere dans les secteurs de la santé et des sciences de la vie.

“Healthcare represents one of the most consequential opportunities for AI and it demands secure, sovereign, and domain-specific systems.”

🇫🇷 La santé représente l’une des opportunités les plus importantes pour l’IA et exige des systèmes sécurisés, souverains et spécifiques au domaine. — Aidan Gomez, Co-Founder & CEO, Cohere

Apports de l’acquisition :

ÉlémentDétail
ÉquipeChercheurs de haut niveau spécialisés biopharma
DonnéesBases de données biomédicales propriétaires
TechnologieAtelier de recherche intelligent (intelligent research workbench)
Clients transférésGSK, Medicus Pharma, Kyowa Kirin

Nouveau produit : North for Pharma — Cohere annonce le développement d’un système d’IA agentique conçu pour les équipes biopharma travaillant sur la R&D, le développement clinique et l’analyse scientifique. Il prolonge la suite “North” déjà proposée pour les secteurs financier et télécom.

Karl Moritz Hermann (ex-PDG de Reliant AI) devient VP of AI Verticalizations à Berlin. Marc Bellemare (co-fondateur, Canada CIFAR AI Chair, Mila) devient VP of Modelling à Montréal.

🔗 Annonce Cohere


KPMG × Anthropic — Alliance mondiale (276 000 employés, 138 pays)

19 mai — KPMG, l’un des plus grands cabinets de services professionnels au monde, a annoncé une alliance stratégique mondiale avec Anthropic. Le cabinet intègre Claude dans sa plateforme Digital Gateway et donne accès à Claude à l’ensemble de ses 276 000+ employés dans 138 pays.

Les axes principaux : Claude Cowork et Managed Agents intégrés dans Digital Gateway, nouveaux outils pour les clients en fiscalité et juridique, KPMG devient partenaire privilégié d’Anthropic pour les fonds de capital-investissement, et les équipes KPMG utilisent Claude Code (via KPMG Blaze) pour moderniser les systèmes informatiques vieillissants.

“Building an AI agent to help clients adjust to changing tax regulations used to take weeks and required teams to switch between multiple tools and chat windows. With Cowork and Managed Agents integrated in Digital Gateway, that same capability takes minutes.”

🇫🇷 Créer un agent IA pour aider les clients à s’adapter à l’évolution des réglementations fiscales prenait auparavant des semaines et nécessitait de jongler entre plusieurs outils. Avec Cowork et Managed Agents intégrés dans Digital Gateway, cette même capacité prend désormais quelques minutes. — Rema Serafi, Vice-Présidente Fiscalité, KPMG US

Ce déploiement s’appuie sur deux ans d’adoption interne chez KPMG aux États-Unis.

🔗 Annonce Anthropic × KPMG


Gemini App — Neural Expressive et Daily Brief

19 mai — L’app Gemini reçoit deux nouveautés majeures.

Neural Expressive est un nouveau langage de design pour l’ère de l’IA : animations fluides, couleurs vives, nouvelle typographie, retour haptique. L’expérience Gemini Live (conversation vocale) est désormais intégrée directement dans l’interface principale — passage transparent entre frappe et conversation. Déploiement global dès le 19 mai sur web, Android et iOS pour tous les utilisateurs.

Daily Brief est un agent qui génère chaque matin un résumé personnalisé basé sur Gmail, Calendar et les priorités de l’utilisateur. Il va au-delà d’un simple résumé : il organise, priorise et suggère des prochaines actions concrètes. Déploiement progressif pour les abonnés Plus, Pro et Ultra, en commençant par les États-Unis.


OpenAI — C2PA, SynthID et outil de vérification publique

19 mai — OpenAI annonce une approche multicouche pour la provenance des contenus générés par l’IA, combinant trois mécanismes complémentaires.

MécanismePortéeRésistance aux modifications
Métadonnées C2PAImages, audio, vidéoMoyenne (supprimable)
Tatouage SynthID (Google DeepMind)Images uniquementHaute
Outil openai.com/verifyContenus générés par OpenAIN/A

OpenAI intègre désormais le tatouage numérique invisible SynthID de Google DeepMind dans toutes les images générées via ChatGPT, Codex et l’API OpenAI. SynthID encode l’origine directement dans les pixels de l’image de façon imperceptible, et résiste à la plupart des modifications courantes (recadrage, filtres, compression). L’outil public openai.com/verify permet à quiconque de téléverser une image pour détecter la présence d’un tatouage SynthID — en aperçu limité aux contenus OpenAI pour l’instant.

🔗 Annonce OpenAI


NVIDIA Sana WM — World Model sur GPU unique

19 mai — NVIDIA AI présente Sana WM (World Model). À partir d’une seule image, d’une description textuelle et d’une trajectoire de caméra, le modèle génère des vidéos cohérentes et contrôlables — le tout sur un seul GPU.

L’architecture repose sur quatre innovations : Hybrid Linear Attention, Dual-Branch Camera Control, Two-Stage Generation Pipeline et Robust Annotation Pipeline. Le projet est entièrement open source (papier + code + modèle).

🔗 Annonce NVIDIA AI


Wan2.7-Image — Contrôle de palette de couleurs

19 mai — Alibaba annonce le contrôle de palette de couleurs (Palette Control) pour Wan2.7-Image. La fonction permet d’extraire la palette chromatique de n’importe quelle image — comme un chef-d’œuvre artistique — et de l’appliquer à une nouvelle création. Disponible directement sur wan.video. L’annonce a généré 529 742 vues sur X.

🔗 Annonce Alibaba Wan


ElevenLabs — Voix d’Albert Einstein pour l’enseignement

19 mai — ElevenLabs annonce l’introduction de la voix recréée d’Albert Einstein dans sa plateforme, sous forme d’un agent conversationnel dédié à l’enseignement. L’agent illustre comment l’IA vocale peut rendre l’apprentissage plus interactif, accessible et multilingue. Une démonstration est disponible sur start.elevenlabs.io. Les enseignants peuvent accéder au plan Pro gratuit via le programme Impact.

En parallèle, ElevenLabs annonce un pilote en Pologne : déploiement d’agents vocaux dans les services publics de santé (NFZ) cet été.

🔗 Annonce ElevenLabs


xAI Grok intégré dans OpenClaw — Agent local open-source multi-messageries

19 mai — xAI annonce l’intégration de Grok dans OpenClaw, un agent personnel open-source et local-first (local-first). Les abonnés Grok et X Premium peuvent désormais utiliser Grok dans OpenClaw, qui fonctionne sur n’importe quel matériel (Mac Mini, laptop, Raspberry Pi) et se connecte à WhatsApp, Telegram, Slack, Discord, Signal et iMessage.

🔗 Annonce xAI


Z.ai GLM-5.1 — N°1 open-source SWE-Bench Pro, MIT, 200K contexte

18 mai — Z.ai (Zhipu AI) rend disponible GLM-5.1 sur OrcaRouter. Le modèle revendique la première place parmi les modèles open-source sur SWE-Bench Pro (benchmark de réparation de code en conditions réelles), surpassant même certains modèles propriétaires. Licence MIT, contexte 200K tokens, conçu pour le codage agentique longue durée (long-horizon agentic coding).

🔗 Annonce OrcaRouter


Brèves

  • The Problem Solvers (Anthropic) — Nouvelle série vidéo mettant en scène des fondateurs bâtissant avec Claude. Premiers épisodes : Scott Wu (Cognition/Devin) et Kay Zhu (Genspark). 🔗 claude.com/problem-solvers

  • Manus × Higgsfield (connecteur MCP) — Manus intègre Higgsfield via MCP pour donner aux créateurs un contrôle professionnel sur la génération image/vidéo au sein de leurs workflows. 🔗 manus.im/blog

  • OpenAI Guaranteed Capacity — Nouvelle offre permettant aux entreprises de réserver l’accès aux ressources de calcul OpenAI via des engagements 1 à 3 ans, avec des remises croissantes selon la durée. 🔗 openai.com

  • Perplexity Computer — Rho — Rho a réduit le temps de réunion hebdomadaire de 90 % et économisé 120 heures sur 12 semaines grâce à Perplexity Computer, qui surveille Slack, Notion, Jira, Figma et Google Docs. 🔗 Perplexity sur X


Ce que ça signifie

La convergence des Managed Agents. Google et Anthropic annoncent le même jour, quasiment à la même heure, une infrastructure similaire sous le même nom : Managed Agents. Chez Google, c’est Antigravity ouvert via l’API Gemini — un appel suffit pour déployer un agent dans un sandbox Linux isolé. Chez Anthropic, ce sont les self-hosted sandboxes (Cloudflare, Daytona, Modal, Vercel) et les tunnels MCP pour les réseaux privés. Cette convergence n’est pas un hasard : elle marque l’émergence d’une nouvelle couche d’infrastructure IA standardisée, entre le modèle brut et l’application finale.

L’IA enterprise se structure autour de la souveraineté. L’acquisition de Reliant AI par Cohere, l’alliance KPMG-Anthropic avec Claude dans Digital Gateway, et l’offre OpenAI Guaranteed Capacity dessinent le même mouvement : les grandes organisations veulent des systèmes IA dans leur périmètre, avec leurs données, leurs règles de sécurité et des engagements de capacité sur plusieurs années. “Souverain” (sovereign) est devenu le mot-clé de l’IA enterprise en 2026.

La course au codage agentique longue durée. Gemini 3.5 Flash (optimisé agents + coding), GLM-5.1 de Z.ai (N°1 open-source SWE-Bench Pro, 200K contexte), Grok Skills (workflows persistants) — tous ciblent le même cas d’usage : un agent qui travaille sur une tâche complexe pendant des heures sans intervention humaine. GitHub Copilot intègre Gemini 3.5 Flash le jour même de son lancement, ce qui illustre la vitesse à laquelle l’outillage développeur absorbe les nouveaux modèles.

Provenance et confiance dans les contenus IA. La combinaison C2PA + SynthID + openai.com/verify annoncée par OpenAI (avec SynthID de Google DeepMind) représente une approche multicouche inédite : métadonnées pour le contexte, tatouage invisible pour la persistance même après modification, outil public pour la vérification. Ce mouvement vers la traçabilité des contenus générés devient progressivement une norme de l’industrie, portée conjointement par OpenAI, Google et la coalition C2PA.


Sources