Anthropic dépose son dossier d'IPO, NVIDIA lance Cosmos 3, MiniMax M3 et Qwen3.7-Plus

Le 1er juin 2026 restera comme l’une des journées les plus denses de l’histoire récente de l’IA : Anthropic franchit une étape vers la bourse avec un dépôt S-1 confidentiel à la SEC, tandis qu’une vague “Physical AI” déferle simultanément — NVIDIA Cosmos 3, Cosmos Coalition Runway+NVIDIA, Luma OPAL Lab, MiniMax M3, Qwen-VLA et Qwen3.7-Plus. Dans le même temps, OpenAI déploie Rosalind Biodefense pour la préparation aux pandémies et publie un cadre de gouvernance aligné sur la TFAIA californienne et l’EU AI Act.

Anthropic dépose confidentiellement un formulaire S-1 auprès de la SEC

1er juin — Anthropic a déposé confidentiellement un projet d’enregistrement sur formulaire S-1 auprès de la Commission américaine des valeurs mobilières et des changes (SEC), en vue d’une introduction en bourse (IPO) de ses actions ordinaires. Ce dépôt confidentiel est une étape préliminaire obligatoire qui permet à la SEC d’examiner le document avant toute offre publique.

Élément	Valeur
Type de dépôt	Formulaire S-1 confidentiel
Régulateur	SEC (États-Unis)
Type d’action	Actions ordinaires
Prix / nombre d’actions	Non encore fixés
Statut légal	Dépôt préliminaire — pas une offre de vente
Date	1er juin 2026

L’annonce précise qu’Anthropic conserve l’option de s’introduire en bourse une fois l’examen de la SEC terminé, mais que l’opération finale dépendra des conditions de marché et d’autres facteurs. Ce dépôt S-1 intervient dans la continuité directe de la clôture de la Série H (65 milliards USD, valorisation post-money de 965 milliards USD) et d’un chiffre d’affaires annualisé qui aurait dépassé 47 milliards USD à la mi-mai 2026.

Anthropic reste une société à mission publique (PBC — Public Benefit Corporation), statut qu’elle entend conserver après une éventuelle cotation — une distinction légale rare qui impose des obligations d’intérêt public en complément de la recherche de profit.

🔗 Annonce officielle — Anthropic

NVIDIA Cosmos 3 — premier omni-modèle open-source pour Physical AI

1er juin — NVIDIA lance Cosmos 3, le premier omni-modèle entièrement ouvert pour l’IA physique. Il unifie langage, image, vidéo, audio et génération d’actions dans un seul modèle — une première mondiale.

Variante	Paramètres	Disponibilité
Cosmos 3 Super	32B	Open-source dès le lancement
Cosmos 3 Nano	8B	Open-source dès le lancement

Le modèle intègre nativement le raisonnement visuel (native vision reasoning), la génération de mondes (world generation) et la génération d’actions (action generation). Selon Artificial Analysis, Cosmos 3 se classe immédiatement #1 parmi les modèles open-weight en génération texte-vers-image et image-vers-vidéo dès le jour du lancement. Les poids sont disponibles sur Hugging Face et NVIDIA NGC.

“Introducing Cosmos 3: Our latest frontier model for Physical AI. Cosmos 3 is the world’s first fully open omnimodel with native vision reasoning, world and action generation.”

🇫🇷 NVIDIA présente Cosmos 3 : son dernier modèle frontier pour l’IA physique. Cosmos 3 est le premier omni-modèle entièrement ouvert au monde, avec raisonnement visuel natif, génération de mondes et génération d’actions. — @NVIDIAAI sur X

Cosmos Coalition — Runway + NVIDIA, initiative mondiale pour les world models

1er juin — Runway rejoint NVIDIA comme membre fondateur de la Cosmos Coalition, une initiative mondiale réunissant des laboratoires d’IA de premier plan pour construire et rendre accessibles en open-source des world models frontier pour l’IA physique.

L’objectif est de créer un écosystème ouvert commun permettant à tout groupe de recherche ou d’industrie d’utiliser, modifier et assembler ces modèles pour des systèmes de travail productif. La coalition intègre également des partenariats avec des fabricants de puces et de matériel.

“Introducing the Cosmos Coalition. A new global initiative with NVIDIA and leading AI labs to build and open-source frontier world models for physical AI.”

🇫🇷 Présentation de la Cosmos Coalition. Une nouvelle initiative mondiale avec NVIDIA et les principaux laboratoires d’IA pour construire et rendre open-source des world models frontier pour l’IA physique. — @runwayml sur X

Ce lancement coordonné avec Cosmos 3 marque un tournant stratégique : NVIDIA positionne l’IA physique open-source comme un enjeu de souveraineté technologique mondial, face à la concentration des ressources chez quelques acteurs fermés.

MiniMax M3 — premier open-weight à combiner coding frontier, multimodalité et contexte 1M

1er juin — MiniMax lance M3, le premier modèle open-weight combinant trois capacités frontier simultanément. Avec 1,7 million de vues en quelques heures, c’est l’un des lancements open-source les plus suivis de l’année.

Capacité	Détail
Coding & Agentic frontier	59,0% SWE-Bench Pro, 66,0% Terminal Bench 2.1
Contexte 1M tokens	MiniMax Sparse Attention
Multimodalité native	Dès l’étape zéro de l’entraînement

Benchmarks complets :

Benchmark	Score
SWE-Bench Pro	59,0%
Terminal Bench 2.1	66,0%
SWE-fficiency	34,8%
KernelBench Hard	28,8%
MCP Atlas	74,2%
BU Bench (browser use)	+26% vs précédent

M3 est conçu nativement pour les agents informatiques (computer-use agents) et les workflows agentiques de longue durée. Les poids et le rapport technique seront publiés dans environ 10 jours depuis le lancement. Un IDE dédié, MiniMax Code, est lancé simultanément, accessible sur code.minimax.io. Les partenaires de lancement de premier jour incluent Qubrid AI (infrastructure cloud GPU) et Simular (agents autonomes).

🔗 Annonce MiniMax M3

Luma OPAL Lab — laboratoire ouvert de Physical AI pour la robotique généraliste

1er juin — Luma annonce la création de l’OPAL Lab (Open Science Physical AI Lab), un laboratoire de recherche ouverte dédié à la généralisation en robotique.

Le fondateur Amit (@gravicle) identifie le problème central de l’IA physique actuelle : contrairement aux grands modèles de langage capables de généraliser sur des tâches inédites, les robots ne peuvent que reproduire des tâches spécifiques dans des environnements spécifiques. La robotique souffre d’un manque de données créant une crise de généralisation.

“We are launching Open Physical AI Lab at Luma to solve generalization in robotics. We believe general physical AI is the most consequential problem to solve to improve life on Earth.”

🇫🇷 Nous lançons l’Open Physical AI Lab chez Luma pour résoudre le problème de généralisation en robotique. Nous pensons que l’IA physique généraliste est le problème le plus crucial à résoudre pour améliorer la vie sur Terre. — @gravicle sur X

Luma s’appuie sur 4 ans de recherche fondamentale en IA multimodale (3D, image, vidéo, génération unifiée) et sur une infrastructure de traitement de données multimodales à l’échelle internet. Les principes de l’OPAL Lab : science ouverte, méthodes et substrats disponibles à tous, collaboration avec l’académie, partenariats industriels, et évaluations de sécurité. Le message est explicitement politique : concentrer l’infrastructure d’intelligence physique mondiale entre les mains d’un petit nombre d’entreprises représente une menace profonde pour l’humanité.

🔗 Annonce OPAL Lab

Qwen3.7-Plus — agent multimodal d’Alibaba avec vision, coding et contexte long

1er juin — Alibaba Tongyi Lab publie Qwen3.7-Plus, son modèle agent multimodal le plus avancé. Construit sur le backbone texte de Qwen3.7, il fusionne vision et langage dans une fondation agent unique et polyvalente.

Benchmarks clés :

Benchmark	Qwen3.7-Plus	GPT-5.4	Claude Opus 4.6 Max	Gemini 3.1 Pro
Terminal Bench 2.0	70,3	—	65,4	—
SWE-bench Verified	77,7	—	80,8	—
GPQA Diamond	90,3	—	91,3	—
ScreenSpot Pro	79,0	67,4	49,5	68,1
AndroidWorld	81,0	—	62,0	70,7
BabyVision	70,4	53,1	12,6	55,9

Quatre capacités principales : agent hybride GUI+CLI (perçoit les écrans, navigue dans les applications), assistant de codage et productivité multimodale (de la maquette frontend à l’ingénierie complexe), agent visuel (perception, raisonnement, localisation et questions-réponses enrichies par recherche web), et généralisation multi-environnement via Claude Code, OpenClaw, Qwen Code ou tout autre environnement d’agents.

Disponibilité : Alibaba Cloud Model Studio, API compatible OpenAI et protocole Anthropic (utilisable directement avec Claude Code via ANTHROPIC_BASE_URL).

🔗 Blog Qwen3.7-Plus

Rosalind Biodefense — OpenAI ouvre GPT-Rosalind à la biologie défensive

29 mai — OpenAI annonce deux initiatives majeures autour de la biologie défensive, en s’appuyant sur GPT-Rosalind, son modèle de raisonnement dédié aux sciences du vivant.

Organisation	Domaine	Type
Fourth Eon	Criblage biosécuritaire, synthèse d’ADN	Développeur Rosalind Biodefense
SecureDNA	Sécurité biologique	Développeur Rosalind Biodefense
Lawrence Livermore National Laboratory	Contre-mesures médicales	Partenaire gouvernemental
Johns Hopkins APL	Ingénierie de protéines, thérapeutiques	Partenaire gouvernemental
CEPI	Vaccins pandémiques, réponse Ebola	Partenaire gouvernemental

Rosalind Biodefense est un programme de développement ouvert aux institutions académiques, organisations à but non lucratif, entreprises à mission défensive et équipes gouvernementales. OpenAI finance l’accès à GPT-Rosalind et accompagne les projets sur la modélisation épidémiologique, la détection précoce, le dépistage, la préparation aux pandémies et les contre-mesures médicales.

“Advances in biology can strengthen our ability to prevent, detect, and respond to biological threats. Our goal is to help build a more robust ecosystem — giving trusted defenders frontier AI to develop and operate new defenses for public health and biodefense.”

🇫🇷 Les avancées en biologie peuvent renforcer notre capacité à prévenir, détecter et répondre aux menaces biologiques. Notre objectif est d’aider à construire un écosystème plus robuste — en donnant aux défenseurs de confiance une IA frontière pour développer et opérer de nouvelles défenses pour la santé publique et la biodéfense. — @OpenAI sur X

L’accès élargi à GPT-Rosalind pour les partenaires gouvernementaux américains et alliés est annoncé simultanément, avec des bénéficiaires comme la CEPI dans le cadre de sa mission “100 Days” d’accélération des vaccins — y compris la réponse à l’épidémie d’Ebola en cours.

🔗 Rosalind Biodefense — OpenAI

Claude Code v2.1.153 à v2.1.159 — cinq mises à jour post-28 mai

29 mai – 1er juin — Anthropic publie cinq versions de Claude Code dans les jours suivant le lancement d’Opus 4.8.

Version	Points clés
2.1.153	Option `skipLfs` pour marketplace, `claude doctor` amélioré, correctifs MCP/agents macOS/Windows
2.1.156	Correctif critique — thinking blocks Opus 4.8 provoquaient des erreurs API
2.1.157	Plugins auto-chargés depuis `.claude/skills/`, commande `plugin init`, `EnterWorktree` mid-session
2.1.158	Auto Mode sur Bedrock, Vertex et Foundry pour Opus 4.7 et Opus 4.8 (`CLAUDE_CODE_ENABLE_AUTO_MODE=1`)
2.1.159	Infrastructure interne, aucun changement visible

La version 2.1.157 est la plus notable : les plugins placés dans .claude/skills/ sont désormais chargés automatiquement sans passer par le marketplace, et EnterWorktree peut basculer entre worktrees gérés par Claude en cours de session. La version 2.1.158 apporte Auto Mode sur les plateformes cloud majeures, renforçant le déploiement enterprise de Claude Code.

🔗 Releases Claude Code

Gemini 3.5 Flash et Gemini Omni en disponibilité générale

29 mai — Google marque la disponibilité générale (general availability) de Gemini 3.5 Flash via 9 démonstrations vidéo couvrant Gemini Omni et Gemini 3.5 Flash en action.

Déploiement Gemini 3.5 Flash : modèle par défaut dans l’application Gemini et dans AI Mode de Search (mondial), disponible via Google Antigravity, l’API Gemini dans Google AI Studio, Android Studio, Gemini Enterprise Agent Platform et Gemini Enterprise.

Gemini Spark : l’agent IA personnel 24h/24 alimenté par Gemini 3.5, désormais disponible pour tous les abonnés Google AI Ultra aux États-Unis, intégré à Gmail, Docs, Slides et Workspace.

Gemini Omni Flash : déployé pour les abonnés Google AI Plus, Pro et Ultra dans l’application Gemini et Google Flow ; disponible sans frais pour les utilisateurs de YouTube Shorts et YouTube Create App ; déploiement API développeurs prévu dans les semaines suivantes.

🔗 Démonstrations Gemini Omni et 3.5 Flash

Qwen-VLA — agent robotique vision-langage-action pour 11 types de robots

29 mai — Tongyi Lab publie Qwen-VLA, un modèle Vision-Language-Action (VLA) unifié pour l’intelligence incarnée générale (general embodied intelligence).

Architecture : Qwen3.5-4B (backbone langage-vision) + décodeur DiT 1,15B pour produire des actions directement depuis la perception visuelle et le langage naturel. Le modèle unifie manipulation d’objets, navigation dans l’espace et prédiction de trajectoire dans un seul cadre.

Grâce aux prompts avec conscience de l’incarnation (embodiment-aware prompts), le même modèle fonctionne sur 11 types d’incarnations robotiques — bras unique, double bras et plateformes humanoïdes — sans têtes de politique (policy heads) ni architectures spécifiques à chaque tâche. Le tweet a généré 3,1 millions de vues en deux jours, signe de l’intérêt majeur de la communauté robotique.

🔗 Qwen-VLA sur X

Copilot — l’API de métriques ajoute des cohortes d’adoption IA

29 mai — GitHub enrichit l’API de métriques d’utilisation Copilot avec un système de cohortes d’adoption IA. Chaque utilisateur actif est classé dans l’une des quatre phases suivantes, calculées sur une fenêtre glissante de 28 jours :

Phase	Nom	Critère
0	No cohort	Pas d’engagement suffisant
1	Code first	Complétion de code et/ou mode agent IDE
2	Agent first	Une surface agent GitHub (cloud agent, code review, CLI)
3	Multi-agent	Deux surfaces agent ou plus, ou l’app GitHub Copilot

Les métriques exposées par phase : utilisateurs actifs, interactions, génération et acceptation de code, lignes ajoutées/supprimées, pull requests créées/mergées/reviewées, délai médian de merge. Accessible aux administrateurs enterprise et propriétaires d’organisation. Ce système permet de mesurer la maturité réelle d’adoption de Copilot et de suivre la progression des développeurs vers des usages agentiques avancés.

🔗 Changelog GitHub — Copilot usage metrics API

ElevenLabs signe un MOU avec le gouvernement de Grèce

28 mai — ElevenLabs signe un mémorandum d’entente avec le gouvernement grec, en présence du Premier ministre (@PrimeministerGR) et du ministre de la Transformation numérique (@papastergiougr), pour trois axes : améliorer l’accès aux services publics via l’IA vocale, promouvoir le tourisme, et préserver le patrimoine linguistique grec. Ce partenariat gouvernemental illustre la stratégie d’ElevenLabs pour s’implanter dans le secteur public européen, en misant sur des usages institutionnels à haute visibilité.

🔗 Annonce ElevenLabs

Frontier Governance Framework — OpenAI aligne ses pratiques sur la TFAIA et l’EU AI Act

28 mai — OpenAI publie son Frontier Governance Framework, un document de gouvernance publique qui traduit le Preparedness Framework interne en obligations réglementaires concrètes. La cible principale : la Transparency in Frontier AI Act (TFAIA) de Californie et le Code de pratique pour l’IA à usage général de l’EU AI Act.

Le framework couvre l’évaluation et l’atténuation des risques dans les domaines cyberoffensifs, CBRN (chimiques, biologiques, radiologiques, nucléaires), manipulation nuisible et perte de contrôle. Il inclut aussi les obligations de signalement des modèles, la gestion des incidents, le recours à des experts externes, et un mécanisme de mise à jour. OpenAI précise que le Preparedness Framework reste son fondement interne — certaines pratiques vont au-delà des exigences légales actuelles.

🔗 Frontier Governance Framework

Guide des évaluations tierces fiables — méthode et cinq biais à contrôler

29 mai — OpenAI publie un guide méthodologique pour des évaluations tierces rigoureuses des modèles IA frontière. Le document part d’un constat : les évaluations conçues à l’origine pour des chatbots ne sont plus adaptées aux systèmes agentiques capables d’utiliser des outils et d’agir sur des trajectoires longues.

Le guide distingue trois types de revendications que les évaluations doivent supporter : l’élicitation de capacités (ce que le modèle peut faire dans les meilleures conditions), la robustesse des protections (résistance aux attaques), et la comparaison entre systèmes. Un concept central est le “harness” (environnement d’exécution autour du modèle), dont les choix peuvent matériellement changer les résultats — OpenAI cite l’impact de la compaction de contexte sur les performances de GPT-5.5 dans des évaluations cyber multi-étapes.

Cinq biais de validité sont identifiés : reward hacking (exploitation de raccourcis), refus masquant les capacités réelles, contamination (mémorisation des benchmarks), problèmes cassés (tâches impossibles ou mal notées), et sandbagging (sous-performance délibérée lors d’évaluations détectées). OpenAI s’engage à fournir des instructions d’élicitation maximale aux évaluateurs tiers et à partager les traces de raisonnement.

🔗 Guide des évaluations tierces — OpenAI

Grok Imagine Extend — extension de vidéo continue

29 mai — Grok Imagine lance Extend, une fonctionnalité permettant de créer des vidéos continues avec transitions fluides à partir d’une vidéo ou d’images existantes. La fonctionnalité est disponible directement dans l’interface Grok Imagine. Le tweet du compte @imagine a été reposté par @grok et a atteint 701 000 vues. Cette annonce consolide la suite créative de Grok aux côtés de Grok Build et de l’API grok-build-0.1.

🔗 Grok Imagine Extend

Codex Computer Use sur Windows et pilotage mobile

29 mai — OpenAI annonce que la fonctionnalité “computer use” de Codex est désormais disponible sur Windows. L’agent peut voir l’écran, cliquer et saisir du texte dans les applications Windows, ouvrant la voie aux tests natifs, aux flux sur simulateur et aux corrections de bugs accessibles uniquement via interface graphique. L’application mobile ChatGPT intègre simultanément le support Windows pour Codex : lancement, suivi et pilotage des tâches depuis le téléphone pendant que le travail se poursuit sur PC. OpenAI qualifie cette fonctionnalité d’« expérience précoce » ; elle n’est pas disponible dans l’Espace économique européen, au Royaume-Uni ni en Suisse.

🔗 Codex Computer Use sur Windows

Brèves

Salesforce + Claude Code — Boris Cherny (@bcherny) partage un témoignage Salesforce sur l’usage agentique de Claude Code : une migration initialement estimée à 231 jours livrée en 13, 21 endpoints à 100% de couverture de tests, et une baisse de 5% des incidents malgré une augmentation du volume de PRs. 🔗 source
Google I/O 2026 — making-of IA — Google détaille comment ses équipes ont utilisé Gemini Omni, Nano Banana, Lyria 3 et Antigravity pour produire les expériences créatives de Google I/O 2026 : court-métrage d’animation, identité visuelle, pré-show musical interactif, jeux génératifs. 🔗 source
Gemini CLI v0.44.0 — Mode Auto unifié (fusion des modes spécialisés), support natif de Sublime Text et Emacs Client, nouveaux outils de test TUI programmatiques. 🔗 source
GitHub Copilot — modèles en évaluation dans le mode auto — Les utilisateurs individuels (Free, Pro, Pro+) ont désormais accès aux modèles pré-GA via la sélection automatique auto. Option de désactivation disponible dans les paramètres. 🔗 source
ElevenLabs Summit Varsovie — Preview du modèle vocal le plus expressif jamais développé par ElevenLabs, dévoilé par le co-fondateur Mati. Il s’agit d’une preview uniquement, sans accès public annoncé. 🔗 source
Cohere Command A+ — benchmarks de traduction — Command A+ dépasse Mistral Medium 3.5, DeepSeek, gpt-oss et Claude Opus 4.6 sur WMT24++, ainsi que Google Translate. Gains documentés : +2,4 pts en français, +1,9 pts en espagnol, +0,9 pts en allemand. 🔗 source

Ce que ça signifie

La dynamique financière d’Anthropic et la consolidation du secteur. Le dépôt S-1 confidentiel d’Anthropic est la nouvelle la plus structurante de la semaine. Il intervient dans un contexte de croissance extraordinaire — 65 milliards USD levés en Série H, valorisation proche du billion — et signale que les grandes entreprises d’IA frontière commencent à envisager sérieusement les marchés publics. La conservation du statut PBC (Public Benefit Corporation) est un engagement fort : Anthropic cherche à prouver qu’une introduction en bourse est compatible avec une mission de sécurité à long terme. Ce précédent aura des implications pour OpenAI et d’autres acteurs qui pourraient suivre ce chemin.

La vague Physical AI — vers une IA qui agit dans le monde réel. Le 1er juin marque une convergence remarquable autour de l’IA physique : NVIDIA Cosmos 3 (premier omni-modèle open-weight pour robots et agents), Cosmos Coalition (écosystème ouvert Runway+NVIDIA), Luma OPAL Lab (recherche ouverte sur la généralisation robotique), MiniMax M3 (contexte 1M + multimodalité native), Qwen-VLA (11 types de robots sous une architecture unifiée) et Qwen3.7-Plus (agent GUI+CLI en action dans les interfaces). Cette grappe n’est pas une coïncidence — elle reflète un consensus croissant que la prochaine frontière de l’IA est l’action dans l’espace physique, et que l’open-source y joue un rôle central. La compétition s’intensifie entre modèles fermés et ouverts, notamment dans les benchmarks de robotique et de computer use.

La gouvernance et la sécurité IA entrent dans le droit positif. La publication du Frontier Governance Framework d’OpenAI, aligné sur la TFAIA californienne et l’EU AI Act, et celle du guide des évaluations tierces marquent une étape : les grandes entreprises d’IA ne définissent plus leurs règles uniquement en interne. Elles les alignent sur des législations concrètes et publient leurs méthodologies d’évaluation. L’initiative Rosalind Biodefense illustre l’autre face de cette gouvernance — mettre l’IA frontière au service de la défense sociale (préparation aux pandémies, biosécurité), avec des contrôles adaptés.

L’outillage développeur s’accélère et se fragmente. Claude Code reçoit cinq versions en quatre jours, dont l’Auto Mode sur Bedrock/Vertex/Foundry et le chargement automatique des plugins locaux. Gemini CLI v0.44.0 unifie son mode Auto et étend les intégrations IDE. GitHub Copilot affine sa taxonomie d’adoption (4 phases, fenêtre 28 jours) pour aider les organisations à mesurer la maturité réelle de leur adoption IA. Les développeurs disposent désormais d’un outillage agentique dense et en rapide évolution — la question n’est plus l’accès aux modèles, mais la capacité des équipes à intégrer ces outils dans leurs flux de travail de façon cohérente et mesurable.