Rechercher

Anthropic dépose son dossier d'IPO, NVIDIA lance Cosmos 3, MiniMax M3 et Qwen3.7-Plus

Anthropic dépose son dossier d'IPO, NVIDIA lance Cosmos 3, MiniMax M3 et Qwen3.7-Plus

Le 1er juin 2026 restera comme l’une des journées les plus denses de l’histoire récente de l’IA : Anthropic franchit une étape vers la bourse avec un dépôt S-1 confidentiel à la SEC, tandis qu’une vague “Physical AI” déferle simultanément — NVIDIA Cosmos 3, Cosmos Coalition Runway+NVIDIA, Luma OPAL Lab, MiniMax M3, Qwen-VLA et Qwen3.7-Plus. Dans le même temps, OpenAI déploie Rosalind Biodefense pour la préparation aux pandémies et publie un cadre de gouvernance aligné sur la TFAIA californienne et l’EU AI Act.


Anthropic dépose confidentiellement un formulaire S-1 auprès de la SEC

1er juin — Anthropic a déposé confidentiellement un projet d’enregistrement sur formulaire S-1 auprès de la Commission américaine des valeurs mobilières et des changes (SEC), en vue d’une introduction en bourse (IPO) de ses actions ordinaires. Ce dépôt confidentiel est une étape préliminaire obligatoire qui permet à la SEC d’examiner le document avant toute offre publique.

ÉlémentValeur
Type de dépôtFormulaire S-1 confidentiel
RégulateurSEC (États-Unis)
Type d’actionActions ordinaires
Prix / nombre d’actionsNon encore fixés
Statut légalDépôt préliminaire — pas une offre de vente
Date1er juin 2026

L’annonce précise qu’Anthropic conserve l’option de s’introduire en bourse une fois l’examen de la SEC terminé, mais que l’opération finale dépendra des conditions de marché et d’autres facteurs. Ce dépôt S-1 intervient dans la continuité directe de la clôture de la Série H (65 milliards USD, valorisation post-money de 965 milliards USD) et d’un chiffre d’affaires annualisé qui aurait dépassé 47 milliards USD à la mi-mai 2026.

Anthropic reste une société à mission publique (PBC — Public Benefit Corporation), statut qu’elle entend conserver après une éventuelle cotation — une distinction légale rare qui impose des obligations d’intérêt public en complément de la recherche de profit.

🔗 Annonce officielle — Anthropic


NVIDIA Cosmos 3 — premier omni-modèle open-source pour Physical AI

1er juin — NVIDIA lance Cosmos 3, le premier omni-modèle entièrement ouvert pour l’IA physique. Il unifie langage, image, vidéo, audio et génération d’actions dans un seul modèle — une première mondiale.

VarianteParamètresDisponibilité
Cosmos 3 Super32BOpen-source dès le lancement
Cosmos 3 Nano8BOpen-source dès le lancement

Le modèle intègre nativement le raisonnement visuel (native vision reasoning), la génération de mondes (world generation) et la génération d’actions (action generation). Selon Artificial Analysis, Cosmos 3 se classe immédiatement #1 parmi les modèles open-weight en génération texte-vers-image et image-vers-vidéo dès le jour du lancement. Les poids sont disponibles sur Hugging Face et NVIDIA NGC.

“Introducing Cosmos 3: Our latest frontier model for Physical AI. Cosmos 3 is the world’s first fully open omnimodel with native vision reasoning, world and action generation.”

🇫🇷 NVIDIA présente Cosmos 3 : son dernier modèle frontier pour l’IA physique. Cosmos 3 est le premier omni-modèle entièrement ouvert au monde, avec raisonnement visuel natif, génération de mondes et génération d’actions.@NVIDIAAI sur X


Cosmos Coalition — Runway + NVIDIA, initiative mondiale pour les world models

1er juin — Runway rejoint NVIDIA comme membre fondateur de la Cosmos Coalition, une initiative mondiale réunissant des laboratoires d’IA de premier plan pour construire et rendre accessibles en open-source des world models frontier pour l’IA physique.

L’objectif est de créer un écosystème ouvert commun permettant à tout groupe de recherche ou d’industrie d’utiliser, modifier et assembler ces modèles pour des systèmes de travail productif. La coalition intègre également des partenariats avec des fabricants de puces et de matériel.

“Introducing the Cosmos Coalition. A new global initiative with NVIDIA and leading AI labs to build and open-source frontier world models for physical AI.”

🇫🇷 Présentation de la Cosmos Coalition. Une nouvelle initiative mondiale avec NVIDIA et les principaux laboratoires d’IA pour construire et rendre open-source des world models frontier pour l’IA physique.@runwayml sur X

Ce lancement coordonné avec Cosmos 3 marque un tournant stratégique : NVIDIA positionne l’IA physique open-source comme un enjeu de souveraineté technologique mondial, face à la concentration des ressources chez quelques acteurs fermés.


MiniMax M3 — premier open-weight à combiner coding frontier, multimodalité et contexte 1M

1er juin — MiniMax lance M3, le premier modèle open-weight combinant trois capacités frontier simultanément. Avec 1,7 million de vues en quelques heures, c’est l’un des lancements open-source les plus suivis de l’année.

CapacitéDétail
Coding & Agentic frontier59,0% SWE-Bench Pro, 66,0% Terminal Bench 2.1
Contexte 1M tokensMiniMax Sparse Attention
Multimodalité nativeDès l’étape zéro de l’entraînement

Benchmarks complets :

BenchmarkScore
SWE-Bench Pro59,0%
Terminal Bench 2.166,0%
SWE-fficiency34,8%
KernelBench Hard28,8%
MCP Atlas74,2%
BU Bench (browser use)+26% vs précédent

M3 est conçu nativement pour les agents informatiques (computer-use agents) et les workflows agentiques de longue durée. Les poids et le rapport technique seront publiés dans environ 10 jours depuis le lancement. Un IDE dédié, MiniMax Code, est lancé simultanément, accessible sur code.minimax.io. Les partenaires de lancement de premier jour incluent Qubrid AI (infrastructure cloud GPU) et Simular (agents autonomes).

🔗 Annonce MiniMax M3


Luma OPAL Lab — laboratoire ouvert de Physical AI pour la robotique généraliste

1er juin — Luma annonce la création de l’OPAL Lab (Open Science Physical AI Lab), un laboratoire de recherche ouverte dédié à la généralisation en robotique.

Le fondateur Amit (@gravicle) identifie le problème central de l’IA physique actuelle : contrairement aux grands modèles de langage capables de généraliser sur des tâches inédites, les robots ne peuvent que reproduire des tâches spécifiques dans des environnements spécifiques. La robotique souffre d’un manque de données créant une crise de généralisation.

“We are launching Open Physical AI Lab at Luma to solve generalization in robotics. We believe general physical AI is the most consequential problem to solve to improve life on Earth.”

🇫🇷 Nous lançons l’Open Physical AI Lab chez Luma pour résoudre le problème de généralisation en robotique. Nous pensons que l’IA physique généraliste est le problème le plus crucial à résoudre pour améliorer la vie sur Terre.@gravicle sur X

Luma s’appuie sur 4 ans de recherche fondamentale en IA multimodale (3D, image, vidéo, génération unifiée) et sur une infrastructure de traitement de données multimodales à l’échelle internet. Les principes de l’OPAL Lab : science ouverte, méthodes et substrats disponibles à tous, collaboration avec l’académie, partenariats industriels, et évaluations de sécurité. Le message est explicitement politique : concentrer l’infrastructure d’intelligence physique mondiale entre les mains d’un petit nombre d’entreprises représente une menace profonde pour l’humanité.

🔗 Annonce OPAL Lab


Qwen3.7-Plus — agent multimodal d’Alibaba avec vision, coding et contexte long

1er juin — Alibaba Tongyi Lab publie Qwen3.7-Plus, son modèle agent multimodal le plus avancé. Construit sur le backbone texte de Qwen3.7, il fusionne vision et langage dans une fondation agent unique et polyvalente.

Benchmarks clés :

BenchmarkQwen3.7-PlusGPT-5.4Claude Opus 4.6 MaxGemini 3.1 Pro
Terminal Bench 2.070,365,4
SWE-bench Verified77,780,8
GPQA Diamond90,391,3
ScreenSpot Pro79,067,449,568,1
AndroidWorld81,062,070,7
BabyVision70,453,112,655,9

Quatre capacités principales : agent hybride GUI+CLI (perçoit les écrans, navigue dans les applications), assistant de codage et productivité multimodale (de la maquette frontend à l’ingénierie complexe), agent visuel (perception, raisonnement, localisation et questions-réponses enrichies par recherche web), et généralisation multi-environnement via Claude Code, OpenClaw, Qwen Code ou tout autre environnement d’agents.

Disponibilité : Alibaba Cloud Model Studio, API compatible OpenAI et protocole Anthropic (utilisable directement avec Claude Code via ANTHROPIC_BASE_URL).

🔗 Blog Qwen3.7-Plus


Rosalind Biodefense — OpenAI ouvre GPT-Rosalind à la biologie défensive

29 mai — OpenAI annonce deux initiatives majeures autour de la biologie défensive, en s’appuyant sur GPT-Rosalind, son modèle de raisonnement dédié aux sciences du vivant.

OrganisationDomaineType
Fourth EonCriblage biosécuritaire, synthèse d’ADNDéveloppeur Rosalind Biodefense
SecureDNASécurité biologiqueDéveloppeur Rosalind Biodefense
Lawrence Livermore National LaboratoryContre-mesures médicalesPartenaire gouvernemental
Johns Hopkins APLIngénierie de protéines, thérapeutiquesPartenaire gouvernemental
CEPIVaccins pandémiques, réponse EbolaPartenaire gouvernemental

Rosalind Biodefense est un programme de développement ouvert aux institutions académiques, organisations à but non lucratif, entreprises à mission défensive et équipes gouvernementales. OpenAI finance l’accès à GPT-Rosalind et accompagne les projets sur la modélisation épidémiologique, la détection précoce, le dépistage, la préparation aux pandémies et les contre-mesures médicales.

“Advances in biology can strengthen our ability to prevent, detect, and respond to biological threats. Our goal is to help build a more robust ecosystem — giving trusted defenders frontier AI to develop and operate new defenses for public health and biodefense.”

🇫🇷 Les avancées en biologie peuvent renforcer notre capacité à prévenir, détecter et répondre aux menaces biologiques. Notre objectif est d’aider à construire un écosystème plus robuste — en donnant aux défenseurs de confiance une IA frontière pour développer et opérer de nouvelles défenses pour la santé publique et la biodéfense.@OpenAI sur X

L’accès élargi à GPT-Rosalind pour les partenaires gouvernementaux américains et alliés est annoncé simultanément, avec des bénéficiaires comme la CEPI dans le cadre de sa mission “100 Days” d’accélération des vaccins — y compris la réponse à l’épidémie d’Ebola en cours.

🔗 Rosalind Biodefense — OpenAI


Claude Code v2.1.153 à v2.1.159 — cinq mises à jour post-28 mai

29 mai – 1er juin — Anthropic publie cinq versions de Claude Code dans les jours suivant le lancement d’Opus 4.8.

VersionPoints clés
2.1.153Option skipLfs pour marketplace, claude doctor amélioré, correctifs MCP/agents macOS/Windows
2.1.156Correctif critique — thinking blocks Opus 4.8 provoquaient des erreurs API
2.1.157Plugins auto-chargés depuis .claude/skills/, commande plugin init, EnterWorktree mid-session
2.1.158Auto Mode sur Bedrock, Vertex et Foundry pour Opus 4.7 et Opus 4.8 (CLAUDE_CODE_ENABLE_AUTO_MODE=1)
2.1.159Infrastructure interne, aucun changement visible

La version 2.1.157 est la plus notable : les plugins placés dans .claude/skills/ sont désormais chargés automatiquement sans passer par le marketplace, et EnterWorktree peut basculer entre worktrees gérés par Claude en cours de session. La version 2.1.158 apporte Auto Mode sur les plateformes cloud majeures, renforçant le déploiement enterprise de Claude Code.

🔗 Releases Claude Code


Gemini 3.5 Flash et Gemini Omni en disponibilité générale

29 mai — Google marque la disponibilité générale (general availability) de Gemini 3.5 Flash via 9 démonstrations vidéo couvrant Gemini Omni et Gemini 3.5 Flash en action.

Déploiement Gemini 3.5 Flash : modèle par défaut dans l’application Gemini et dans AI Mode de Search (mondial), disponible via Google Antigravity, l’API Gemini dans Google AI Studio, Android Studio, Gemini Enterprise Agent Platform et Gemini Enterprise.

Gemini Spark : l’agent IA personnel 24h/24 alimenté par Gemini 3.5, désormais disponible pour tous les abonnés Google AI Ultra aux États-Unis, intégré à Gmail, Docs, Slides et Workspace.

Gemini Omni Flash : déployé pour les abonnés Google AI Plus, Pro et Ultra dans l’application Gemini et Google Flow ; disponible sans frais pour les utilisateurs de YouTube Shorts et YouTube Create App ; déploiement API développeurs prévu dans les semaines suivantes.

🔗 Démonstrations Gemini Omni et 3.5 Flash


Qwen-VLA — agent robotique vision-langage-action pour 11 types de robots

29 mai — Tongyi Lab publie Qwen-VLA, un modèle Vision-Language-Action (VLA) unifié pour l’intelligence incarnée générale (general embodied intelligence).

Architecture : Qwen3.5-4B (backbone langage-vision) + décodeur DiT 1,15B pour produire des actions directement depuis la perception visuelle et le langage naturel. Le modèle unifie manipulation d’objets, navigation dans l’espace et prédiction de trajectoire dans un seul cadre.

Grâce aux prompts avec conscience de l’incarnation (embodiment-aware prompts), le même modèle fonctionne sur 11 types d’incarnations robotiques — bras unique, double bras et plateformes humanoïdes — sans têtes de politique (policy heads) ni architectures spécifiques à chaque tâche. Le tweet a généré 3,1 millions de vues en deux jours, signe de l’intérêt majeur de la communauté robotique.

🔗 Qwen-VLA sur X


Copilot — l’API de métriques ajoute des cohortes d’adoption IA

29 mai — GitHub enrichit l’API de métriques d’utilisation Copilot avec un système de cohortes d’adoption IA. Chaque utilisateur actif est classé dans l’une des quatre phases suivantes, calculées sur une fenêtre glissante de 28 jours :

PhaseNomCritère
0No cohortPas d’engagement suffisant
1Code firstComplétion de code et/ou mode agent IDE
2Agent firstUne surface agent GitHub (cloud agent, code review, CLI)
3Multi-agentDeux surfaces agent ou plus, ou l’app GitHub Copilot

Les métriques exposées par phase : utilisateurs actifs, interactions, génération et acceptation de code, lignes ajoutées/supprimées, pull requests créées/mergées/reviewées, délai médian de merge. Accessible aux administrateurs enterprise et propriétaires d’organisation. Ce système permet de mesurer la maturité réelle d’adoption de Copilot et de suivre la progression des développeurs vers des usages agentiques avancés.

🔗 Changelog GitHub — Copilot usage metrics API


ElevenLabs signe un MOU avec le gouvernement de Grèce

28 mai — ElevenLabs signe un mémorandum d’entente avec le gouvernement grec, en présence du Premier ministre (@PrimeministerGR) et du ministre de la Transformation numérique (@papastergiougr), pour trois axes : améliorer l’accès aux services publics via l’IA vocale, promouvoir le tourisme, et préserver le patrimoine linguistique grec. Ce partenariat gouvernemental illustre la stratégie d’ElevenLabs pour s’implanter dans le secteur public européen, en misant sur des usages institutionnels à haute visibilité.

🔗 Annonce ElevenLabs


Frontier Governance Framework — OpenAI aligne ses pratiques sur la TFAIA et l’EU AI Act

28 mai — OpenAI publie son Frontier Governance Framework, un document de gouvernance publique qui traduit le Preparedness Framework interne en obligations réglementaires concrètes. La cible principale : la Transparency in Frontier AI Act (TFAIA) de Californie et le Code de pratique pour l’IA à usage général de l’EU AI Act.

Le framework couvre l’évaluation et l’atténuation des risques dans les domaines cyberoffensifs, CBRN (chimiques, biologiques, radiologiques, nucléaires), manipulation nuisible et perte de contrôle. Il inclut aussi les obligations de signalement des modèles, la gestion des incidents, le recours à des experts externes, et un mécanisme de mise à jour. OpenAI précise que le Preparedness Framework reste son fondement interne — certaines pratiques vont au-delà des exigences légales actuelles.

🔗 Frontier Governance Framework


Guide des évaluations tierces fiables — méthode et cinq biais à contrôler

29 mai — OpenAI publie un guide méthodologique pour des évaluations tierces rigoureuses des modèles IA frontière. Le document part d’un constat : les évaluations conçues à l’origine pour des chatbots ne sont plus adaptées aux systèmes agentiques capables d’utiliser des outils et d’agir sur des trajectoires longues.

Le guide distingue trois types de revendications que les évaluations doivent supporter : l’élicitation de capacités (ce que le modèle peut faire dans les meilleures conditions), la robustesse des protections (résistance aux attaques), et la comparaison entre systèmes. Un concept central est le “harness” (environnement d’exécution autour du modèle), dont les choix peuvent matériellement changer les résultats — OpenAI cite l’impact de la compaction de contexte sur les performances de GPT-5.5 dans des évaluations cyber multi-étapes.

Cinq biais de validité sont identifiés : reward hacking (exploitation de raccourcis), refus masquant les capacités réelles, contamination (mémorisation des benchmarks), problèmes cassés (tâches impossibles ou mal notées), et sandbagging (sous-performance délibérée lors d’évaluations détectées). OpenAI s’engage à fournir des instructions d’élicitation maximale aux évaluateurs tiers et à partager les traces de raisonnement.

🔗 Guide des évaluations tierces — OpenAI


Grok Imagine Extend — extension de vidéo continue

29 mai — Grok Imagine lance Extend, une fonctionnalité permettant de créer des vidéos continues avec transitions fluides à partir d’une vidéo ou d’images existantes. La fonctionnalité est disponible directement dans l’interface Grok Imagine. Le tweet du compte @imagine a été reposté par @grok et a atteint 701 000 vues. Cette annonce consolide la suite créative de Grok aux côtés de Grok Build et de l’API grok-build-0.1.

🔗 Grok Imagine Extend


Codex Computer Use sur Windows et pilotage mobile

29 mai — OpenAI annonce que la fonctionnalité “computer use” de Codex est désormais disponible sur Windows. L’agent peut voir l’écran, cliquer et saisir du texte dans les applications Windows, ouvrant la voie aux tests natifs, aux flux sur simulateur et aux corrections de bugs accessibles uniquement via interface graphique. L’application mobile ChatGPT intègre simultanément le support Windows pour Codex : lancement, suivi et pilotage des tâches depuis le téléphone pendant que le travail se poursuit sur PC. OpenAI qualifie cette fonctionnalité d’« expérience précoce » ; elle n’est pas disponible dans l’Espace économique européen, au Royaume-Uni ni en Suisse.

🔗 Codex Computer Use sur Windows


Brèves

  • Salesforce + Claude Code — Boris Cherny (@bcherny) partage un témoignage Salesforce sur l’usage agentique de Claude Code : une migration initialement estimée à 231 jours livrée en 13, 21 endpoints à 100% de couverture de tests, et une baisse de 5% des incidents malgré une augmentation du volume de PRs. 🔗 source

  • Google I/O 2026 — making-of IA — Google détaille comment ses équipes ont utilisé Gemini Omni, Nano Banana, Lyria 3 et Antigravity pour produire les expériences créatives de Google I/O 2026 : court-métrage d’animation, identité visuelle, pré-show musical interactif, jeux génératifs. 🔗 source

  • Gemini CLI v0.44.0 — Mode Auto unifié (fusion des modes spécialisés), support natif de Sublime Text et Emacs Client, nouveaux outils de test TUI programmatiques. 🔗 source

  • GitHub Copilot — modèles en évaluation dans le mode auto — Les utilisateurs individuels (Free, Pro, Pro+) ont désormais accès aux modèles pré-GA via la sélection automatique auto. Option de désactivation disponible dans les paramètres. 🔗 source

  • ElevenLabs Summit Varsovie — Preview du modèle vocal le plus expressif jamais développé par ElevenLabs, dévoilé par le co-fondateur Mati. Il s’agit d’une preview uniquement, sans accès public annoncé. 🔗 source

  • Cohere Command A+ — benchmarks de traduction — Command A+ dépasse Mistral Medium 3.5, DeepSeek, gpt-oss et Claude Opus 4.6 sur WMT24++, ainsi que Google Translate. Gains documentés : +2,4 pts en français, +1,9 pts en espagnol, +0,9 pts en allemand. 🔗 source


Ce que ça signifie

La dynamique financière d’Anthropic et la consolidation du secteur. Le dépôt S-1 confidentiel d’Anthropic est la nouvelle la plus structurante de la semaine. Il intervient dans un contexte de croissance extraordinaire — 65 milliards USD levés en Série H, valorisation proche du billion — et signale que les grandes entreprises d’IA frontière commencent à envisager sérieusement les marchés publics. La conservation du statut PBC (Public Benefit Corporation) est un engagement fort : Anthropic cherche à prouver qu’une introduction en bourse est compatible avec une mission de sécurité à long terme. Ce précédent aura des implications pour OpenAI et d’autres acteurs qui pourraient suivre ce chemin.

La vague Physical AI — vers une IA qui agit dans le monde réel. Le 1er juin marque une convergence remarquable autour de l’IA physique : NVIDIA Cosmos 3 (premier omni-modèle open-weight pour robots et agents), Cosmos Coalition (écosystème ouvert Runway+NVIDIA), Luma OPAL Lab (recherche ouverte sur la généralisation robotique), MiniMax M3 (contexte 1M + multimodalité native), Qwen-VLA (11 types de robots sous une architecture unifiée) et Qwen3.7-Plus (agent GUI+CLI en action dans les interfaces). Cette grappe n’est pas une coïncidence — elle reflète un consensus croissant que la prochaine frontière de l’IA est l’action dans l’espace physique, et que l’open-source y joue un rôle central. La compétition s’intensifie entre modèles fermés et ouverts, notamment dans les benchmarks de robotique et de computer use.

La gouvernance et la sécurité IA entrent dans le droit positif. La publication du Frontier Governance Framework d’OpenAI, aligné sur la TFAIA californienne et l’EU AI Act, et celle du guide des évaluations tierces marquent une étape : les grandes entreprises d’IA ne définissent plus leurs règles uniquement en interne. Elles les alignent sur des législations concrètes et publient leurs méthodologies d’évaluation. L’initiative Rosalind Biodefense illustre l’autre face de cette gouvernance — mettre l’IA frontière au service de la défense sociale (préparation aux pandémies, biosécurité), avec des contrôles adaptés.

L’outillage développeur s’accélère et se fragmente. Claude Code reçoit cinq versions en quatre jours, dont l’Auto Mode sur Bedrock/Vertex/Foundry et le chargement automatique des plugins locaux. Gemini CLI v0.44.0 unifie son mode Auto et étend les intégrations IDE. GitHub Copilot affine sa taxonomie d’adoption (4 phases, fenêtre 28 jours) pour aider les organisations à mesurer la maturité réelle de leur adoption IA. Les développeurs disposent désormais d’un outillage agentique dense et en rapide évolution — la question n’est plus l’accès aux modèles, mais la capacité des équipes à intégrer ces outils dans leurs flux de travail de façon cohérente et mesurable.


Sources