Claude Fable 5 et Mythos 5, OpenAI dépose son S-1, Gemini 3.5 Live Translate

Le 9 juin 2026 marque une journée dense : Anthropic lance Claude Fable 5, son premier modèle de la classe Mythos accessible au grand public, accompagné d’une disponibilité générale dans GitHub Copilot. OpenAI révèle avoir soumis un S-1 confidentiel à la SEC tout en publiant sa vision “phase 3”, tandis que Google déploie Gemini 3.5 Live Translate en streaming continu pour 70+ langues. Cohere entre dans l’open-source avec North Mini Code, et Luma lance Ray 3.2 avec contrôle cinématique avancé.

Claude Fable 5 et Mythos 5 : le premier modèle Mythos-class grand public

9 juin — Anthropic lance Claude Fable 5, premier modèle de sa nouvelle classe Mythos rendu accessible publiquement, accompagné de Claude Mythos 5 en accès restreint. La classe Mythos représente un palier au-dessus de la gamme Opus — inaugurée en avril 2026 avec Mythos Preview dans le cadre du projet Glasswing. Fable et Mythos désignent le même modèle sous-jacent : Fable est la version grand public avec garde-fous renforcés, Mythos la version à accès restreint avec certains garde-fous levés.

Performances et benchmarks

Fable 5 revendique l’état de l’art sur quasi tous les benchmarks testés :

Domaine	Résultat notable
Ingénierie logicielle	Migration d’une base Ruby de 50 millions de lignes chez Stripe en 1 jour (contre 2 mois pour une équipe)
Travail analytique	Premier score au Finance Benchmark Hebbia pour le raisonnement senior
Vision	Premier modèle à terminer Pokémon FireRed avec un harnais vision seul
Long contexte / mémoire	Mémoire persistante 3× plus efficace que sur Opus 4.8
Recherche en biologie	Hypothèses scientifiques inédites préférées dans 80 % des comparaisons à l’aveugle
Génomique	Modèle ML personnalisé surpassant un article publié dans Science, avec 100× moins de paramètres

Tarification et disponibilité

Paramètre	Valeur
Prix entrée	$10 / million de tokens
Prix sortie	$50 / million de tokens
ID modèle API	`claude-fable-5`
Disponibilité abonnés (Pro, Max, Team, Enterprise)	Gratuit du 9 au 22 juin 2026
Taux de fallback moyen	< 5 % des sessions

Garde-fous et fallback Opus 4.8

Trois domaines déclenchent un fallback automatique vers Opus 4.8 (l’utilisateur en est informé) plutôt qu’un refus sec :

Cybersécurité : exploitation de vulnérabilités et tâches d’attaque agentique
Biologie et chimie : risques de double usage en recherche avancée
Distillation : tentatives d’extraction des capacités pour entraîner des modèles concurrents

Les SDK Python, TypeScript, Go, Java et C# reçoivent un middleware de fallback côté client pour les fournisseurs API qui ne gèrent pas le fallback serveur. Une rétention de données 30 jours est obligatoire sur tous les trafics pour les modèles Mythos-class (uniquement à des fins de sécurité, suppression garantie après 30 jours).

Disponibilité dans GitHub Copilot

Claude Fable 5 est simultanément lancé en disponibilité générale (generally available) dans GitHub Copilot, accessible aux plans Pro+, Max, Business et Enterprise — dans VS Code, Visual Studio, Copilot CLI, l’agent cloud GitHub, GitHub Mobile et les IDE JetBrains, Xcode, Eclipse. Selon les benchmarks internes de GitHub, Fable 5 réalise un travail équivalent avec moins d’appels d’outils et une consommation de tokens inférieure aux modèles Opus précédents.

Point d’attention : contrairement aux autres modèles Claude dans Copilot (Opus 4.8, Sonnet 4.5, Haiku 4.5 qui fonctionnent sous Zero Data Retention), Claude Fable 5 nécessite la rétention 30 jours pour opérer ses classificateurs de sécurité. Les administrateurs Enterprise/Business doivent activer la politique Claude Fable 5 dans les paramètres Copilot (désactivée par défaut). La facturation s’effectue au tarif fournisseur via le système de facturation à l’usage.

“Fable 5 is the biggest step up I’ve felt in our models since Opus 4.5 back in November. […] It really has this ‘big model smell’ that I haven’t felt before.”

🇫🇷 Fable 5 est la plus grande progression que j’ai ressentie dans nos modèles depuis Opus 4.5 en novembre. […] Il a vraiment ce “parfum grand modèle” que je n’avais jamais ressenti avant. — @bcherny sur X

🔗 Annonce Anthropic · Changelog GitHub Copilot

Claude Code v2.1.169 et v2.1.170 : accès à Fable 5 et mode sans personnalisation

9 juin — Deux nouvelles versions de Claude Code accompagnent le lancement de Fable 5.

v2.1.170 apporte l’accès au modèle : mettre à jour puis utiliser /model claude-fable-5. Un correctif accompagne cette version — les sessions lancées depuis le terminal intégré VS Code ne sauvegardaient plus leurs transcriptions ni n’apparaissaient dans --resume.

v2.1.169 est particulièrement riche en fonctionnalités :

Fonctionnalité	Description
`--safe-mode` / `CLAUDE_CODE_SAFE_MODE`	Démarre Claude Code sans aucune personnalisation (CLAUDE.md, plugins, skills, hooks, serveurs MCP) — idéal pour le débogage
`/cd`	Change le répertoire de travail d’une session sans casser le cache de prompt en milieu de session
`disableBundledSkills`	Cache les skills intégrés, workflows et commandes slash (aussi via `CLAUDE_CODE_DISABLE_BUNDLED_SKILLS`)

Parmi les corrections : navigation correcte dans l’historique pour les commandes longues sur plusieurs lignes, régression claude -p bloqué sur Windows corrigée, politiques MCP entreprise non appliquées à la reconnexion corrigées, et stall UI de 30-50 ms sur macOS éliminé.

🔗 Tweet @ClaudeDevs

OpenAI soumet un S-1 confidentiel à la SEC

8 juin — OpenAI a annoncé avoir soumis confidentiellement un formulaire S-1 à la Securities and Exchange Commission (SEC), première étape formelle vers une introduction en bourse (Initial Public Offering). L’annonce est formulée avec une franchise inhabituelle : anticipant une fuite du document, la société a préféré prendre les devants.

We recently submitted a confidential S-1. We expect it to leak so we’re just announcing it. We have not decided on timing yet; it may be a while because there are things we want to do that are likely easier as a private company. But it’s a complicated set of tradeoffs and this gives us the option to go public sooner if that ends up being best.

🇫🇷 Nous avons récemment soumis un S-1 confidentiel. Nous nous attendions à ce que cela fuite, donc nous l’annonçons nous-mêmes. Nous n’avons pas encore décidé du calendrier ; cela pourrait prendre du temps car certaines choses sont plus faciles à faire en tant qu’entreprise privée. Mais c’est un ensemble complexe de compromis et cela nous donne la possibilité d’entrer en bourse plus tôt si c’est la meilleure option.

— @OpenAINewsroom sur X

Le dépôt confidentiel d’un S-1 permet à une entreprise de préparer une offre publique sans divulguer immédiatement ses informations financières au marché. OpenAI dispose désormais de l’option d’accélérer son introduction en bourse si les conditions le justifient — sans obligation de le faire immédiatement. Cette annonce intervient après la recapitalisation d’octobre 2025, qui avait créé la Fondation OpenAI (entité à but non lucratif) et OpenAI Group PBC (entreprise d’intérêt public), avec une valorisation de la participation non lucrative estimée à 130 milliards de dollars. Le tweet a dépassé 3 millions de vues en moins de 24 heures.

🔗 Annonce officielle OpenAI

OpenAI “Built to benefit everyone” : vision phase 3

8 juin — Sam Altman et Jakub Pachocki (directeur de la recherche et CTO d’OpenAI) co-signent un article de fond décrivant la vision stratégique pour la prochaine période. OpenAI entre dans sa troisième phase : rendre l’IA avancée abondante, abordable, sûre et accessible à tous.

Objectif	Description	Horizon
Chercheur IA automatisé	Système IA capable d’accélérer et d’automatiser la recherche, notamment sur l’alignement	Mars 2028 (fraction significative)
Accélérer l’économie	Productivité scientifique, croissance économique, partage large des gains	En cours
AGI personnel pour tous	Chaque personne sur Terre dispose d’un AGI personnel	Long terme

L’article insiste sur la nécessité d’une coordination internationale et d’un organisme dédié à la sécurité de l’IA de frontière (frontier AI). Sur le rôle humain : “Entirely automating everything is not the future we want. The human role becomes more important: setting direction, making tradeoffs, applying judgment.”

🔗 Article OpenAI

Gemini 3.5 Live Translate : traduction vocale en streaming continu, 70+ langues

9 juin — Google lance Gemini 3.5 Live Translate, modèle audio dédié à la traduction vocale quasi instantanée. Contrairement aux systèmes qui attendent la fin d’une phrase, ce modèle génère la traduction en continu, restant quelques secondes derrière chaque locuteur tout en préservant intonation, rythme et hauteur.

Capacité	Détail
Langues supportées	70+ avec détection automatique
Mode de traitement	Streaming continu (pas de tours de parole)
Préservation vocale	Intonation, rythme et hauteur maintenus
Robustesse	Gestion des environnements bruyants

Disponibilité : API Gemini Live et Google AI Studio en préversion publique pour les développeurs ; préversion privée dans Google Meet ce mois-ci (déploiement élargi en fin d’année) ; application Google Traduction sur Android et iOS dès maintenant. Un mode écoute (listening mode) sur Android permet de recevoir les traductions directement dans l’écouteur, sans casque. Pour Google Meet, le déploiement portera les langues supportées de 5 à 70+, avec plus de 2 000 combinaisons de langues dans une même réunion. Grab teste déjà le modèle pour les communications conducteurs/passagers (plus de 10 millions d’appels vocaux par mois). Tous les contenus audio générés sont marqués SynthID.

🔗 Blog Google

Cohere North Mini Code : premier modèle de code open-source Apache 2.0

9 juin — Cohere lance North Mini Code, son premier modèle de code open-source, sous licence Apache 2.0. Architecture mixture-of-experts (Mixture of Experts, MoE) à 30 milliards de paramètres total avec seulement 3 milliards actifs simultanément — conception visant l’efficacité et le déploiement souverain.

Paramètre	Valeur
Nom	North-Mini-Code-1.0
Licence	Apache 2.0
Taille totale	30B paramètres
Paramètres actifs	3B
Fenêtre de contexte	256K tokens (64K max génération)
Artificial Analysis Coding Index	33.4
Throughput vs Devstral Small 2	2.8× plus rapide
Avantage inter-token latency	30%
Hardware minimum	1× H100 @ FP8
Disponibilité	HuggingFace, Cohere API, Model Vault, OpenRouter

Le modèle est optimisé pour les workflows agentiques : orchestration de sous-agents, cartographie d’architecture système, revues de code et tâches terminal. Selon Cohere, l’objectif est de démontrer qu’une IA souveraine de classe mondiale peut être construite et déployée de façon indépendante.

Cohere × Gouvernement du Québec — IA souveraine canadienne

Le même jour, Aidan Gomez (CEO Cohere) annonce un partenariat avec le gouvernement du Québec pour déployer une IA sécurisée et souveraine au service des citoyens canadiens. Ce partenariat gouvernemental est distinct du partenariat Mila annoncé en mai 2026 pour l’avancement du français québécois dans l’IA.

“C’est une étape importante pour montrer comment une IA de classe mondiale peut être construite au Canada, adoptée au Canada et utilisée pour améliorer les services publics dont les citoyens dépendent chaque jour.” — Aidan Gomez sur X

🔗 Blog Cohere — North Mini Code

Luma Ray 3.2 : keyframes multiples et transfert d’expression faciale

9 juin — Luma AI lance Ray 3.2, nouvelle version de son modèle de génération vidéo, centrée sur le contrôle cinématique de précision.

Fonctionnalité	Description
Keyframes multiples	Contrôle précis de la cohérence temporelle — modèle le plus fidèle aux contrôles par keyframes
Transfert d’expression faciale	Précision élevée en mode vidéo-à-vidéo
API cinématique	Intégration directe dans des produits tiers (`lumalabs.ai/api`)
Intégration Figma Weave	Disponible au lancement dans Figma Weave

Le modèle est accessible dès maintenant sur lumalabs.ai/ray3-2. L’API cible les productions à grande échelle : rendu cinématique accessible directement depuis les outils de design.

🔗 Tweet Luma Labs

Claude pour le framework Apple Foundation Models

8 juin — Anthropic publie un package Swift permettant aux développeurs Apple d’intégrer Claude dans le framework Foundation Models d’Apple, compatible iOS 27, iPadOS 27, macOS 27, visionOS 27 et watchOS 27.

Le framework Foundation Models gère les tâches locales rapides (résumé, extraction). Le nouveau package permet un transfert (hand off) fluide vers Claude lorsque la tâche nécessite un raisonnement multi-étapes, génération de code, recherche web en temps réel ou analyse de données. L’expérience reste continue pour l’utilisateur : le framework Apple gère les entrées typées Swift (via @Generable), puis Claude répond en streaming dans la même vue SwiftUI. Disponible dès le 9 juin via une clé API Anthropic.

🔗 Blog Anthropic

Sécurité pour agents tiers dans GitHub (CodeQL, Advisory DB, secret scanning)

9 juin — La validation de sécurité automatique est désormais en disponibilité générale pour les agents de codage tiers (Claude, OpenAI Codex) qui travaillent directement dans les dépôts GitHub. Le code généré bénéficie des mêmes contrôles que GitHub Copilot cloud agent : analyse CodeQL, vérification contre la GitHub Advisory Database, et détection de secrets exposés. Activé par défaut, sans licence GitHub Advanced Security requise. Depuis octobre 2025, ce mécanisme a “proactivement prévenu des centaines de fuites de sécurité potentielles et de vulnérabilités”.

🔗 Changelog GitHub

Genspark Skills : outils IA réutilisables par équipes

9 juin — Genspark lance Skills, fonctionnalité permettant de créer des outils IA réutilisables dédiés à des tâches spécifiques. Les équipes peuvent construire un Skill depuis un prompt ou en important un Skill existant, le partager en interne, ou puiser dans une bibliothèque communautaire. Disponible dès maintenant sur genspark.ai/skills.

🔗 Tweet Genspark

NVIDIA NVFP4 sur Blackwell : entraînement Llama 3 1.31-1.73× plus rapide que FP8

8 juin — NVIDIA publie la recette d’entraînement NVFP4 pour les GPU Blackwell (GB200 et GB300) via JAX/MaxText, avec des gains allant de 1.31× à 1.73× par rapport au format FP8, sans perte de précision mesurable (écart de 0.026 nats sur la courbe de loss à 10 000 steps — dans le bruit de fond).

Modèle	Hardware	Speedup vs FP8
Llama 3 8B	GB200	1.35×
Llama 3 8B	GB300	1.31×
Llama 3.1 405B	GB200	1.44×
Llama 3.1 405B	GB300	1.73×

Format 4 bits avec micro-blocs de 16 éléments, appliqué uniquement aux couches MLP (l’attention conserve une précision plus élevée). Throughput GEMM : 7× vs FP8 natif sur Hopper.

🔗 NVIDIA Tech Blog

ElevenLabs × Trainline : agents vocaux pour les remboursements ferroviaires

9 juin — ElevenLabs et Trainline (la plus grande plateforme de réservation ferroviaire en Europe, 27 millions de clients) déploient des agents vocaux qui automatisent les remboursements lors d’annulations ou de retards. Les agents s’intègrent directement aux systèmes téléphoniques et de billetterie de Trainline. Ce déploiement s’inscrit dans le mouvement d’expansion d’ElevenLabs au Royaume-Uni, accompagné du MOU signé avec le gouvernement britannique le 8 juin.

🔗 Tweet ElevenLabs

xAI + Gopuff : lancement de l’agent shopping Go

9 juin — Gopuff et SpaceXAI (division commerciale de xAI) lancent Go, assistant shopping multimodal intégré à l’application Gopuff, alimenté par les modèles Grok de texte, audio et image. Personnalisé à partir de 13 ans de données de demande (centaines de millions de commandes), Go construit des paniers personnalisés, génère des scènes photo-réalistes via Grok Imagine et s’appuie sur les signaux temps réel de X et du web. Disponible sur iOS et Android aux États-Unis.

🔗 Annonce xAI

Codex CLI 0.138.0 : handoff vers Desktop et chemins d’images

8 juin — OpenAI publie Codex CLI 0.138.0. Principales nouveautés : transfert (hand off) du fil CLI vers Codex Desktop sur macOS et Windows natif, exposition des chemins de fichiers images locales aux modèles, raccourcis de sélection de l’effort de raisonnement (reasoning effort), et sortie JSON structurée enrichie pour les plugins. Installation : npm install @openai/codex@0.138.0.

🔗 Release GitHub

Responses API OpenAI : résultats d’images dans la recherche web

9 juin — La recherche web dans la Responses API d’OpenAI supporte désormais les résultats d’images en plus du texte, permettant de construire des applications qui affichent des produits avec visuels, des lieux avec photos ou des références visuelles pour l’inspiration.

🔗 Tweet @OpenAIDevs

Perplexity Billion Pound Build : £1M en crédits Computer (UK)

9 juin — Perplexity annonce à la London Tech Week une compétition distincte du Billion Dollar Build américain : le Billion Pound Build, réservé aux équipes britanniques. Prix : £1M en crédits Perplexity Computer. Phase de pitchs ouverte jusqu’au 6 juillet 2026 sur billionpoundbuild.pplx.app.

🔗 Tweet Perplexity

Brèves

Observabilité pour les connecteurs Claude — Anthropic publie de nouvelles fonctionnalités d’observabilité pour les développeurs construisant des connecteurs sur Claude Platform. 🔗 claude.com/blog
NotebookLM dans Gemini App — déploiement 100% en Europe — L’intégration NotebookLM dans l’application Gemini est désormais complètement déployée pour les utilisateurs européens, après son lancement en avril 2026. 🔗 Tweet NotebookLM
GitHub code scanning pour les dépôts inactifs — Les analyses de sécurité planifiées tous les 30 jours s’étendent désormais aux dépôts sans activité depuis 6 mois ou plus, activables depuis les paramètres Advanced Security. 🔗 Changelog GitHub
ElevenLabs nomme Alex Holt Field CTO — Alex Holt rejoint ElevenLabs au poste de Field CTO pour accélérer l’expansion auprès des entreprises et du secteur public britannique. 🔗 Tweet ElevenLabs
Grok devient le moteur voix par défaut de Vapi — xAI s’associe à Vapi pour alimenter les 12 voix principales de la plateforme (2,5M+ agents vocaux), après une évaluation indépendante remportée par Grok Voice. 🔗 Annonce xAI

Ce que ça signifie

Modèles de frontière et open-source : deux stratégies divergentes, une même pression. Le lancement de Claude Fable 5 / Mythos 5 illustre la montée en puissance des modèles de frontière à accès différencié : une version publique avec garde-fous renforcés, une version restreinte pour des usages sensibles (gouvernements, recherche). Simultanément, Cohere entre dans l’open-source avec North Mini Code (Apache 2.0, 30B/3B MoE) — une architecture MoE efficiente qui rivalise directement avec Devstral Small 2 sur les benchmarks de code. Ces deux mouvements opposés (fermeture sécurisée vs ouverture souveraine) témoignent de la maturation du marché : les acteurs positionnent désormais leurs modèles sur des axes distincts plutôt que de s’affronter frontalement.

L’économie de l’IA entre dans une nouvelle ère réglementaire et boursière. Le S-1 confidentiel d’OpenAI n’est pas une introduction en bourse imminente, mais il crée un signal fort : la valorisation, la gouvernance et la structure financière d’OpenAI (avec la Fondation à but non lucratif et OpenAI Group PBC) vont devoir résister à un examen public. Couplé à la vision “phase 3” d’Altman et Pachocki — chercheur IA automatisé d’ici 2028, AGI personnel pour tous — le tableau révèle une organisation qui doit maintenant réconcilier ses ambitions transformatrices avec les obligations de transparence attendues d’une entreprise cotée.

Agents et outillage développeur : Fable 5 comme accélérateur de workflows. La disponibilité de Fable 5 dans GitHub Copilot avec validation de sécurité automatique pour agents tiers (CodeQL, Advisory Database, secret scanning) dessine un écosystème où les agents de codage autonomes sont désormais traités comme des contributeurs à part entière — avec les mêmes contrôles de qualité et sécurité. Les deux versions de Claude Code (v2.1.169/170), le Codex CLI 0.138.0 et les Genspark Skills convergent vers le même objectif : outiller les équipes de développeurs pour capturer des pratiques répétables et les rejouer à l’échelle.

IA souveraine, voix et gouvernance publique. Le partenariat Cohere × Québec, le déploiement Trainline × ElevenLabs et la nomination du Field CTO UK d’ElevenLabs révèlent une tendance structurelle : les gouvernements et grandes entreprises de services publics commencent à ancrer leur stratégie IA dans des partenariats locaux à la fois pour des raisons de souveraineté et de confiance opérationnelle. La traduction vocale Gemini 3.5 Live Translate (70+ langues, streaming continu) arrive dans ce contexte avec un positionnement infrastructure, ciblant directement les plateformes B2B (Google Meet, Grab) avant le grand public.