Le 20 mai 2026, l’IA fait irruption dans les mathématiques fondamentales : un modèle OpenAI réfute une conjecture de Paul Erdős posée en 1946, sur une preuve de 125 pages validée par des mathématiciens dont le médaillé Fields Tim Gowers. Côté modèles, Cohere publie Command A+ en open-source Apache 2.0 (architecture MoE 218B/25B actifs), NVIDIA lance Nemotron-Labs-Diffusion avec génération parallèle de tokens, et Stability AI dévoile Stable Audio 3.0 (4 modèles open weights). Sur l’outillage, GitHub Copilot évolue sur quatre fronts simultanément, et Claude Code sort deux versions en 24 heures.
OpenAI réfute une conjecture d’Erdős vieille de 80 ans
20 mai — OpenAI a publié un résultat inédit : un modèle interne de raisonnement général a résolu le problème des distances planaires unitaires (planar unit distance problem), une question ouverte depuis que Paul Erdős l’a posée en 1946. Ce problème interroge le nombre maximal de paires de points à distance exactement 1 parmi n points dans le plan. Depuis les années 1940, la communauté mathématique pensait que les constructions en grilles carrées d’Erdős étaient essentiellement optimales.
Le modèle a produit une preuve montrant l’existence d’une famille infinie de configurations qui dépasse la borne conjecturée, avec un exposant δ = 0,014 établi par Will Sawin (Princeton). La percée repose sur un outil mathématique inattendu : les tours de corps de classes infinies et la théorie de Golod-Shafarevich, issus de la théorie algébrique des nombres, appliqués à un problème de géométrie euclidienne élémentaire. Cette connexion entre deux champs a priori distants est, selon les mathématiciens impliqués, le cœur de l’originalité du résultat.
| Aspect | Détail |
|---|---|
| Problème | Distances planaires unitaires (Erdős, 1946) |
| Borne précédente | Croissance en n^(1+C/loglog(n)) (Spencer-Szemerédi-Trotter, 1984) |
| Nouveau résultat | n^(1+δ), δ = 0,014 |
| Outil mathématique | Théorie algébrique des nombres (Golod-Shafarevich) |
| Modèle | Modèle de raisonnement général interne (non nommé) |
| Longueur chaîne de pensée | 125 pages |
| Validation | Groupe de mathématiciens externes + article compagnon |
Ce qui rend le résultat particulièrement notable : il n’a pas été produit par un système entraîné spécifiquement pour les mathématiques ou ciblé sur ce problème. C’est un modèle à usage général, évalué sur une collection de problèmes de Erdős dans le cadre d’une exploration plus large des capacités de recherche autonome.
Tim Gowers (médaille Fields) qualifie le résultat de “milestone in AI mathematics”. Arul Shankar (Princeton) va plus loin :
“In my opinion this paper demonstrates that current AI models go beyond just helpers to human mathematicians – they are capable of having original ingenious ideas, and then carrying them out to fruition.”
🇫🇷 À mon avis, cet article démontre que les modèles d’IA actuels vont au-delà du simple rôle d’assistants pour les mathématiciens — ils sont capables d’avoir des idées originales et ingénieuses, et de les mener à terme. — [Arul Shankar, théoricien des nombres, Princeton]
OpenAI voit dans ce résultat un signal pour la recherche fondamentale : si un modèle peut maintenir un raisonnement complexe sur 125 pages et connecter des domaines mathématiques distants, ces capacités sont transférables à la biologie, la physique, les matériaux et la médecine.
Cohere Command A+ — MoE flagship open-source
20 mai — Cohere lance Command A+, son modèle le plus puissant à ce jour, en open-source sous licence Apache 2.0. L’architecture mixture-of-experts (sparse MoE) mobilise 218B paramètres totaux mais seulement 25B actifs à chaque inférence, ce qui lui permet de tourner sur deux GPU NVIDIA H100 ou un seul GPU Blackwell (B200) en quantification W4A4.
Command A+ unifie sous un seul modèle les capacités auparavant réparties entre Command A Reasoning, Command A Vision et Command A Translate. Il supporte 48 langues (contre 23 pour les versions précédentes), avec un tokeniseur amélioré pour les langues non-européennes (+20% pour l’arabe, +16% pour le coréen, +18% pour le japonais).
| Benchmark | Command A+ | Command A Reasoning |
|---|---|---|
| τ²-Bench Telecom | 85% | 37% |
| Terminal-Bench Hard | 25% | 3% |
| MMMU | 75,1% | N/A |
| MathVista | 80,6% | 73,5% |
| North Agentic QA | +20% amélioration | référence |
| North Data Analysis | +32% amélioration | référence |
Le modèle est jusqu’à 2× plus rapide et 30% moins latent que Command A Reasoning, avec un décodage spéculatif (speculative decoding) offrant un gain supplémentaire de 1,5–1,6×. Disponible sur Hugging Face et via vLLM. Le score de 37 sur l’Artificial Analysis Intelligence Index en fait le meilleur parmi les modèles open-source.
“Introducing: Cohere Command A+ — We’ve created our most powerful LLM yet, optimized it to run on as little hardware as possible, and released it open-source for all.”
🇫🇷 Voici Cohere Command A+ — nous avons créé notre LLM le plus puissant à ce jour, optimisé pour fonctionner avec le moins de matériel possible, et le publions en open-source pour tous. — @cohere sur X
Gemini for Science — L’IA comme partenaire de découverte scientifique
20 mai — Annoncé lors du Google I/O 2026 et tweété le 20 mai, Gemini for Science est une suite d’outils expérimentaux pour la recherche scientifique. Face à l’explosion des données, l’objectif est de permettre aux chercheurs de connecter des informations qu’aucun individu ne peut traiter seul.
Trois outils expérimentaux sont dévoilés :
| Outil | Base | Fonction |
|---|---|---|
| Hypothesis Generation | Co-Scientist | Découverte et raffinement de nouvelles hypothèses |
| Computational Discovery | AlphaEvolve + ERA | Tests de milliers de variations de code en parallèle |
| Science Skills | 30+ modèles bio | Bundle intégré aux plateformes agentiques (Antigravity) |
Computational Discovery est l’outil le plus technique : il génère et évalue des milliers de variations de code en parallèle, permettant de tester de nouvelles approches de modélisation en épidémiologie, chimie ou biologie computationnelle en une fraction du temps habituel.
Science Skills intègre des données de plus de 30 modèles majeurs en sciences de la vie et bases de données, s’interfaçant avec les plateformes agentiques pour automatiser des workflows manuels complexes en quelques minutes.
Le projet a été développé avec 100+ institutions partenaires, des étudiants en doctorat aux lauréats du Nobel.
NVIDIA Nemotron-Labs-Diffusion — Architecture de diffusion de tokens
20 mai — NVIDIA annonce Nemotron-Labs-Diffusion, un modèle de langage qui génère des tokens de manière parallèle par diffusion, contrairement aux LLM autorégressifs classiques qui produisent un token à la fois. Cette architecture — inspirée des modèles de diffusion pour la génération d’images — vise à accélérer l’inférence tout en maintenant la qualité des sorties.
L’approche est fondamentalement différente du paradigme transformer standard : plutôt que de prédire séquentiellement chaque token conditionné aux précédents, le modèle itère en parallèle sur une séquence entière de tokens bruitée, jusqu’à convergence. Les avantages théoriques incluent une latence réduite sur les sorties longues et une meilleure parallélisation sur GPU.
| Aspect | Classique (autorégressif) | Nemotron-Labs-Diffusion |
|---|---|---|
| Génération | Token par token, séquentielle | Parallèle sur toute la séquence |
| Latence longues sorties | Croît linéairement | Potentiellement réduite |
| Paradigme | GPT-style | Diffusion-style |
Le rapport technique complet accompagne la sortie. Il s’agit d’une contribution de recherche de NVIDIA Labs, positionnée comme alternative architecturale au modèle dominant transformer autorégressif — un terrain de recherche actif depuis l’émergence des modèles de diffusion texte comme MDLM et Plaid.
Stability AI — Stable Audio 3.0 (famille open weights)
20 mai — Stability AI publie Stable Audio 3.0, une famille de 4 modèles audio open weights sous licence commerciale. La gamme couvre l’ensemble du spectre de déploiement, des appareils embarqués à l’API entreprise.
| Modèle | Longueur max | Déploiement | Open weights |
|---|---|---|---|
| Small SFX | courte | on-device | Oui |
| Small | 2 min | on-device | Oui |
| Medium | 6:20 | cloud/local | Oui |
| Large | 6:20+ | API/entreprise | Non |
Les modèles Small SFX, Small et Medium sont disponibles sur Hugging Face. Toutes les données d’entraînement sont entièrement sous licence, avec partenariats annoncés avec Universal Music Group et Warner Music Group. Les fonctionnalités avancées incluent le support LoRA training pour le fine-tuning personnalisé, et un mode audio inpainting (édition single-segment, multi-segment, continuation causale).
“We want to foster the same kind of community-driven innovation in audio that we sparked in image generation with the launch of Stable Diffusion.”
🇫🇷 Nous voulons favoriser le même type d’innovation portée par la communauté dans l’audio que celui que nous avons déclenché dans la génération d’images avec le lancement de Stable Diffusion. — Stability AI
GitHub Copilot évolue sur quatre fronts
Auto model selection adaptatif dans VS Code
20 mai — L’option “Auto” de Copilot VS Code sélectionne désormais le modèle optimal selon la nature de la tâche : raisonnement complexe, génération de code simple, débogage ou orchestration d’outils. La sélection s’appuie sur des métriques temps réel de disponibilité et de fiabilité. Avantage pratique : réduction de 10% sur le multiplicateur de requêtes premium lors de l’utilisation d’Auto, sans configuration nécessaire.
Recherche sémantique d’issues en langage naturel
20 mai — Copilot Chat sur le web intègre un index sémantique des issues : un développeur peut chercher “les bugs de rendu mobile signalés le mois dernier” sans connaître le titre exact, et obtenir des résultats groupés par contexte. Disponible en disponibilité générale pour tous les plans Copilot.
Retrait des modèles Gemini de Copilot Chat web
20 mai — Tous les modèles Gemini sont retirés de Copilot Chat sur github.com, ainsi que GPT-5.2 Codex et GPT-5.4 nano. Seuls OpenAI et Claude restent disponibles sur le web. GitHub justifie le choix par la cohérence de la qualité des réponses. Gemini reste disponible dans les IDE et l’API.
Fix with Copilot — application groupée des retours de code review
19 mai — Le bouton “Implement suggestion” est renommé “Fix with Copilot” avec une nouvelle boîte de dialogue (choix du modèle, branche cible, instructions personnalisées). Un nouveau bouton “Fix batch with Copilot” permet de regrouper plusieurs commentaires de code review et de les confier simultanément au Copilot cloud agent, réduisant la friction sur les PRs comportant de nombreux commentaires.
Claude Code v2.1.144 et v2.1.145
19 mai — Claude Code publie deux versions en 24 heures avec un ensemble conséquent de nouvelles fonctionnalités et de corrections.
La version 2.1.144 améliore la gestion des sessions en arrière-plan : la commande /resume affiche désormais les sessions --bg, et les notifications de fin de sous-agent incluent la durée (ex : “Agent completed · 3h 2m 5s”). La commande /model s’applique uniquement à la session courante (appuyer sur d pour définir le défaut permanent). Le renommage “extra usage” → “usage credits” clarifie la terminologie, et la correction d’un blocage de démarrage jusqu’à 75 secondes quand api.anthropic.com est inaccessible (VPN, pare-feu) améliore l’expérience en entreprise.
La version 2.1.145 se distingue par l’introduction de claude agents --json, une commande conçue pour l’intégration dans les scripts shell (tmux-resurrect, barres de statut, sélecteurs de session). Le traçage OpenTelemetry est enrichi avec agent_id et parent_agent_id dans les spans, permettant une hiérarchie correcte des sous-agents. L’écran /plugin affiche désormais le contenu complet (commandes, agents, skills, hooks, serveurs MCP/LSP) avant installation. Les hooks Stop/SubagentStop reçoivent deux nouveaux champs : background_tasks et session_crons.
Anthropic ouvre la réflexion sur la formation du caractère de l’IA
19 mai — Anthropic a publié un article détaillant une initiative de dialogues réguliers avec des philosophes, des clercs et des éthiciens issus de plus de 15 traditions religieuses et culturelles. L’objectif est d’enrichir la réflexion sur ce que signifie former le caractère d’un système d’IA — en s’appuyant sur des siècles de pensée accumulée sur la vertu et la vie bonne, sans aligner Claude sur une tradition particulière.
Un résultat expérimental mérite attention : un outil que Claude peut invoquer en cours de tâche pour relire ses propres engagements éthiques. Utilisé spontanément avant des actions à fort impact, il a montré “une réduction marquée des comportements non alignés” sur les évaluations internes. Les prochaines étapes incluront des échanges avec des juristes, psychologues et institutions civiques.
Cohere — MOUs avec Indra Group et Multiverse Computing
20 mai — Cohere signe deux accords-cadres (MOU) lors de la visite d’État du Roi Felipe VI d’Espagne au Canada. Le premier unit Cohere à IndraMind (branche IA du groupe Indra, défense et digitalisation espagnols) pour construire un écosystème d’IA souveraine incluant des adaptations linguistiques pour les cinq langues officielles d’Espagne. Un volet défense prévoit des capacités d’analyse et de planification pour exercices multinationaux. Le second implique Multiverse Computing (optimisation par IA d’inspiration quantique, Espagne/Canada) pour explorer des opportunités commerciales en Europe et au Canada.
“Enterprises no longer want to rent AI — they want to own it.”
🇫🇷 Les entreprises ne veulent plus louer l’IA — elles veulent la posséder. — Aidan Gomez, co-fondateur et CEO de Cohere
Perplexity — Compression de contexte sensible à la requête en production
20 mai — Perplexity déploie en production un système de compression de contexte (query-aware context compression) qui réduit les tokens de contexte jusqu’à 70% tout en améliorant la précision des réponses. Le principe : un modèle léger extrait chirurgicalement les passages pertinents à la requête avant de les transmettre au LLM principal, éliminant publicités, métadonnées et contenus hors-sujet.
| Métrique | Valeur |
|---|---|
| Réduction tokens contexte | jusqu’à 70% |
| Gain contenu vital par extrait | +63% |
| Réduction latence inférence | 35–40% |
| Réduction calcul GPU agrégé | 40–45% |
| Latence production (p99) | < 20 ms |
Le backbone pplx-diffusion (17 couches, distillé depuis 28 couches) prédit en parallèle quels segments conserver sans génération de texte — approche extractive qui garantit la fidélité des citations. Sur SimpleQA, le preset “medium” avec compression atteint 95% de précision avec seulement 200 tokens en moyenne par document.
ElevenLabs — Speech Engine, un agent vocal en un prompt
20 mai — ElevenLabs lance Speech Engine, un pipeline vocal unifié (synthèse vocale + transcription + orchestration) permettant aux développeurs de transformer un agent conversationnel texte en agent vocal complet avec un seul prompt. Disponible dans ElevenAPI, la tarification est de 8 centimes par minute avec décroissance volumique. Migration possible vers ElevenAgents pour des canaux de déploiement supplémentaires avec monitoring et analytics.
Luma Agents intègre Seedance 2.0
19 mai — Luma Agents intègre Seedance 2.0, le modèle de génération vidéo de ByteDance, dans sa plateforme d’agents créatifs. Même workflow que les autres modèles déjà intégrés. Cette intégration élargit le choix de modèles accessibles via Luma Agents, positionnant la plateforme comme hub d’orchestration multi-modèles pour la vidéo IA.
Kling AI à Cannes — House of David, premier film Hollywood avec IA à l’échelle industrielle
20 mai — Au Festival de Cannes 2026, Kling AI confirme l’utilisation industrielle de sa technologie dans House of David (Prime Video) : 44 millions de viewers mondiaux, top 10 des nouvelles séries aux États-Unis, numéro 1 sur Prime Video US. C’est la première production hollywoodienne à reconnaître publiquement l’intégration de la génération vidéo IA dans son pipeline de production à grande échelle, avec des plans cohérents répondant aux standards industriels stricts.
Brèves
-
Running Guide Agent — Google DeepMind — Agent IA personnel dédié à l’entraînement à la course à pied, présenté comme “une étape vers une course sans limites”. 🔗 Blog DeepMind
-
Midjourney V8.1 — flag
--noréintroduit — Le flag anti-prompting est de retour dans V8.1 pour exclure des éléments des images générées (ex :--no people). 🔗 Annonce @midjourney -
Anthropic
/usagerevampée dans Claude Code — Boris Cherny confirme une refonte de l’UI de/usagepour mieux visualiser la consommation de tokens en réponse à un utilisateur. 🔗 source -
MiniMax Speech 2.8 Turbo — 600+ voix sur Together AI — Plus de 600 nouvelles voix Speech 2.8 Turbo désormais disponibles sur la plateforme Together AI. 🔗 Annonce @MiniMax_AI
Ce que ça signifie
Recherche fondamentale et IA autonome. La résolution de la conjecture d’Erdős par un modèle OpenAI à usage général n’est pas anecdotique. Ce qui frappe les mathématiciens impliqués, c’est la nature du résultat : une connexion inattendue entre deux branches des mathématiques (théorie algébrique des nombres et géométrie discrète), maintenue sur 125 pages de raisonnement cohérent. Couplée à Gemini for Science (développé avec 100+ institutions), la tendance est claire : l’IA commence à s’intégrer non plus seulement comme outil de traitement de données scientifiques, mais comme partenaire de découverte capable de générer des hypothèses originales.
Architectures alternatives au paradigme autorégressif. Deux annonces du jour remettent en question le modèle dominant GPT-style. NVIDIA Nemotron-Labs-Diffusion génère des tokens en parallèle par diffusion plutôt que séquentiellement. Stable Audio 3.0 de Stability AI démontre que la diffusion produit des résultats musicaux de haute qualité avec des modèles open weights sur 4 niveaux de déploiement. La convergence de ces approches suggère que la diffusion n’est plus cantonnée à la génération d’images — elle devient une architecture concurrente sérieuse pour le texte et l’audio.
Souveraineté et IA d’entreprise. Command A+ (MoE 218B open-source, Apache 2.0, 2× H100) et les MOUs de Cohere avec Indra Group et Multiverse Computing illustrent une tendance de fond : les grandes organisations — gouvernements, défense, secteur réglementé — demandent à déployer leurs modèles dans leur propre infrastructure. La combinaison d’une architecture MoE efficiente (25B actifs sur 218B totaux) et d’une licence Apache 2.0 fait de Command A+ le modèle open-source le mieux positionné pour les déploiements souverains à fin mai 2026.
Pression croissante sur l’outillage développeur. Claude Code 2.1.144 et 2.1.145, les quatre mises à jour simultanées de GitHub Copilot, et la compression de contexte de Perplexity (-70% tokens, -40% GPU) sont des signaux cohérents : la compétition se déplace de la qualité brute des modèles vers l’ergonomie des outils, la scriptabilité (claude agents —json), le coût d’inférence (Auto model selection -10%, pplx-diffusion) et la robustesse en production (correction du blocage VPN dans Claude Code).
Sources
- OpenAI — Model disproves discrete geometry conjecture
- OpenAI sur X
- Cohere — Command A+ blog
- Cohere Command A+ sur X
- Google AI — Gemini for Science sur X
- NVIDIA AI — Nemotron-Labs-Diffusion sur X
- Stability AI — Stable Audio 3.0
- GitHub Changelog — Auto model selection VS Code
- GitHub Changelog — Semantic issue search
- GitHub Changelog — Modèles disponibles sur le web
- GitHub Changelog — Fix with Copilot
- Claude Code CHANGELOG
- Anthropic — Widening the conversation on frontier AI
- Cohere — MOUs Indra et Multiverse Computing
- Perplexity — Query-aware context compression sur X
- Perplexity — Article de recherche
- ElevenLabs — Speech Engine sur X
- Luma Labs — Seedance 2.0 sur X
- Kling AI — Cannes sur X
- Google DeepMind — Running Guide Agent
- Midjourney — Flag —no sur X
- Boris Cherny — /usage revampée sur X
- MiniMax — Speech 2.8 Turbo sur X