Cette semaine, Google DeepMind franchit un cap dans la recherche mathématique avec AlphaProof Nexus, un agent capable de résoudre des problèmes ouverts depuis plusieurs décennies. Du côté d’Anthropic, le mode auto de Claude Code s’ouvre au plan Pro et intègre Sonnet 4.6. GitHub open source le plugin Copilot pour Eclipse, et Alibaba active le cache implicite sur Qwen3.7-Max.
AlphaProof Nexus — Un agent IA résout des problèmes mathématiques ouverts depuis des décennies
25 mai 2026 — Google DeepMind a annoncé AlphaProof Nexus, un cadre agentique (agentic framework) de recherche de preuves formelles alimenté par Gemini, accompagné d’un article soumis à arXiv le 21 mai (arXiv:2605.22763).
L’agent repose sur une boucle alternant génération via Gemini et vérification formelle via le langage de preuve Lean. Cette combinaison garantit la rigueur mathématique des preuves produites : le LLM propose, Lean valide ou rejette, et l’agent itère.
Résultats publiés :
| Domaine | Résultats | Contexte |
|---|---|---|
| Problèmes ouverts d’Erdős | 9 résolus sur 353 évalués | Dont 2 ouverts depuis 56 ans |
| Conjectures OEIS | 44 résolues sur 492 | Online Encyclopedia of Integer Sequences |
| Géométrie algébrique | 1 problème ouvert résolu | Ouvert depuis 15 ans |
| Optimisation min-max | 1 question ouverte résolue | Ouverte depuis 7 ans |
Le coût par problème résolu est de quelques centaines de dollars — un ordre de grandeur qui illustre l’efficacité économique de l’approche agentique pour la recherche mathématique formelle.
AlphaProof Nexus est déjà déployé en collaboration avec des mathématiciens dans plusieurs domaines : combinatoire, théorie des graphes, géométrie algébrique et optique quantique. Ce travail s’inscrit dans la continuité d’AlphaProof (2024), qui ciblait des problèmes de niveau olympiade. AlphaProof Nexus vise des problèmes ouverts de recherche, marquant une étape vers l’utilisation de l’IA comme outil de découverte mathématique autonome.
“AI agents are advancing research-level math.”
🇫🇷 Les agents IA font progresser les mathématiques au niveau de la recherche. — Pushmeet Kohli, VP Research, Google DeepMind sur X
Claude Code v2.1.149 — Détail /usage par catégorie et 25+ corrections
23 mai 2026 — La version 2.1.149 de Claude Code a été publiée, concrétisant la fonctionnalité /usage breakdown par catégorie annoncée par Boris Cherny la semaine précédente.
| Fonctionnalité | Détail |
|---|---|
/usage breakdown | Détail de consommation par catégorie : skills, sous-agents, plugins, serveur MCP |
/diff navigation | Navigation clavier : flèches, j/k, PgUp/PgDn, Home/End |
| GFM task lists | Cases à cocher Markdown ([ ] / [x]) affichées correctement |
| Enterprise | Nouveau paramètre managé allowAllClaudeAIMcps pour managed-mcp.json |
La release corrige également une vingtaine de bugs : contournement de permissions PowerShell dans cd, épuisement de la table vnode sur macOS avec find, gel du dialogue managed-settings, changements fantômes dans /config, crash de /insights sur des champs optionnels manquants, et spinner de réflexion restant ambre entre les appels d’outils.
La version 2.1.150, publiée le même jour, n’apporte que des améliorations d’infrastructure internes sans changement visible.
Claude Code Auto Mode — Disponible sur Pro, Sonnet 4.6 intégré
23 mai 2026 — Anthropic annonce deux extensions du mode auto de Claude Code :
“Two updates to auto mode: · Now available on the Pro plan · Sonnet 4.6 is now supported, alongside Opus 4.7. Shift+tab, and let Claude run.”
🇫🇷 Deux mises à jour du mode auto : désormais disponible sur le plan Pro ; Sonnet 4.6 est supporté, aux côtés d’Opus 4.7. Shift+tab, et laissez Claude travailler. — @ClaudeDevs sur X
Le mode auto, activé via Shift+Tab, permet à Claude d’exécuter des actions de façon autonome sans validation manuelle à chaque étape. Jusqu’ici réservé aux plans supérieurs, il est désormais accessible aux abonnés Pro. L’ajout de Sonnet 4.6 offre une option plus économique qu’Opus 4.7 pour les sessions longues, réduisant la consommation de crédits en mode autonome.
Pour accéder à ces changements : claude update ou mise à jour de l’application desktop Claude. L’annonce a généré 1,18 million de vues sur X.
GitHub Copilot for Eclipse — Open source sous licence MIT
21 mai 2026 — GitHub a rendu open source le plugin GitHub Copilot pour Eclipse, disponible sur GitHub sous licence MIT à l’adresse github.com/microsoft/copilot-for-eclipse.
L’ensemble des fonctionnalités est exposé pour contributions communautaires :
| Fonctionnalité | Statut |
|---|---|
| Code completion (complétions en ligne) | Open source |
| Next Edit Suggestions (NES) | Open source |
| Chat (flux de conversation, appels d’outils) | Open source |
| Agent mode (workflows agentiques multistep) | Open source |
| Skills et prompt files | Open source |
| BYOK (Bring Your Own Key) | Open source |
| Agents personnalisés, sous-agents, plan agent, MCP | Open source |
La motivation est la transparence et l’innovation communautaire dans l’esprit de l’écosystème ouvert d’Eclipse. Des contributions ont déjà été reçues de la communauté dès l’ouverture.
Qwen3.7-Max — Cache implicite activé en production
25 mai 2026 — Alibaba active le cache implicite (implicit caching) sur Qwen3.7-Max, son modèle phare orienté agents.
Le cache s’active automatiquement pour toutes les requêtes API — aucune modification de code requise. Les développeurs bénéficient immédiatement de requêtes plus rapides et moins coûteuses sur les contextes répétitifs. Pour des taux de cache plus élevés et déterministes, Alibaba recommande le cache explicite, documenté sur Alibaba Cloud.
Brèves
-
MiniMax Hailuo AI au AIFF de Hong Kong (HKUST) — Le 2e AI Film Festival organisé par l’HKUST a reçu 1 300 candidatures de 80 pays. Hailuo AI y était représenté aux côtés de Tencent et Z.ai lors d’un panel sur la démocratisation du cinéma IA. 🔗 minimax.io
-
NVIDIA DGX Spark — 16 agents IA locaux simultanés — Démonstration communautaire retweetée par @NVIDIAAI : 2x DGX Spark (GB10) + MiniMax M2.7 NVFP4 font tourner 16 agents IA en streaming simultané, sans APIs cloud. 🔗 @NVIDIAAI sur X
Ce que ça signifie
Un tournant pour la recherche mathématique formelle. AlphaProof Nexus marque une rupture : l’IA ne se limite plus à des problèmes de concours ou à des benchmarks académiques, elle s’attaque à des problèmes ouverts que les mathématiciens n’ont pas réussi à résoudre depuis des décennies. La combinaison Gemini + Lean crée une boucle de vérification formelle qui garantit que les preuves sont correctes, pas seulement plausibles. Le coût de quelques centaines de dollars par problème résolu suggère que cette approche devient accessible à des laboratoires de recherche, pas uniquement aux géants du secteur.
La maturité de l’outillage agentique côté Anthropic. L’arrivée du mode auto sur le plan Pro et l’intégration de Sonnet 4.6 signalent qu’Anthropic considère l’usage agentique autonome comme suffisamment stable pour le grand public. La version 2.1.149, avec son breakdown /usage par catégorie, répond à un besoin concret des développeurs qui construisent des systèmes multi-agents complexes : comprendre précisément ce qui consomme leur quota pour optimiser leurs architectures.
Ouverture vs souveraineté logicielle. L’open source de Copilot pour Eclipse sous MIT et l’activation du cache implicite sur Qwen3.7-Max illustrent deux stratégies différentes pour conquérir les développeurs. GitHub mise sur la transparence et l’écosystème Eclipse pour élargir l’adoption de Copilot dans les environnements Java d’entreprise. Alibaba mise sur la réduction automatique des coûts sans friction pour rendre Qwen3.7-Max plus compétitif face aux alternatives cloud.
L’industrialisation des médias génératifs progresse. La participation de MiniMax à l’AIFF de Hong Kong — 1 300 candidatures de 80 pays — et la démonstration NVIDIA de 16 agents locaux simultanés sur DGX Spark dessinent un écosystème où la création vidéo par IA pénètre les workflows professionnels du cinéma, aussi bien en festival qu’en infrastructure locale.