AlphaProof Nexus résout 9 problèmes ouverts, Claude Code Auto Mode sur Pro, Copilot Eclipse open source

Cette semaine, Google DeepMind franchit un cap dans la recherche mathématique avec AlphaProof Nexus, un agent capable de résoudre des problèmes ouverts depuis plusieurs décennies. Du côté d’Anthropic, le mode auto de Claude Code s’ouvre au plan Pro et intègre Sonnet 4.6. GitHub open source le plugin Copilot pour Eclipse, et Alibaba active le cache implicite sur Qwen3.7-Max.

AlphaProof Nexus — Un agent IA résout des problèmes mathématiques ouverts depuis des décennies

25 mai 2026 — Google DeepMind a annoncé AlphaProof Nexus, un cadre agentique (agentic framework) de recherche de preuves formelles alimenté par Gemini, accompagné d’un article soumis à arXiv le 21 mai (arXiv:2605.22763).

L’agent repose sur une boucle alternant génération via Gemini et vérification formelle via le langage de preuve Lean. Cette combinaison garantit la rigueur mathématique des preuves produites : le LLM propose, Lean valide ou rejette, et l’agent itère.

Résultats publiés :

Domaine	Résultats	Contexte
Problèmes ouverts d’Erdős	9 résolus sur 353 évalués	Dont 2 ouverts depuis 56 ans
Conjectures OEIS	44 résolues sur 492	Online Encyclopedia of Integer Sequences
Géométrie algébrique	1 problème ouvert résolu	Ouvert depuis 15 ans
Optimisation min-max	1 question ouverte résolue	Ouverte depuis 7 ans

Le coût par problème résolu est de quelques centaines de dollars — un ordre de grandeur qui illustre l’efficacité économique de l’approche agentique pour la recherche mathématique formelle.

AlphaProof Nexus est déjà déployé en collaboration avec des mathématiciens dans plusieurs domaines : combinatoire, théorie des graphes, géométrie algébrique et optique quantique. Ce travail s’inscrit dans la continuité d’AlphaProof (2024), qui ciblait des problèmes de niveau olympiade. AlphaProof Nexus vise des problèmes ouverts de recherche, marquant une étape vers l’utilisation de l’IA comme outil de découverte mathématique autonome.

“AI agents are advancing research-level math.”

🇫🇷 Les agents IA font progresser les mathématiques au niveau de la recherche. — Pushmeet Kohli, VP Research, Google DeepMind sur X

🔗 Article arXiv 2605.22763

Claude Code v2.1.149 — Détail `/usage` par catégorie et 25+ corrections

23 mai 2026 — La version 2.1.149 de Claude Code a été publiée, concrétisant la fonctionnalité /usage breakdown par catégorie annoncée par Boris Cherny la semaine précédente.

Fonctionnalité	Détail
`/usage` breakdown	Détail de consommation par catégorie : skills, sous-agents, plugins, serveur MCP
`/diff` navigation	Navigation clavier : flèches, `j`/`k`, PgUp/PgDn, Home/End
GFM task lists	Cases à cocher Markdown (`[ ]` / `[x]`) affichées correctement
Enterprise	Nouveau paramètre managé `allowAllClaudeAIMcps` pour `managed-mcp.json`

La release corrige également une vingtaine de bugs : contournement de permissions PowerShell dans cd, épuisement de la table vnode sur macOS avec find, gel du dialogue managed-settings, changements fantômes dans /config, crash de /insights sur des champs optionnels manquants, et spinner de réflexion restant ambre entre les appels d’outils.

La version 2.1.150, publiée le même jour, n’apporte que des améliorations d’infrastructure internes sans changement visible.

🔗 Changelog Claude Code

Claude Code Auto Mode — Disponible sur Pro, Sonnet 4.6 intégré

23 mai 2026 — Anthropic annonce deux extensions du mode auto de Claude Code :

“Two updates to auto mode: · Now available on the Pro plan · Sonnet 4.6 is now supported, alongside Opus 4.7. Shift+tab, and let Claude run.”

🇫🇷 Deux mises à jour du mode auto : désormais disponible sur le plan Pro ; Sonnet 4.6 est supporté, aux côtés d’Opus 4.7. Shift+tab, et laissez Claude travailler. — @ClaudeDevs sur X

Le mode auto, activé via Shift+Tab, permet à Claude d’exécuter des actions de façon autonome sans validation manuelle à chaque étape. Jusqu’ici réservé aux plans supérieurs, il est désormais accessible aux abonnés Pro. L’ajout de Sonnet 4.6 offre une option plus économique qu’Opus 4.7 pour les sessions longues, réduisant la consommation de crédits en mode autonome.

Pour accéder à ces changements : claude update ou mise à jour de l’application desktop Claude. L’annonce a généré 1,18 million de vues sur X.

GitHub Copilot for Eclipse — Open source sous licence MIT

21 mai 2026 — GitHub a rendu open source le plugin GitHub Copilot pour Eclipse, disponible sur GitHub sous licence MIT à l’adresse github.com/microsoft/copilot-for-eclipse.

L’ensemble des fonctionnalités est exposé pour contributions communautaires :

Fonctionnalité	Statut
Code completion (complétions en ligne)	Open source
Next Edit Suggestions (NES)	Open source
Chat (flux de conversation, appels d’outils)	Open source
Agent mode (workflows agentiques multistep)	Open source
Skills et prompt files	Open source
BYOK (Bring Your Own Key)	Open source
Agents personnalisés, sous-agents, plan agent, MCP	Open source

La motivation est la transparence et l’innovation communautaire dans l’esprit de l’écosystème ouvert d’Eclipse. Des contributions ont déjà été reçues de la communauté dès l’ouverture.

🔗 Annonce GitHub Changelog

Qwen3.7-Max — Cache implicite activé en production

25 mai 2026 — Alibaba active le cache implicite (implicit caching) sur Qwen3.7-Max, son modèle phare orienté agents.

Le cache s’active automatiquement pour toutes les requêtes API — aucune modification de code requise. Les développeurs bénéficient immédiatement de requêtes plus rapides et moins coûteuses sur les contextes répétitifs. Pour des taux de cache plus élevés et déterministes, Alibaba recommande le cache explicite, documenté sur Alibaba Cloud.

🔗 Tweet @Alibaba_Qwen

Brèves

MiniMax Hailuo AI au AIFF de Hong Kong (HKUST) — Le 2e AI Film Festival organisé par l’HKUST a reçu 1 300 candidatures de 80 pays. Hailuo AI y était représenté aux côtés de Tencent et Z.ai lors d’un panel sur la démocratisation du cinéma IA. 🔗 minimax.io
NVIDIA DGX Spark — 16 agents IA locaux simultanés — Démonstration communautaire retweetée par @NVIDIAAI : 2x DGX Spark (GB10) + MiniMax M2.7 NVFP4 font tourner 16 agents IA en streaming simultané, sans APIs cloud. 🔗 @NVIDIAAI sur X

Ce que ça signifie

Un tournant pour la recherche mathématique formelle. AlphaProof Nexus marque une rupture : l’IA ne se limite plus à des problèmes de concours ou à des benchmarks académiques, elle s’attaque à des problèmes ouverts que les mathématiciens n’ont pas réussi à résoudre depuis des décennies. La combinaison Gemini + Lean crée une boucle de vérification formelle qui garantit que les preuves sont correctes, pas seulement plausibles. Le coût de quelques centaines de dollars par problème résolu suggère que cette approche devient accessible à des laboratoires de recherche, pas uniquement aux géants du secteur.

La maturité de l’outillage agentique côté Anthropic. L’arrivée du mode auto sur le plan Pro et l’intégration de Sonnet 4.6 signalent qu’Anthropic considère l’usage agentique autonome comme suffisamment stable pour le grand public. La version 2.1.149, avec son breakdown /usage par catégorie, répond à un besoin concret des développeurs qui construisent des systèmes multi-agents complexes : comprendre précisément ce qui consomme leur quota pour optimiser leurs architectures.

Ouverture vs souveraineté logicielle. L’open source de Copilot pour Eclipse sous MIT et l’activation du cache implicite sur Qwen3.7-Max illustrent deux stratégies différentes pour conquérir les développeurs. GitHub mise sur la transparence et l’écosystème Eclipse pour élargir l’adoption de Copilot dans les environnements Java d’entreprise. Alibaba mise sur la réduction automatique des coûts sans friction pour rendre Qwen3.7-Max plus compétitif face aux alternatives cloud.

L’industrialisation des médias génératifs progresse. La participation de MiniMax à l’AIFF de Hong Kong — 1 300 candidatures de 80 pays — et la démonstration NVIDIA de 16 agents locaux simultanés sur DGX Spark dessinent un écosystème où la création vidéo par IA pénètre les workflows professionnels du cinéma, aussi bien en festival qu’en infrastructure locale.