AlphaProof Nexus löst 9 offene Probleme, Claude Code Auto Mode auf Pro, Copilot Eclipse Open Source

Diese Woche erreicht Google DeepMind mit AlphaProof Nexus einen Meilenstein in der mathematischen Forschung, einem Agenten, der seit Jahrzehnten offene Probleme lösen kann. Bei Anthropic wird der Auto Mode von Claude Code für den Pro-Plan geöffnet und um Sonnet 4.6 ergänzt. GitHub macht das Copilot-Plugin für Eclipse Open Source, und Alibaba aktiviert den impliziten Cache für Qwen3.7-Max.

AlphaProof Nexus — Ein KI-Agent löst mathematische Probleme, die seit Jahrzehnten offen sind

25. Mai 2026 — Google DeepMind hat AlphaProof Nexus angekündigt, ein agentisches Forschungsrahmenwerk (agentic framework) für formale Beweise, das von Gemini angetrieben wird, begleitet von einem am 21. Mai bei arXiv eingereichten Artikel (arXiv:2605.22763).

Der Agent basiert auf einer Schleife, die zwischen Generierung über Gemini und formaler Verifikation über die Beweissprache Lean wechselt. Diese Kombination gewährleistet die mathematische Strenge der erzeugten Beweise: Das LLM schlägt vor, Lean validiert oder verwirft, und der Agent iteriert.

Veröffentlichte Ergebnisse:

Bereich	Ergebnisse	Kontext
Offene Erdős-Probleme	9 von 353 bewertet gelöst	Davon 2 seit 56 Jahren offen
OEIS-Vermutungen	44 von 492 gelöst	Online Encyclopedia of Integer Sequences
Algebraische Geometrie	1 offenes Problem gelöst	Seit 15 Jahren offen
Min-Max-Optimierung	1 offene Frage gelöst	Seit 7 Jahren offen

Die Kosten pro gelöstem Problem liegen bei einigen Hundert Dollar — eine Größenordnung, die die wirtschaftliche Effizienz des agentischen Ansatzes für formale mathematische Forschung veranschaulicht.

AlphaProof Nexus wird bereits in Zusammenarbeit mit Mathematikern in mehreren Bereichen eingesetzt: Kombinatorik, Graphentheorie, algebraische Geometrie und Quantenoptik. Diese Arbeit steht in der Kontinuität von AlphaProof (2024), das auf Probleme auf Olympiaden-Niveau abzielte. AlphaProof Nexus zielt auf offene Forschungsprobleme und markiert damit einen Schritt hin zum Einsatz von KI als Werkzeug für autonome mathematische Entdeckungen.

“AI agents are advancing research-level math.”

🇩🇪 KI-Agenten treiben die Mathematik auf Forschungsebene voran. — Pushmeet Kohli, VP Research, Google DeepMind auf X

🔗 arXiv-Artikel 2605.22763

Claude Code v2.1.149 — `/usage`-Aufschlüsselung nach Kategorie und 25+ Korrekturen

23. Mai 2026 — Version 2.1.149 von Claude Code wurde veröffentlicht und macht die von Boris Cherny in der Vorwoche angekündigte Kategorie-/usage-Aufschlüsselung möglich.

Funktion	Detail
`/usage` breakdown	Verbrauchsdetails nach Kategorie: skills, Unteragenten, Plugins, MCP-Server
`/diff` navigation	Tastaturnavigation: Pfeile, `j`/`k`, PgUp/PgDn, Home/End
GFM task lists	Markdown-Checkboxen (`[ ]` / `[x]`) korrekt angezeigt
Enterprise	Neuer verwalteter Parameter `allowAllClaudeAIMcps` für `managed-mcp.json`

Die Version behebt außerdem rund zwanzig Bugs: Umgehung der PowerShell-Berechtigungen in cd, Erschöpfung der vnode-Tabelle unter macOS mit find, Einfrieren des Dialogs managed-settings, Phantomänderungen in /config, Absturz von /insights bei fehlenden optionalen Feldern und einen Reflexions-Spinner, der zwischen Tool-Aufrufen amber bleibt.

Die am selben Tag veröffentlichte Version 2.1.150 bringt lediglich interne Infrastrukturverbesserungen ohne sichtbare Änderungen.

🔗 Claude Code Changelog

Claude Code Auto Mode — Auf Pro verfügbar, Sonnet 4.6 integriert

23. Mai 2026 — Anthropic kündigt zwei Erweiterungen des Auto Mode von Claude Code an:

“Two updates to auto mode: · Now available on the Pro plan · Sonnet 4.6 is now supported, alongside Opus 4.7. Shift+tab, and let Claude run.”

🇩🇪 Zwei Aktualisierungen des Auto Mode: jetzt auf dem Pro-Plan verfügbar; Sonnet 4.6 wird unterstützt, neben Opus 4.7. Shift+tab und lass Claude arbeiten. — @ClaudeDevs auf X

Der Auto Mode, aktiviert über Shift+Tab, erlaubt Claude, Aktionen autonom auszuführen, ohne bei jedem Schritt eine manuelle Bestätigung einzuholen. Bisher den höheren Tarifen vorbehalten, ist er nun für Pro-Abonnenten zugänglich. Die Hinzufügung von Sonnet 4.6 bietet für lange Sitzungen eine günstigere Option als Opus 4.7 und reduziert den Verbrauch von Credits im autonomen Modus.

Um auf diese Änderungen zuzugreifen: claude update oder die Claude-Desktop-App aktualisieren. Die Ankündigung erzielte auf X 1,18 Millionen Aufrufe.

GitHub Copilot für Eclipse — Open Source unter MIT-Lizenz

21. Mai 2026 — GitHub hat das GitHub-Copilot-Plugin für Eclipse als Open Source veröffentlicht, verfügbar auf GitHub unter MIT-Lizenz unter github.com/microsoft/copilot-for-eclipse.

Der gesamte Funktionsumfang ist für Beiträge aus der Community freigegeben:

Funktion	Status
Code completion (Inline-Vervollständigungen)	Open source
Next Edit Suggestions (NES)	Open source
Chat (Konversationsfluss, Tool-Aufrufe)	Open source
Agent mode (agentische Multistep-Workflows)	Open source
Skills und Prompt files	Open source
BYOK (Bring Your Own Key)	Open source
Benutzerdefinierte Agents, Unteragenten, Plan Agent, MCP	Open source

Die Motivation sind Transparenz und Community-Innovation im Geist des offenen Eclipse-Ökosystems. Bereits mit der Öffnung wurden Beiträge aus der Community eingereicht.

🔗 GitHub-Changelog-Ankündigung

Qwen3.7-Max — Impliziter Cache in Produktion aktiviert

25. Mai 2026 — Alibaba aktiviert den impliziten Cache (implicit caching) für Qwen3.7-Max, sein agentenorientiertes Flaggschiffmodell.

Der Cache aktiviert sich automatisch für alle API-Anfragen — keine Codeänderung erforderlich. Entwickler profitieren sofort von schnelleren und günstigeren Anfragen bei wiederholten Kontexten. Für höhere und deterministische Cache-Raten empfiehlt Alibaba den expliziten Cache, der auf Alibaba Cloud dokumentiert ist.

🔗 Tweet @Alibaba_Qwen

Kurzmeldungen

MiniMax Hailuo AI auf dem AIFF in Hongkong (HKUST) — Das 2. AI Film Festival, organisiert von der HKUST, erhielt 1.300 Einreichungen aus 80 Ländern. Hailuo AI war dort an der Seite von Tencent und Z.ai in einem Panel zur Demokratisierung des KI-Kinos vertreten. 🔗 minimax.io
NVIDIA DGX Spark — 16 lokale KI-Agenten gleichzeitig — Community-Demonstration, von @NVIDIAAI retweetet: 2x DGX Spark (GB10) + MiniMax M2.7 NVFP4 betreiben 16 KI-Agenten im gleichzeitigen Streaming, ohne Cloud-APIs. 🔗 @NVIDIAAI auf X

Was das bedeutet

Ein Wendepunkt für die formale mathematische Forschung. AlphaProof Nexus markiert einen Bruch: KI beschränkt sich nicht mehr auf Wettbewerbsprobleme oder akademische Benchmarks, sondern greift offene Probleme an, die Mathematiker seit Jahrzehnten nicht lösen konnten. Die Kombination aus Gemini + Lean erzeugt eine Schleife der formalen Verifikation, die sicherstellt, dass die Beweise korrekt sind und nicht nur plausibel. Die Kosten von wenigen Hundert Dollar pro gelöstem Problem deuten darauf hin, dass dieser Ansatz für Forschungslabore zugänglich wird, nicht nur für die Giganten der Branche.

Die Reife der agentischen Werkzeuge auf Seiten von Anthropic. Das Erscheinen des Auto Mode auf dem Pro-Plan und die Integration von Sonnet 4.6 signalisieren, dass Anthropic die autonome agentische Nutzung als stabil genug für die breite Öffentlichkeit betrachtet. Version 2.1.149 mit ihrer /usage-Aufschlüsselung nach Kategorien beantwortet ein konkretes Bedürfnis von Entwicklern, die komplexe Multi-Agenten-Systeme bauen: präzise zu verstehen, was ihr Kontingent verbraucht, um ihre Architekturen zu optimieren.

Offenheit vs. Software-Souveränität. Die Open-Source-Veröffentlichung von Copilot für Eclipse unter MIT und die Aktivierung des impliziten Caches auf Qwen3.7-Max veranschaulichen zwei unterschiedliche Strategien, um Entwickler zu gewinnen. GitHub setzt auf Transparenz und das Eclipse-Ökosystem, um die Akzeptanz von Copilot in Java-Enterprise-Umgebungen zu erweitern. Alibaba setzt auf automatische Kostensenkung ohne Reibung, um Qwen3.7-Max gegenüber Cloud-Alternativen wettbewerbsfähiger zu machen.

Die Industrialisierung generativer Medien schreitet voran. Die Teilnahme von MiniMax am AIFF in Hongkong — 1.300 Einreichungen aus 80 Ländern — und die NVIDIA-Demonstration von 16 gleichzeitigen lokalen Agenten auf DGX Spark zeichnen ein Ökosystem, in dem KI-gestützte Videoproduktion in professionelle Film-Workflows eindringt, sowohl im Festivalumfeld als auch in lokaler Infrastruktur.