Zoeken

AlphaProof Nexus lost 9 open problemen, Claude Code Auto Mode op Pro, open-source Copilot voor Eclipse

AlphaProof Nexus lost 9 open problemen, Claude Code Auto Mode op Pro, open-source Copilot voor Eclipse

Deze week zet Google DeepMind een grote stap in wiskundig onderzoek met AlphaProof Nexus, een agent die open problemen kan oplossen die al tientallen jaren openstaan. Aan de kant van Anthropic wordt de auto-modus van Claude Code geopend voor het Pro-abonnement en geïntegreerd met Sonnet 4.6. GitHub maakt de Copilot-plug-in voor Eclipse open source, en Alibaba activeert impliciete caching op Qwen3.7-Max.


AlphaProof Nexus — Een AI-agent lost wiskundige open problemen op die al decennia bestaan

25 mei 2026 — Google DeepMind heeft AlphaProof Nexus aangekondigd, een agentisch kader voor onderzoek naar formele bewijzen, aangedreven door Gemini, vergezeld van een artikel dat op 21 mei naar arXiv is ingestuurd (arXiv:2605.22763).

De agent steunt op een lus die afwisselt tussen generatie via Gemini en formele verificatie via de bewijstaal Lean. Deze combinatie garandeert de wiskundige strengheid van de geproduceerde bewijzen: het LLM stelt voor, Lean valideert of verwerpt, en de agent herhaalt.

Gepubliceerde resultaten:

DomeinResultatenContext
Open problemen van Erdős9 opgelost op 353 geëvalueerdDaarvan 2 al 56 jaar open
OEIS-vermoedens44 opgelost op 492Online Encyclopedia of Integer Sequences
Algebraïsche meetkunde1 open probleem opgelostAl 15 jaar open
Min-max-optimalisatie1 open vraag opgelostAl 7 jaar open

De kostprijs per opgelost probleem bedraagt enkele honderden dollars — een orde van grootte die de economische efficiëntie van de agentische aanpak voor formeel wiskundig onderzoek illustreert.

AlphaProof Nexus wordt al ingezet in samenwerking met wiskundigen op verschillende gebieden: combinatoriek, graaftheorie, algebraïsche meetkunde en kwantumoptica. Dit werk bouwt voort op AlphaProof (2024), dat zich richtte op problemen van olympiadenniveau. AlphaProof Nexus mikt op open onderzoeksproblemen, en markeert daarmee een stap richting het gebruik van AI als hulpmiddel voor autonome wiskundige ontdekking.

“AI agents are advancing research-level math.”

🇳🇱 AI-agenten brengen de wiskunde vooruit op onderzoeksniveau.Pushmeet Kohli, VP Research, Google DeepMind op X

🔗 arXiv-artikel 2605.22763


Claude Code v2.1.149 — Detail /usage per categorie en 25+ correcties

23 mei 2026 — De versie 2.1.149 van Claude Code is uitgebracht en maakt de eerder door Boris Cherny aangekondigde /usage-uitsplitsing per categorie werkelijkheid.

FunctieDetail
/usage breakdownUitsplitsing van verbruik per categorie: skills, sub-agents, plug-ins, MCP-server
/diff navigationToetsenbordnavigatie: pijlen, j/k, PgUp/PgDn, Home/End
GFM task listsMarkdown-checkboxen ([ ] / [x]) worden correct weergegeven
EnterpriseNieuwe beheerde parameter allowAllClaudeAIMcps voor managed-mcp.json

De release verhelpt ook een twintigtal bugs: omzeiling van PowerShell-machtigingen in cd, uitputting van de vnode-tabel op macOS met find, vastlopen van het managed-settings-dialoogvenster, spookwijzigingen in /config, crash van /insights op ontbrekende optionele velden, en een reflectiespinner die tussen tool-aanroepen amber blijft.

Versie 2.1.150, die dezelfde dag is uitgebracht, brengt alleen interne infrastructuurverbeteringen zonder zichtbare wijziging.

🔗 Wijzigingenlogboek Claude Code


Claude Code Auto Mode — Beschikbaar op Pro, Sonnet 4.6 geïntegreerd

23 mei 2026 — Anthropic kondigt twee uitbreidingen van de auto-modus van Claude Code aan:

“Two updates to auto mode: · Now available on the Pro plan · Sonnet 4.6 is now supported, alongside Opus 4.7. Shift+tab, and let Claude run.”

🇳🇱 Twee updates van de auto-modus: nu beschikbaar op het Pro-abonnement; Sonnet 4.6 wordt ondersteund, naast Opus 4.7. Druk op Shift+Tab en laat Claude aan het werk gaan.@ClaudeDevs op X

De auto-modus, geactiveerd via Shift+Tab, laat Claude acties autonoom uitvoeren zonder bij elke stap handmatige bevestiging. Tot nu toe was deze functie voorbehouden aan hogere abonnementen, maar nu is ze beschikbaar voor Pro-abonnees. De toevoeging van Sonnet 4.6 biedt een voordeliger alternatief dan Opus 4.7 voor lange sessies, waardoor het creditverbruik in autonome modus daalt.

Om toegang te krijgen tot deze wijzigingen: claude update of een update van de desktop-app van Claude. De aankondiging genereerde 1,18 miljoen weergaven op X.


GitHub Copilot voor Eclipse — Open source onder MIT-licentie

21 mei 2026 — GitHub heeft de GitHub Copilot-plug-in voor Eclipse open source gemaakt, beschikbaar op GitHub onder MIT-licentie op github.com/microsoft/copilot-for-eclipse.

Het volledige functieset is beschikbaar voor bijdragen van de community:

FunctieStatus
Code completion (inline-aanvullingen)Open source
Next Edit Suggestions (NES)Open source
Chat (conversatiestroom, tool-aanroepen)Open source
Agent mode (meerstaps agentische workflows)Open source
Skills en prompt filesOpen source
BYOK (Bring Your Own Key)Open source
Aangepaste agents, sub-agents, agentplan, MCPOpen source

De motivatie is transparantie en community-innovatie in de geest van het open ecosysteem van Eclipse. Sinds de openstelling zijn er al bijdragen uit de community ontvangen.

🔗 Aankondiging in GitHub Changelog


Qwen3.7-Max — Impliciete caching geactiveerd in productie

25 mei 2026 — Alibaba activeert impliciete caching op Qwen3.7-Max, zijn vlaggenschipmodel gericht op agents.

De cache wordt automatisch geactiveerd voor alle API-verzoeken — er is geen codewijziging nodig. Ontwikkelaars profiteren meteen van snellere en goedkopere verzoeken op herhalende contexten. Voor hogere en deterministische cache-hitratio’s raadt Alibaba expliciete caching aan, gedocumenteerd op Alibaba Cloud.

🔗 Tweet van @Alibaba_Qwen


Korte berichten

  • MiniMax Hailuo AI op de AIFF van Hongkong (HKUST) — Het 2e AI Film Festival georganiseerd door de HKUST ontving 1.300 inzendingen uit 80 landen. Hailuo AI was daar vertegenwoordigd naast Tencent en Z.ai tijdens een panel over de democratisering van AI-film. 🔗 minimax.io

  • NVIDIA DGX Spark — 16 lokale AI-agenten tegelijk — Een communitydemonstratie geretweet door @NVIDIAAI: 2x DGX Spark (GB10) + MiniMax M2.7 NVFP4 laten 16 AI-agenten gelijktijdig streamen, zonder cloud-API’s. 🔗 @NVIDIAAI op X


Wat dit betekent

Een keerpunt voor formeel wiskundig onderzoek. AlphaProof Nexus markeert een breuk: AI beperkt zich niet langer tot wedstrijdproblemen of academische benchmarks, maar pakt open problemen aan waar wiskundigen al decennia niet in zijn geslaagd. De combinatie Gemini + Lean creëert een lus van formele verificatie die garandeert dat de bewijzen correct zijn, niet alleen plausibel. De kostprijs van enkele honderden dollars per opgelost probleem suggereert dat deze aanpak toegankelijk wordt voor onderzoekslaboratoria, niet alleen voor de reuzen van de sector.

De volwassenheid van de agentische tooling aan de kant van Anthropic. De komst van de auto-modus op het Pro-abonnement en de integratie van Sonnet 4.6 geven aan dat Anthropic autonoom agentisch gebruik beschouwt als voldoende stabiel voor het grote publiek. Versie 2.1.149, met zijn /usage-uitsplitsing per categorie, beantwoordt aan een concrete behoefte van ontwikkelaars die complexe multi-agent-systemen bouwen: precies begrijpen wat hun quota verbruikt om hun architecturen te optimaliseren.

Openheid versus softwaresouvereiniteit. De open source-makking van Copilot voor Eclipse onder MIT en de activering van impliciete caching op Qwen3.7-Max illustreren twee verschillende strategieën om ontwikkelaars te winnen. GitHub zet in op transparantie en het Eclipse-ecosysteem om de adoptie van Copilot in Java-ondernemingsomgevingen te vergroten. Alibaba zet in op automatische kostenverlaging zonder frictie om Qwen3.7-Max concurrerender te maken tegenover cloudalternatieven.

De industrialisering van generatieve media vordert. De deelname van MiniMax aan de AIFF van Hongkong — 1.300 inzendingen uit 80 landen — en de NVIDIA-demonstratie van 16 gelijktijdige lokale agents op DGX Spark schetsen een ecosysteem waarin AI-videocreatie de professionele workflows van film binnendringt, zowel op festivals als in lokale infrastructuur.


Bronnen

Artikel vertaald van fr naar nl met gpt-5.4-mini.