Zoeken

OpenAI weerlegt een 80 jaar oude vermoedens van Erdős, Cohere Command A+ open-source, NVIDIA Nemotron-Labs-Diffusion

OpenAI weerlegt een 80 jaar oude vermoedens van Erdős, Cohere Command A+ open-source, NVIDIA Nemotron-Labs-Diffusion

ai-powered-markdown-translator

Artikel vertaald van fr naar nl met gpt-5.4-mini.

Bekijk project op GitHub ↗

Op 20 mei 2026 breekt AI door in de fundamentele wiskunde: een OpenAI-model weerlegt een vermoeden van Paul Erdős uit 1946, op basis van een bewijs van 125 pagina’s dat is gevalideerd door wiskundigen, onder wie Fields-medaillewinnaar Tim Gowers. Aan modelzijde brengt Cohere Command A+ uit als open-source onder Apache 2.0 (MoE-architectuur 218B/25B actieve parameters), NVIDIA lanceert Nemotron-Labs-Diffusion met parallelle tokengeneratie, en Stability AI onthult Stable Audio 3.0 (4 open-weightsmodellen). Op het gebied van tooling evolueert GitHub Copilot tegelijk op vier fronten, en Claude Code brengt binnen 24 uur twee versies uit.


OpenAI weerlegt een 80 jaar oud vermoeden van Erdős

20 mei — OpenAI heeft een ongekend resultaat gepubliceerd: een intern model voor algemeen redeneren heeft het probleem van de eenheidsafstanden in het vlak (planar unit distance problem) opgelost, een vraag die openstond sinds Paul Erdős die in 1946 stelde. Dit probleem onderzoekt het maximale aantal paren punten op exact afstand 1 van elkaar onder n punten in het vlak. Sinds de jaren veertig ging de wiskundige gemeenschap ervan uit dat de vierkante roosterconstructies van Erdős in wezen optimaal waren.

Het model produceerde een bewijs waaruit het bestaan van een oneindige familie configuraties blijkt die de vermoede bovengrens overschrijdt, met een exponent δ = 0,014 vastgesteld door Will Sawin (Princeton). De doorbraak berust op een onverwacht wiskundig instrument: oneindige class field towers en de theorie van Golod-Shafarevich, afkomstig uit de algebraïsche getaltheorie, toegepast op een elementair meetkundig Euclidisch probleem. Deze verbinding tussen twee op het eerste gezicht verre vakgebieden vormt, volgens de betrokken wiskundigen, de kern van de originaliteit van het resultaat.

AspectDetail
ProbleemEenheidsafstanden in het vlak (Erdős, 1946)
Eerdere bovengrensGroei in n^(1+C/loglog(n)) (Spencer-Szemerédi-Trotter, 1984)
Nieuw resultaatn^(1+δ), δ = 0,014
Wiskundig instrumentAlgebraïsche getaltheorie (Golod-Shafarevich)
ModelIntern model voor algemeen redeneren (niet genoemd)
Lengte van de gedachtegang125 pagina’s
ValidatieGroep externe wiskundigen + begeleidend artikel

Wat het resultaat bijzonder opmerkelijk maakt: het is niet geproduceerd door een systeem dat speciaal voor wiskunde of voor dit probleem was getraind. Het is een model voor algemeen gebruik, geëvalueerd op een verzameling problemen van Erdős in het kader van een bredere verkenning van autonome onderzoeksvaardigheden.

Tim Gowers (Fields-medaille) noemt het resultaat een “milestone in AI mathematics”. Arul Shankar (Princeton) gaat verder:

“In my opinion this paper demonstrates that current AI models go beyond just helpers to human mathematicians – they are capable of having original ingenious ideas, and then carrying them out to fruition.”

🇳🇱 Volgens mij laat dit artikel zien dat de huidige AI-modellen verder gaan dan alleen een hulpmiddel voor wiskundigen — ze zijn in staat om originele en ingenieuze ideeën te hebben en die tot een goed einde te brengen. — [Arul Shankar, getaltheoreticus, Princeton]

OpenAI ziet in dit resultaat een signaal voor fundamenteel onderzoek: als een model complexe redenering over 125 pagina’s kan volhouden en verre wiskundige domeinen met elkaar kan verbinden, dan zijn die capaciteiten overdraagbaar naar de biologie, fysica, materialen en geneeskunde.

🔗 OpenAI-artikel


Cohere Command A+ — open-source MoE-flaggenschip

20 mei — Cohere lanceert Command A+, zijn krachtigste model tot nu toe, als open-source onder de Apache 2.0-licentie. De mixture-of-experts-architectuur (sparse MoE) gebruikt 218B totale parameters maar slechts 25B actieve parameters per inferentie, waardoor het op twee NVIDIA H100-GPU’s of op één Blackwell-GPU (B200) kan draaien in W4A4-kwantisatie.

Command A+ verenigt onder één model de capaciteiten die eerder verdeeld waren over Command A Reasoning, Command A Vision en Command A Translate. Het ondersteunt 48 talen (tegenover 23 voor eerdere versies), met een verbeterde tokenizer voor niet-Europese talen (+20% voor Arabisch, +16% voor Koreaans, +18% voor Japans).

BenchmarkCommand A+Command A Reasoning
τ²-Bench Telecom85%37%
Terminal-Bench Hard25%3%
MMMU75,1%N/A
MathVista80,6%73,5%
North Agentic QA+20% verbeteringreferentie
North Data Analysis+32% verbeteringreferentie

Het model is tot 2× sneller en 30% minder latentie-intensief dan Command A Reasoning, met speculatieve decodering (speculative decoding) die nog een extra winst van 1,5–1,6× oplevert. Beschikbaar op Hugging Face en via vLLM. De score van 37 op de Artificial Analysis Intelligence Index maakt het de beste onder de open-source modellen.

“Introducing: Cohere Command A+ — We’ve created our most powerful LLM yet, optimized it to run on as little hardware as possible, and released it open-source for all.”

🇳🇱 Maak kennis met Cohere Command A+ — we hebben ons krachtigste LLM tot nu toe gebouwd, geoptimaliseerd om met zo weinig mogelijk hardware te draaien, en we brengen het als open-source uit voor iedereen.@cohere op X

🔗 Cohere-blog


Gemini for Science — AI als partner voor wetenschappelijke ontdekking

20 mei — Aangekondigd tijdens Google I/O 2026 en getweet op 20 mei, is Gemini for Science een suite van experimentele tools voor wetenschappelijk onderzoek. Tegen de achtergrond van de explosie aan data is het doel onderzoekers in staat te stellen informatie met elkaar te verbinden die geen enkel individu alleen kan verwerken.

Drie experimentele tools worden onthuld:

ToolBasisFunctie
Hypothesis GenerationCo-ScientistOntdekking en verfijning van nieuwe hypothesen
Computational DiscoveryAlphaEvolve + ERATests van duizenden codevarianten parallel
Science Skills30+ bio-modellenGeïntegreerde bundel voor agentische platforms (Antigravity)

Computational Discovery is de meest technische tool: deze genereert en evalueert duizenden codevarianten parallel, waardoor nieuwe modelleerbenaderingen in de epidemiologie, chemie of computationele biologie in een fractie van de gebruikelijke tijd kunnen worden getest.

Science Skills integreert gegevens van meer dan 30 toonaangevende modellen in de life sciences en databanken, en koppelt met agentische platforms om complexe handmatige workflows in enkele minuten te automatiseren.

Het project is ontwikkeld met 100+ partnerinstellingen, van promovendi tot Nobelprijswinnaars.

🔗 Aankondiging @GoogleAI


NVIDIA Nemotron-Labs-Diffusion — token-diffusiearchitectuur

20 mei — NVIDIA kondigt Nemotron-Labs-Diffusion aan, een taalmodel dat tokens parallel genereert via diffusie, in tegenstelling tot klassieke autoregressieve LLM’s die één token tegelijk produceren. Deze architectuur — geïnspireerd op diffusiemodellen voor beeldgeneratie — is bedoeld om inferentie te versnellen terwijl de kwaliteit van de output behouden blijft.

De aanpak verschilt fundamenteel van het standaard transformerparadigma: in plaats van elk token sequentieel te voorspellen op basis van de voorgaande tokens, doorloopt het model parallel een hele reeks verstoorde tokens, tot convergentie. De theoretische voordelen omvatten lagere latentie bij lange outputs en betere parallelisatie op GPU’s.

AspectKlassiek (autoregressief)Nemotron-Labs-Diffusion
GeneratieToken voor token, sequentieelParallel over de hele sequentie
Latentie bij lange outputNeemt lineair toePotentieel verlaagd
ParadigmaGPT-stijlDiffusion-stijl

Het volledige technische rapport vergezelt de release. Het betreft een onderzoeksbijdrage van NVIDIA Labs, gepositioneerd als architecturaal alternatief voor het dominante autoregressieve transformer-model — een actief onderzoeksdomein sinds de opkomst van tekstdiffusiemodellen zoals MDLM en Plaid.

🔗 Aankondiging @NVIDIAAI


Stability AI — Stable Audio 3.0 (open-weightsfamilie)

20 mei — Stability AI publiceert Stable Audio 3.0, een familie van 4 open-weights audiomodellen onder commerciële licentie. Het aanbod bestrijkt het volledige spectrum van implementatie, van ingebedde apparaten tot enterprise-API’s.

ModelMaximale lengteImplementatieOpen weights
Small SFXkorton-deviceJa
Small2 minon-deviceJa
Medium6:20cloud/localJa
Large6:20+API/enterpriseNee

De modellen Small SFX, Small en Medium zijn beschikbaar op Hugging Face. Alle trainingsdata zijn volledig gelicentieerd, met aangekondigde partnerschappen met Universal Music Group en Warner Music Group. Geavanceerde functies omvatten ondersteuning voor LoRA-training voor gepersonaliseerde fine-tuning, en een audio-inpaintingmodus (bewerking van één segment, meerdere segmenten, causale voortzetting).

“We want to foster the same kind of community-driven innovation in audio that we sparked in image generation with the launch of Stable Diffusion.”

🇳🇱 We willen in audio hetzelfde soort door de community gedreven innovatie stimuleren als die we met de lancering van Stable Diffusion hebben ontketend in beeldgeneratie.Stability AI


GitHub Copilot evolueert op vier fronten

Adaptieve auto model selection in VS Code

20 mei — De “Auto”-optie van Copilot VS Code selecteert voortaan het optimale model op basis van de aard van de taak: complex redeneren, eenvoudige codegeneratie, debuggen of toolorkestratie. De selectie is gebaseerd op realtime meetwaarden voor beschikbaarheid en betrouwbaarheid. Praktisch voordeel: 10% reductie op de premium request multiplier bij gebruik van Auto, zonder dat configuratie nodig is.

🔗 GitHub-changelog

Semantische zoekfunctie voor issues in natuurlijke taal

20 mei — Copilot Chat op het web integreert een semantische index van issues: een ontwikkelaar kan zoeken op “de mobiele renderingbugs die vorige maand zijn gemeld” zonder de exacte titel te kennen, en resultaten krijgen gegroepeerd op context. Beschikbaar in algemene beschikbaarheid voor alle Copilot-abonnementen.

🔗 GitHub-changelog

Verwijdering van Gemini-modellen uit Copilot Chat web

20 mei — Alle Gemini-modellen worden verwijderd uit Copilot Chat op github.com, evenals GPT-5.2 Codex en GPT-5.4 nano. Alleen OpenAI en Claude blijven op het web beschikbaar. GitHub rechtvaardigt de keuze met de consistentie van de kwaliteit van de antwoorden. Gemini blijft beschikbaar in IDE’s en de API.

🔗 GitHub-changelog

Fix with Copilot — gebundelde toepassing van code review-feedback

19 mei — De knop “Implement suggestion” wordt hernoemd tot “Fix with Copilot” met een nieuw dialoogvenster (modelkeuze, doelbranch, aangepaste instructies). Een nieuwe knop “Fix batch with Copilot” maakt het mogelijk meerdere code-reviewopmerkingen te bundelen en tegelijk toe te vertrouwen aan de Copilot cloud agent, waardoor de frictie bij PR’s met veel opmerkingen afneemt.

🔗 GitHub-changelog


Claude Code v2.1.144 en v2.1.145

19 mei — Claude Code brengt binnen 24 uur twee versies uit met een aanzienlijke reeks nieuwe functies en verbeteringen.

Versie 2.1.144 verbetert het beheer van sessies op de achtergrond: het commando /resume toont nu de --bg-sessies, en meldingen aan het einde van een subagent bevatten de duur (bijv.: “Agent completed · 3h 2m 5s”). Het commando /model geldt alleen voor de huidige sessie (druk op d om de permanente standaard in te stellen). De hernoeming “extra usage” → “usage credits” verduidelijkt de terminologie, en het oplossen van een opstartblokkade tot 75 seconden wanneer api.anthropic.com ontoegankelijk is (VPN, firewall) verbetert de ervaring in enterprise-omgevingen.

Versie 2.1.145 onderscheidt zich door de introductie van claude agents --json, een commando dat is ontworpen voor integratie in shellscripts (tmux-resurrect, statusbalken, sessiekiezers). De OpenTelemetry-tracing is uitgebreid met agent_id en parent_agent_id in de spans, waardoor een correcte hiërarchie van subagents mogelijk wordt. Het scherm /plugin toont voortaan de volledige inhoud (commando’s, agents, skills, hooks, MCP/LSP-servers) vóór installatie. De hooks Stop/SubagentStop krijgen twee nieuwe velden: background_tasks en session_crons.

🔗 CHANGELOG Claude Code


Anthropic opent het denken over de vorming van het karakter van AI

19 mei — Anthropic heeft een artikel gepubliceerd waarin een initiatief wordt beschreven van regelmatige dialogen met filosofen, geestelijken en ethici uit meer dan 15 religieuze en culturele tradities. Het doel is de reflectie te verdiepen over wat het betekent om het karakter van een AI-systeem te vormen — voortbouwend op eeuwen van opgehoopte denktradities over deugd en het goede leven, zonder Claude af te stemmen op één bepaalde traditie.

Een experimenteel resultaat verdient aandacht: een tool die Claude tijdens een taak kan aanroepen om zijn eigen ethische verplichtingen opnieuw te lezen. Wanneer die spontaan werd gebruikt vóór acties met grote impact, liet hij “een duidelijke vermindering van niet-uitgelijnd gedrag” zien in interne evaluaties. De volgende stappen omvatten uitwisselingen met juristen, psychologen en civiele instellingen.

🔗 Anthropic-artikel


Cohere — MOU’s met Indra Group en Multiverse Computing

20 mei — Cohere ondertekent twee raamovereenkomsten (MOU) tijdens het staatsbezoek van koning Felipe VI van Spanje aan Canada. De eerste verbindt Cohere met IndraMind (de AI-divisie van de Spaanse groep Indra, actief in defensie en digitalisering) om een ecosysteem van soevereine AI te bouwen, inclusief taaladaptaties voor de vijf officiële talen van Spanje. Een defensietraject voorziet analyse- en planningsmogelijkheden voor multinationale oefeningen. De tweede betreft Multiverse Computing (quantum-geïnspireerde AI-optimalisatie, Spanje/Canada) om commerciële kansen in Europa en Canada te verkennen.

“Enterprises no longer want to rent AI — they want to own it.”

🇳🇱 Bedrijven willen AI niet langer huren — ze willen het bezitten.Aidan Gomez, medeoprichter en CEO van Cohere


Perplexity — Op de vraag afgestemde contextcompressie in productie

20 mei — Perplexity zet in productie een systeem voor contextcompressie (query-aware context compression) uit dat contexttokens tot wel 70% vermindert terwijl de nauwkeurigheid van antwoorden verbetert. Het principe: een licht model extraheert chirurgisch de passages die relevant zijn voor de vraag voordat ze worden doorgegeven aan het hoofd-LLM, waarbij advertenties, metadata en off-topic inhoud worden verwijderd.

MetriekWaarde
Vermindering contexttokenstot 70%
Winst aan vitale inhoud per excerpt+63%
Vermindering inferentielatentie35–40%
Vermindering geaggregeerde GPU-berekening40–45%
Productielatentie (p99)< 20 ms

De pplx-diffusion-backbone (17 lagen, gedistilleerd uit 28 lagen) voorspelt parallel welke segmenten behouden moeten blijven zonder tekstgeneratie — een extractieve aanpak die de betrouwbaarheid van citaten garandeert. Op SimpleQA haalt de preset “medium” met compressie 95% nauwkeurigheid met gemiddeld slechts 200 tokens per document.

🔗 Aankondiging van Perplexity


ElevenLabs — Speech Engine, een spraakagent in één prompt

20 mei — ElevenLabs lanceert Speech Engine, een uniforme spraakpipeline (spraaksynthetisatie + transcriptie + orchestratie) waarmee ontwikkelaars een tekstgebaseerde conversationele agent met één prompt kunnen omzetten in een complete spraakagent. Beschikbaar in ElevenAPI, met een prijs van 8 cent per minuut en volumekorting. Migratie naar ElevenAgents is mogelijk voor extra uitrolkanalen met monitoring en analytics.

🔗 Aankondiging van ElevenLabs


Luma Agents integreert Seedance 2.0

19 mei — Luma Agents integreert Seedance 2.0, het videogeneratiemodel van ByteDance, in zijn platform voor creatieve agents. Dezelfde workflow als de andere modellen die al zijn geïntegreerd. Deze integratie vergroot de keuze aan modellen die via Luma Agents toegankelijk zijn, waardoor het platform zich positioneert als een hub voor multi-modelorchestratie voor AI-video.

🔗 Aankondiging van Luma


Kling AI in Cannes — House of David, eerste Hollywoodfilm met AI op industriële schaal

20 mei — Op het Filmfestival van Cannes 2026 bevestigt Kling AI het industriële gebruik van zijn technologie in House of David (Prime Video): 44 miljoen wereldwijde kijkers, top 10 van nieuwe series in de Verenigde Staten, nummer 1 op Prime Video US. Dit is de eerste Hollywoodproductie die publiekelijk de integratie van AI-videogeneratie in zijn productiepijplijn op grote schaal erkent, met coherente shots die voldoen aan strikte industriële normen.

🔗 Aankondiging van Kling AI


Kort nieuws

  • Running Guide Agent — Google DeepMind — Persoonlijke AI-agent gericht op hardlooptraining, gepresenteerd als “een stap naar hardlopen zonder grenzen”. 🔗 DeepMind-blog

  • Midjourney V8.1 — vlag --no opnieuw geïntroduceerd — De anti-promptingvlag is terug in V8.1 om elementen uit gegenereerde afbeeldingen uit te sluiten (bijv. --no people). 🔗 Aankondiging @midjourney

  • Anthropic /usage vernieuwd in Claude Code — Boris Cherny bevestigt een herziening van de /usage-UI om het tokenverbruik bij het beantwoorden van een gebruiker beter te visualiseren. 🔗 bron

  • MiniMax Speech 2.8 Turbo — 600+ stemmen op Together AI — Meer dan 600 nieuwe Speech 2.8 Turbo-stemmen zijn nu beschikbaar op het Together AI-platform. 🔗 Aankondiging @MiniMax_AI


Wat dit betekent

Fundamenteel onderzoek en autonome AI. De oplossing van de vermoede stelling van Erdős door een algemeen inzetbaar OpenAI-model is niet anekdotisch. Wat de betrokken wiskundigen opvalt, is de aard van het resultaat: een onverwachte verbinding tussen twee takken van de wiskunde (algebraïsche getaltheorie en discrete meetkunde), gedragen door 125 pagina’s van coherent redeneren. In combinatie met Gemini for Science (ontwikkeld met 100+ instellingen) is de trend duidelijk: AI begint niet langer alleen als hulpmiddel voor het verwerken van wetenschappelijke gegevens te worden geïntegreerd, maar als ontdekkingspartner die originele hypothesen kan genereren.

Alternatieve architecturen naast het autoregressieve paradigma. Twee aankondigingen van vandaag zetten het dominante GPT-style-model op losse schroeven. NVIDIA Nemotron-Labs-Diffusion genereert tokens parallel via diffusie in plaats van sequentieel. Stable Audio 3.0 van Stability AI laat zien dat diffusie hoogwaardige muzikale resultaten oplevert met open weights-modellen op 4 implementatieniveaus. De convergentie van deze benaderingen suggereert dat diffusie niet langer beperkt is tot beeldgeneratie — het wordt een serieus concurrerende architectuur voor tekst en audio.

Soevereiniteit en enterprise-AI. Command A+ (MoE 218B open-source, Apache 2.0, 2× H100) en de MOU’s van Cohere met Indra Group en Multiverse Computing illustreren een onderliggende trend: grote organisaties — overheden, defensie, gereguleerde sector — willen hun modellen in hun eigen infrastructuur uitrollen. De combinatie van een efficiënte MoE-architectuur (25B actief op 218B totaal) en een Apache 2.0-licentie maakt Command A+ tot het best gepositioneerde open-source model voor soevereine implementaties eind mei 2026.

Groeiende druk op ontwikkeltools. Claude Code 2.1.144 en 2.1.145, de vier gelijktijdige updates van GitHub Copilot en de contextcompressie van Perplexity (-70% tokens, -40% GPU) zijn consistente signalen: de concurrentie verschuift van de ruwe kwaliteit van modellen naar de ergonomie van tools, scriptbaarheid (claude agents —json), inferentiekosten (Auto model selection -10%, pplx-diffusion) en robuustheid in productie (de oplossing voor de VPN-blokkering in Claude Code).


Bronnen