OpenAI motbevisar en 80 år gammal Erdős-gissning, Cohere Command A+ open-source, NVIDIA Nemotron-Labs-Diffusion

Den 20 maj 2026 bryter sig AI in i den grundläggande matematiken: en OpenAI-modell motbevisar en gissning av Paul Erdős som formulerades 1946, på ett 125 sidor långt bevis som verifierats av matematiker, däribland Fieldsmedaljören Tim Gowers. På modellfronten släpper Cohere Command A+ som open-source under Apache 2.0 (MoE-arkitektur med 218B/25B aktiva), NVIDIA lanserar Nemotron-Labs-Diffusion med parallell token-generering, och Stability AI presenterar Stable Audio 3.0 (4 modeller med öppna vikter). På verktygssidan utvecklas GitHub Copilot på fyra fronter samtidigt, och Claude Code släpper två versioner inom 24 timmar.

OpenAI motbevisar en 80 år gammal gissning av Erdős

20 maj — OpenAI har publicerat ett nytt resultat: en intern allmän resonemangsmodell har löst det plana enhetsavståndsproblemet (planar unit distance problem), en fråga som varit öppen sedan Paul Erdős ställde den 1946. Problemet handlar om det maximala antalet punktpar på exakt avstånd 1 bland n punkter i planet. Sedan 1940-talet trodde den matematiska gemenskapen att Erdős rutnätskonstruktioner i praktiken var optimala.

Modellen producerade ett bevis som visar att det finns en oändlig familj av konfigurationer som överskrider den gissade gränsen, med en exponent δ = 0,014 fastställd av Will Sawin (Princeton). Genombrottet bygger på ett oväntat matematiskt verktyg: oändliga klasskroppstorn och Golod-Shafarevich-teorin, hämtade från algebraisk talteori, tillämpade på ett elementärt problem inom euklidisk geometri. Denna koppling mellan två på förhand avlägsna fält är, enligt de inblandade matematikerna, kärnan i resultatets originalitet.

Aspekt	Detalj
Problem	Plana enhetsavstånd (Erdős, 1946)
Tidigare gräns	Tillväxt i n^(1+C/loglog(n)) (Spencer-Szemerédi-Trotter, 1984)
Nytt resultat	n^(1+δ), δ = 0,014
Matematiskt verktyg	Algebraisk talteori (Golod-Shafarevich)
Modell	Intern allmän resonemangsmodell (ej namngiven)
Längd på kedja av tankar	125 sidor
Validering	Grupp externa matematiker + medföljande artikel

Det som gör resultatet särskilt anmärkningsvärt är att det inte producerades av ett system som tränats specifikt för matematik eller som var riktat mot detta problem. Det är en modell för allmänt bruk, utvärderad på en samling Erdős-problem som en del av en bredare utforskning av autonoma forskningsförmågor.

Tim Gowers (Fieldsmedalj) beskriver resultatet som “a milestone in AI mathematics”. Arul Shankar (Princeton) går längre:

“In my opinion this paper demonstrates that current AI models go beyond just helpers to human mathematicians – they are capable of having original ingenious ideas, and then carrying them out to fruition.”

🇸🇪 Enligt min mening visar den här artikeln att dagens AI-modeller går bortom rollen som enkla assistenter för matematiker — de kan komma med originella och uppfinningsrika idéer och driva dem i mål. — [Arul Shankar, talteoretiker, Princeton]

OpenAI ser i detta resultat en signal för grundforskningen: om en modell kan upprätthålla ett komplext resonemang över 125 sidor och koppla samman avlägsna matematiska områden, är dessa förmågor överförbara till biologi, fysik, materialvetenskap och medicin.

🔗 OpenAI-artikel

Cohere Command A+ — MoE-flaggskepp open-source

20 maj — Cohere lanserar Command A+, sin starkaste modell hittills, som open-source under Apache 2.0-licens. Mixture-of-experts-arkitekturen (sparse MoE) använder 218B parametrar totalt men bara 25B aktiva vid varje inferens, vilket gör att den kan köras på två NVIDIA H100-GPU:er eller en enda Blackwell-GPU (B200) med W4A4-kvantisering.

Command A+ förenar i en enda modell de förmågor som tidigare var uppdelade mellan Command A Reasoning, Command A Vision och Command A Translate. Den stöder 48 språk (jämfört med 23 i tidigare versioner), med en förbättrad tokeniserare för icke-europeiska språk (+20% för arabiska, +16% för koreanska, +18% för japanska).

Benchmark	Command A+	Command A Reasoning
τ²-Bench Telecom	85%	37%
Terminal-Bench Hard	25%	3%
MMMU	75,1%	N/A
MathVista	80,6%	73,5%
North Agentic QA	+20% förbättring	referens
North Data Analysis	+32% förbättring	referens

Modellen är upp till 2× snabbare och 30% mindre latent än Command A Reasoning, med spekulativ avkodning (speculative decoding) som ger en ytterligare förbättring på 1,5–1,6×. Tillgänglig på Hugging Face och via vLLM. Poängen 37 på Artificial Analysis Intelligence Index gör den till den bästa bland open-source-modellerna.

“Introducing: Cohere Command A+ — We’ve created our most powerful LLM yet, optimized it to run on as little hardware as possible, and released it open-source for all.”

🇸🇪 Här är Cohere Command A+ — vi har skapat vår kraftfullaste LLM hittills, optimerad för att fungera med så lite hårdvara som möjligt, och släpper den som open-source för alla. — @cohere på X

🔗 Cohere-blogg

Gemini for Science — AI som partner i vetenskaplig upptäckt

20 maj — Tillkännagiven under Google I/O 2026 och twittrad den 20 maj, är Gemini for Science en svit av experimentella verktyg för vetenskaplig forskning. Mot bakgrund av den explosionsartade datamängden är målet att göra det möjligt för forskare att koppla samman information som ingen enskild individ kan hantera på egen hand.

Tre experimentella verktyg presenteras:

Verktyg	Grund	Funktion
Hypothesis Generation	Co-Scientist	Upptäckt och förfining av nya hypoteser
Computational Discovery	AlphaEvolve + ERA	Test av tusentals kodvariationer parallellt
Science Skills	30+ bio-modeller	Integrerat paket för agentiska plattformar (Antigravity)

Computational Discovery är det mest tekniska verktyget: det genererar och utvärderar tusentals kodvariationer parallellt, vilket gör det möjligt att testa nya modelleringsmetoder inom epidemiologi, kemi eller beräkningsbiologi på en bråkdel av den vanliga tiden.

Science Skills integrerar data från mer än 30 stora modeller inom life science och databaser, och ansluter till agentiska plattformar för att automatisera komplexa manuella arbetsflöden på bara några minuter.

Projektet har utvecklats med 100+ partnerinstitutioner, från doktorander till Nobelpristagare.

🔗 Tillkännagivande @GoogleAI

NVIDIA Nemotron-Labs-Diffusion — Token-diffusionsarkitektur

20 maj — NVIDIA tillkännager Nemotron-Labs-Diffusion, en språkmodell som genererar tokens parallellt via diffusion, till skillnad från klassiska autoregressiva LLM:er som producerar en token i taget. Denna arkitektur — inspirerad av diffusionsmodeller för bildgenerering — syftar till att snabba upp inferensen samtidigt som utmatningskvaliteten bibehålls.

Metoden skiljer sig grundläggande från det standardiserade transformerparadigmet: i stället för att sekventiellt förutsäga varje token villkorad av de föregående, itererar modellen parallellt över en hel sekvens av brusiga tokens, tills konvergens. De teoretiska fördelarna omfattar lägre latens för långa utdata och bättre parallellisering på GPU.

Aspekt	Klassisk (autoregressiv)	Nemotron-Labs-Diffusion
Generering	Token för token, sekventiellt	Parallellt över hela sekvensen
Latens vid långa utdata	Ökar linjärt	Potentiellt reducerad
Paradigm	GPT-style	Diffusion-style

Den fullständiga tekniska rapporten följer med utgåvan. Det rör sig om ett forskningsbidrag från NVIDIA Labs, positionerat som ett arkitektoniskt alternativ till den dominerande autoregressiva transformer-modellen — ett aktivt forskningsfält sedan uppkomsten av textdiffusionsmodeller som MDLM och Plaid.

🔗 Tillkännagivande @NVIDIAAI

Stability AI — Stable Audio 3.0 (familj med open weights)

20 maj — Stability AI publicerar Stable Audio 3.0, en familj med 4 audio-modeller med open weights och kommersiell licens. Serien täcker hela spektrumet för driftsättning, från inbyggda enheter till företags-API.

Modell	Maxlängd	Driftsättning	Open weights
Small SFX	kort	on-device	Ja
Small	2 min	on-device	Ja
Medium	6:20	cloud/local	Ja
Large	6:20+	API/företag	Nej

Modellerna Small SFX, Small och Medium finns tillgängliga på Hugging Face. Alla träningsdata är fullt licensierade, med tillkännagivna partnerskap med Universal Music Group och Warner Music Group. Avancerade funktioner inkluderar stöd för LoRA training för anpassad finjustering, och ett audio inpainting-läge (single-segment-redigering, multi-segment, kausal fortsättning).

“We want to foster the same kind of community-driven innovation in audio that we sparked in image generation with the launch of Stable Diffusion.”

🇸🇪 Vi vill främja samma typ av community-driven innovation inom ljud som den vi satte igång inom bildgenerering med lanseringen av Stable Diffusion. — Stability AI

GitHub Copilot utvecklas på fyra fronter

Adaptiv Auto model selection i VS Code

20 maj — Copilots “Auto”-alternativ i VS Code väljer nu den optimala modellen beroende på uppgiftens art: komplext resonemang, enkel kodgenerering, felsökning eller orkestrering av verktyg. Urvalet bygger på realtidsmått för tillgänglighet och tillförlitlighet. Praktisk fördel: 10% lägre premiumförfrågningsmultiplikator när Auto används, utan att någon konfiguration behövs.

🔗 GitHub-changelog

Semantisk sökning efter issues på naturligt språk

20 maj — Copilot Chat på webben integrerar ett semantiskt index över issues: en utvecklare kan söka på “mobile rendering bugs reported last month” utan att känna till den exakta titeln, och få resultat grupperade efter sammanhang. Tillgänglig i allmän tillgänglighet för alla Copilot-planer.

🔗 GitHub-changelog

Borttagning av Gemini-modeller från Copilot Chat web

20 maj — Alla Gemini-modeller tas bort från Copilot Chat på github.com, liksom GPT-5.2 Codex och GPT-5.4 nano. Endast OpenAI och Claude finns kvar tillgängliga på webben. GitHub motiverar valet med enhetlig kvalitet i svaren. Gemini finns fortfarande tillgängligt i IDE:er och API:t.

🔗 GitHub-changelog

Fix with Copilot — samlad tillämpning av kodgranskningsfeedback

19 maj — Knappen “Implement suggestion” byter namn till “Fix with Copilot” med en ny dialogruta (val av modell, målbranch, anpassade instruktioner). En ny knapp “Fix batch with Copilot” gör det möjligt att gruppera flera kommentarer från code review och överlämna dem samtidigt till Copilot cloud agent, vilket minskar friktionen i PR:er med många kommentarer.

🔗 GitHub-changelog

Claude Code v2.1.144 och v2.1.145

19 maj — Claude Code släpper två versioner inom 24 timmar med en omfattande uppsättning nya funktioner och korrigeringar.

Version 2.1.144 förbättrar hanteringen av bakgrundssessioner: kommandot /resume visar nu sessionerna --bg, och notifikationer när en sub-agent avslutas inkluderar varaktigheten (t.ex. “Agent completed · 3h 2m 5s”). Kommandot /model gäller endast den aktuella sessionen (tryck på d för att ställa in permanent standard). Omdöpningen “extra usage” → “usage credits” förtydligar terminologin, och rättningen av en startblockering på upp till 75 sekunder när api.anthropic.com är otillgänglig (VPN, brandvägg) förbättrar upplevelsen i företagsmiljöer.

Version 2.1.145 utmärker sig genom introduktionen av claude agents --json, ett kommando utformat för integration i shell-skript (tmux-resurrect, statusfält, sessionsväljare). OpenTelemetry-spårning berikas med agent_id och parent_agent_id i spans, vilket möjliggör en korrekt hierarki av sub-agenter. Skärmen /plugin visar nu hela innehållet (kommandon, agenter, skills, hooks, MCP/LSP-servrar) före installation. Hooks Stop/SubagentStop får två nya fält: background_tasks och session_crons.

🔗 CHANGELOG Claude Code

Anthropic öppnar reflektionen kring formandet av AI:s karaktär

19 maj — Anthropic har publicerat en artikel som beskriver ett initiativ med regelbundna dialoger med filosofer, präster och etikforskare från mer än 15 religiösa och kulturella traditioner. Målet är att berika reflektionen över vad det innebär att forma karaktären hos ett AI-system — med stöd i århundraden av ackumulerat tänkande om dygd och det goda livet, utan att anpassa Claude till en särskild tradition.

Ett experimentellt resultat förtjänar uppmärksamhet: ett verktyg som Claude kan anropa under en uppgift för att läsa igenom sina egna etiska åtaganden. När det användes spontant före handlingar med hög påverkan visade det “en tydlig minskning av icke-anpassade beteenden” i interna utvärderingar. Nästa steg kommer att omfatta samtal med jurister, psykologer och civila institutioner.

🔗 Anthropic-artikel

Cohere — MOU:er med Indra Group och Multiverse Computing

20 maj — Cohere skriver under två samförståndsavtal (MOU) under det spanske kung Felipe VI:s statsbesök i Kanada. Det första förenar Cohere med IndraMind (AI-grenen inom Indra-gruppen, spansk försvar och digitalisering) för att bygga ett ekosystem för suverän AI, inklusive språkanpassningar för Spaniens fem officiella språk. En försvarsdel planerar för kapaciteter för analys och planering vid multinationella övningar. Det andra involverar Multiverse Computing (kvantinspirerad AI-optimering, Spanien/Kanada) för att utforska affärsmöjligheter i Europa och Kanada.

“Enterprises no longer want to rent AI — they want to own it.”

🇸🇪 Företag vill inte längre hyra AI — de vill äga den. — Aidan Gomez, medgrundare och vd för Cohere

Perplexity — Resningskänslig kontextkomprimering i produktion

20 maj — Perplexity rullar ut ett system för kontextkomprimering i produktion (query-aware context compression) som minskar kontexttokens med upp till 70 % samtidigt som svarens precision förbättras. Principen: en lätt modell extraherar kirurgiskt de delar som är relevanta för frågan innan de skickas vidare till huvud-LLM:n, och eliminerar annonser, metadata och innehåll som inte hör till ämnet.

Metrik	Värde
Minskning av kontexttokens	upp till 70 %
Ökning av livsviktigt innehåll per utdrag	+63%
Minskning av inferenslatens	35–40%
Minskning av aggregerad GPU-beräkning	40–45%
Produktionslatens (p99)	< 20 ms

Backbonen pplx-diffusion (17 lager, distillerad från 28 lager) förutsäger parallellt vilka segment som ska behållas utan att generera text — en extraktiv metod som garanterar citatens korrekthet. På SimpleQA når presetet “medium” med komprimering 95 % precision med i genomsnitt bara 200 tokens per dokument.

🔗 Perplexitys tillkännagivande

ElevenLabs — Speech Engine, en röstagent i en prompt

20 maj — ElevenLabs lanserar Speech Engine, ett enhetligt röstpipeline (talsyntes + transkribering + orkestrering) som gör det möjligt för utvecklare att förvandla en textbaserad konversationsagent till en fullständig röstagent med en enda prompt. Tillgängligt i ElevenAPI, med prissättning på 8 cent per minut med volymrabatter. Migrering möjlig till ElevenAgents för ytterligare distributionskanaler med övervakning och analys.

🔗 ElevenLabs tillkännagivande

Luma Agents integrerar Seedance 2.0

19 maj — Luma Agents integrerar Seedance 2.0, ByteDances modell för videogenerering, i sin plattform för kreativa agenter. Samma arbetsflöde som för de andra redan integrerade modellerna. Denna integration breddar urvalet av modeller som är tillgängliga via Luma Agents och positionerar plattformen som ett nav för orkestrering av flera modeller för AI-video.

🔗 Lumas tillkännagivande

Kling AI i Cannes — House of David, första Hollywoodfilmen med AI i industriell skala

20 maj — Vid filmfestivalen i Cannes 2026 bekräftar Kling AI den industriella användningen av sin teknik i House of David (Prime Video): 44 miljoner globala tittare, topp 10 bland nya serier i USA, nummer 1 på Prime Video US. Det är den första Hollywoodproduktionen som offentligt erkänner integreringen av AI-videogenerering i sin storskaliga produktionspipeline, med sammanhängande planer som uppfyller strikta industriella standarder.

🔗 Kling AI:s tillkännagivande

Kortnytt

Running Guide Agent — Google DeepMind — Personlig AI-agent dedikerad till löpträning, presenterad som “ett steg mot löpning utan gränser”. 🔗 DeepMind-bloggen
Midjourney V8.1 — flaggan --no återinförd — Anti-prompting-flaggan är tillbaka i V8.1 för att utesluta element från genererade bilder (t.ex. --no people). 🔗 @midjourney tillkännagivande
Anthropic /usage omarbetad i Claude Code — Boris Cherny bekräftar en omarbetning av /usage-gränssnittet för att bättre visualisera tokenförbrukningen som svar på en användare. 🔗 källa
MiniMax Speech 2.8 Turbo — 600+ röster på Together AI — Över 600 nya röster i Speech 2.8 Turbo finns nu tillgängliga på Together AI-plattformen. 🔗 @MiniMax_AI tillkännagivande

Vad det betyder

Grundforskning och autonom AI. Att en allmän OpenAI-modell löser Erdős-förmodan är inte en bagatell. Det som slår de inblandade matematikerna är resultatets natur: en oväntad koppling mellan två grenar av matematiken (algebraisk talteori och diskret geometri), upprätthållen över 125 sidor av sammanhängande resonemang. Tillsammans med Gemini for Science (utvecklat med 100+ institutioner) är trenden tydlig: AI börjar integreras inte bara som ett verktyg för att bearbeta vetenskapliga data, utan som en upptäcktspartner som kan generera originella hypoteser.

Alternativa arkitekturer till det autoregressiva paradigmet. Två tillkännagivanden idag ifrågasätter den dominerande GPT-stilen. NVIDIA Nemotron-Labs-Diffusion genererar tokens parallellt med diffusion i stället för sekventiellt. Stability AIs Stable Audio 3.0 visar att diffusion ger musikaliskt högkvalitativa resultat med open weights-modeller på fyra distributionsnivåer. Konvergensen mellan dessa angreppssätt antyder att diffusion inte längre är begränsad till bildgenerering — den håller på att bli en seriös konkurrerande arkitektur för text och ljud.

Suveränitet och företags-AI. Command A+ (MoE 218B open-source, Apache 2.0, 2× H100) och Cohere:s MOUs med Indra Group och Multiverse Computing illustrerar en tydlig trend: stora organisationer — regeringar, försvar, reglerade sektorer — vill distribuera sina modeller i sin egen infrastruktur. Kombinationen av en effektiv MoE-arkitektur (25B aktiva av 218B totalt) och en Apache 2.0-licens gör Command A+ till den open-source-modell som är bäst positionerad för suveräna utrullningar i slutet av maj 2026.

Växande press på utvecklarverktyg. Claude Code 2.1.144 och 2.1.145, de fyra samtidiga uppdateringarna av GitHub Copilot och Perplexitys kontextkomprimering (-70% tokens, -40% GPU) är samstämmiga signaler: konkurrensen flyttar från modellernas råa kvalitet till verktygens användbarhet, scriptbarhet (claude agents —json), inferenskostnad (Auto model selection -10%, pplx-diffusion) och robusthet i produktion (fixen för VPN-blockeringen i Claude Code).

OpenAI motbevisar en 80 år gammal Erdős-gissning, Cohere Command A+ open-source, NVIDIA Nemotron-Labs-Diffusion

OpenAI motbevisar en 80 år gammal gissning av Erdős

Cohere Command A+ — MoE-flaggskepp open-source

Gemini for Science — AI som partner i vetenskaplig upptäckt

NVIDIA Nemotron-Labs-Diffusion — Token-diffusionsarkitektur

Stability AI — Stable Audio 3.0 (familj med open weights)

GitHub Copilot utvecklas på fyra fronter

Adaptiv Auto model selection i VS Code

Semantisk sökning efter issues på naturligt språk

Borttagning av Gemini-modeller från Copilot Chat web

Fix with Copilot — samlad tillämpning av kodgranskningsfeedback

Claude Code v2.1.144 och v2.1.145

Anthropic öppnar reflektionen kring formandet av AI:s karaktär

Cohere — MOU:er med Indra Group och Multiverse Computing

Perplexity — Resningskänslig kontextkomprimering i produktion

ElevenLabs — Speech Engine, en röstagent i en prompt

Luma Agents integrerar Seedance 2.0

Kling AI i Cannes — House of David, första Hollywoodfilmen med AI i industriell skala

Kortnytt

Vad det betyder

Källor

Innehållsförteckning