Anthropic avslöjar recursive självimprovement hos AI, NVIDIA Nemotron 3 Ultra öppen källkod, Suno tar in 400M USD

Den 4 juni 2026 inleds med en historisk publicering från Anthropic Institute: AI påskyndar redan sin egen utveckling, med mer än 80 % av Anthropics kod skriven av Claude och en produktivitetsökning på ×8. Samtidigt släpper NVIDIA Nemotron 3 Ultra, en MoE-modell med 550 miljarder parametrar och helt öppen källkod för agenter. OpenAI lanserar Dreaming v3, en ny minnesarkitektur för ChatGPT som är 5× billigare. GitHub Copilot passerar gränsen för en miljon tokens i kontext. Och Suno meddelar en Serie D-runda på 400 miljoner dollar, vilket värderar bolaget till 5,4 miljarder dollar.

Anthropic Institute — “When AI builds itself” : dokumenterad recursive självimprovement

4 juni — The Anthropic Institute publicerar “When AI builds itself”, den första officiella dokumentationen, med interna siffror som stöd, av utvecklingen mot möjlig recursive självimprovement hos AI. Medförfattarna Marina Favaro och Jack Clark presenterar interna data från maj 2026 som visar att Claude nu skriver majoriteten av Anthropics kod.

Indikator	Värde (maj 2026)
Andel av Anthropics kod skriven av Claude	>80 % av raderna som mergas i produktion
Produktivitetsökning kod/ingenjör	×8 under Q2 2026 jämfört med 2024
Framgångsgrad för öppna uppgifter	76 % (+50 poäng på 6 månader)
Speedup för kodoptimering (Mythos Preview)	~52× jämfört med ~3× för Opus 4 (maj 2025)
Forskningsbeslut bättre än människa	64 % (Mythos Preview jämfört med 51 % för Opus 4.5 i nov. 2025)
Intern enkät — uppskattad produktivitetsökning	×4 med Mythos Preview (130 anställda, mars 2026)

Utvecklingen av autonom uppgiftstid är särskilt slående: Claude Opus 3 hanterade uppgifter på omkring 4 minuter i mars 2024, Claude Sonnet 3.7 nådde 1,5 timmar i mars 2025, Claude Opus 4.6 arbetar över 12 timmar i mars 2026, och Mythos Preview passerar 16 timmar (gränsen för mätning i METR-benchmarket) i maj 2026. Tiden fördubblas ungefär var 4:e månad.

Ett konkret resultat: i april 2026 löste Claude-agenter ett öppet AI-säkerhetsproblem från början till slut — hypoteser, tester, iterationer — och återhämtade 97 % av prestandavinsten, jämfört med 23 % för två mänskliga forskare under en vecka, till en kostnad på omkring 18 000 dollar i beräkning på 800 ackumulerade timmar.

Artikeln utforskar tre scenarier: en platå (bedömd som minst sannolik), en substantiell automatisering med strategisk mänsklig ledning, och full recursive självimprovement där modeller bygger sina efterträdare utan mänsklig inblandning. Artikeln avslutas med en uttrycklig uppmaning till en koordinerad och verifierbar paus i frontier-utvecklingen av AI, villkorad av att andra stora labb deltar.

“Our internal data shows Claude is accelerating AI development—a possible path to recursive self-improvement, or AI autonomously building a more capable successor. It’s happening faster than we thought, and the implications deserve greater attention.”

🇸🇪 Våra interna data visar att Claude påskyndar AI-utvecklingen — en möjlig väg mot recursive självimprovement, eller att AI autonomt bygger en mer kapabel efterträdare. Detta sker snabbare än väntat, och konsekvenserna förtjänar ökad uppmärksamhet. — @AnthropicAI

🔗 Anthropic Institute-artikel

NVIDIA Nemotron 3 Ultra — 550B MoE med öppen källkod för långvariga agenter

4 juni — NVIDIA släpper Nemotron 3 Ultra, en frontier-modell med öppen källkod och 550 miljarder parametrar, särskilt utformad för långvariga AI-agenter (long-running agents). Lanseringen är den faktiska konkretiseringen av de öppna vikterna — efter den ursprungliga tillkännagivandet under Microsoft Build den 2 juni är vikterna nu tillgängliga på HuggingFace och via Ollama Cloud.

Egenskap	Värde
Arkitektur	Hybrid Mamba-Transformer MoE
Totala parametrar	550 miljarder
Aktiva parametrar	55 miljarder (NVFP4)
Inferenshastighet	5× snabbare än jämförbara frontier-modeller med öppen källkod
Kostnadsminskning för agenter	-30%
HuggingFace-vikter	`nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4`
Molnåtkomst	Ollama Cloud
Stödda agent-harnesses	OpenClaw, Hermes Agent (NousResearch), LangChain

Den hybrida arkitekturen Mamba-Transformer MoE gör det möjligt att genomföra fler resonemangscykler inom samma tidsbudget — det är detta som förklarar hastighetsvinsten. Nemotron 3 Ultra är eftertränad för komplexa uppgifter: avancerad coding, djupgående forskning, planering, verktygsanvändning och återhämtning efter misslyckanden.

NVIDIA publicerar också de syntetiska data och efterträningsrecept som gör det möjligt för externa team att reproducera eller finjustera processen.

“Today we’re shipping Nemotron 3 Ultra. A 550B MoE frontier-intelligence open model built for long-running agents. It delivers 5x faster inference and lowers the cost of complex agentic tasks by up to 30% versus other open frontier models.”

🇸🇪 I dag levererar vi Nemotron 3 Ultra. En frontier-nivå MoE-modell med öppen källkod och 550 miljarder parametrar, utformad för långvariga agenter. Den ger 5× snabbare inferens och minskar kostnaden för komplexa agentuppgifter med 30 % jämfört med andra frontier-modeller med öppen källkod. — @NVIDIAAI

🔗 HuggingFace — Nemotron 3 Ultra

Dreaming v3 — en ny minnesarkitektur för ChatGPT

4 juni — OpenAI lanserar Dreaming v3, en helt omarbetad autonom minnesarkitektur för ChatGPT. Systemet löser de tre begränsningarna i den tidigare mekanismen: informationsfärskhet, korrigering över tid och uppskalning till Free-användare.

Mål	Beskrivning
Kontextuell kontinuitet	Minnas information en gång, återanvända den i framtida samtal
Respekt för preferenser	Tillämpa personliga begränsningar (kost, tidszon, etc.)
Tidsmässig uppdatering	Revidera minnen automatiskt — efter en resa vet AI:n att du är tillbaka

Systemets historia: de saved memories kom i april 2024 (manuell deklaration), sedan “Dreaming v0” i april 2025 (automatisk summering i bakgrunden). Version 3 är arkitektoniskt autonom, cirka 5× billigare att serva — det är denna kostnadsminskning som gjorde det möjligt att utöka till Free-användare.

Tillgänglighet: i dag för abonnenterna Plus och Pro i USA; expansion till andra länder och till användare av Free och Go väntas under de kommande veckorna.

En sida “Memory Summary” gör det möjligt att se en läsbar sammanfattning av vad ChatGPT vet om användaren, lägga till eller korrigera information och definiera regler för vilka ämnen som ska tas upp.

🔗 openai.com — Dreaming

Suno Serie D — 400 miljoner dollar till en värdering på 5,4 miljarder dollar

3 juni — Suno tillkännager en finansieringsrunda Serie D på 400 miljoner dollar, vilket värderar den generativa musikplattformen till 5,4 miljarder dollar. Rundan leds av Bond Capital, med deltagande från nya investerare (IVP, USV — Union Square Ventures, Forerunner Ventures) samt fortsatt stöd från Matrix VC, Lightspeed och Menlo Ventures.

Värderingsutvecklingen är anmärkningsvärd: 125 miljoner dollar togs in i maj 2024, därefter 250 miljoner dollar i november 2025 till en värdering på 2,45 miljarder dollar, och nu 5,4 miljarder dollar — alltså mer än det dubbla på sju månader.

Suno positionerar sig som en av världens bäst finansierade kreativa AI-plattformar, med ett uppdrag som varit konstant: att göra det möjligt för fler människor att uppleva glädjen i att skapa musik, utan tekniska hinder.

“We’re thrilled to announce Suno’s next chapter: a $400M Series D at a $5.4B valuation!”

🇸🇪 Vi är glada att kunna tillkännage nästa kapitel för Suno: en Serie D på 400 miljoner dollar till en värdering på 5,4 miljarder dollar! — @suno

🔗 Suno-bloggen — The Next Chapter

GitHub Copilot — 1M tokens kontextfönster och konfigurerbart resonemang

4 juni — GitHub Copilot lägger till två nya stora funktioner som finns tillgängliga från och med i dag i VS Code, Copilot CLI och GitHub Copilot-appen.

Funktion	Tillgänglighet	Påverkan på AI-krediter
Kontextfönster på 1M tokens	VS Code, Copilot CLI, Copilot-app	Högre
Konfigurerbara resonemangsnivåer	VS Code, Copilot CLI, Copilot-app	Högre

Kontextfönstret på en miljon tokens gör det möjligt att arbeta med större kodbaser, längre dokument och komplexa flerfilsprojekt utan att tappa tråden. Tidigare tvingade kontextbegränsningar utvecklare att fragmentera sitt arbete eller förenkla sina förfrågningar i komplexa projekt.

De konfigurerbara resonemangsnivåerna gör det möjligt att kalibrera balansen mellan hastighet och djup och aktivera “extended thinking” (extended thinking) för de mest komplexa arkitektur- och felsökningsutmaningarna. GitHub rekommenderar att de maximala inställningarna reserveras för komplexa flerfilsproblem — användning av utökad kontext eller högre resonemang förbrukar fler AI-krediter per interaktion.

Utökningen till fler Copilot-gränssnitt är planerad till de kommande veckorna.

🔗 GitHub Changelog — Större kontextfönster

GitHub Copilot — uppdateringar den 4 juni

Copilot i Visual Studio — Uppdatering i maj 2026

4 juni — Uppdateringen för maj 2026 för Copilot i Visual Studio 2026 förbättrar planering och samarbetsgranskning.

Agent Plan: utforskar repositoryt i skrivskyddat läge, ställer förtydligande frågor och genererar en detaljerad plan som sparas i .copilot/plans/plan-{titre}.md. En knapp “Implement plan” växlar till agentläge.
Skills-panel: listar alla upptäckta agentförmågor från arbetsytan och användarprofilen, med sökning på namn eller nyckelord.
Sammanfattande diff för flera filer: efter Copilot-ändringar i flera filer finns en “change summary”-vy för att acceptera eller återställa ändringar globalt, per fil eller per block.
Indikator för användning av kontextfönster: ikon högst upp i inmatningsfältet med alternativet “Summarize conversation” för att frigöra utrymme.
Lägga till commits i kontext: högerklicka på en commit i Git History för att bifoga den som kontext i Copilot Chat.

🔗 GitHub Changelog — Visual Studio majuppdatering

Copilot Chat på github.com — rikare PR-kontekst (allmän tillgänglighet)

4 juni — Copilot Chat går från förhandsvisning för allmänheten till allmän tillgänglighet för alla med en Copilot-licens, med utökade möjligheter när man arbetar med diffs och pull requests på github.com.

Kod och chatt sida vid sida: granska konversationen direkt bredvid koden, kommentarer och ändringar inline utan att växla mellan PR:n och chattfönstret.
Automatiskt inläst kontext: när en fråga gäller en diff eller en PR injiceras relevant kontext automatiskt — inget behov av att kopiera och klistra in utdrag.
Åtkomst: knappen “Ask about this diff” högst upp i varje diff, eller via dropdown-menyn när du markerar en kodrad.

🔗 GitHub Changelog — Copilot Chat PR-kontekst

Claude Code v2.1.162

3 juni — Version v2.1.162 av Claude Code innehåller flera viktiga UX-förbättringar och agentfixar.

Funktion	Beskrivning
`claude agents --json` + `waitingFor`	JSON innehåller nu blockeringsorsaken för en väntande session (t.ex. behörighetsprompt)
Bekräftad `/effort`-persistens	Tydlig bekräftelse när den valda nivån blir standard för nya sessioner
Autocomplete för slash-kommando	Ett klick fyller i kommandot i prompten utan att köra det — Enter för att bekräfta
Remote Control footer pill	Remote Control visas som en ihållande pill längst ned med länk till sessionen
Omnamngivning Windsurf → Devin Desktop	Uppdaterad i `/ide`, `/terminal-setup`, `/scroll-speed`

Bland fixarna: tyst blockering vid start om konfigurationskatalogen är skrivskyddad (Claude Code startar nu med en konfiguration i minnet), WebFetch-regler som inte tillämpades på förgodkända domäner, Windows-behörigheter med backslashes, och flera agentfixar (Ctrl+V-bilder, förlorade sessioner vid bakgrundskörning, terminalbredd på långa sessioner).

🔗 Releaser Claude Code v2.1.162

ElevenLabs — Flows Agent och partnerskap med Hasbro

Flows Agent i ElevenCreative

4 juni — ElevenLabs lanserar Flows Agent i sitt gränssnitt ElevenCreative. Användaren beskriver vad hen vill skapa och agenten bygger automatiskt hela pipelinen — genom att koppla samman fler än 50 bild- och videomodeller med röst-, musik- och ljudeffektverktygen som finns på plattformen, i en enda enhetlig canvas.

Ett “assist”-läge gör det möjligt för agenten att be om godkännande före varje betalningsoperation för att behålla kontroll över kostnaderna. Marknadsteam kan därmed kedja samman modaliteter och testa kreativa variationer över olika produkter, språk och format utan att manuellt konfigurera varje steg.

🔗 ElevenLabs Flows

ElevenLabs × Hasbro — licensierade karaktärsröster i Iconic Marketplace

3 juni — ElevenLabs samarbetar med Hasbro för att erbjuda officiella karaktärsröster (My Little Pony, Transformers, G.I. Joe) via Iconic Marketplace. Rösterna byggs i samarbete med Hasbro och de ursprungliga rösttalangerna, med tydligt definierade användningsrättigheter för utvecklare, företag och appskapare. Erbjudandet syftar till att kombinera AI-kreativitet med skydd av varumärkens immateriella rättigheter.

🔗 ElevenLabs × Hasbro-tweet

GPT-Rosalind — nya kapaciteter för life sciences

3 juni — OpenAI tillkännager en större uppdatering av GPT-Rosalind, dess specialiserade modell för forskning inom life sciences på enterprise-nivå. Modellen kombinerar de agentiska förmågorna i GPT-5.5 med förstärkt intelligens inom medicinsk kemi och genomik.

Benchmark	Domän	GPT-Rosalind-poäng	GPT-5.5-poäng	Tokenreduktion
LifeSciBench	Life sciences (6 domäner)	Bäst	—	—
MedChemBench	Medicinsk kemi	27,5 %	25,1 %	-7,2 %
GeneBench	Genomik	21,6 %	20,4 %	-31 %
LabWorkBench	wet lab-protokoll	63,2 %	55,8 %	-5,3 %

Två nya plugins är nu tillgängliga för alla Codex-användare: Life Sciences Research plugin (hämtning av källbelägg) och Life Sciences NGS Analysis plugin (bioinformatiska arbetsflöden för scRNA-seq, bulk RNA-seq). Novo Nordisk är den första tillkännagivna partnern. Tillgången utökas globalt till kvalificerade organisationer (legitim vetenskaplig forskning, stark styrning).

🔗 openai.com — GPT-Rosalind

Perplexity lanserar Main Street AI Accelerator med amerikanska SBA

4 juni — Perplexity lanserar Main Street AI Accelerator i samarbete med U.S. Small Business Administration (SBA). Programmet gör $25 miljoner i Perplexity Computer-krediter tillgängliga: $250 i krediter för upp till 100 000 berättigade företag, med hänvisning till USA:s 250-årsjubileum.

Berättigade är företag som får lån via SBA:s 7(a)-, 504- och mikrolån. Ansökningarna är ännu inte öppna; en väntelista finns på den dedikerade sidan. Initiativet är en del av Perplexitys strategi att föra Computer närmare den amerikanska lokala ekonomin, efter att företaget veckan innan tillkännagav de 400+ enterprise-integrationerna i Computer (Intuit QuickBooks, Vercel, Shopify, Canva).

🔗 Main Street AI Accelerator

Cohere tar hem förstapriset i NATO:s utmaning om agentisk AI

4 juni — Cohere vinner första plats i tävlingen NATO Agentic AI for Cognitive Warfare Innovation Challenge. Hela prispallen:

Cohere (1:a plats)
OpenMinds (2:a plats)
Ipsos & Thoughtworks (3:e plats, delad)

Tävlingen lyfter fram den växande rollen för agentisk AI när det gäller att hjälpa demokratiska nationer att förstå, förutse och bemöta informationshot. För Cohere bekräftar detta erkännande från NATO företagets position inom suverän AI för försvars- och offentlig sektor — en viktig inriktning sedan den transatlantiska fusionen med Aleph Alpha i april 2026.

🔗 Cohere — NATO-utmaningen

Pika — Group Chat med AI-agent på iOS

4 juni — Pika lanserar den första Group Chat integrerad med en AI-agent i sin app. Användare bjuder in sina kontakter till en gruppchatt där Pika Agent deltar i den kreativa konversationen — hjälper till att konfigurera en telefon, skapa memes i grupp och samarbeta kring korta videoformat. Tillgänglig nu på iOS via https://pika.me.

🔗 Pika-tweet

Kortnyheter

Anthropic-artikel — självbetjäningsanalys med Claude — Anthropic-teamet publicerar sina bästa praxis för att bygga självbetjäningsagenter för dataanalys med Claude: färdigheter (skills), datagrunder och utvärderingar. 🔗 Claude-bloggen
Google Antigravity v2.0.11 — Stabilitetspatch för IDE:n som drivs av Gemini: två åtgärdade fel (startstopp och knappen “Open IDE”), ingen ny funktionalitet. 🔗 Antigravity Changelog
GitHub Enterprise Teams GA — Enterprise Teams blir allmänt tillgängligt på GitHub Enterprise Cloud: grupper definieras en gång på företagsnivå, kan tilldelas alla organisationer och har SCIM, GitHub Apps och fullständig granskning. Upp till 2 500 team och 5 000 medlemmar per team. 🔗 GitHub Changelog
Genspark — lanseringspartner för Agent365 på Microsoft Build — Medgrundaren Ray Zhong framträdde på scenen vid Microsoft Build som global strategisk partner och lanseringspartner för Agent365, vilket integrerar agentisk AI i Microsofts befintliga enterprise-infrastruktur. 🔗 Genspark-tweet
Cohere stöder Kanadas nationella AI-strategi — VD:n Aidan Gomez bekräftar Cohere:s kanadensiska förankring och välkomnar Kanadas nya nationella AI-strategi som ett viktigt steg mot teknologisk suveränitet och utvecklingen av nästa generations AI i landet. 🔗 Cohere-tweet

Vad det betyder

AI:s självförbättring går från teoretiskt scenario till uppmätta interna data. Anthropic Institutes publicering är ingen spekulation — det är en fältrapport med exakta siffror: >80% av koden, ×8 produktivitet, 76% lyckandefrekvens på öppna uppgifter. Den autonoma uppgiftslängden som fördubblas var fjärde månad är den mest konkreta signalen om den pågående dynamiken. Det som diskuterades i AI-säkerhetskretsar som en framtida risk är nu dokumenterat som en nuvarande verklighet. Uppmaningen till ett samordnat pausläge — med Anthropic som första avsändare — visar spänningen mellan kommersiell konkurrens och regulatorisk försiktighet.

Frontier-nivå open source ändrar skala. Nemotron 3 Ultra med 550 miljarder parametrar — helt open source, nedladdningsbara vikter, syntetiska data och publicerade recept — omdefinierar vad “open source” betyder för frontier-modeller. Den 5× högre inferenshastigheten och 30% lägre kostnaden för agentiska uppgifter är inte marginella: de gör det möjligt att köra komplexa agenter utanför de stora proprietära molnen. För team som bygger autonoma agenter innebär det en ny infrastruktur.

Utvecklarverktygen konsolideras kring den långlivade agenten. GitHub Copilot med 1M tokens i kontext, Claude Code v2.1.162 med waitingFor i JSON agents, och Flows Agent från ElevenLabs som bygger multimodala pipelines — dessa tre annonseringar delar samma paradigm: agenten måste hantera långa kontexter, kommunicera sitt tillstånd till andra system och orkestrera flera verktyg utan mänsklig inblandning. Copilots “konfigurerbara resonemang” och Claude Codes persistenta /effort svarar på samma fråga: hur kan användaren kalibrera tänkandets djup efter uppgiftens komplexitet?

Den kreativa AI-ekonomin når en symbolisk milstolpe. Sunos värdering på $5,4 miljarder på sju månader — med en fördubbling av värdet — signalerar att investerare satsar på en plattform för generativ musikskapande i stor konsumentskala. Tillsammans med de senaste kapitalrundorna inom video (Runway, Pika) har AI-skapandebranschen nu en kapitalisering som kan jämföras med de stora traditionella kreativa mjukvaruutgivarna. Hasbros inträde i ElevenLabs Iconic Marketplace illustrerar hur rättighetsinnehavare anpassar sig: i stället för att blockera AI tjänar de pengar på den genom licensiering.