Karpathy ansluter till Anthropic, Google I/O 2026 lanserar Gemini 3.5:s agentiska era, Cohere förvärvar Reliant AI

Den 19 maj 2026 är en fullspäckad dag för AI: Andrej Karpathy lämnar scenen för att ansluta till Anthropic, Google I/O 2026 lanserar en rad agentiska tillkännagivanden kring Gemini 3.5-serien, xAI rullar ut Grok Skills med generering av Office-dokument, och Cohere gör ett strategiskt förvärv inom biopharma. Samtidigt stärker OpenAI spårbarheten för AI-innehåll och den generativa medievärlden får nya funktioner.

Andrej Karpathy ansluter till Anthropic

19 maj — Andrej Karpathy meddelade på X att han har anslutit till Anthropic. Nyheten genererade mer än 11,3 miljoner visningar, 102 000 gilla-markeringar och 13 000 delningar på några timmar — ett exceptionellt engagemang som visar hur stor betydelse rekryteringen har i communityn.

“Personal update: I’ve joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D. I remain deeply passionate about education and plan to resume my work on it in time.”

🇸🇪 Personlig uppdatering: jag har anslutit till Anthropic. Jag tror att de kommande åren vid LLM-gränsen kommer att bli särskilt formativa. Jag är mycket entusiastisk över att få gå med i teamet och återvända till FoU. Jag förblir djupt passionerad kring utbildning och planerar att återuppta det arbetet i sinom tid. — @karpathy på X

Karpathy är en av de mest välkända personerna i området. Hans resa: doktorsexamen vid Stanford, grundande medlem av OpenAI, AI-chef på Tesla, och därefter en oberoende profil med den pedagogiska serien nanoGPT och sina maskininlärningskurser som följts av miljontals människor.

Hans ankomst till Anthropic stärker avsevärt teamet för grundforskning just när konkurrensen mellan gränslaboratorierna intensifieras. En tidigare OpenAI-profil som går till Anthropic — signalen är stark om talangdynamiken i branschen.

Anthropic har inte specificerat hans exakta roll. Tillkännagivandet sammanfaller med evenemanget Code with Claude London och flera stora lanseringar samma dag.

Google I/O 2026 — Gemini 3.5:s agentiska era

19 maj — Google I/O 2026 äger rum i dag, med Gemini agentiska era (agentic Gemini era) som centralt tema. Google tillkännager under keynoten en sammanhängande uppsättning nyheter som alla kretsar kring Gemini:s förmåga att agera självständigt, proaktivt och ihållande.

“Three years ago, Gemini started by understanding the world. With Gemini 2, models learned to think and reason. Late last year, Gemini 3 brought any idea to life. Today, we’re continuing that journey with our Gemini 3.5 series, starting with Gemini 3.5 Flash, delivering frontier performance for agents and coding.”

🇸🇪 “För tre år sedan började Gemini med att förstå världen. Med Gemini 2 lärde sig modellerna att tänka och resonera. I slutet av förra året gav Gemini 3 liv åt vilken idé som helst. I dag fortsätter vi den här resan med vår Gemini 3.5-serie, med Gemini 3.5 Flash som först ut, och levererar topprestanda för agenter och kodning.” — @GoogleAI på X

De viktigaste tillkännagivandena under I/O 2026-keynoten:

Tillkännagivande	Kategori
Gemini 3.5 Flash	Ny modell (agenter + coding)
Gemini Omni	Multimodal videomodell
Gemini Spark	Personlig agent 24/7
Daily Brief	Personlig morgonagent
Neural Expressive	Ny appdesign
Managed Agents API	Antigravity-infrastruktur för utvecklare
Google AI Studio	Förnyad med agentmallar

🔗 Google I/O 2026-bloggen

Gemini 3.5 Flash — Hastighet och intelligens för agenter

19 maj — Gemini 3.5 Flash är den första modellen i den nya 3.5-generationen. Den är utformad för att kombinera toppmodern intelligens (frontier intelligence) och blixtsnabb handling (lightning-fast action), särskilt optimerad för agent- och kodningsanvändningsfall.

Gemini 3.5 Flash är den underliggande motorn för Antigravity-agenten (Managed Agents API) och Gemini Spark. Den är tillgänglig via Gemini API och i Google AI Studio från och med 19 maj.

Generation	Nyckelförmåga
Gemini 1	Förståelse av världen
Gemini 2	Resonemang och tänkande
Gemini 3	Multimodal skapande
Gemini 3.5 Flash	Agenter, coding, blixtsnabb hastighet

Modellen är också allmänt tillgänglig (generally available) i GitHub Copilot samma dag som lanseringen — på planerna Pro, Pro+, Business och Enterprise. GitHub rapporterar prestanda nära Pro-nivå med Flash-hastighet, effektiv verktygsanvändning, snabba svarstider och hög cacheeffektivitet. Utrullningen sker stegvis; administratörer för Copilot Enterprise och Business måste aktivera policyn Gemini 3.5 Flash i inställningarna.

Copilot-attribut	Värde
Berörda planer	Pro, Pro+, Business, Enterprise
Stödda IDE:er	VS Code, Visual Studio, JetBrains, Xcode, Eclipse, GitHub Mobile
Premium-multiplikator	14× (provisorisk, kan komma att ändras)

🔗 GitHub Copilot-annonsen

Gemini Omni — Skapa vad som helst från vad som helst

19 maj — Google DeepMind lanserar Gemini Omni, presenterad som “det första steget mot en modell som kan skapa vad som helst från vad som helst — med start i video”. Den kombinerar Gemini:s intelligens med Googles generativa mediesystem (Veo, Imagen).

“We’re dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video. It combines Gemini’s intelligence with our generative media systems - representing a leap forward in world understanding, multimodality, and editing.”

🇸🇪 “Vi lanserar Gemini Omni: vårt första steg mot en modell som kan skapa vad som helst från vad som helst — med start i video. Den kombinerar Gemini:s intelligens med våra generativa mediesystem och representerar ett stort språng framåt inom världsuppfattning, multimodalitet och redigering.” — @GoogleDeepMind på X

I Gemini-appen möjliggör Gemini Omni högkvalitativ filmisk videogenerering från text, bilder eller befintliga videor, videoredigering via naturlig konversation (filmiska zoomar, bakgrundsbyten med en enkel prompt), skapande av anpassade AI-avatarer som liknar användaren samt applicering av inbyggda mallar med ett tryck.

Tillgänglighet: Stegvis utrullning från och med 19 maj för Google AI Plus-, Pro- och Ultra-prenumeranter världen över.

Gemini Spark — Personlig agent 24/7

19 maj — Google tillkännager Gemini Spark, en personlig AI-agent tillgänglig dygnet runt, alla dagar i veckan. Det är ett grundläggande skifte i Gemini:s natur: den går från att vara en reaktiv assistent till att bli en aktiv partner som arbetar i bakgrunden även när användaren stänger sin enhet (molnarkitektur).

Spark körs på Gemini 3.5 Flash via Antigravity-infrastrukturen. Den är djupt integrerad med Workspace-verktygen (Gmail, Docs, Slides, Calendar).

Förmåga	Detalj
Återkommande uppgifter	Automatiska triggers (t.ex. analysera månadsutdrag)
Inlärning av färdigheter	På användarens instruktion
Kompletta arbetsflöden	Mötessammanfattning → Google Doc → uppföljningsmail
MCP-anslutningar	Canva, OpenTable, Instacart från lanseringen
Användarkontroll	Bekräftelse krävs före högpåverkande åtgärder

Tillgänglighet: Tester i betrodd miljö denna vecka; beta för Google AI Ultra-prenumeranter i USA veckan därpå. Ankomst till Gemini:s macOS-app planeras till sommaren 2026.

Managed Agents i Gemini API — Öppen Antigravity-infrastruktur

19 maj — Google lanserar Managed Agents i Gemini API, vilket gör det möjligt för utvecklare att distribuera agenter med en enda rad kod i en isolerad, tillfällig Linux-miljö. Infrastrukturen drivs av agenten Antigravity, byggd på Gemini 3.5 Flash.

Detta öppnar Googles interna agentinfrastruktur för externa utvecklare. Den första hanterade agenten var Deep Research (december 2025); nu kan utvecklare skapa sina egna.

Utvecklarfunktion	Detalj
Distribution	Ett enda API-anrop — fjärr-Linuxmiljö
Förmågor	Webbnavigering, kodkörning, filhantering
Anpassning	Filer `AGENTS.md` och `SKILL.md`
Beständiga sessioner	Fullständig återupptagning av tillstånd
Återanvändbara agenter	Registrering via `client.agents.create()`
Enterprise	Gemini Enterprise Agent Platform (privat förhandsversion)

Tillgänglighet: Förhandsversion i Gemini API från och med kvällen den 19 maj; mallar i Google AI Studio.

🔗 Managed Agents API-annonsen

Claude Managed Agents — Självhostade sandlådor och MCP-tunnlar

19 maj — Från evenemanget Code with Claude London har Anthropic lanserat två stora nya funktioner för Claude Managed Agents.

Self-hosted sandboxes (publik beta) — Claude-agenter kan nu köras i sandlådor (sandboxes) som hostas på kundens infrastruktur. Team behåller känsliga filer, paket och tjänster inom sin egen sfär, med sina nätverkspolicys, granskningsloggar och säkerhetsverktyg redan på plats.

MCP tunnels (forskningsförhandsvisning) — Agenter kan nå MCP-servrar som finns i ett privat nätverk utan att exponera dem publikt. MCP-tunnlar hanteras från Claude Console och stöds både i Managed Agents och i Messages API.

Funktion	Status	Leverantörer
Self-hosted sandboxes	Publik beta	Cloudflare, Daytona, Modal, Vercel
MCP tunnels	Forskningsförhandsvisning (åtkomst på begäran)	Via Claude Console

🔗 Claude Managed Agents-annonsen

Grok Skills — Ihållande expertis och Office-dokument

18 maj — xAI lanserade Skills för Grok 4.3, en funktion för ihållande minne som gör det möjligt för Grok att lära sig preferenser, formateringsregler och arbetsflödessteg en gång och sedan tillämpa dem i alla följande konversationer.

“I’m leveling up my Skills. Automate your workflows and get things done in record time with prebuilt and custom Skills.”

🇸🇪 “Jag bygger upp min kompetens med Skills. Automatisera dina arbetsflöden och slutför dina uppgifter i rekordfart med förbyggda och anpassade Skills.” — @grok på X

Dokumenttyp	Förmågor
Word (`.docx`)	Skapande och redigering med fullständig formatering (rubriker, tabeller, punktlistor)
PowerPoint	Bilder med visuell hierarki och talarnoter
Excel	Formler, färgade avsnitt, tydlig struktur
PDF	Skapande, sammanfogning, delning och extrahering
Skill Creator	Bygga nya anpassade skills via konversationen

Skills finns tillgängliga på grok.com, iOS och Android. Användarens anpassade skills har alltid företräde framför de inbyggda standardskillsen.

🔗 Grok Skills-annonsen

Cohere förvärvar Reliant AI — Suverän AI för biopharma

19 maj — Cohere meddelar förvärvet av Reliant AI, ett företag specialiserat på AI för biopharma, med kontor i Montréal och Berlin. Affären stärker Cohere:s strategi för suverän AI (sovereign AI) inom hälso- och life science-sektorerna.

“Healthcare represents one of the most consequential opportunities for AI and it demands secure, sovereign, and domain-specific systems.”

🇸🇪 Hälso- och sjukvården är en av de största möjligheterna för AI och kräver säkra, suveräna och domänspecifika system. — Aidan Gomez, medgrundare & vd, Cohere

Förvärvets bidrag:

Element	Detalj
Team	Toppforskare specialiserade på biopharma
Data	Egna biomedicinska databaser
Teknik	Intelligent forskningsarbetsbänk (intelligent research workbench)
Överförda kunder	GSK, Medicus Pharma, Kyowa Kirin

Ny produkt: North for Pharma — Cohere tillkännager utvecklingen av ett agentiskt AI-system utformat för biopharma-team som arbetar med FoU, klinisk utveckling och vetenskaplig analys. Det utökar “North”-sviten som redan erbjuds för finans- och telekomsektorerna.

Karl Moritz Hermann (tidigare vd för Reliant AI) blir VP of AI Verticalizations i Berlin. Marc Bellemare (medgrundare, Canada CIFAR AI Chair, Mila) blir VP of Modelling i Montréal.

🔗 Cohere-annonsen

KPMG × Anthropic — Global allians (276 000 anställda, 138 länder)

19 maj — KPMG, ett av världens största företag inom professionella tjänster, tillkännagav en global strategisk allians med Anthropic. Byrån integrerar Claude i sin plattform Digital Gateway och ger tillgång till Claude för hela sin personal på över 276 000 anställda i 138 länder.

De viktigaste fokusområdena: Claude Cowork och Managed Agents integreras i Digital Gateway, nya verktyg för kunder inom skatt och juridik, KPMG blir Anthropic:s föredragna partner för private equity-fonder, och KPMG:s team använder Claude Code (via KPMG Blaze) för att modernisera äldre IT-system.

“Building an AI agent to help clients adjust to changing tax regulations used to take weeks and required teams to switch between multiple tools and chat windows. With Cowork and Managed Agents integrated in Digital Gateway, that same capability takes minutes.”

🇸🇪 Att skapa en AI-agent för att hjälpa kunder att anpassa sig till föränderliga skatteregler tog tidigare veckor och krävde att man jonglerade mellan flera verktyg. Med Cowork och Managed Agents integrerade i Digital Gateway tar samma förmåga nu bara några minuter. — Rema Serafi, Vice President of Tax, KPMG US

Denna utrullning bygger på två års intern användning inom KPMG i USA.

🔗 Anthropic × KPMG-annonsen

Gemini-appen — Neural Expressive och Daily Brief

19 maj — Gemini-appen får två stora nyheter.

Neural Expressive är ett nytt designspråk för AI-eran: mjuka animationer, starka färger, ny typografi, haptisk återkoppling. Gemini Live-upplevelsen (röstkonversation) är nu direkt integrerad i huvudgränssnittet — sömlös övergång mellan skrivande och samtal. Global utrullning från och med 19 maj på webben, Android och iOS för alla användare.

Daily Brief är en agent som varje morgon genererar en personlig sammanfattning baserad på Gmail, Calendar och användarens prioriteringar. Den går längre än en enkel sammanfattning: den organiserar, prioriterar och föreslår konkreta nästa steg. Stegvis utrullning för Plus-, Pro- och Ultra-prenumeranter, med start i USA.

OpenAI — C2PA, SynthID och offentligt verifieringsverktyg

19 maj — OpenAI tillkännager ett flerskiktat angreppssätt för spårbarhet av AI-genererat innehåll, genom att kombinera tre kompletterande mekanismer.

Mekanism	Omfattning	Motståndskraft mot ändringar
C2PA-metadata	Bilder, ljud, video	Medel (kan tas bort)
SynthID-vattenmärke (Google DeepMind)	Endast bilder	Hög
Verktyget openai.com/verify	Innehåll genererat av OpenAI	N/A

OpenAI integrerar nu det osynliga digitala vattenmärket SynthID från Google DeepMind i alla bilder som genereras via ChatGPT, Codex och OpenAI API. SynthID kodar ursprunget direkt i bildens pixlar på ett omärkligt sätt och står emot de flesta vanliga ändringar (beskärning, filter, komprimering). Det offentliga verktyget openai.com/verify gör det möjligt för vem som helst att ladda upp en bild för att upptäcka förekomsten av ett SynthID-vattenmärke — för tillfället i en begränsad förhandsversion för OpenAI-innehåll.

🔗 OpenAI-annonsen

NVIDIA Sana WM — Världsmodell på en enda GPU

19 maj — NVIDIA AI presenterar Sana WM (Världsmodell). Utifrån en enda bild, en textbeskrivning och en kamerarörelse genererar modellen sammanhängande och styrbara videor — allt på en enda GPU.

Arkitekturen bygger på fyra innovationer: Hybrid Linear Attention, Dual-Branch Camera Control, Two-Stage Generation Pipeline och Robust Annotation Pipeline. Projektet är helt öppen källkod (paper + kod + modell).

🔗 NVIDIA AI:s tillkännagivande

Wan2.7-Image — Färgpalettkontroll

19 maj — Alibaba annonserar färgpalettkontroll (Palette Control) för Wan2.7-Image. Funktionen gör det möjligt att extrahera färgpaletten från vilken bild som helst — som ett konstnärligt mästerverk — och tillämpa den på ett nytt skapande. Finns direkt på wan.video. Tillkännagivandet genererade 529 742 visningar på X.

🔗 Alibaba Wan:s tillkännagivande

ElevenLabs — Albert Einsteins röst för undervisning

19 maj — ElevenLabs tillkännager introduktionen av den återskapade rösten av Albert Einstein i sin plattform, i form av en konversationsagent avsedd för undervisning. Agenten visar hur röst-AI kan göra lärandet mer interaktivt, tillgängligt och flerspråkigt. En demo finns på start.elevenlabs.io. Lärare kan få tillgång till den kostnadsfria Pro-planen via Impact-programmet.

Samtidigt meddelar ElevenLabs ett pilotprojekt i Polen: utrullning av röstagenter i de offentliga hälsotjänsterna (NFZ) i sommar.

🔗 ElevenLabs tillkännagivande

xAI Grok integrerad i OpenClaw — lokal öppen källkod-multi-messageries-agent

19 maj — xAI annonserar integreringen av Grok i OpenClaw, en personlig agent med öppen källkod och local-first (local-first). Grok- och X Premium-prenumeranter kan nu använda Grok i OpenClaw, som fungerar på vilken hårdvara som helst (Mac Mini, laptop, Raspberry Pi) och ansluter till WhatsApp, Telegram, Slack, Discord, Signal och iMessage.

🔗 xAI:s tillkännagivande

Z.ai GLM-5.1 — N°1 öppen källkod SWE-Bench Pro, MIT, 200K kontext

18 maj — Z.ai (Zhipu AI) gör GLM-5.1 tillgänglig på OrcaRouter. Modellen gör anspråk på förstaplatsen bland modeller med öppen källkod på SWE-Bench Pro (benchmark för kodreparation i verkliga förhållanden), och överträffar till och med vissa proprietära modeller. MIT-licens, 200K tokens kontext, utformad för långsiktigt agentiskt kodande (long-horizon agentic coding).

🔗 OrcaRouters tillkännagivande

Kortnytt

The Problem Solvers (Anthropic) — Ny videoserie som visar grundare som bygger med Claude. Första avsnitten: Scott Wu (Cognition/Devin) och Kay Zhu (Genspark). 🔗 claude.com/problem-solvers
Manus × Higgsfield (MCP-kontakt) — Manus integrerar Higgsfield via MCP för att ge skapare professionell kontroll över bild-/videogenerering i sina arbetsflöden. 🔗 manus.im/blog
OpenAI Guaranteed Capacity — Nytt erbjudande som gör det möjligt för företag att reservera tillgång till OpenAI:s beräkningsresurser via 1 till 3 års åtaganden, med ökande rabatter beroende på löptid. 🔗 openai.com
Perplexity Computer — Rho — Rho har minskat den veckovisa mötestiden med 90 % och sparat 120 timmar på 12 veckor tack vare Perplexity Computer, som övervakar Slack, Notion, Jira, Figma och Google Docs. 🔗 Perplexity på X

Vad det betyder

Konvergensen kring Managed Agents. Google och Anthropic tillkännager samma dag, nästan samtidigt, en liknande infrastruktur under samma namn: Managed Agents. Hos Google är det Antigravity öppet via Gemini-API:t — ett enda anrop räcker för att distribuera en agent i en isolerad Linux-sandbox. Hos Anthropic handlar det om self-hosted sandlådor (Cloudflare, Daytona, Modal, Vercel) och MCP-tunnlar för privata nätverk. Denna konvergens är ingen slump: den markerar framväxten av ett nytt standardiserat lager av AI-infrastruktur, mellan råmodellen och slutapplikationen.

Enterprise-AI struktureras kring suveränitet. Cohere:s förvärv av Reliant AI, KPMG-Anthropic-alliansen med Claude i Digital Gateway, och erbjudandet OpenAI Guaranteed Capacity visar samma rörelse: stora organisationer vill ha AI-system inom sin egen sfär, med sina data, sina säkerhetsregler och kapacitetsåtaganden över flera år. “Sovereign” (sovereign) har blivit nyckelordet för enterprise-AI år 2026.

Kapplöpningen om långsiktigt agentiskt kodande. Gemini 3.5 Flash (optimerad för agenter + kodning), Z.ai:s GLM-5.1 (N°1 öppen källkod SWE-Bench Pro, 200K kontext), Grok Skills (persistenta arbetsflöden) — alla riktar in sig på samma användningsfall: en agent som arbetar på en komplex uppgift i timmar utan mänsklig inblandning. GitHub Copilot integrerar Gemini 3.5 Flash samma dag som lanseringen, vilket illustrerar hastigheten med vilken utvecklarverktyg absorberar nya modeller.

Proveniens och förtroende i AI-innehåll. Kombinationen C2PA + SynthID + openai.com/verify som OpenAI tillkännagav (med SynthID från Google DeepMind) representerar en oöverträffad flerskiktsansats: metadata för kontext, osynlig vattenmärkning för beständighet även efter ändring, offentligt verktyg för verifiering. Denna rörelse mot spårbarhet för genererat innehåll håller gradvis på att bli en branschstandard, driven gemensamt av OpenAI, Google och C2PA-koalitionen.