ai-powered-markdown-translatorArtikel översatt från fr till sv med gpt-5.4-mini.
Den 19 maj 2026 är en fullspäckad dag för AI: Andrej Karpathy lämnar scenen för att ansluta till Anthropic, Google I/O 2026 lanserar en rad agentiska tillkännagivanden kring Gemini 3.5-serien, xAI rullar ut Grok Skills med generering av Office-dokument, och Cohere gör ett strategiskt förvärv inom biopharma. Samtidigt stärker OpenAI spårbarheten för AI-innehåll och den generativa medievärlden får nya funktioner.
Andrej Karpathy ansluter till Anthropic
19 maj — Andrej Karpathy meddelade på X att han har anslutit till Anthropic. Nyheten genererade mer än 11,3 miljoner visningar, 102 000 gilla-markeringar och 13 000 delningar på några timmar — ett exceptionellt engagemang som visar hur stor betydelse rekryteringen har i communityn.
“Personal update: I’ve joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D. I remain deeply passionate about education and plan to resume my work on it in time.”
🇸🇪 Personlig uppdatering: jag har anslutit till Anthropic. Jag tror att de kommande åren vid LLM-gränsen kommer att bli särskilt formativa. Jag är mycket entusiastisk över att få gå med i teamet och återvända till FoU. Jag förblir djupt passionerad kring utbildning och planerar att återuppta det arbetet i sinom tid. — @karpathy på X
Karpathy är en av de mest välkända personerna i området. Hans resa: doktorsexamen vid Stanford, grundande medlem av OpenAI, AI-chef på Tesla, och därefter en oberoende profil med den pedagogiska serien nanoGPT och sina maskininlärningskurser som följts av miljontals människor.
Hans ankomst till Anthropic stärker avsevärt teamet för grundforskning just när konkurrensen mellan gränslaboratorierna intensifieras. En tidigare OpenAI-profil som går till Anthropic — signalen är stark om talangdynamiken i branschen.
Anthropic har inte specificerat hans exakta roll. Tillkännagivandet sammanfaller med evenemanget Code with Claude London och flera stora lanseringar samma dag.
Google I/O 2026 — Gemini 3.5:s agentiska era
19 maj — Google I/O 2026 äger rum i dag, med Gemini agentiska era (agentic Gemini era) som centralt tema. Google tillkännager under keynoten en sammanhängande uppsättning nyheter som alla kretsar kring Gemini:s förmåga att agera självständigt, proaktivt och ihållande.
“Three years ago, Gemini started by understanding the world. With Gemini 2, models learned to think and reason. Late last year, Gemini 3 brought any idea to life. Today, we’re continuing that journey with our Gemini 3.5 series, starting with Gemini 3.5 Flash, delivering frontier performance for agents and coding.”
🇸🇪 “För tre år sedan började Gemini med att förstå världen. Med Gemini 2 lärde sig modellerna att tänka och resonera. I slutet av förra året gav Gemini 3 liv åt vilken idé som helst. I dag fortsätter vi den här resan med vår Gemini 3.5-serie, med Gemini 3.5 Flash som först ut, och levererar topprestanda för agenter och kodning.” — @GoogleAI på X
De viktigaste tillkännagivandena under I/O 2026-keynoten:
| Tillkännagivande | Kategori |
|---|---|
| Gemini 3.5 Flash | Ny modell (agenter + coding) |
| Gemini Omni | Multimodal videomodell |
| Gemini Spark | Personlig agent 24/7 |
| Daily Brief | Personlig morgonagent |
| Neural Expressive | Ny appdesign |
| Managed Agents API | Antigravity-infrastruktur för utvecklare |
| Google AI Studio | Förnyad med agentmallar |
Gemini 3.5 Flash — Hastighet och intelligens för agenter
19 maj — Gemini 3.5 Flash är den första modellen i den nya 3.5-generationen. Den är utformad för att kombinera toppmodern intelligens (frontier intelligence) och blixtsnabb handling (lightning-fast action), särskilt optimerad för agent- och kodningsanvändningsfall.
Gemini 3.5 Flash är den underliggande motorn för Antigravity-agenten (Managed Agents API) och Gemini Spark. Den är tillgänglig via Gemini API och i Google AI Studio från och med 19 maj.
| Generation | Nyckelförmåga |
|---|---|
| Gemini 1 | Förståelse av världen |
| Gemini 2 | Resonemang och tänkande |
| Gemini 3 | Multimodal skapande |
| Gemini 3.5 Flash | Agenter, coding, blixtsnabb hastighet |
Modellen är också allmänt tillgänglig (generally available) i GitHub Copilot samma dag som lanseringen — på planerna Pro, Pro+, Business och Enterprise. GitHub rapporterar prestanda nära Pro-nivå med Flash-hastighet, effektiv verktygsanvändning, snabba svarstider och hög cacheeffektivitet. Utrullningen sker stegvis; administratörer för Copilot Enterprise och Business måste aktivera policyn Gemini 3.5 Flash i inställningarna.
| Copilot-attribut | Värde |
|---|---|
| Berörda planer | Pro, Pro+, Business, Enterprise |
| Stödda IDE:er | VS Code, Visual Studio, JetBrains, Xcode, Eclipse, GitHub Mobile |
| Premium-multiplikator | 14× (provisorisk, kan komma att ändras) |
Gemini Omni — Skapa vad som helst från vad som helst
19 maj — Google DeepMind lanserar Gemini Omni, presenterad som “det första steget mot en modell som kan skapa vad som helst från vad som helst — med start i video”. Den kombinerar Gemini:s intelligens med Googles generativa mediesystem (Veo, Imagen).
“We’re dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video. It combines Gemini’s intelligence with our generative media systems - representing a leap forward in world understanding, multimodality, and editing.”
🇸🇪 “Vi lanserar Gemini Omni: vårt första steg mot en modell som kan skapa vad som helst från vad som helst — med start i video. Den kombinerar Gemini:s intelligens med våra generativa mediesystem och representerar ett stort språng framåt inom världsuppfattning, multimodalitet och redigering.” — @GoogleDeepMind på X
I Gemini-appen möjliggör Gemini Omni högkvalitativ filmisk videogenerering från text, bilder eller befintliga videor, videoredigering via naturlig konversation (filmiska zoomar, bakgrundsbyten med en enkel prompt), skapande av anpassade AI-avatarer som liknar användaren samt applicering av inbyggda mallar med ett tryck.
Tillgänglighet: Stegvis utrullning från och med 19 maj för Google AI Plus-, Pro- och Ultra-prenumeranter världen över.
Gemini Spark — Personlig agent 24/7
19 maj — Google tillkännager Gemini Spark, en personlig AI-agent tillgänglig dygnet runt, alla dagar i veckan. Det är ett grundläggande skifte i Gemini:s natur: den går från att vara en reaktiv assistent till att bli en aktiv partner som arbetar i bakgrunden även när användaren stänger sin enhet (molnarkitektur).
Spark körs på Gemini 3.5 Flash via Antigravity-infrastrukturen. Den är djupt integrerad med Workspace-verktygen (Gmail, Docs, Slides, Calendar).
| Förmåga | Detalj |
|---|---|
| Återkommande uppgifter | Automatiska triggers (t.ex. analysera månadsutdrag) |
| Inlärning av färdigheter | På användarens instruktion |
| Kompletta arbetsflöden | Mötessammanfattning → Google Doc → uppföljningsmail |
| MCP-anslutningar | Canva, OpenTable, Instacart från lanseringen |
| Användarkontroll | Bekräftelse krävs före högpåverkande åtgärder |
Tillgänglighet: Tester i betrodd miljö denna vecka; beta för Google AI Ultra-prenumeranter i USA veckan därpå. Ankomst till Gemini:s macOS-app planeras till sommaren 2026.
Managed Agents i Gemini API — Öppen Antigravity-infrastruktur
19 maj — Google lanserar Managed Agents i Gemini API, vilket gör det möjligt för utvecklare att distribuera agenter med en enda rad kod i en isolerad, tillfällig Linux-miljö. Infrastrukturen drivs av agenten Antigravity, byggd på Gemini 3.5 Flash.
Detta öppnar Googles interna agentinfrastruktur för externa utvecklare. Den första hanterade agenten var Deep Research (december 2025); nu kan utvecklare skapa sina egna.
| Utvecklarfunktion | Detalj |
|---|---|
| Distribution | Ett enda API-anrop — fjärr-Linuxmiljö |
| Förmågor | Webbnavigering, kodkörning, filhantering |
| Anpassning | Filer AGENTS.md och SKILL.md |
| Beständiga sessioner | Fullständig återupptagning av tillstånd |
| Återanvändbara agenter | Registrering via client.agents.create() |
| Enterprise | Gemini Enterprise Agent Platform (privat förhandsversion) |
Tillgänglighet: Förhandsversion i Gemini API från och med kvällen den 19 maj; mallar i Google AI Studio.
Claude Managed Agents — Självhostade sandlådor och MCP-tunnlar
19 maj — Från evenemanget Code with Claude London har Anthropic lanserat två stora nya funktioner för Claude Managed Agents.
Self-hosted sandboxes (publik beta) — Claude-agenter kan nu köras i sandlådor (sandboxes) som hostas på kundens infrastruktur. Team behåller känsliga filer, paket och tjänster inom sin egen sfär, med sina nätverkspolicys, granskningsloggar och säkerhetsverktyg redan på plats.
MCP tunnels (forskningsförhandsvisning) — Agenter kan nå MCP-servrar som finns i ett privat nätverk utan att exponera dem publikt. MCP-tunnlar hanteras från Claude Console och stöds både i Managed Agents och i Messages API.
| Funktion | Status | Leverantörer |
|---|---|---|
| Self-hosted sandboxes | Publik beta | Cloudflare, Daytona, Modal, Vercel |
| MCP tunnels | Forskningsförhandsvisning (åtkomst på begäran) | Via Claude Console |
🔗 Claude Managed Agents-annonsen
Grok Skills — Ihållande expertis och Office-dokument
18 maj — xAI lanserade Skills för Grok 4.3, en funktion för ihållande minne som gör det möjligt för Grok att lära sig preferenser, formateringsregler och arbetsflödessteg en gång och sedan tillämpa dem i alla följande konversationer.
“I’m leveling up my Skills. Automate your workflows and get things done in record time with prebuilt and custom Skills.”
🇸🇪 “Jag bygger upp min kompetens med Skills. Automatisera dina arbetsflöden och slutför dina uppgifter i rekordfart med förbyggda och anpassade Skills.” — @grok på X
| Dokumenttyp | Förmågor |
|---|---|
Word (.docx) | Skapande och redigering med fullständig formatering (rubriker, tabeller, punktlistor) |
| PowerPoint | Bilder med visuell hierarki och talarnoter |
| Excel | Formler, färgade avsnitt, tydlig struktur |
| Skapande, sammanfogning, delning och extrahering | |
| Skill Creator | Bygga nya anpassade skills via konversationen |
Skills finns tillgängliga på grok.com, iOS och Android. Användarens anpassade skills har alltid företräde framför de inbyggda standardskillsen.
Cohere förvärvar Reliant AI — Suverän AI för biopharma
19 maj — Cohere meddelar förvärvet av Reliant AI, ett företag specialiserat på AI för biopharma, med kontor i Montréal och Berlin. Affären stärker Cohere:s strategi för suverän AI (sovereign AI) inom hälso- och life science-sektorerna.
“Healthcare represents one of the most consequential opportunities for AI and it demands secure, sovereign, and domain-specific systems.”
🇸🇪 Hälso- och sjukvården är en av de största möjligheterna för AI och kräver säkra, suveräna och domänspecifika system. — Aidan Gomez, medgrundare & vd, Cohere
Förvärvets bidrag:
| Element | Detalj |
|---|---|
| Team | Toppforskare specialiserade på biopharma |
| Data | Egna biomedicinska databaser |
| Teknik | Intelligent forskningsarbetsbänk (intelligent research workbench) |
| Överförda kunder | GSK, Medicus Pharma, Kyowa Kirin |
Ny produkt: North for Pharma — Cohere tillkännager utvecklingen av ett agentiskt AI-system utformat för biopharma-team som arbetar med FoU, klinisk utveckling och vetenskaplig analys. Det utökar “North”-sviten som redan erbjuds för finans- och telekomsektorerna.
Karl Moritz Hermann (tidigare vd för Reliant AI) blir VP of AI Verticalizations i Berlin. Marc Bellemare (medgrundare, Canada CIFAR AI Chair, Mila) blir VP of Modelling i Montréal.
KPMG × Anthropic — Global allians (276 000 anställda, 138 länder)
19 maj — KPMG, ett av världens största företag inom professionella tjänster, tillkännagav en global strategisk allians med Anthropic. Byrån integrerar Claude i sin plattform Digital Gateway och ger tillgång till Claude för hela sin personal på över 276 000 anställda i 138 länder.
De viktigaste fokusområdena: Claude Cowork och Managed Agents integreras i Digital Gateway, nya verktyg för kunder inom skatt och juridik, KPMG blir Anthropic:s föredragna partner för private equity-fonder, och KPMG:s team använder Claude Code (via KPMG Blaze) för att modernisera äldre IT-system.
“Building an AI agent to help clients adjust to changing tax regulations used to take weeks and required teams to switch between multiple tools and chat windows. With Cowork and Managed Agents integrated in Digital Gateway, that same capability takes minutes.”
🇸🇪 Att skapa en AI-agent för att hjälpa kunder att anpassa sig till föränderliga skatteregler tog tidigare veckor och krävde att man jonglerade mellan flera verktyg. Med Cowork och Managed Agents integrerade i Digital Gateway tar samma förmåga nu bara några minuter. — Rema Serafi, Vice President of Tax, KPMG US
Denna utrullning bygger på två års intern användning inom KPMG i USA.
Gemini-appen — Neural Expressive och Daily Brief
19 maj — Gemini-appen får två stora nyheter.
Neural Expressive är ett nytt designspråk för AI-eran: mjuka animationer, starka färger, ny typografi, haptisk återkoppling. Gemini Live-upplevelsen (röstkonversation) är nu direkt integrerad i huvudgränssnittet — sömlös övergång mellan skrivande och samtal. Global utrullning från och med 19 maj på webben, Android och iOS för alla användare.
Daily Brief är en agent som varje morgon genererar en personlig sammanfattning baserad på Gmail, Calendar och användarens prioriteringar. Den går längre än en enkel sammanfattning: den organiserar, prioriterar och föreslår konkreta nästa steg. Stegvis utrullning för Plus-, Pro- och Ultra-prenumeranter, med start i USA.
OpenAI — C2PA, SynthID och offentligt verifieringsverktyg
19 maj — OpenAI tillkännager ett flerskiktat angreppssätt för spårbarhet av AI-genererat innehåll, genom att kombinera tre kompletterande mekanismer.
| Mekanism | Omfattning | Motståndskraft mot ändringar |
|---|---|---|
| C2PA-metadata | Bilder, ljud, video | Medel (kan tas bort) |
| SynthID-vattenmärke (Google DeepMind) | Endast bilder | Hög |
| Verktyget openai.com/verify | Innehåll genererat av OpenAI | N/A |
OpenAI integrerar nu det osynliga digitala vattenmärket SynthID från Google DeepMind i alla bilder som genereras via ChatGPT, Codex och OpenAI API. SynthID kodar ursprunget direkt i bildens pixlar på ett omärkligt sätt och står emot de flesta vanliga ändringar (beskärning, filter, komprimering). Det offentliga verktyget openai.com/verify gör det möjligt för vem som helst att ladda upp en bild för att upptäcka förekomsten av ett SynthID-vattenmärke — för tillfället i en begränsad förhandsversion för OpenAI-innehåll.
NVIDIA Sana WM — Världsmodell på en enda GPU
19 maj — NVIDIA AI presenterar Sana WM (Världsmodell). Utifrån en enda bild, en textbeskrivning och en kamerarörelse genererar modellen sammanhängande och styrbara videor — allt på en enda GPU.
Arkitekturen bygger på fyra innovationer: Hybrid Linear Attention, Dual-Branch Camera Control, Two-Stage Generation Pipeline och Robust Annotation Pipeline. Projektet är helt öppen källkod (paper + kod + modell).
🔗 NVIDIA AI:s tillkännagivande
Wan2.7-Image — Färgpalettkontroll
19 maj — Alibaba annonserar färgpalettkontroll (Palette Control) för Wan2.7-Image. Funktionen gör det möjligt att extrahera färgpaletten från vilken bild som helst — som ett konstnärligt mästerverk — och tillämpa den på ett nytt skapande. Finns direkt på wan.video. Tillkännagivandet genererade 529 742 visningar på X.
🔗 Alibaba Wan:s tillkännagivande
ElevenLabs — Albert Einsteins röst för undervisning
19 maj — ElevenLabs tillkännager introduktionen av den återskapade rösten av Albert Einstein i sin plattform, i form av en konversationsagent avsedd för undervisning. Agenten visar hur röst-AI kan göra lärandet mer interaktivt, tillgängligt och flerspråkigt. En demo finns på start.elevenlabs.io. Lärare kan få tillgång till den kostnadsfria Pro-planen via Impact-programmet.
Samtidigt meddelar ElevenLabs ett pilotprojekt i Polen: utrullning av röstagenter i de offentliga hälsotjänsterna (NFZ) i sommar.
xAI Grok integrerad i OpenClaw — lokal öppen källkod-multi-messageries-agent
19 maj — xAI annonserar integreringen av Grok i OpenClaw, en personlig agent med öppen källkod och local-first (local-first). Grok- och X Premium-prenumeranter kan nu använda Grok i OpenClaw, som fungerar på vilken hårdvara som helst (Mac Mini, laptop, Raspberry Pi) och ansluter till WhatsApp, Telegram, Slack, Discord, Signal och iMessage.
Z.ai GLM-5.1 — N°1 öppen källkod SWE-Bench Pro, MIT, 200K kontext
18 maj — Z.ai (Zhipu AI) gör GLM-5.1 tillgänglig på OrcaRouter. Modellen gör anspråk på förstaplatsen bland modeller med öppen källkod på SWE-Bench Pro (benchmark för kodreparation i verkliga förhållanden), och överträffar till och med vissa proprietära modeller. MIT-licens, 200K tokens kontext, utformad för långsiktigt agentiskt kodande (long-horizon agentic coding).
🔗 OrcaRouters tillkännagivande
Kortnytt
-
The Problem Solvers (Anthropic) — Ny videoserie som visar grundare som bygger med Claude. Första avsnitten: Scott Wu (Cognition/Devin) och Kay Zhu (Genspark). 🔗 claude.com/problem-solvers
-
Manus × Higgsfield (MCP-kontakt) — Manus integrerar Higgsfield via MCP för att ge skapare professionell kontroll över bild-/videogenerering i sina arbetsflöden. 🔗 manus.im/blog
-
OpenAI Guaranteed Capacity — Nytt erbjudande som gör det möjligt för företag att reservera tillgång till OpenAI:s beräkningsresurser via 1 till 3 års åtaganden, med ökande rabatter beroende på löptid. 🔗 openai.com
-
Perplexity Computer — Rho — Rho har minskat den veckovisa mötestiden med 90 % och sparat 120 timmar på 12 veckor tack vare Perplexity Computer, som övervakar Slack, Notion, Jira, Figma och Google Docs. 🔗 Perplexity på X
Vad det betyder
Konvergensen kring Managed Agents. Google och Anthropic tillkännager samma dag, nästan samtidigt, en liknande infrastruktur under samma namn: Managed Agents. Hos Google är det Antigravity öppet via Gemini-API:t — ett enda anrop räcker för att distribuera en agent i en isolerad Linux-sandbox. Hos Anthropic handlar det om self-hosted sandlådor (Cloudflare, Daytona, Modal, Vercel) och MCP-tunnlar för privata nätverk. Denna konvergens är ingen slump: den markerar framväxten av ett nytt standardiserat lager av AI-infrastruktur, mellan råmodellen och slutapplikationen.
Enterprise-AI struktureras kring suveränitet. Cohere:s förvärv av Reliant AI, KPMG-Anthropic-alliansen med Claude i Digital Gateway, och erbjudandet OpenAI Guaranteed Capacity visar samma rörelse: stora organisationer vill ha AI-system inom sin egen sfär, med sina data, sina säkerhetsregler och kapacitetsåtaganden över flera år. “Sovereign” (sovereign) har blivit nyckelordet för enterprise-AI år 2026.
Kapplöpningen om långsiktigt agentiskt kodande. Gemini 3.5 Flash (optimerad för agenter + kodning), Z.ai:s GLM-5.1 (N°1 öppen källkod SWE-Bench Pro, 200K kontext), Grok Skills (persistenta arbetsflöden) — alla riktar in sig på samma användningsfall: en agent som arbetar på en komplex uppgift i timmar utan mänsklig inblandning. GitHub Copilot integrerar Gemini 3.5 Flash samma dag som lanseringen, vilket illustrerar hastigheten med vilken utvecklarverktyg absorberar nya modeller.
Proveniens och förtroende i AI-innehåll. Kombinationen C2PA + SynthID + openai.com/verify som OpenAI tillkännagav (med SynthID från Google DeepMind) representerar en oöverträffad flerskiktsansats: metadata för kontext, osynlig vattenmärkning för beständighet även efter ändring, offentligt verktyg för verifiering. Denna rörelse mot spårbarhet för genererat innehåll håller gradvis på att bli en branschstandard, driven gemensamt av OpenAI, Google och C2PA-koalitionen.
Källor
- Karpathy på X
- Claude Managed Agents-uppdateringar
- Anthropic × KPMG
- Google I/O 2026 — Nästa utveckling av Gemini-appen
- GoogleAI på X — Gemini 3.5
- GoogleDeepMind på X — Gemini Omni
- Managed Agents API Gemini
- GitHub Copilot — Gemini 3.5 Flash GA
- GitHub på X — Gemini 3.5 Flash
- Grok Skills
- Cohere förvärvar Reliant AI
- OpenAI Content Provenance
- NVIDIA Sana WM
- Wan2.7-Image Palette Control
- ElevenLabs Einstein
- xAI Grok × OpenClaw
- Z.ai GLM-5.1