ai-powered-markdown-translatorArtikel översatt från fr till sv med gpt-5.4-mini.
En tät vecka för AI-ekosystemet: Alibaba lanserar sin flaggskeppsmodell Qwen3.7-Max som är utformad för den agentiska eran, GitHub avslöjar en säkerhetsincident som involverar ett skadligt VS Code-tillägg, NVIDIA publicerar ett öppet styrningsramverk för agentskills, och Runway förnyar sin videoredigeringsmodell med Aleph 2.0 och Edit Studio. På utvecklarverktygssidan döper Claude Code 2.1.146 om /simplify till /code-review och Codex 26.519 introducerar Appshots på macOS.
Qwen3.7-Max — Alibabas flaggskepp för den agentiska eran
21 maj — Alibaba lanserar Qwen3.7-Max, sin nya proprietära flaggskeppsmodell, särskilt utformad för autonoma agenter. Modellen följer på förhandsversionerna Qwen3.7-Max-Preview och Qwen3.7-Plus-Preview som utvärderades på Arena den 18 maj.
Positioneringen är uttryckligen “Agent Era”: Qwen3.7-Max riktar sig till uppgifter som går bortom punktuell förståelse och in i området för långvarig autonomi och komplex orkestrering.
| Metrik | Värde |
|---|---|
| AAII-poäng | 56,6 |
| Förbättring jämfört med föregående | +4,8 poäng |
| Kontinuerliga autonomi-timmar (kärntest) | 35 h |
| Verktygskall (kärntest) | 1 000+ |
| Visningar av huvudtweeten | ~325 000 |
Fem utannonserade förmågor:
- End-to-end-kodningsagent — frontendprototyper, omstruktureringar över flera filer, verklig felsökning
- Produktivitet på skrivbordet — uppgifter via MCP-integrationer och hantering av flera agenter
- Långvarig autonomi — 35 sammanhängande timmar på en kärnoptimeringsuppgift, 1 000+ verktygskall utan kritisk hallucination
- Scaffold-agnostisk — kompatibel med Claude Code, OpenClaw, Qwen Code eller vilken egen stack som helst
- Förstärkt vetenskapligt resonemang — AAII-poäng: 56,6 (+4,8 poäng)
Enligt Tongyi Lab (Alibaba) är Qwen3.7-Max “vår senaste proprietära modell som är särskilt utformad för agenternas era”, med en kodningsagent i frontier-klass, en skrivbordsproduktivitetassistent och långvarig autonomi — tillförlitlig varje gång, scaffold-agnostisk.
Modellen är tillgänglig via Qwen Studio (chat.qwen.ai) och Alibaba Clouds API.
GitHub — Säkerhetsincident: skadligt VS Code-tillägg
20 maj — GitHub avslöjar en stor säkerhetsincident: en anställd installerade ett skadligt VS Code-tillägg från Microsofts marketplace, vilket möjliggjorde obehörig åtkomst till interna GitHub-repositorier.
Det första inlägget på X genererade 13,4 miljoner visningar, 8 000 reposts och 25 000 likes — ett tecken på en betydande påverkan i communityn. GitHub publicerade en tråd i fem delar som beskriver tidslinjen och de åtgärder som vidtagits.
“1/ Yesterday we detected and contained a compromise of an employee device involving a poisoned VS Code extension. We removed the malicious extension version, isolated the endpoint, and began incident response immediately.”
🇸🇪 I går upptäckte och begränsade vi komprometteringen av en anställds enhet som involverade ett förgiftat VS Code-tillägg. Vi tog bort den skadliga versionen av tillägget, isolerade slutpunkten och inledde omedelbart incidenthanteringen. — @github på X
Det som hände:
- Vektor: skadligt VS Code-tillägg från Microsofts marketplace
- En GitHub-anställds enhet komprometterades
- Obehörig åtkomst till interna GitHub-repositorier
Det som enligt GitHub inte påverkades:
- Ingen bekräftad påverkan på kunddata (företag, organisationer, publika eller privata repositorier)
Omedelbara åtgärder:
- Borttagning av det skadliga tillägget
- Isolering av den komprometterade slutpunkten
- Analys av loggar (logs) och rotation av hemligheter
- Förstärkt övervakning av infrastrukturen
GitHub har lovat att publicera en fullständig rapport när utredningen är avslutad. Denna incident återupplivar debatten om säkerheten i VS Code:s marketplace för tillägg, som rymmer tiotusentals tillägg vars granskning fortfarande är begränsad.
NVIDIA Verified Agent Skills — En öppen standard för styrning av AI-agenter
21 maj — NVIDIA lanserar NVIDIA-Verified Agent Skills, ett öppet styrningsramverk för att säkra AI-agenters förmågor (skills). Initiativet svarar mot ett växande problem: skills ökar agenternas kapacitet, men introducerar också potentiella sårbarheter.
En “verifierad” skill enligt NVIDIA bygger på fyra pelare:
| Komponent | Beskrivning |
|---|---|
| Katalogisering | Daglig synkronisering från NVIDIAs produktteam |
| SkillSpector | Riskscanner baserad på OWASP LLM och MITRE ATLAS |
| Kryptografisk signatur | Frånkopplad signatur skill.oms.sig verifierbar via OpenSSF Model Signing |
| Skill Card (SKILLCARD.yaml) | Maskinläsbara metadata: härkomst, beroenden, begränsningar, status |
Ramverket upptäcker särskilt: sårbara beroenden, prompt injection, trigger abuse, excessive agency och tool poisoning.
Den tekniska specifikationen är öppen via agentskills.io (formatet SKILL.md), inbyggt kompatibel med Claude Code, OpenAI Codex och Cursor. NVIDIAs offentliga katalog över skills finns tillgänglig på github.com/nvidia/skills.
“Verified means cataloged, scanned, signed, and documented with a skill card.”
🇸🇪 Verifierad betyder katalogiserad, skannad, signerad och dokumenterad med ett kompetensblad. — Developer Blog NVIDIA, 21 maj 2026
Att specifikationen är öppen och kompatibel med de tre främsta AI-kodningsverktygen (Claude Code, Codex, Cursor) antyder en ambition om en branschstandard, inte bara ett internt NVIDIA-verktyg.
Runway Aleph 2.0 och Edit Studio — Videoredigering upp till 30 sekunder i 1080p
21 maj — Runway lanserar Aleph 2.0, en större uppdatering av sin videoredigeringsmodell, tillsammans med Edit Studio, ett nytt gränssnitt riktat till marknadsföringsteam och filmskapare.
Den centrala nyheten i Aleph 2.0 är image-level-kontroll: användaren anger en redigerad frame som visuell referens, och modellen tillämpar ändringen konsekvent över hela videon. Till skillnad från tidigare angreppssätt där slutresultatet var okänt innan generering, ger denna metod förutsägbar kontroll över outputen.
| Funktion | Detalj |
|---|---|
| Maxlängd | 30 sekunder |
| Upplösning | 1080p |
| Kontroll | Bildreferensframe (image-level) |
| Redigering av flera shots | Ja — automatisk tillämpning på flera scener |
| Åtkomst | Alla betalda Runway-planer |
Aleph 2.0:s redigeringsmöjligheter:
- Exakta lokaliserade redigeringar: endast det modifierade området ändras, resten bevaras
- Redigering av flera shots: ändringar tillämpas på videor med flera klipp
- Klipp upp till 30 s i 1080p — tillräcklig längd för annonser och kortformat innehåll
Användningsfall för Edit Studio: produktbyte, bakgrundsbyte, säsongsvariationer i kampanjer, ljuskorrigering, borttagning av störande element, fullständig omstyling.
“With Aleph 2.0, your edited frame defines what the change should look like, and the model carries it through to the right parts of your video.”
🇸🇪 Med Aleph 2.0 definierar din redigerade bild det önskade utseendet, och modellen tillämpar det på motsvarande delar av din video. — Runway, officiell blogg 21 maj 2026
🔗 Officiell Runway-annonsering
Claude Code 2.1.146 — /code-review och korrigeringar för background agents
21 maj — Anthropic publicerar version 2.1.146 av Claude Code med en huvudnyhet och flera viktiga stabilitetsfixar.
Kommandot /simplify döps om till /code-review, tillsammans med en valfri ambitionsnivå (/code-review high). Denna ändring ompositionerar uttryckligen funktionen som ett verktyg för kodgranskning i agentiska arbetsflöden.
| Område | Fix |
|---|---|
| Windows PowerShell | Regression i v2.1.124 åtgärdad för pwsh via winget/Microsoft Store |
| MCP-paginering | resources/list och prompts/list förlorar inte längre objekt bortom sida 1 |
| Background sessions | Strobing i Windows Terminal, worktrees på NTFS, blockeringar /background och claude agents |
| Auto mode | AskUserQuestion bevaras när skillen eller användaren är beroende av det |
| Bedrock | Cross-account-autentisering åtgärdad med awsCredentialExport |
| VSCode Voice | Tyst mikrofonfeedback, sox-förslag för WSLg |
Claude Code /usage — Nedbrytning av tokenförbrukning per komponent
21 maj — Boris Cherny (lead för Claude Code hos Anthropic) meddelar på X en betydande utökning av kommandot /usage: nästa version kommer att göra det möjligt att se exakt vilka Skills, Agents, MCPs och Plugins som förbrukar tokens i en session.
Denna funktion går längre än gårdagens omdesign av gränssnittet. Den ger en komponentvis granularitet — vilket gör det möjligt att identifiera de mest kontextkrävande tilläggen. Den finns redan tillgänglig i CLI och kommer snart till Desktop-appen. Tillkännagivandet genererade 137 527 visningar på X, med många önskemål om att selektivt kunna inaktivera oanvända kopplingar.
“In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using your tokens CLI today, coming to Desktop next”
🇸🇪 I nästa version av Claude Code: kör
/usageför att se fördelningen av tokenförbrukning per Skills, Agents, MCPs och Plugins — tillgängligt i CLI idag, på Desktop snart. — @bcherny på X
Google I/O 2026 — Den officiella sammanfattningen med “100 annonseringar”
20 maj — Google publicerar sin officiella sammanfattningsartikel “100 things announced at I/O 2026”, referensdokumentet för hela eventets lanseringar. Bland de bekräftade annonseringarna: Antigravity 2.0 CLI (efterföljaren till Gemini CLI), Universal Cart (köp över flera handlare), Google Pics (smart fotohantering), Ask YouTube (frågor om YouTube-videor), Android XR glasses och expansionen av SynthID. Detta dokument sammanfattar omfattningen av Google I/O 2026 och fungerar som en primär källa för utvecklare som vill hitta alla officiella detaljer.
🔗 Google-blogg — 100 annonseringar I/O 2026
Gemini Connected Apps — OpenTable, Canva och Instacart
21 maj — Google Gemini utökar sina Connected Apps med tre nya partners: OpenTable (restaurangbokning), Canva (skapande av visuellt material) och Instacart (matinköp). Gemini nöjer sig inte längre med att söka information — den utför konkreta handlingar i användarens digitala ekosystem på dennes vägnar. Detta efter-I/O-meddelande konkretiserar Gemini Sparks agentiska vision: agenten agerar på populära tredjepartstjänster utan att lämna appen.
🔗 Annonsering av Gemini Connected Apps
GitHub Copilot — Fyra utvecklaruppdateringar
Metrikrapporter migreras till copilot-reports.github.com
20 maj — Nedladdnings-URL:erna för Copilot Usage Metrics-rapporter migrerar från den gamla Azure Front Door-domänen (azurefd.net) till den stabila domänen copilot-reports.github.com. Åtgärd krävs för organisationer med brandvägg eller proxy: lägg till den nya domänen i enterprise-allowlist så snart som möjligt. Den gamla domänen förblir aktiv under övergångsperioden men kommer att avvecklas senare. För GitHub Enterprise Cloud-instanser följer den nya domänen formatet copilot-reports.SUBDOMAIN.ghe.com. En fallback till *.blob.core.windows.net är planerad vid Azure-avbrott.
Cloud agent — Claude Haiku 4.5 och GPT-5.4-mini till 0,33x
18 maj — Copilot cloud agent integrerar två nya ekonomiska modeller: Claude Haiku 4.5 och GPT-5.4-mini, båda debiterade till 0,33x av standardmultiplikatorn (jämfört med 1x för standardmodellerna). Denna expansion gör det möjligt att välja rätt verktyg beroende på uppgiftens natur — en lätt och snabb modell för enkla lint-fixar eller enhetstester, en kraftfullare modell för komplexa omstruktureringar. Modellvalet görs när en uppgift delegeras till cloud agent, vilket optimerar kostnad/kvalitet-förhållandet utifrån arbetets faktiska komplexitet.
Webbchat — Kontextsensitive sidopanel i allmän tillgänglighet
18 maj — Copilot Chat på github.com öppnas nu som en sidopanel direkt bredvid den resurs som granskas (PR, issue, repo), utan att man behöver navigera till en dedikerad sida. Kontexten byggs automatiskt upp när man växlar mellan flera PRs och issues i samma session — korsreferenser mellan resurser förblir tillgängliga utan att tråden i samtalet tappas. Den helsides, immersiva upplevelsen är fortfarande tillgänglig via “More → In immersive chat”. Det går också att omvandla konversationen till en agentsession för att skapa PRs eller starta en fördjupad sökning. Tillgänglig i GA för alla Copilot-planer.
Genspark integrerar Gemini 3.5 Flash gratis
20 maj — Genspark integrerar Gemini 3.5 Flash redan dagen efter tillkännagivandet på Google I/O, tillgängligt gratis i AI Chat Agent och Genspark Claw. Plattformen (70+ modeller samtidigt tillgängliga samtidigt) illustrerar dess strategi för reaktiv integration: att ta till sig de senaste modellerna utan att tvinga användaren att välja manuellt. Gemini 3.5 Flash är Googles mest högpresterande Flash-modell hittills, optimerad för svarshastighet i komplexa uppgifter.
Kling AI i Cannes — RAPHAEL RAPHAEL, 100 % AI-film
21 maj — Kling AI presenterar RAPHAEL RAPHAEL vid filmfestivalen i Cannes 2026, ett långfilmsprojekt som genereras till 100 % av AI i stor skala. Detta tillkännagivande skiljer sig från inlägget den 20 maj om House of David (första Hollywood-serien som integrerar Kling i industriell skala, 44 miljoner tittare, #1 på Prime Video US). Kling AI befäster därmed en närvaro i flera projekt i Cannes 2026 och bekräftar sin position som en viktig aktör inom AI-video för film.
BFL FLUX Erase — Borttagning av objekt och textutplåning
21 maj — Black Forest Labs lanserar FLUX Erase, en intelligent utplåningsfunktion för FLUX-bilder. Tre huvudförmågor: objektborttagning (ren borttagning med konsekvent rekonstruktion av bakgrunden), textutplåning (borttagning samtidigt som den underliggande designen bevaras) och automatisk borttagning av skuggor kopplade till utplånade objekt. Funktionen är utformad för precisionsretuschering (precision inpainting): endast det målade området modifieras, utan att försämra resten av bilden. Tillgänglig via webbverktyget flux-tools.bfl.ai/erase och BFL API (docs.bfl.ai/flux_erase), med omedelbar åtkomst utan väntelista.
ElevenReader — 200 000+ premiumtitlar med valfri röst
21 maj — ElevenLabs integrerar 200 000+ premiumtitlar i ElevenReader: bestsellers i ljudböcker och licensierade e-böcker, varav tusentals tillgängliga med berättarrösten du väljer bland ElevenLabs röster. Denna expansion positionerar ElevenReader som en anpassningsbar ljudläsningsplattform, där användaren inte längre är begränsad till en boks originalberättare: man kan välja den röst man föredrar för vilken kompatibel titel som helst. Appen är tillgänglig på elevenreader.io med gratis åtkomst för att börja.
xAI Grok × OpenCode — Grok Build i kod-CLI:n
21 maj — Grok- eller X Premium-prenumeranter kan nu använda modellen Grok Build i OpenCode, en kodredigerare för kommandoraden (CLI coding editor) specialiserad på kodbasintelligens. Denna integration följer den som tillkännagavs i OpenClaw två dagar tidigare — xAI utökar gradvis sin prenumeration till fler tredjepartsverktyg. Åtkomsten ingår i den befintliga Grok/X Premium-prenumerationen, utan extra kostnad. OpenCode skiljer sig från OpenClaw genom sitt särskilda fokus på kod: analys av kodbas, navigering och assisterad refaktorering.
Codex 26.519 — Appshots, Goal mode GA, låst datoranvändning, delning av plugins
21 maj — OpenAI släpper Codex 26.519 med flera nya macOS- och företagsfunktioner. Appshots gör det möjligt att skicka applikationsfönstret i förgrunden till en Codex-tråd via ett dubbeltryck på båda Command-tangenterna — det synliga fönstret och texten som är tillgänglig via macOS tillgänglighets-API fångas. Goal mode lämnar experimentstadiet och går till allmän tillgänglighet (app, IDE-extension, CLI). Remote computer use: Codex kan nu använda skrivbordsapplikationer efter att Mac-datorn har låsts. Delning av plugins är tillgänglig för ChatGPT Business.
| Funktion | Status | Plattformar |
|---|---|---|
| Appshots | Nytt (GA) | Endast macOS |
| Goal mode | GA (var experimentellt) | App, IDE extension, CLI |
| Remote computer use (låst Mac) | Nytt | macOS + Codex Mobile |
| Plugin sharing | Nytt (Business) | ChatGPT Business |
Kortnyheter
- Gemini Daily Brief — allmän tillgänglighet — Den dagliga sammanfattningen är nu tillgänglig för alla Google AI Plus-, Pro- och Ultra-prenumeranter (18+), initialt i USA. 🔗 källa
- Grok × Imagine — tillgångar för videospel (8,1M visningar) — Viral demonstration av prototypframtagning av tillgångar för videospel direkt med Grok och @imagine, med starkt engagemang från gaming-communityn. 🔗 källa
- Cohere Command A+ — W4A4-vikter tillgängliga på HuggingFace — De kvantiserade W4A4-vikterna för Command A+ går att ladda ner, vilket möjliggör driftsättning på 2× H100 med +47% hastighet jämfört med BF16. 🔗 källa
Vad det betyder
Den agentiska eran tar form på flera fronter samtidigt. Lanseringen av Qwen3.7-Max med 35 timmars kontinuerlig autonomi och 1 000+ verktygsanrop, i kombination med NVIDIA Verified Agent Skills som standardiserar styrningen av agenters kapabiliteter, signalerar att branschen går från en experimentfas till en struktureringsfas. Att NVIDIA baserar sin standard på den öppna specifikationen agentskills.io — kompatibel med Claude Code, Codex och Cursor — antyder en konvergens mot gemensamma gränssnitt för AI-agenter, oberoende av den underliggande modellen.
Säkerheten i AI-verktygskedjan blir en kritisk fråga. GitHub-incidenten, där en skadlig VS Code-extension från Microsofts officiella marketplace komprometterade en intern enhet, illustrerar en ny attackyta som branschen ännu inte helt har hanterat. Tidpunkten är talande: NVIDIA lanserar sina Verified Agent Skills samma dag som GitHub tillkännager sin incident. Ogranskade skills och extensions utgör en växande attackvektor i takt med att AI-agenter tar kontroll över kritiska system.
Utvecklarverktygen konsolideras kring transparens i förbrukning. Tillkännagivandet av Claude Code /usage med uppdelning per komponent, i kombination med Codex Appshots och Goal mode GA, visar en trend: AI-utvecklarverktyg av nästa generation måste nu förklara vad de förbrukar och hur. Finkornighet per Skills/Agents/MCPs/Plugins svarar mot ett konkret behov hos team som driftsätter agenter i produktion och vill förstå de faktiska kostnaderna.
Generativ videokonst går in i filmindustrin. Runway Aleph 2.0 med sin förutsägbara kontroll på bildnivå, Kling AI i Cannes med en långfilm som är 100% AI (RAPHAEL RAPHAEL) och bekräftelsen att House of David (44M tittare, #1 Prime Video US) använder Kling i industriell skala markerar en vändpunkt. Studiorna testar inte längre tekniken — de integrerar den i sina standardiserade produktionspipelines.
Källor
- Qwen3.7-Max — Tweet från Alibaba Qwen
- Qwen3.7-Max — Officiell blogg
- GitHub — Säkerhetsincident (initialt tillkännagivande)
- GitHub — Säkerhetsincident (detaljerad tråd)
- NVIDIA Verified Agent Skills — Utvecklarblogg
- NVIDIA Verified Agent Skills — Tweet
- Runway Aleph 2.0 — Officiellt tillkännagivande
- Runway Aleph 2.0 — Tweet
- Claude Code CHANGELOG
- Claude Code /usage breakdown — Boris Cherny
- Google I/O 2026 — 100 tillkännagivanden
- Gemini Connected Apps — OpenTable, Canva, Instacart
- GitHub Copilot — Migrering av rapport-URL:er
- GitHub Copilot — Claude Haiku 4.5 och GPT-5.4-mini
- GitHub Copilot Chat web — Sidopanel GA
- Genspark — Gemini 3.5 Flash integrerat
- Kling AI — RAPHAEL RAPHAEL i Cannes
- BFL FLUX Erase
- ElevenReader — 200 000+ titlar
- xAI Grok × OpenCode
- Codex 26.519 — Appshots
- Codex 26.519 — Changelog
- Gemini Daily Brief GA
- Grok × Imagine — tillgångar för videospel
- Cohere Command A+ — W4A4 HuggingFace