Qwen3.7-Max, GitHub-säkerhetsincident, NVIDIA Verified Agent Skills, Runway Aleph 2.0

En tät vecka för AI-ekosystemet: Alibaba lanserar sin flaggskeppsmodell Qwen3.7-Max som är utformad för den agentiska eran, GitHub avslöjar en säkerhetsincident som involverar ett skadligt VS Code-tillägg, NVIDIA publicerar ett öppet styrningsramverk för agentskills, och Runway förnyar sin videoredigeringsmodell med Aleph 2.0 och Edit Studio. På utvecklarverktygssidan döper Claude Code 2.1.146 om /simplify till /code-review och Codex 26.519 introducerar Appshots på macOS.

Qwen3.7-Max — Alibabas flaggskepp för den agentiska eran

21 maj — Alibaba lanserar Qwen3.7-Max, sin nya proprietära flaggskeppsmodell, särskilt utformad för autonoma agenter. Modellen följer på förhandsversionerna Qwen3.7-Max-Preview och Qwen3.7-Plus-Preview som utvärderades på Arena den 18 maj.

Positioneringen är uttryckligen “Agent Era”: Qwen3.7-Max riktar sig till uppgifter som går bortom punktuell förståelse och in i området för långvarig autonomi och komplex orkestrering.

Metrik	Värde
AAII-poäng	56,6
Förbättring jämfört med föregående	+4,8 poäng
Kontinuerliga autonomi-timmar (kärntest)	35 h
Verktygskall (kärntest)	1 000+
Visningar av huvudtweeten	~325 000

Fem utannonserade förmågor:

End-to-end-kodningsagent — frontendprototyper, omstruktureringar över flera filer, verklig felsökning
Produktivitet på skrivbordet — uppgifter via MCP-integrationer och hantering av flera agenter
Långvarig autonomi — 35 sammanhängande timmar på en kärnoptimeringsuppgift, 1 000+ verktygskall utan kritisk hallucination
Scaffold-agnostisk — kompatibel med Claude Code, OpenClaw, Qwen Code eller vilken egen stack som helst
Förstärkt vetenskapligt resonemang — AAII-poäng: 56,6 (+4,8 poäng)

Enligt Tongyi Lab (Alibaba) är Qwen3.7-Max “vår senaste proprietära modell som är särskilt utformad för agenternas era”, med en kodningsagent i frontier-klass, en skrivbordsproduktivitetassistent och långvarig autonomi — tillförlitlig varje gång, scaffold-agnostisk.

Modellen är tillgänglig via Qwen Studio (chat.qwen.ai) och Alibaba Clouds API.

🔗 Officiell Qwen3.7-Max-blogg

GitHub — Säkerhetsincident: skadligt VS Code-tillägg

20 maj — GitHub avslöjar en stor säkerhetsincident: en anställd installerade ett skadligt VS Code-tillägg från Microsofts marketplace, vilket möjliggjorde obehörig åtkomst till interna GitHub-repositorier.

Det första inlägget på X genererade 13,4 miljoner visningar, 8 000 reposts och 25 000 likes — ett tecken på en betydande påverkan i communityn. GitHub publicerade en tråd i fem delar som beskriver tidslinjen och de åtgärder som vidtagits.

“1/ Yesterday we detected and contained a compromise of an employee device involving a poisoned VS Code extension. We removed the malicious extension version, isolated the endpoint, and began incident response immediately.”

🇸🇪 I går upptäckte och begränsade vi komprometteringen av en anställds enhet som involverade ett förgiftat VS Code-tillägg. Vi tog bort den skadliga versionen av tillägget, isolerade slutpunkten och inledde omedelbart incidenthanteringen. — @github på X

Det som hände:

Vektor: skadligt VS Code-tillägg från Microsofts marketplace
En GitHub-anställds enhet komprometterades
Obehörig åtkomst till interna GitHub-repositorier

Det som enligt GitHub inte påverkades:

Ingen bekräftad påverkan på kunddata (företag, organisationer, publika eller privata repositorier)

Omedelbara åtgärder:

Borttagning av det skadliga tillägget
Isolering av den komprometterade slutpunkten
Analys av loggar (logs) och rotation av hemligheter
Förstärkt övervakning av infrastrukturen

GitHub har lovat att publicera en fullständig rapport när utredningen är avslutad. Denna incident återupplivar debatten om säkerheten i VS Code:s marketplace för tillägg, som rymmer tiotusentals tillägg vars granskning fortfarande är begränsad.

🔗 GitHub-annonsering på X

NVIDIA Verified Agent Skills — En öppen standard för styrning av AI-agenter

21 maj — NVIDIA lanserar NVIDIA-Verified Agent Skills, ett öppet styrningsramverk för att säkra AI-agenters förmågor (skills). Initiativet svarar mot ett växande problem: skills ökar agenternas kapacitet, men introducerar också potentiella sårbarheter.

En “verifierad” skill enligt NVIDIA bygger på fyra pelare:

Komponent	Beskrivning
Katalogisering	Daglig synkronisering från NVIDIAs produktteam
SkillSpector	Riskscanner baserad på OWASP LLM och MITRE ATLAS
Kryptografisk signatur	Frånkopplad signatur `skill.oms.sig` verifierbar via OpenSSF Model Signing
Skill Card (SKILLCARD.yaml)	Maskinläsbara metadata: härkomst, beroenden, begränsningar, status

Ramverket upptäcker särskilt: sårbara beroenden, prompt injection, trigger abuse, excessive agency och tool poisoning.

Den tekniska specifikationen är öppen via agentskills.io (formatet SKILL.md), inbyggt kompatibel med Claude Code, OpenAI Codex och Cursor. NVIDIAs offentliga katalog över skills finns tillgänglig på github.com/nvidia/skills.

“Verified means cataloged, scanned, signed, and documented with a skill card.”

🇸🇪 Verifierad betyder katalogiserad, skannad, signerad och dokumenterad med ett kompetensblad. — Developer Blog NVIDIA, 21 maj 2026

Att specifikationen är öppen och kompatibel med de tre främsta AI-kodningsverktygen (Claude Code, Codex, Cursor) antyder en ambition om en branschstandard, inte bara ett internt NVIDIA-verktyg.

🔗 NVIDIAs utvecklarblogg

Runway Aleph 2.0 och Edit Studio — Videoredigering upp till 30 sekunder i 1080p

21 maj — Runway lanserar Aleph 2.0, en större uppdatering av sin videoredigeringsmodell, tillsammans med Edit Studio, ett nytt gränssnitt riktat till marknadsföringsteam och filmskapare.

Den centrala nyheten i Aleph 2.0 är image-level-kontroll: användaren anger en redigerad frame som visuell referens, och modellen tillämpar ändringen konsekvent över hela videon. Till skillnad från tidigare angreppssätt där slutresultatet var okänt innan generering, ger denna metod förutsägbar kontroll över outputen.

Funktion	Detalj
Maxlängd	30 sekunder
Upplösning	1080p
Kontroll	Bildreferensframe (image-level)
Redigering av flera shots	Ja — automatisk tillämpning på flera scener
Åtkomst	Alla betalda Runway-planer

Aleph 2.0:s redigeringsmöjligheter:

Exakta lokaliserade redigeringar: endast det modifierade området ändras, resten bevaras
Redigering av flera shots: ändringar tillämpas på videor med flera klipp
Klipp upp till 30 s i 1080p — tillräcklig längd för annonser och kortformat innehåll

Användningsfall för Edit Studio: produktbyte, bakgrundsbyte, säsongsvariationer i kampanjer, ljuskorrigering, borttagning av störande element, fullständig omstyling.

“With Aleph 2.0, your edited frame defines what the change should look like, and the model carries it through to the right parts of your video.”

🇸🇪 Med Aleph 2.0 definierar din redigerade bild det önskade utseendet, och modellen tillämpar det på motsvarande delar av din video. — Runway, officiell blogg 21 maj 2026

🔗 Officiell Runway-annonsering

Claude Code 2.1.146 — `/code-review` och korrigeringar för background agents

21 maj — Anthropic publicerar version 2.1.146 av Claude Code med en huvudnyhet och flera viktiga stabilitetsfixar.

Kommandot /simplify döps om till /code-review, tillsammans med en valfri ambitionsnivå (/code-review high). Denna ändring ompositionerar uttryckligen funktionen som ett verktyg för kodgranskning i agentiska arbetsflöden.

Område	Fix
Windows PowerShell	Regression i v2.1.124 åtgärdad för pwsh via winget/Microsoft Store
MCP-paginering	`resources/list` och `prompts/list` förlorar inte längre objekt bortom sida 1
Background sessions	Strobing i Windows Terminal, worktrees på NTFS, blockeringar `/background` och `claude agents`
Auto mode	`AskUserQuestion` bevaras när skillen eller användaren är beroende av det
Bedrock	Cross-account-autentisering åtgärdad med `awsCredentialExport`
VSCode Voice	Tyst mikrofonfeedback, sox-förslag för WSLg

🔗 CHANGELOG Claude Code

Claude Code /usage — Nedbrytning av tokenförbrukning per komponent

21 maj — Boris Cherny (lead för Claude Code hos Anthropic) meddelar på X en betydande utökning av kommandot /usage: nästa version kommer att göra det möjligt att se exakt vilka Skills, Agents, MCPs och Plugins som förbrukar tokens i en session.

Denna funktion går längre än gårdagens omdesign av gränssnittet. Den ger en komponentvis granularitet — vilket gör det möjligt att identifiera de mest kontextkrävande tilläggen. Den finns redan tillgänglig i CLI och kommer snart till Desktop-appen. Tillkännagivandet genererade 137 527 visningar på X, med många önskemål om att selektivt kunna inaktivera oanvända kopplingar.

“In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using your tokens CLI today, coming to Desktop next”

🇸🇪 I nästa version av Claude Code: kör /usage för att se fördelningen av tokenförbrukning per Skills, Agents, MCPs och Plugins — tillgängligt i CLI idag, på Desktop snart. — @bcherny på X

Google I/O 2026 — Den officiella sammanfattningen med “100 annonseringar”

20 maj — Google publicerar sin officiella sammanfattningsartikel “100 things announced at I/O 2026”, referensdokumentet för hela eventets lanseringar. Bland de bekräftade annonseringarna: Antigravity 2.0 CLI (efterföljaren till Gemini CLI), Universal Cart (köp över flera handlare), Google Pics (smart fotohantering), Ask YouTube (frågor om YouTube-videor), Android XR glasses och expansionen av SynthID. Detta dokument sammanfattar omfattningen av Google I/O 2026 och fungerar som en primär källa för utvecklare som vill hitta alla officiella detaljer.

🔗 Google-blogg — 100 annonseringar I/O 2026

Gemini Connected Apps — OpenTable, Canva och Instacart

21 maj — Google Gemini utökar sina Connected Apps med tre nya partners: OpenTable (restaurangbokning), Canva (skapande av visuellt material) och Instacart (matinköp). Gemini nöjer sig inte längre med att söka information — den utför konkreta handlingar i användarens digitala ekosystem på dennes vägnar. Detta efter-I/O-meddelande konkretiserar Gemini Sparks agentiska vision: agenten agerar på populära tredjepartstjänster utan att lämna appen.

🔗 Annonsering av Gemini Connected Apps

GitHub Copilot — Fyra utvecklaruppdateringar

Metrikrapporter migreras till copilot-reports.github.com

20 maj — Nedladdnings-URL:erna för Copilot Usage Metrics-rapporter migrerar från den gamla Azure Front Door-domänen (azurefd.net) till den stabila domänen copilot-reports.github.com. Åtgärd krävs för organisationer med brandvägg eller proxy: lägg till den nya domänen i enterprise-allowlist så snart som möjligt. Den gamla domänen förblir aktiv under övergångsperioden men kommer att avvecklas senare. För GitHub Enterprise Cloud-instanser följer den nya domänen formatet copilot-reports.SUBDOMAIN.ghe.com. En fallback till *.blob.core.windows.net är planerad vid Azure-avbrott.

🔗 GitHub Copilot-changelog

Cloud agent — Claude Haiku 4.5 och GPT-5.4-mini till 0,33x

18 maj — Copilot cloud agent integrerar två nya ekonomiska modeller: Claude Haiku 4.5 och GPT-5.4-mini, båda debiterade till 0,33x av standardmultiplikatorn (jämfört med 1x för standardmodellerna). Denna expansion gör det möjligt att välja rätt verktyg beroende på uppgiftens natur — en lätt och snabb modell för enkla lint-fixar eller enhetstester, en kraftfullare modell för komplexa omstruktureringar. Modellvalet görs när en uppgift delegeras till cloud agent, vilket optimerar kostnad/kvalitet-förhållandet utifrån arbetets faktiska komplexitet.

🔗 Changelog cloud agent

Webbchat — Kontextsensitive sidopanel i allmän tillgänglighet

18 maj — Copilot Chat på github.com öppnas nu som en sidopanel direkt bredvid den resurs som granskas (PR, issue, repo), utan att man behöver navigera till en dedikerad sida. Kontexten byggs automatiskt upp när man växlar mellan flera PRs och issues i samma session — korsreferenser mellan resurser förblir tillgängliga utan att tråden i samtalet tappas. Den helsides, immersiva upplevelsen är fortfarande tillgänglig via “More → In immersive chat”. Det går också att omvandla konversationen till en agentsession för att skapa PRs eller starta en fördjupad sökning. Tillgänglig i GA för alla Copilot-planer.

🔗 Changelog Copilot Chat web

Genspark integrerar Gemini 3.5 Flash gratis

20 maj — Genspark integrerar Gemini 3.5 Flash redan dagen efter tillkännagivandet på Google I/O, tillgängligt gratis i AI Chat Agent och Genspark Claw. Plattformen (70+ modeller samtidigt tillgängliga samtidigt) illustrerar dess strategi för reaktiv integration: att ta till sig de senaste modellerna utan att tvinga användaren att välja manuellt. Gemini 3.5 Flash är Googles mest högpresterande Flash-modell hittills, optimerad för svarshastighet i komplexa uppgifter.

🔗 Genspark-annonsering

Kling AI i Cannes — RAPHAEL RAPHAEL, 100 % AI-film

21 maj — Kling AI presenterar RAPHAEL RAPHAEL vid filmfestivalen i Cannes 2026, ett långfilmsprojekt som genereras till 100 % av AI i stor skala. Detta tillkännagivande skiljer sig från inlägget den 20 maj om House of David (första Hollywood-serien som integrerar Kling i industriell skala, 44 miljoner tittare, #1 på Prime Video US). Kling AI befäster därmed en närvaro i flera projekt i Cannes 2026 och bekräftar sin position som en viktig aktör inom AI-video för film.

🔗 Annonsering av Kling AI

BFL FLUX Erase — Borttagning av objekt och textutplåning

21 maj — Black Forest Labs lanserar FLUX Erase, en intelligent utplåningsfunktion för FLUX-bilder. Tre huvudförmågor: objektborttagning (ren borttagning med konsekvent rekonstruktion av bakgrunden), textutplåning (borttagning samtidigt som den underliggande designen bevaras) och automatisk borttagning av skuggor kopplade till utplånade objekt. Funktionen är utformad för precisionsretuschering (precision inpainting): endast det målade området modifieras, utan att försämra resten av bilden. Tillgänglig via webbverktyget flux-tools.bfl.ai/erase och BFL API (docs.bfl.ai/flux_erase), med omedelbar åtkomst utan väntelista.

🔗 BFL-annonsering

ElevenReader — 200 000+ premiumtitlar med valfri röst

21 maj — ElevenLabs integrerar 200 000+ premiumtitlar i ElevenReader: bestsellers i ljudböcker och licensierade e-böcker, varav tusentals tillgängliga med berättarrösten du väljer bland ElevenLabs röster. Denna expansion positionerar ElevenReader som en anpassningsbar ljudläsningsplattform, där användaren inte längre är begränsad till en boks originalberättare: man kan välja den röst man föredrar för vilken kompatibel titel som helst. Appen är tillgänglig på elevenreader.io med gratis åtkomst för att börja.

🔗 ElevenLabs-annonsering

xAI Grok × OpenCode — Grok Build i kod-CLI:n

21 maj — Grok- eller X Premium-prenumeranter kan nu använda modellen Grok Build i OpenCode, en kodredigerare för kommandoraden (CLI coding editor) specialiserad på kodbasintelligens. Denna integration följer den som tillkännagavs i OpenClaw två dagar tidigare — xAI utökar gradvis sin prenumeration till fler tredjepartsverktyg. Åtkomsten ingår i den befintliga Grok/X Premium-prenumerationen, utan extra kostnad. OpenCode skiljer sig från OpenClaw genom sitt särskilda fokus på kod: analys av kodbas, navigering och assisterad refaktorering.

🔗 xAI-annons

Codex 26.519 — Appshots, Goal mode GA, låst datoranvändning, delning av plugins

21 maj — OpenAI släpper Codex 26.519 med flera nya macOS- och företagsfunktioner. Appshots gör det möjligt att skicka applikationsfönstret i förgrunden till en Codex-tråd via ett dubbeltryck på båda Command-tangenterna — det synliga fönstret och texten som är tillgänglig via macOS tillgänglighets-API fångas. Goal mode lämnar experimentstadiet och går till allmän tillgänglighet (app, IDE-extension, CLI). Remote computer use: Codex kan nu använda skrivbordsapplikationer efter att Mac-datorn har låsts. Delning av plugins är tillgänglig för ChatGPT Business.

Funktion	Status	Plattformar
Appshots	Nytt (GA)	Endast macOS
Goal mode	GA (var experimentellt)	App, IDE extension, CLI
Remote computer use (låst Mac)	Nytt	macOS + Codex Mobile
Plugin sharing	Nytt (Business)	ChatGPT Business

🔗 Codex-changelog

Kortnyheter

Gemini Daily Brief — allmän tillgänglighet — Den dagliga sammanfattningen är nu tillgänglig för alla Google AI Plus-, Pro- och Ultra-prenumeranter (18+), initialt i USA. 🔗 källa
Grok × Imagine — tillgångar för videospel (8,1M visningar) — Viral demonstration av prototypframtagning av tillgångar för videospel direkt med Grok och @imagine, med starkt engagemang från gaming-communityn. 🔗 källa
Cohere Command A+ — W4A4-vikter tillgängliga på HuggingFace — De kvantiserade W4A4-vikterna för Command A+ går att ladda ner, vilket möjliggör driftsättning på 2× H100 med +47% hastighet jämfört med BF16. 🔗 källa

Vad det betyder

Den agentiska eran tar form på flera fronter samtidigt. Lanseringen av Qwen3.7-Max med 35 timmars kontinuerlig autonomi och 1 000+ verktygsanrop, i kombination med NVIDIA Verified Agent Skills som standardiserar styrningen av agenters kapabiliteter, signalerar att branschen går från en experimentfas till en struktureringsfas. Att NVIDIA baserar sin standard på den öppna specifikationen agentskills.io — kompatibel med Claude Code, Codex och Cursor — antyder en konvergens mot gemensamma gränssnitt för AI-agenter, oberoende av den underliggande modellen.

Säkerheten i AI-verktygskedjan blir en kritisk fråga. GitHub-incidenten, där en skadlig VS Code-extension från Microsofts officiella marketplace komprometterade en intern enhet, illustrerar en ny attackyta som branschen ännu inte helt har hanterat. Tidpunkten är talande: NVIDIA lanserar sina Verified Agent Skills samma dag som GitHub tillkännager sin incident. Ogranskade skills och extensions utgör en växande attackvektor i takt med att AI-agenter tar kontroll över kritiska system.

Utvecklarverktygen konsolideras kring transparens i förbrukning. Tillkännagivandet av Claude Code /usage med uppdelning per komponent, i kombination med Codex Appshots och Goal mode GA, visar en trend: AI-utvecklarverktyg av nästa generation måste nu förklara vad de förbrukar och hur. Finkornighet per Skills/Agents/MCPs/Plugins svarar mot ett konkret behov hos team som driftsätter agenter i produktion och vill förstå de faktiska kostnaderna.

Generativ videokonst går in i filmindustrin. Runway Aleph 2.0 med sin förutsägbara kontroll på bildnivå, Kling AI i Cannes med en långfilm som är 100% AI (RAPHAEL RAPHAEL) och bekräftelsen att House of David (44M tittare, #1 Prime Video US) använder Kling i industriell skala markerar en vändpunkt. Studiorna testar inte längre tekniken — de integrerar den i sina standardiserade produktionspipelines.

Qwen3.7-Max, GitHub-säkerhetsincident, NVIDIA Verified Agent Skills, Runway Aleph 2.0

Qwen3.7-Max — Alibabas flaggskepp för den agentiska eran

GitHub — Säkerhetsincident: skadligt VS Code-tillägg

NVIDIA Verified Agent Skills — En öppen standard för styrning av AI-agenter

Runway Aleph 2.0 och Edit Studio — Videoredigering upp till 30 sekunder i 1080p

Claude Code 2.1.146 — `/code-review` och korrigeringar för background agents

Claude Code /usage — Nedbrytning av tokenförbrukning per komponent

Google I/O 2026 — Den officiella sammanfattningen med “100 annonseringar”

Gemini Connected Apps — OpenTable, Canva och Instacart

GitHub Copilot — Fyra utvecklaruppdateringar

Metrikrapporter migreras till copilot-reports.github.com

Cloud agent — Claude Haiku 4.5 och GPT-5.4-mini till 0,33x

Webbchat — Kontextsensitive sidopanel i allmän tillgänglighet

Genspark integrerar Gemini 3.5 Flash gratis

Kling AI i Cannes — RAPHAEL RAPHAEL, 100 % AI-film

BFL FLUX Erase — Borttagning av objekt och textutplåning

ElevenReader — 200 000+ premiumtitlar med valfri röst

xAI Grok × OpenCode — Grok Build i kod-CLI:n

Codex 26.519 — Appshots, Goal mode GA, låst datoranvändning, delning av plugins

Kortnyheter

Vad det betyder

Källor

Innehållsförteckning

Qwen3.7-Max, GitHub-säkerhetsincident, NVIDIA Verified Agent Skills, Runway Aleph 2.0

Qwen3.7-Max — Alibabas flaggskepp för den agentiska eran

GitHub — Säkerhetsincident: skadligt VS Code-tillägg

NVIDIA Verified Agent Skills — En öppen standard för styrning av AI-agenter

Runway Aleph 2.0 och Edit Studio — Videoredigering upp till 30 sekunder i 1080p

Claude Code 2.1.146 — /code-review och korrigeringar för background agents

Claude Code /usage — Nedbrytning av tokenförbrukning per komponent

Google I/O 2026 — Den officiella sammanfattningen med “100 annonseringar”

Gemini Connected Apps — OpenTable, Canva och Instacart

GitHub Copilot — Fyra utvecklaruppdateringar

Metrikrapporter migreras till copilot-reports.github.com

Cloud agent — Claude Haiku 4.5 och GPT-5.4-mini till 0,33x

Webbchat — Kontextsensitive sidopanel i allmän tillgänglighet

Genspark integrerar Gemini 3.5 Flash gratis

Kling AI i Cannes — RAPHAEL RAPHAEL, 100 % AI-film

BFL FLUX Erase — Borttagning av objekt och textutplåning

ElevenReader — 200 000+ premiumtitlar med valfri röst

xAI Grok × OpenCode — Grok Build i kod-CLI:n

Codex 26.519 — Appshots, Goal mode GA, låst datoranvändning, delning av plugins

Kortnyheter

Vad det betyder

Källor

Claude Code 2.1.146 — `/code-review` och korrigeringar för background agents