Claude Code autoläge, visuell shopping i ChatGPT, Grok Imagine multi-image till video

Intensiva dagar den 23 och 24 mars: Anthropic rullar ut autoläge i Claude Code — en åtgärdsklassificerare som fattar godkännandebeslut i användarens ställe — och publicerar en ingenjörsartikel om sin multi-agent-arkitektur inspirerad av GAN. OpenAI lanserar visuell shopping i ChatGPT med Agentic Commerce Protocol, medan xAI öppnar Grok Imagine för multi-image-video via API. GitHub Copilot, Google DeepMind och Anthropic Science Blog kompletterar denna översikt.

Claude Code: autoläge, en klassificerare mellan dig och kommandona

24 mars — Claude Code lägger till en tredje behörighetsnivå: autoläge. Hittills erbjöd verktyget antingen att manuellt godkänna varje filskrivning och bash-kommando, eller att helt stänga av kontrollerna. Autoläget introducerar en mellanväg: Claude fattar besluten själv, inom ramarna för en klassificerare (classifier) som analyserar varje åtgärd före körning.

Mekanismen är enkel — före varje verktygsanrop bedömer klassificeraren om åtgärden potentiellt är destruktiv. Åtgärder som bedöms som säkra körs automatiskt. Riskfyllda åtgärder blockeras, och Claude söker ett alternativt angreppssätt utan att avbryta användaren.

Anthropic preciserar att detta läge minskar riskerna utan att eliminera dem, och rekommenderar att det används i isolerade miljöer. För att aktivera det: claude --enable-auto-mode, och navigera sedan till detta läge med Shift+Tab.

Funktionen finns tillgänglig som förhandsversion (research preview) i Team-planen. Utrullning för Enterprise och API aviserades för de följande dagarna.

New in Claude Code: auto mode. Instead of approving every file write and bash command, or skipping permissions entirely, auto mode lets Claude make permission decisions on your behalf. Safeguards check each action before it runs.

🇸🇪 Nytt i Claude Code: autoläge. I stället för att godkänna varje filskrivning och varje bash-kommando, eller helt hoppa över behörigheter, låter autoläget Claude fatta godkännandebeslut åt dig. Skydd kontrollerar varje åtgärd innan den körs. — @claudeai på X

🔗 Tillkännagivande på X

Multi-agent-arkitektur: Anthropic Engineerings GAN-angreppssätt

24 mars — I en artikel publicerad på Anthropic Engineering Blog beskriver Prithvi Rajasekaran (Labs-teamet) en multi-agent-arkitektur för att tänja på gränserna för Claude inom två områden: gränssnittsdesign och långvarig autonom applikationsutveckling.

Angreppssättet är inspirerat av generativa adversariella nätverk (Generative Adversarial Networks, GAN): en genererande agent producerar koden eller designen, medan en separat utvärderande agent betygsätter resultatet och ger kritisk återkoppling. Denna frikoppling löser ett känt problem — Claude tenderar att självutvärdera alltför välvilligt. En dedikerad utvärderare, som successivt kalibreras med exempel, blir en effektiv hävstång för förbättring.

För frontend-design får utvärderaren tillgång till MCP Playwright för att navigera live-sidor. Fyra kriterier används: designens kvalitet och konsekvens, originalitet (med straff för generiska mönster som kallas “AI slop”), tekniskt hantverk och funktionalitet. På 10 till 15 iterationer producerar generatorn märkbart mer distinkta gränssnitt.

För applikationsutveckling lägger arkitekturen till en planerare: den omvandlar en prompt på en mening till en komplett produktspecifikation. Generatorn och utvärderaren förhandlar fram “sprintkontrakt” före varje implementation och definierar framgångskriterierna. Utvärderaren testar applikationen via Playwright och kan underkänna en sprint, vilket tvingar fram en revidering.

Angreppssätt	Varaktighet	Kostnad	Resultat
Solo-agent Opus 4.5	20 min	9 $	Trasig applikation
Komplett harness	6 h	200 $	Fungerande applikation
Harness med Opus 4.6	4 h	124,70 $	Fungerande applikation + integrerad Claude-agent

Med Opus 4.6 — som inte längre lider av “kontextångest” — kunde författaren förenkla arkitekturen, ta bort sessionsåterställningar och minska kostnaderna. Den vägledande principen består: granska regelbundet harness för att ta bort sådant som modellen numera kan göra själv.

🔗 Fullständig artikel 🔗 Tillkännagivande på X

Computer Use i Cowork och Claude Code (macOS, Pro/Max)

23 mars — Claude kan nu använda din dator för att utföra uppgifter direkt. Som förhandsversion är denna funktion tillgänglig i Claude Cowork och Claude Code, endast på macOS.

Claude kan öppna applikationer, navigera i webbläsaren och fylla i kalkylblad. Idén: lämna över en uppgift från telefonen, göra något annat och komma tillbaka till ett slutfört arbete. Det går också att definiera återkommande uppgifter — skanna e-post varje morgon, generera en rapport varje fredag.

Funktionen Computer Use finns tillgänglig i Pro- och Max-planerna, genom att uppdatera skrivbordsappen och koppla den till mobilappen.

🔗 Tillkännagivande på X 🔗 Cowork-produktsida

Anthropic Economic Index: “Learning curves” (5:e rapporten)

24 mars — Anthropic publicerar sin femte rapport i Anthropic Economic Index, med titeln “Learning curves”, baserad på användningsdata för Claude i februari 2026 (cirka 1 miljon konversationer, från 5 till 12 februari).

Rapporten dokumenterar två stora utvecklingar sedan november 2025. För det första en diversifiering av användningsområden: de tio vanligaste uppgifterna på Claude.ai står nu bara för 19 % av trafiken, jämfört med 24 % tre månader tidigare. Denna trend förklaras delvis av att kodningsuppgifter flyttar till API, drivet av Claude Codes tillväxt.

Därefter effekten “inlärningskurva”: långvariga användare (mer än sex månader) uppvisar en framgångsgrad som är 4 till 5 procentenheter högre. De arbetar med mer komplexa problem, samarbetar mer och delegerar mindre i automatiskt läge. Författarna ser detta som en signal om lärande genom praktik (learning-by-doing), även om en överlevnadsbias fortfarande är möjlig.

När det gäller modellval bekräftar datan att användarna föredrar Opus för uppgifter med högt värde: varje ytterligare intervall om 10 $/h i en uppgifts uppskattade värde åtföljs av en ökning på 1,5 procentenheter i andelen Opus-användning på Claude.ai, och 2,8 punkter på API.

🔗 Fullständig rapport 🔗 Tillkännagivande på X

Anthropic Science Blog: en ny blogg för AI inom vetenskaplig forskning

23 mars — Anthropic lanserar Anthropic Science Blog, tillägnad skärningspunkten mellan AI och vetenskaplig forskning. Målet är att dokumentera hur AI accelererar forskares arbete och utforska de frågor som denna omvandling väcker.

Bloggen kommer att publicera tre typer av innehåll: fördjupande artiklar om specifika resultat med AI:s roll i detalj (Features), praktiska guider per vetenskapligt område (Workflows) och översikter över nyheter inom fältet (Field notes).

Två premiärartiklar följer lanseringen: “Vibe physics: The AI grad student” av Matthew Schwartz (en fysiker som övervakas av Claude i en verklig beräkning), och en handledning om orkestrering av Claude Code för flerdagars vetenskapliga uppgifter.

Bloggen är förankrad i Anthropics befintliga initiativ: programmet AI for Science (API-krediter för forskare), Claude for Life Sciences (partnerskap med läkemedels- och bioteknikbolag) och Genesis Mission.

🔗 Lanseringsartikel 🔗 Tillkännagivande på X

Visuell shopping i ChatGPT och Agentic Commerce Protocol

24 mars — OpenAI lanserar en visuell och immersiv shoppingupplevelse direkt i ChatGPT. Användare kan bläddra bland produkter visuellt, jämföra dem sida vid sida med detaljer (pris, omdömen, egenskaper) och förfina sin sökning i konversation — utan att lämna ChatGPT. Det går också att ladda upp en inspirationsbild för att hitta liknande artiklar.

För att driva denna funktion utökar OpenAI Agentic Commerce Protocol (ACP) till produktupptäckt. Detta protokoll blir kopplingslagret mellan handlare och användare: handlare delar sina kataloger via ACP, och datan flödar direkt in i ChatGPT. Salesforce och Stripe är redan integrerade som tredjepartsleverantörer.

Detalj	Info
Tillgänglighet	Alla Free-, Go-, Plus- och Pro-användare — utrullning denna vecka
Bilduppladdning	Inspirationsfoto för att hitta liknande artiklar
Integrerade handlare	Target, Sephora, Nordstrom, Lowe’s, Best Buy, The Home Depot, Wayfair
Shopify	Kataloger redan integrerade utan åtgärd från handlare

Walmart är den första handlaren som erbjuder en inbyggd ChatGPT-app: från upptäckt i ChatGPT till en Walmart-miljö med kontolänkning, lojalitetsprogram och betalningar. Tillgänglig i webbläsare; iOS och Android kommer senare. Notering: OpenAI överger sin ursprungliga funktion “Instant Checkout”, som bedömdes vara otillräckligt flexibel för handlare, och fokuserar på upptäckt.

🔗 Officiellt tillkännagivande

OpenAI: säkerhetspolicyer för tonåringar som open source

24 mars — OpenAI publicerar en uppsättning säkerhetspolicyer med öppen källkod för att hjälpa utvecklare att skapa upplevelser anpassade för tonåringar. Dessa policyer presenteras som prompts som kan användas direkt med gpt-oss-safeguard, OpenAI:s open-weight-säkerhetsmodell.

Målet: göra det möjligt för utvecklare att översätta abstrakta säkerhetsmål till precisa operativa regler. Sex områden täcks:

Område	Beskrivning
Grafiskt våldsamt innehåll	Filtrering av explicit våld
Grafiskt sexuellt innehåll	Filtrering av explicit sexualitet
Farliga kroppsideal	Ätstörningar, riskbeteenden
Farliga aktiviteter och utmaningar	Riskfyllda virala challenges
Romantiska eller våldsamma rollspel	Olämpliga interaktioner
Varor och tjänster för vuxna	Alkohol, tobak, hasardspel

Dessa policyer har utvecklats tillsammans med Common Sense Media och everyone.ai. De publiceras via ROOST Model Community (RMC GitHub) och presenteras uttryckligen som en utgångspunkt, inte som en komplett lösning.

🔗 Officiellt tillkännagivande

OpenAI Foundation: minst 1 miljard dollar sätts i arbete

24 mars — Bret Taylor, styrelseordförande för OpenAI Foundation, meddelar att stiftelsen börjar sätta in de resurser som kommer från rekapitaliseringen hösten 2025. Minst 1 miljard dollar kommer att investeras under året inom fyra områden: life sciences (Alzheimer, sjukdomar med hög dödlighet), sysselsättning och ekonomisk påverkan, AI-resiliens (barnsäkerhet, biosäkerhet) och samhällsprogram.

🔗 Officiellt tillkännagivande

OpenAI: Library-flik för att hantera filer i ChatGPT

23 mars — OpenAI lägger till nya funktioner för filhantering i ChatGPT: senaste filer åtkomliga direkt från verktygsfältet, möjlighet att fråga ett redan uppladdat dokument och en Library-flik i webbens sidofält för att hitta alla filer. Tillgängligt för Plus-, Pro- och Business-prenumeranter, med utrullning kommande för Europeiska ekonomiska samarbetsområdet, Schweiz och Storbritannien.

🔗 Tillkännagivande på X

Gemini 3.1 Flash-Lite: en webbläsare som genererar sidor i realtid

24 mars — Google DeepMind publicerar en demonstration av Gemini 3.1 Flash-Lite: en experimentell webbläsare som genererar varje webbsida i farten, i takt med klick, sökningar och navigering. Inga befintliga HTML-sidor — allt innehåll skapas i realtid av modellen. Demon är åtkomlig direkt från Google AI Studio och har genererat stort engagemang (85 000 visningar på några timmar).

🔗 AI Studio-demo 🔗 Tillkännagivande på X

Google DeepMind × Agile Robots: robotikpartnerskap

24 mars — Google DeepMind tillkännager ett forskningspartnerskap med Agile Robots, specialist på humanoid robotik. Avtalet innebär att Gemini-grundmodeller integreras i Agile Robots robotikhårdvara, inom ramen för Google DeepMinds Gemini Robotics-strategi.

🔗 Tillkännagivande på X

Grok Imagine: multi-image-video på API (#1 Arena Elo 1342)

24 mars — xAI tillkännager två nya kapaciteter för sitt Grok Imagine-API: videogenerering från flera bilder (multi-image to video) och förlängning av befintlig video (video extension).

Utvecklare kan skicka in upp till 7 bilder som input för att generera en sammanhängande video via modellen grok-imagine-video. API fungerar asynkront: man skickar in begäran och frågar sedan tills statusen done uppnås. Utdata stöder bildförhållandet 16:9 i 720p.

Enligt Design Arena tog Grok Imagine omedelbart förstaplatsen i rankningen Multi Image to Video Arena med en Elo-poäng på 1342.

🔗 Tillkännagivande @grok 🔗 Imagine API-dokumentation

GitHub Copilot: @copilot för att ändra en PR direkt

24 mars — GitHub Copilot kan nu ändra vilken pull request som helst direkt på begäran. Genom att nämna @copilot i en kommentar med en instruktion på naturligt språk — fixa misslyckade tester, åtgärda en review-kommentar, lägga till ett enhetstest — arbetar agenten i sin cloud-miljö, validerar sitt arbete med tester och linters och pushar sedan ändringarna till branchen. Det tidigare beteendet (att öppna en ny PR) är fortfarande tillgängligt om man uttryckligen ber om det. Tillgängligt i alla betalda Copilot-planer.

🔗 GitHub Changelog

GitHub Copilot: Gemini 3.1 Pro i JetBrains, Xcode och Eclipse

23 mars — GitHub Copilot utökar tillgängligheten för Gemini 3.1 Pro till JetBrains-IDE:er, Xcode och Eclipse. Modellen är nu åtkomlig via Copilots modellväljare i alla lägen (agent, ask, edit) i dessa miljöer, utöver de plattformar som redan stöds. I offentlig preview för planerna Enterprise, Business, Pro och Pro+.

🔗 GitHub Changelog

GitHub Copilot: hantering av agentåtkomst per repository via API

24 mars — GitHub publicerar i offentlig preview ett REST-API för att hantera åtkomst för Copilot coding agent på organisationsrepositories. Administratörer kan programmässigt tillåta agenten på inga, alla eller vissa specifika repositories — användbart för storskaliga utrullningar i företag.

🔗 GitHub Changelog

GitHub Copilot: live-loggar i Raycast

20 mars — GitHub Copilot-tillägget för Raycast (macOS/Windows-launchern) gör det nu möjligt att övervaka coding agentens loggar live utan att lämna launchern. Via kommandot “View Tasks”, och därefter val av session, kan utvecklare följa agentens framsteg i realtid. Tillgängligt för alla betalda Copilot-prenumeranter.

🔗 GitHub Changelog

Vad det betyder

Claude Codes auto mode är den mest strukturellt viktiga förändringen under den här perioden. Den flyttar den kognitiva belastningen från användaren — man behöver inte längre godkänna varje kommando — samtidigt som ett säkerhetsnät bibehålls via klassificeraren. Det är ett steg mot mer autonoma utvecklingsagenter, men inom en ram som uttryckligen rekommenderas för isolerade miljöer. Ingenjörsartikeln om multi-agent-harness kompletterar bilden: Anthropics riktning är tydligt mot agenter som arbetar länge och självständigt, med interna övervakningsstrukturer (dedikerad utvärderare, sprintkontrakt) snarare än mänsklig övervakning vid varje steg.

På OpenAI-sidan markerar visuell shopping i ChatGPT en vändning mot kommersiella användningsfall för breda konsumentgrupper. Agentic Commerce Protocol positionerar ChatGPT som ett förmedlingslager mellan handlare och konsumenter — en annan strategi än ett rent API, som riktar in sig direkt på transaktionsvärde.

Att Grok Imagine når förstaplatsen i Arena-rankingen redan vid lanseringen för multi-image to video illustrerar hur snabbt xAI itererar inom videogenerering. GitHub Copilot stärker å sin sida systematiskt autonomin hos sin coding agent: förmågan att ändra en befintlig PR direkt minskar ytterligare fram-och-tillbaka mellan agenten och utvecklaren.

Källor

Detta dokument har översatts från versionen fr till språket sv med modellen gpt-5.5. För mer information om översättningsprocessen, se https://gitlab.com/jls42/ai-powered-markdown-translator