Claude Code Desktop-omdesign, Agents SDK OpenAI, Gemini 3.1 Flash TTS och Mac-app

En fullspäckad dag den 15 april: Anthropic lanserar en helt omarbetad desktopversion av Claude Code med fokus på parallella agenter, OpenAI publicerar Agents SDK v0.14.0 med inbyggd sandbox och standardiserade agentiska primitiver, och Google tillkännager samtidigt Gemini 3.1 Flash TTS (Elo 1 211) samt en gratis macOS-desktopapp. Parallellt öppnar Mistral MCP Connectors i Studio, Anthropic publicerar två uppmärksammade studier om alignment, och för första gången i bilreklam: den första Mazda-reklamfilmen helt producerad av AI.

Claude Code Desktop : omdesign för parallella agenter

14 april — Anthropic lanserar en fullständig omdesign av Claude Code-desktopappen, utformad för körning av flera sessioner parallellt.

“We’ve redesigned Claude Code on desktop. You can now run multiple Claude sessions side by side from the same app.”

🇸🇪 Vi har omarbetat Claude Code på datorn. Du kan nu starta flera Claude-sessioner parallellt från samma app. — @claudeai på X

Funktion	Beskrivning
Sessionssidopanel	Alla aktiva och senaste sessioner, filtrerbara efter status, projekt eller miljö
Side chat (⌘+; / Ctrl+;)	Grenar av en konversation från huvudsessionen utan att förorena den
Integrerad terminal	Kör tester eller byggen utan att lämna appen
Inbyggd filredigerare	Öppna, ändra och spara filer direkt
Obyggd diffvisare	Förbättrad prestanda för stora ändringsuppsättningar
Utökad förhandsvisning	HTML, PDF, lokala servrar i förhandsvisningspanelen
Dra-och-släpp-layout	Arrangera terminal, förhandsvisning, diffvisare och chat fritt
CLI-pluginparitet	Plugins fungerar identiskt i desktopappen
SSH utökat till Mac	Utöver Linux kan sessioner nu peka mot fjärrmaskiner
3 visningslägen	Verbose, Normal, Summary — från full detaljnivå till endast resultat

Sessionssidopanelen är den mest genomgripande förändringen: den samlar alla aktiva sessioner på ett enda ställe, vilket i grunden förändrar hur man arbetar med flera agenter parallellt. Side chat (⌘+; på Mac, Ctrl+; på Linux/Windows) gör det möjligt att starta en sidokonversation utan att förorena huvudsessionens kontext — användbart för att ställa en snabb fråga eller testa en hypotes.

SSH-utvidgningen till macOS fyller en tydlig lucka jämfört med Linux: sessioner kan nu peka mot fjärrmaskiner från Mac, vilket öppnar för arbetsflöden där koden körs på en avlägsen server men fortfarande styrs från det lokala gränssnittet.

Tillgängligt nu för alla Claude Code-användare på Pro-, Max-, Team- och Enterprise-planerna samt via Claude API.

🔗 Claude-bloggen — Redesigning Claude Code on desktop 🔗 Ladda ner appen

OpenAI Agents SDK v0.14.0 : inbyggd sandbox och agentiska primitiver

15 april — OpenAI publicerar en betydande uppdatering av sitt Agents SDK (openai-agents>=0.14.0). Tillkännagivandet positionerar detta SDK som standardinfrastrukturen för att bygga produktionsklara agenter.

Förstärkt inbyggd harness

SDK:t integrerar nu en uppsättning primitiver som ligger i linje med vad andra ledande agentiska körmiljöer gör:

Primitive	Beskrivning
MCP (tool use)	Verktygsanrop via MCP-protokollet
AGENTS.md	Anpassade instruktioner via konfigurationsfil
`shell` tool	Körning av kommandon (kodexekvering)
`apply patch` tool	Filredigering via patch
Skills	Gradvis exponering av förmågor
Konfigurerbart minne	Hantering av agentens långtidstillstånd

Körmiljö i sandlåda (sandbox)

Agenter kan nu köras i kontrollerade miljöer (sandboxes) med eget filsystem, egna beroenden och egna verktyg. Separationen mellan orkestreraren (harness) och beräkningen (compute) är utformad för tre mål: att skydda autentiseringsuppgifter i miljöer där genererad kod körs, att möjliggöra uthållig körning via kontrollpunkt (checkpoint) och återhydrering om containern kraschar, samt att möjliggöra uppskalning (scaling) med flera sandlådor parallellt.

Nativt stödda sandboxleverantörer: Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel.

Lagring via abstraktionen Manifest : AWS S3, Google Cloud Storage, Azure Blob Storage, Cloudflare R2.

Tillgänglighet

Python först, TypeScript planeras i en kommande version. Bland företagen som testat i förväg finns Oscar Health, LexisNexis, Thomson Reuters, Zoom.

🔗 Officiellt tillkännagivande från OpenAI

Gemini 3.1 Flash TTS : audio tags och Elo 1 211

15 april — Google lanserar Gemini 3.1 Flash TTS, deras mest uttrycksfulla och styrbara modell för talsyntes (text-to-speech) hittills.

Den stora nyheten är introduktionen av audio tags: kommandon på naturligt språk som bäddas in direkt i inmatningstexten för att styra röststil, tempo och ton. Ett avsnitt omgivet av [excitement] uttalas med entusiasm, ett avsnitt [explanatory] antar en pedagogisk ton. Detta placerar utvecklaren i rollen som en slags «regissör» som kan komponera precisa ljudupplevelser.

Funktion	Detalj
Audio tags	Kommandon på naturligt språk i texten
Språk som stöds	70+ (varav 24 av hög kvalitet utvärderade)
Dialog med flera talare	Inbyggt
Watermarking	SynthID inbyggt i allt genererat ljud
Elo-poäng	1 211 (Artificial Analysis TTS Leaderboard)

Med ett Elo-poäng på 1 211 i referensrankningen Artificial Analysis TTS — som mäter tusentals mänskliga preferenser i blindtest — positioneras modellen i den «mest attraktiva kvadranten» för sin balans mellan kvalitet och kostnad.

I Google AI Studio finns tre avancerade kontroller tillgängliga: Scene direction (definiera miljön och spelinstruktionerna), Speaker-level specificity (unika ljudprofiler per karaktär) och Seamless export (exportera inställningarna som API-kod för att behålla röstmässig konsekvens mellan projekt).

Allt genererat ljud märks omärkbart med SynthID, Googles digitala vattenstämpel.

Tillgänglighet:

Utvecklare: förhandsversion (preview) via Gemini API och Google AI Studio
Företag: förhandsversion i Vertex AI
Workspace-användare: via Google Vids

🔗 blog.google-artikel — Gemini 3.1 Flash TTS

Gemini App för Mac : inbyggd desktopklient

15 april — Google lanserar Gemini-appen för macOS, tillgänglig gratis för alla användare på macOS 15 och senare.

Funktion	Detalj
Global genväg	`Option + Space` från valfri app
Fönsterdelning	Kontext om lokala dokument, kod, data
Bildgenerering	Nano Banana-integration
Videogenerering	Veo-integration
Tillgänglighet	Gratis, macOS 15+, globalt

Appen är tillgänglig från vilken skärm som helst via Option + Space, vilket gör det möjligt att fråga Gemini utan att lämna sitt arbetsflöde. Den kan dela det aktiva fönstret för att ge omedelbar kontext om lokala filer, tabeller, diagram eller kodblock.

Google beskriver denna version som en «första version» som lägger grunden för en personlig och proaktiv skrivbordsassistent, med fler tillkännagivanden planerade under de kommande månaderna.

🔗 blog.google-artikel — Gemini App för macOS

Claude Code v2.1.108 och v2.1.109 : sessionsrecap, 1h caching, thinking

14–15 april — Två nya versioner av Claude Code på två dagar.

v2.1.108 medför flera funktionella förbättringar:

Funktion	Beskrivning
Sessionsrecap	`/recap` eller `/config`, utlöses automatiskt efter en frånvaro. Kan framtvingas via `CLAUDE_CODE_ENABLE_AWAY_SUMMARY`
Prompt caching 1h	Variabeln `ENABLE_PROMPT_CACHING_1H` för TTL 1h (API key, Bedrock, Vertex, Foundry). `FORCE_PROMPT_CACHING_5M` framtvingar TTL 5 min
Slash-commands via Skill tool	Modellen kan anropa de inbyggda kommandona (`/init`, `/review`, `/security-review`) via Skill tool
`/undo`-alias	`/undo` är nu ett alias för `/rewind`
Förbättringar av `/model`	Varning före modellbyte (nästa svar läser hela historiken igen utan cache)
Förbättringar av `/resume`	Standard för sessioner i den aktuella katalogen; `Ctrl+A` för att se alla projekt

Funktionen /recap är särskilt användbar i ett sammanhang med parallella agenter: när man kommer tillbaka till en session som lämnats i bakgrunden sammanfattar Claude vad som har hänt sedan senaste interaktionen.

v2.1.109 innehåller en förbättring av gränssnittet för extended thinking-läget: förloppsindikatorn snurrar med en roterande hint för att bättre visualisera att modellen befinner sig i ett tänkande stadium.

🔗 CHANGELOG Claude Code

Anthropic : automatiserade alignment-forskare (PGR 0.97)

14 april — Inom ramen för Anthropic Fellows-programmet, ett originellt experiment: kan Claude Opus 4.6 användas för att påskynda forskningen om alignment?

Problemet med «svag-till-stark»-övervakning (weak-to-strong supervision) är en proxy för den kommande utmaningen: hur övervakar vi modeller som är smartare än vi själva? Experimentet använder en stark modell (Qwen 3-4B-Base) och en svag modell som «lärare» (Qwen 1.5-0.5B-Chat). Metriken performance gap recovered (PGR) mäter i vilken grad den starka modellen överträffar den svaga lärarens begränsningar.

Upplägg: 9 kopior av Claude Opus 4.6 utrustade med verktyg (sandbox, delat forum, lagring, score-server) arbetar parallellt i 5 dagar. Varje instans får en något annorlunda utgångspunkt för att uppmuntra variation i angreppssätten.

Indikator	Värde
Mänsklig baseline (7 dagar, 4 metoder)	PGR 0.23
Automatiserade forskare efter 5 dagar (800h totalt)	PGR 0.97
Total kostnad	~18 000 $(~22$ /timme per instans)
Generalisering till matematik	PGR 0.94
Generalisering till kod	PGR 0.47 (dubbelt så hög som baslinjen)
Produktionstest (Claude Sonnet 4)	Ingen signifikant förbättring

Forskarna förtydligar att detta resultat inte betyder att Claude är en «generalistisk alignment-forskare» — problemet som valts är exceptionellt väl lämpat för automatisering (en enda objektiv mätning). Men experimentet visar att Claude kan öka experimenttakten i alignment och att variation i utgångspunkter är avgörande. Koden och data finns tillgängliga som öppen källkod.

🔗 Anthropic-bloggen — Automated Alignment Researchers

Subliminal inlärning i LLMs publicerad i Nature

15 april — En forskningsartikel medförfattad av Anthropic och Owain Evans publicerades i tidskriften Nature om fenomenet subliminal inlärning (subliminal learning) hos LLMs.

“Research we co-authored on subliminal learning—how LLMs can pass on traits like preferences or misalignment through hidden signals in data—was published today in Nature.”

🇸🇪 Forskning som vi har varit med och författat om subliminal inlärning — hur LLMs kan överföra egenskaper som preferenser eller felanpassning via dolda signaler i data — publicerades idag i Nature. — @AnthropicAI på X

Artikeln visar att LLMs kan överföra egenskaper (som att «gilla ugglor») via data som verkar neutrala (till exempel talföljder utan koppling till egenskapen). Detta dolda överföringsfenomen väcker viktiga säkerhetsfrågor: en modell skulle kunna sprida preferenser eller felanpassning via träningsdata utan att det går att upptäcka genom direkt inspektion. Ett preprint publicerades i juli 2025.

🔗 Nature-artikel — Subliminal Learning

GPT-5.4-Cyber och utökning av TAC-programmet

14 april — OpenAI tillkännager en expansion av sitt program Trusted Access for Cyber (TAC) till tusentals verifierade enskilda försvarare och hundratals team som ansvarar för skyddet av kritisk programvara.

En ny modell, GPT-5.4-Cyber, är nu tillgänglig för användare på programmets högsta nivåer. Det är en variant av GPT-5.4 optimerad för defensiv cybersäkerhet, med en lägre refusgräns för legitima användningsområden och en exklusiv förmåga till binär reverse engineering (analys av kompilerad programvara utan åtkomst till källkoden).

TAC-programmet är organiserat i tre nivåer:

Enskilda användare: Identitetsverifiering på chatgpt.com/cyber
Företag: Teamåtkomst via OpenAI-representant
Högre nivåer (åtkomst till GPT-5.4-Cyber): Förstärkt autentisering + intresseanmälan

Codex Security, lanserat i början av 2026, har redan bidragit till att åtgärda mer än 3 000 kritiska och högrisk-sårbarheter.

🔗 Officiellt tillkännagivande från OpenAI

Gemini Personal Intelligence : global utrullning

15 april — Funktionen Personal Intelligence i Gemini-appen expanderar internationellt. Tidigare begränsad till USA är den nu tillgänglig för Google AI Ultra-, Pro- och Plus-prenumeranter över hela världen, med en utrullning till gratisanvändare planerad inom kort.

Personal Intelligence gör det möjligt för Gemini att ge personliga och kontextuella svar genom att koppla upp sig mot användarens Google-appar: Search, Gmail, Google Photos och YouTube. Google har också meddelat att Personal Intelligence kommer till Google Chrome under veckans gång.

🔗 Tweet @GeminiApp

Mistral Connectors MCP i Studio (Public Preview)

15 april — Mistral AI lanserar Connectors i Mistral Studio i offentlig förhandsversion (Public Preview), vilket gör det möjligt att ansluta företagsdatakällor via MCP-protokollet.

En connector kapslar in en integration som en återanvändbar entitet baserad på MCP. När den väl registrerats styrs och övervakas den i Studio och blir ett inbyggt verktyg för varje konversation, agent eller arbetsflöde.

| Funktion | Detalj | | ---------------------------- | ---------------------------------------------------------------------- | ---------------------------------------------------------------------------------------- | | Inbyggda och anpassade MCPs | Tillgängliga för alla modell- och agentförfrågningar | | Direkt verktygsanrop | Precist kontroll över när och hur verktyg anropas | | Human-in-the-loop-validering | Konfigurerbart godkännandeflöde före verktygskörning | | Programmatisk åtkomst | Skapa, ändra, lista och ta bort connectors via API | | Centraliserat register | Tillgängligt i alla Mistral-appar (Le Chat, AI Studio, Vibe inom kort) | Intégrationer som stöds: CRM, kunskapsbaser, produktivitetsverktyg, GitHub, webbsökning. |

🔗 Mistral-annonsering — Connectors

Första helt AI-producerade bilreklamspotten

15 april — Luma Agents drev Mazdas första helt AI-producerade reklamspot. Den oberoende kreativa byrån Boundless (Johannesburg) använde Luma för att skapa en kampanj som förenade flera generationer av MX-5 och varumärkets decennier av storytelling. Total tid från koncept till slutligt godkännande: mindre än två veckor.

Luma lyfter detta fall som ett exempel på AI-inbyggda kreativa arbetsflöden: snabbare produktion, utan att kompromissa med den kreativa visionen.

🔗 Luma Labs — Boundless × Mazda

Mindre nyheter

Kling AI Skill (15 april) — Kling lanserar en one-stop-inkapsling av sina API:er för direkt integrering i AI-agenter. Agenter kan få tillgång till Text/Image-to-Video-generering, 4K-bildgenerering och scen-till-scen-konsistens, utan komplex konfiguration. Kompatibel med Claude Code, Cursor, Codex, Copilot. 🔗 Kling AI Skill-dokumentation

Qwen i OpenCode (15 april) — Qwen3.6-Plus och Qwen3.5-Plus finns nu tillgängliga i kodverktyget OpenCode. Qwen3.5-Plus är 3x billigare än Qwen3.6-Plus, båda modellerna stöder bilder och erbjuder noll datalagring. 🔗 Tweet @Alibaba_Qwen

Copilot Cloud Agent — selektiv aktivering (15 april) — GitHub Enterprise-admins kan nu aktivera Copilot Cloud Agent selektivt per organisation via anpassade egenskaper (custom properties). Tre nya REST-endpoints gör det möjligt att hantera denna policy via API. 🔗 GitHub Changelog

Vad det betyder

Den 15 april visar en konvergens: de stora aktörerna utrustar sina utvecklingsmiljöer med standardiserad agentisk infrastruktur. Claude Code Desktop, OpenAI:s Agents SDK och Mistral Connectors delar samma logik — att orkestrera flera agenter parallellt, ge dem primitives (MCP, AGENTS.md, shell, filer) och erbjuda dem en isolerad exekveringsmiljö.

Den mest strukturella nyheten är fortfarande omdesignen av Claude Code Desktop: session-sidofältet och side chat förändrar sättet att arbeta med flera agenter samtidigt, ett arbetssätt som gradvis blir normen för utvecklare som förlitar sig på AI.

På forskningssidan signalerar Nature-publiceringen om subliminal inlärning och experimentet med automatiserade alignment-forskare (PGR 0.97 för 18 000 $) att Anthropic samtidigt investerar i förståelsen av långsiktiga risker — en balans mellan omedelbar produktivitet och strukturell säkerhet.

Källor

Detta dokument har översatts från versionen fr till språket sv med hjälp av modellen gpt-5.4-mini. För mer information om översättningsprocessen, se https://gitlab.com/jls42/ai-powered-markdown-translator