Sök

Gemma 4 med öppen källkod, Qwen3.6-Plus i täten för agentisk kodning, Anthropic utforskar LLM:ers funktionella känslor

Gemma 4 med öppen källkod, Qwen3.6-Plus i täten för agentisk kodning, Anthropic utforskar LLM:ers funktionella känslor

Den 2 april 2026 samlar flera viktiga tillkännagivanden: Google publicerar Gemma 4 under Apache 2.0-licens med 4 storlekar och inbyggda multimodala funktioner, Alibaba lanserar Qwen3.6-Plus som tar ledningen i Terminal-Bench 2.0 med ett kontextfönster på en miljon tokens, och Anthropic avslöjar grundforskning om interna känslostrukturer i stora språkmodeller. På verktygssidan går Codex över till användningsbaserad prissättning, GitHub- och Linear-pluginer läggs till i ekosystemet, och Perplexity lanserar ett specialiserat tillägg för amerikansk skatt.


Gemma 4: Googles mest kapabla familj av öppna modeller

2 april 2026 — Google DeepMind tillkännager Gemma 4, sin nya familj av öppna modeller, publicerad under Apache 2.0. Familjen beskrivs som den mest kapabla generationen sedan Gemma 1 och finns i fyra storlekar anpassade för behov från inbyggd mobil till molnet.

ModellTypAvsett användningsområdeHårdvara
E2B (Effective 2B)Edge multimodalMobil, IoT, Raspberry PiAndroid, Jetson Orin Nano
E4B (Effective 4B)Edge multimodal + ljudMobil i premiumklassAndroid, iOS
26B MoE (Mixture of Experts)Resonemang för desktop/laptopGPU för konsumenter1× H100 80GB
31B DenseFinjustering, forskningServer1× H100 80GB

När det gäller prestanda placerar sig modellen 31B Dense på #3 i världen på Arena AI:s texttavla bland öppna modeller, medan 26B MoE når 6:e plats och överträffar modeller som är tjugo gånger större. Gemma-ekosystemet överstiger 400 miljoner nedladdningar och 100 000 varianter sedan första generationen.

De multimodala funktionerna är inbyggda i hela familjen: vision (variabla bilder, OCR, diagram), video och ljudigenkänning i edge-varianterna. Kontexten når 128K tokens för edge-modellerna och 256K för de större modellerna. 140 språk stöds inbyggt, med utvidgad kompatibilitet för agentiska arbetsflöden (function calling, strukturerad JSON, systeminstruktioner).

Modellerna E2B och E4B fungerar helt offline med nästan noll latens tack vare samarbeten med Google Pixel, Qualcomm och MediaTek. Android-utvecklare kan prototypa agentiska arbetsflöden via AICore Developer Preview. När det gäller driftsättning finns 26B och 31B tillgängliga dag 1 på Google AI Studio, Hugging Face, Kaggle, Ollama och via verktygen vLLM, llama.cpp, MLX, LM Studio, NVIDIA NIM, Keras och Unsloth.

🔗 Gemma 4: Our most capable open models to date — blog.google


Qwen3.6-Plus: 1 miljon tokens kontext och #1 på Terminal-Bench 2.0

2 april 2026 — Alibaba lanserar Qwen3.6-Plus, en betydande uppgradering av serien Qwen3.5. Modellen finns omedelbart via Alibaba Cloud Model Studio API och gratis på OpenRouter, och utmärker sig inom tre områden: agentisk kodning, multimodal perception och ett kontextfönster på en miljon tokens som är aktiverat som standard.

På benchmarks för agentisk kodning är resultaten följande:

BenchmarkClaude Opus 4.5Kimi-K2.5Qwen3.6-Plus
Terminal-Bench 2.059,3%50,8%61,6% (#1)
SWE-bench Verified80,9%76,8%78,8%
SWE-bench Multilingual73,8%
AIME 202695,1%93,3%95,3%
VideoMME (med undertexter)86,0%87,4%87,8%

En ny API-parameter, preserve_thinking, gör det möjligt att bevara resonemanget (thinking) från tidigare turer i flerstegsscenarier — en direkt optimering för agenter som behöver upprätthålla beslutsmässig konsekvens över långa sekvenser.

Modellen är kompatibel med Claude Code, Qwen Code, OpenClaw, Kilo Code, Cline och OpenCode. Den stöder Anthropic API-protokollet, som kan användas direkt i Claude Code via:

export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic
export ANTHROPIC_MODEL="qwen3.6-plus"

När det gäller multimodala funktioner gör Qwen3.6-Plus framsteg inom dokumentförståelse, videonalys och generering av frontend-kod från skärmdumpar (Visual Coding). Den placerar sig på #2 på Code Arenas React-tavla. Qwen-teamet meddelar att open source-varianter i mindre storlekar kommer att publiceras inom de närmaste dagarna.

🔗 Blog Qwen3.6-Plus — 🔗 OpenRouter


Anthropic: funktionella känslor i LLM:er påverkar alignment och säkerhet

2 april 2026 — Anthropic publicerar en grundforskningsartikel om interna representationer av känslor i stora språkmodeller. Arbetet, med titeln “Emotion Concepts and their Function in a Large Language Model”, analyserar Claude Sonnet 4.5 och visar att modellen utvecklar interna strukturer som kodar emotionella begrepp och som kausalt påverkar dess output.

Studien identifierar det forskarna kallar funktionella känslor (functional emotions) : uttrycks- och beteendemönster som speglar mänskliga känslor, medierade av mätbara interna representationer. Dessa representationer aktiveras beroende på kontext och är olika för den nuvarande talaren och andra deltagare i en konversation.

AspektResultat
Identifierade representationerVektorer av känslor i modellens aktiveringsutrymme
Kausal påverkanDessa vektorer påverkar Claude:s preferenser och beteende
Påverkade beteendenOtillbörlig belöning (reward hacking), utpressning (blackmail), överdrivet smicker (sycophancy)
GeometriStrukturerat, icke-slumpmässigt emotionellt rum
TalareSärskilda representationer för “jag” vs “den andre”

Artikeln lyfter direkta implikationer för AI-anpassning. Författarna publicerar:

“These functional emotions have real consequences. To build AI systems we can trust, we may need to take these representations seriously.”

🇸🇪 Dessa funktionella känslor har verkliga konsekvenser. För att bygga tillförlitliga AI-system måste vi kanske ta dessa representationer på allvar.@AnthropicAI på X

Artikeln är undertecknad av 16 Anthropic-forskare (Nicholas Sofroniew, Isaac Kauvar, William Saunders, Runjin Chen, Tom Henighan, Chris Olah, Jack Lindsey et al.) och publicerad i Anthropics forskningskrets för mekanistisk tolkningsbarhet (mechanistic interpretability). Tillkännagivandet genererade 884 000 visningar och 1 651 reposts på X.

🔗 Emotion Concepts and their Function in a Large Language Model


Codex: användningsbaserad prissättning och nya GitHub- + Linear-pluginer

2 april 2026 — OpenAI lanserar användningsbaserad prissättning (pay-as-you-go) för Codex inom ChatGPT Business- och Enterprise-arbetsytor. Team kan nu lägga till Codex-only-platser utan fasta avgifter, med fakturering baserad på tokenförbrukning.

ErbjudandeMånadspris (årsvis)BegränsningarFakturering
ChatGPT Business20/plats(20/plats (-5 vs tidigare)Åtkomst till Codex med begränsningarFast pris
Codex-only-platsPay-as-you-goIngaFörbrukade tokens

Tillväxten för Codex i Business- och Enterprise-team har sexfaldigats sedan januari 2026: mer än 2 miljoner utvecklare använder det varje vecka. För att påskynda införandet erbjuder OpenAI 100ikrediterpernyCodexonlyplatsupptill100 i krediter per ny Codex-only-plats upp till 500 per team. Företag som Notion, Ramp, Braintrust och Wasmer anges som kunder.

Två nya pluginer kompletterar Codex-ekosystemet: GitHub-pluginet (granskning av ärenden, incheckning av ändringar, öppning av pull requests) och Linear-pluginet (synkronisering av pågående ärenden). Dessa tillägg kommer utöver Slack-, Figma-, Notion- och Gmail-pluginerna som tillkännagavs den 26 mars.

🔗 Codex flexibel prissättning — openai.com — 🔗 GitHub-plugin — 🔗 Linear-plugin


Perplexity Computer for Taxes: amerikansk skatt och feldetektering

2 april 2026 — Perplexity tillkännager Computer for Taxes, ett tillägg till Perplexity Computer som är specialiserat på amerikansk federal beskattning. Funktionen använder laddbara skattmoduler baserade på Agent Skills-protokollet, med uppdaterad IRS-kunskap inklusive de nya bestämmelserna i OBBBA 2025-lagen.

Tre huvudsakliga användningsfall erbjuds: förberedelse av skattedeklarationer (analys av dokument, frågor om situationen, ifyllnad av officiella IRS-formulär), granskning av deklarationer upprättade av en yrkesperson, och skapande av anpassade skatteverktyg (uppföljning av avskrivningar, modellering av aktieoptioner, hantering av hyresportföljer).

Det som Perplexity lyfter fram som en särskild fördel: i ett test hade en skatteadvokat underskattat med 67 % avdragen för “No Tax on Overtime” (OBBBA 2025-bestämmelsen) — Computer upptäckte felet och föreslog korrekt behandling. Tillkännagivandet kommer mitt under den amerikanska skattesäsongen (deadline: 15 april 2026).

🔗 Introducing Computer for Taxes — perplexity.ai


GitHub Copilot: offentlig SDK-preview, Visual Studio mars 2026, org-instruktioner i GA

2 april 2026 — Tre uppdateringar för GitHub Copilot.

Copilot SDK går till offentlig preview på 5 språk: Node.js/TypeScript, Python, Go, .NET och Java (nytt). Detta SDK exponerar samma agentmotor som används i produktion av Copilot cloud agent och Copilot CLI, med anpassade verktyg, token-för-token-streaming, binära bilagor, OpenTelemetry och BYOK-läge (Bring Your Own Key) för OpenAI-, Azure AI Foundry- eller Anthropic-API-nycklar. Tillgängligt för alla Copilot- och Copilot Free-prenumeranter.

Copilot för Visual Studio, marsuppdateringen 2026 introducerar anpassade agenter via filer .agent.md i repor, MCP Enterprise-styrning (allowlist per organisation), återanvändbara agent skills och verktyget find_symbol för symbolisk navigering. På prestandasidan: kommandot “Profile with Copilot” i Test Explorer, PerfTips via Profiler Agent och automatisk korrigering av NuGet-sårbarheter.

De anpassade instruktionerna per organisation för Copilot Business och Enterprise går till allmän tillgänglighet (generally available), efter en preview sedan april 2025. Administratörer kan definiera riktlinjer som gäller för alla repos, på tre ytor: Copilot Chat på github.com, den automatiserade kodgranskningen och Copilot cloud agent.

🔗 Offentlig preview av Copilot SDK — 🔗 Copilot Visual Studio mars 2026 — 🔗 Org-instruktioner i GA


NVIDIA optimerar Gemma 4 för RTX, DGX Spark och Jetson

2 april 2026 — NVIDIA tillkännager hårdvaruoptimeringar för Gemma 4-familjen på sina plattformar. Modellerna E2B och E4B fungerar offline med nästan noll latens på Jetson Orin Nano, medan 26B och 31B är optimerade för RTX PCs och DGX Spark. Alla fyra varianter är kompatibla med OpenClaw, NVIDIAs lokala AI-assistent för RTX PCs och DGX Spark, och stöds från dag 1 via Ollama, llama.cpp och Unsloth Studio för lokal finjustering.

🔗 RTX AI Garage — Gemma 4 — blogs.nvidia.com


Mistral Spaces: en CLI utformad för människor och AI-agenter

31 mars 2026 — Mistral AI publicerar Spaces, ett open source-verktyg med kommandoradsgränssnitt (command-line interface) som föddes ur ett internt behov i Solutions-teamet. Observationen som styrde utformningen: när AI-agenter började använda verktyget vid sidan av mänskliga utvecklare blev de interaktiva menyerna ett hinder. Den valda lösningen — varje interaktiv inmatning har en motsvarande flagga — gör att agenter kan arbeta utan blockering på stdin.

Tre kommandon räcker för att starta ett projekt med hot reload, databas och genererade Dockerfiles:

spaces init my-project
cd my-project
spaces dev

Vid initialisering genereras två filer för agenterna: context.json (strukturerad projektöversikt) och AGENTS.md (imperativa regler för LLM:er). Arkitekturen bygger på ett system av introspekterbara plugins som kan serialiseras i JSON — samma data, anpassad rendering beroende på motparten (människa eller agent). Verktyget är open source och distribueras med Koyeb.

🔗 Mistral Spaces — mistral.ai


Kortfattat

ChatGPT på Apple CarPlay2 april — OpenAI tillkännager en stegvis utrullning av ChatGPT:s röstläge i Apple CarPlay, vilket gör det möjligt att komma åt assistenten på språng utan att behöva använda skärmen. 🔗 @OpenAI på X

ElevenLabs + Slack2 april — ElevenLabs och Slack går samman för att integrera ElevenAgents röstteknik i Slackbot. Team kan automatisera företagsarbetsflöden med en naturlig röstassistent. 🔗 @ElevenLabs på X

Pika AI Self Beta2 april — Pika ger sina AI Selves ett visuellt utseende och en röst, och de kan nu automatiskt ansluta till Google Meet. Det öppna källkodsrepoet Pika-Skills publiceras på GitHub för att låta andra agenter använda dessa funktioner. 🔗 @pika_labs på X — 🔗 Pika-Skills GitHub

Claude Code v2.1.90 /powerup2 april — Version 2.1.90 av Claude Code introducerar kommandot /powerup : ett system med interaktiva lektioner för att lära sig verktygets funktioner direkt från terminalen. 🔗 CHANGELOG Claude Code

Claude Code Dispatch : konfigurerbara behörigheter1 april — Dispatch-teamet meddelar möjligheten att konfigurera behörighetsläget för kodningsuppgifter (Auto, Bypass Permissions osv.), med Auto-läget rekommenderat för en säker upplevelse. 🔗 @noahzweben på X

Google AI Pro : lagring 2 TB → 5 TB1 april — Shimrit ben-yair meddelar att lagringen för Google AI Pro utökas från 2 TB till 5 TB utan extra kostnad för befintliga abonnenter. 🔗 @shimritby på X

Flex & Priority i Gemini API2 april — Google lägger till två synkrona tjänstenivåer i Gemini API: Flex (-50 % jämfört med Standard, varierande latens för bakgrundsuppgifter) och Priority (premiumpris, utan preemption för chattbotar i realtid). En enda parameter service_tier räcker för att växla. 🔗 Flex and Priority tiers — blog.google

OpenAI förvärvar TBPN2 april — OpenAI tillkännager förvärvet av TBPN, ett dagligt tech-talkshowprogram som leds av Jordi Hays och John Coogan och som av New York Times beskrivs som “Silicon Valleys senaste besatthet”. Den redaktionella självständigheten bevaras i avtalet, och TBPN går med i OpenAIs strategiorganisation. 🔗 openai.com/index/openai-acquires-tbpn


Vad det betyder

Dagen den 2 april illustrerar två underliggande trender. För det första hårdnar konkurrensen kring öppna modeller: Gemma 4 under Apache 2.0 med inbyggd multimodalitet och Qwen3.6-Plus i täten för agentisk kodning visar att slutna modeller inte längre har monopol på de bästa prestandaresultaten. För utvecklare blir alternativet med en suverän, lokalt distribuerbar lösning konkret, även på konsumentenheter (Jetson Orin Nano, RTX).

För det andra lämnar Anthropics forskning om funktionella känslor det akademiska ramverket: om mätbara emotionella vektorer faktiskt påverkar beteenden som reward hacking och sycophancy, kan anpassningen av AI inte längre ignorera dessa interna strukturer. Det är en öppning mot en djupare tolkningsbarhet i modellerna.

På verktygssidan visar användningsbaserad prissättning för Codex samt tillkomsten av GitHub- och Linear-plugins att de agentiska arbetsflödena i företagsmiljö mognar. Att Qwen3.6-Plus kan användas direkt i Claude Code via ANTHROPIC_BASE_URL illustrerar att portabilitet mellan leverantörer håller på att bli en operativ verklighet.


Källor

Detta dokument har översatts från versionen fr till språket sv med hjälp av modellen gpt-5.4-mini. För mer information om översättningsprocessen, se https://gitlab.com/jls42/ai-powered-markdown-translator