Sök

DiffusionGemma 4x snabbare, dynamiska Claude Code-arbetsflöden i GA, Grok Voice #1 EVA-Bench

ai-powered-markdown-translator

Översatt artikel från fr till sv med gpt-5.4-mini.

Visa projekt på GitHub ↗

Den 10 juni 2026 markerar en intensiv dag: Google DeepMind lanserar DiffusionGemma, en ny arkitektur för textgenerering med diffusion som når 1 000 tokens per sekund på H100, och som omedelbart optimeras av NVIDIA för lokal hårdvara. På verktygssidan för utvecklare gör Anthropic Claude Codes dynamiska arbetsflöden allmänt tillgängliga med agentrekursion upp till 5 nivåer, och xAI positionerar Grok Voice Think Fast 1.0 som nummer ett i EVA-Bench-benchmarken. GitHub, OpenAI, Perplexity och Cohere avrundar en dag rik på annonseringar.


DiffusionGemma: parallell generering av block om 256 tokens, 4x snabbare på GPU

10 juni — Google DeepMind lanserar DiffusionGemma, en experimentell öppen modell med 26 miljarder parametrar (Mixture of Experts-arkitektur, Mixture of Experts) publicerad under Apache 2.0-licensen. Dess särdrag: i stället för att generera en token i taget som alla klassiska autoregressiva modeller, genererar den hela block om 256 tokens samtidigt genom att tillämpa samma iterativa avbrusningsprincip som bilddiffusionsmodeller använder.

Resultatet: upp till 4x snabbare på dedikerad GPU. Modellen aktiverar bara 3,8 miljarder parametrar under inferens, vilket gör att den ryms i 18 GB VRAM när den är kvantiserad — tillgänglig på avancerade konsument-GPU:er. Den dubbelriktade attentionen öppnar användningsområden som är svåra för autoregressiva modeller: online-redigering, kodkomplettering, aminosyrasekvenser, matematiska grafer.

NVIDIA har omedelbart optimerat DiffusionGemma för sina GPU:er genom att dra nytta av tensor-kärnor (Tensor Cores), där autoregressiva arkitekturer hämmas av minnesbandbredden. Uppmätta prestanda på olika hårdvaror:

HårdvaraPrestanda
NVIDIA H100 (server)1 000 tokens/s
NVIDIA DGX Stationupp till 800 tokens/s
NVIDIA DGX Spark (lokal)150 tokens/s
GeForce RTX 5090 (kvantiserad)700+ tokens/s
GeForce RTX 4090 (kvantiserad)stöd för llama.cpp kommer senare

Vikterna finns tillgängliga på Hugging Face med omedelbart stöd i HF Transformers, vLLM och Unsloth. Modellen går också att testa gratis på build.nvidia.com.

Viktigt: Google förtydligar uttryckligen att utgående kvalitet fortfarande är lägre än för standardmodellerna i Gemma 4. DiffusionGemma riktar sig till utvecklare som utforskar interaktiva lokala arbetsflöden — snabb iteration, redigering i linjen — och inte till produktion.

“DiffusionGemma is our new experimental open model with up to 4x faster output on dedicated GPUs. Instead of predicting word-by-word, it generates entire blocks of text simultaneously.”

🇸🇪 DiffusionGemma är vår nya experimentella öppna modell som ger upp till 4 gånger snabbare utdata på dedikerad GPU. I stället för att förutsäga orden ord för ord genererar den hela textblock samtidigt.@GoogleDeepMind på X

🔗 Google DeepMinds tillkännagivande · 🔗 NVIDIA-optimering


Claude Code v2.1.172: dynamiska arbetsflöden i allmän tillgänglighet, rekursiva underagenter upp till 5 nivåer

10 juni — Anthropic meddelar att Claude Codes dynamiska arbetsflöden (dynamic workflows) går till allmän tillgänglighet. De presenterades som forskningsförhandsvisning den 28 maj och gör det möjligt för Claude att utforma sin egen orkestrering och att starta tiotals till hundratals underagenter parallellt för att hantera komplexa uppgifter från början till slut.

Versionen v2.1.172 av CLI:t, som släpptes samma dag, introducerar den nyckelförmåga som hör till detta: underagenter kan nu skapa sina egna underagenter, upp till 5 nivåer av nästling. Det är den tekniska grund som gör dynamiska arbetsflöden operativa i stor skala.

Huvudsakliga användningsfall:

  • Felsökning i skala över ett helt kodförråd, säkerhetsgranskningar
  • Kodmigreringar som berör tusentals filer (t.ex. Bun-portning Zig→Rust på 11 dagar)
  • Motstridig verifiering av ett resultat före leverans

Tillgänglighet och villkor:

ElementDetalj
PlanerMax, Team, Enterprise (om aktiverat av administratören), Claude API
MolnplattformarAmazon Bedrock, Vertex AI, Microsoft Foundry
AktiveringKommando Create a workflow eller parameter ultracode (ansträngning xhigh)
Djup för underagenterUpp till 5 nivåer
CLI-versionv2.1.172

Att notera: de dynamiska arbetsflödena förbrukar avsevärt fler tokens än en standard-session i Claude Code. Claude Code visar en bekräftelse före den första körningen. Enterprise-administratörer kan inaktivera funktionen via de hanterade inställningarna.

Övriga ändringar i v2.1.172: buggfix för sessioner som fastnade permanent med 1M-kontext utan krediter, sökfält i webbläsaren /plugin, Amazon Bedrock läser nu AWS-regionen från ~/.aws om AWS_REGION inte är definierad, många stabilitetsfixar för bakgrundsagenter.

🔗 Tillkännagivande @claudeai · 🔗 Blogg om Dynamic Workflows · 🔗 CHANGELOG


Grok Voice Think Fast 1.0 — nummer ett på EVA-Bench

10 juni — xAI meddelar Grok Voice Think Fast 1.0, dess röstmodell som placerar sig på Paretofronten i ServiceNow AI Researchs EVA-Bench-rankning. Paretofronten innebär att inget annat system i utvärderingen samtidigt överträffar dess precision och kvaliteten på användarupplevelsen.

xAI lyfter fram tre egenskaper: naturlig timing, kontextanpassad intonation och en upplevd värme som liknar en människas. Modellen är tillgänglig via xAIs röst-API på x.ai/api/voice, till ett pris som anges som betydligt lägre än konkurrenternas.

MetrikVärde
EVA-Bench-rankningParetofronten (nummer 1)
TillgänglighetAPI x.ai/api/voice
PrispositioneringEn bråkdel av konkurrenternas pris (enligt xAI)

“Grok Voice offers state-of-the-art performance with human-like timing, tone, and warmth. And it’s a fraction the price of competitors.”

🇸🇪 Grok Voice levererar topprestanda med timing, ton och värme som liknar en människas. Och priset är en bråkdel av konkurrenternas.@xai på X

🔗 EVA-Bench-resultat


NVIDIA Confidential Computing i Apple Private Cloud Compute (WWDC 2026)

9 juni — Tillkännagiven under WWDC 2026 markerar denna tredelade Apple–NVIDIA–Google-integration ett strukturellt steg för integritet i AI i molnet. GPU:er med NVIDIA Blackwell och Confidential Computing är nu integrerade i Apples infrastruktur Private Cloud Compute (PCC), som sträcker sig bortom Apples datacenter till Google Cloud.

Målet: att behandla Apple Intelligence-förfrågningar på serversidan med en garanti för absolut kryptografisk sekretess — ingen, inte ens systemets tillverkare, kan komma åt användarnas data, konversationer eller chattar.

Skyddsmekanismer:

  • Hårdvarubaserat förtroende (hardware-rooted trust): verifiering av att infrastrukturen inte har manipulerats
  • Krypterade kommunikationsvägar mellan komponenterna
  • Fjärrattestering (remote attestation): programvaran verifierar plattformens säkerhetsläge innan någon känslig data överförs
  • Stöd för accelererad inferens utan kompromiss med GPU-prestanda

Denna arkitektur gör det möjligt för Apple att utöka Apple Intelligence på Google Cloud samtidigt som integritetsåtagandena bibehålls — en ovanlig kombination i branschen. För NVIDIA innebär det ett storskaligt införande av Blackwell Confidential Computing i en konsumentinriktad driftsättning.

🔗 NVIDIA-blogg


Anthropic: schemalagda agenter, hemlighetsvalv och regelverk

Claude Managed Agents — schemalagda driftsättningar och variabelvalv

9 juni — Två nya funktioner kommer i offentlig beta i Claude Managed Agents, tillkännagivna under Code with Claude Tokyo:

Schemalagda driftsättningar (scheduled deployments): agenter kan nu köras automatiskt enligt ett schema, utan manuell inblandning — dagliga rapporter, periodiska kontroller, regelbundna datapipelines.

Variabler i valv (vaults): agenter får åtkomst till sina hemligheter och konfigurationer via ett hanterat valv, utan att exponera nycklar i kod eller sessionskonfigurationer.

FunktionStatus
Schemalagda driftsättningarOffentlig beta
Variabler i valvOffentlig beta
PlattformClaude Managed Agents

🔗 Vad är nytt i Claude Managed Agents

Policy on the AI Exponential — Anthropics regelverksramverk

10 juni — Anthropic publicerar Policy on the AI Exponential, ett ramverk för offentlig policy tillsammans med en essä av Dario Amodei. Slutsatsen: AI-förmågorna utvecklas i en exponentiell takt som den lagstiftande processen inte är utformad för att följa.

Dokumentet riktar sig till modeller som tränats med mer än 10²⁵ flyttalsoperationer (FLOP), utvecklade av företag som genererar mer än USD 500 miljoner i intäkter kopplade till AI eller spenderar mer än USD 1 miljard på AI-FoU. Det identifierar fyra kategorier av katastrofala risker: biologisk risk, cyberrisk, förlust av kontroll över AI-system och automatisering av själva AI-FoU:n.

Föreslagen skyldighetBeskrivning
TransparensObligatoriska tester, publicering av resultaten
Oberoende utvärderingMinst en kvalificerad extern utvärderare
SäkerhetSkydd av vikter mot statliga aktörer
Statlig myndighetBefogenhet att blockera eller skjuta upp farliga modeller

“AI is advancing at a pace our policymaking institutions were never built for—and the gap between the two is becoming the central challenge of the technology.”

🇸🇪 AI utvecklas i en takt som våra lagstiftande institutioner inte är byggda för — och gapet mellan de två håller på att bli den centrala utmaning som denna teknik innebär.@AnthropicAI på X

🔗 Policy on the AI Exponential


GitHub Copilot: öppen app för alla, synliga agentsessioner och säkerhetsgranskning i CLI

Copilot App — öppen technical preview utan väntelista

10 juni — GitHub Copilot-appens technical preview är nu tillgänglig för alla Copilot Pro-, Pro+-, Max-, Business- och Enterprise-prenumeranter, utan väntelista. Denna skrivbordsapp som är utformad för agenter centraliserar hanteringen av agentsessioner, skapandet av pull requests och styrningen av utvecklingsuppgifter från skrivbordet — från ärende till PR på en och samma plats.

🔗 Tillkännagivande @github

Copilot Chat ser nu agentsessioner

10 juni — GitHub förbättrar övergången mellan Copilot Chat och molnagenten. Två nya verktyg finns nu i Copilot Chat: Get agent logs (loggar från en agentsession på en pull request, sökbara direkt i konversationen) och Session search (sökning och sammanfattning av tidigare sessioner efter ämne, titel eller datum). Statusen för en pågående session återspeglas nu i realtid i chatten.

🔗 Changelog

Copilot CLI — kommando /security-review (experimentell public preview)

10 juni — Ett nytt slash-kommando /security-review finns tillgängligt i experimentell public preview i GitHub Copilot CLI. Det analyserar lokala kodändringar direkt från terminalen: injektioner (SQL, kommandon), XSS, osäker datahantering, path traversal, svag kryptografi. Resultaten poängsätts efter allvarlighetsgrad och tillit, med förslag som kan tillämpas utan att lämna terminalen. Kommandot är oberoende av GitHub code scanning och Dependabot — det kompletterar dem med lättviktig analys på begäran.

🔗 Changelog

Manus — Zoom Connector

9 juni — Manus lanserar Zoom-kopplingen, som gör det möjligt för agenten att automatiskt analysera innehållet i möten som är åtkomliga från det anslutna kontot: sammanfattningar, transkriptioner, inspelningar, anteckningar, agendor, whiteboards, deltagarinformation. Tre huvudsakliga användningsfall: analys på begäran av ett möte, återkommande automatisk granskning med rapport i Slack eller e-post, och trendanalys över flera möten. Begränsning: Manus får endast åtkomst till de resurser som det anslutna Zoom-kontot är behörigt att se.

🔗 Manus Blog


xAI och Kimi: partnerskap och swarm-agenter

Grok + eToro — Agenten Tori drivs av X-data i realtid

10 juni — xAI och eToro meddelar att Tori, eToros AI-agent (40 miljoner användare i 75 länder), nu integrerar xAI-modeller och realtidsdata från X-plattformen för att analysera marknadssentiment (market sentiment). Tori kan läsa sentimentutvecklingen i realtid, följa live-signaler och analysera information. Samma realtidsintelligens är tillgänglig för alla utvecklare via xAI:s API-konsol.

🔗 xAI News

Kimi Agent Swarm — Förutsägelse av 104 matcher i VM 2026

9 juni — Kimi (Moonshot AI) sätter in 300 underagenter parallellt för att förutsäga de 104 matcherna i FIFA-VM 2026. Varje agent har sin egen analytiska vinkel: taktik, spelarnas form, historiska data, allmänhetens sentiment, väder, psykologi, oddsrörelser. Systemet använder Elo/FIFA-modeller, Poisson/Dixon-Coles, Monte-Carlo-simuleringar och dynamisk bayesiansk uppdatering. Identifierad signal: Tysklands sannolikhet att vinna titeln uppskattas till ~11,3 % mot ~7,4 % på spelmarknaderna.

🔗 Tillkännagivande @Kimi_Moonshot


OpenAI Codex: migrering från Claude Code och Ableton-showcase

Codex app 26.608 — Migrering från Claude Code och omarbetning av plugins

9 juni — Uppdateringen Codex app 26.608 introducerar ett migreringsflöde (Migrate to Codex) som gör det möjligt att automatiskt importera konfigurationen från Claude Code och Claude Cowork, även vid appens första start. Plugin-gränssnittet har byggts om helt med separata flikar, en marknadsplats med filter per kategori och förbättrad tangentbordsnavigering. Sökningen i inställningarna har utökats till Git och visuella anpassningar.

FunktionDetalj
Migrering Claude Code/CoworkAutomatisk import, även vid onboarding
Plugins screenFlikar, marketplace, kategorifilter
Settings searchUtökad till Git, visuella anpassningar

🔗 Codex Changelog


Perplexity och Cohere: fler-modell-orchestrering och röstbenchmark

Perplexity Computer integrerar Claude Fable 5 som orchestrator

10 juni — Perplexity meddelar integrationen av Claude Fable 5 som orchestrator-modell i Perplexity Computer, dess flerstegsagentiska gränssnitt. Denna integration är reserverad för abonnenterna Pro och Max.

🔗 Tillkännagivande @perplexity_ai

Cohere Transcribe nummer 1 i Hugging Face-benchmarken Far-Field ASR

10 juniCohere Transcribe, Cohere:s öppna modell för taligenkänning, rankas först i Hugging Face:s nya benchmark Far-Field ASR, som är utformad för att testa robusthet i verkliga ljudmiljöer (mötesrum, kontaktcenter, telefonsamtal).

ModellWER Far-Field ASR
Cohere Transcribe17,9
IBM Granite Speech~19,8
NVIDIA Parakeet~21,5

Modellen fortsätter att vara licensierad under Apache 2.0 och kan köras lokalt. Den låg redan etta på den allmänna OpenASR-ledartavlan i mars 2026.

🔗 Meddelande @cohere


Gemini App: nya funktioner för små företag

10 juni — Under Google for Brazil-evenemanget i São Paulo tillkännager Google två Gemini App-funktioner riktade till små företag, med en global utrullning planerad till juni 2026.

Anslutning till Google Business Profile: användare kopplar sin profil direkt i Gemini-appen. När den är ansluten får Gemini tillgång till kundomdömen, frågor och prestandadata för att föreslå personliga rekommendationer: månatlig prestandaanalys, utformning av svar på omdömen i varumärkets ton, uppdatering av öppettider och profil.

Business notebooks: ett centraliserat utrymme där företaget organiserar sina konversationer, källor och Google Business-profil. Gemini använder det som kunskapsbas för att bibehålla kontinuiteten i konversationer och föreslå proaktiva varningar (kundfråga utan svar, helgdagstider inte angivna).

🔗 Google-bloggen


Kortnyheter

  • Gemini-störning den 10 juni — Produktchefen Josh Woodward rapporterar ett tjänsteavbrott kl. 19:31, med delvisa korrigeringar redan utrullade. 🔗 @joshwoodward
  • GitHub Enterprise — 500 kostnadsställen — Gränsen för kostnadsställen per företag höjs från 250 till 500, automatiskt utan någon konfiguration. 🔗 Ändringslogg
  • Dependabot stödjer Deno — Versionsuppdateringar för Deno stöds via en deno-post i .github/dependabot.yml (säkerhetsuppdateringar stöds inte ännu). 🔗 Ändringslogg
  • npm v12 — inkompatibla ändringar i juli 2026 — Installationsskript, Git-beroenden och fjärr-URL:er kommer att blockeras som standard. Uppdatering till npm 11.16.0+ rekommenderas för att ligga steget före. 🔗 Ändringslogg
  • Alibaba Wan — Fisheye Lens — Ett nytt verktyg som omvandlar standardbilder till cirkulära ultravidvinkelvyer i fisheye-stil, tillagt i Wan:s galleri för visuella färdigheter. 🔗 @Alibaba_Wan
  • Z-Image-Engineer-V6 — Utbytbar textkodare för Z-Image-Turbo (Tongyi Lab / Alibaba), som omvandlar enkla prompts till filmiska beskrivningar. Tillgänglig på Hugging Face. 🔗 @Ali_TongyiLab
  • Qwen-Image-Edit-2511 + LoRA — Nytt communityutrymme på Hugging Face för Qwen-Image-Edit-2511 med en mångsidig LoRA-matris (ansiktsbyte, poser, virtuell provning, renderingar från flera vinklar). 🔗 @Ali_TongyiLab
  • ChatGPT for iOS 1.2026.153 — Nya Codex Mobile-funktioner — worktrees, /goal.
  • Codex i Ableton Live — @OpenAIDevs lyfter fram musikern @sound4movement som använder Codex för att automatiskt konfigurera Ableton Live utifrån en spårbeskrivning. 🔗 @OpenAIDevs
  • Cohere Labs — AI och arbetets framtid — Publicering av en rapport om evidensluckor i debatten om AI:s påverkan på sysselsättning, vilket inleder en ny forskningsinriktning. 🔗 @cohere

Vad det betyder

Nya inferensarkitekturer: slutet på token-för-token? DiffusionGemma är den första offentliga demonstrationen i stor skala av en öppen textdiffusionsarkitektur, och NVIDIA:s omedelbara intresse — de optimerade modellen samma dag som den lanserades — bekräftar att denna riktning tas på allvar industriellt. En 4x-vinst på dedikerad GPU är inte trivial: den flyttar flaskhalsen från minnesbandbredden (den autoregressiva modellens svagaste punkt) till tensorberäkningskärnorna. Den nuvarande begränsningen (lägre kvalitet än Gemma 4) och den uttryckliga inriktningen mot utvecklare snarare än produktion visar att detta är en forskningsspår, inte en omedelbar ersättning — men Grok Voice:s Pareto-benchmark på EVA-Bench, i ett annat område (röst), visar att jakten på effektivitet nu pågår på flera arkitektoniska fronter parallellt.

Agentisk autonomi: från löfte till infrastruktur. GA för Claude Code:s dynamiska arbetsflöden med rekursion på 5 nivåer, i kombination med schemalagda deploymenter och hemlighetsvalv i Claude Managed Agents, konkretiserar ett paradigmskifte: agenter är inte längre engångsverktyg utan ihållande, schemaläggningsbara processer med säker åtkomst till hemligheter. Initiativet Kimi Agent Swarm (300 underagenter över 104 matcher) illustrerar samma rörelse på Moonshot AI:s sida. Och Perplexity Computer som integrerar Claude Fable 5 som orkestrator signalerar att konkurrensen kring agenter avgörs lika mycket på verktygsnivå som på själva modellerna.

Integritet och tillit: axeln Apple–NVIDIA–Google. Integreringen av NVIDIA Confidential Computing i Apple PCC på Google Cloud är strukturellt betydelsefull: den visar att en konsumentinriktad utrullning kan kombinera GPU-acceleration, kryptografiska integritetsgarantier och tredjeparts molninfrastruktur. Det här är ingen nisch — Apple Intelligence når hundratals miljoner enheter. Om denna arkitektur normaliseras kan den bli en de facto-standard för AI-tjänster som hanterar känsliga personuppgifter.

Utvecklarekosystemet: konsolidering och konkurrens kring verktygen. Att Codex 26.608 erbjuder ett migreringsflöde från Claude Code är inte obetydligt: det är ett erkännande av att utvecklare har investerat sin konfiguration i konkurrerande verktyg och att övergångskostnaden måste sänkas. GitHub Copilot accelererar å sin sida inom det “agent-native” tillvägagångssättet (app utan väntelista, agent-sessioner synliga i chatten, säkerhetsgranskning i CLI). Dagen den 10 juni ritar upp ett ekosystem där differentieringen avgörs mindre av modellernas råkapacitet än av hur djupt de är integrerade i utvecklares dagliga arbetsflöden.


Källor