Voice Mode i Claude Code, GPT-5.3 Instant för alla, Gemini 3.1 Flash-Lite i preview

Den 3 mars 2026 markerar en intensiv dag: Claude Code aktiverar sitt Voice Mode i gradvis utrullning, OpenAI rullar ut GPT-5.3 Instant till alla ChatGPT-användare med en märkbar minskning av hallucinationer, och Google lanserar Gemini 3.1 Flash-Lite i preview — den mest kostnadseffektiva modellen i Gemini 3-serien. Samtidigt teasar OpenAI redan GPT-5.4, FLUX.2 [pro] fördubblar hastigheten utan kvalitetsförlust, och Anthropic medger en “unprecedented” tillväxt som pressade deras system.

Voice Mode i Claude Code — push-to-talk, utrullning ~5%

3 mars 2026 — Thariq (@trq212, Claude Code-teamet på Anthropic) tillkännager den gradvisa utrullningen av Voice Mode i Claude Code. Funktionen har varit efterlängtad i flera veckor av utvecklarsamhället.

Hur det fungerar:

Aspekt	Detalj
Aktivering	Kommando `/voice` för att aktivera/deaktivera
Push-to-talk	Håll mellanslagstangenten intryckt för att tala, släpp för att skicka
Transkribering	Visas i realtid i terminalen
Välkomstnotis	Synlig på startsidan vid aktivering
Tokens	Tokens för rösttranskribering räknas inte i rate limits

Boris Cherny (@bcherny, lead Claude Code) bekräftar att han använder detta läge dagligen: han uppger att han skrev “största delen av [sin] CLI-kod den här veckan” med Voice Mode. Hans återkoppling tyder på att funktionen är redo för verkliga arbetsessioner, inte bara tester.

Tillgänglighet: Aktiv för ungefär 5% av användarna den 3 mars. Den gradvisa utrullningen fortsätter under de följande veckorna. Att transkriberingen är gratis (tokens utanför kvoten) är ett tydligt val som tar bort en vanlig friktion för den här typen av funktion.

Communityen efterfrågar redan en tvåvägsvariant — svar upplästa högt — samt allmän tillgänglighet för /remote-control. Dessa två punkter ligger kvar på roadmapen.

🔗 Tweet @trq212 — Voice Mode rullas ut 🔗 Tweet @bcherny — Återkoppling

GPT-5.3 Instant tillgänglig för alla — -26,8% hallucinationer

3 mars 2026 — OpenAI rullar ut GPT-5.3 Instant till alla ChatGPT-användare. Denna modell ersätter GPT-5.2 Instant som standardmodell i ChatGPT, med fokus på vardagskvalitet snarare än akademiska benchmarks.

Det mest konkreta med denna uppdatering är minskningen av hallucinationer.

Scenario	Minskning hallucinationer
Med webbtillgång (områden med hög risk: medicin, juridik)	-26,8%
Utan webbtillgång	-19,7%
Användarrapporter (felanmälningar)	-22,5% (web), -9,6% (utan)

Andra dokumenterade förbättringar i OpenAI-bloggen:

Mindre onödiga nekanden: färre defensiva/moraliska förord om GPT-5.2 — modellen svarar direkt utan överflödiga varningar
Webb-sökning: bättre balans mellan webbresultat och intern kunskap; färre listor med länkar, mer relevant syntes
Flytande ton: färre antaganden om användarens känslotillstånd
Kreativt skrivande: mer suggestiv och immersiv prosa

“GPT-5.3 Instant in ChatGPT is now rolling out to everyone. More accurate, less cringe.”

🇸🇪 “GPT-5.3 Instant i ChatGPT är nu utrullad för alla. Mer exakt, mindre pinsamt.” — @OpenAI på X

API-tillgänglighet: identifierare gpt-5.3-chat-latest. GPT-5.2 Instant förblir tillgänglig under “Tidigare modeller” i 3 månader, därefter tas den bort den 3 juni 2026. Uppdateringar för Thinking och Pro är “kommer snart”.

Känd begränsning: tonen på japanska och koreanska kan ibland vara styv — under åtgärd.

🔗 Annonsering GPT-5.3 Instant 🔗 Systemkort GPT-5.3 Instant

Gemini 3.1 Flash-Lite — preview, 2,5× snabbare, $0,25/1M tokens

3 mars 2026 — Google lanserar Gemini 3.1 Flash-Lite i preview via API Gemini i Google AI Studio och Vertex AI. Det är den mest kostnadseffektiva modellen i Gemini 3-serien, designad för utvecklartunga arbetsbelastningar i stor skala.

Prissättning och prestanda

Aspekt	Värde
Pris input	$0,25 / 1M tokens
Pris output	$1,50 / 1M tokens
Hastighet (TTFAT)	2,5× snabbare vs Gemini 2.5 Flash
Utmatningshastighet	+45% vs Gemini 2.5 Flash (Artificial Analysis)
Elo-poäng (Arena.ai)	1432
GPQA Diamond	86,9%
MMMU Pro	76,8%

Dessa benchmarks placerar Flash-Lite över flera tidigare, större Gemini-modeller — vilket validerar effektivitetsansatsen i 3.1-serien.

Adaptiva thinking levels

En anmärkningsvärd funktion: de thinking levels (adaptiva reflektionsnivåer) är inbyggda i AI Studio och Vertex AI. Utvecklare kan dynamiskt justera djupet i resonemanget beroende på uppgiftens komplexitet — användbart för att blanda enkla lågkostnadsuppgifter med komplexa analyser i samma pipeline, utan att byta modell.

Dokumenterade användningsfall

Storskalig flerspråkig översättning, innehållsmoderation, generering av e-handelsgränssnitt, dynamiska dashboards, flerstegs SaaS-agenter. Företag som Latitude, Cartwheel och Whering är redan i early access.

🔗 Annonsering Gemini 3.1 Flash-Lite 🔗 Tweet @GoogleAI

Teaser GPT-5.4 — “5.4 sooner than you Think.”

3 mars 2026 — En timme efter GPT-5.3 Instant-annonseringen publicerade OpenAI en kort tweet: “5.4 sooner than you Think.” 800k visningar, 13k likes.

Den ovanliga versaliseringen av “Think” uppmärksammades av communityn — möjligt referens till ett förbättrat tänkandemode i GPT-5.4. Inga ytterligare detaljer finns i nuläget.

🔗 Teaser GPT-5.4 — @OpenAI

Claude — skalbarhet, trafik utan motstycke, #1 i App Store

3 mars 2026 — Sent på dagen publicerade Thariq (@trq212) ett meddelande där han erkänner svårigheter med skalning:

“We’ve seen unprecedented growth in Claude and Claude Code traffic this week that was genuinely hard to forecast. We appreciate you bearing with us as we scale.”

🇸🇪 “Vi har sett en tillväxt i trafiken för Claude och Claude Code utan motstycke den här veckan, vilket verkligen var svårt att förutse. Vi tackar för ert tålamod medan vi anpassar vår infrastruktur.” — @trq212 på X

Bakgrund: Claude klättrade till #1 i App Store den 1 mars (bekräftat av Mike Krieger, CPO @mikeyk), och lanseringen av Voice Mode genererade en extra trafikspik. npm-paketet @anthropic-ai/claude-code rapporterar 9,5 miljoner nedladdningar per vecka.

🔗 Tweet @trq212 — Skalbarhet 🔗 Tweet @mikeyk — Claude #1 App Store

BFL FLUX.2 [pro] — 2× snabbare, samma pris, samma kvalitet

3 mars 2026 — Black Forest Labs meddelar en större uppdatering av FLUX.2 [pro]: modellen är nu 2× snabbare utan kvalitetsförlust och utan prisökning.

FLUX.2 [pro] täcker tre lägen: text-to-image, bildredigering och multi-reference. BFL beskriver positioneringen som “sweet spot of high quality + reasonable speed + broad capabilities” — särskilt för fotorealism (produktfoton, graphic design) och konsekvent rendering av karaktärer.

🔗 Tweet @bfl_ml — FLUX.2 [pro] update 🔗 Dokumentation FLUX.2

ElevenLabs på MWC — nätverksbaserad röstassistent och partnerskap med Deloitte

2 mars 2026 — ElevenLabs tillkännager två partnerskap från Mobile World Congress i Barcelona.

ElevenLabs × Deutsche Telekom — Magenta AI Call Assistant

Deutsche Telekom presenterar Magenta AI Call Assistant — beskriven som den första röstbaserade AI-assistenten integrerad direkt i telekommunikationsnätet. Drivs av ElevenAgents-plattformen från ElevenLabs och fungerar utan någon app att installera, på alla enheter som kan ringa (smartphones och fasta telefoner).

Funktioner: översättning på 50 språk, smart samtalssammanfattning, autonom handling i arbetsflöden.

ElevenLabs × Deloitte — omnikanalsagenter för företag

ElevenLabs och Deloitte tillkännager sitt första partnerskap. Målet: kombinera ElevenLabs Agents-plattformen med Deloittes rådgivningsexpertis för att hjälpa företag att rulla ut omnikanals röstagenter — kundupplevelse, försäljning, interna operationer — integrerade i befintliga företagsystem. Det är ElevenLabs första partneravtal med en Big Four-konsult.

🔗 Tweet @elevenlabsio — Deutsche Telekom MWC 🔗 Blogg ElevenLabs × Deloitte

Kort nytt

Claude Code v2.1.64 (pre-release “next”)

Version 2.1.64 av Claude Code publiceras under taggen next på npm — inte ännu främjad i latest (som förblir 2.1.63) och saknas i de officiella GitHub Releases. Changelog finns inte än; troligen en pre-release som inkluderar Voice Mode.

🔗 npm @anthropic-ai/claude-code

Qwen 3.5 GPTQ-Int4 — kvantisering, vLLM och SGLang

3 mars — Alibaba/Qwen släpper GPTQ-Int4-vikterna för Qwen 3.5-serien med inbyggt stöd för vLLM och SGLang. Resultat: mindre VRAM-behov, snabbare inferens, enklare lokala distributioner på begränsade GPU-konfigurationer.

🔗 Tweet @Alibaba_Qwen — GPTQ-Int4

Qwen 3.5 Small på LM Studio, Ollama och MLX

2–3 mars — Qwen 3.5 Small (0.8B–9B) finns nu på de tre stora lokala inferensplattformarna: LM Studio (~7 GB VRAM för 9B), Ollama och MLX. Lokala distributioner är därmed möjliga redan dagen efter lansering.

🔗 LM Studio · Ollama · MLX

Z.ai Startup Program — API-krediter och early access till GLM-5

2 mars — Z.ai öppnar sitt Startup Program: gratis API-krediter, prioriterade rate limits, tidig API-access och en dedikerad community. Målgrupp: AI-native startups, agentbyggare, SaaS-grundare. Den aktiva modellen på plattformen är GLM-5.

🔗 Tweet @Zai_org — Startup Program

March Pixel Drop — Gemini i appar, Circle to Search multi-objekt, Scam Detection i Frankrike

3 mars — Pixels March Pixel Drop innehåller flera AI-funktioner för Pixel-enheter. Gemini kan nu utföra uppgifter direkt i appar (bokningar, kommandon — i beta). Circle to Search känner igen alla objekt på en skärm i en enda sökning, med en “Try It On”-knapp för virtuell provning av kläder. Magic Cue föreslår restauranger via Gemini direkt i konversationer. Säkerhetsfunktionen Scam Detection lanseras i Frankrike, Italien, Spanien, Mexiko, Tyskland och Japan. Pixel Watch får jordbävningsvarningar och Satellite SOS i Europa och Kanada.

🔗 March Pixel Drop — Google Blog

GPT-5.3 Instant System Card

Systemkortet som följer GPT-5.3 Instant publiceras samtidigt. Säkerhetsansatsen är densamma som för GPT-5.2 Instant — modellen refereras också under gpt-5.3-instant.

🔗 Systemkort GPT-5.3 Instant

Vad det betyder

Voice Mode i Claude Code är dagens mest strukturerande beslut för utvecklare. Att göra transkriberingen gratis (utom kvoten) tar bort den främsta ekonomiska barriären för den här typen av funktion — det är ett medvetet val för att maximera adoption, inte en petitess. Att använda mellanslag som push-to-talk i en terminal är en minimalistisk gränssnittsdesign som passar verktyget.

På modellfronten illustrerar GPT-5.3 Instant och Gemini 3.1 Flash-Lite två olika strategier: OpenAI förbättrar den dagliga användarupplevelsen för allmänheten (färre hallucinationer, färre onödiga nekanden), medan Google optimerar kostnads-/prestandaförhållandet för API-utvecklare med hög volym (2,5× snabbare, aggressiv prissättning). Teasern för GPT-5.4, publicerad en timme efter lanseringen av GPT-5.3, antyder en fortsatt snabb takt i OpenAIs distribution under mars 2026.

Anthropics omnämnande av trafik utan motstycke (unprecedented), i kombination med #1 i App Store, bekräftar att Claude Code och Claude-appen går från nisch till en mycket bredare publik. Skalbarhetsproblemen är tecken på en adoption som överstiger prognoserna, inte en teknisk kollaps.

Källor - Tweet @trq212 — Voice Mode rullas ut

Detta dokument har översatts från versionen fr till språket sv med hjälp av modellen gpt-5-mini. För mer information om översättningsprocessen, se https://gitlab.com/jls42/ai-powered-markdown-translator