Den 3 mars 2026 markerar en intensiv dag: Claude Code aktiverar sitt Voice Mode i gradvis utrullning, OpenAI rullar ut GPT-5.3 Instant till alla ChatGPT-användare med en märkbar minskning av hallucinationer, och Google lanserar Gemini 3.1 Flash-Lite i preview — den mest kostnadseffektiva modellen i Gemini 3-serien. Samtidigt teasar OpenAI redan GPT-5.4, FLUX.2 [pro] fördubblar hastigheten utan kvalitetsförlust, och Anthropic medger en “unprecedented” tillväxt som pressade deras system.
Voice Mode i Claude Code — push-to-talk, utrullning ~5%
3 mars 2026 — Thariq (@trq212, Claude Code-teamet på Anthropic) tillkännager den gradvisa utrullningen av Voice Mode i Claude Code. Funktionen har varit efterlängtad i flera veckor av utvecklarsamhället.
Hur det fungerar:
| Aspekt | Detalj |
|---|---|
| Aktivering | Kommando /voice för att aktivera/deaktivera |
| Push-to-talk | Håll mellanslagstangenten intryckt för att tala, släpp för att skicka |
| Transkribering | Visas i realtid i terminalen |
| Välkomstnotis | Synlig på startsidan vid aktivering |
| Tokens | Tokens för rösttranskribering räknas inte i rate limits |
Boris Cherny (@bcherny, lead Claude Code) bekräftar att han använder detta läge dagligen: han uppger att han skrev “största delen av [sin] CLI-kod den här veckan” med Voice Mode. Hans återkoppling tyder på att funktionen är redo för verkliga arbetsessioner, inte bara tester.
Tillgänglighet: Aktiv för ungefär 5% av användarna den 3 mars. Den gradvisa utrullningen fortsätter under de följande veckorna. Att transkriberingen är gratis (tokens utanför kvoten) är ett tydligt val som tar bort en vanlig friktion för den här typen av funktion.
Communityen efterfrågar redan en tvåvägsvariant — svar upplästa högt — samt allmän tillgänglighet för /remote-control. Dessa två punkter ligger kvar på roadmapen.
🔗 Tweet @trq212 — Voice Mode rullas ut 🔗 Tweet @bcherny — Återkoppling
GPT-5.3 Instant tillgänglig för alla — -26,8% hallucinationer
3 mars 2026 — OpenAI rullar ut GPT-5.3 Instant till alla ChatGPT-användare. Denna modell ersätter GPT-5.2 Instant som standardmodell i ChatGPT, med fokus på vardagskvalitet snarare än akademiska benchmarks.
Det mest konkreta med denna uppdatering är minskningen av hallucinationer.
| Scenario | Minskning hallucinationer |
|---|---|
| Med webbtillgång (områden med hög risk: medicin, juridik) | -26,8% |
| Utan webbtillgång | -19,7% |
| Användarrapporter (felanmälningar) | -22,5% (web), -9,6% (utan) |
Andra dokumenterade förbättringar i OpenAI-bloggen:
- Mindre onödiga nekanden: färre defensiva/moraliska förord om GPT-5.2 — modellen svarar direkt utan överflödiga varningar
- Webb-sökning: bättre balans mellan webbresultat och intern kunskap; färre listor med länkar, mer relevant syntes
- Flytande ton: färre antaganden om användarens känslotillstånd
- Kreativt skrivande: mer suggestiv och immersiv prosa
“GPT-5.3 Instant in ChatGPT is now rolling out to everyone. More accurate, less cringe.”
🇸🇪 “GPT-5.3 Instant i ChatGPT är nu utrullad för alla. Mer exakt, mindre pinsamt.” — @OpenAI på X
API-tillgänglighet: identifierare gpt-5.3-chat-latest. GPT-5.2 Instant förblir tillgänglig under “Tidigare modeller” i 3 månader, därefter tas den bort den 3 juni 2026. Uppdateringar för Thinking och Pro är “kommer snart”.
Känd begränsning: tonen på japanska och koreanska kan ibland vara styv — under åtgärd.
🔗 Annonsering GPT-5.3 Instant 🔗 Systemkort GPT-5.3 Instant
Gemini 3.1 Flash-Lite — preview, 2,5× snabbare, $0,25/1M tokens
3 mars 2026 — Google lanserar Gemini 3.1 Flash-Lite i preview via API Gemini i Google AI Studio och Vertex AI. Det är den mest kostnadseffektiva modellen i Gemini 3-serien, designad för utvecklartunga arbetsbelastningar i stor skala.
Prissättning och prestanda
| Aspekt | Värde |
|---|---|
| Pris input | $0,25 / 1M tokens |
| Pris output | $1,50 / 1M tokens |
| Hastighet (TTFAT) | 2,5× snabbare vs Gemini 2.5 Flash |
| Utmatningshastighet | +45% vs Gemini 2.5 Flash (Artificial Analysis) |
| Elo-poäng (Arena.ai) | 1432 |
| GPQA Diamond | 86,9% |
| MMMU Pro | 76,8% |
Dessa benchmarks placerar Flash-Lite över flera tidigare, större Gemini-modeller — vilket validerar effektivitetsansatsen i 3.1-serien.
Adaptiva thinking levels
En anmärkningsvärd funktion: de thinking levels (adaptiva reflektionsnivåer) är inbyggda i AI Studio och Vertex AI. Utvecklare kan dynamiskt justera djupet i resonemanget beroende på uppgiftens komplexitet — användbart för att blanda enkla lågkostnadsuppgifter med komplexa analyser i samma pipeline, utan att byta modell.
Dokumenterade användningsfall
Storskalig flerspråkig översättning, innehållsmoderation, generering av e-handelsgränssnitt, dynamiska dashboards, flerstegs SaaS-agenter. Företag som Latitude, Cartwheel och Whering är redan i early access.
🔗 Annonsering Gemini 3.1 Flash-Lite 🔗 Tweet @GoogleAI
Teaser GPT-5.4 — “5.4 sooner than you Think.”
3 mars 2026 — En timme efter GPT-5.3 Instant-annonseringen publicerade OpenAI en kort tweet: “5.4 sooner than you Think.” 800k visningar, 13k likes.
Den ovanliga versaliseringen av “Think” uppmärksammades av communityn — möjligt referens till ett förbättrat tänkandemode i GPT-5.4. Inga ytterligare detaljer finns i nuläget.
Claude — skalbarhet, trafik utan motstycke, #1 i App Store
3 mars 2026 — Sent på dagen publicerade Thariq (@trq212) ett meddelande där han erkänner svårigheter med skalning:
“We’ve seen unprecedented growth in Claude and Claude Code traffic this week that was genuinely hard to forecast. We appreciate you bearing with us as we scale.”
🇸🇪 “Vi har sett en tillväxt i trafiken för Claude och Claude Code utan motstycke den här veckan, vilket verkligen var svårt att förutse. Vi tackar för ert tålamod medan vi anpassar vår infrastruktur.” — @trq212 på X
Bakgrund: Claude klättrade till #1 i App Store den 1 mars (bekräftat av Mike Krieger, CPO @mikeyk), och lanseringen av Voice Mode genererade en extra trafikspik. npm-paketet @anthropic-ai/claude-code rapporterar 9,5 miljoner nedladdningar per vecka.
🔗 Tweet @trq212 — Skalbarhet 🔗 Tweet @mikeyk — Claude #1 App Store
BFL FLUX.2 [pro] — 2× snabbare, samma pris, samma kvalitet
3 mars 2026 — Black Forest Labs meddelar en större uppdatering av FLUX.2 [pro]: modellen är nu 2× snabbare utan kvalitetsförlust och utan prisökning.
FLUX.2 [pro] täcker tre lägen: text-to-image, bildredigering och multi-reference. BFL beskriver positioneringen som “sweet spot of high quality + reasonable speed + broad capabilities” — särskilt för fotorealism (produktfoton, graphic design) och konsekvent rendering av karaktärer.
🔗 Tweet @bfl_ml — FLUX.2 [pro] update 🔗 Dokumentation FLUX.2
ElevenLabs på MWC — nätverksbaserad röstassistent och partnerskap med Deloitte
2 mars 2026 — ElevenLabs tillkännager två partnerskap från Mobile World Congress i Barcelona.
ElevenLabs × Deutsche Telekom — Magenta AI Call Assistant
Deutsche Telekom presenterar Magenta AI Call Assistant — beskriven som den första röstbaserade AI-assistenten integrerad direkt i telekommunikationsnätet. Drivs av ElevenAgents-plattformen från ElevenLabs och fungerar utan någon app att installera, på alla enheter som kan ringa (smartphones och fasta telefoner).
Funktioner: översättning på 50 språk, smart samtalssammanfattning, autonom handling i arbetsflöden.
ElevenLabs × Deloitte — omnikanalsagenter för företag
ElevenLabs och Deloitte tillkännager sitt första partnerskap. Målet: kombinera ElevenLabs Agents-plattformen med Deloittes rådgivningsexpertis för att hjälpa företag att rulla ut omnikanals röstagenter — kundupplevelse, försäljning, interna operationer — integrerade i befintliga företagsystem. Det är ElevenLabs första partneravtal med en Big Four-konsult.
🔗 Tweet @elevenlabsio — Deutsche Telekom MWC 🔗 Blogg ElevenLabs × Deloitte
Kort nytt
Claude Code v2.1.64 (pre-release “next”)
Version 2.1.64 av Claude Code publiceras under taggen next på npm — inte ännu främjad i latest (som förblir 2.1.63) och saknas i de officiella GitHub Releases. Changelog finns inte än; troligen en pre-release som inkluderar Voice Mode.
🔗 npm @anthropic-ai/claude-code
Qwen 3.5 GPTQ-Int4 — kvantisering, vLLM och SGLang
3 mars — Alibaba/Qwen släpper GPTQ-Int4-vikterna för Qwen 3.5-serien med inbyggt stöd för vLLM och SGLang. Resultat: mindre VRAM-behov, snabbare inferens, enklare lokala distributioner på begränsade GPU-konfigurationer.
🔗 Tweet @Alibaba_Qwen — GPTQ-Int4
Qwen 3.5 Small på LM Studio, Ollama och MLX
2–3 mars — Qwen 3.5 Small (0.8B–9B) finns nu på de tre stora lokala inferensplattformarna: LM Studio (~7 GB VRAM för 9B), Ollama och MLX. Lokala distributioner är därmed möjliga redan dagen efter lansering.
Z.ai Startup Program — API-krediter och early access till GLM-5
2 mars — Z.ai öppnar sitt Startup Program: gratis API-krediter, prioriterade rate limits, tidig API-access och en dedikerad community. Målgrupp: AI-native startups, agentbyggare, SaaS-grundare. Den aktiva modellen på plattformen är GLM-5.
🔗 Tweet @Zai_org — Startup Program
March Pixel Drop — Gemini i appar, Circle to Search multi-objekt, Scam Detection i Frankrike
3 mars — Pixels March Pixel Drop innehåller flera AI-funktioner för Pixel-enheter. Gemini kan nu utföra uppgifter direkt i appar (bokningar, kommandon — i beta). Circle to Search känner igen alla objekt på en skärm i en enda sökning, med en “Try It On”-knapp för virtuell provning av kläder. Magic Cue föreslår restauranger via Gemini direkt i konversationer. Säkerhetsfunktionen Scam Detection lanseras i Frankrike, Italien, Spanien, Mexiko, Tyskland och Japan. Pixel Watch får jordbävningsvarningar och Satellite SOS i Europa och Kanada.
🔗 March Pixel Drop — Google Blog
GPT-5.3 Instant System Card
Systemkortet som följer GPT-5.3 Instant publiceras samtidigt. Säkerhetsansatsen är densamma som för GPT-5.2 Instant — modellen refereras också under gpt-5.3-instant.
Vad det betyder
Voice Mode i Claude Code är dagens mest strukturerande beslut för utvecklare. Att göra transkriberingen gratis (utom kvoten) tar bort den främsta ekonomiska barriären för den här typen av funktion — det är ett medvetet val för att maximera adoption, inte en petitess. Att använda mellanslag som push-to-talk i en terminal är en minimalistisk gränssnittsdesign som passar verktyget.
På modellfronten illustrerar GPT-5.3 Instant och Gemini 3.1 Flash-Lite två olika strategier: OpenAI förbättrar den dagliga användarupplevelsen för allmänheten (färre hallucinationer, färre onödiga nekanden), medan Google optimerar kostnads-/prestandaförhållandet för API-utvecklare med hög volym (2,5× snabbare, aggressiv prissättning). Teasern för GPT-5.4, publicerad en timme efter lanseringen av GPT-5.3, antyder en fortsatt snabb takt i OpenAIs distribution under mars 2026.
Anthropics omnämnande av trafik utan motstycke (unprecedented), i kombination med #1 i App Store, bekräftar att Claude Code och Claude-appen går från nisch till en mycket bredare publik. Skalbarhetsproblemen är tecken på en adoption som överstiger prognoserna, inte en teknisk kollaps.
Källor - Tweet @trq212 — Voice Mode rullas ut
- Tweet @bcherny — Voice Mode erfarenhetsrapport
- Tweet @trq212 — Claudes skalbarhet
- Tweet @mikeyk — Claude #1 i App Store
- npm @anthropic-ai/claude-code — v2.1.64 next
- Tillkännagivande GPT-5.3 Instant — OpenAI
- Systemkort GPT-5.3 Instant
- Tweet @OpenAI — GPT-5.3 Instant
- Teaser GPT-5.4 — @OpenAI
- Tillkännagivande Gemini 3.1 Flash-Lite — Google Blog
- Tweet @GoogleAI — Gemini 3.1 Flash-Lite
- Tweet @bfl_ml — FLUX.2 [pro] 2× snabbare
- Tweet @elevenlabsio — Deutsche Telekom MWC
- Blogg ElevenLabs × Deloitte
- Tweet @Alibaba_Qwen — GPTQ-Int4
- Tweet @Alibaba_Qwen — LM Studio
- Tweet @Alibaba_Qwen — Ollama
- Tweet @Alibaba_Qwen — MLX
- Tweet @Zai_org — Z.ai startupprogram
- Mars Pixel Drop — Google Blog
Detta dokument har översatts från versionen fr till språket sv med hjälp av modellen gpt-5-mini. För mer information om översättningsprocessen, se https://gitlab.com/jls42/ai-powered-markdown-translator