Voice Mode in Claude Code, GPT-5.3 Instant voor iedereen, Gemini 3.1 Flash-Lite in preview

3 maart 2026 is een drukke dag: Claude Code activeert zijn Voice Mode in een gefaseerde uitrol, OpenAI rolt GPT-5.3 Instant uit naar alle ChatGPT-gebruikers met een merkbare afname van hallucinations, en Google presenteert Gemini 3.1 Flash-Lite in preview — het meest zuinige model uit de Gemini 3-serie. Tegelijkertijd teaseert OpenAI al GPT-5.4, FLUX.2 [pro] is 2× sneller zonder kwaliteitsverlies, en Anthropic erkent een “unprecedented” groei die druk op hun systemen zette.

Voice Mode in Claude Code — push-to-talk, uitrol ~5%

3 maart 2026 — Thariq (@trq212, Claude Code-team bij Anthropic) kondigt de gefaseerde uitrol van Voice Mode in Claude Code aan. De functie werd de afgelopen weken sterk verwacht door de ontwikkelaarscommunity.

Hoe het werkt:

Aspect	Detail
Activation	Commande `/voice` voor activeren/deactiveren
Push-to-talk	Houd de spatiebalk ingedrukt om te spreken, loslaten om te verzenden
Transcription	Wordt realtime in de terminal weergegeven
Note d’accueil	Zichtbaar op het startscherm bij activatie
Tokens	De tokens van spraaktranscriptie tellen niet mee voor de rate limits

Boris Cherny (@bcherny, lead Claude Code) bevestigt dat hij deze modus dagelijks gebruikt: hij zegt “la majeure partie de [son] code CLI cette semaine” te hebben geschreven met Voice Mode. Zijn feedback suggereert dat de functie klaar is voor echte werksessies, niet alleen tests.

Beschikbaarheid: Actief voor ongeveer 5% van de gebruikers op 3 maart. De gefaseerde uitrol zal de volgende weken doorgaan. Het gratis maken van transcripties (tokens buiten quota) is een opvallende keuze die een gebruikelijke frictie voor dit type functie wegneemt.

De community vraagt al om een bidirectionele versie — antwoorden die luidop worden voorgelezen — en om algemene beschikbaarheid van /remote-control. Beide punten blijven op de roadmap.

🔗 Tweet @trq212 — Voice Mode in uitrol 🔗 Tweet @bcherny — Ervaring

GPT-5.3 Instant beschikbaar voor iedereen — -26,8% hallucinations

3 maart 2026 — OpenAI rolt GPT-5.3 Instant uit voor alle ChatGPT-gebruikers. Dit model vervangt GPT-5.2 Instant als het standaardmodel in ChatGPT, met de focus op dagelijkse kwaliteit boven academische benchmarks.

Het meest concrete resultaat van deze update: de vermindering van hallucinations.

Scenario	Reductie hallucinations
Met webtoegang (domeinen met inzet: geneeskunde, recht)	-26,8%
Zonder webtoegang	-19,7%
Gebruikersfeedback (foutmeldingen)	-22,5% (web), -9,6% (zonder)

Andere verbeteringen gedocumenteerd in de OpenAI-blog:

Minder onnodige weigeringen: vermindering van defensieve/moraliserende preambules van GPT-5.2 — het model antwoordt direct zonder overbodige waarschuwingen
Webonderzoek: betere balans tussen webresultaten en interne kennis; minder lijsten met links, meer relevante synthese
Vloeiender toon: minder veronderstellingen over de emotionele staat van de gebruiker
Creatief schrijven: meer evocerende en meeslepende proza

“GPT-5.3 Instant in ChatGPT is now rolling out to everyone. More accurate, less cringe.”

🇳🇱 “GPT-5.3 Instant in ChatGPT wordt nu uitgerold voor iedereen. Nauwkeuriger, minder ongemakkelijk.” — @OpenAI op X

Beschikbaarheid API: identifiant gpt-5.3-chat-latest. GPT-5.2 Instant blijft beschikbaar onder “Oudere modellen” gedurende 3 maanden, daarna wordt het verwijderd op 3 juni 2026. Updates voor Thinking en Pro zijn “coming soon”.

Bekende beperking: de toon in het Japans en Koreaans blijft soms stijf — wordt hersteld.

🔗 Aankondiging GPT-5.3 Instant 🔗 System Card GPT-5.3 Instant

Gemini 3.1 Flash-Lite — preview, 2,5× sneller, $0,25/1M tokens

3 maart 2026 — Google introduceert Gemini 3.1 Flash-Lite in preview via de Gemini API in Google AI Studio en Vertex AI. Het is het meest kostenefficiënte model uit de Gemini 3-reeks, ontworpen voor hoge-volume ontwikkelaarstaken.

Prijzen en prestaties

Aspect	Waarde
Prijs input	$0,25 / 1M tokens
Prijs output	$1,50 / 1M tokens
Snelheid (TTFAT)	2,5× sneller vs Gemini 2.5 Flash
Output-snelheid	+45% vs Gemini 2.5 Flash (Artificial Analysis)
Elo-score (Arena.ai)	1432
GPQA Diamond	86,9%
MMMU Pro	76,8%

Deze benchmarks plaatsen Flash-Lite boven verschillende grotere vorige generatie Gemini-modellen — wat de efficiëntiebenadering van de 3.1-serie valideert.

Adaptieve thinking levels

Een opvallende eigenschap: de thinking levels (adaptieve denkniveaus) zijn native geïntegreerd in AI Studio en Vertex AI. Ontwikkelaars kunnen dynamisch de diepte van het redeneren aanpassen naargelang de taakcomplexiteit — handig om goedkope, eenvoudige taken en complexe analyses in dezelfde pipeline te combineren zonder van model te wisselen.

Gedocumenteerde use-cases

Grote schaal meertalige vertalingen, contentmoderatie, generatie van e‑commerce interfaces, dynamische dashboards, multi‑step SaaS-agenten. Bedrijven als Latitude, Cartwheel en Whering hebben al early access.

🔗 Aankondiging Gemini 3.1 Flash-Lite 🔗 Tweet @GoogleAI

Teaser GPT-5.4 — “5.4 sooner than you Think.”

3 maart 2026 — Een uur na de aankondiging van GPT-5.3 Instant publiceert OpenAI een sobere tweet: “5.4 sooner than you Think.” 800k weergaven, 13k likes.

De ongebruikelijke hoofdlettering van “Think” wordt in de community opgemerkt — mogelijk een verwijzing naar een verbeterde denkmode in GPT-5.4. Op dit moment zijn er geen verdere details.

🔗 Teaser GPT-5.4 — @OpenAI

Schaalbaarheid Claude — ongekend verkeer, #1 App Store

3 maart 2026 — Aan het eind van de dag publiceert Thariq (@trq212) een bericht waarin hij de moeilijkheden met opschaling erkent:

“We’ve seen unprecedented growth in Claude and Claude Code traffic this week that was genuinely hard to forecast. We appreciate you bearing with us as we scale.”

🇳🇱 “We hebben deze week een ongekende groei van het verkeer naar Claude en Claude Code gezien, die echt moeilijk te voorspellen was. We danken jullie voor jullie geduld terwijl we onze infrastructuur aanpassen.” — @trq212 op X

Context: Claude stond op #1 in de App Store op 1 maart (bevestigd door Mike Krieger, CPO @mikeyk), en de lancering van Voice Mode veroorzaakte een extra piek in het verkeer. Het npm-pakket @anthropic-ai/claude-code noteert 9,5 miljoen wekelijkse downloads.

🔗 Tweet @trq212 — Schaalbaarheid 🔗 Tweet @mikeyk — Claude #1 App Store

BFL FLUX.2 [pro] — 2× sneller, zelfde prijs, zelfde kwaliteit

3 maart 2026 — Black Forest Labs kondigt een grote update van FLUX.2 [pro] aan: het model is nu 2× sneller zonder kwaliteitsverlies en zonder prijsverhoging.

FLUX.2 [pro] dekt drie modi: text-to-image, beeldbewerking en multi-reference. De tweet van BFL beschrijft de positionering als “sweet spot of high quality + reasonable speed + broad capabilities” — vooral gericht op photorealism (productfoto’s, graphic design) en consistente weergave van personages.

🔗 Tweet @bfl_ml — FLUX.2 [pro] update 🔗 Documentatie FLUX.2

ElevenLabs op MWC — netwerkintegrated voice assistant en partnership met Deloitte

2 maart 2026 — ElevenLabs kondigt twee partnerschappen aan vanuit het Mobile World Congress in Barcelona.

ElevenLabs × Deutsche Telekom — Magenta AI Call Assistant

Deutsche Telekom onthult de Magenta AI Call Assistant — gepresenteerd als de eerste geïntegreerde voice AI-assistent die direct in het telecomnetwerk zit. Aangedreven door het ElevenAgents-platform van ElevenLabs werkt het zonder app-installatie, op elk apparaat dat kan bellen (smartphones en vaste telefoons).

Aangegeven features: vertaling in 50 talen, slimme samenvatting van gesprekken, autonome acties binnen workflows.

ElevenLabs × Deloitte — omnichannel enterprise agents

ElevenLabs en Deloitte kondigen hun eerste partnership aan. Het doel is het combineren van het ElevenLabs Agents-platform met de adviesexpertise van Deloitte om ondernemingen te helpen omnichannel voice‑agenten uit te rollen — customer experience, sales, interne operaties — geïntegreerd met bestaande enterprise‑systemen. Dit is het eerste ElevenLabs‑partnership met een Big Four‑kantoor.

🔗 Tweet @elevenlabsio — Deutsche Telekom MWC 🔗 Blog ElevenLabs × Deloitte

Korte berichten

Claude Code v2.1.64 (pre-release “next”)

Versie 2.1.64 van Claude Code is gepubliceerd als tag next op npm — nog niet gepromoveerd naar latest (dat blijft 2.1.63) en afwezig in de officiële GitHub Releases. De changelog is nog niet beschikbaar; waarschijnlijk een pre-release die Voice Mode bevat.

🔗 npm @anthropic-ai/claude-code

Qwen 3.5 GPTQ-Int4 — quantization, vLLM en SGLang

3 maart — Alibaba/Qwen publiceert GPTQ-Int4-gewichten van de Qwen 3.5‑serie met native ondersteuning voor vLLM en SGLang. Resultaat: minder VRAM‑behoefte, snellere inferentie, vereenvoudigde lokale deployments op bescheiden GPU‑setups.

🔗 Tweet @Alibaba_Qwen — GPTQ-Int4

Qwen 3.5 Small op LM Studio, Ollama en MLX

2–3 maart — Qwen 3.5 Small‑modellen (0.8B–9B) zijn nu beschikbaar op de drie belangrijkste lokale inferentieplatformen: LM Studio (~7 GB VRAM voor 9B), Ollama en MLX. Lokale inzet is dus operationeel de dag na release.

🔗 LM Studio · Ollama · MLX

Z.ai Startup Program — API‑kredieten en early access GLM-5

2 maart — Z.ai opent zijn Startup Program: gratis API‑kredieten, prioritaire rate limits, vroegtijdige API‑toegang en een toegewijde community. Doelgroep: AI‑native startups, agent‑bouwers, SaaS‑founders. Het actieve model op het platform is GLM‑5.

🔗 Tweet @Zai_org — Startup Program

March Pixel Drop — Gemini in apps, Circle to Search multi‑object, Scam Detection in Frankrijk

3 maart — De March Pixel Drop brengt meerdere AI‑features naar Pixel‑apparaten. Gemini kan nu taken direct binnen apps uitvoeren (bestellingen, reserveringen, koffie — in bèta). Circle to Search herkent nu alle zichtbare objecten op een scherm in één zoekopdracht, met een “Try It On”‑knop om kleding virtueel te passen. Magic Cue suggereert restaurants via Gemini direct in gesprekken. Op het gebied van veiligheid komt Scam Detection naar Frankrijk, Italië, Spanje, Mexico, Duitsland en Japan. Pixel Watch krijgt seismische waarschuwingen en Satellite SOS in Europa en Canada.

🔗 March Pixel Drop — Google Blog

GPT-5.3 Instant System Card

De System Card bij GPT-5.3 Instant is gelijktijdig gepubliceerd. De veiligheidsaanpak is identiek aan die van GPT-5.2 Instant — het model wordt ook aangeduid als gpt-5.3-instant.

🔗 System Card GPT-5.3 Instant

Wat het betekent

Voice Mode in Claude Code is de meest structurele beslissing van de dag voor ontwikkelaars. Het gratis maken van transcriptie (buiten quota) verwijdert de belangrijkste economische barrière voor dit soort functionaliteit — het is een bewuste keuze om adoptie te maximaliseren, geen detail. De spatiebalk als push‑to‑talk in een terminal is een minimalistische interface die goed past bij het gereedschap.

Aan de modelkant illustreren GPT-5.3 Instant en Gemini 3.1 Flash-Lite twee verschillende strategieën: OpenAI verbetert de dagelijkse ervaring voor het grote publiek (minder hallucinations, minder onnodige weigeringen), Google optimaliseert de cost/performance verhouding voor hoge‑volume API‑ontwikkelaars (2,5× sneller, agressieve prijzen). De GPT-5.4‑teaser een uur na de GPT-5.3‑lancering wijst op een aanhoudend hoog uitroltempo bij OpenAI in maart 2026.

De melding van ongekend verkeer (unprecedented) bij Anthropic, gecombineerd met de #1 App Store‑positie, bevestigt dat Claude Code en de Claude‑app uit een nichefase stappen en een veel breder publiek bereiken. Schaalbaarheidsproblemen zijn een teken van adoptie die de prognoses overschrijdt, geen technische mislukking.

Bronnen - Tweet @trq212 — Voice Mode wordt uitgerold

Dit document is vertaald van de Franse versie naar het Nederlands met behulp van het model gpt-5-mini. Voor meer informatie over het vertaalproces, raadpleeg https://gitlab.com/jls42/ai-powered-markdown-translator