Voice Mode in Claude Code, GPT-5.3 Instant per tutti, Gemini 3.1 Flash-Lite in anteprima

Il 3 marzo 2026 segna una giornata intensa: Claude Code attiva il Voice Mode in rollout progressivo, OpenAI distribuisce GPT-5.3 Instant a tutti gli utenti di ChatGPT con una riduzione significativa delle allucinazioni, e Google presenta Gemini 3.1 Flash-Lite in anteprima — il modello più economico della serie Gemini 3. Parallelamente, OpenAI anticipa già GPT-5.4, FLUX.2 [pro] raddoppia la velocità senza perdita di qualità, e Anthropic riconosce una crescita “unprecedented” che ha messo sotto pressione i suoi sistemi.

Voice Mode in Claude Code — push-to-talk, distribuzione ~5%

3 marzo 2026 — Thariq (@trq212, team Claude Code presso Anthropic) annuncia il rollout progressivo del Voice Mode in Claude Code. La funzionalità è molto attesa da settimane dalla community di sviluppatori.

Come funziona :

Aspetto	Dettaglio
Attivazione	Comando `/voice` per attivare/disattivare
Push-to-talk	Tenere premuta la barra spaziatrice per parlare, rilasciare per inviare
Trascrizione	Si visualizza in tempo reale nel terminale
Messaggio iniziale	Visibile sulla schermata iniziale al momento dell’attivazione
Tokens	I tokens della trascrizione vocale non vengono conteggiati nei rate limits

Boris Cherny (@bcherny, lead Claude Code) conferma di usare quotidianamente questa modalità: indica di aver scritto “la maggior parte del [suo] codice CLI questa settimana” con il Voice Mode. Il suo feedback suggerisce che la funzionalità è pronta per sessioni di lavoro reali, non solo per test.

Disponibilità : Attivo per circa il 5% degli utenti al 3 marzo. Il rollout progressivo continuerà nelle settimane successive. La gratuità della trascrizione (tokens fuori quota) è una scelta notevole che rimuove una frizione abituale per questo tipo di funzionalità.

La community chiede già una versione bidirezionale — risposte lette ad alta voce — e la disponibilità generale di /remote-control. Entrambi i punti restano nella roadmap.

🔗 Tweet @trq212 — Voice Mode in distribuzione 🔗 Tweet @bcherny — Resoconto dell’esperienza

GPT-5.3 Instant disponibile per tutti — -26,8% di allucinazioni

3 marzo 2026 — OpenAI distribuisce GPT-5.3 Instant a tutti gli utenti di ChatGPT. Questo modello sostituisce GPT-5.2 Instant come modello predefinito di ChatGPT, con un focus sulla qualità d’uso quotidiana piuttosto che sui benchmark accademici.

Il dato più concreto di questo aggiornamento: la riduzione delle allucinazioni.

Scenario	Riduzione delle allucinazioni
Con accesso web (domini a rischio: medicina, diritto)	-26,8%
Senza accesso web	-19,7%
Feedback utenti (segnalazioni di errori)	-22,5% (web), -9,6% (senza)

Altre migliorie documentate nel blog di OpenAI :

Meno rifiuti inutili: riduzione dei preamboli difensivi/moralistici di GPT-5.2 — il modello risponde direttamente senza avvertimenti superflui
Ricerca web: migliore bilanciamento tra risultati web e conoscenza interna; meno liste di link, sintesi più pertinente
Tono più fluido: meno supposizioni sullo stato emotivo dell’utente
Scrittura creativa: prosa più evocativa e immersiva

“GPT-5.3 Instant in ChatGPT is now rolling out to everyone. More accurate, less cringe.”

🇮🇹 “GPT-5.3 Instant in ChatGPT è ora distribuito per tutti. Più preciso, meno imbarazzante.” — @OpenAI su X

Disponibilità API : identificatore gpt-5.3-chat-latest. GPT-5.2 Instant resta accessibile in “Modelli precedenti” per 3 mesi, poi verrà ritirato il 3 giugno 2026. Gli aggiornamenti Thinking e Pro sono annunciati “a venire”.

Limite noto : il tono in giapponese e coreano rimane talvolta rigido — è in corso una correzione.

🔗 Annuncio GPT-5.3 Instant 🔗 System Card GPT-5.3 Instant

Gemini 3.1 Flash-Lite — anteprima, 2,5× più veloce, $0,25/1M tokens

3 marzo 2026 — Google presenta Gemini 3.1 Flash-Lite in anteprima tramite l’API Gemini in Google AI Studio e Vertex AI. È il modello più economico della serie Gemini 3, pensato per carichi di lavoro a elevato volume per sviluppatori.

Prezzi e prestazioni

Aspetto	Valore
Prezzo input	$0,25 / 1M tokens
Prezzo output	$1,50 / 1M tokens
Velocità (TTFAT)	2,5× più veloce vs Gemini 2.5 Flash
Velocità output	+45% vs Gemini 2.5 Flash (Artificial Analysis)
Score Elo (Arena.ai)	1432
GPQA Diamond	86,9%
MMMU Pro	76,8%

Questi benchmark posizionano Flash-Lite sopra diversi modelli Gemini di generazione precedente più grandi — convalidando l’approccio di efficienza della serie 3.1.

Thinking levels adattivi

Una caratteristica notevole: i thinking levels (livelli di riflessione adattivi) sono integrati nativamente in AI Studio e Vertex AI. Gli sviluppatori possono regolare dinamicamente la profondità del ragionamento in base alla complessità del compito — utile per combinare attività semplici a basso costo e analisi complesse nello stesso pipeline, senza cambiare modello.

Casi d’uso documentati

Traduzione multilingue su larga scala, moderazione dei contenuti, generazione di interfacce e-commerce, dashboard dinamici, agenti SaaS multi-step. Aziende come Latitude, Cartwheel e Whering sono già in early access.

🔗 Annuncio Gemini 3.1 Flash-Lite 🔗 Tweet @GoogleAI

Teaser GPT-5.4 — “5.4 sooner than you Think.”

3 marzo 2026 — Un’ora dopo l’annuncio di GPT-5.3 Instant, OpenAI pubblica un tweet asciutto: “5.4 sooner than you Think.” 800k visualizzazioni, 13k like.

La capitalizzazione inusuale di “Think” è notata dalla community — possibile riferimento a una modalità di ragionamento migliorata in GPT-5.4. Al momento non ci sono altri dettagli.

🔗 Teaser GPT-5.4 — @OpenAI

Scalabilità Claude — traffico senza precedenti, #1 App Store

3 marzo 2026 — A fine giornata, Thariq (@trq212) pubblica un messaggio che riconosce le difficoltà nella gestione del carico:

“We’ve seen unprecedented growth in Claude and Claude Code traffic this week that was genuinely hard to forecast. We appreciate you bearing with us as we scale.”

🇮🇹 “Abbiamo osservato una crescita senza precedenti del traffico di Claude e Claude Code questa settimana, che è stata davvero difficile da prevedere. Vi ringraziamo per la pazienza mentre adattiamo la nostra infrastruttura.” — @trq212 su X

Contesto: Claude è arrivato #1 nell’App Store il 1° marzo (confermato da Mike Krieger, CPO @mikeyk), e il lancio del Voice Mode ha generato un picco di traffico aggiuntivo. Il package npm @anthropic-ai/claude-code registra 9,5 milioni di download settimanali.

🔗 Tweet @trq212 — Scalabilità 🔗 Tweet @mikeyk — Claude #1 App Store

BFL FLUX.2 [pro] — 2× più veloce, stesso prezzo, stessa qualità

3 marzo 2026 — Black Forest Labs annuncia un aggiornamento importante di FLUX.2 [pro]: il modello è ora 2× più veloce senza alcuna perdita di qualità e senza aumento di prezzo.

FLUX.2 [pro] copre tre modalità: text-to-image, editing di immagini e multi-reference. Il tweet di BFL descrive il posizionamento: “sweet spot of high quality + reasonable speed + broad capabilities” — in particolare per il fotorealismo (foto prodotto, graphic design) e la coerenza del rendering dei personaggi.

🔗 Tweet @bfl_ml — Aggiornamento FLUX.2 [pro] 🔗 Documentazione FLUX.2

ElevenLabs al MWC — assistente vocale in rete e partnership con Deloitte

2 marzo 2026 — ElevenLabs annuncia due partnership dal Mobile World Congress Barcelona.

ElevenLabs × Deutsche Telekom — Magenta AI Call Assistant

Deutsche Telekom presenta il Magenta AI Call Assistant — descritto come il primo assistente vocale IA integrato direttamente nella rete telecom. Alimentato dalla piattaforma ElevenAgents di ElevenLabs, funziona senza app da installare, su qualsiasi dispositivo che possa effettuare una chiamata (smartphone e telefoni fissi).

Funzionalità annunciate: traduzione in 50 lingue, sommario intelligente delle chiamate, azione autonoma nei workflow.

ElevenLabs × Deloitte — agenti omnicanale enterprise

ElevenLabs e Deloitte annunciano la loro prima partnership. L’obiettivo: combinare la piattaforma ElevenLabs Agents con l’expertise consulenziale di Deloitte per aiutare le aziende a distribuire agenti vocali omnicanale — customer experience, vendite, operazioni interne — integrati nei sistemi enterprise esistenti. È la prima partnership di ElevenLabs con uno studio Big Four.

🔗 Tweet @elevenlabsio — Deutsche Telekom MWC 🔗 Blog ElevenLabs × Deloitte

Brevi

Claude Code v2.1.64 (pre-release “next”)

La versione 2.1.64 di Claude Code è pubblicata con tag next su npm — non ancora promossa in latest (che resta 2.1.63) ed è assente dalle GitHub Releases ufficiali. Il changelog non è ancora disponibile; si tratta probabilmente di una pre-release che include il Voice Mode.

🔗 npm @anthropic-ai/claude-code

Qwen 3.5 GPTQ-Int4 — quantizzazione, vLLM e SGLang

3 marzo — Alibaba/Qwen pubblica i pesi GPTQ-Int4 della serie Qwen 3.5 con supporto nativo vLLM e SGLang. Risultato: meno VRAM richiesta, inferenza più veloce, deployment locali facilitati su configurazioni GPU limitate.

🔗 Tweet @Alibaba_Qwen — GPTQ-Int4

Qwen 3.5 Small su LM Studio, Ollama e MLX

2-3 marzo — I modelli Qwen 3.5 Small (0.8B–9B) sono ora disponibili sulle tre principali piattaforme di inferenza locale: LM Studio (~7 GB VRAM per 9B), Ollama e MLX. Il deployment locale è quindi operativo il giorno successivo al lancio.

🔗 LM Studio · Ollama · MLX

Z.ai Startup Program — crediti API e early access a GLM-5

2 marzo — Z.ai apre il suo Startup Program: crediti API gratuiti, rate limits prioritari, accesso anticipato all’API e community dedicata. Target: startup AI-native, builder di agenti, fondatori SaaS. Il modello attivo sulla piattaforma è GLM-5.

🔗 Tweet @Zai_org — Programma Startup

March Pixel Drop — Gemini nelle app, Circle to Search multi-oggetto, Scam Detection in Francia

3 marzo — Il Pixel Drop di marzo porta diverse funzioni IA ai dispositivi Pixel. Gemini può ora eseguire attività direttamente nelle app (comandi, prenotazioni, caffè — in beta). Circle to Search riconosce ora tutti gli oggetti visibili su uno schermo in una sola ricerca, con un pulsante “Try It On” per provare virtualmente i vestiti. Magic Cue suggerisce ristoranti tramite Gemini direttamente nelle conversazioni. Sul fronte sicurezza, Scam Detection arriva in Francia, Italia, Spagna, Messico, Germania e Giappone. Pixel Watch guadagna notifiche sismiche e Satellite SOS in Europa e Canada.

🔗 Pixel Drop di marzo — Blog Google

System Card GPT-5.3 Instant

La System Card che accompagna GPT-5.3 Instant è pubblicata simultaneamente. L’approccio di sicurezza è identico a quello di GPT-5.2 Instant — il modello è anche referenziato sotto gpt-5.3-instant.

🔗 System Card GPT-5.3 Instant

Cosa significa

Il Voice Mode in Claude Code è la decisione più strutturante della giornata per gli sviluppatori. Rendere la trascrizione gratuita (fuori quota) elimina la barriera economica principale per questo tipo di funzionalità — è una scelta deliberata per massimizzare l’adozione, non un dettaglio. La barra spaziatrice come push-to-talk in un terminale è un’interfaccia minimalista coerente con lo strumento.

Sul fronte dei modelli, GPT-5.3 Instant e Gemini 3.1 Flash-Lite illustrano due strategie diverse: OpenAI migliora l’esperienza quotidiana del grande pubblico (meno allucinazioni, meno rifiuti inutili), Google ottimizza il rapporto costo/prestazioni per gli sviluppatori API ad alto volume (2,5× più veloce, prezzo aggressivo). Il teaser GPT-5.4 pubblicato un’ora dopo il lancio di GPT-5.3 suggerisce un ritmo di rilascio ancora sostenuto in OpenAI per marzo 2026.

La menzione di un traffico senza precedenti (unprecedented) in Anthropic, combinata con il #1 nell’App Store, conferma che Claude Code e l’app Claude stanno uscendo da una fase di nicchia per raggiungere un pubblico molto più ampio. I problemi di scalabilità sono il segno di un’adozione che supera le proiezioni, non di un fallimento tecnico.

Fonti - Tweet @trq212 — Voice Mode in distribuzione

Questo documento è stato tradotto dalla versione fr alla lingua it utilizzando il modello gpt-5-mini. Per maggiori informazioni sul processo di traduzione, consultare https://gitlab.com/jls42/ai-powered-markdown-translator