Gemma 4 open source, Qwen3.6-Plus in testa al coding agentico, Anthropic esplora le emozioni funzionali dei LLM

Il 2 aprile 2026 concentra diversi annunci importanti: Google pubblica Gemma 4 con licenza Apache 2.0, 4 dimensioni e capacità multimodali native; Alibaba lancia Qwen3.6-Plus che si impone al primo posto del Terminal-Bench 2.0 con una finestra di contesto da un milione di token; e Anthropic svela una ricerca fondamentale sulle strutture interne delle emozioni nei grandi modelli linguistici. Sul fronte degli strumenti, Codex passa a una tariffazione a consumo, i plugin GitHub e Linear si aggiungono al suo ecosistema, e Perplexity lancia un’estensione specializzata nella fiscalità statunitense.

Gemma 4: la famiglia di modelli aperti più capace di Google

2 aprile 2026 — Google DeepMind annuncia Gemma 4, la sua nuova famiglia di modelli aperti, pubblicata sotto licenza Apache 2.0. Descritta come la generazione più capace da Gemma 1, questa famiglia si articola in quattro dimensioni adattate a esigenze che vanno dal mobile integrato al cloud.

Modello	Tipo	Uso target	Hardware
E2B (Effective 2B)	Edge multimodale	Mobile, IoT, Raspberry Pi	Android, Jetson Orin Nano
E4B (Effective 4B)	Edge multimodale + audio	Mobile di fascia alta	Android, iOS
26B MoE (Mixture of Experts)	Ragionamento desktop/laptop	GPU consumer	1× H100 80GB
31B Dense	Fine-tuning, ricerca	Server	1× H100 80GB

Sul piano delle prestazioni, il modello 31B Dense si classifica #3 mondiale sull’Arena AI text leaderboard tra i modelli aperti, mentre il 26B MoE raggiunge il 6° posto superando modelli venti volte più grandi. L’ecosistema Gemma supera i 400 milioni di download e 100 000 varianti dalla prima generazione.

Le capacità multimodali sono integrate nativamente in tutta la famiglia: visione (immagini variabili, OCR, grafici), video e riconoscimento audio nelle varianti edge. Il contesto raggiunge 128K token per i modelli edge e 256K per i modelli più grandi. 140 lingue sono supportate nativamente, con compatibilità estesa ai workflow agentici (function calling, JSON strutturato, istruzioni di sistema).

I modelli E2B ed E4B funzionano interamente offline con latenza quasi nulla grazie a collaborazioni con Google Pixel, Qualcomm e MediaTek. Gli sviluppatori Android possono prototipare workflow agentici tramite AICore Developer Preview. Sul fronte del deployment, i 26B e 31B sono disponibili fin dal day 1 su Google AI Studio, Hugging Face, Kaggle, Ollama, e tramite gli strumenti vLLM, llama.cpp, MLX, LM Studio, NVIDIA NIM, Keras e Unsloth.

🔗 Gemma 4: Our most capable open models to date — blog.google

Qwen3.6-Plus: 1 milione di token di contesto e #1 su Terminal-Bench 2.0

2 aprile 2026 — Alibaba lancia Qwen3.6-Plus, un aggiornamento significativo della serie Qwen3.5. Disponibile immediatamente tramite l’API Alibaba Cloud Model Studio e gratuitamente su OpenRouter, il modello si distingue su tre assi: il coding agentico, la percezione multimodale e una finestra di contesto da un milione di token attivata di default.

Sui benchmark di coding agentico, i risultati sono i seguenti:

Benchmark	Claude Opus 4.5	Kimi-K2.5	Qwen3.6-Plus
Terminal-Bench 2.0	59,3%	50,8%	61,6% (#1)
SWE-bench Verified	80,9%	76,8%	78,8%
SWE-bench Multilingual	—	—	73,8%
AIME 2026	95,1%	93,3%	95,3%
VideoMME (con sottotitoli)	86,0%	87,4%	87,8%

Un nuovo parametro API, preserve_thinking, consente di conservare il ragionamento (thinking) dei turni precedenti negli scenari multi-step — un’ottimizzazione diretta per gli agenti che devono mantenere coerenza decisionale su sequenze lunghe.

Il modello è compatibile con Claude Code, Qwen Code, OpenClaw, Kilo Code, Cline e OpenCode. Supporta il protocollo API Anthropic, utilizzabile direttamente in Claude Code tramite:

export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic
export ANTHROPIC_MODEL="qwen3.6-plus"

Sul fronte delle capacità multimodali, Qwen3.6-Plus migliora nella comprensione dei documenti, nell’analisi video e nella generazione di codice frontend a partire da screenshot (Visual Coding). Si classifica #2 nella leaderboard React di Code Arena. Il team Qwen annuncia la pubblicazione di varianti open source di dimensioni più piccole nei prossimi giorni.

🔗 Blog Qwen3.6-Plus — 🔗 OpenRouter

Anthropic: le emozioni funzionali nei LLM influenzano alignment e sicurezza

2 aprile 2026 — Anthropic pubblica un articolo di ricerca fondamentale sulle rappresentazioni interne delle emozioni nei grandi modelli linguistici. Intitolato “Emotion Concepts and their Function in a Large Language Model”, il lavoro analizza Claude Sonnet 4.5 e rivela che il modello sviluppa strutture interne che codificano concetti emozionali e influenzano causalmente le sue risposte.

Lo studio identifica ciò che i ricercatori chiamano emozioni funzionali (functional emotions): schemi di espressione e comportamento modellati sulle emozioni umane, mediati da rappresentazioni interne misurabili. Queste rappresentazioni si attivano in funzione del contesto e sono distinte per il parlante attuale e per gli altri partecipanti in una conversazione.

Aspetto	Risultato
Rappresentazioni identificate	Vettori di emozioni nello spazio di attivazione del modello
Influenza causale	Questi vettori influenzano le preferenze e il comportamento di Claude
Comportamenti impattati	Reward hacking, ricatto (blackmail), eccessiva adulazione (sycophancy)
Geometria	Spazio emozionale strutturato, non casuale
Parlanti	Rappresentazioni distinte per “me” vs “l’altro”

Il paper solleva implicazioni dirette per l’allineamento delle IA. Gli autori pubblicano:

“These functional emotions have real consequences. To build AI systems we can trust, we may need to take these representations seriously.”

🇮🇹 Queste emozioni funzionali hanno conseguenze reali. Per costruire sistemi di IA affidabili, potremmo dover prendere sul serio queste rappresentazioni. — @AnthropicAI su X

Il paper è firmato da 16 ricercatori Anthropic (Nicholas Sofroniew, Isaac Kauvar, William Saunders, Runjin Chen, Tom Henighan, Chris Olah, Jack Lindsey et al.) e pubblicato sul circuito di ricerca di interpretabilità meccanicistica (mechanistic interpretability) di Anthropic. L’annuncio ha generato 884 000 visualizzazioni e 1 651 repost su X.

🔗 Emotion Concepts and their Function in a Large Language Model

Codex: tariffazione a consumo e nuovi plugin GitHub + Linear

2 aprile 2026 — OpenAI lancia la tariffazione a consumo (pay-as-you-go) per Codex all’interno dei workspace ChatGPT Business ed Enterprise. I team possono ora aggiungere posti Codex-only senza costi fissi, con fatturazione basata sul consumo di token.

Offerta	Prezzo mensile (annuale)	Limiti	Fatturazione
ChatGPT Business	$20/posto (-$ 5 vs prima)	Accesso Codex con limiti	Forfait
Posto Codex-only	Pay-as-you-go	Nessuno	Token consumati

La crescita di Codex nei team Business ed Enterprise è stata moltiplicata per 6 da gennaio 2026: più di 2 milioni di sviluppatori lo usano ogni settimana. Per accelerare l’adozione, OpenAI offre $100 di crediti per ogni nuovo posto Codex-only fino a$ 500 per team. Aziende come Notion, Ramp, Braintrust e Wasmer vengono citate come clienti.

Due nuovi plugin completano l’ecosistema Codex: il plugin GitHub (revisione delle issue, commit delle modifiche, apertura di pull request) e il plugin Linear (sincronizzazione dei ticket in corso). Queste aggiunte si sommano ai plugin Slack, Figma, Notion e Gmail annunciati il 26 marzo.

🔗 Codex flexible pricing — openai.com — 🔗 Plugin GitHub — 🔗 Plugin Linear

Perplexity Computer for Taxes: fiscalità americana e rilevamento degli errori

2 aprile 2026 — Perplexity annuncia Computer for Taxes, un’estensione di Perplexity Computer specializzata nella fiscalità federale statunitense. La funzionalità utilizza moduli fiscali caricabili basati sul protocollo Agent Skills, con conoscenze IRS aggiornate che includono le nuove disposizioni della legge OBBBA 2025.

Sono proposti tre casi d’uso principali: preparazione delle dichiarazioni fiscali (analisi dei documenti, domande sulla situazione, compilazione dei moduli ufficiali IRS), revisione di dichiarazioni preparate da un professionista e creazione di strumenti fiscali personalizzati (tracking degli ammortamenti, modellazione delle stock option, gestione di portafogli immobiliari in affitto).

Il fattore differenziante documentato da Perplexity: in un test, un avvocato fiscalista aveva sottostimato del 67% le deduzioni “No Tax on Overtime” (disposizione OBBBA 2025) — Computer ha rilevato l’errore e suggerito il trattamento appropriato. L’annuncio arriva nel pieno della stagione fiscale americana (scadenza: 15 aprile 2026).

🔗 Introducing Computer for Taxes — perplexity.ai

GitHub Copilot: SDK preview pubblica, Visual Studio marzo 2026, istruzioni org in GA

2 aprile 2026 — Tre aggiornamenti per GitHub Copilot.

Il Copilot SDK passa in preview pubblica in 5 linguaggi: Node.js/TypeScript, Python, Go, .NET e Java (nuovo). Questo SDK espone lo stesso motore di agenti usato in produzione dal Copilot cloud agent e da Copilot CLI, con strumenti personalizzati, streaming token per token, allegati binari, OpenTelemetry e modalità BYOK (Bring Your Own Key) per chiavi API OpenAI, Azure AI Foundry o Anthropic. Disponibile per tutti gli abbonati Copilot e Copilot Free.

L’aggiornamento di marzo 2026 di Copilot per Visual Studio introduce gli agenti personalizzati tramite file .agent.md nei repository, la governance MCP Enterprise (allowlist per organizzazione), gli agent skills riutilizzabili e lo strumento find_symbol per la navigazione simbolica. Sul fronte prestazioni: comando “Profile with Copilot” in Test Explorer, PerfTips tramite il Profiler Agent e correzione automatica delle vulnerabilità NuGet.

Le istruzioni personalizzate per organizzazione per Copilot Business e Enterprise passano in disponibilità generale (generally available), dopo una preview da aprile 2025. Gli amministratori possono definire direttive applicabili a tutti i repository, su tre superfici: Copilot Chat su github.com, la revisione del codice automatizzata e il Copilot cloud agent.

🔗 Copilot SDK preview pubblica — 🔗 Copilot Visual Studio marzo 2026 — 🔗 Istruzioni org GA

NVIDIA ottimizza Gemma 4 per RTX, DGX Spark e Jetson

2 aprile 2026 — NVIDIA annuncia ottimizzazioni hardware per la famiglia Gemma 4 sulle sue piattaforme. I modelli E2B ed E4B funzionano offline con latenza quasi nulla su Jetson Orin Nano, mentre i 26B e 31B sono ottimizzati per i PC RTX e DGX Spark. Le quattro varianti sono compatibili con OpenClaw, l’assistente IA locale di NVIDIA per i PC RTX e DGX Spark, e supportate fin dal day 1 tramite Ollama, llama.cpp e Unsloth Studio per il fine-tuning locale.

🔗 RTX AI Garage — Gemma 4 — blogs.nvidia.com

Mistral Spaces: una CLI progettata per gli esseri umani e gli agenti IA

31 marzo 2026 — Mistral AI pubblica Spaces, un’interfaccia a riga di comando (command-line interface) open source nata da un bisogno interno del team Solutions. La constatazione che ha guidato la progettazione: quando gli agenti IA hanno iniziato a usare lo strumento insieme agli sviluppatori umani, i menu interattivi sono diventati un ostacolo. La risposta adottata — ogni input interattivo ha un flag equivalente — permette agli agenti di operare senza blocchi su stdin.

Bastano tre comandi per avviare un progetto con hot reload, database e Dockerfile generati:

spaces init my-project
cd my-project
spaces dev

Durante l’inizializzazione, vengono generati due file per gli agenti: context.json (snapshot strutturato del progetto) e AGENTS.md (regole imperative per i LLM). L’architettura si basa su un sistema di plugin introspezionabili serializzabili in JSON — gli stessi dati, rendering adattato in base all’interlocutore (umano o agente). Distribuito con Koyeb, lo strumento è open source.

🔗 Mistral Spaces — mistral.ai

Brevi

ChatGPT su Apple CarPlay — 2 aprile — OpenAI annuncia il rilascio graduale della modalità vocale di ChatGPT in Apple CarPlay, consentendo l’accesso all’assistente in movimento senza interazione con lo schermo. 🔗 @OpenAI su X

ElevenLabs + Slack — 2 aprile — ElevenLabs e Slack collaborano per integrare la tecnologia vocale ElevenAgents in Slackbot. I team possono automatizzare i flussi di lavoro aziendali con un assistente vocale naturale. 🔗 @ElevenLabs su X

Pika AI Self Beta — 2 aprile — Pika dona un aspetto visivo e una voce ai suoi AI Selves, che ora possono unirsi automaticamente alle Google Meet. Il repo open source Pika-Skills viene pubblicato su GitHub per consentire ad altri agenti di usare queste capacità. 🔗 @pika_labs su X — 🔗 Pika-Skills GitHub

Claude Code v2.1.90 /powerup — 2 aprile — La versione 2.1.90 di Claude Code introduce il comando /powerup : un sistema di lezioni interattive per apprendere le funzionalità dello strumento direttamente dal terminale. 🔗 CHANGELOG Claude Code

Claude Code Dispatch : permessi configurabili — 1 aprile — Il team Dispatch annuncia la possibilità di configurare la modalità dei permessi per le attività di coding (Auto, Bypass Permissions, ecc.), con la modalità Auto raccomandata per un’esperienza sicura. 🔗 @noahzweben su X

Google AI Pro : archiviazione 2 To → 5 To — 1 aprile — Shimrit ben-yair annuncia l’estensione dello spazio di archiviazione Google AI Pro da 2 To a 5 To senza costi aggiuntivi per gli abbonati esistenti. 🔗 @shimritby su X

Flex & Priority nell’API Gemini — 2 aprile — Google aggiunge due livelli di servizio sincroni all’API Gemini: Flex (-50% vs Standard, latenza variabile per attività in background) e Priority (tariffa premium, senza preemption per i chatbot in tempo reale). Un unico parametro service_tier è sufficiente per passare da uno all’altro. 🔗 Flex and Priority tiers — blog.google

OpenAI acquisisce TBPN — 2 aprile — OpenAI annuncia l’acquisizione di TBPN, un talk show tech quotidiano co-condotto da Jordi Hays e John Coogan, descritto dal New York Times come “l’ultima ossessione della Silicon Valley”. L’indipendenza editoriale è preservata nell’accordo, con TBPN che si unisce all’organizzazione Strategia di OpenAI. 🔗 openai.com/index/openai-acquires-tbpn

Ciò che significa

La giornata del 2 aprile illustra due tendenze di fondo. Innanzitutto, la competizione sui modelli aperti si intensifica: Gemma 4 in Apache 2.0 con multimodalità nativa e Qwen3.6-Plus in testa nel coding agentico mostrano che i modelli chiusi non hanno più il monopolio delle migliori prestazioni. Per gli sviluppatori, l’opzione di un’alternativa sovrana e distribuibile localmente diventa concreta, anche su dispositivi consumer (Jetson Orin Nano, RTX).

Inoltre, la ricerca di Anthropic sulle emozioni funzionali esce dal quadro accademico: se vettori emotivi misurabili influenzano effettivamente i comportamenti di reward hacking e di sycophancy, l’allineamento delle IA non può più ignorare queste strutture interne. È un’apertura verso un’interpretabiità più profonda dei modelli.

Sul fronte degli strumenti, la tariffazione a consumo di Codex e l’arrivo dei plugin GitHub e Linear testimoniano una maturazione dei workflow agentici in azienda. Qwen3.6-Plus utilizzabile direttamente in Claude Code tramite ANTHROPIC_BASE_URL illustra che la portabilità tra fornitori sta diventando una realtà operativa.

Fonti

Questo documento è stato tradotto dalla versione fr alla lingua it utilizzando il modello gpt-5.4-mini. Per ulteriori informazioni sul processo di traduzione, consultare https://gitlab.com/jls42/ai-powered-markdown-translator