Grok Build in beta, Anthropic in Vaticano, ElevenLabs Music v2

Il 25 e 26 maggio 2026 segnano l’ingresso dirompente di xAI nel mercato degli agenti CLI con Grok Build (40,8 milioni di visualizzazioni), mentre Anthropic pubblica un articolo di ingegneria sulla sicurezza degli agenti e il suo cofondatore prende la parola in Vaticano. In parallelo, ElevenLabs rilascia Music v2 con prezzi ridotti della metà, Runway sostiene di aver superato la “valle perturbante” (uncanny valley) per il video IA, e OpenAI come Alibaba pubblicano aggiornamenti rilevanti dei loro strumenti per agenti.

Grok Build — xAI lancia il suo agente di codice nel terminale

25 maggio 2026 — xAI ha lanciato Grok Build in beta, un agente di codifica (coding agent) che funziona direttamente dal terminale. L’annuncio ha generato 40,8 milioni di visualizzazioni su X in poche ore — una delle pubblicazioni più virali di xAI degli ultimi mesi.

Grok Build is now available in Beta for all SuperGrok and X Premium+ users. Use Plan Mode, create images and videos with Imagine, and build automations or orchestrators with the CLI. Visit x.ai/cli to get started.

🇮🇹 Grok Build è ora disponibile in beta per tutti gli utenti SuperGrok e X Premium+. Usate il Plan Mode, create immagini e video con Imagine e costruite automazioni o orchestratori con la CLI. Andate su x.ai/cli per iniziare. — @xai su X

Lo strumento si installa con un solo comando: curl -fsSL https://x.ai/cli/install.sh | bash

L’accesso è immediato per gli abbonati SuperGrok e X Premium+, senza costi aggiuntivi di abbonamento.

Funzionalità principali

Funzionalità	Descrizione
Plan Mode	Pianificazione strutturata prima di qualsiasi modifica — ogni cambiamento bloccato fino all’approvazione esplicita
Skills	Workflow riutilizzabili (AGENTS.md, plugin, hook, MCP), richiamabili automaticamente o per nome — `/skillify` per creare
Subagents	Agenti specializzati eseguiti in parallelo per ricerca, costruzione e revisione
Plugin	Marketplace condiviso: Linear, Sentry, Postgres, browser via MCP
Integrazione Git	stage, commit, push, gestione dei branch dal terminale
Code review	Feedback riga per riga prima dell’apertura della PR
Memory	Persistenza delle decisioni tra sessioni
Headless mode	Utilizzabile in pipeline CI/CD

La somiglianza architetturale con Claude Code è sorprendente: AGENTS.md, hook, MCP, subagents, worktrees. Questa convergenza conferma che la categoria degli agenti CLI si sta imponendo come standard dell’ecosistema per sviluppatori IA.

🔗 Pagina prodotto Grok Build

Chris Olah (Anthropic) in Vaticano sull’enciclica di Papa Leone XIV

25 maggio 2026 — Papa Leone XIV ha pubblicato un’enciclica intitolata “Magnifica humanitas : On safeguarding the human person in the time of artificial Intelligence”. Chris Olah, cofondatore di Anthropic, è stato invitato a parlare durante la cerimonia di presentazione in Vaticano.

Nel suo discorso, Olah affronta tre aspetti: le pressioni commerciali e geopolitiche che gravano sui laboratori di IA, le questioni di giustizia globale (concentrazione dei benefici dell’IA in poche nazioni ricche) e la natura dei modelli stessi. Su quest’ultimo punto, si esprime con prudenza:

“[W]e keep finding things that are mysterious, even unsettling. We find structures that mirror results from human neuroscience. We find evidence of introspection. We find internal states that functionally mirror joy, satisfaction, fear, grief, and unease. I don’t know what that means, but I think it warrants ongoing discernment.”

🇮🇹 Continuiamo a trovare cose misteriose, persino inquietanti. Troviamo strutture che riflettono i risultati della neuroscienza umana. Prove di introspezione. Stati interni che riflettono funzionalmente la gioia, la soddisfazione, la paura, la tristezza e il disagio. Non so cosa significhi, ma penso che meriti un discernimento continuo. — Chris Olah, discorso in Vaticano, 25 maggio 2026

Il tweet @AnthropicAI che annunciava l’articolo ha generato più di 1 milione di visualizzazioni — un coinvolgimento eccezionale per contenuti istituzionali.

🔗 Tweet @AnthropicAI

Anthropic Engineering — Come contenere gli agenti Claude

26 maggio 2026 — Anthropic pubblica un dettagliato articolo di ingegneria sulla sua strategia di contenimento degli agenti Claude, firmato da cinque ingegneri. L’articolo confronta tre architetture distribuite in tre prodotti, con incidenti reali e metriche concrete.

Prodotto	Meccanismo di isolamento	Raggio d’esplosione
claude.ai	Contenitore effimero (gVisor)	Server, isolamento per tenant
Claude Code	Seatbelt (macOS) / bubblewrap (Linux), rete bloccata di default	Workspace locale
Claude Cowork	VM completa (hypervisor Apple/HCS)	Workspace montato dall’utente

Tre incidenti reali documentati: una vulnerabilità di hook pre-trust dialog (Claude Code, metà 2025), un caso di phishing prompt injection con 24 esfiltrazioni riuscite su 25 tentativi, e un’esfiltrazione tramite dominio approvato in Claude Cowork.

Metriche di sicurezza pubblicate: Claude Opus 4.7 ottiene 0,1% di tasso di successo dell’attacco su singolo tentativo (Gray Swan Agent Red Teaming), 5-6% dopo 100 tentativi adattivi. La modalità auto di Claude Code intercetta 83% dei comportamenti troppo permissivi prima dell’esecuzione.

🔗 Articolo Engineering Blog

GitHub Copilot — Regole dei modelli per organizzazione

26 maggio 2026 — GitHub lancia in anteprima pubblica (public preview) le regole di modelli mirate (targeted model rules) per GitHub Copilot. Gli amministratori aziendali possono ora definire quale organizzazione può accedere a quale modello Copilot, invece di un unico parametro a livello aziendale.

Ogni modello può essere configurato come Enabled (attivato per tutte le organizzazioni) oppure Optional (ogni organizzazione decide). L’interfaccia di gestione della disponibilità predefinita è stata completamente ridisegnata. La funzionalità è disponibile per Copilot Business e Copilot Enterprise.

🔗 Changelog GitHub

Manus Projects disponibili su mobile

25 maggio 2026 — Manus annuncia la disponibilità di Projects sulla sua app mobile. La funzionalità copre dalla semplice gestione delle attività fino ai workflow avanzati con file condivisi, istruzioni, skills e connettori.

Il tweet di lancio (48 388 visualizzazioni, 574 like) precisa: “Projects are more than folders. Teach Manus how you want work done.” I Projects permettono di codificare le preferenze di lavoro — istruzioni ricorrenti, file di riferimento, connettori — affinché l’agente le applichi automaticamente sulle nuove attività.

🔗 Annuncio @ManusAI

Runway Project Luxo — superare la valle perturbante

26 maggio 2026 — Runway pubblica Project Luxo, un rapporto di ricerca accompagnato da tre cortometraggi al 100% generati da IA, proiettati a professionisti del cinema. Risultato: tutti i partecipanti hanno giudicato che i film “funzionassero” emotivamente.

Titolo	Durata	Team	Tempo di produzione
The Rogue	9:57	1 persona	3 settimane
Last Night	5:28	1 persona	7 ore
Pigeons in Time	0:46	1 persona	4 ore

Il nome fa riferimento a Luxo Jr. (Pixar, SIGGRAPH 1986), cortometraggio che aveva segnato il passaggio verso l’animazione 3D credibile. Runway dichiara di superare una soglia equivalente per il video IA. Uno spot fittizio pubblicato ad aprile aveva già superato 10 milioni di visualizzazioni in 48h su Instagram.

🔗 Project Luxo — Runway

ElevenLabs Music v2 — qualità migliorata, prezzi dimezzati

26 maggio 2026 — ElevenLabs lancia Music v2, disponibile immediatamente su ElevenMusic e ElevenCreative (ElevenAPI a breve). Il nuovo modello migliora la qualità vocale e orchestrale multi-genere, l’inpainting (rigenerazione di sezioni isolate), la composizione sezione per sezione e il supporto multilingue.

Piattaforma	Uso
ElevenMusic	Studio creator: creare, remixare, sviluppare
ElevenAPI	Accesso al modello per sviluppatori
ElevenCreative	Musica con licenza per brand e contenuti video

I prezzi scendono del -50% per ElevenAPI e del -40% per ElevenCreative (clienti self-service). Ogni brano generato è libero per uso commerciale. Il modello è addestrato solo su dati con licenza, con una partnership Believe.

🔗 Annuncio ElevenLabs

AgentScope 2.0 — Alibaba pubblica un framework di produzione per agenti

26 maggio 2026 — Tongyi Lab (Alibaba) pubblica AgentScope 2.0, un framework open-source per distribuire agenti IA in produzione. L’obiettivo dichiarato: passare da “so cosa fa il mio agente” a “so che il mio agente completerà il compito”.

Funzionalità	Descrizione
Retry / fallback	Passaggio automatico tra modelli se uno fallisce
Sistema di permessi	Controllo fine sulle azioni autorizzate dell’agente
Streaming di esecuzione	Monitoraggio in tempo reale delle azioni dell’agente

Disponibile in Python e TypeScript (Java annunciato a breve), con documentazione dedicata su docs.agentscope.io/v2.

🔗 Annuncio @agentscope_ai

Codex CLI 0.134.0 — OpenAI migliora MCP e cronologia

26 maggio 2026 — OpenAI pubblica Codex CLI versione 0.134.0 con sei nuove funzionalità. La ricerca nella cronologia locale delle conversazioni (insensibile alle maiuscole, con anteprima dei risultati) facilita la navigazione nelle sessioni passate. La gestione dei profili è unificata sotto un unico flag --profile per CLI, TUI e sandbox.

Sul fronte MCP, i server possono ora indirizzare ambienti specifici e usare opzioni OAuth per i server HTTP in streaming (streamable). Gli strumenti MCP annotati readOnlyHint vengono ora eseguiti in parallelo. Gli hook ricevono un contesto arricchito che include la cronologia della conversazione e l’identità del subagent.

Correzioni rilevanti: risolta la corruzione del rendering TUI su Windows, i messaggi di errore per il limite di utilizzo sono ora specifici per il workspace.

🔗 Changelog Codex CLI 0.134.0

Cosa significa

L’uscita di Grok Build illustra la rapida consolidazione del mercato degli agenti CLI. In pochi mesi, Claude Code (Anthropic), Codex CLI (OpenAI), GitHub Copilot CLI e ora Grok Build sono convergiti verso la stessa architettura: file di convenzioni per directory (CLAUDE.md / AGENTS.md), hook, integrazione MCP, subagents paralleli. La competizione si sposta verso la qualità dei modelli sottostanti, l’affidabilità in produzione e l’ecosistema di plugin — non verso l’architettura, che è diventata uno standard de facto.

La pubblicazione simultanea dell’articolo di contenimento di Anthropic e del lancio di Grok Build rivela una tensione centrale del momento: gli agenti CLI diventano più potenti (accesso al sistema, esecuzione di codice, git, CI/CD) mentre la comunità inizia a documentare seriamente i rischi. Le 24 esfiltrazioni su 25 durante il test di phishing di Anthropic e la vulnerabilità pre-trust dialog di Claude Code sono promemoria del fatto che la sicurezza degli agenti nel terminale resta un problema aperto. La pubblicazione di metriche concrete (Gray Swan 0,1%, cattura auto 83%) rappresenta un passo verso la trasparenza su questo tema.

L’intervento di Chris Olah in Vaticano si inserisce in un movimento più ampio: i ricercatori dei laboratori di IA avviano il dialogo con istituzioni non tecnologiche (chiesa, governi, società civile) su questioni che la sola tecnica non può risolvere. La questione della natura dei modelli — stati interni, introspezione, forme di coscienza funzionale — esce dai circoli di ricerca ed entra nel dibattito pubblico. L’enciclica papale “Magnifica humanitas” è un segnale che queste questioni raggiungono ormai il livello più alto delle istituzioni morali mondiali.

Il calo dei prezzi di ElevenLabs (-50% API, -40% Creative) e i film di Runway prodotti da una sola persona in poche ore puntano nella stessa direzione: la generazione di media creativi di qualità professionale sta diventando accessibile a singoli creatori. Project Luxo e Music v2 non sono annunci tecnici in senso stretto — sono dimostrazioni che gli strumenti hanno superato una soglia di usabilità per impieghi professionali reali.