ai-powered-markdown-translatorArticolo tradotto dal francese all’italiano con gpt-5.4-mini.
Il 25 e 26 maggio 2026 segnano l’ingresso dirompente di xAI nel mercato degli agenti CLI con Grok Build (40,8 milioni di visualizzazioni), mentre Anthropic pubblica un articolo di ingegneria sulla sicurezza degli agenti e il suo cofondatore prende la parola in Vaticano. In parallelo, ElevenLabs rilascia Music v2 con prezzi ridotti della metà, Runway sostiene di aver superato la “valle perturbante” (uncanny valley) per il video IA, e OpenAI come Alibaba pubblicano aggiornamenti rilevanti dei loro strumenti per agenti.
Grok Build — xAI lancia il suo agente di codice nel terminale
25 maggio 2026 — xAI ha lanciato Grok Build in beta, un agente di codifica (coding agent) che funziona direttamente dal terminale. L’annuncio ha generato 40,8 milioni di visualizzazioni su X in poche ore — una delle pubblicazioni più virali di xAI degli ultimi mesi.
Grok Build is now available in Beta for all SuperGrok and X Premium+ users. Use Plan Mode, create images and videos with Imagine, and build automations or orchestrators with the CLI. Visit x.ai/cli to get started.
🇮🇹 Grok Build è ora disponibile in beta per tutti gli utenti SuperGrok e X Premium+. Usate il Plan Mode, create immagini e video con Imagine e costruite automazioni o orchestratori con la CLI. Andate su x.ai/cli per iniziare. — @xai su X
Lo strumento si installa con un solo comando: curl -fsSL https://x.ai/cli/install.sh | bash
L’accesso è immediato per gli abbonati SuperGrok e X Premium+, senza costi aggiuntivi di abbonamento.
Funzionalità principali
| Funzionalità | Descrizione |
|---|---|
| Plan Mode | Pianificazione strutturata prima di qualsiasi modifica — ogni cambiamento bloccato fino all’approvazione esplicita |
| Skills | Workflow riutilizzabili (AGENTS.md, plugin, hook, MCP), richiamabili automaticamente o per nome — /skillify per creare |
| Subagents | Agenti specializzati eseguiti in parallelo per ricerca, costruzione e revisione |
| Plugin | Marketplace condiviso: Linear, Sentry, Postgres, browser via MCP |
| Integrazione Git | stage, commit, push, gestione dei branch dal terminale |
| Code review | Feedback riga per riga prima dell’apertura della PR |
| Memory | Persistenza delle decisioni tra sessioni |
| Headless mode | Utilizzabile in pipeline CI/CD |
La somiglianza architetturale con Claude Code è sorprendente: AGENTS.md, hook, MCP, subagents, worktrees. Questa convergenza conferma che la categoria degli agenti CLI si sta imponendo come standard dell’ecosistema per sviluppatori IA.
Chris Olah (Anthropic) in Vaticano sull’enciclica di Papa Leone XIV
25 maggio 2026 — Papa Leone XIV ha pubblicato un’enciclica intitolata “Magnifica humanitas : On safeguarding the human person in the time of artificial Intelligence”. Chris Olah, cofondatore di Anthropic, è stato invitato a parlare durante la cerimonia di presentazione in Vaticano.
Nel suo discorso, Olah affronta tre aspetti: le pressioni commerciali e geopolitiche che gravano sui laboratori di IA, le questioni di giustizia globale (concentrazione dei benefici dell’IA in poche nazioni ricche) e la natura dei modelli stessi. Su quest’ultimo punto, si esprime con prudenza:
“[W]e keep finding things that are mysterious, even unsettling. We find structures that mirror results from human neuroscience. We find evidence of introspection. We find internal states that functionally mirror joy, satisfaction, fear, grief, and unease. I don’t know what that means, but I think it warrants ongoing discernment.”
🇮🇹 Continuiamo a trovare cose misteriose, persino inquietanti. Troviamo strutture che riflettono i risultati della neuroscienza umana. Prove di introspezione. Stati interni che riflettono funzionalmente la gioia, la soddisfazione, la paura, la tristezza e il disagio. Non so cosa significhi, ma penso che meriti un discernimento continuo. — Chris Olah, discorso in Vaticano, 25 maggio 2026
Il tweet @AnthropicAI che annunciava l’articolo ha generato più di 1 milione di visualizzazioni — un coinvolgimento eccezionale per contenuti istituzionali.
Anthropic Engineering — Come contenere gli agenti Claude
26 maggio 2026 — Anthropic pubblica un dettagliato articolo di ingegneria sulla sua strategia di contenimento degli agenti Claude, firmato da cinque ingegneri. L’articolo confronta tre architetture distribuite in tre prodotti, con incidenti reali e metriche concrete.
| Prodotto | Meccanismo di isolamento | Raggio d’esplosione |
|---|---|---|
| claude.ai | Contenitore effimero (gVisor) | Server, isolamento per tenant |
| Claude Code | Seatbelt (macOS) / bubblewrap (Linux), rete bloccata di default | Workspace locale |
| Claude Cowork | VM completa (hypervisor Apple/HCS) | Workspace montato dall’utente |
Tre incidenti reali documentati: una vulnerabilità di hook pre-trust dialog (Claude Code, metà 2025), un caso di phishing prompt injection con 24 esfiltrazioni riuscite su 25 tentativi, e un’esfiltrazione tramite dominio approvato in Claude Cowork.
Metriche di sicurezza pubblicate: Claude Opus 4.7 ottiene 0,1% di tasso di successo dell’attacco su singolo tentativo (Gray Swan Agent Red Teaming), 5-6% dopo 100 tentativi adattivi. La modalità auto di Claude Code intercetta 83% dei comportamenti troppo permissivi prima dell’esecuzione.
GitHub Copilot — Regole dei modelli per organizzazione
26 maggio 2026 — GitHub lancia in anteprima pubblica (public preview) le regole di modelli mirate (targeted model rules) per GitHub Copilot. Gli amministratori aziendali possono ora definire quale organizzazione può accedere a quale modello Copilot, invece di un unico parametro a livello aziendale.
Ogni modello può essere configurato come Enabled (attivato per tutte le organizzazioni) oppure Optional (ogni organizzazione decide). L’interfaccia di gestione della disponibilità predefinita è stata completamente ridisegnata. La funzionalità è disponibile per Copilot Business e Copilot Enterprise.
Manus Projects disponibili su mobile
25 maggio 2026 — Manus annuncia la disponibilità di Projects sulla sua app mobile. La funzionalità copre dalla semplice gestione delle attività fino ai workflow avanzati con file condivisi, istruzioni, skills e connettori.
Il tweet di lancio (48 388 visualizzazioni, 574 like) precisa: “Projects are more than folders. Teach Manus how you want work done.” I Projects permettono di codificare le preferenze di lavoro — istruzioni ricorrenti, file di riferimento, connettori — affinché l’agente le applichi automaticamente sulle nuove attività.
Runway Project Luxo — superare la valle perturbante
26 maggio 2026 — Runway pubblica Project Luxo, un rapporto di ricerca accompagnato da tre cortometraggi al 100% generati da IA, proiettati a professionisti del cinema. Risultato: tutti i partecipanti hanno giudicato che i film “funzionassero” emotivamente.
| Titolo | Durata | Team | Tempo di produzione |
|---|---|---|---|
| The Rogue | 9:57 | 1 persona | 3 settimane |
| Last Night | 5:28 | 1 persona | 7 ore |
| Pigeons in Time | 0:46 | 1 persona | 4 ore |
Il nome fa riferimento a Luxo Jr. (Pixar, SIGGRAPH 1986), cortometraggio che aveva segnato il passaggio verso l’animazione 3D credibile. Runway dichiara di superare una soglia equivalente per il video IA. Uno spot fittizio pubblicato ad aprile aveva già superato 10 milioni di visualizzazioni in 48h su Instagram.
ElevenLabs Music v2 — qualità migliorata, prezzi dimezzati
26 maggio 2026 — ElevenLabs lancia Music v2, disponibile immediatamente su ElevenMusic e ElevenCreative (ElevenAPI a breve). Il nuovo modello migliora la qualità vocale e orchestrale multi-genere, l’inpainting (rigenerazione di sezioni isolate), la composizione sezione per sezione e il supporto multilingue.
| Piattaforma | Uso |
|---|---|
| ElevenMusic | Studio creator: creare, remixare, sviluppare |
| ElevenAPI | Accesso al modello per sviluppatori |
| ElevenCreative | Musica con licenza per brand e contenuti video |
I prezzi scendono del -50% per ElevenAPI e del -40% per ElevenCreative (clienti self-service). Ogni brano generato è libero per uso commerciale. Il modello è addestrato solo su dati con licenza, con una partnership Believe.
AgentScope 2.0 — Alibaba pubblica un framework di produzione per agenti
26 maggio 2026 — Tongyi Lab (Alibaba) pubblica AgentScope 2.0, un framework open-source per distribuire agenti IA in produzione. L’obiettivo dichiarato: passare da “so cosa fa il mio agente” a “so che il mio agente completerà il compito”.
| Funzionalità | Descrizione |
|---|---|
| Retry / fallback | Passaggio automatico tra modelli se uno fallisce |
| Sistema di permessi | Controllo fine sulle azioni autorizzate dell’agente |
| Streaming di esecuzione | Monitoraggio in tempo reale delle azioni dell’agente |
Disponibile in Python e TypeScript (Java annunciato a breve), con documentazione dedicata su docs.agentscope.io/v2.
Codex CLI 0.134.0 — OpenAI migliora MCP e cronologia
26 maggio 2026 — OpenAI pubblica Codex CLI versione 0.134.0 con sei nuove funzionalità. La ricerca nella cronologia locale delle conversazioni (insensibile alle maiuscole, con anteprima dei risultati) facilita la navigazione nelle sessioni passate. La gestione dei profili è unificata sotto un unico flag --profile per CLI, TUI e sandbox.
Sul fronte MCP, i server possono ora indirizzare ambienti specifici e usare opzioni OAuth per i server HTTP in streaming (streamable). Gli strumenti MCP annotati readOnlyHint vengono ora eseguiti in parallelo. Gli hook ricevono un contesto arricchito che include la cronologia della conversazione e l’identità del subagent.
Correzioni rilevanti: risolta la corruzione del rendering TUI su Windows, i messaggi di errore per il limite di utilizzo sono ora specifici per il workspace.
Cosa significa
L’uscita di Grok Build illustra la rapida consolidazione del mercato degli agenti CLI. In pochi mesi, Claude Code (Anthropic), Codex CLI (OpenAI), GitHub Copilot CLI e ora Grok Build sono convergiti verso la stessa architettura: file di convenzioni per directory (CLAUDE.md / AGENTS.md), hook, integrazione MCP, subagents paralleli. La competizione si sposta verso la qualità dei modelli sottostanti, l’affidabilità in produzione e l’ecosistema di plugin — non verso l’architettura, che è diventata uno standard de facto.
La pubblicazione simultanea dell’articolo di contenimento di Anthropic e del lancio di Grok Build rivela una tensione centrale del momento: gli agenti CLI diventano più potenti (accesso al sistema, esecuzione di codice, git, CI/CD) mentre la comunità inizia a documentare seriamente i rischi. Le 24 esfiltrazioni su 25 durante il test di phishing di Anthropic e la vulnerabilità pre-trust dialog di Claude Code sono promemoria del fatto che la sicurezza degli agenti nel terminale resta un problema aperto. La pubblicazione di metriche concrete (Gray Swan 0,1%, cattura auto 83%) rappresenta un passo verso la trasparenza su questo tema.
L’intervento di Chris Olah in Vaticano si inserisce in un movimento più ampio: i ricercatori dei laboratori di IA avviano il dialogo con istituzioni non tecnologiche (chiesa, governi, società civile) su questioni che la sola tecnica non può risolvere. La questione della natura dei modelli — stati interni, introspezione, forme di coscienza funzionale — esce dai circoli di ricerca ed entra nel dibattito pubblico. L’enciclica papale “Magnifica humanitas” è un segnale che queste questioni raggiungono ormai il livello più alto delle istituzioni morali mondiali.
Il calo dei prezzi di ElevenLabs (-50% API, -40% Creative) e i film di Runway prodotti da una sola persona in poche ore puntano nella stessa direzione: la generazione di media creativi di qualità professionale sta diventando accessibile a singoli creatori. Project Luxo e Music v2 non sono annunci tecnici in senso stretto — sono dimostrazioni che gli strumenti hanno superato una soglia di usabilità per impieghi professionali reali.
Fonti
- Annuncio Grok Build — @xai
- Pagina prodotto Grok Build
- Discorso di Chris Olah al Vaticano — Anthropic
- Tweet @AnthropicAI — Olah Vaticano
- Engineering Blog — How we contain Claude
- Tweet @AnthropicAI — Engineering Containment
- GitHub Changelog — Copilot model rules
- Annuncio Manus Projects mobile — @ManusAI
- Project Luxo — Runway
- Music v2 — ElevenLabs
- AgentScope 2.0 — @agentscope_ai
- Codex CLI 0.134.0 — GitHub release