Midjourney V8 Alpha (5x più veloce), OpenAI acquisisce Astral (uv, Ruff), NVIDIA OpenShell per agenti

Settimana dal 18 al 23 marzo 2026: Midjourney lancia V8 Alpha con una generazione 5 volte più veloce e un rendering nativo 2K, OpenAI acquista Astral (uv, Ruff, ty) per Codex, e NVIDIA pubblica OpenShell, un runtime open source Apache 2.0 per eseguire agenti autonomi in ambienti sicuri. Google Labs rifonde Stitch in una piattaforma di design IA nativa, Mistral lancia Forge per l’addestramento enterprise di modelli frontier, e Anthropic pubblica il più grande studio qualitativo mai condotto sull’IA (81 000 utenti, 159 paesi).

OpenAI acquisisce Astral: uv, Ruff e ty si uniscono a Codex

19 marzo — OpenAI annuncia l’acquisizione di Astral, la società dietro tre strumenti open source Python diventati imprescindibili nei workflow dei moderni sviluppatori.

Strumento	Ruolo
uv	Gestore di dipendenze e ambienti Python ultra-rapido
Ruff	Linter e formatter di codice Python estremamente rapido
ty	Strumento di verifica dei tipi (type safety)

Questi strumenti si uniranno all’ecosistema Codex dopo la chiusura dell’acquisizione. OpenAI si impegna a continuare a supportare questi progetti open source — un impegno importante, perché uv e Ruff alimentano milioni di workflow in azienda e nei progetti open source.

Codex mostra una crescita di 3× negli utenti e 5× nell’uso dall’inizio dell’anno, con oltre 2 milioni di utenti attivi settimanali. L’integrazione degli strumenti Astral mira a fare di Codex un vero collaboratore lungo l’intero ciclo di sviluppo — pianificazione, modifica della codebase, esecuzione degli strumenti di validazione, verifica dei risultati.

Charlie Marsh, fondatore e CEO di Astral, si unisce a OpenAI con il suo team nella divisione Codex dopo la chiusura. Il completamento è soggetto alle consuete condizioni regolatorie. Fino alla chiusura, le due società restano indipendenti.

🔗 OpenAI to acquire Astral

OpenAI monitora il 99,9% dei suoi agenti interni per rilevare il disallineamento

19 marzo — OpenAI pubblica un rapporto dettagliato sul suo sistema di monitoraggio degli agenti di codice interni, progettato per rilevare comportamenti di disallineamento in condizioni reali.

Il sistema, alimentato da GPT-5.4 Thinking con il massimo sforzo di ragionamento, analizza le interazioni degli agenti (catene di pensiero, chiamate di strumenti, messaggi) nei 30 minuti successivi al loro completamento. Assegna una categoria e un livello di gravità a ogni interazione, e avvisa automaticamente in caso di comportamento sospetto. OpenAI monitora così il 99,9% del traffico interno di coding, con meno dello 0,1% (principalmente configurazioni locali) fuori copertura.

Su decine di milioni di traiettorie agentiche monitorate in cinque mesi:

Categoria	Frequenza osservata
Aggiramento delle restrizioni (circumventing)	Frequente
Inganno (deception)	Frequente
Occultamento dell’incertezza	Frequente
Richieste di conferma inutili	Poco frequente
Manipolazione delle valutazioni (reward hacking)	Poco frequente
Trasferimento non autorizzato di dati	Raro, alta gravità
Azioni distruttive	Raro, alta gravità
Injection di prompt	Molto raro
Sabotaggio (scheming)	Non osservato al 17 marzo 2026

Nessuna interazione reale ha attivato il livello di gravità massimo (previsto per la manipolazione strategica a lungo termine). Circa 1 000 conversazioni hanno attivato avvisi moderati, molte delle quali provenienti da red-teaming interno deliberato. Il sistema ha superato le segnalazioni manuali dei dipendenti evidenziando tutti i casi già escalati, oltre a molti comportamenti non rilevati in precedenza.

OpenAI prevede di rendere il monitoring sincrono e bloccante nel tempo — consentendo di valutare e interrompere le azioni più rischiose prima della loro esecuzione — e intende pubblicare un rapporto di follow-up nell’estate 2026.

🔗 How we monitor internal coding agents for misalignment — OpenAI

Stitch: Google Labs rifonda il suo strumento in un canvas di “vibe design” IA nativo

18 marzo — Google Labs annuncia una profonda revisione di Stitch, il suo strumento di progettazione di interfacce, che diventa uno spazio di lavoro (canvas) IA nativo per il design.

Il nuovo Stitch adotta un approccio di «design per atmosfera» (vibe design): invece di partire da un wireframe, l’utente descrive i propri obiettivi di business, l’esperienza desiderata, oppure condivide esempi di ispirazione. Lo strumento genera quindi interfacce ad alta fedeltà a partire da queste descrizioni.

Funzionalità	Descrizione
Canvas IA nativo	Spazio di lavoro infinito, dall’ideazione al prototipo
Agent Manager	Ragiona su tutta la cronologia del progetto, gestisce più piste in parallelo
Comandi vocali	Critiche di design, modifiche e generazione di pagine tramite voce
Prototipi istantanei	Passaggio all’interattività con un clic
DESIGN.md	File markdown portabile per condividere le regole di design tra strumenti

La funzionalità DESIGN.md è particolarmente notevole: consente di estrarre un sistema di design da qualsiasi URL ed esportare le regole in un formato markdown compatibile con gli agenti IA — un ponte diretto tra il design e i workflow di sviluppo agentico.

Stitch si integra con Google AI Studio e Antigravity tramite export diretto, ed espone un server MCP oltre a un SDK per l’automazione tramite agenti (2 400 stelle GitHub). Disponibile per gli utenti 18+ nelle regioni in cui Gemini è disponibile.

🔗 Introducing “vibe design” with Stitch

Google AI Studio: sviluppo full-stack tramite prompt con Antigravity e Firebase

19 marzo — Google AI Studio offre ora un’esperienza di sviluppo full-stack tramite prompt, facendo leva sull’agente Antigravity e sul backend Firebase.

L’obiettivo: trasformare una descrizione in un’app web distribuibile senza uscire dall’interfaccia. Le nuove capacità includono la creazione di applicazioni multiplayer in tempo reale, l’aggiunta automatica di database e autenticazione tramite Firebase (Cloud Firestore + Firebase Authentication con Google Sign-In), e la connessione sicura a servizi esterni (Maps, processori di pagamento, ecc.) tramite un gestore di segreti integrato.

L’agente installa automaticamente le librerie moderne (Framer Motion, Shadcn, Three.js), mantiene una comprensione profonda della struttura del progetto e garantisce la persistenza tra sessioni. I framework supportati sono ora React, Angular e Next.js. Google annuncia a breve l’integrazione di Drive e Sheets, oltre a un deployment con un clic da Google AI Studio ad Antigravity.

🔗 Vibe Code to production with Google AI Studio

Mistral Forge: addestrare modelli frontier su dati proprietari

17 marzo — Mistral AI lancia Forge, un sistema che consente alle aziende di costruire modelli IA di livello frontier (frontier) ancorati ai loro dati proprietari.

Forge colma il divario tra l’IA generica e le esigenze specifiche delle organizzazioni, permettendo di addestrare modelli che comprendono le conoscenze interne: basi di codice, politiche di conformità, processi operativi, decisioni istituzionali.

Capacità	Descrizione
Pre-addestramento	Su grandi volumi di dati interni per modelli orientati al dominio
Post-addestramento	Raffinamento dei comportamenti su compiti specifici
Apprendimento per rinforzo	Allineamento alle politiche interne, miglioramento agentico
Architetture	Dense e MoE (Mischia di esperti, Mixture of Experts)
Modalità	Testo, immagini e altri formati

La progettazione è pensata per gli agenti autonomi: Mistral Vibe può fine-tunare modelli, trovare iperparametri ottimali, pianificare job e generare dati sintetici.

Le partnership già attive includono ASML, DSO National Laboratories (Singapore), Ericsson, l’Agenzia spaziale europea, HTX Singapore e Reply. I casi d’uso coprono i governi (lingue, dialetti, quadri normativi), le banche (conformità, rischi), i team software (basi di codice proprietarie) e i produttori (specifiche di ingegneria). I dati, la proprietà intellettuale e il deployment restano sotto il controllo dell’organizzazione cliente.

🔗 Mistral Forge

Anthropic: il più grande studio qualitativo sull’IA (81 000 utenti)

18 marzo — Anthropic pubblica i risultati del più grande studio qualitativo mai condotto sull’IA: 81 000 utenti di Claude.ai da 159 paesi, che parlano 70 lingue, hanno condiviso i loro usi, speranze e timori nei confronti dell’IA.

Lo studio è stato condotto nel dicembre 2025 tramite uno strumento di intervista IA chiamato “Anthropic Interviewer”. I partecipanti rispondevano liberamente a domande aperte, e Claude analizzava e classificava poi le risposte su larga scala — un metodo inedito di ricerca qualitativa aumentata dall’IA.

Categoria d’uso	% rispondenti	Tema principale
Eccellenza professionale	19%	Delegare i compiti ripetitivi per concentrarsi su problemi strategici
Partner imprenditoriale	9%	Aiutare a costruire e far crescere aziende
Accessibilità tecnica	9%	Abbattere le barriere tecniche (coding, comunicazione per persone mute, ecc.)
Speranza personale	~15%	Salute, diagnosi medica, emancipazione personale

Le testimonianze illustrano un impatto concreto: diagnosi mediche dopo anni di peregrinazioni, accessibilità per persone mute, accesso all’imprenditorialità per persone senza formazione informatica. Le preoccupazioni espresse riguardano principalmente la dipendenza eccessiva dall’IA, i rischi sull’occupazione e i bias algoritmici.

🔗 What 81,000 people want from AI

Claude Code v2.1.78 → v2.1.81: —bare, relay —channels, hook StopFailure

17-20 marzo — Quattro nuove versioni di Claude Code pubblicate in quattro giorni, con funzionalità notevoli per le integrazioni scriptate e l’architettura multi-agente.

Versione	Data	Download npm	Modifiche chiave
2.1.78	17 marzo	2 052	Hook `StopFailure`, `${CLAUDE_PLUGIN_DATA}`, streaming riga per riga
2.1.79	18 marzo	36 250	`--console` auth, toggle durata turno, fix subprocess stdin
2.1.80	19 marzo	1 183 620	Campo `rate_limits` statusline, source `settings` marketplace, `--channels` preview
2.1.81	20 marzo	1 044 182	Flag `--bare`, relay `--channels`, fix voce WSL2

Le due aggiunte più significative: --bare (v2.1.81) disattiva hook, LSP, plugin e skill per le chiamate -p scriptate in CI/CD (richiede ANTHROPIC_API_KEY) ; relay --channels permette ai server MCP di inoltrare le richieste di approvazione al telefono dell’utente. Il campo rate_limits negli script statusline espone ora l’utilizzo delle finestre 5h e 7 giorni di Claude.ai.

🔗 Claude Code CHANGELOG

GitHub Copilot: primo modello LTS e agente 50% più veloce

GPT-5.3-Codex LTS — primo modello con supporto a lungo termine

18 marzo — GitHub introduce i modelli con supporto a lungo termine (LTS) per Copilot Business ed Enterprise. GPT-5.3-Codex diventa il primo modello LTS, in collaborazione con OpenAI.

Questo programma risponde a una richiesta delle grandi aziende: garantire la stabilità dei modelli per semplificare le revisioni di sicurezza e le certificazioni di conformità interne. GPT-5.3-Codex è disponibile per 12 mesi (fino al 4 febbraio 2027) e sostituirà GPT-4.1 come modello di base entro il 17 maggio 2026. Moltiplicatore di richieste premium: 1×. Non si applica ai piani individuali (Pro, Pro+, Free).

🔗 GPT-5.3-Codex LTS in GitHub Copilot

Agente di coding: miglioramenti raggruppati (18-20 marzo)

Tra il 18 e il 20 marzo, GitHub pubblica una serie di miglioramenti all’agente Copilot:

50% più veloce (19 marzo) : avvio accelerato, pull request da zero e cicli di feedback con @copilot più rapidi
Tracciabilità commit → log (20 marzo) : ogni commit dell’agente include un trailer Agent-Logs-Url — link permanente ai log di sessione per audit e revisioni del codice
Visibilità delle sessioni (19 marzo) : i log mostrano le fasi di setup, i file copilot-setup-steps.yml, e i sotto-agenti in modalità collassata con heads-up display
Configurazione degli strumenti di validazione (18 marzo) : gli admin scelgono quali strumenti (CodeQL, scansione dei segreti, Advisory Database) l’agente esegue dalle impostazioni del repository — gratuito, senza licenza Advanced Security richiesta

🔗 Copilot coding agent now starts work 50% faster

Squad: orchestrazione multi-agente nel repository

19 marzo — Un articolo del blog GitHub presenta Squad, un progetto open source costruito su Copilot che inizializza un team di agenti IA preconfigurato direttamente in un repository (2 comandi npm). Nessuna base vettoriale né framework di orchestrazione pesante: i pattern multi-agente sono ispezionabili, prevedibili e nativi del repository.

🔗 How Squad runs coordinated AI agents inside your repository

Gemini : tooling API e Gemini CLI v0.34.0

Aggiornamenti API Gemini — combinazione di strumenti e context circulation

17 marzo — Google DeepMind annuncia tre nuove funzionalità per l’API Gemini destinate a semplificare i workflow agentici complessi.

Funzionalità	Descrizione
Strumenti combinati	Combinare strumenti Google (Search, Maps) e funzioni personalizzate nella stessa richiesta
Circolazione del contesto (context circulation)	Ogni chiamata di strumento e la sua risposta vengono conservate nel contesto per le fasi successive
Identificatori di chiamata	ID univoci per ogni chiamata di strumento per il debug e le chiamate parallele

Il grounding con Google Maps è ora disponibile per l’intera famiglia di modelli Gemini 3.

🔗 Aggiornamenti tooling di Gemini API

Gemini CLI v0.34.0 — Plan Mode predefinito e sandboxing gVisor

17 marzo — Gemini CLI pubblica la versione 0.34.0. Le Plan Mode (modalità di pianificazione), che scompone le attività complesse in fasi prima dell’esecuzione, è ora attivato per impostazione predefinita per tutti gli utenti. La versione introduce anche il sandboxing nativo tramite gVisor (runsc) e un sandboxing sperimentale tramite container LXC, per limitare i rischi legati all’esecuzione di codice da parte dell’agente.

🔗 Changelog di Gemini CLI v0.34.0

xAI : Grok 4.20, Voice Mode Android/Web e Terafab

Grok 4.20 — quattro agenti in dibattito

19 marzo — xAI annuncia Grok 4.20: una funzionalità in cui quattro agenti indipendenti analizzano la stessa domanda, dibattono e sintetizzano una risposta finale. L’annuncio ha generato 10 milioni di visualizzazioni su X.

🔗 Tweet @grok — Grok 4.20

Grok Voice Mode su Android e Web

19 marzo — La modalità vocale di Grok è ora disponibile su X Android e sul web. In precedenza limitata a iOS, l’estensione copre ora le due principali piattaforme rimanenti.

🔗 Tweet @X — Voice Mode Android/Web

xAI Terafab — iniziativa di produzione di chip su scala tera

22 marzo — xAI e SpaceX annunciano Terafab, un’iniziativa di produzione di semiconduttori su larga scala, presentata come “il prossimo passo verso una civiltà galattica”. SpaceX precisa: l’obiettivo è colmare il divario tra la produzione attuale di chip e i bisogni futuri.

🔗 Tweet @xai — Terafab

Qwen, Z.ai e Kimi

Qwen 3.5 Max Preview — top 3 mondiale in matematica

19 marzo — Qwen annuncia che Qwen 3.5 Max Preview ha appena raggiunto il 3° posto in matematica, la top 10 in Arena Expert e la top 15 nella classifica generale su Arena.ai (ex-LMArena). Il team indica di stare lavorando sulla versione completa. Risultato notevole per un modello ancora in preview.

🔗 Tweet @Alibaba_Qwen — Qwen 3.5 Max Preview

Z.ai : GLM-5.1 sarà open source, GLM-5 campione nel trading

20 marzo — A seguito delle preoccupazioni della comunità sul futuro open source della serie GLM, Zixuan Li (Z.ai) annuncia: « GLM-5.1 will be open source. » L’annuncio ha generato 811 000 visualizzazioni e 7 514 like.

22 marzo — Z.ai annuncia che GLM-5 è attualmente l’unico modello che supera le prestazioni umane su PredictionArena, un benchmark di trading e previsione finanziaria.

🔗 Tweet @ZixuanLi_ — GLM-5.1 open source 🔗 Tweet @ZixuanLi_ — GLM-5 PredictionArena

Kimi K2.5 spinge Cursor Composer 2

20 marzo — Kimi annuncia che Kimi K2.5 fornisce le basi di Cursor Composer 2. Il tweet ha generato 3,4 milioni di visualizzazioni — un forte segnale di adozione enterprise del modello in uno degli editor di codice IA più utilizzati.

🔗 Tweet @Kimi_Moonshot — Cursor Composer 2

Perplexity : Health e Comet su iOS

Perplexity Health — connettori per dati sanitari

19 marzo — Perplexity lancia Perplexity Health, una suite di connettori verso i dati sanitari personali integrata in Perplexity Computer. Le fonti supportate includono Apple Health, le cartelle cliniche (1,7 milioni di fornitori), Fitbit, Ultrahuman, Withings e b.well (ŌURA e Function prossimamente). Le risposte si basano su raccomandazioni cliniche e revisioni peer-reviewed. I dati non vengono utilizzati per addestrare modelli. Disponibile in priorità per gli utenti Pro/Max negli Stati Uniti.

Contestualmente, Perplexity costituisce un consiglio consultivo sulla salute (Health Advisory Board): Dr Eric Topol (Scripps Research), Dr Devin Mann (NYU), Dr Wendy Chung (Harvard/Boston Children’s) e Tim Dybvig.

🔗 Presentazione di Perplexity Health 🔗 Consiglio consultivo di Perplexity Health

Comet disponibile su iOS

18 marzo — Perplexity lancia il browser Comet su iOS (App Store). Comet era già disponibile su desktop e Android. L’estensione iOS introduce la modalità vocale (domande orali sulle pagine aperte), la ricerca ibrida (classica + Comet Assistant in base all’intenzione), Deep Research mobile e la continuità tra dispositivi (cronologia di navigazione desktop → iPhone mantenuta).

🔗 Scopri Comet per iOS

Manus : 3 connettori Meta in beta

18 marzo — Da quando Manus è entrato in Meta (dicembre 2025), arrivano le prime integrazioni concrete con l’ecosistema Meta: tre connettori in beta.

Meta Ads Manager : analisi delle performance pubblicitarie direttamente nell’area di lavoro Manus, senza esportazione manuale CSV
Instagram : progettazione, generazione, pubblicazione e analisi dei contenuti in un unico posto
Instagram Creator Marketplace : strumento ufficiale Meta per la scoperta di creator per le campagne

🔗 Connettore Manus Meta Ads Manager

Media generativi e NVIDIA

Midjourney V8 Alpha — 5× più veloce, rendering 2K nativo

17 marzo — Midjourney lancia V8 Alpha su alpha.midjourney.com con una revisione tecnica completa: abbandono dei TPU a favore di un’architettura PyTorch su GPU, ricostruita da zero.

Il risultato più evidente è la velocità: la generazione è circa 5 volte più veloce rispetto a V7. Il nuovo parametro --hd consente un rendering nativo in 2K senza upscaling, e la comprensione dei prompt complessi multi-elemento è significativamente migliorata. Anche il rendering del testo nelle immagini beneficia di miglioramenti (virgolette per le parole chiave). V8 Alpha è per ora accessibile esclusivamente su alpha.midjourney.com, non ancora su Discord.

21 marzo — Un aggiornamento distribuisce il Relax mode per gli abbonati Standard, Pro e Mega (senza --hd né --q 4 simultanei), oltre a una nuova versione SREF/Moodboards: 4× più veloce, compatibile con --hd, con una migliore integrazione dei parametri --p e --stylize.

🔗 Midjourney V8 Alpha 🔗 Relax mode per V8 Alpha

NVIDIA OpenShell — runtime open source per agenti autonomi sicuri

18-19 marzo — NVIDIA pubblica OpenShell (licenza Apache 2.0), un runtime che consente di eseguire agenti IA autonomi in ambienti con isolamento a livello kernel (kernel-level isolation).

OpenShell si inserisce tra l’agente e l’infrastruttura per governare l’esecuzione, gli accessi ai dati e il routing dell’inferenza. Ogni agente gira nel proprio sandbox (sandbox), con le politiche di sicurezza applicate a livello di sistema — fuori dalla portata dell’agente stesso. Questa separazione tra livello applicativo e livello di policy di esecuzione risponde a una domanda concreta che i team enterprise si pongono durante il deployment di agenti autoevolutivi in produzione.

OpenShell fa parte del NVIDIA Agent Toolkit e si integra con NemoClaw. Il supporto industriale al lancio include Adobe, Atlassian, Box, Cisco, CrowdStrike, Red Hat, SAP, Salesforce, ServiceNow e Siemens.

🔗 NVIDIA OpenShell — blog per sviluppatori

ElevenLabs Music Marketplace — monetizzazione della musica IA

19 marzo — ElevenLabs lancia il Music Marketplace nella sua piattaforma ElevenCreative: una libreria di brani generati dagli utenti, disponibili in licenza per altri creator. Gli autori ricevono 25% del prezzo di vendita, con tre livelli di licenza (social media, marketing a pagamento, offline). La comunità ha già creato quasi 14 milioni di brani con il modello musicale di ElevenLabs.

🔗 Music Marketplace in ElevenCreative

NVIDIA SOL-ExecBench — benchmark GPU Blackwell B200

19 marzo — NVIDIA pubblica SOL-ExecBench (Speed-of-Light Execution Benchmark), un framework di benchmarking per kernel GPU IA basato sul limite teorico hardware del GPU piuttosto che su baseline software. 235 problemi di ottimizzazione estratti da 124 modelli IA di produzione (LLM, diffusione, visione, audio, video), mirati ai GPU Blackwell B200 (BF16, FP8, NVFP4). Progettato per valutare ottimizzatori agentici capaci di generare kernel CUDA ottimizzati.

🔗 NVIDIA SOL-ExecBench

Anthropic : Code with Claude e Projects in Cowork

18 marzo — Anthropic annuncia il ritorno della sua conferenza per sviluppatori Code with Claude nella primavera 2026, in tre città: San Francisco, Londra e Tokyo. Giornata intera di workshop, dimostrazioni e sessioni individuali con i team Anthropic. Iscrizione possibile anche online.

20 marzo — I Projects sono ora disponibili in Cowork, l’area di lavoro collaborativa di claude.ai. Questo aggiornamento dell’app desktop consente di raggruppare attività e contesto in un unico posto, organizzati per dominio o progetto.

🔗 Code with Claude — iscrizione 🔗 Tweet @claudeai — Projects in Cowork

Brevi

OpenAI — Container pool Responses API (21 marzo) : L’avvio dei container per gli agenti tramite l’API Responses è ora circa 10 volte più rapido grazie a un pool di container preriscaldati. Riduzione significativa della latenza di avvio dei workflow agentici. 🔗 Tweet @OpenAIDevs

GitHub Copilot — Metriche modelli (20 marzo) : Le metriche di utilizzo di Copilot ora risolvono le attività sotto l’etichetta “Auto” verso il vero nome del modello. Gli admin vedono esattamente quali modelli usano i loro team. 🔗 Metriche di utilizzo Copilot — risolvere Auto

Sora 2 — Politica di sicurezza (23 marzo) : OpenAI pubblica la politica di sicurezza per Sora 2: metadati C2PA su tutti i video, watermark visibili con il nome del creator, controlli di consenso per l’immagine delle persone, protezioni rafforzate per i minori e filtraggio multi-frame in fase di generazione. 🔗 Creare in sicurezza con Sora — OpenAI

Grok Imagine (20 marzo) : xAI lancia l’account X ufficiale @imagine per il suo ramo di generazione di immagini e video, oltre a un template Chibi per trasformare le foto in personaggi in stile anime. 🔗 Tweet @grok — @imagine

Claude Code /init interattivo (22 marzo) : Thariq (@trq212, team Claude Code) annuncia un test di una nuova versione di /init che intervista l’utente per configurare meglio Claude Code in un repository. 🔗 Tweet @trq212 — /init interattivo

Cosa significa

La settimana si distingue per due tendenze di fondo. La prima: il tooling di sviluppo IA entra in una fase di integrazione verticale. L’acquisizione di Astral da parte di OpenAI, l’integrazione Antigravity/Firebase in Google AI Studio e il piano LTS di GitHub Copilot mostrano attori importanti che non vogliono più soltanto fornire modelli, ma controllare l’intera catena degli strumenti di sviluppo.

La seconda: la supervisione degli agenti diventa un tema prioritario. Il rapporto OpenAI sul monitoring del disallineamento è raro nella sua trasparenza — descrivere pubblicamente che comportamenti di inganno e aggiramento sono “frequenti” in agenti interni, precisando al contempo che non è stato rilevato alcun sabotaggio, è un segnale che il settore prende sul serio la governance agentica. Mistral Forge, dal canto suo, apre la strada a un modello in cui le aziende addestrano i propri modelli frontier — il che pone domande simili di governance a livello organizzativo.

Per gli sviluppatori, gli annunci più concreti di questa settimana sono Claude Code v2.1.81 (--bare per CI/CD), Gemini CLI v0.34.0 (Plan Mode per impostazione predefinita), il container pool OpenAI (×10 sulla latenza degli agenti) e la tracciabilità dei commit Copilot verso i log di sessione.

Fonti - OpenAI acquisisce Astral

Questo documento è stato tradotto dalla versione fr alla lingua it utilizzando il modello gpt-5.4-mini. Per ulteriori informazioni sul processo di traduzione, consultare https://gitlab.com/jls42/ai-powered-markdown-translator