Anthropic deposita il suo dossier di IPO, NVIDIA lancia Cosmos 3, MiniMax M3 e Qwen3.7-Plus

Il 1° giugno 2026 resterà come una delle giornate più dense della storia recente dell’IA: Anthropic compie un passo verso la borsa con un deposito S-1 confidenziale presso la SEC, mentre un’ondata di “Physical AI” si abbatte simultaneamente — NVIDIA Cosmos 3, Cosmos Coalition Runway+NVIDIA, Luma OPAL Lab, MiniMax M3, Qwen-VLA e Qwen3.7-Plus. Nello stesso tempo, OpenAI distribuisce Rosalind Biodefense per la preparazione alle pandemie e pubblica un quadro di governance allineato con la TFAIA californiana e l’EU AI Act.

Anthropic deposita confidenzialmente un modulo S-1 presso la SEC

1° giugno — Anthropic ha depositato confidenzialmente una bozza di registrazione sul modulo S-1 presso la Securities and Exchange Commission statunitense (SEC), in vista di un’introduzione in borsa (IPO) delle sue azioni ordinarie. Questo deposito confidenziale è una fase preliminare obbligatoria che consente alla SEC di esaminare il documento prima di qualsiasi offerta pubblica.

Elemento	Valore
Tipo di deposito	Modulo S-1 confidenziale
Regolatore	SEC (Stati Uniti)
Tipo di azione	Azioni ordinarie
Prezzo / numero azioni	Non ancora fissati
Stato legale	Deposito preliminare — non è un’offerta di vendita
Data	1° giugno 2026

L’annuncio precisa che Anthropic conserva l’opzione di quotarsi in borsa una volta completato l’esame della SEC, ma che l’operazione finale dipenderà dalle condizioni di mercato e da altri fattori. Questo deposito S-1 si inserisce nella continuità diretta della chiusura della Serie H (65 miliardi USD, valutazione post-money di 965 miliardi USD) e di un fatturato annualizzato che avrebbe superato i 47 miliardi USD a metà maggio 2026.

Anthropic resta una società di pubblica utilità (PBC — Public Benefit Corporation), uno status che intende mantenere dopo una possibile quotazione — una rara distinzione legale che impone obblighi di interesse pubblico in aggiunta alla ricerca del profitto.

🔗 Annuncio ufficiale — Anthropic

NVIDIA Cosmos 3 — primo omni-modello open-source per la Physical AI

1° giugno — NVIDIA lancia Cosmos 3, il primo omni-modello completamente aperto per l’IA fisica. Unifica linguaggio, immagine, video, audio e generazione di azioni in un unico modello — una prima mondiale.

Variante	Parametri	Disponibilità
Cosmos 3 Super	32B	Open-source dal lancio
Cosmos 3 Nano	8B	Open-source dal lancio

Il modello integra nativamente il ragionamento visivo (native vision reasoning), la generazione di mondi (world generation) e la generazione di azioni (action generation). Secondo Artificial Analysis, Cosmos 3 si classifica immediatamente #1 tra i modelli open-weight nella generazione testo-immagine e immagine-video già dal giorno del lancio. I pesi sono disponibili su Hugging Face e NVIDIA NGC.

“Introducing Cosmos 3: Our latest frontier model for Physical AI. Cosmos 3 is the world’s first fully open omnimodel with native vision reasoning, world and action generation.”

🇮🇹 NVIDIA presenta Cosmos 3: il suo ultimo modello frontier per l’IA fisica. Cosmos 3 è il primo omni-modello completamente aperto al mondo, con ragionamento visivo nativo, generazione di mondi e generazione di azioni. — @NVIDIAAI su X

Cosmos Coalition — Runway + NVIDIA, iniziativa mondiale per i world models

1° giugno — Runway si unisce a NVIDIA come membro fondatore della Cosmos Coalition, un’iniziativa mondiale che riunisce laboratori di IA di primo piano per costruire e rendere accessibili in open-source world models frontier per l’IA fisica.

L’obiettivo è creare un ecosistema aperto comune che consenta a qualsiasi gruppo di ricerca o industriale di utilizzare, modificare e assemblare questi modelli per sistemi di lavoro produttivo. La coalizione integra anche partnership con produttori di chip e di hardware.

“Introducing the Cosmos Coalition. A new global initiative with NVIDIA and leading AI labs to build and open-source frontier world models for physical AI.”

🇮🇹 Presentazione della Cosmos Coalition. Una nuova iniziativa mondiale con NVIDIA e i principali laboratori di IA per costruire e rendere open-source world models frontier per l’IA fisica. — @runwayml su X

Questo lancio coordinato con Cosmos 3 segna una svolta strategica: NVIDIA posiziona l’IA fisica open-source come una questione di sovranità tecnologica mondiale, di fronte alla concentrazione delle risorse nelle mani di pochi attori chiusi.

MiniMax M3 — primo open-weight a combinare coding frontier, multimodalità e contesto 1M

1° giugno — MiniMax lancia M3, il primo modello open-weight che combina simultaneamente tre capacità frontier. Con 1,7 milioni di visualizzazioni in poche ore, è uno dei lanci open-source più seguiti dell’anno.

Capacità	Dettaglio
Coding & Agentic frontier	59,0% SWE-Bench Pro, 66,0% Terminal Bench 2.1
Contesto 1M token	MiniMax Sparse Attention
Multimodalità nativa	Fin dalla fase zero dell’addestramento

Benchmark completi:

Benchmark	Punteggio
SWE-Bench Pro	59,0%
Terminal Bench 2.1	66,0%
SWE-fficiency	34,8%
KernelBench Hard	28,8%
MCP Atlas	74,2%
BU Bench (browser use)	+26% vs precedente

M3 è progettato nativamente per gli agenti informatici (computer-use agents) e i workflow agentici di lunga durata. I pesi e il rapporto tecnico saranno pubblicati tra circa 10 giorni dal lancio. Un IDE dedicato, MiniMax Code, viene lanciato simultaneamente, accessibile su code.minimax.io. I partner di lancio del primo giorno includono Qubrid AI (infrastruttura cloud GPU) e Simular (agenti autonomi).

🔗 Annuncio MiniMax M3

Luma OPAL Lab — laboratorio aperto di Physical AI per la robotica generalista

1° giugno — Luma annuncia la creazione di OPAL Lab (Open Science Physical AI Lab), un laboratorio di ricerca aperta dedicato alla generalizzazione nella robotica.

Il fondatore Amit (@gravicle) identifica il problema centrale dell’IA fisica attuale: a differenza dei grandi modelli linguistici capaci di generalizzare su compiti inediti, i robot possono solo riprodurre compiti specifici in ambienti specifici. La robotica soffre di una mancanza di dati che crea una crisi di generalizzazione.

“We are launching Open Physical AI Lab at Luma to solve generalization in robotics. We believe general physical AI is the most consequential problem to solve to improve life on Earth.”

🇮🇹 Stiamo lanciando l’Open Physical AI Lab in Luma per risolvere il problema della generalizzazione nella robotica. Pensiamo che l’IA fisica generalista sia il problema più cruciale da risolvere per migliorare la vita sulla Terra. — @gravicle su X

Luma si basa su 4 anni di ricerca fondamentale in IA multimodale (3D, immagine, video, generazione unificata) e su un’infrastruttura di elaborazione di dati multimodali su scala internet. I principi dell’OPAL Lab: scienza aperta, metodi e substrati disponibili a tutti, collaborazione con l’accademia, partnership industriali e valutazioni di sicurezza. Il messaggio è esplicitamente politico: concentrare l’infrastruttura di intelligenza fisica mondiale nelle mani di un piccolo numero di aziende rappresenta una minaccia profonda per l’umanità.

🔗 Annuncio OPAL Lab

Qwen3.7-Plus — agente multimodale di Alibaba con visione, coding e contesto lungo

1° giugno — Alibaba Tongyi Lab pubblica Qwen3.7-Plus, il suo modello agente multimodale più avanzato. Costruito sul backbone testuale di Qwen3.7, fonde visione e linguaggio in una base agentica unica e versatile.

Benchmark chiave:

Benchmark	Qwen3.7-Plus	GPT-5.4	Claude Opus 4.6 Max	Gemini 3.1 Pro
Terminal Bench 2.0	70,3	—	65,4	—
SWE-bench Verified	77,7	—	80,8	—
GPQA Diamond	90,3	—	91,3	—
ScreenSpot Pro	79,0	67,4	49,5	68,1
AndroidWorld	81,0	—	62,0	70,7
BabyVision	70,4	53,1	12,6	55,9

Quattro capacità principali: agente ibrido GUI+CLI (percepisce gli schermi, naviga nelle applicazioni), assistente di coding e produttività multimodale (dal mockup frontend all’ingegneria complessa), agente visivo (percezione, ragionamento, localizzazione e domande-risposte arricchite dalla ricerca web) e generalizzazione multi-ambiente tramite Claude Code, OpenClaw, Qwen Code o qualsiasi altro ambiente di agenti.

Disponibilità: Alibaba Cloud Model Studio, API compatibile OpenAI e protocollo Anthropic (utilizzabile direttamente con Claude Code tramite ANTHROPIC_BASE_URL).

🔗 Blog Qwen3.7-Plus

Rosalind Biodefense — OpenAI apre GPT-Rosalind alla biologia difensiva

29 maggio — OpenAI annuncia due iniziative importanti attorno alla biologia difensiva, basandosi su GPT-Rosalind, il suo modello di ragionamento dedicato alle scienze della vita.

Organizzazione	Ambito	Tipo
Fourth Eon	Screening biosicurezza, sintesi di DNA	Sviluppatore Rosalind Biodefense
SecureDNA	Sicurezza biologica	Sviluppatore Rosalind Biodefense
Lawrence Livermore National Laboratory	Contromisure mediche	Partner governativo
Johns Hopkins APL	Ingegneria proteica, terapeutiche	Partner governativo
CEPI	Vaccini pandemici, risposta a Ebola	Partner governativo

Rosalind Biodefense è un programma di sviluppo aperto a istituzioni accademiche, organizzazioni senza scopo di lucro, aziende con missione difensiva e team governativi. OpenAI finanzia l’accesso a GPT-Rosalind e accompagna i progetti sulla modellazione epidemiologica, il rilevamento precoce, lo screening, la preparazione alle pandemie e le contromisure mediche.

“Advances in biology can strengthen our ability to prevent, detect, and respond to biological threats. Our goal is to help build a more robust ecosystem — giving trusted defenders frontier AI to develop and operate new defenses for public health and biodefense.”

🇮🇹 I progressi in biologia possono rafforzare la nostra capacità di prevenire, rilevare e rispondere alle minacce biologiche. Il nostro obiettivo è aiutare a costruire un ecosistema più solido — dando ai difensori fidati un’IA frontier per sviluppare e operare nuove difese per la salute pubblica e la biodifesa. — @OpenAI su X

L’accesso ampliato a GPT-Rosalind per i partner governativi americani e alleati viene annunciato simultaneamente, con beneficiari come la CEPI nell’ambito della sua missione “100 Days” di accelerazione dei vaccini — inclusa la risposta all’epidemia di Ebola in corso.

🔗 Rosalind Biodefense — OpenAI

Claude Code v2.1.153 a v2.1.159 — cinque aggiornamenti post-28 maggio

29 maggio – 1° giugno — Anthropic pubblica cinque versioni di Claude Code nei giorni successivi al lancio di Opus 4.8.

Versione	Punti chiave
2.1.153	Opzione `skipLfs` per marketplace, `claude doctor` migliorato, correzioni MCP/agent macOS/Windows
2.1.156	Correzione critica — i thinking blocks di Opus 4.8 provocavano errori API
2.1.157	Plugin caricati automaticamente da `.claude/skills/`, comando `plugin init`, `EnterWorktree` a metà sessione
2.1.158	Auto Mode su Bedrock, Vertex e Foundry per Opus 4.7 e Opus 4.8 (`CLAUDE_CODE_ENABLE_AUTO_MODE=1`)
2.1.159	Infrastruttura interna, nessuna modifica visibile

La versione 2.1.157 è la più notevole: i plugin inseriti in .claude/skills/ vengono ora caricati automaticamente senza passare dal marketplace, e EnterWorktree può passare tra worktree gestiti da Claude nel corso della sessione. La versione 2.1.158 porta Auto Mode sulle principali piattaforme cloud, rafforzando il deployment enterprise di Claude Code.

🔗 Release Claude Code

Gemini 3.5 Flash e Gemini Omni in disponibilità generale

29 maggio — Google segna la disponibilità generale (general availability) di Gemini 3.5 Flash tramite 9 dimostrazioni video che coprono Gemini Omni e Gemini 3.5 Flash in azione.

Distribuzione di Gemini 3.5 Flash: modello predefinito nell’app Gemini e in AI Mode di Search (globale), disponibile tramite Google Antigravity, l’API Gemini in Google AI Studio, Android Studio, Gemini Enterprise Agent Platform e Gemini Enterprise.

Gemini Spark: l’agente IA personale 24 ore su 24 alimentato da Gemini 3.5, ora disponibile per tutti gli abbonati Google AI Ultra negli Stati Uniti, integrato in Gmail, Docs, Slides e Workspace.

Gemini Omni Flash: distribuito agli abbonati Google AI Plus, Pro e Ultra nell’app Gemini e in Google Flow; disponibile senza costi per gli utenti di YouTube Shorts e YouTube Create App; distribuzione API per sviluppatori prevista nelle settimane successive.

🔗 Dimostrazioni Gemini Omni e 3.5 Flash

Qwen-VLA — agente robotico visione-linguaggio-azione per 11 tipi di robot

29 maggio — Tongyi Lab pubblica Qwen-VLA, un modello Vision-Language-Action (VLA) unificato per l’intelligenza incarnata generale (general embodied intelligence).

Architettura: Qwen3.5-4B (backbone linguaggio-visione) + decodificatore DiT 1,15B per produrre azioni direttamente dalla percezione visiva e dal linguaggio naturale. Il modello unifica manipolazione di oggetti, navigazione nello spazio e previsione della traiettoria in un unico quadro.

Grazie ai prompt con consapevolezza dell’incarnazione (embodiment-aware prompts), lo stesso modello funziona su 11 tipi di incarnazioni robotiche — braccio singolo, doppio braccio e piattaforme umanoidi — senza policy heads né architetture specifiche per ciascun compito. Il tweet ha generato 3,1 milioni di visualizzazioni in due giorni, segno del forte interesse della comunità robotica.

🔗 Qwen-VLA su X

Copilot — l’API delle metriche aggiunge cohort di adozione IA

29 maggio — GitHub arricchisce l’API delle metriche di utilizzo di Copilot con un sistema di cohort di adozione IA. Ogni utente attivo viene classificato in una delle quattro fasi seguenti, calcolate su una finestra scorrevole di 28 giorni:

Fase	Nome	Criterio
0	No cohort	Engagement insufficiente
1	Code first	Completamento del codice e/o modalità agente IDE
2	Agent first	Una superficie agente GitHub (cloud agent, code review, CLI)
3	Multi-agent	Due o più superfici agente, oppure l’app GitHub Copilot

Le metriche esposte per fase: utenti attivi, interazioni, generazione e accettazione di codice, righe aggiunte/eliminate, pull request create/mergiate/revisionate, tempo mediano di merge. Accessibile agli amministratori enterprise e ai proprietari dell’organizzazione. Questo sistema consente di misurare la reale maturità di adozione di Copilot e di seguire la progressione degli sviluppatori verso usi agentici avanzati.

🔗 Changelog GitHub — API delle metriche di utilizzo di Copilot

ElevenLabs firma un MOU con il governo della Grecia

28 maggio — ElevenLabs firma un memorandum d’intesa con il governo greco, alla presenza del Primo ministro (@PrimeministerGR) e del ministro della Trasformazione digitale (@papastergiougr), per tre direttrici: migliorare l’accesso ai servizi pubblici tramite l’IA vocale, promuovere il turismo e preservare il patrimonio linguistico greco. Questa partnership governativa illustra la strategia di ElevenLabs per insediarsi nel settore pubblico europeo, puntando su usi istituzionali ad alta visibilità.

🔗 Annuncio ElevenLabs

Frontier Governance Framework — OpenAI allinea le sue pratiche alla TFAIA e all’EU AI Act

28 maggio — OpenAI pubblica il suo Frontier Governance Framework, un documento di governance pubblica che traduce il Preparedness Framework interno in obblighi normativi concreti. L’obiettivo principale: la Transparency in Frontier AI Act (TFAIA) della California e il Codice di pratica per l’IA a uso generale dell’EU AI Act.

Il framework copre la valutazione e la mitigazione dei rischi nei domini cyberoffensivi, CBRN (chimici, biologici, radiologici, nucleari), manipolazione dannosa e perdita di controllo. Include anche gli obblighi di segnalazione dei modelli, la gestione degli incidenti, il ricorso a esperti esterni e un meccanismo di aggiornamento. OpenAI precisa che il Preparedness Framework resta il suo fondamento interno — alcune pratiche vanno oltre gli attuali requisiti legali.

🔗 Frontier Governance Framework

Guida alle valutazioni terze affidabili — metodo e cinque bias da controllare

29 maggio — OpenAI pubblica una guida metodologica per valutazioni terze rigorose dei modelli IA di frontiera. Il documento parte da un’osservazione: le valutazioni progettate in origine per i chatbot non sono più adatte ai sistemi agentici capaci di usare strumenti e di agire su traiettorie lunghe.

La guida distingue tre tipi di affermazioni che le valutazioni devono supportare: l’elicitation di capacità (ciò che il modello può fare nelle migliori condizioni), la robustezza delle protezioni (resistenza agli attacchi) e il confronto tra sistemi. Un concetto centrale è il “harness” (ambiente di esecuzione attorno al modello), le cui scelte possono cambiare in modo materiale i risultati — OpenAI cita l’impatto della compaction del contesto sulle prestazioni di GPT-5.5 in valutazioni cyber multi-step.

Sono identificati cinque bias di validità: reward hacking (sfruttamento di scorciatoie), rifiuto che maschera le reali capacità, contaminazione (memorizzazione dei benchmark), problemi rotti (attività impossibili o valutate male) e sandbagging (sotto-performance deliberata durante valutazioni rilevate). OpenAI si impegna a fornire istruzioni di elicitation massima ai valutatori terzi e a condividere le tracce di ragionamento.

🔗 Guida alle valutazioni terze — OpenAI

Grok Imagine Extend — estensione video continua

29 maggio — Grok Imagine lancia Extend, una funzionalità che consente di creare video continui con transizioni fluide a partire da un video o da immagini esistenti. La funzionalità è disponibile direttamente nell’interfaccia di Grok Imagine. Il tweet dell’account @imagine è stato ripubblicato da @grok e ha raggiunto 701.000 visualizzazioni. Questo annuncio consolida la suite creativa di Grok al fianco di Grok Build e dell’API grok-build-0.1.

🔗 Grok Imagine Extend

Codex Computer Use su Windows e controllo da mobile

29 maggio — OpenAI annuncia che la funzionalità “computer use” di Codex è ora disponibile su Windows. L’agente può vedere lo schermo, fare clic e digitare testo nelle applicazioni Windows, aprendo la strada a test nativi, flussi su simulatore e correzioni di bug accessibili solo tramite interfaccia grafica. L’app mobile ChatGPT integra simultaneamente il supporto Windows per Codex: avvio, monitoraggio e controllo delle attività dal telefono mentre il lavoro prosegue sul PC. OpenAI definisce questa funzionalità un’«esperienza iniziale»; non è disponibile nello Spazio economico europeo, nel Regno Unito né in Svizzera.

🔗 Codex Computer Use su Windows

Brevi

Salesforce + Claude Code — Boris Cherny (@bcherny) condivide una testimonianza Salesforce sull’uso agentico di Claude Code: una migrazione inizialmente stimata in 231 giorni consegnata in 13, 21 endpoint al 100% di copertura dei test e un calo del 5% degli incidenti nonostante un aumento del volume di PR. 🔗 source
Google I/O 2026 — making-of IA — Google dettaglia come i suoi team hanno utilizzato Gemini Omni, Nano Banana, Lyria 3 e Antigravity per produrre le esperienze creative di Google I/O 2026: cortometraggio d’animazione, identità visiva, pre-show musicale interattivo, giochi generativi. 🔗 source
Gemini CLI v0.44.0 — Modalità Auto unificata (fusione delle modalità specializzate), supporto nativo per Sublime Text e Emacs Client, nuovi strumenti di test TUI programmabili. 🔗 source
GitHub Copilot — modelli in valutazione nella modalità auto — Gli utenti individuali (Free, Pro, Pro+) hanno ora accesso ai modelli pre-GA tramite la selezione automatica auto. Opzione di disattivazione disponibile nelle impostazioni. 🔗 source
ElevenLabs Summit Varsavia — Preview del modello vocale più espressivo mai sviluppato da ElevenLabs, svelato dal co-fondatore Mati. Si tratta solo di una preview, senza accesso pubblico annunciato. 🔗 source
Cohere Command A+ — benchmark di traduzione — Command A+ supera Mistral Medium 3.5, DeepSeek, gpt-oss e Claude Opus 4.6 su WMT24++, oltre a Google Translate. Guadagni documentati: +2,4 pt in francese, +1,9 pt in spagnolo, +0,9 pt in tedesco. 🔗 source

Cosa significa

La dinamica finanziaria di Anthropic e il consolidamento del settore. Il deposito S-1 riservato di Anthropic è la notizia più strutturante della settimana. Avviene in un contesto di crescita straordinaria — 65 miliardi USD raccolti nella Serie H, valutazione vicina al trilione — e segnala che le grandi aziende di IA di frontiera iniziano a considerare seriamente i mercati pubblici. Il mantenimento dello status di PBC (Public Benefit Corporation) è un impegno forte: Anthropic cerca di dimostrare che una quotazione in borsa è compatibile con una missione di sicurezza a lungo termine. Questo precedente avrà implicazioni per OpenAI e altri attori che potrebbero seguire questa strada.

L’ondata Physical AI — verso un’IA che agisce nel mondo reale. Il 1° giugno segna una convergenza notevole attorno all’IA fisica: NVIDIA Cosmos 3 (primo omni-modello open-weight per robot e agenti), Cosmos Coalition (ecosistema aperto Runway+NVIDIA), Luma OPAL Lab (ricerca aperta sulla generalizzazione robotica), MiniMax M3 (contesto 1M + multimodalità nativa), Qwen-VLA (11 tipi di robot sotto un’architettura unificata) e Qwen3.7-Plus (agente GUI+CLI in azione nelle interfacce). Questo cluster non è una coincidenza — riflette un consenso crescente sul fatto che la prossima frontiera dell’IA sia l’azione nello spazio fisico, e che l’open source vi giochi un ruolo centrale. La competizione si intensifica tra modelli chiusi e aperti, soprattutto nei benchmark di robotica e di computer use.

La governance e la sicurezza IA entrano nel diritto positivo. La pubblicazione del Frontier Governance Framework di OpenAI, allineato alla TFAIA californiana e all’EU AI Act, e quella della guida alle valutazioni terze segnano una tappa: le grandi aziende di IA non definiscono più le loro regole solo internamente. Le allineano a legislazioni concrete e pubblicano le loro metodologie di valutazione. L’iniziativa Rosalind Biodefense illustra l’altra faccia di questa governance — mettere l’IA di frontiera al servizio della difesa sociale (preparazione alle pandemie, biosicurezza), con controlli adeguati.

Gli strumenti per sviluppatori accelerano e si frammentano. Claude Code riceve cinque versioni in quattro giorni, tra cui l’Auto Mode su Bedrock/Vertex/Foundry e il caricamento automatico dei plugin locali. Gemini CLI v0.44.0 unifica la sua modalità Auto ed estende le integrazioni IDE. GitHub Copilot affina la sua tassonomia di adozione (4 fasi, finestra di 28 giorni) per aiutare le organizzazioni a misurare la reale maturità della loro adozione IA. Gli sviluppatori dispongono ormai di uno stack agentico denso e in rapida evoluzione — la questione non è più l’accesso ai modelli, ma la capacità dei team di integrare questi strumenti nei propri flussi di lavoro in modo coerente e misurabile.