Cerca

GLM-5.2 open-source MIT, Qwen-Robot Suite e NVIDIA Blackwell dominano MLPerf: il 16 giugno 2026 nell’IA

GLM-5.2 open-source MIT, Qwen-Robot Suite e NVIDIA Blackwell dominano MLPerf: il 16 giugno 2026 nell’IA

ai-powered-markdown-translator

Articolo tradotto dal fr verso l’it con gpt-5.4-mini.

Vedi progetto su GitHub ↗

16 giugno 2026 — Z.ai pubblica i pesi open-source MIT di GLM-5.2 (finestra da 1M token, due livelli di ragionamento), Alibaba Qwen svela la Qwen-Robot Suite composta da tre modelli fondamentali per la robotica, NVIDIA Blackwell domina l’interezza dei benchmark MLPerf Training 6.0 — incluso DeepSeek-V3 671B addestrato in 2,02 minuti su 8 192 GPU. GitHub annuncia la disponibilità generale (general availability) a pagamento di Code Quality il 20 luglio a $10 per sviluppatore attivo al mese, il June Pixel Drop porta Gemini Omni video e la generazione musicale sui dispositivi Pixel, e la ricerca economica di Anthropic quantifica per la prima volta l’impatto dell’esperienza di dominio su Claude Code.


Z.ai GLM-5.2 — pesi open-source MIT disponibili

16 giugno — Z.ai (ex Zhipu AI) pubblica ufficialmente i pesi open-source di GLM-5.2 sotto licenza MIT, concretizzando l’annuncio del 13 giugno. I pesi sono ora disponibili per il download sulla piattaforma dell’azienda.

“Introducing GLM-5.2: Frontier Intelligence, Open Weights

  • Significant improvements in coding and agentic tasks
  • Strong long-horizon capabilities with a 1M context window
  • Two levels of reasoning effort: GLM-5.2 (max) pushes the limits, while GLM-5.2 (high) strikes a strong balance”

🇮🇹 Presentazione di GLM-5.2: intelligenza di frontiera, pesi aperti. Miglioramenti significativi nelle attività di coding e agentiche. Capacità robuste sulle sequenze lunghe con una finestra di contesto da 1 milione di token. Due livelli di sforzo di ragionamento: GLM-5.2 (max) spinge oltre i limiti, mentre GLM-5.2 (high) offre un solido equilibrio.@Zai_org su X

Punti chiave di GLM-5.2:

  • Miglioramenti significativi nelle attività di coding (coding) e agentiche
  • Finestra di contesto da 1 milione di token — utile per agenti di coding su larga scala e per l’elaborazione di documenti lunghi
  • Due livelli complementari di sforzo di ragionamento
  • Supera GLM-5.1 nel coding, nell’uso degli strumenti e nel ragionamento
  • Disponibile tramite chat.z.ai
VarianteRagionamentoContestoLicenza
GLM-5.2 (max)Prestazioni massime1M tokensMIT open-source
GLM-5.2 (high)Forte equilibrio prestazioni/velocità1M tokensMIT open-source

La licenza MIT è il marcatore più importante: autorizza l’uso commerciale senza restrizioni, rendendo GLM-5.2 direttamente utilizzabile dalle aziende che non possono o non vogliono dipendere da modelli proprietari americani. Il tweet ha raggiunto 515 000 visualizzazioni in poche ore — un segnale forte dell’interesse della comunità per i modelli open-source di frontiera con grandi finestre di contesto.

🔗 Blog Z.ai — GLM-5.2


Qwen-Robot Suite — tre modelli fondamentali per la robotica incarnata

16 giugno — Alibaba Qwen annuncia la Qwen-Robot Suite, una pila completa per l’intelligenza incarnata (embodied intelligence) composta da tre modelli fondamentali distinti e complementari: navigazione, manipolazione e modello del mondo.

Qwen-RobotNav — specialista della navigazione mobile:

  • Unifica 5 attività in un unico modello: follow di istruzioni, navigazione verso un punto obiettivo (point-goal), navigazione verso un oggetto obiettivo (object-goal), tracking di oggetti e guida autonoma
  • Protocollo di osservazione controllabile
  • Interfaccia tool per sistemi agentici

Qwen-RobotManip — specialista della manipolazione:

  • Spazio stato-azione unificato per robot eterogenei
  • Pose delta nel frame della camera per un apprendimento coerente tra diversi corpi robotici (cross-embodiment)
  • Pre-addestrato su un corpus open-source di oltre 38 100 ore

Qwen-RobotWorld — modello del mondo fisico:

  • Un unico modello che copre più di 20 tipi di corpi robotici
  • Interfaccia d’azione in linguaggio naturale
  • Prevede futuri fisicamente ancorati per la manipolazione, la guida e la navigazione

Ogni modello è utilizzabile indipendentemente e può essere composto come uno strumento del mondo fisico. Insieme, formano la cassetta degli attrezzi a basso livello per sistemi agentici a vocazione generalista.

ModelloSpecialitàDato chiave
Qwen-RobotNavNavigazione multi-attività (5 attività unificate)Interfaccia tool per sistemi agentici
Qwen-RobotManipManipolazione robotica cross-embodimentCorpus open-source 38 100+ ore
Qwen-RobotWorldModello del mondo fisico20+ tipi di corpi robotici

🔗 Qwen-Robot Suite — annuncio


NVIDIA Blackwell domina MLPerf Training 6.0 — clean sweep

16 giugno — NVIDIA ha vinto l’integralità dei benchmark MLPerf Training 6.0, il riferimento industriale per l’addestramento IA stabilito dal consorzio MLCommons. È l’unica piattaforma ad aver presentato risultati su ogni test, inclusi i due nuovi benchmark introdotti in questa edizione: DeepSeek-V3 (671 miliardi di parametri, architettura MoE) e GPT-OSS-20B.

Le prestazioni del sistema GB300 NVL72 (72 GPU Blackwell Ultra interconnesse) sono notevoli:

ModelloPiattaformaGPUTempo
DeepSeek-V3 671B (MoE)GB300 NVL728 1922,02 min
GPT-OSS 20B (MoE)GB300 NVL725127,43 min
Llama 3.1 405BGB200 NVL728 1927,07 min
Llama 3.1 8BGB200 NVL721 0244,46 min
Llama 2 70B LoRAGB300 NVL725120,40 min
FLUX.1 (generazione di immagini)GB300 NVL7251217,1 min
DLRM-dcnv2GB300 NVL72640,67 min

L’inclusione di FLUX.1 (modello di generazione di immagini di Black Forest Labs) nei benchmark ufficiali è notevole: conferma che l’infrastruttura Blackwell è il punto di riferimento per addestrare i modelli di generazione di immagini più avanzati.

Sul piano software, NVIDIA ha distribuito diverse innovazioni nello stack NeMo 26.06: grafi CUDA a iterazione completa per i MoE, fusioni di kernel tramite CuTe DSL, precisione MXFP8 per il blocco di attenzione e ottimizzazioni del router MoE (accelerazione del kernel 5×). Questi miglioramenti software hanno permesso un guadagno di 1,3× nel throughput DeepSeek-V3 in tre mesi senza modifiche all’hardware, passando da 1 298 a 1 648 TFLOPS/GPU — un promemoria che le prestazioni hardware sono solo una parte dell’equazione.

🔗 NVIDIA — MLPerf Training 6.0


June Pixel Drop 2026 — Gemini Omni video, generazione musicale, Daily Brief

16 giugno — Il June Pixel Drop 2026 introduce diverse funzionalità principali che integrano Gemini direttamente nei dispositivi Pixel, con il rollout graduale che inizierà nelle prossime settimane.

Gemini Omni — creazione e modifica video IA: basta dialogare naturalmente con Gemini per mescolare testo, immagini e video. Possibilità di partire da zero, remixare contenuti della galleria, usare modelli predefiniti o persino creare un avatar IA personalizzato nell’immagine e nella voce dell’utente.

Generazione musicale in Gemini: l’utente descrive un’idea o importa una foto, trasformata in una traccia audio originale con testo. Stile, voce e tempo sono personalizzabili dal menu Strumenti → “Crea musica” dell’app Gemini.

Daily Brief — agente mattutino IA: disponibile per tutti gli abbonati Google AI Plus, Pro e Ultra (18+, al momento solo Stati Uniti). Questo agente organizza la giornata dell’utente prima ancora del suo risveglio. Voice Translate, che traduce le chiamate in tempo reale, si estende a Pixel 10a (7 lingue tra cui il francese).

FunzionalitàDisponibilitàNote
Gemini Omni videoPixel (rollout graduale)Creazione/remix via conversazione
Generazione musicalePixel (app Gemini)Audio + testo, personalizzabile
Daily BriefGoogle AI Plus/Pro/Ultra, 18+, Stati UnitiAgente mattutino IA
Voice TranslatePixel 10a7 lingue + hindi in anteprima
Edit with Ask PhotosUK, Germania, Francia, Spagna, ItaliaEditing foto via conversazione

🔗 June Pixel Drop 2026 — blog ufficiale Google


GitHub Code Quality — disponibilità generale il 20 luglio, $10 per sviluppatore attivo

16 giugno — GitHub annuncia che GitHub Code Quality passerà dalla preview pubblica alla disponibilità generale (general availability) il 20 luglio 2026, come prodotto a pagamento. Oltre 10 000 aziende hanno partecipato alla preview.

Prezzi al 20 luglio:

ComponentePrezzo
Licenza per sviluppatore attivo (committer)$10 / sviluppatore attivo / mese
Funzionalità IA (Copilot code review, rilevamento IA, Copilot Autofix)Fatturazione a consumo
Analisi deterministica CodeQLMinuti GitHub Actions

Nuove funzionalità disponibili già al GA:

  • Deployment su scala organizzativa (un unico toggle admin)
  • Dashboard qualità a livello di organizzazione
  • Applicazione della copertura del codice tramite i set di regole (rulesets)
  • Punteggio di qualità per repository e per organizzazione
  • API per l’attivazione e la gestione dei risultati

Disponibilità: solo GitHub Enterprise Cloud e GitHub Team. Non disponibile su GitHub Enterprise Server. I clienti che desiderano disattivare prima della fatturazione possono disabilitare Code Quality sui propri repository prima del 20 luglio.

🔗 GitHub Code Quality — annuncio GA


Ricerca economica Anthropic — l’esperienza di dominio prevale sulla padronanza del codice

16 giugno — Anthropic pubblica uno studio economico sull’uso di Claude Code, basato sull’analisi confidenziale di circa 400 000 sessioni tra ottobre 2025 e aprile 2026. Primi risultati quantificati su come l’esperienza determini il successo con un agente di coding IA.

Risultati chiave dello studio (autori: Zoe Hitzig, Maxim Massenkoff, Eva Lyubich, Ryan Heller, Peter McCrory):

IndicatoreValore
Sessioni analizzate~400 000
Utenti distinti~235 000
Periodo copertoOtt 2025 – Apr 2026
Decisioni di pianificazione (utente)~70 %
Decisioni di esecuzione (Claude)~80 %
Aumento medio del valore economico delle attività+25 %
Tasso di successo verificato (esperto di dominio)28–33 %
Tasso di successo verificato (principiante)15 %
Quota sessioni di debug ott → apr33 % → 19 %

Conclusione centrale: in una sessione tipica, l’utente prende ~70 % delle decisioni di pianificazione (cosa fare) mentre Claude prende ~80 % delle decisioni di esecuzione (come farlo). Gli esperti di dominio — non necessariamente sviluppatori — guidano Claude verso catene di azioni due volte più lunghe con cinque volte più contenuto per istruzione. Il tasso di successo delle professioni non tecniche (giuristi, manager, scienziati) si colloca a meno di 7 punti percentuali dagli ingegneri software. È la comprensione del problema di business, e non la padronanza del codice, a determinare il successo.

🔗 Ricerca economica Anthropic — Claude Code


Anthropic e OpenAI — agenti in produzione e deployment Europa

Claude Managed Agents — guida alla messa in produzione

16 giugno — Il team Applied AI di Anthropic pubblica una guida pratica sulla messa in produzione degli agenti con Claude Managed Agents. Il post spiega l’evoluzione delle superfici di interazione: dal chatbot classico verso agenti autonomi pianificati, persistenti, con accesso a ambienti di esecuzione (stateful runtime environments). Due funzionalità disponibili dal 9 giugno: esecuzione di agenti su pianificazione definita e archiviazione di variabili d’ambiente in caveau (vaults).

🔗 Building with Claude Managed Agents

Claude Code v2.1.178 — permessi granulari e skills annidate

15 giugno — Claude Code v2.1.178 introduce la sintassi Tool(param:value) per le regole di autorizzazione — per esempio Agent(model:opus) per bloccare i sotto-agenti Opus. Le skills nelle directory .claude/skills/ annidate vengono caricate automaticamente quando si lavora in quelle cartelle. L’auto mode valuta ora i lanci di sotto-agenti tramite il classificatore prima dell’avvio, chiudendo una falla in cui un sotto-agente poteva richiedere un’azione bloccata senza revisione preliminare.

🔗 Claude Code v2.1.178

App Codex nell’EEE, UK e Svizzera — Computer Use, Memories, Chronicle

16 giugno — OpenAI distribuisce quattro funzionalità avanzate di Codex nello Spazio economico europeo (SEE), nel Regno Unito e in Svizzera: Computer Use (macOS + Windows), l’estensione Chrome di Codex, Memories e Chronicle.

Computer Use consente a Codex di interagire con le applicazioni desktop — vedere, cliccare, inserire testo. L’estensione Chrome permette di eseguire attività che richiedono un contesto browser connesso, lavorando su più schede in background. Memories memorizza le preferenze e le convenzioni di repository ricorrenti, ma è disattivata per impostazione predefinita nelle tre regioni per conformità normativa. Chronicle, anteprima opt-in riservata agli abbonati Pro su macOS, aiuta Codex a costruire ricordi dal contesto recente dello schermo. Queste funzionalità erano già disponibili per gli utenti Enterprise fuori da SEE/UK/CH.

🔗 OpenAI — deployment Codex SEE/UK/Svizzera

Simulazione di deployment OpenAI — prevedere il comportamento prima del rilascio

16 giugno — OpenAI pubblica il suo metodo Deployment Simulation (Simulazione di deployment): riprodurre vere conversazioni anonimizzate provenienti da deployment precedenti con un modello candidato, per individuare i comportamenti indesiderati prima della messa in produzione. Testato sui deployment GPT-5-series Thinking (~1,3 milioni di conversazioni), l’errore mediano di previsione è di 1,5×, nettamente migliore delle valutazioni sintetiche. Il metodo ha permesso di rilevare il “calculator hacking” (una forma di deriva (reward hacking)) prima del rilascio di GPT-5.1.

🔗 Deployment Simulation — OpenAI

Codex CLI 0.140.0 — /usage, /import da Claude Code, autenticazione Bedrock

15 giugno — La versione 0.140.0 del Codex CLI introduce diverse funzionalità sostanziali. /usage mostra le attività token giornaliere, settimanali e cumulative dell’account. /import consente di importare selettivamente configurazione, impostazioni del progetto e conversazioni recenti da Claude Code — un’interoperabilità diretta tra due strumenti concorrenti. codex delete elimina definitivamente una sessione con conferma di sicurezza e pulizia dei sotto-agenti associati. L’autenticazione gestita Amazon Bedrock memorizza le chiavi API in modo cifrato localmente e copre anche le credenziali OAuth MCP. In parallelo, correzioni di affidabilità MCP (nuovi tentativi sui bootstrap transitori) e recupero automatico dei database SQLite corrotti.

🔗 Codex CLI 0.140.0 — release GitHub


Meta AI — Modalità AI su Facebook con Muse Spark

16 giugno — Meta distribuisce nuovi strumenti di intelligenza artificiale su Facebook. AI Mode è una nuova modalità di ricerca alimentata da Meta AI (basata su Muse Spark) che ancorа le proprie risposte a ciò che gli utenti dicono pubblicamente sulle app Meta — Gruppi, Reels — offrendo prospettive contestualizzate invece di risultati generici. Accessibile dal feed o dalla ricerca.

Nuovi strumenti creativi: suggerimenti di condivisione dalla galleria con modelli di collage (cutout templates), effetti di transizione video, preimpostazioni foto (photo presets) che consentono di modificare virtualmente vestiti e acconciatura, e l’opzione “Wear It” per indossare virtualmente una maglia sportiva nelle Stories. Tutte queste funzionalità sono opt-in e disattivabili.

🔗 Meta — nuovi strumenti IA su Facebook


NVIDIA SpatialClaw — agente di ragionamento spaziale senza training

16 giugno — NVIDIA Research pubblica SpatialClaw, un agente di ragionamento spaziale visivo training-free (senza training aggiuntivo). Anziché chiamare un insieme fisso di strumenti predefiniti, l’agente scrive direttamente Python in un kernel persistente, componendo dinamicamente moduli di percezione e rivedendo la propria strategia nel corso delle fasi. Gli output diventano variabili Python riutilizzabili con NumPy e SciPy.

Risultati: +11,2 punti su 20 benchmark di ragionamento spaziale visivo rispetto a un precedente agente recente, in modo coerente su 6 diverse architetture di modelli, senza tuning specifico per un benchmark.

🔗 SpatialClaw — @NVIDIAAI sur X


Cohere — afflusso di richieste dopo la restrizione USA su Anthropic

15 giugno — Cohere, azienda canadese di IA generativa, segnala di ricevere un numero elevato di richieste in arrivo (inbounds) da aziende in cerca di alternative a seguito della direttiva USA che limita l’accesso ad Anthropic (coperta il 13 giugno). L’azienda ha risposto con umorismo citando il tweet di Polymarket: “The world needs more Canada 🇨🇦”. Il tweet ha raggiunto 56.000 visualizzazioni, 797 like. Questo posizionamento conferma che la direttiva americana crea un’opportunità commerciale diretta per i fornitori sovrani non americani.

🔗 Cohere — tweet


GitHub Models ritirato per i nuovi clienti

16 giugno — GitHub annuncia il ritiro graduale di GitHub Models. A partire dal 16 giugno, i nuovi clienti (organizzazioni e aziende senza uso preesistente) non hanno più accesso al servizio, né nei piani gratuiti né in quelli a pagamento. I clienti esistenti con un uso attivo non sono al momento impattati e possono continuare a utilizzare il playground, l’API e i modelli disponibili. GitHub precisa che comunicherà in seguito le tempistiche dettagliate della chiusura completa. Per i nuovi progetti che richiedono accesso ai modelli di IA, GitHub indirizza verso Azure AI Foundry, che offre un catalogo esteso di modelli.

🔗 GitHub Models retirement


Brevi

  • Claude Code v2.1.179 — 9 correzioni di stabilità (16 giugno) : disconnessioni durante il flusso (mid-stream) preservate, scorrimento con la rotella corretto in WSL2 su Windows Terminal e VS Code (regressione da v2.1.172), correzione sandbox Linux su grandi alberi di directory. 🔗 v2.1.179

  • Gemini Trusted Tester Program — iscrizioni aperte : Google apre un numero limitato di posti per power user che desiderano testare funzionalità Gemini inedite prima del lancio pubblico. 🔗 Iscrizione

  • Gemini — microfono multilingue 70+ lingue (Android e iOS) : l’icona del microfono supporta ora più di 70 lingue con mix libero senza cambiare impostazioni. Annuncio tramite @joshwoodward (Director of Product, Gemini App).

  • GitHub Code Quality — attivazione organizzazione in un clic (16 giugno) : gli admin dell’organizzazione possono attivare o disattivare Code Quality su tutti i loro repository con un solo toggle nelle impostazioni di sicurezza. 🔗 Changelog

  • Copilot usage metrics — arricchimento tramite telemetria server (15 giugno) : i report di utilizzo di Copilot Enterprise integrano ora gli utenti attivi rilevati lato server (oltre alla telemetria client), migliorando la copertura dei DAU nei report giornalieri e su 28 giorni. 🔗 Changelog

  • Manus — coda di messaggi durante l’esecuzione (16 giugno) : Manus consente ora di mettere in coda messaggi da inviare all’agente mentre un’attività è in corso. I messaggi vengono elaborati in ordine alla fine dell’attività corrente. 🔗 Annuncio

  • ChatGPT iOS 1.2026.160 (15 giugno) : esploratore di file workspace, selettore di cartelle, controlli diff, approvazione MCP via chat o globale, e rendering LaTeX nei messaggi e nei piani Codex.


Cosa significa

L’apertura dei pesi MIT di GLM-5.2 e i tre modelli robotici Qwen-Robot Suite illustrano l’accelerazione dell’offerta open-source cinese nei segmenti in cui gli attori americani restano in gran parte proprietari. GLM-5.2 con la sua finestra da 1M token sotto licenza MIT si colloca direttamente come concorrente dei modelli commerciali per le aziende che cercano un’alternativa sovrana — precisamente il segmento che la direttiva USA che limita Anthropic ha reso strategicamente visibile, come conferma l’afflusso di richieste segnalato da Cohere. La robotica è il prossimo terreno di questa competizione: Qwen-Robot Suite propone uno stack completo navigation-manipulation-world model, mentre SpatialClaw di NVIDIA Research dimostra che un ragionamento spaziale avanzato può essere raggiunto senza fine-tuning — due approcci complementari che delineano l’architettura dei sistemi robotici agentici di prossima generazione.

Sul fronte hardware, i risultati di MLPerf Training 6.0 confermano la dominanza dell’architettura Blackwell su scala industriale: addestrare DeepSeek-V3 (671 miliardi di parametri) in 2 minuti su 8.192 GPU non è un exploit accademico, è una vera capacità produttiva distribuita nei datacenter cloud. Il guadagno software di 1,3× nel throughput di DeepSeek-V3 in tre mesi senza cambiamenti hardware ricorda che la corsa alle prestazioni IA è tanto una competizione di stack software (NeMo, CuTe DSL, MXFP8) quanto di chip — una dinamica che amplifica le posizioni già dominanti.

La ricerca economica di Anthropic su Claude Code offre un importante spunto controintuitivo: l’esperienza nel dominio professionale (diritto, management, scienze) determina il successo con un agente di coding quasi quanto la padronanza del codice stesso. I tassi di successo verificati mostrano un divario di soli 7 punti tra gli ingegneri e i non sviluppatori esperti nel proprio settore. È un’informazione strutturante per i team di prodotto: il target degli strumenti di coding IA non è più soltanto quello degli sviluppatori, e il design delle interfacce deve tenerne conto.

Sul fronte degli strumenti per sviluppatori, la giornata del 16 giugno concentra diversi segnali convergenti: il GA a pagamento di GitHub Code Quality ($10/sviluppatore attivo), la disponibilità di Codex con Computer Use nell’EEE/UK/Svizzera, i permessi granulari di Claude Code v2.1.178 e il metodo Deployment Simulation di OpenAI. La qualità del codice e la sicurezza dei deployment passano da temi di ricerca a prodotti fatturati — una normalizzazione che riflette la crescente maturità del mercato degli strumenti IA per i team di sviluppo.


Fonti