Cerca

Karpathy si unisce ad Anthropic, Google I/O 2026 inaugura l’era agentica Gemini 3.5, Cohere acquisisce Reliant AI

Karpathy si unisce ad Anthropic, Google I/O 2026 inaugura l’era agentica Gemini 3.5, Cohere acquisisce Reliant AI

ai-powered-markdown-translator

Articolo tradotto dal fr al it con gpt-5.4-mini.

Vedi progetto su GitHub ↗

Il 19 maggio 2026 è una giornata ricca per l’IA: Andrej Karpathy lascia la scena per unirsi ad Anthropic, Google I/O 2026 lancia una serie di annunci agentici attorno alla famiglia Gemini 3.5, xAI distribuisce Grok Skills con generazione di documenti Office, e Cohere compie un’acquisizione strategica nella biopharma. In parallelo, OpenAI rafforza la provenienza dei contenuti IA e il mondo dei media generativi si arricchisce di nuove capacità.


Andrej Karpathy si unisce ad Anthropic

19 maggio — Andrej Karpathy ha annunciato su X di essersi unito ad Anthropic. La notizia ha generato oltre 11,3 milioni di visualizzazioni, 102.000 “mi piace” e 13.000 condivisioni in poche ore — un coinvolgimento eccezionale che misura l’impatto di questo reclutamento nella comunità.

“Personal update: I’ve joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D. I remain deeply passionate about education and plan to resume my work on it in time.”

🇮🇹 Aggiornamento personale: mi sono unito ad Anthropic. Penso che i prossimi anni al confine dei LLM saranno particolarmente formativi. Sono molto entusiasta all’idea di entrare nel team e di tornare alla R&S. Rimango profondamente appassionato di educazione e prevedo di riprendere questo lavoro a tempo debito.@karpathy su X

Karpathy è una delle figure più riconosciute del settore. Il suo percorso: dottorato a Stanford, membro fondatore di OpenAI, direttore dell’IA in Tesla, poi figura indipendente con la serie didattica nanoGPT e i suoi corsi di machine learning seguiti da milioni di persone.

Il suo arrivo in Anthropic rafforza in modo significativo il team di ricerca fondamentale nel momento esatto in cui la competizione tra i laboratori di frontiera si intensifica. Ex-OpenAI che si unisce ad Anthropic — il segnale è forte sulle dinamiche dei talenti nel settore.

Anthropic non ha precisato il suo ruolo esatto. L’annuncio coincide con l’evento Code with Claude London e con diversi lanci importanti della stessa giornata.


Google I/O 2026 — L’era agentica Gemini 3.5

19 maggio — Google I/O 2026 si svolge oggi, con come tema centrale l’era Gemini agentica (agentic Gemini era). Google annuncia durante il keynote un insieme coerente di annunci che ruotano tutti attorno alla capacità di Gemini di agire in modo autonomo, proattivo e persistente.

“Three years ago, Gemini started by understanding the world. With Gemini 2, models learned to think and reason. Late last year, Gemini 3 brought any idea to life. Today, we’re continuing that journey with our Gemini 3.5 series, starting with Gemini 3.5 Flash, delivering frontier performance for agents and coding.”

🇮🇹 “Tre anni fa, Gemini ha iniziato comprendendo il mondo. Con Gemini 2, i modelli hanno imparato a pensare e ragionare. Alla fine dell’anno scorso, Gemini 3 ha dato vita a qualsiasi idea. Oggi proseguiamo questo percorso con la nostra serie Gemini 3.5, iniziando da Gemini 3.5 Flash, che offre prestazioni di punta per gli agenti e il coding.”@GoogleAI su X

Le principali novità del keynote I/O 2026:

AnnuncioCategoria
Gemini 3.5 FlashNuovo modello (agenti + coding)
Gemini OmniModello video multimodale
Gemini SparkAgente personale 24/7
Daily BriefAgente mattutino personalizzato
Neural ExpressiveNuovo design dell’app
Managed Agents APIInfrastruttura Antigravity per sviluppatori
Google AI StudioRinnovato con template per agenti

🔗 Blog di Google I/O 2026


Gemini 3.5 Flash — Velocità e intelligenza per gli agenti

19 maggioGemini 3.5 Flash è il primo modello della nuova generazione 3.5. È progettato per combinare intelligenza di frontiera (frontier intelligence) e velocità d’azione fulminea (lightning-fast action), ottimizzato in particolare per i casi d’uso agentici e di coding.

Gemini 3.5 Flash è il motore sottostante dell’agente Antigravity (Managed Agents API) e di Gemini Spark. È disponibile tramite l’API Gemini e in Google AI Studio dal 19 maggio.

GenerazioneCapacità chiave
Gemini 1Comprensione del mondo
Gemini 2Ragionamento e pensiero
Gemini 3Creazione multimodale
Gemini 3.5 FlashAgenti, coding, velocità fulminea

Il modello è inoltre disponibile in disponibilità generale (generally available) in GitHub Copilot il giorno stesso del lancio — nei piani Pro, Pro+, Business ed Enterprise. GitHub riporta prestazioni vicine al livello Pro con la velocità Flash, con un uso efficace degli strumenti, tempi di risposta rapidi e un’elevata efficienza della cache. La distribuzione è graduale; gli amministratori di Copilot Enterprise e Business devono attivare la policy Gemini 3.5 Flash nelle impostazioni.

Attributo CopilotValore
Piani interessatiPro, Pro+, Business, Enterprise
IDE supportatiVS Code, Visual Studio, JetBrains, Xcode, Eclipse, GitHub Mobile
Moltiplicatore premium14× (provvisorio, soggetto a evoluzione)

🔗 Annuncio GitHub Copilot


Gemini Omni — Creare qualsiasi cosa da qualsiasi cosa

19 maggio — Google DeepMind lancia Gemini Omni, presentato come “il primo passo verso un modello capace di creare qualsiasi cosa da qualsiasi cosa — iniziando dal video”. Combina l’intelligenza di Gemini con i sistemi di media generativi di Google (Veo, Imagen).

“We’re dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video. It combines Gemini’s intelligence with our generative media systems - representing a leap forward in world understanding, multimodality, and editing.”

🇮🇹 “Lanciamo Gemini Omni: il nostro primo passo verso un modello capace di creare qualsiasi cosa da qualsiasi cosa — iniziando dal video. Combina l’intelligenza di Gemini con i nostri sistemi di media generativi, rappresentando un salto in avanti nella comprensione del mondo, nella multimodalità e nell’editing.”@GoogleDeepMind su X

Nell’app Gemini, Gemini Omni consente la generazione di video cinematografici di alta qualità a partire da testo, immagini o video esistenti, l’editing video tramite conversazione naturale (zoom cinematografici, cambi di sfondo con un semplice prompt), la creazione di avatar IA personalizzati simili all’utente e l’applicazione con un tap di template integrati.

Disponibilità: distribuzione progressiva dal 19 maggio per gli abbonati Google AI Plus, Pro e Ultra in tutto il mondo.


Gemini Spark — Agente personale 24/7

19 maggio — Google annuncia Gemini Spark, un agente IA personale disponibile 24 ore su 24, 7 giorni su 7. È un cambiamento fondamentale nella natura di Gemini: passa da assistente reattivo a partner attivo che lavora in background anche quando l’utente chiude il dispositivo (architettura cloud).

Spark funziona su Gemini 3.5 Flash tramite l’infrastruttura Antigravity. È profondamente integrato negli strumenti Workspace (Gmail, Docs, Slides, Calendar).

CapacitàDettaglio
Attività ricorrentiTrigger automatici (es. analizzare i rendiconti mensili)
Apprendimento di competenzeSu istruzione dell’utente
Workflow completiSintesi riunione → Google Doc → email di follow-up
Connessioni MCPCanva, OpenTable, Instacart al lancio
Controllo utenteConferma richiesta prima delle azioni ad alto impatto

Disponibilità: test in affidabilità questa settimana; beta per gli abbonati Google AI Ultra negli Stati Uniti la settimana successiva. Arrivo nell’app macOS Gemini previsto per l’estate 2026.


Managed Agents nell’API Gemini — Infrastruttura Antigravity aperta

19 maggio — Google lancia i Managed Agents nell’API Gemini, consentendo agli sviluppatori di distribuire agenti con una sola riga di codice in un ambiente Linux isolato ed effimero. L’infrastruttura è alimentata dall’agente Antigravity, costruito su Gemini 3.5 Flash.

Si tratta dell’apertura dell’infrastruttura interna di agenti di Google agli sviluppatori esterni. Il primo agente gestito era Deep Research (dicembre 2025); ora gli sviluppatori possono crearne di propri.

Funzionalità sviluppatoreDettaglio
DistribuzioneUna sola chiamata API — ambiente Linux remoto
CapacitàNavigazione web, esecuzione del codice, gestione file
PersonalizzazioneFile AGENTS.md e SKILL.md
Sessioni persistentiRipresa completa dello stato
Agenti riutilizzabiliRegistrazione tramite client.agents.create()
EnterpriseGemini Enterprise Agent Platform (anteprima privata)

Disponibilità: anteprima nell’API Gemini dal 19 maggio sera; template in Google AI Studio.

🔗 Annuncio Managed Agents API


Claude Managed Agents — Sandbox auto-ospitate e tunnel MCP

19 maggio — In occasione dell’evento Code with Claude London, Anthropic ha lanciato due nuove funzionalità importanti per Claude Managed Agents.

Self-hosted sandboxes (beta pubblica) — Gli agenti Claude possono ora essere eseguiti in sandbox ospitati sull’infrastruttura del cliente. I team mantengono file sensibili, pacchetti e servizi nel proprio perimetro, con politiche di rete, log di audit e strumenti di sicurezza già in atto.

MCP tunnels (anteprima di ricerca) — Gli agenti possono raggiungere server MCP situati in una rete privata senza esporli pubblicamente. I tunnel MCP sono gestiti dalla Claude Console e supportati sia in Managed Agents sia nella Messages API.

FunzionalitàStatoFornitori
Self-hosted sandboxesBeta pubblicaCloudflare, Daytona, Modal, Vercel
MCP tunnelsAnteprima di ricerca (accesso su richiesta)Tramite Claude Console

🔗 Annuncio Claude Managed Agents


Grok Skills — Competenza persistente e documenti Office

18 maggio — xAI ha lanciato Skills per Grok 4.3, una funzionalità di memoria persistente che consente a Grok di apprendere preferenze, regole di formattazione e fasi di workflow una sola volta, per poi applicarle in tutte le conversazioni successive.

“I’m leveling up my Skills. Automate your workflows and get things done in record time with prebuilt and custom Skills.”

🇮🇹 “Sto migliorando le mie competenze grazie agli Skills. Automatizzate i vostri workflow e portate a termine i vostri compiti a velocità record con Skills predefiniti e personalizzati.”@grok su X

Tipo di documentoCapacità
Word (.docx)Creazione ed editing con formattazione completa (titoli, tabelle, elenchi puntati)
PowerPointDiapositive con gerarchia visiva e note del relatore
ExcelFormule, sezioni colorate, struttura chiara
PDFCreazione, unione, suddivisione ed estrazione
Skill CreatorCreazione di nuovi skills personalizzati tramite conversazione

Gli Skills sono disponibili su grok.com, iOS e Android. Gli skills personalizzati dell’utente hanno sempre la priorità rispetto agli skills integrati predefiniti.

🔗 Annuncio Grok Skills


Cohere acquisisce Reliant AI — IA sovrana per la biopharma

19 maggio — Cohere annuncia l’acquisizione di Reliant AI, un’azienda specializzata in IA per la biopharma, con uffici a Montréal e Berlino. Questa operazione rafforza la strategia di IA sovrana (sovereign AI) di Cohere nei settori della salute e delle scienze della vita.

“Healthcare represents one of the most consequential opportunities for AI and it demands secure, sovereign, and domain-specific systems.”

🇮🇹 La sanità rappresenta una delle opportunità più importanti per l’IA e richiede sistemi sicuri, sovrani e specifici per il dominio. — Aidan Gomez, Co-Founder & CEO, Cohere

Contributi dell’acquisizione:

ElementoDettaglio
TeamRicercatori di alto livello specializzati in biopharma
DatiBasi di dati biomediche proprietarie
TecnologiaBanco di ricerca intelligente (intelligent research workbench)
Clienti trasferitiGSK, Medicus Pharma, Kyowa Kirin

Nuovo prodotto: North for Pharma — Cohere annuncia lo sviluppo di un sistema IA agentico progettato per i team biopharma che lavorano su R&S, sviluppo clinico e analisi scientifica. Estende la suite “North” già proposta per i settori finanziario e telecom.

Karl Moritz Hermann (ex CEO di Reliant AI) diventa VP of AI Verticalizations a Berlino. Marc Bellemare (co-fondatore, Canada CIFAR AI Chair, Mila) diventa VP of Modelling a Montréal.

🔗 Annuncio Cohere


KPMG × Anthropic — Alleanza globale (276.000 dipendenti, 138 paesi)

19 maggio — KPMG, uno dei più grandi studi di servizi professionali al mondo, ha annunciato un’alleanza strategica globale con Anthropic. Lo studio integra Claude nella sua piattaforma Digital Gateway e dà accesso a Claude all’intero organico di oltre 276.000 dipendenti in 138 paesi.

I punti principali: Claude Cowork e Managed Agents integrati in Digital Gateway, nuovi strumenti per i clienti in ambito fiscale e legale, KPMG diventa partner privilegiato di Anthropic per i fondi di private equity, e i team KPMG usano Claude Code (tramite KPMG Blaze) per modernizzare sistemi informatici obsoleti.

“Building an AI agent to help clients adjust to changing tax regulations used to take weeks and required teams to switch between multiple tools and chat windows. With Cowork and Managed Agents integrated in Digital Gateway, that same capability takes minutes.”

🇮🇹 Creare un agente IA per aiutare i clienti ad adattarsi all’evoluzione delle normative fiscali richiedeva in passato settimane e implicava destreggiarsi tra più strumenti. Con Cowork e Managed Agents integrati in Digital Gateway, la stessa capacità richiede ora pochi minuti. — Rema Serafi, Vicepresidente Fiscalità, KPMG US

Questo rollout si basa su due anni di adozione interna presso KPMG negli Stati Uniti.

🔗 Annuncio Anthropic × KPMG


Gemini App — Neural Expressive e Daily Brief

19 maggio — L’app Gemini riceve due importanti novità.

Neural Expressive è un nuovo linguaggio di design per l’era dell’IA: animazioni fluide, colori vividi, nuova tipografia, feedback aptico. L’esperienza Gemini Live (conversazione vocale) è ora integrata direttamente nell’interfaccia principale — passaggio trasparente tra digitazione e conversazione. Distribuzione globale dal 19 maggio su web, Android e iOS per tutti gli utenti.

Daily Brief è un agente che genera ogni mattina un riepilogo personalizzato basato su Gmail, Calendar e sulle priorità dell’utente. Va oltre un semplice riassunto: organizza, dà priorità e suggerisce prossime azioni concrete. Distribuzione progressiva per gli abbonati Plus, Pro e Ultra, a partire dagli Stati Uniti.


OpenAI — C2PA, SynthID e strumento di verifica pubblico

19 maggio — OpenAI annuncia un approccio multilivello per la provenienza dei contenuti generati dall’IA, combinando tre meccanismi complementari.

MeccanismoAmbitoResistenza alle modifiche
Metadati C2PAImmagini, audio, videoMedia (rimovibile)
Watermark SynthID (Google DeepMind)Solo immaginiAlta
Strumento openai.com/verifyContenuti generati da OpenAIN/D

OpenAI integra ora il watermark digitale invisibile SynthID di Google DeepMind in tutte le immagini generate tramite ChatGPT, Codex e l’API OpenAI. SynthID codifica l’origine direttamente nei pixel dell’immagine in modo impercettibile e resiste alla maggior parte delle modifiche comuni (ritaglio, filtri, compressione). Lo strumento pubblico openai.com/verify consente a chiunque di caricare un’immagine per rilevare la presenza di un watermark SynthID — per il momento in anteprima limitata ai contenuti OpenAI.

🔗 Annuncio OpenAI


NVIDIA Sana WM — World Model su GPU singola

19 maggio — NVIDIA AI presenta Sana WM (World Model). A partire da una singola immagine, una descrizione testuale e una traiettoria della camera, il modello genera video coerenti e controllabili — tutto su una sola GPU.

L’architettura si basa su quattro innovazioni: Hybrid Linear Attention, Dual-Branch Camera Control, Two-Stage Generation Pipeline e Robust Annotation Pipeline. Il progetto è completamente open source (paper + codice + modello).

🔗 Annuncio NVIDIA AI


Wan2.7-Image — Controllo della palette di colori

19 maggio — Alibaba annuncia il controllo della palette di colori (Palette Control) per Wan2.7-Image. La funzione permette di estrarre la palette cromatica di qualsiasi immagine — come un capolavoro artistico — e di applicarla a una nuova creazione. Disponibile direttamente su wan.video. L’annuncio ha generato 529 742 visualizzazioni su X.

🔗 Annuncio Alibaba Wan


ElevenLabs — Voce di Albert Einstein per l’insegnamento

19 maggio — ElevenLabs annuncia l’introduzione della voce ricreata di Albert Einstein nella sua piattaforma, sotto forma di un agente conversazionale dedicato all’insegnamento. L’agente mostra come l’IA vocale possa rendere l’apprendimento più interattivo, accessibile e multilingue. Una dimostrazione è disponibile su start.elevenlabs.io. Gli insegnanti possono accedere gratuitamente al piano Pro tramite il programma Impact.

In parallelo, ElevenLabs annuncia un pilota in Polonia: distribuzione di agenti vocali nei servizi pubblici sanitari (NFZ) quest’estate.

🔗 Annuncio ElevenLabs


xAI Grok integrato in OpenClaw — Agente locale open-source multi-messaggistica

19 maggio — xAI annuncia l’integrazione di Grok in OpenClaw, un agente personale open-source e local-first (local-first). Gli abbonati Grok e X Premium possono ora usare Grok in OpenClaw, che funziona su qualsiasi hardware (Mac Mini, laptop, Raspberry Pi) e si connette a WhatsApp, Telegram, Slack, Discord, Signal e iMessage.

🔗 Annuncio xAI


Z.ai GLM-5.1 — N°1 open-source SWE-Bench Pro, MIT, contesto 200K

18 maggio — Z.ai (Zhipu AI) rende disponibile GLM-5.1 su OrcaRouter. Il modello rivendica il primo posto tra i modelli open-source su SWE-Bench Pro (benchmark per la correzione di codice in condizioni reali), superando persino alcuni modelli proprietari. Licenza MIT, contesto da 200K token, progettato per il coding agentico a lungo raggio (long-horizon agentic coding).

🔗 Annuncio OrcaRouter


Brevi

  • The Problem Solvers (Anthropic) — Nuova serie video che mette in scena fondatori che costruiscono con Claude. Primi episodi: Scott Wu (Cognition/Devin) e Kay Zhu (Genspark). 🔗 claude.com/problem-solvers

  • Manus × Higgsfield (connettore MCP) — Manus integra Higgsfield tramite MCP per offrire ai creatori un controllo professionale sulla generazione di immagini/video all’interno dei loro workflow. 🔗 manus.im/blog

  • OpenAI Guaranteed Capacity — Nuova offerta che consente alle aziende di prenotare l’accesso alle risorse di calcolo di OpenAI tramite impegni da 1 a 3 anni, con sconti crescenti in base alla durata. 🔗 openai.com

  • Perplexity Computer — Rho — Rho ha ridotto del 90% il tempo della riunione settimanale e risparmiato 120 ore in 12 settimane grazie a Perplexity Computer, che monitora Slack, Notion, Jira, Figma e Google Docs. 🔗 Perplexity su X


Cosa significa

La convergenza dei Managed Agents. Google e Anthropic annunciano lo stesso giorno, quasi alla stessa ora, un’infrastruttura simile con lo stesso nome: Managed Agents. In Google, si tratta di Antigravity aperto tramite l’API Gemini — basta una chiamata per distribuire un agente in un sandbox Linux isolato. In Anthropic, si tratta dei sandbox self-hosted (Cloudflare, Daytona, Modal, Vercel) e dei tunnel MCP per le reti private. Questa convergenza non è un caso: segna l’emergere di un nuovo livello di infrastruttura IA standardizzata, tra il modello grezzo e l’applicazione finale.

L’IA enterprise si struttura attorno alla sovranità. L’acquisizione di Reliant AI da parte di Cohere, l’alleanza KPMG-Anthropic con Claude in Digital Gateway e l’offerta OpenAI Guaranteed Capacity delineano lo stesso movimento: le grandi organizzazioni vogliono sistemi IA nel proprio perimetro, con i propri dati, le proprie regole di sicurezza e impegni di capacità su più anni. “Sovereign” (sovereign) è diventata la parola chiave dell’IA enterprise nel 2026.

La corsa al coding agentico a lungo termine. Gemini 3.5 Flash (ottimizzato per agenti + coding), GLM-5.1 di Z.ai (N°1 open-source SWE-Bench Pro, contesto 200K), Grok Skills (workflow persistenti) — tutti puntano allo stesso caso d’uso: un agente che lavora su un compito complesso per ore senza intervento umano. GitHub Copilot integra Gemini 3.5 Flash il giorno stesso del suo lancio, il che illustra la velocità con cui gli strumenti per sviluppatori assorbono i nuovi modelli.

Provenienza e fiducia nei contenuti IA. La combinazione C2PA + SynthID + openai.com/verify annunciata da OpenAI (con SynthID di Google DeepMind) rappresenta un approccio multilivello inedito: metadati per il contesto, watermark invisibile per la persistenza anche dopo modifiche, strumento pubblico per la verifica. Questo movimento verso la tracciabilità dei contenuti generati sta diventando progressivamente uno standard del settore, sostenuto congiuntamente da OpenAI, Google e dalla coalizione C2PA.


Fonti