ai-powered-markdown-translatorArticolo tradotto dal fr all’it con gpt-5.4-mini.
Una settimana intensa per l’ecosistema IA: Alibaba lancia il suo modello di punta Qwen3.7-Max progettato per l’era agentica, GitHub rivela un incidente di sicurezza che coinvolge un’estensione VS Code malevola, NVIDIA pubblica un framework aperto di governance per gli skill degli agenti, e Runway rinnova il suo modello di editing video con Aleph 2.0 ed Edit Studio. Sul fronte degli strumenti per sviluppatori, Claude Code 2.1.146 rinomina /simplify in /code-review e Codex 26.519 introduce gli Appshots su macOS.
Qwen3.7-Max — Il flagship di Alibaba per l’era agentica
21 maggio — Alibaba lancia Qwen3.7-Max, il suo nuovo modello proprietario di punta, progettato specificamente per gli agenti autonomi. Il modello succede alle preview Qwen3.7-Max-Preview e Qwen3.7-Plus-Preview valutate su Arena il 18 maggio.
Il posizionamento è esplicitamente “Agent Era”: Qwen3.7-Max punta ai compiti che vanno oltre la comprensione puntuale per entrare nel dominio dell’autonomia di lunga durata e dell’orchestrazione complessa.
| Metrica | Valore |
|---|---|
| Punteggio AAII | 56,6 |
| Progressione vs precedente | +4,8 punti |
| Ore di autonomia continue (test kernel) | 35 h |
| Chiamate agli strumenti (test kernel) | 1.000+ |
| Visualizzazioni del tweet principale | ~325.000 |
Cinque capacità annunciate:
- Agente di coding end-to-end — prototipi frontend, refactoring multi-file, debug reale
- Produttività da ufficio — attività tramite integrazioni MCP e gestione multi-agente
- Autonomia di lunga durata — 35 ore consecutive su un task di ottimizzazione kernel, 1.000+ chiamate agli strumenti senza hallucination critica
- Agnostico rispetto agli scaffolds — compatibile con Claude Code, OpenClaw, Qwen Code o qualsiasi stack personalizzato
- Ragionamento scientifico potenziato — punteggio AAII: 56,6 (+4,8 punti)
Secondo Tongyi Lab (Alibaba), Qwen3.7-Max è “il nostro ultimo modello proprietario progettato specificamente per l’era degli agenti”, con un agente di coding frontier, un assistente di produttività da ufficio e un’autonomia di lunga durata — affidabile ogni volta, agnostico rispetto agli scaffolds.
Il modello è accessibile tramite Qwen Studio (chat.qwen.ai) e l’API Alibaba Cloud.
GitHub — Incidente di sicurezza: estensione VS Code malevola
20 maggio — GitHub rivela un grave incidente di sicurezza: un dipendente ha installato un’estensione VS Code malevola dal marketplace Microsoft, consentendo un accesso non autorizzato ai repository interni di GitHub.
L’annuncio iniziale su X ha generato 13,4 milioni di visualizzazioni, 8.000 repost e 25.000 like — segno di un impatto considerevole sulla community. GitHub ha pubblicato un thread in 5 parti che dettaglia la cronologia e le misure adottate.
“1/ Yesterday we detected and contained a compromise of an employee device involving a poisoned VS Code extension. We removed the malicious extension version, isolated the endpoint, and began incident response immediately.”
🇮🇹 Ieri abbiamo rilevato e contenuto la compromissione di un dispositivo di un dipendente che coinvolgeva un’estensione VS Code avvelenata. Abbiamo rimosso la versione malevola dell’estensione, isolato l’endpoint e avviato immediatamente la risposta all’incidente. — @github su X
Cosa è successo:
- Vettore: estensione VS Code malevola dal marketplace Microsoft
- Dispositivo di un dipendente GitHub compromesso
- Accesso non autorizzato ai repository interni GitHub
Cosa non è stato colpito (secondo GitHub):
- Nessun impatto confermato sui dati dei clienti (aziende, organizzazioni, repository pubblici o privati)
Azioni immediate:
- Rimozione dell’estensione malevola
- Isolamento dell’endpoint compromesso
- Analisi dei log (logs) e rotazione dei secret
- Monitoraggio rafforzato dell’infrastruttura
GitHub si è impegnata a pubblicare un rapporto completo al termine dell’indagine. Questo incidente riapre il dibattito sulla sicurezza del marketplace delle estensioni VS Code, che conta decine di migliaia di estensioni la cui verifica resta limitata.
NVIDIA Verified Agent Skills — Uno standard aperto per la governance degli agenti IA
21 maggio — NVIDIA lancia i NVIDIA-Verified Agent Skills, un framework di governance aperto per mettere in sicurezza le capacità (skills) degli agenti IA. L’iniziativa risponde a un problema crescente: gli skill aumentano le capacità degli agenti, ma introducono anche potenziali vulnerabilità.
Uno skill “verificato” secondo NVIDIA si basa su quattro pilastri:
| Componente | Descrizione |
|---|---|
| Catalogazione | Sincronizzazione quotidiana dai team prodotto NVIDIA |
| SkillSpector | Scanner di rischio basato su OWASP LLM e MITRE ATLAS |
| Firma crittografica | Firma separata skill.oms.sig verificabile tramite OpenSSF Model Signing |
| Skill Card (SKILLCARD.yaml) | Metadati machine-readable: provenienza, dipendenze, limitazioni, stato |
Il framework rileva in particolare: dipendenze vulnerabili, injection di prompt, trigger abuse, excessive agency e tool poisoning.
La specifica tecnica è aperta tramite agentskills.io (formato SKILL.md), compatibile in modo nativo con Claude Code, OpenAI Codex e Cursor. Il repository pubblico degli skill NVIDIA è disponibile su github.com/nvidia/skills.
“Verified means cataloged, scanned, signed, and documented with a skill card.”
🇮🇹 Verificato significa catalogato, scansionato, firmato e documentato con una scheda di competenza. — Developer Blog NVIDIA, 21 maggio 2026
Il fatto che la specifica sia aperta e compatibile con i tre principali strumenti di coding IA (Claude Code, Codex, Cursor) suggerisce un’ambizione da standard industriale, non solo da strumento interno NVIDIA.
Runway Aleph 2.0 ed Edit Studio — Editing video fino a 30 secondi in 1080p
21 maggio — Runway lancia Aleph 2.0, importante aggiornamento del suo modello di editing video, accompagnato da Edit Studio, una nuova interfaccia dedicata ai team marketing e ai cineasti.
La novità centrale di Aleph 2.0 è il controllo image-level: l’utente fornisce un frame editato come riferimento visivo, e il modello applica la modifica in modo coerente all’intero video. A differenza degli approcci precedenti, in cui il risultato finale era sconosciuto prima della generazione, questo metodo offre un controllo prevedibile sull’output.
| Funzionalità | Dettaglio |
|---|---|
| Durata max | 30 secondi |
| Risoluzione | 1080p |
| Controllo | Frame di riferimento immagine (image-level) |
| Editing multi-shots | Sì — applicazione automatica su più scene |
| Accesso | Tutti i piani a pagamento Runway |
Capacità di editing di Aleph 2.0:
- Editing localizzato preciso: solo l’area modificata cambia, il resto viene preservato
- Editing multi-shots: modifiche applicate a video con più tagli
- Clip fino a 30s in 1080p — durata sufficiente per pubblicità e contenuti brevi
Casi d’uso di Edit Studio: swap prodotto, cambio di sfondo, variazione stagionale della campagna, correzione dell’illuminazione, rimozione di elementi di disturbo, restyling completo.
“With Aleph 2.0, your edited frame defines what the change should look like, and the model carries it through to the right parts of your video.”
🇮🇹 Con Aleph 2.0, la tua immagine modificata definisce l’aspetto desiderato, e il modello lo applica alle parti corrispondenti del tuo video. — Runway, blog ufficiale 21 maggio 2026
Claude Code 2.1.146 — /code-review e correzioni background agents
21 maggio — Anthropic pubblica la versione 2.1.146 di Claude Code con una novità principale e diverse importanti correzioni di stabilità.
Il comando /simplify viene rinominato /code-review, accompagnato da un livello di effort opzionale (/code-review high). Questo cambiamento riposiziona esplicitamente la funzionalità come strumento di code review nei workflow agentici.
| Ambito | Correzione |
|---|---|
| Windows PowerShell | Regresione v2.1.124 corretta per pwsh via winget/Microsoft Store |
| MCP pagination | resources/list e prompts/list non perdono più gli item oltre la pagina 1 |
| Sessioni background | Strobing Windows Terminal, worktree NTFS, blocchi /background e claude agents |
| Auto mode | AskUserQuestion preservato quando lo skill o l’utente ne dipendono |
| Bedrock | Auth cross-account corretta con awsCredentialExport |
| VSCode Voice | Feedback del microfono silenzioso, suggerimenti sox per WSLg |
Claude Code /usage — Suddivisione del consumo di token per componente
21 maggio — Boris Cherny (lead Claude Code in Anthropic) annuncia su X un’estensione significativa del comando /usage: la prossima versione consentirà di vedere esattamente quali Skills, Agents, MCPs e Plugins consumano token in una sessione.
Questa funzionalità va oltre il redesign dell’interfaccia della vigilia. Introduce una granularità per componente — permettendo di identificare le estensioni più esose in termini di contesto. È già disponibile in CLI e arriverà prossimamente sull’app Desktop. L’annuncio ha generato 137.527 visualizzazioni su X, con molte richieste di disattivare selettivamente i connettori non utilizzati.
“In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using your tokens CLI today, coming to Desktop next”
🇮🇹 Nella prossima versione di Claude Code: esegui
/usageper vedere la ripartizione del consumo di token per Skills, Agents, MCPs e Plugins — disponibile oggi in CLI, prossimamente su Desktop. — @bcherny su X
Google I/O 2026 — Il riepilogo ufficiale “100 announcements”
20 maggio — Google pubblica il suo articolo riepilogativo ufficiale “100 things announced at I/O 2026”, documento di riferimento per l’insieme dei lanci dell’evento. Tra gli annunci confermati: Antigravity 2.0 CLI (successore del Gemini CLI), Universal Cart (acquisti multi-catena), Google Pics (gestione intelligente delle foto), Ask YouTube (interrogazione dei video YouTube), Android XR glasses e l’espansione di SynthID. Questo documento consolida la portata del Google I/O 2026 e funge da fonte primaria per gli sviluppatori che desiderano ritrovare tutti i dettagli ufficiali.
🔗 Blog Google — 100 annunci I/O 2026
Gemini Connected Apps — OpenTable, Canva e Instacart
21 maggio — Google Gemini estende le sue Connected Apps a tre nuovi partner: OpenTable (prenotazione di ristoranti), Canva (creazione di visual) e Instacart (spesa alimentare). Gemini non si limita più a cercare informazioni — compie azioni concrete nell’ecosistema digitale dell’utente al suo posto. Questo annuncio post-I/O traduce concretamente la visione agentica di Gemini Spark: l’agente agisce sui servizi terzi più popolari senza uscire dall’applicazione.
🔗 Annuncio Gemini Connected Apps
GitHub Copilot — Quattro aggiornamenti per sviluppatori
Report metrici migrati su copilot-reports.github.com
20 maggio — Gli URL di download dei report Copilot Usage Metrics migrano dal vecchio dominio Azure Front Door (azurefd.net) al dominio stabile copilot-reports.github.com. Azione richiesta per le organizzazioni con firewall o proxy: aggiungere il nuovo dominio all’allowlist enterprise il prima possibile. Il vecchio dominio resta attivo durante il periodo di transizione ma sarà deprecato successivamente. Per le istanze GitHub Enterprise Cloud, il nuovo dominio segue il formato copilot-reports.SUBDOMAIN.ghe.com. È previsto un fallback verso *.blob.core.windows.net in caso di indisponibilità di Azure.
Cloud agent — Claude Haiku 4.5 e GPT-5.4-mini a 0,33x
18 maggio — Il Copilot cloud agent integra due nuovi modelli economici: Claude Haiku 4.5 e GPT-5.4-mini, entrambi fatturati a 0,33x del moltiplicatore standard (contro 1x per i modelli standard). Questa espansione consente di scegliere lo strumento giusto in base alla natura del task — modello leggero e veloce per correzioni semplici di lint o test unitari, modello più potente per refactoring complessi. La scelta del modello avviene nel momento in cui si delega un task al cloud agent, consentendo di ottimizzare il rapporto costo/qualità in base alla complessità reale del lavoro.
Chat web — Pannello laterale contestuale in disponibilità generale
18 maggio — Copilot Chat su github.com si apre ora in pannello laterale direttamente accanto alla risorsa consultata (PR, issue, repository), senza dover navigare verso una pagina dedicata. Il contesto si accumula automaticamente navigando tra più PR e issue nella stessa sessione — i riferimenti cross-risorsa restano accessibili senza perdere il filo della conversazione. L’esperienza immersiva a pagina intera resta accessibile tramite “More → In immersive chat”. È inoltre possibile trasformare la conversazione in una sessione agent per creare PR o avviare una ricerca approfondita. Disponibile in GA per tutti i piani Copilot.
Genspark integra Gemini 3.5 Flash gratuitamente
20 maggio — Genspark integra Gemini 3.5 Flash già dal giorno successivo al suo annuncio al Google I/O, disponibile gratuitamente in AI Chat Agent e Genspark Claw. La piattaforma (70+ modelli simultanei disponibili contemporaneamente) illustra la sua strategia di integrazione reattiva: adottare i modelli più recenti senza costringere l’utente a scegliere manualmente. Gemini 3.5 Flash rappresenta il modello Flash più performante di Google fino a oggi, ottimizzato per la velocità di risposta su task complessi.
Kling AI a Cannes — RAPHAEL RAPHAEL, film 100% IA
21 maggio — Kling AI presenta RAPHAEL RAPHAEL al Festival di Cannes 2026, un progetto di lungometraggio generato al 100% da IA su larga scala. Questo annuncio è distinto dal post del 20 maggio su House of David (prima serie Hollywood a integrare Kling su scala industriale, 44 milioni di spettatori, #1 su Prime Video US). Kling AI consolida così una presenza multi-progetto a Cannes 2026, affermando la sua posizione come attore principale dell’IA video per il cinema.
BFL FLUX Erase — Rimozione di oggetti e cancellazione del testo
21 maggio — Black Forest Labs lancia FLUX Erase, funzionalità di cancellazione intelligente per le immagini FLUX. Tre capacità principali: rimozione di oggetti (eliminazione pulita con ricostruzione coerente dello sfondo), cancellazione del testo (rimozione preservando il design sottostante) e rimozione automatica delle ombre legate agli oggetti eliminati. La funzionalità è progettata per il ritocco di precisione (precision inpainting): solo l’area target viene modificata, senza degradare il resto dell’immagine. Disponibile tramite lo strumento web flux-tools.bfl.ai/erase e l’API BFL (docs.bfl.ai/flux_erase), con accesso immediato senza lista d’attesa.
ElevenReader — 200.000+ titoli premium con voce a scelta
21 maggio — ElevenLabs integra 200.000+ titoli premium in ElevenReader: best seller in audiolibri ed eBook con licenza, tra cui migliaia disponibili con la voce del narratore a scelta tra le voci ElevenLabs. Questa espansione posiziona ElevenReader come una piattaforma di lettura audio personalizzabile, in cui l’utente non è più limitato al narratore originale di un libro: può scegliere la voce che preferisce per qualsiasi titolo compatibile. L’app è accessibile su elevenreader.io con accesso gratuito per iniziare.
xAI Grok × OpenCode — Grok Build nel CLI di codice
21 maggio — Gli abbonati Grok o X Premium possono ora utilizzare il modello Grok Build in OpenCode, editor di codice da riga di comando (CLI coding editor) specializzato nell’intelligenza della codebase. Questa integrazione segue quella annunciata in OpenClaw due giorni prima — xAI estende progressivamente il suo abbonamento a un numero maggiore di strumenti di terze parti. L’accesso è incluso nell’abbonamento Grok/X Premium esistente, senza costi aggiuntivi. OpenCode si distingue da OpenClaw per il suo focus specifico sul codice: analisi della codebase, navigazione e refactoring assistito.
Codex 26.519 — Appshots, Goal mode GA, computer use bloccato, condivisione dei plugin
21 maggio — OpenAI pubblica Codex 26.519 con diverse nuove funzionalità macOS e per le aziende. Gli Appshots permettono di inviare la finestra dell’applicazione in primo piano in un thread Codex tramite un doppio tocco sui due tasti Command — la finestra visibile e il testo accessibile tramite l’API di accessibilità macOS vengono catturati. Il Goal mode esce dallo stato sperimentale e passa alla disponibilità generale (app, estensione IDE, CLI). Remote computer use: Codex può ora utilizzare le applicazioni desktop dopo il blocco del Mac. La condivisione dei plugin è disponibile per ChatGPT Business.
| Funzionalità | Stato | Piattaforme |
|---|---|---|
| Appshots | Nuovo (GA) | Solo macOS |
| Goal mode | GA (era sperimentale) | App, estensione IDE, CLI |
| Remote computer use (Mac bloccato) | Nuovo | macOS + Codex Mobile |
| Condivisione dei plugin | Nuovo (Business) | ChatGPT Business |
Brevi
- Gemini Daily Brief — disponibilità generale — Il riassunto quotidiano è ora accessibile a tutti gli abbonati Google AI Plus, Pro e Ultra (18+), inizialmente negli Stati Uniti. 🔗 fonte
- Grok × Imagine — asset di videogiochi (8,1M visualizzazioni) — Dimostrazione virale della prototipazione di asset di videogiochi direttamente con Grok e @imagine, forte coinvolgimento della community gaming. 🔗 fonte
- Cohere Command A+ — pesi W4A4 disponibili su HuggingFace — I pesi quantizzati W4A4 di Command A+ sono scaricabili, consentendo il deployment su 2× H100 con +47% di velocità rispetto a BF16. 🔗 fonte
Cosa significa
L’era agentica si afferma su più fronti simultaneamente. Il lancio di Qwen3.7-Max con 35 ore di autonomia continua e oltre 1 000 chiamate di strumenti, combinato con i NVIDIA Verified Agent Skills che standardizzano la governance delle capacità degli agenti, segnala che il settore sta passando da una fase di sperimentazione a una fase di strutturazione. Il fatto che NVIDIA basi il suo standard sulla spec aperta agentskills.io — compatibile con Claude Code, Codex e Cursor — suggerisce una convergenza verso interfacce comuni per gli agenti IA, indipendentemente dal modello sottostante.
La sicurezza della catena di strumenti IA sta diventando una questione critica. L’incidente GitHub, in cui un’estensione VS Code malevola del marketplace ufficiale Microsoft ha compromesso un dispositivo interno, illustra una nuova superficie di attacco che il settore non ha ancora affrontato pienamente. Il tempismo è rivelatore: NVIDIA lancia i suoi Verified Agent Skills lo stesso giorno in cui GitHub annuncia il suo incidente. Gli skills e le estensioni non verificate rappresentano un vettore di attacco in crescita man mano che gli agenti IA prendono il controllo di sistemi critici.
L’outillage per sviluppatori si consolida attorno alla trasparenza dei consumi. L’annuncio di Claude Code /usage con scomposizione per componente, combinato con gli Appshots di Codex e il Goal mode GA, rivela una tendenza: gli strumenti IA per sviluppatori di nuova generazione devono ormai spiegare cosa consumano e come. La granularità per Skills/Agents/MCPs/Plugins risponde a una richiesta concreta dei team che distribuiscono agenti in produzione e vogliono capire i costi reali.
L’IA generativa video entra nell’industria cinematografica. Runway Aleph 2.0 con il suo controllo image-level prevedibile, Kling AI a Cannes con un lungometraggio 100% IA (RAPHAEL RAPHAEL) e la conferma che House of David (44M viewer, #1 Prime Video US) utilizza Kling su scala industriale segnano una svolta. Gli studi non stanno più testando la tecnologia — la stanno integrando nei loro pipeline di produzione standard.
Fonti
- Qwen3.7-Max — Tweet Alibaba Qwen
- Qwen3.7-Max — Blog ufficiale
- GitHub — Incidente di sicurezza (annuncio iniziale)
- GitHub — Incidente di sicurezza (thread dettagliato)
- NVIDIA Verified Agent Skills — Blog per sviluppatori
- NVIDIA Verified Agent Skills — Tweet
- Runway Aleph 2.0 — Annuncio ufficiale
- Runway Aleph 2.0 — Tweet
- Claude Code CHANGELOG
- Claude Code /usage breakdown — Boris Cherny
- Google I/O 2026 — 100 annunci
- Gemini Connected Apps — OpenTable, Canva, Instacart
- GitHub Copilot — Migrazione URL dei report
- GitHub Copilot — Claude Haiku 4.5 e GPT-5.4-mini
- GitHub Copilot Chat web — Pannello laterale GA
- Genspark — Gemini 3.5 Flash integrato
- Kling AI — RAPHAEL RAPHAEL a Cannes
- BFL FLUX Erase
- ElevenReader — oltre 200 000 titoli
- xAI Grok × OpenCode
- Codex 26.519 — Appshots
- Codex 26.519 — Changelog
- Gemini Daily Brief GA
- Grok × Imagine — asset di videogiochi
- Cohere Command A+ — W4A4 HuggingFace