Cerca

Qwen3.7-Max, incidente di sicurezza GitHub, NVIDIA Verified Agent Skills, Runway Aleph 2.0

Qwen3.7-Max, incidente di sicurezza GitHub, NVIDIA Verified Agent Skills, Runway Aleph 2.0

ai-powered-markdown-translator

Articolo tradotto dal fr all’it con gpt-5.4-mini.

Vedi progetto su GitHub ↗

Una settimana intensa per l’ecosistema IA: Alibaba lancia il suo modello di punta Qwen3.7-Max progettato per l’era agentica, GitHub rivela un incidente di sicurezza che coinvolge un’estensione VS Code malevola, NVIDIA pubblica un framework aperto di governance per gli skill degli agenti, e Runway rinnova il suo modello di editing video con Aleph 2.0 ed Edit Studio. Sul fronte degli strumenti per sviluppatori, Claude Code 2.1.146 rinomina /simplify in /code-review e Codex 26.519 introduce gli Appshots su macOS.


Qwen3.7-Max — Il flagship di Alibaba per l’era agentica

21 maggio — Alibaba lancia Qwen3.7-Max, il suo nuovo modello proprietario di punta, progettato specificamente per gli agenti autonomi. Il modello succede alle preview Qwen3.7-Max-Preview e Qwen3.7-Plus-Preview valutate su Arena il 18 maggio.

Il posizionamento è esplicitamente “Agent Era”: Qwen3.7-Max punta ai compiti che vanno oltre la comprensione puntuale per entrare nel dominio dell’autonomia di lunga durata e dell’orchestrazione complessa.

MetricaValore
Punteggio AAII56,6
Progressione vs precedente+4,8 punti
Ore di autonomia continue (test kernel)35 h
Chiamate agli strumenti (test kernel)1.000+
Visualizzazioni del tweet principale~325.000

Cinque capacità annunciate:

  1. Agente di coding end-to-end — prototipi frontend, refactoring multi-file, debug reale
  2. Produttività da ufficio — attività tramite integrazioni MCP e gestione multi-agente
  3. Autonomia di lunga durata — 35 ore consecutive su un task di ottimizzazione kernel, 1.000+ chiamate agli strumenti senza hallucination critica
  4. Agnostico rispetto agli scaffolds — compatibile con Claude Code, OpenClaw, Qwen Code o qualsiasi stack personalizzato
  5. Ragionamento scientifico potenziato — punteggio AAII: 56,6 (+4,8 punti)

Secondo Tongyi Lab (Alibaba), Qwen3.7-Max è “il nostro ultimo modello proprietario progettato specificamente per l’era degli agenti”, con un agente di coding frontier, un assistente di produttività da ufficio e un’autonomia di lunga durata — affidabile ogni volta, agnostico rispetto agli scaffolds.

Il modello è accessibile tramite Qwen Studio (chat.qwen.ai) e l’API Alibaba Cloud.

🔗 Blog ufficiale Qwen3.7-Max


GitHub — Incidente di sicurezza: estensione VS Code malevola

20 maggio — GitHub rivela un grave incidente di sicurezza: un dipendente ha installato un’estensione VS Code malevola dal marketplace Microsoft, consentendo un accesso non autorizzato ai repository interni di GitHub.

L’annuncio iniziale su X ha generato 13,4 milioni di visualizzazioni, 8.000 repost e 25.000 like — segno di un impatto considerevole sulla community. GitHub ha pubblicato un thread in 5 parti che dettaglia la cronologia e le misure adottate.

“1/ Yesterday we detected and contained a compromise of an employee device involving a poisoned VS Code extension. We removed the malicious extension version, isolated the endpoint, and began incident response immediately.”

🇮🇹 Ieri abbiamo rilevato e contenuto la compromissione di un dispositivo di un dipendente che coinvolgeva un’estensione VS Code avvelenata. Abbiamo rimosso la versione malevola dell’estensione, isolato l’endpoint e avviato immediatamente la risposta all’incidente.@github su X

Cosa è successo:

  • Vettore: estensione VS Code malevola dal marketplace Microsoft
  • Dispositivo di un dipendente GitHub compromesso
  • Accesso non autorizzato ai repository interni GitHub

Cosa non è stato colpito (secondo GitHub):

  • Nessun impatto confermato sui dati dei clienti (aziende, organizzazioni, repository pubblici o privati)

Azioni immediate:

  • Rimozione dell’estensione malevola
  • Isolamento dell’endpoint compromesso
  • Analisi dei log (logs) e rotazione dei secret
  • Monitoraggio rafforzato dell’infrastruttura

GitHub si è impegnata a pubblicare un rapporto completo al termine dell’indagine. Questo incidente riapre il dibattito sulla sicurezza del marketplace delle estensioni VS Code, che conta decine di migliaia di estensioni la cui verifica resta limitata.

🔗 Annuncio GitHub su X


NVIDIA Verified Agent Skills — Uno standard aperto per la governance degli agenti IA

21 maggio — NVIDIA lancia i NVIDIA-Verified Agent Skills, un framework di governance aperto per mettere in sicurezza le capacità (skills) degli agenti IA. L’iniziativa risponde a un problema crescente: gli skill aumentano le capacità degli agenti, ma introducono anche potenziali vulnerabilità.

Uno skill “verificato” secondo NVIDIA si basa su quattro pilastri:

ComponenteDescrizione
CatalogazioneSincronizzazione quotidiana dai team prodotto NVIDIA
SkillSpectorScanner di rischio basato su OWASP LLM e MITRE ATLAS
Firma crittograficaFirma separata skill.oms.sig verificabile tramite OpenSSF Model Signing
Skill Card (SKILLCARD.yaml)Metadati machine-readable: provenienza, dipendenze, limitazioni, stato

Il framework rileva in particolare: dipendenze vulnerabili, injection di prompt, trigger abuse, excessive agency e tool poisoning.

La specifica tecnica è aperta tramite agentskills.io (formato SKILL.md), compatibile in modo nativo con Claude Code, OpenAI Codex e Cursor. Il repository pubblico degli skill NVIDIA è disponibile su github.com/nvidia/skills.

“Verified means cataloged, scanned, signed, and documented with a skill card.”

🇮🇹 Verificato significa catalogato, scansionato, firmato e documentato con una scheda di competenza. — Developer Blog NVIDIA, 21 maggio 2026

Il fatto che la specifica sia aperta e compatibile con i tre principali strumenti di coding IA (Claude Code, Codex, Cursor) suggerisce un’ambizione da standard industriale, non solo da strumento interno NVIDIA.

🔗 Blog sviluppatori NVIDIA


Runway Aleph 2.0 ed Edit Studio — Editing video fino a 30 secondi in 1080p

21 maggio — Runway lancia Aleph 2.0, importante aggiornamento del suo modello di editing video, accompagnato da Edit Studio, una nuova interfaccia dedicata ai team marketing e ai cineasti.

La novità centrale di Aleph 2.0 è il controllo image-level: l’utente fornisce un frame editato come riferimento visivo, e il modello applica la modifica in modo coerente all’intero video. A differenza degli approcci precedenti, in cui il risultato finale era sconosciuto prima della generazione, questo metodo offre un controllo prevedibile sull’output.

FunzionalitàDettaglio
Durata max30 secondi
Risoluzione1080p
ControlloFrame di riferimento immagine (image-level)
Editing multi-shotsSì — applicazione automatica su più scene
AccessoTutti i piani a pagamento Runway

Capacità di editing di Aleph 2.0:

  • Editing localizzato preciso: solo l’area modificata cambia, il resto viene preservato
  • Editing multi-shots: modifiche applicate a video con più tagli
  • Clip fino a 30s in 1080p — durata sufficiente per pubblicità e contenuti brevi

Casi d’uso di Edit Studio: swap prodotto, cambio di sfondo, variazione stagionale della campagna, correzione dell’illuminazione, rimozione di elementi di disturbo, restyling completo.

“With Aleph 2.0, your edited frame defines what the change should look like, and the model carries it through to the right parts of your video.”

🇮🇹 Con Aleph 2.0, la tua immagine modificata definisce l’aspetto desiderato, e il modello lo applica alle parti corrispondenti del tuo video. — Runway, blog ufficiale 21 maggio 2026

🔗 Annuncio ufficiale Runway


Claude Code 2.1.146 — /code-review e correzioni background agents

21 maggio — Anthropic pubblica la versione 2.1.146 di Claude Code con una novità principale e diverse importanti correzioni di stabilità.

Il comando /simplify viene rinominato /code-review, accompagnato da un livello di effort opzionale (/code-review high). Questo cambiamento riposiziona esplicitamente la funzionalità come strumento di code review nei workflow agentici.

AmbitoCorrezione
Windows PowerShellRegresione v2.1.124 corretta per pwsh via winget/Microsoft Store
MCP paginationresources/list e prompts/list non perdono più gli item oltre la pagina 1
Sessioni backgroundStrobing Windows Terminal, worktree NTFS, blocchi /background e claude agents
Auto modeAskUserQuestion preservato quando lo skill o l’utente ne dipendono
BedrockAuth cross-account corretta con awsCredentialExport
VSCode VoiceFeedback del microfono silenzioso, suggerimenti sox per WSLg

🔗 CHANGELOG Claude Code


Claude Code /usage — Suddivisione del consumo di token per componente

21 maggio — Boris Cherny (lead Claude Code in Anthropic) annuncia su X un’estensione significativa del comando /usage: la prossima versione consentirà di vedere esattamente quali Skills, Agents, MCPs e Plugins consumano token in una sessione.

Questa funzionalità va oltre il redesign dell’interfaccia della vigilia. Introduce una granularità per componente — permettendo di identificare le estensioni più esose in termini di contesto. È già disponibile in CLI e arriverà prossimamente sull’app Desktop. L’annuncio ha generato 137.527 visualizzazioni su X, con molte richieste di disattivare selettivamente i connettori non utilizzati.

“In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using your tokens CLI today, coming to Desktop next”

🇮🇹 Nella prossima versione di Claude Code: esegui /usage per vedere la ripartizione del consumo di token per Skills, Agents, MCPs e Plugins — disponibile oggi in CLI, prossimamente su Desktop.@bcherny su X


Google I/O 2026 — Il riepilogo ufficiale “100 announcements”

20 maggio — Google pubblica il suo articolo riepilogativo ufficiale “100 things announced at I/O 2026”, documento di riferimento per l’insieme dei lanci dell’evento. Tra gli annunci confermati: Antigravity 2.0 CLI (successore del Gemini CLI), Universal Cart (acquisti multi-catena), Google Pics (gestione intelligente delle foto), Ask YouTube (interrogazione dei video YouTube), Android XR glasses e l’espansione di SynthID. Questo documento consolida la portata del Google I/O 2026 e funge da fonte primaria per gli sviluppatori che desiderano ritrovare tutti i dettagli ufficiali.

🔗 Blog Google — 100 annunci I/O 2026


Gemini Connected Apps — OpenTable, Canva e Instacart

21 maggio — Google Gemini estende le sue Connected Apps a tre nuovi partner: OpenTable (prenotazione di ristoranti), Canva (creazione di visual) e Instacart (spesa alimentare). Gemini non si limita più a cercare informazioni — compie azioni concrete nell’ecosistema digitale dell’utente al suo posto. Questo annuncio post-I/O traduce concretamente la visione agentica di Gemini Spark: l’agente agisce sui servizi terzi più popolari senza uscire dall’applicazione.

🔗 Annuncio Gemini Connected Apps


GitHub Copilot — Quattro aggiornamenti per sviluppatori

Report metrici migrati su copilot-reports.github.com

20 maggio — Gli URL di download dei report Copilot Usage Metrics migrano dal vecchio dominio Azure Front Door (azurefd.net) al dominio stabile copilot-reports.github.com. Azione richiesta per le organizzazioni con firewall o proxy: aggiungere il nuovo dominio all’allowlist enterprise il prima possibile. Il vecchio dominio resta attivo durante il periodo di transizione ma sarà deprecato successivamente. Per le istanze GitHub Enterprise Cloud, il nuovo dominio segue il formato copilot-reports.SUBDOMAIN.ghe.com. È previsto un fallback verso *.blob.core.windows.net in caso di indisponibilità di Azure.

🔗 Changelog GitHub Copilot

Cloud agent — Claude Haiku 4.5 e GPT-5.4-mini a 0,33x

18 maggio — Il Copilot cloud agent integra due nuovi modelli economici: Claude Haiku 4.5 e GPT-5.4-mini, entrambi fatturati a 0,33x del moltiplicatore standard (contro 1x per i modelli standard). Questa espansione consente di scegliere lo strumento giusto in base alla natura del task — modello leggero e veloce per correzioni semplici di lint o test unitari, modello più potente per refactoring complessi. La scelta del modello avviene nel momento in cui si delega un task al cloud agent, consentendo di ottimizzare il rapporto costo/qualità in base alla complessità reale del lavoro.

🔗 Changelog cloud agent

Chat web — Pannello laterale contestuale in disponibilità generale

18 maggio — Copilot Chat su github.com si apre ora in pannello laterale direttamente accanto alla risorsa consultata (PR, issue, repository), senza dover navigare verso una pagina dedicata. Il contesto si accumula automaticamente navigando tra più PR e issue nella stessa sessione — i riferimenti cross-risorsa restano accessibili senza perdere il filo della conversazione. L’esperienza immersiva a pagina intera resta accessibile tramite “More → In immersive chat”. È inoltre possibile trasformare la conversazione in una sessione agent per creare PR o avviare una ricerca approfondita. Disponibile in GA per tutti i piani Copilot.

🔗 Changelog Copilot Chat web

Genspark integra Gemini 3.5 Flash gratuitamente

20 maggio — Genspark integra Gemini 3.5 Flash già dal giorno successivo al suo annuncio al Google I/O, disponibile gratuitamente in AI Chat Agent e Genspark Claw. La piattaforma (70+ modelli simultanei disponibili contemporaneamente) illustra la sua strategia di integrazione reattiva: adottare i modelli più recenti senza costringere l’utente a scegliere manualmente. Gemini 3.5 Flash rappresenta il modello Flash più performante di Google fino a oggi, ottimizzato per la velocità di risposta su task complessi.

🔗 Annuncio Genspark


Kling AI a Cannes — RAPHAEL RAPHAEL, film 100% IA

21 maggio — Kling AI presenta RAPHAEL RAPHAEL al Festival di Cannes 2026, un progetto di lungometraggio generato al 100% da IA su larga scala. Questo annuncio è distinto dal post del 20 maggio su House of David (prima serie Hollywood a integrare Kling su scala industriale, 44 milioni di spettatori, #1 su Prime Video US). Kling AI consolida così una presenza multi-progetto a Cannes 2026, affermando la sua posizione come attore principale dell’IA video per il cinema.

🔗 Annuncio Kling AI


BFL FLUX Erase — Rimozione di oggetti e cancellazione del testo

21 maggio — Black Forest Labs lancia FLUX Erase, funzionalità di cancellazione intelligente per le immagini FLUX. Tre capacità principali: rimozione di oggetti (eliminazione pulita con ricostruzione coerente dello sfondo), cancellazione del testo (rimozione preservando il design sottostante) e rimozione automatica delle ombre legate agli oggetti eliminati. La funzionalità è progettata per il ritocco di precisione (precision inpainting): solo l’area target viene modificata, senza degradare il resto dell’immagine. Disponibile tramite lo strumento web flux-tools.bfl.ai/erase e l’API BFL (docs.bfl.ai/flux_erase), con accesso immediato senza lista d’attesa.

🔗 Annuncio BFL


ElevenReader — 200.000+ titoli premium con voce a scelta

21 maggio — ElevenLabs integra 200.000+ titoli premium in ElevenReader: best seller in audiolibri ed eBook con licenza, tra cui migliaia disponibili con la voce del narratore a scelta tra le voci ElevenLabs. Questa espansione posiziona ElevenReader come una piattaforma di lettura audio personalizzabile, in cui l’utente non è più limitato al narratore originale di un libro: può scegliere la voce che preferisce per qualsiasi titolo compatibile. L’app è accessibile su elevenreader.io con accesso gratuito per iniziare.

🔗 Annuncio ElevenLabs


xAI Grok × OpenCode — Grok Build nel CLI di codice

21 maggio — Gli abbonati Grok o X Premium possono ora utilizzare il modello Grok Build in OpenCode, editor di codice da riga di comando (CLI coding editor) specializzato nell’intelligenza della codebase. Questa integrazione segue quella annunciata in OpenClaw due giorni prima — xAI estende progressivamente il suo abbonamento a un numero maggiore di strumenti di terze parti. L’accesso è incluso nell’abbonamento Grok/X Premium esistente, senza costi aggiuntivi. OpenCode si distingue da OpenClaw per il suo focus specifico sul codice: analisi della codebase, navigazione e refactoring assistito.

🔗 Annuncio xAI


Codex 26.519 — Appshots, Goal mode GA, computer use bloccato, condivisione dei plugin

21 maggio — OpenAI pubblica Codex 26.519 con diverse nuove funzionalità macOS e per le aziende. Gli Appshots permettono di inviare la finestra dell’applicazione in primo piano in un thread Codex tramite un doppio tocco sui due tasti Command — la finestra visibile e il testo accessibile tramite l’API di accessibilità macOS vengono catturati. Il Goal mode esce dallo stato sperimentale e passa alla disponibilità generale (app, estensione IDE, CLI). Remote computer use: Codex può ora utilizzare le applicazioni desktop dopo il blocco del Mac. La condivisione dei plugin è disponibile per ChatGPT Business.

FunzionalitàStatoPiattaforme
AppshotsNuovo (GA)Solo macOS
Goal modeGA (era sperimentale)App, estensione IDE, CLI
Remote computer use (Mac bloccato)NuovomacOS + Codex Mobile
Condivisione dei pluginNuovo (Business)ChatGPT Business

🔗 Changelog Codex


Brevi

  • Gemini Daily Brief — disponibilità generale — Il riassunto quotidiano è ora accessibile a tutti gli abbonati Google AI Plus, Pro e Ultra (18+), inizialmente negli Stati Uniti. 🔗 fonte
  • Grok × Imagine — asset di videogiochi (8,1M visualizzazioni) — Dimostrazione virale della prototipazione di asset di videogiochi direttamente con Grok e @imagine, forte coinvolgimento della community gaming. 🔗 fonte
  • Cohere Command A+ — pesi W4A4 disponibili su HuggingFace — I pesi quantizzati W4A4 di Command A+ sono scaricabili, consentendo il deployment su 2× H100 con +47% di velocità rispetto a BF16. 🔗 fonte

Cosa significa

L’era agentica si afferma su più fronti simultaneamente. Il lancio di Qwen3.7-Max con 35 ore di autonomia continua e oltre 1 000 chiamate di strumenti, combinato con i NVIDIA Verified Agent Skills che standardizzano la governance delle capacità degli agenti, segnala che il settore sta passando da una fase di sperimentazione a una fase di strutturazione. Il fatto che NVIDIA basi il suo standard sulla spec aperta agentskills.io — compatibile con Claude Code, Codex e Cursor — suggerisce una convergenza verso interfacce comuni per gli agenti IA, indipendentemente dal modello sottostante.

La sicurezza della catena di strumenti IA sta diventando una questione critica. L’incidente GitHub, in cui un’estensione VS Code malevola del marketplace ufficiale Microsoft ha compromesso un dispositivo interno, illustra una nuova superficie di attacco che il settore non ha ancora affrontato pienamente. Il tempismo è rivelatore: NVIDIA lancia i suoi Verified Agent Skills lo stesso giorno in cui GitHub annuncia il suo incidente. Gli skills e le estensioni non verificate rappresentano un vettore di attacco in crescita man mano che gli agenti IA prendono il controllo di sistemi critici.

L’outillage per sviluppatori si consolida attorno alla trasparenza dei consumi. L’annuncio di Claude Code /usage con scomposizione per componente, combinato con gli Appshots di Codex e il Goal mode GA, rivela una tendenza: gli strumenti IA per sviluppatori di nuova generazione devono ormai spiegare cosa consumano e come. La granularità per Skills/Agents/MCPs/Plugins risponde a una richiesta concreta dei team che distribuiscono agenti in produzione e vogliono capire i costi reali.

L’IA generativa video entra nell’industria cinematografica. Runway Aleph 2.0 con il suo controllo image-level prevedibile, Kling AI a Cannes con un lungometraggio 100% IA (RAPHAEL RAPHAEL) e la conferma che House of David (44M viewer, #1 Prime Video US) utilizza Kling su scala industriale segnano una svolta. Gli studi non stanno più testando la tecnologia — la stanno integrando nei loro pipeline di produzione standard.


Fonti