Cerca

Anthropic svela l'auto-miglioramento ricorsivo dell'IA, NVIDIA Nemotron 3 Ultra open-source, Suno raccoglie 400M USD

Anthropic svela l'auto-miglioramento ricorsivo dell'IA, NVIDIA Nemotron 3 Ultra open-source, Suno raccoglie 400M USD

ai-powered-markdown-translator

Articolo tradotto dal fr al it con gpt-5.4-mini.

Vedi progetto su GitHub ↗

Il 4 giugno 2026 si apre con una pubblicazione storica dell’Anthropic Institute: l’IA accelera già il proprio sviluppo, con oltre l’80% del codice di Anthropic scritto da Claude e un guadagno di produttività ×8. NVIDIA rilascia nello stesso momento Nemotron 3 Ultra, un modello MoE da 550 miliardi di parametri interamente open-source per gli agenti. OpenAI distribuisce Dreaming v3, una nuova architettura di memoria per ChatGPT 5× meno costosa. GitHub Copilot supera la soglia di un milione di token di contesto. E Suno annuncia un round di finanziamento Serie D da $400 milioni, portando la sua valutazione a $5,4 miliardi.


Anthropic Institute — “When AI builds itself” : l’auto-miglioramento ricorsivo documentato

4 giugno — The Anthropic Institute pubblica “When AI builds itself”, la prima documentazione ufficiale, con cifre interne a supporto, del progresso verso un possibile auto-miglioramento ricorsivo dell’IA. I coautori Marina Favaro e Jack Clark presentano dati interni di maggio 2026 che mostrano che Claude scrive ormai la maggior parte del codice di Anthropic.

IndicatoreValore (maggio 2026)
Quota del codice Anthropic scritto da Claude>80% delle righe mergiate in produzione
Guadagno di produttività codice/ingegnere×8 nel Q2 2026 vs 2024
Tasso di successo compiti aperti76% (+50 punti in 6 mesi)
Speedup ottimizzazione codice (Mythos Preview)~52× vs ~3× per Opus 4 (maggio 2025)
Decisioni di ricerca migliori dell’umano64% (Mythos Preview vs 51% per Opus 4.5 in nov. 2025)
Sondaggio interno — guadagno di produttività stimato×4 con Mythos Preview (130 dipendenti, marzo 2026)

L’evoluzione della durata del compito autonomo è particolarmente notevole: Claude Opus 3 gestiva compiti di circa 4 minuti a marzo 2024, Claude Sonnet 3.7 raggiungeva 1h30 a marzo 2025, Claude Opus 4.6 opera su 12 ore a marzo 2026, e Mythos Preview supera le 16 ore (limite di misura del benchmark METR) a maggio 2026. La durata raddoppia ogni circa 4 mesi.

Un risultato concreto: nell’aprile 2026, agenti Claude hanno risolto un problema aperto di sicurezza IA end-to-end — ipotesi, test, iterazioni — e recuperato il 97% del guadagno di performance, contro il 23% per due ricercatori umani in una settimana, per un costo di circa $18 000 di calcolo su 800 ore cumulate.

L’articolo esplora tre scenari: un plateau (ritenuto il meno probabile), un’automazione sostanziale con direzione umana strategica, e l’auto-miglioramento ricorsivo completo in cui i modelli costruiscono i propri successori senza intervento umano. L’articolo si conclude con un appello esplicito a una pausa coordinata e verificabile dello sviluppo IA frontier, condizionata alla partecipazione degli altri principali laboratori.

“Our internal data shows Claude is accelerating AI development—a possible path to recursive self-improvement, or AI autonomously building a more capable successor. It’s happening faster than we thought, and the implications deserve greater attention.”

🇮🇹 I nostri dati interni mostrano che Claude accelera lo sviluppo dell’IA — una possibile via verso l’auto-miglioramento ricorsivo, o l’IA che costruisce autonomamente un successore più capace. Questo accade più rapidamente del previsto, e le implicazioni meritano un’attenzione maggiore.@AnthropicAI

🔗 Articolo Anthropic Institute


NVIDIA Nemotron 3 Ultra — 550B MoE open-source per gli agenti di lunga durata

4 giugno — NVIDIA rilascia Nemotron 3 Ultra, un modello frontier open-source da 550 miliardi di parametri progettato specificamente per agenti IA di lunga durata (long-running agents). Questo lancio è la concretizzazione effettiva dei pesi open-source — dopo l’annuncio iniziale al Microsoft Build il 2 giugno, i pesi sono ora disponibili su HuggingFace e tramite Ollama Cloud.

CaratteristicaValore
ArchitetturaIbrida Mamba-Transformer MoE
Parametri totali550 miliardi
Parametri attivi55 miliardi (NVFP4)
Velocità di inferenza5× più veloce rispetto ai modelli frontier open-source comparabili
Riduzione del costo agentico-30%
Pesi HuggingFacenvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4
Accesso cloudOllama Cloud
Harness di agenti supportatiOpenClaw, Hermes Agent (NousResearch), LangChain

L’architettura ibrida Mamba-Transformer MoE consente di effettuare più cicli di ragionamento nello stesso budget di tempo — ed è questo che spiega il guadagno di velocità. Nemotron 3 Ultra è post-addestrato per compiti complessi: coding avanzato, ricerca approfondita, pianificazione, uso di strumenti e recupero dopo i fallimenti.

NVIDIA pubblica inoltre i dati sintetici e le ricette di post-addestramento, il che consente a team esterni di riprodurre o affinare il processo.

“Today we’re shipping Nemotron 3 Ultra. A 550B MoE frontier-intelligence open model built for long-running agents. It delivers 5x faster inference and lowers the cost of complex agentic tasks by up to 30% versus other open frontier models.”

🇮🇹 Oggi rilasciamo Nemotron 3 Ultra. Un modello MoE open-source di livello frontier da 550 miliardi di parametri, progettato per gli agenti di lunga durata. Offre un’inferenza 5× più veloce e riduce del 30% il costo dei compiti agentici complessi rispetto agli altri modelli frontier open-source.@NVIDIAAI

🔗 HuggingFace — Nemotron 3 Ultra


Dreaming v3 — una nuova architettura di memoria per ChatGPT

4 giugno — OpenAI distribuisce Dreaming v3, un’architettura di memoria autonoma completamente ripensata per ChatGPT. Il sistema risolve i tre limiti del meccanismo precedente: la freschezza delle informazioni, la loro correzione nel tempo e la scalabilità verso gli utenti Free.

ObiettivoDescrizione
Continuità contestualeMemorizzare le informazioni una volta, riutilizzarle in future conversazioni
Rispetto delle preferenzeApplicare i vincoli personali (dieta, fuso orario, ecc.)
Aggiornamento temporaleRevisionare automaticamente le memorie — dopo un viaggio, l’IA sa che siete rientrati

La storia del sistema: le saved memories sono arrivate nell’aprile 2024 (dichiarazione manuale), poi “Dreaming v0” nell’aprile 2025 (sintesi automatica in background). La versione 3 è architettonicamente autonoma, ~5× meno costosa da servire — ed è questa riduzione dei costi che ha reso possibile l’estensione agli utenti Free.

Disponibilità: oggi per gli abbonati Plus e Pro negli Stati Uniti; estensione prevista agli altri paesi e agli utenti Free e Go nelle prossime settimane.

Una pagina “Memory Summary” consente di consultare un riepilogo leggibile di ciò che ChatGPT sa dell’utente, aggiungere o correggere informazioni e definire regole sugli argomenti da affrontare.

🔗 openai.com — Dreaming


Suno Serie D — $400 milioni a una valutazione di $5,4 miliardi

3 giugno — Suno annuncia un round di finanziamento Serie D da $400 milioni, portando la valutazione della piattaforma di musica generativa a $5,4 miliardi. Il round è guidato da Bond Capital, con la partecipazione di nuovi investitori (IVP, USV — Union Square Ventures, Forerunner Ventures) e il sostegno rinnovato di Matrix VC, Lightspeed e Menlo Ventures.

La traiettoria di valutazione è notevole: $125 milioni raccolti nel maggio 2024, poi $250 milioni nel novembre 2025 a $2,45 miliardi di valutazione, e ora $5,4 miliardi — cioè più del doppio in sette mesi.

Suno si afferma come una delle piattaforme creative IA meglio finanziate al mondo, con una missione rimasta costante: permettere a più persone di vivere la gioia di creare musica, senza vincoli tecnici.

“We’re thrilled to announce Suno’s next chapter: a $400M Series D at a $5.4B valuation!”

🇮🇹 Siamo entusiasti di annunciare il prossimo capitolo di Suno: una Serie D da $400 milioni per una valutazione di $5,4 miliardi!@suno

🔗 Blog Suno — The Next Chapter


GitHub Copilot — finestra di contesto da 1M token e ragionamento configurabile

4 giugno — GitHub Copilot integra due nuove capacità principali disponibili da oggi in VS Code, Copilot CLI e nell’app GitHub Copilot.

CapacitàDisponibilitàImpatto crediti IA
Finestra di contesto 1M tokenVS Code, Copilot CLI, app CopilotPiù alto
Livelli di ragionamento configurabiliVS Code, Copilot CLI, app CopilotPiù alto

La finestra di contesto da un milione di token consente di lavorare su codebase più ampie, documenti più lunghi e progetti multi-file complessi senza perdere il filo. Finora, i limiti di contesto costringevano gli sviluppatori a frammentare il proprio lavoro o a semplificare le richieste su progetti complessi.

I livelli di ragionamento configurabili permettono di calibrare l’equilibrio velocità/profondità e di attivare il “pensiero esteso” (extended thinking) per le sfide architetturali e di debug più complesse. GitHub raccomanda di riservare i parametri massimi ai problemi complessi multi-file — l’uso di contesto esteso o di ragionamento superiore consuma più crediti IA per interazione.

L’estensione ad altre superfici Copilot è prevista nelle prossime settimane.

🔗 GitHub Changelog — Larger context windows


GitHub Copilot — aggiornamenti del 4 giugno

Copilot in Visual Studio — Aggiornamento di maggio 2026

4 giugno — L’aggiornamento di maggio 2026 per Copilot in Visual Studio 2026 rafforza la pianificazione e la revisione collaborativa.

  • Agent Plan: esplora il repository in sola lettura, pone domande di chiarimento e genera un piano dettagliato salvato in .copilot/plans/plan-{titre}.md. Un pulsante “Implement plan” passa alla modalità agent.
  • Pannello Skills: elenca tutte le competenze degli agenti rilevate dallo spazio di lavoro e dal profilo utente, con ricerca per nome o parola chiave.
  • Diff riepilogativo multi-file: dopo modifiche Copilot su più file, una vista “change summary” per accettare o annullare le modifiche a livello globale, per file o per blocco.
  • Indicatore di utilizzo della finestra di contesto: icona in alto nella casella di input con opzione “Summarize conversation” per liberare spazio.
  • Aggiunta di commit nel contesto: clic destro su un commit nella Git History per allegarlo come contesto in Copilot Chat.

🔗 GitHub Changelog — Visual Studio May update


Copilot Chat su github.com — contesto PR arricchito (disponibilità generale)

4 giugno — Copilot Chat passa dall’anteprima pubblica alla disponibilità generale per tutti i titolari di una licenza Copilot, con capacità arricchite durante il lavoro su diff e pull request su github.com.

  • Codice e chat fianco a fianco: consultazione della conversazione direttamente accanto al codice, commenti e modifiche in linea senza passare dalla PR alla finestra di chat.
  • Contesto caricato automaticamente: quando una domanda riguarda un diff o una PR, il contesto pertinente viene iniettato automaticamente — niente più copia-incolla di estratti.
  • Accesso: pulsante “Ask about this diff” in alto su ogni diff, oppure tramite il menu a discesa evidenziando una riga di codice.

🔗 GitHub Changelog — Copilot Chat PR context


Claude Code v2.1.162

3 giugno — La versione v2.1.162 di Claude Code introduce diversi miglioramenti UX e importanti correzioni agent.

FunzionalitàDescrizione
claude agents --json + waitingForIl JSON include ora il motivo di blocco di una sessione in attesa (es: prompt di autorizzazione)
Persistenza di /effort confermataConferma esplicita quando il livello scelto diventa il predefinito per le nuove sessioni
Autocomplete slash commandUn clic completa il comando nel prompt senza eseguirlo — Enter per confermare
Remote Control footer pillRemote Control viene visualizzato come pill persistente in basso con link alla sessione
Rinomina Windsurf → Devin DesktopAggiornato in /ide, /terminal-setup, /scroll-speed

Tra le correzioni: blocco silenzioso all’avvio se la directory di configurazione è in sola lettura (Claude Code ora si avvia con una configurazione in memoria), regole WebFetch non applicate sui domini pre-approvati, permessi Windows con backslash e diverse correzioni agent (Ctrl+V immagini, sessioni perse durante il backgrounding, larghezza del terminale su sessioni lunghe).

🔗 Releases Claude Code v2.1.162


ElevenLabs — Flows Agent e partnership Hasbro

Flows Agent in ElevenCreative

4 giugno — ElevenLabs lancia Flows Agent nella sua interfaccia ElevenCreative. L’utente descrive ciò che vuole creare e l’agente costruisce automaticamente il pipeline completo — collegando oltre 50 modelli di immagine e video agli strumenti di voce, musica ed effetti sonori disponibili sulla piattaforma, in un unico canvas unificato.

Una modalità “assist” consente all’agente di richiedere una convalida prima di ogni operazione a pagamento per mantenere il controllo dei costi. I team marketing possono così concatenare le modalità e testare varianti creative attraverso diversi prodotti, lingue e formati senza configurare manualmente ogni fase.

🔗 ElevenLabs Flows


ElevenLabs × Hasbro — voci di personaggi con licenza nell’Iconic Marketplace

3 giugno — ElevenLabs si associa a Hasbro per offrire voci ufficiali di personaggi (My Little Pony, Transformers, G.I. Joe) tramite l’Iconic Marketplace. Le voci sono costruite in collaborazione con Hasbro e i talenti vocali originali, con diritti d’uso chiaramente definiti per sviluppatori, aziende e creatori di applicazioni. L’offerta mira a combinare creatività IA e protezione dei diritti di proprietà intellettuale dei marchi.

🔗 Tweet ElevenLabs × Hasbro


GPT-Rosalind — nuove capacità per le scienze della vita

3 giugno — OpenAI annuncia un importante aggiornamento di GPT-Rosalind, il suo modello specializzato per la ricerca nelle scienze della vita su scala enterprise. Il modello combina le capacità agentiche di GPT-5.5 con un’intelligenza rafforzata in chimica medicinale e genomica.

BenchmarkDominioPunteggio GPT-RosalindPunteggio GPT-5.5Riduzione dei token
LifeSciBenchScienze della vita (6 domini)Migliore
MedChemBenchChimica medicinale27,5%25,1%-7,2%
GeneBenchGenomica21,6%20,4%-31%
LabWorkBenchProtocolli wet lab63,2%55,8%-5,3%

Due nuovi plugin sono ora accessibili a tutti gli utenti Codex: Life Sciences Research plugin (recupero di prove con fonti) e Life Sciences NGS Analysis plugin (workflow bioinformatici scRNA-seq, bulk RNA-seq). Novo Nordisk è il primo partner annunciato. L’accesso viene esteso a livello globale alle organizzazioni qualificate (ricerca scientifica legittima, governance solida).

🔗 openai.com — GPT-Rosalind


Perplexity lancia il Main Street AI Accelerator con la SBA statunitense

4 giugno — Perplexity lancia il Main Street AI Accelerator in partnership con la U.S. Small Business Administration (SBA). Il programma mette a disposizione $25 milioni in crediti Perplexity Computer: $250 di crediti per un massimo di 100 000 aziende idonee, in riferimento al 250º anniversario degli Stati Uniti.

Sono idonee le imprese beneficiarie dei prestiti 7(a), 504 e dei microprestiti della SBA. Le candidature non sono ancora aperte; è disponibile una lista d’attesa sulla pagina dedicata. L’iniziativa rientra nella strategia di Perplexity di estendere Computer al tessuto economico locale americano, dopo aver annunciato la settimana precedente le oltre 400 integrazioni enterprise di Computer (Intuit QuickBooks, Vercel, Shopify, Canva).

🔗 Main Street AI Accelerator


Cohere vince il 1º premio della challenge NATO sull’IA agentica

4 giugno — Cohere ottiene il primo posto nel concorso NATO Agentic AI for Cognitive Warfare Innovation Challenge. Il podio completo:

  1. Cohere (1º posto)
  2. OpenMinds (2º posto)
  3. Ipsos & Thoughtworks (3º posto, ex aequo)

La competizione mette in evidenza il ruolo crescente dell’IA agentica nell’aiutare le nazioni democratiche a comprendere, anticipare e rispondere alle minacce informative. Per Cohere, questo riconoscimento della NATO conferma il suo posizionamento sull’IA sovrana per il settore difesa e governativo — un asse fondamentale dalla sua fusione transatlantica con Aleph Alpha nell’aprile 2026.

🔗 Cohere — Challenge NATO


Pika — Group Chat con agente IA su iOS

4 giugno — Pika lancia il primo Group Chat integrato con un agente IA nella sua app. Gli utenti invitano i propri contatti in una chat di gruppo in cui il Pika Agent partecipa alla conversazione creativa — aiuto per configurare un telefono, creare meme di gruppo, collaborare su brevi formati video. Disponibile da ora su iOS tramite https://pika.me.

🔗 Tweet Pika


Brevi

  • Articolo Anthropic — analytics self-service con Claude — Il team Anthropic pubblica le proprie best practice per costruire agenti di analisi dati self-service con Claude: competenze (skills), fondamenta dei dati e valutazioni. 🔗 Blog Claude

  • Google Antigravity v2.0.11 — Patch di stabilità per l’IDE alimentato da Gemini: due correzioni (blocchi all’avvio e pulsante “Open IDE”), nessuna nuova funzionalità. 🔗 Changelog di Antigravity

  • GitHub Enterprise Teams GA — Enterprise Teams passa in disponibilità generale su GitHub Enterprise Cloud: gruppi definiti una sola volta a livello enterprise, assegnabili a tutte le organizzazioni, con SCIM, GitHub Apps e audit completo. Fino a 2 500 team e 5 000 membri per team. 🔗 Changelog di GitHub

  • Genspark — partner di lancio di Agent365 a Microsoft Build — Il co-fondatore Ray Zhong è intervenuto sul palco al Microsoft Build come partner strategico globale e partner di lancio di Agent365, integrando l’IA agentica nell’infrastruttura enterprise Microsoft esistente. 🔗 Tweet Genspark

  • Cohere sostiene la strategia nazionale sull’IA del Canada — Il CEO Aidan Gomez riafferma il radicamento canadese di Cohere, accogliendo con favore la nuova strategia nazionale sull’IA del Canada come un passo importante verso la sovranità tecnologica e la costruzione dell’IA di prossima generazione nel Paese. 🔗 Tweet Cohere


Cosa significa

L’auto-miglioramento dell’IA passa dallo scenario teorico ai dati interni misurati. La pubblicazione dell’Anthropic Institute non è una speculazione — è un rapporto sul campo con cifre precise: >80% del codice, ×8 di produttività, 76% di tasso di successo sui compiti aperti. La durata del compito autonomo che raddoppia ogni 4 mesi è il segnale più concreto della dinamica in corso. Ciò che veniva discusso nei circoli di sicurezza IA come un rischio futuro è ora documentato come una realtà presente. L’appello a una pausa coordinata — con Anthropic come primo richiedente — illustra la tensione tra competizione commerciale e prudenza regolatoria.

L’open-source di livello frontier cambia di dimensione. Nemotron 3 Ultra con 550 miliardi di parametri — completamente open-source, pesi scaricabili, dati sintetici e ricette pubblicate — ridefinisce ciò che “open-source” significa per i modelli frontier. La velocità di inferenza 5× superiore e la riduzione dei costi del 30% per i compiti agentici non sono marginali: rendono praticabile l’esecuzione di agenti complessi al di fuori dei grandi cloud proprietari. Per i team che costruiscono agenti autonomi, è una nuova infrastruttura che si sta affermando.

L’outillage sviluppatore si consolida attorno all’agente a lunga durata. GitHub Copilot con 1M token di contesto, Claude Code v2.1.162 con waitingFor nel JSON agents, Flows Agent di ElevenLabs che costruisce pipeline multimodali — queste tre annunci condividono lo stesso paradigma: l’agente deve gestire contesti lunghi, comunicare il proprio stato ad altri sistemi e orchestrare più strumenti senza intervento umano. Il “ragionamento configurabile” di Copilot e il /effort persistente di Claude Code rispondono alla stessa domanda: come può l’utente calibrare la profondità di riflessione in base alla complessità del compito?

L’economia dell’IA creativa supera una soglia simbolica. La valutazione di Suno a $5,4 miliardi in sette mesi — con un raddoppio del valore — segnala che gli investitori puntano su una piattaforma di creazione musicale generativa su scala consumer. Combinato con i recenti round nel video (Runway, Pika), il settore della creazione IA dispone ormai di una capitalizzazione comparabile a quella dei grandi editori di software creativi tradizionali. L’ingresso di Hasbro nell’Iconic Marketplace di ElevenLabs illustra come i detentori di diritti di proprietà intellettuale si adattino: invece di bloccare l’IA, la monetizzano in licenza.


Fonti