Cerca

OpenAI confuta una congettura di Erdős vecchia di 80 anni, Cohere Command A+ open-source, NVIDIA Nemotron-Labs-Diffusion

OpenAI confuta una congettura di Erdős vecchia di 80 anni, Cohere Command A+ open-source, NVIDIA Nemotron-Labs-Diffusion

ai-powered-markdown-translator

Articolo tradotto dal francese all’italiano con gpt-5.4-mini.

Vedi progetto su GitHub ↗

Il 20 maggio 2026, l’IA irrompe nelle matematiche fondamentali: un modello OpenAI confuta una congettura di Paul Erdős formulata nel 1946, su una dimostrazione di 125 pagine validata da matematici tra cui il medagliato Fields Tim Gowers. Sul fronte dei modelli, Cohere pubblica Command A+ in open-source Apache 2.0 (architettura MoE 218B/25B attivi), NVIDIA lancia Nemotron-Labs-Diffusion con generazione parallela di token, e Stability AI svela Stable Audio 3.0 (4 modelli open weights). Sul fronte degli strumenti, GitHub Copilot evolve su quattro direttrici simultaneamente, e Claude Code esce in due versioni in 24 ore.


OpenAI confuta una congettura di Erdős vecchia di 80 anni

20 maggio — OpenAI ha pubblicato un risultato inedito: un modello interno di ragionamento generale ha risolto il problema delle distanze planari unitarie (planar unit distance problem), una questione aperta da quando Paul Erdős la pose nel 1946. Questo problema interroga il numero massimo di coppie di punti a distanza esattamente 1 tra n punti nel piano. Dagli anni 1940, la comunità matematica pensava che le costruzioni su griglie quadrate di Erdős fossero sostanzialmente ottimali.

Il modello ha prodotto una dimostrazione che mostra l’esistenza di una famiglia infinita di configurazioni che supera il limite congetturale, con un esponente δ = 0,014 stabilito da Will Sawin (Princeton). La svolta si basa su uno strumento matematico inatteso: le torri di corpi di classi infinite e la teoria di Golod-Shafarevich, provenienti dalla teoria algebrica dei numeri, applicate a un problema di geometria euclidea elementare. Questa connessione tra due campi a priori distanti è, secondo i matematici coinvolti, il cuore dell’originalità del risultato.

AspettoDettaglio
ProblemaDistanze planari unitarie (Erdős, 1946)
Limite precedenteCrescita in n^(1+C/loglog(n)) (Spencer-Szemerédi-Trotter, 1984)
Nuovo risultaton^(1+δ), δ = 0,014
Strumento matematicoTeoria algebrica dei numeri (Golod-Shafarevich)
ModelloModello interno di ragionamento generale (non nominato)
Lunghezza del chain of thought125 pagine
ValidazioneGruppo di matematici esterni + articolo compagno

Ciò che rende il risultato particolarmente notevole: non è stato prodotto da un sistema addestrato specificamente per la matematica o mirato a questo problema. È un modello ad uso generale, valutato su una raccolta di problemi di Erdős nell’ambito di un’esplorazione più ampia delle capacità di ricerca autonoma.

Tim Gowers (medaglia Fields) definisce il risultato un “milestone in AI mathematics”. Arul Shankar (Princeton) va oltre:

“In my opinion this paper demonstrates that current AI models go beyond just helpers to human mathematicians – they are capable of having original ingenious ideas, and then carrying them out to fruition.”

🇮🇹 A mio avviso, questo articolo dimostra che gli attuali modelli di IA vanno oltre il semplice ruolo di assistenti per i matematici — sono capaci di avere idee originali e ingegnose, e di portarle a termine. — [Arul Shankar, teorico dei numeri, Princeton]

OpenAI vede in questo risultato un segnale per la ricerca fondamentale: se un modello può mantenere un ragionamento complesso su 125 pagine e collegare ambiti matematici distanti, queste capacità sono trasferibili alla biologia, alla fisica, ai materiali e alla medicina.

🔗 Articolo OpenAI


Cohere Command A+ — MoE flagship open-source

20 maggio — Cohere lancia Command A+, il suo modello più potente a oggi, in open-source sotto licenza Apache 2.0. L’architettura mixture-of-experts (sparse MoE) mobilita 218B parametri totali ma solo 25B attivi a ogni inferenza, permettendogli di girare su due GPU NVIDIA H100 o su una singola GPU Blackwell (B200) in quantizzazione W4A4.

Command A+ unifica sotto un unico modello le capacità precedentemente distribuite tra Command A Reasoning, Command A Vision e Command A Translate. Supporta 48 lingue (contro 23 nelle versioni precedenti), con un tokenizzatore migliorato per le lingue non europee (+20% per l’arabo, +16% per il coreano, +18% per il giapponese).

BenchmarkCommand A+Command A Reasoning
τ²-Bench Telecom85%37%
Terminal-Bench Hard25%3%
MMMU75,1%N/A
MathVista80,6%73,5%
North Agentic QA+20% miglioramentoriferimento
North Data Analysis+32% miglioramentoriferimento

Il modello è fino a 2× più veloce e 30% meno latente di Command A Reasoning, con un decodifica speculativa (speculative decoding) che offre un guadagno aggiuntivo di 1,5–1,6×. Disponibile su Hugging Face e tramite vLLM. Il punteggio di 37 sull’Artificial Analysis Intelligence Index ne fa il migliore tra i modelli open-source.

“Introducing: Cohere Command A+ — We’ve created our most powerful LLM yet, optimized it to run on as little hardware as possible, and released it open-source for all.”

🇮🇹 Ecco Cohere Command A+ — abbiamo creato il nostro LLM più potente a oggi, ottimizzato per funzionare con la minor quantità possibile di hardware, e lo pubblichiamo in open-source per tutti.@cohere su X

🔗 Blog di Cohere


Gemini for Science — L’IA come partner della scoperta scientifica

20 maggio — Annunciato durante il Google I/O 2026 e twittato il 20 maggio, Gemini for Science è una suite di strumenti sperimentali per la ricerca scientifica. Di fronte all’esplosione dei dati, l’obiettivo è consentire ai ricercatori di collegare informazioni che nessun individuo può elaborare da solo.

Vengono svelati tre strumenti sperimentali:

StrumentoBaseFunzione
Hypothesis GenerationCo-ScientistScoperta e affinamento di nuove ipotesi
Computational DiscoveryAlphaEvolve + ERATest di migliaia di variazioni di codice in parallelo
Science Skills30+ modelli bioBundle integrato nelle piattaforme agentiche (Antigravity)

Computational Discovery è lo strumento più tecnico: genera e valuta migliaia di variazioni di codice in parallelo, consentendo di testare nuovi approcci di modellazione in epidemiologia, chimica o biologia computazionale in una frazione del tempo abituale.

Science Skills integra dati di oltre 30 modelli principali nelle scienze della vita e database, interfacciandosi con le piattaforme agentiche per automatizzare workflow manuali complessi in pochi minuti.

Il progetto è stato sviluppato con 100+ istituzioni partner, da studenti di dottorato a vincitori del Nobel.

🔗 Annuncio @GoogleAI


NVIDIA Nemotron-Labs-Diffusion — Architettura di diffusione dei token

20 maggio — NVIDIA annuncia Nemotron-Labs-Diffusion, un modello di linguaggio che genera token in modo parallelo tramite diffusione, a differenza dei LLM autoregressivi classici che producono un token alla volta. Questa architettura — ispirata ai modelli di diffusione per la generazione di immagini — mira ad accelerare l’inferenza mantenendo la qualità delle uscite.

L’approccio è fondamentalmente diverso dal paradigma standard transformer: invece di predire sequenzialmente ogni token condizionato ai precedenti, il modello itera in parallelo su un’intera sequenza di token rumorosa, fino alla convergenza. I vantaggi teorici includono una latenza ridotta sulle uscite lunghe e una migliore parallelizzazione su GPU.

AspettoClassico (autoregressivo)Nemotron-Labs-Diffusion
GenerazioneToken per token, sequenzialeParallela sull’intera sequenza
Latenza uscite lungheCresce linearmentePotenzialmente ridotta
ParadigmaGPT-styleDiffusion-style

Il rapporto tecnico completo accompagna il rilascio. Si tratta di un contributo di ricerca di NVIDIA Labs, posizionato come alternativa architetturale al modello dominante transformer autoregressivo — un terreno di ricerca attivo dall’emergere dei modelli di diffusione testuale come MDLM e Plaid.

🔗 Annuncio @NVIDIAAI


Stability AI — Stable Audio 3.0 (famiglia open weights)

20 maggio — Stability AI pubblica Stable Audio 3.0, una famiglia di 4 modelli audio open weights con licenza commerciale. La gamma copre l’intero spettro di deployment, dai dispositivi embedded all’API enterprise.

ModelloLunghezza maxDeploymentOpen weights
Small SFXbreveon-device
Small2 minon-device
Medium6:20cloud/local
Large6:20+API/enterpriseNo

I modelli Small SFX, Small e Medium sono disponibili su Hugging Face. Tutti i dati di addestramento sono completamente licenziati, con partnership annunciate con Universal Music Group e Warner Music Group. Le funzionalità avanzate includono il supporto LoRA training per il fine-tuning personalizzato, e una modalità audio inpainting (editing single-segment, multi-segment, continuation causale).

“We want to foster the same kind of community-driven innovation in audio that we sparked in image generation with the launch of Stable Diffusion.”

🇮🇹 Vogliamo favorire lo stesso tipo di innovazione guidata dalla comunità nell’audio che abbiamo innescato nella generazione di immagini con il lancio di Stable Diffusion.Stability AI


GitHub Copilot evolve su quattro fronti

Selezione automatica adattiva del modello in VS Code

20 maggio — L’opzione “Auto” di Copilot VS Code seleziona ora il modello ottimale in base alla natura del compito: ragionamento complesso, generazione di codice semplice, debug o orchestrazione di strumenti. La selezione si basa su metriche in tempo reale di disponibilità e affidabilità. Vantaggio pratico: riduzione del 10% del moltiplicatore di richieste premium quando si usa Auto, senza configurazione necessaria.

🔗 Changelog GitHub

Ricerca semantica delle issue in linguaggio naturale

20 maggio — Copilot Chat sul web integra un indice semantico delle issue: uno sviluppatore può cercare “i bug di rendering mobile segnalati il mese scorso” senza conoscere il titolo esatto, e ottenere risultati raggruppati per contesto. Disponibile in disponibilità generale per tutti i piani Copilot.

🔗 Changelog GitHub

Rimozione dei modelli Gemini da Copilot Chat web

20 maggio — Tutti i modelli Gemini vengono rimossi da Copilot Chat su github.com, insieme a GPT-5.2 Codex e GPT-5.4 nano. Sul web restano disponibili solo OpenAI e Claude. GitHub giustifica la scelta con la coerenza della qualità delle risposte. Gemini resta disponibile negli IDE e nell’API.

🔗 Changelog GitHub

Fix with Copilot — applicazione raggruppata dei feedback di code review

19 maggio — Il pulsante “Implement suggestion” viene rinominato “Fix with Copilot” con una nuova finestra di dialogo (scelta del modello, branch target, istruzioni personalizzate). Un nuovo pulsante “Fix batch with Copilot” consente di raggruppare più commenti di code review e affidarli simultaneamente al Copilot cloud agent, riducendo l’attrito sulle PR con molti commenti.

🔗 Changelog GitHub


Claude Code v2.1.144 e v2.1.145

19 maggio — Claude Code pubblica due versioni in 24 ore con un insieme consistente di nuove funzionalità e correzioni.

La versione 2.1.144 migliora la gestione delle sessioni in background: il comando /resume mostra ora le sessioni --bg, e le notifiche di fine sub-agent includono la durata (ad es. “Agent completed · 3h 2m 5s”). Il comando /model si applica solo alla sessione corrente (premere d per impostare il default permanente). La rinomina “extra usage” → “usage credits” chiarisce la terminologia, e la correzione di un blocco di avvio fino a 75 secondi quando api.anthropic.com è inaccessibile (VPN, firewall) migliora l’esperienza in azienda.

La versione 2.1.145 si distingue per l’introduzione di claude agents --json, un comando pensato per l’integrazione negli script shell (tmux-resurrect, barre di stato, selettori di sessione). Il tracciamento OpenTelemetry è arricchito con agent_id e parent_agent_id negli span, consentendo una gerarchia corretta dei sub-agent. La schermata /plugin mostra ora il contenuto completo (comandi, agenti, skills, hook, server MCP/LSP) prima dell’installazione. Gli hook Stop/SubagentStop ricevono due nuovi campi: background_tasks e session_crons.

🔗 CHANGELOG Claude Code


Anthropic apre la riflessione sulla formazione del carattere dell’IA

19 maggio — Anthropic ha pubblicato un articolo che dettaglia un’iniziativa di dialoghi regolari con filosofi, clero ed eticisti provenienti da oltre 15 tradizioni religiose e culturali. L’obiettivo è arricchire la riflessione su cosa significhi formare il carattere di un sistema di IA — attingendo a secoli di pensiero accumulato su virtù e vita buona, senza allineare Claude a una tradizione particolare.

Un risultato sperimentale merita attenzione: uno strumento che Claude può invocare durante un compito per rileggere i propri impegni etici. Usato spontaneamente prima di azioni ad alto impatto, ha mostrato “una marcata riduzione dei comportamenti non allineati” nelle valutazioni interne. I prossimi passi includeranno scambi con giuristi, psicologi e istituzioni civiche.

🔗 Articolo Anthropic


Cohere — MOU con Indra Group e Multiverse Computing

20 maggio — Cohere firma due accordi quadro (MOU) durante la visita di Stato del Re Felipe VI di Spagna in Canada. Il primo unisce Cohere a IndraMind (divisione IA del gruppo Indra, difesa e digitalizzazione spagnole) per costruire un ecosistema di IA sovrana che includa adattamenti linguistici per le cinque lingue ufficiali della Spagna. Un capitolo difesa prevede capacità di analisi e pianificazione per esercitazioni multinazionali. Il secondo coinvolge Multiverse Computing (ottimizzazione tramite IA di ispirazione quantistica, Spagna/Canada) per esplorare opportunità commerciali in Europa e in Canada.

“Enterprises no longer want to rent AI — they want to own it.”

🇮🇹 Le aziende non vogliono più noleggiare l’IA — vogliono possederla.Aidan Gomez, cofondatore e CEO di Cohere


Perplexity — Compressione del contesto sensibile alla query in produzione

20 maggio — Perplexity distribuisce in produzione un sistema di compressione del contesto (query-aware context compression) che riduce i token di contesto fino al 70% migliorando al contempo la precisione delle risposte. Il principio: un modello leggero estrae chirurgicamente i passaggi pertinenti alla query prima di passarli al LLM principale, eliminando pubblicità, metadati e contenuti fuori tema.

MetricaValore
Riduzione dei token di contestofino al 70%
Incremento del contenuto vitale per estratto+63%
Riduzione della latenza di inferenza35–40%
Riduzione del calcolo GPU aggregato40–45%
Latenza in produzione (p99)< 20 ms

Il backbone pplx-diffusion (17 strati, distillato da 28 strati) prevede in parallelo quali segmenti conservare senza generazione di testo — un approccio estrattivo che garantisce la fedeltà delle citazioni. Su SimpleQA, il preset “medium” con compressione raggiunge il 95% di precisione con soli 200 token in media per documento.

🔗 Annuncio Perplexity


ElevenLabs — Speech Engine, un agente vocale in un prompt

20 maggio — ElevenLabs lancia Speech Engine, una pipeline vocale unificata (sintesi vocale + trascrizione + orchestrazione) che consente agli sviluppatori di trasformare un agente conversazionale testuale in un agente vocale completo con un solo prompt. Disponibile in ElevenAPI, il prezzo è di 8 centesimi al minuto con sconti volumetrici. Migrazione possibile verso ElevenAgents per canali di distribuzione aggiuntivi con monitoraggio e analytics.

🔗 Annuncio ElevenLabs


Luma Agents integra Seedance 2.0

19 maggio — Luma Agents integra Seedance 2.0, il modello di generazione video di ByteDance, nella sua piattaforma di agenti creativi. Stesso workflow degli altri modelli già integrati. Questa integrazione amplia la scelta di modelli accessibili tramite Luma Agents, posizionando la piattaforma come hub di orchestrazione multi-modello per il video IA.

🔗 Annuncio Luma


Kling AI a Cannes — House of David, primo film di Hollywood con IA su scala industriale

20 maggio — Al Festival di Cannes 2026, Kling AI conferma l’uso industriale della sua tecnologia in House of David (Prime Video): 44 milioni di spettatori globali, top 10 delle nuove serie negli Stati Uniti, numero 1 su Prime Video US. È la prima produzione hollywoodiana a riconoscere pubblicamente l’integrazione della generazione video IA nel proprio pipeline di produzione su larga scala, con piani coerenti che rispondono a rigorosi standard industriali.

🔗 Annuncio Kling AI


Brevi

  • Running Guide Agent — Google DeepMind — Agente IA personale dedicato all’allenamento alla corsa, presentato come “un passo verso una corsa senza limiti”. 🔗 Blog DeepMind

  • Midjourney V8.1 — flag --no reintrodotto — Il flag anti-prompting è tornato in V8.1 per escludere elementi dalle immagini generate (es: --no people). 🔗 Annuncio @midjourney

  • Anthropic /usage rinnovata in Claude Code — Boris Cherny conferma una ristrutturazione della UI di /usage per visualizzare meglio il consumo di token in risposta a un utente. 🔗 fonte

  • MiniMax Speech 2.8 Turbo — 600+ voci su Together AI — Oltre 600 nuove voci Speech 2.8 Turbo ora disponibili sulla piattaforma Together AI. 🔗 Annuncio @MiniMax_AI


Cosa significa

Ricerca fondamentale e IA autonoma. La risoluzione della congettura di Erdős da parte di un modello OpenAI a uso generale non è aneddotica. Ciò che colpisce i matematici coinvolti è la natura del risultato: una connessione inattesa tra due rami della matematica (teoria algebrica dei numeri e geometria discreta), mantenuta su 125 pagine di ragionamento coerente. Insieme a Gemini for Science (sviluppato con 100+ istituzioni), la tendenza è chiara: l’IA inizia a integrarsi non più soltanto come strumento di trattamento dei dati scientifici, ma come partner di scoperta capace di generare ipotesi originali.

Architetture alternative al paradigma autoregressivo. Due annunci di oggi mettono in discussione il modello dominante in stile GPT. NVIDIA Nemotron-Labs-Diffusion genera token in parallelo tramite diffusione anziché in sequenza. Stable Audio 3.0 di Stability AI dimostra che la diffusione produce risultati musicali di alta qualità con modelli open weights su 4 livelli di deployment. La convergenza di questi approcci suggerisce che la diffusione non è più confinata alla generazione di immagini — sta diventando una seria architettura concorrente per testo e audio.

Sovranità e IA aziendale. Command A+ (MoE 218B open-source, Apache 2.0, 2× H100) e i MOU di Cohere con Indra Group e Multiverse Computing illustrano una tendenza di fondo: le grandi organizzazioni — governi, difesa, settore regolamentato — chiedono di distribuire i propri modelli nella propria infrastruttura. La combinazione di un’architettura MoE efficiente (25B attivi su 218B totali) e di una licenza Apache 2.0 fa di Command A+ il modello open-source meglio posizionato per i deployment sovrani a fine maggio 2026.

Pressione crescente sugli strumenti per sviluppatori. Claude Code 2.1.144 e 2.1.145, i quattro aggiornamenti simultanei di GitHub Copilot e la compressione del contesto di Perplexity (-70% token, -40% GPU) sono segnali coerenti: la competizione si sposta dalla qualità grezza dei modelli verso l’ergonomia degli strumenti, la scriptabilità (claude agents —json), il costo di inferenza (Auto model selection -10%, pplx-diffusion) e la robustezza in produzione (correzione del blocco VPN in Claude Code).


Fonti