DeepSeek-V4 Preview, Claude chimico (NMR), distinzioni CVPR 2026

Una settimana segnata da due annunci di primo piano: DeepSeek pubblica il suo nuovo modello di punta V4 Preview con una finestra di contesto da un milione di token a prezzi molto bassi, e Anthropic dimostra che Opus 4.7 è competitivo con i software NMR di riferimento nella chimica di sintesi. Sul fronte degli strumenti per sviluppatori, Claude Code continua a rilasciare nuove versioni e GitHub Copilot apre la sua API REST per i task agentici.

DeepSeek-V4 Preview — modelli V4 Flash e V4 Pro, contesto 1M token

6 giugno — DeepSeek pubblica una versione preliminare (preview) di DeepSeek-V4, il suo nuovo modello di punta, in due varianti: deepseek-v4-flash e deepseek-v4-pro. Entrambe espongono una finestra di contesto di 1 milione di token e un output massimo di 384 000 token — capacità che si collocano nella fascia alta del mercato frontier.

Il banner ufficiale dell’annuncio sottolinea il posizionamento del modello sul ragionamento e sulle capacità agentiche (Agent capabilities) :

🎉 DeepSeek-V4 Preview is here with stronger Agent capabilities and top-tier reasoning. Now available on Web, App, and API.

🇮🇹 DeepSeek-V4 Preview è disponibile con capacità agentiche potenziate e un ragionamento di prim’ordine. Disponibile subito su Web, nell’app e nell’API. — deepseek.com (banner ufficiale dell’annuncio)

Ogni modello supporta una modalità di ragionamento (thinking, attivata per default) e una modalità standard (non-thinking). La disponibilità è immediata sul web, sull’app mobile e sull’API. I vecchi identificatori deepseek-chat e deepseek-reasoner saranno deprecati il 24 luglio 2026; ora corrispondono rispettivamente alle modalità non-thinking e thinking di deepseek-v4-flash.

Dettaglio notevole per gli sviluppatori: l’API DeepSeek espone un endpoint compatibile con il formato Anthropic (https://api.deepseek.com/anthropic) oltre al formato OpenAI — il che consente di usare V4 in strumenti come Claude Code tramite la variabile ANTHROPIC_BASE_URL senza modifiche al codice.

🔗 deepseek.com

Tariffe ufficiali (api-docs.deepseek.com)

Modello	Contesto	Max output	Input cache miss /1M	Input cache hit /1M	Output /1M	Concorrenza
deepseek-v4-flash	1M	384K	$0,14	$0,0028	$0,28	2 500
deepseek-v4-pro	1M	384K	$0,435	$0,003625	$0,87	500

Queste tariffe restano ben al di sotto dei modelli frontier occidentali comparabili: flash a $0,28 / 1M token in output, pro a $0,87 — cioè un ordine di grandezza più economico rispetto alle offerte GPT-5.x o Claude 4.x a capacità equivalenti.

🔗 Tariffe ufficiali

Claude chimico — Opus 4.7 è competitivo con ChemDraw e MestReNova sull’NMR

5 giugno — Anthropic pubblica un articolo scientifico dettagliato sul suo programma di IA per la chimica. Lo studio, condotto da David Kamber, chimico presso Anthropic, confronta le prestazioni di Claude sulla spettroscopia NMR (Nuclear Magnetic Resonance) — lo strumento analitico di riferimento nella chimica di sintesi — contro i software dedicati ChemDraw e MestReNova.

Protocollo di valutazione: 20 composti estratti da prepubblicazioni ChemRxiv successive alle date di addestramento dei modelli, distribuiti in 4 famiglie di strutture (chloropyridazines, maleimmidi, spirochetoni, sulfonamidi silylati), con 5 composti per famiglia.

Predizione diretta (spettro simulato a partire da una struttura):

Strumento	Errore ¹H (MAE)	Errore ¹³C (MAE)
Opus 4.7	±0,079 ppm (migliore)	±1,37 ppm (a pari merito con MestReNova)
MestReNova	—	±1,48 ppm
Opus 4.6	Intermedio	Intermedio
Sonnet 4.6	Più basso	Più basso

Opus 4.7 è il più preciso sull’idrogeno (¹H) e a pari merito con MestReNova sul carbonio (¹³C). Sulla forma dei picchi (splitting patterns), i modelli Claude prevedono la spaziatura entro una tolleranza di 0,5 Hz per circa l’80 % dei casi, contro il 26-35 % per ChemDraw e MestReNova.

Elucidazione inversa (struttura a partire da uno spettro): Opus 4.7 recupera correttamente 8/8 strutture semplici a ogni tentativo a partire dal solo spettro e dalla formula molecolare. Sulle 7 strutture complesse, con indicazione del materiale di partenza, raggiunge 3/3 tentativi per 4 di esse, e 2/3 per le altre.

I limiti dichiarati dagli autori: solo 20 composti, 4 famiglie strutturali, assenza di NMR 2D, nessuna stereochimica, 3 solventi testati. Anthropic annuncia l’estensione del programma alla lettura di strutture da brevetti, alla retrosintesi (retrosynthesis) e ai meccanismi di reazione.

🔗 Articolo scientifico Anthropic

Claude Code & Cowork — settimana intensa di aggiornamenti

Cowork — limiti di utilizzo raddoppiati fino al 5 luglio

6 giugno — Anthropic raddoppia temporaneamente i limiti di utilizzo di Claude Cowork per tutti gli abbonati a pagamento, validi fino al 5 luglio 2026. La misura si applica ai limiti di throughput su 5 ore (5-hour rate limits).

Dettaglio	Valore
Fattore di aumento	×2
Durata	6 giugno → 5 luglio 2026
Piani interessati	Tutti i piani a pagamento
Accesso	App desktop Claude + claude.com/cowork

We doubled Claude Cowork usage limits for the next month. This applies to your 5-hr rate limits.

🇮🇹 Abbiamo raddoppiato i limiti di utilizzo di Claude Cowork per il prossimo mese. Questo si applica ai vostri limiti di throughput su 5 ore. — @bcherny su X

🔗 Annuncio @claudeai

Claude Code v2.1.163 — versioni gestite, /plugin list, hook arricchiti

4 giugno — La versione 2.1.163 di Claude Code introduce diverse funzionalità per gli amministratori e gli sviluppatori di plugin:

Funzionalità	Dettaglio
`requiredMinimumVersion` / `requiredMaximumVersion`	Impone un intervallo di versioni consentite; rifiuto di avvio fuori intervallo
`/plugin list`	Elenca i plugin installati con filtri `--enabled` e `--disabled`
Hook `Stop` / `SubagentStop`	Restituiscono `hookSpecificOutput.additionalContext` senza generare errori
Skills — escaping `\$`	Includere un `$` letterale prima di una cifra nei corpi dei comandi
MCP stdio	Riceve lo stesso `CLAUDE_CODE_SESSION_ID` degli hook e di Bash durante `--resume`

🔗 Release v2.1.163

Claude Code v2.1.166 — fallbackModel, sicurezza tra sessioni, controllo del ragionamento

5-6 giugno — La versione funzionalmente più ricca del lotto:

Funzionalità	Dettaglio
`fallbackModel`	Fino a 3 modelli di fallback provati in ordine; opzione CLI `--fallback-model` in modalità interattiva
Pattern glob in `deny`	`"*"` blocca tutti gli strumenti; i nomi sconosciuti generano un avviso
Sicurezza `SendMessage`	I messaggi inoltrati da altre sessioni non trasportano più autorità utente
`MAX_THINKING_TOKENS=0`	Disattiva il ragionamento sui modelli che ragionano per default tramite l’API Claude
`claude update`	Annuncia la versione target prima del download

🔗 Release v2.1.166

GitHub Copilot — plugin enterprise e API REST agentica

Plugin gestiti dall’azienda in VS Code in anteprima pubblica

5 giugno — La versione 1.122 di VS Code estende ai client VS Code la funzionalità dei plugin gestiti dall’azienda, precedentemente disponibile solo in Copilot CLI. Gli amministratori possono ora configurare e distribuire plugin a tutta la loro organizzazione tramite un file settings.json collocato in .github-private/.github/copilot/settings.json.

Aspetto	Dettaglio
Piani	Copilot Business, Copilot Enterprise
Client supportati	VS Code v1.122+, Copilot CLI
Tipi di plugin	Agenti personalizzati, skills, hook, configurazioni MCP
Installazione	Automatica all’autenticazione

🔗 Changelog GitHub

Agent Tasks REST API — anteprima pubblica per Pro, Pro+ e Max

4 giugno — L’API REST Agent Tasks permette di avviare e seguire le attività dell’agente cloud Copilot in modo programmatico. I casi d’uso coperti: refactoring in massa su molti repository, creazione di nuovi repository da un portale sviluppatori interno, preparazione automatizzata di nuove release.

Aspetto	Dettaglio
Piani	Copilot Pro, Pro+, Max
Stato	Anteprima pubblica
Autenticazione	PAT classici, PAT granulari, token OAuth

🔗 Changelog GitHub

OpenAI Codex & ragionamento matematico

Codex CLI 0.137.0 — Multi-agent v2 e limiti enterprise

4 giugno — Codex CLI passa alla versione 0.137.0 con diversi miglioramenti per i workflow multi-agent e le distribuzioni enterprise:

Novità	Dettaglio
Multi-agent v2	Ogni thread conserva la propria scelta di motore di esecuzione (runtime); metadati più puliti
Limiti di credito enterprise	Visualizzazione dei massimali mensili + applicazione di bundle di configurazione cloud
Controllo remoto	Pairing (pairing) e gestione accessi tramite app-server v2
Strumenti web e image	Disponibili in più flussi in modalità code

🔗 Codex Changelog

Congettura di Erdős — un modello di ragionamento trova un controesempio dopo 80 anni

4 giugno — OpenAI annuncia che uno dei suoi modelli di ragionamento ha trovato un controesempio (counterexample) a una congettura matematica di Erdős vecchia di 80 anni. L’annuncio prende la forma dell’episodio 20 del podcast OpenAI, nel quale tre ricercatori — Alex Wei, Hongxun Wu e @wjmzbmr1 — raccontano la scoperta e spiegano come matematici e modelli possano collaborare per produrre nuove conoscenze. Il podcast ha generato oltre 227 000 visualizzazioni su X.

What happened when one of our models found a counterexample to an 80-year-old Erdős conjecture? Researchers @alexwei_, @HongxunWu, and @wjmzbmr1 shared the story on the OpenAI Podcast with @AndrewMayne and explained how mathematicians and models can work together to make new discoveries.

🇮🇹 Che cosa è successo quando uno dei nostri modelli ha trovato un controesempio a una congettura di Erdős vecchia di 80 anni? I ricercatori @alexwei_, @HongxunWu e @wjmzbmr1 hanno raccontato questa storia nel podcast OpenAI con @AndrewMayne, spiegando come matematici e modelli possano collaborare per fare nuove scoperte. — @OpenAI su X

Ricerca & CVPR 2026 — Meta SAM 3D e NVIDIA PixelDiT premiati

La conferenza CVPR 2026 (Computer Vision and Pattern Recognition) premia due lavori di ricerca provenienti dall’industria IA.

Meta AI SAM 3D — Menzione d’Onore Best Paper

5 giugno — Il team SAM 3D di Meta AI riceve una Menzione d’Onore Best Paper (Best Paper Honorable Mention) al CVPR 2026. SAM 3D è un’estensione tridimensionale del modello Segment Anything (SAM), che consente la segmentazione di oggetti in scene 3D — una capacità chiave per la robotica, la realtà aumentata e la guida autonoma.

🔗 Tweet @AIatMeta · 🔗 Paper arXiv

NVIDIA PixelDiT — finalista Best Paper

6 giugno — NVIDIA Research annuncia che PixelDiT (Pixel Diffusion Transformers) è stato selezionato come finalista del miglior paper al CVPR 2026. L’architettura è un’innovazione di pipeline: mentre tutti gli attuali modelli di diffusione (Stable Diffusion, FLUX, ecc.) comprimono l’immagine tramite un autoencoder prima della diffusione — introducendo una perdita di qualità cumulativa — PixelDiT opera direttamente nello spazio pixel in un unico passaggio, eliminando questo pretrattamento. Questo approccio single-stage elimina la degradazione intermedia e semplifica la pipeline.

🔗 Tweet @NVIDIAAI

NotebookLM — Source Attribution e Grok su Cloudflare AI Gateway

NotebookLM lancia la Source Attribution

4 giugno — Google lancia la Source Attribution in NotebookLM, una funzionalità molto richiesta. Gli utenti possono ora vedere la formula esatta — combinazione di prompt e fonti — usata per generare ogni artefatto. Un pulsante « Iterate » permette di modificare direttamente la formula e personalizzare gli artefatti prodotti, rendendo il processo di generazione trasparente e riproducibile.

Elemento	Dettaglio
Funzionalità	Source Attribution
Pulsante chiave	« Iterate » per personalizzare
Disponibilità	NotebookLM (web)

🔗 Annuncio @NotebookLM

Grok disponibile su Cloudflare AI Gateway

4 giugno — xAI annuncia che i suoi modelli Grok (LLM, audio, immagine e video) sono accessibili tramite Cloudflare AI Gateway. La fatturazione è centralizzata tramite Cloudflare, senza configurazione aggiuntiva dell’autenticazione né chiavi API xAI distinte da gestire — una semplificazione dell’integrazione per gli sviluppatori già nell’ecosistema Cloudflare.

🔗 Annuncio @xai

Brevi

Claude Code v2.1.165 — Correzioni di bug, miglioramenti di affidabilità senza nuove funzionalità. 🔗 Release
Claude Code v2.1.167 — Correzioni di bug. 🔗 Release
Claude Code v2.1.168 — Ultima versione disponibile (7 giugno), correzioni di bug e affidabilità. 🔗 Release
GPT-5.2 e GPT-5.2-Codex deprecati in Copilot — A partire dal 5 giugno, questi modelli vengono sostituiti da GPT-5.5 e GPT-5.3-Codex. GPT-5.2 resta disponibile solo nella revisione del codice. 🔗 Changelog
Fix with Copilot per GitHub Actions esteso — Gli abbonati Pro, Pro+ e Max possono correggere con un clic un job GitHub Actions fallito (analisi + PR correttiva). 🔗 Changelog
API di gestione dei budget GitHub in GA — Ciclo di vita completo dei budget via API (creazione, aggiornamento, eliminazione), usage summary filtrabile per org, repository, prodotto o SKU. 🔗 Changelog
API dei report di utilizzo della fatturazione GitHub in GA — Generazione programmatica di report CSV per gli amministratori GitHub Enterprise. 🔗 Changelog
Suno — guida Voices « Your Voice, Reimagined » — 6 consigli pratici per usare la funzionalità Voices (cantare con la propria voce, disponibile per gli abbonati a pagamento). 🔗 Articolo Suno
Codex — aggiornamenti di qualità della vita (5 giugno) — Ricerca nelle impostazioni per categoria, persistenza dello stato tra i riavvii (bozze, zoom, indicatori non letti), rifinitura generale dell’interfaccia. 🔗 Tweet @OpenAIDevs
Codex — scheda profilo personalizzata — La scheda di condivisione del profilo si adatta al tema scelto e include l’animale virtuale (pet) selezionato. 🔗 Tweet @OpenAIDevs
Perplexity integra Nemotron 3 Ultra (NVIDIA) — Modello open source NVIDIA per agenti di lunga durata disponibile per gli abbonati Pro e Max. 🔗 Tweet @perplexity_ai
Cohere al webinar Far-Field ASR Leaderboard (HuggingFace) — Cohere Transcribe presentato durante il webinar FFASR Leaderboard l’11 giugno 2026. 🔗 Tweet @cohere

Cosa significa

La corsa ai modelli open-weight low-cost si intensifica. DeepSeek-V4 Preview fissa un nuovo prezzo minimo per le finestre di contesto da 1M token: $0,28 / 1M token in output per la versione flash, $0,87 per la versione pro. Queste tariffe esercitano una pressione diretta sugli attori occidentali che fatturano ordini di grandezza in più per capacità comparabili. La compatibilità Anthropic dell’API DeepSeek è un segnale forte: DeepSeek gioca la carta dell’interoperabilità per abbassare il costo di migrazione.

L’outillage agentico per sviluppatori raggiunge una maturità operativa. In una settimana, Claude Code rilascia quattro versioni (v2.1.163, .165, .166, .168), GitHub Copilot apre la sua API REST per le attività agentiche ed estende i plugin enterprise a VS Code, e OpenAI pubblica Codex CLI 0.137.0 con il multi-agent v2. Non è più sperimentazione: i tre attori forniscono funzionalità di governance (controllo di versione amministrato, limiti di crediti, sicurezza tra sessioni) che segnalano una distribuzione su scala enterprise.

L’IA applicata alla scienza produce i suoi primi risultati misurabili. Lo studio NMR di Anthropic porta qualcosa di raro: un confronto rigoroso, su dati non visti, tra un modello linguistico generale e software dedicati al lavoro del chimico. Opus 4.7 ottiene il miglior errore assoluto sull’idrogeno e l’80 % di precisione sulla forma dei picchi — contro il 26-35 % degli strumenti specializzati. Non è ancora una sostituzione di ChemDraw, ma è la dimostrazione che i modelli frontier possono competere con strumenti verticali senza fine-tuning specifico.

La visione artificiale beneficia di un doppio riconoscimento accademico. Il CVPR 2026 distingue simultaneamente SAM 3D (Meta) e PixelDiT (NVIDIA). Questi due riconoscimenti riflettono direzioni tecniche complementari: SAM 3D spinge la segmentazione verso il volume, PixelDiT riconsidera i fondamenti delle pipeline di diffusione eliminando il pre-processing tramite autoencoder. L’industria IA non è più focalizzata solo sui modelli linguistici — la percezione visiva 3D e la generazione di immagini di alta qualità avanzano in parallelo.