Claude Opus 4.5: Il modello IA più avanzato al mondo

L’annuncio che ridefinisce l’IA

24 novembre 2025 — Anthropic svela Claude Opus 4.5, il suo modello più avanzato fino ad oggi. Presentato come “il miglior modello al mondo per coding, agenti e computer use”, Opus 4.5 segna una tappa significativa nell’evoluzione dei sistemi di IA.

Introducing Claude Opus 4.5: the best model in the world for coding, agents, and computer use. Opus 4.5 is a step forward in what AI systems can do, and a preview of larger changes to how work gets done.

🇮🇹 Vi presentiamo Claude Opus 4.5: il miglior modello al mondo per coding, agenti e utilizzo del computer. Opus 4.5 è un passo avanti in ciò che i sistemi di IA possono fare e un’anteprima di cambiamenti più ampi nel modo in cui viene svolto il lavoro. — @claudeai su X

🔗 Annuncio ufficiale su anthropic.com

Perché Opus 4.5 cambia le regole del gioco

Claude Opus 4.5 non è un semplice aggiornamento incrementale. Questo modello rappresenta un salto qualitativo in diverse aree chiave:

Ragionamento intelligente

Opus 4.5 eccelle nella gestione dell’ambiguità e dei compromessi. Il modello dimostra una maggiore capacità di navigare in situazioni complesse in cui esistono più approcci validi, scegliendo quello più appropriato al contesto.

Gestione estesa del contesto

Grazie alla summarization automatica, Opus 4.5 elimina i limiti di lunghezza della conversazione. Il modello può mantenere il contesto in sessioni di lavoro prolungate senza degrado delle prestazioni.

Coordinamento multi-agente

Uno dei maggiori progressi riguarda la capacità di orchestrare sistemi multi-agente. Opus 4.5 può coordinare più processi autonomi che lavorano in parallelo su compiti complessi.

Computer Use avanzato

Il modello può ora manipolare direttamente:

Fogli di calcolo — Analisi e modifica di dati Excel/Sheets
Presentazioni — Creazione e modifica di slide
Browser — Automazione di compiti web complessi
Applicazioni desktop — Interazione con software nativo

Benchmark: I numeri parlano

Prestazioni nell’ingegneria del software

Benchmark	Opus 4.5	Miglioramento
SWE-bench Verified	State-of-the-art	Leader assoluto
SWE-bench Multilingual	7/8 linguaggi	Migliore su 7 linguaggi
Aider Polyglot	+10.6%	vs Sonnet 4.5
Vending-Bench	+29%	vs Sonnet 4.5
Terminal Bench	+15%	vs Sonnet 4.5
BrowseComp-Plus	Guadagni significativi	Ricerca agentica

Un dato saliente

Durante un esame interno di ingegneria di Anthropic con un limite di 2 ore, Opus 4.5 ha ottenuto un punteggio superiore a tutti i candidati umani. Una prima assoluta che illustra il livello raggiunto da questo modello.

Efficienza rivoluzionaria nei token

Uno degli aspetti più impressionanti di Opus 4.5 è la sua efficienza nei token. Il modello produce risultati equivalenti o superiori con significativamente meno token:

Livello di sforzo	Prestazioni	Riduzione dei token
Sforzo medio	Uguale a Sonnet 4.5	-76% di token
Sforzo massimo	+4.3% vs Sonnet 4.5	-48% di token
Compiti lunghi	Mantenuta	-65% di token

Cosa significa concretamente

Costi ridotti — Meno token = fattura API più leggera
Risposte più veloci — Meno generazione = latenza ridotta
Ragionamento più efficiente — Meno backtracking ed esplorazione ridondante

Prezzi e disponibilità

Accesso API

Parametro	Valore
Model ID	`claude-opus-4-5-20251101`
Prezzo input	$5 / milione di token
Prezzo output	$25 / milione di token
Context window	200K token
Thinking budget	64K token

Piattaforme disponibili

Anthropic API — Accesso diretto
AWS Bedrock — Integrazione cloud Amazon
Google Vertex AI — Integrazione cloud Google
Applicazioni Claude — claude.ai, desktop, mobile

Cosa dicono le aziende

I feedback dei primi utenti sono unanimi:

GitHub Copilot

Il modello supera i nostri benchmark interni di coding dimezzando l’utilizzo dei token. — Mario Rodriguez, Chief Product Officer

Windsurf AI

Clear winner… best frontier task planning and tool calling.

🇮🇹 Vincitore netto… migliore pianificazione delle attività di frontiera e chiamata degli strumenti. — Jeff Wang, CEO

Replit

Using fewer tokens to solve the same problems.

🇮🇹 Utilizzo di meno token per risolvere gli stessi problemi. — Michele Catasta, President

Warp

15% improvement over Sonnet 4.5 su Terminal Bench per compiti autonomi. — Zach Lloyd, Founder

Cursor

Notable improvement with improved pricing and intelligence.

🇮🇹 Miglioramento notevole con prezzi e intelligenza migliori. — Michael Truell, CEO

Miglioramenti del prodotto

Opus 4.5 è accompagnato da diverse novità nell’ecosistema Claude:

Claude Code — Plan Mode migliorato

Domande di chiarimento prima dell’esecuzione
File plan.md modificabili dall’utente
Migliore coordinamento delle modifiche su più file

Claude Desktop

Sessioni parallele locali e remote
Cattura schermo integrata
Condivisione del contesto cliccando sulle finestre
Comando vocale (Caps Lock per parlare)

Claude for Chrome (Disponibile per tutti i piani a pagamento)

Inizialmente in beta, Claude for Chrome è ora disponibile per tutti i piani a pagamento (Pro, Team, Enterprise) dal 18 dicembre 2025. L’estensione permette a Claude di interagire direttamente nel browser:

Navigazione autonoma — Sfogliare siti, cliccare, compilare moduli
Multi-schede — Lavorare su più schede contemporaneamente
Automazione — Estrazione di metriche, gestione file cloud, preparazione calendario
Integrazioni — Google Drive, Salesforce, Gmail, CRM
Workflow pianificati — Automazioni giornaliere o settimanali
Sicurezza — Revisione delle azioni sensibili prima dell’esecuzione

🔗 Saperne di più su Claude for Chrome

Altre integrazioni

Claude for Excel — Beta estesa a Max, Team ed Enterprise
Conversazioni estese — Nessun limite di lunghezza grazie all’auto-summarization

Sicurezza e allineamento

Anthropic presenta Opus 4.5 come il suo “modello più robustamente allineato fino ad oggi”:

Resistenza agli attacchi

Prompt injection — Più difficile da ingannare rispetto a qualsiasi modello concorrente
Misuse categories — Punteggi di “comportamento preoccupante” ridotti

System Card

Il documento di sicurezza descrive le misure adottate per garantire un comportamento affidabile e prevedibile, anche in scenari limite complessi.

Specifiche tecniche

Specifica	Valore
Context window	200K token (default)
Thinking budget	64K token (interleaved)
Metodologia di valutazione	Media di 5 prove indipendenti
Parametro di sforzo	Configurabile (velocità vs capacità)
Sampling	Temperatura e top-p standard

Vantaggi architettonici

Ragionamento multi-step efficiente che riduce il backtracking
Compattazione del contesto ottimizzata
Strumenti di memoria per ragionamento sostenuto su sessioni lunghe

Conclusione

Claude Opus 4.5 rappresenta più di un aggiornamento del modello — è una dimostrazione di ciò che l’IA può compiere quando efficienza e capacità progrediscono insieme.

Per gli sviluppatori, le implicazioni sono chiare:

Migliori prestazioni nei compiti di coding e automazione
Costi ridotti grazie all’efficienza dei token
Nuove possibilità con il computer use e il coordinamento multi-agente