L’annuncio che ridefinisce l’IA
24 novembre 2025 — Anthropic svela Claude Opus 4.5, il suo modello più avanzato fino ad oggi. Presentato come “il miglior modello al mondo per coding, agenti e computer use”, Opus 4.5 segna una tappa significativa nell’evoluzione dei sistemi di IA.
Introducing Claude Opus 4.5: the best model in the world for coding, agents, and computer use. Opus 4.5 is a step forward in what AI systems can do, and a preview of larger changes to how work gets done.
🇮🇹 Vi presentiamo Claude Opus 4.5: il miglior modello al mondo per coding, agenti e utilizzo del computer. Opus 4.5 è un passo avanti in ciò che i sistemi di IA possono fare e un’anteprima di cambiamenti più ampi nel modo in cui viene svolto il lavoro. — @claudeai su X
🔗 Annuncio ufficiale su anthropic.com
Perché Opus 4.5 cambia le regole del gioco
Claude Opus 4.5 non è un semplice aggiornamento incrementale. Questo modello rappresenta un salto qualitativo in diverse aree chiave:
Ragionamento intelligente
Opus 4.5 eccelle nella gestione dell’ambiguità e dei compromessi. Il modello dimostra una maggiore capacità di navigare in situazioni complesse in cui esistono più approcci validi, scegliendo quello più appropriato al contesto.
Gestione estesa del contesto
Grazie alla summarization automatica, Opus 4.5 elimina i limiti di lunghezza della conversazione. Il modello può mantenere il contesto in sessioni di lavoro prolungate senza degrado delle prestazioni.
Coordinamento multi-agente
Uno dei maggiori progressi riguarda la capacità di orchestrare sistemi multi-agente. Opus 4.5 può coordinare più processi autonomi che lavorano in parallelo su compiti complessi.
Computer Use avanzato
Il modello può ora manipolare direttamente:
- Fogli di calcolo — Analisi e modifica di dati Excel/Sheets
- Presentazioni — Creazione e modifica di slide
- Browser — Automazione di compiti web complessi
- Applicazioni desktop — Interazione con software nativo
Benchmark: I numeri parlano
Prestazioni nell’ingegneria del software
| Benchmark | Opus 4.5 | Miglioramento |
|---|---|---|
| SWE-bench Verified | State-of-the-art | Leader assoluto |
| SWE-bench Multilingual | 7/8 linguaggi | Migliore su 7 linguaggi |
| Aider Polyglot | +10.6% | vs Sonnet 4.5 |
| Vending-Bench | +29% | vs Sonnet 4.5 |
| Terminal Bench | +15% | vs Sonnet 4.5 |
| BrowseComp-Plus | Guadagni significativi | Ricerca agentica |
Un dato saliente
Durante un esame interno di ingegneria di Anthropic con un limite di 2 ore, Opus 4.5 ha ottenuto un punteggio superiore a tutti i candidati umani. Una prima assoluta che illustra il livello raggiunto da questo modello.
Efficienza rivoluzionaria nei token
Uno degli aspetti più impressionanti di Opus 4.5 è la sua efficienza nei token. Il modello produce risultati equivalenti o superiori con significativamente meno token:
| Livello di sforzo | Prestazioni | Riduzione dei token |
|---|---|---|
| Sforzo medio | Uguale a Sonnet 4.5 | -76% di token |
| Sforzo massimo | +4.3% vs Sonnet 4.5 | -48% di token |
| Compiti lunghi | Mantenuta | -65% di token |
Cosa significa concretamente
- Costi ridotti — Meno token = fattura API più leggera
- Risposte più veloci — Meno generazione = latenza ridotta
- Ragionamento più efficiente — Meno backtracking ed esplorazione ridondante
Prezzi e disponibilità
Accesso API
| Parametro | Valore |
|---|---|
| Model ID | claude-opus-4-5-20251101 |
| Prezzo input | $5 / milione di token |
| Prezzo output | $25 / milione di token |
| Context window | 200K token |
| Thinking budget | 64K token |
Piattaforme disponibili
- Anthropic API — Accesso diretto
- AWS Bedrock — Integrazione cloud Amazon
- Google Vertex AI — Integrazione cloud Google
- Applicazioni Claude — claude.ai, desktop, mobile
Cosa dicono le aziende
I feedback dei primi utenti sono unanimi:
GitHub Copilot
Il modello supera i nostri benchmark interni di coding dimezzando l’utilizzo dei token. — Mario Rodriguez, Chief Product Officer
Windsurf AI
Clear winner… best frontier task planning and tool calling.
🇮🇹 Vincitore netto… migliore pianificazione delle attività di frontiera e chiamata degli strumenti. — Jeff Wang, CEO
Replit
Using fewer tokens to solve the same problems.
🇮🇹 Utilizzo di meno token per risolvere gli stessi problemi. — Michele Catasta, President
Warp
15% improvement over Sonnet 4.5 su Terminal Bench per compiti autonomi. — Zach Lloyd, Founder
Cursor
Notable improvement with improved pricing and intelligence.
🇮🇹 Miglioramento notevole con prezzi e intelligenza migliori. — Michael Truell, CEO
Miglioramenti del prodotto
Opus 4.5 è accompagnato da diverse novità nell’ecosistema Claude:
Claude Code — Plan Mode migliorato
- Domande di chiarimento prima dell’esecuzione
- File
plan.mdmodificabili dall’utente - Migliore coordinamento delle modifiche su più file
Claude Desktop
- Sessioni parallele locali e remote
- Cattura schermo integrata
- Condivisione del contesto cliccando sulle finestre
- Comando vocale (Caps Lock per parlare)
Claude for Chrome (Disponibile per tutti i piani a pagamento)
Inizialmente in beta, Claude for Chrome è ora disponibile per tutti i piani a pagamento (Pro, Team, Enterprise) dal 18 dicembre 2025. L’estensione permette a Claude di interagire direttamente nel browser:
- Navigazione autonoma — Sfogliare siti, cliccare, compilare moduli
- Multi-schede — Lavorare su più schede contemporaneamente
- Automazione — Estrazione di metriche, gestione file cloud, preparazione calendario
- Integrazioni — Google Drive, Salesforce, Gmail, CRM
- Workflow pianificati — Automazioni giornaliere o settimanali
- Sicurezza — Revisione delle azioni sensibili prima dell’esecuzione
🔗 Saperne di più su Claude for Chrome
Altre integrazioni
- Claude for Excel — Beta estesa a Max, Team ed Enterprise
- Conversazioni estese — Nessun limite di lunghezza grazie all’auto-summarization
Sicurezza e allineamento
Anthropic presenta Opus 4.5 come il suo “modello più robustamente allineato fino ad oggi”:
Resistenza agli attacchi
- Prompt injection — Più difficile da ingannare rispetto a qualsiasi modello concorrente
- Misuse categories — Punteggi di “comportamento preoccupante” ridotti
System Card
Il documento di sicurezza descrive le misure adottate per garantire un comportamento affidabile e prevedibile, anche in scenari limite complessi.
Specifiche tecniche
| Specifica | Valore |
|---|---|
| Context window | 200K token (default) |
| Thinking budget | 64K token (interleaved) |
| Metodologia di valutazione | Media di 5 prove indipendenti |
| Parametro di sforzo | Configurabile (velocità vs capacità) |
| Sampling | Temperatura e top-p standard |
Vantaggi architettonici
- Ragionamento multi-step efficiente che riduce il backtracking
- Compattazione del contesto ottimizzata
- Strumenti di memoria per ragionamento sostenuto su sessioni lunghe
Conclusione
Claude Opus 4.5 rappresenta più di un aggiornamento del modello — è una dimostrazione di ciò che l’IA può compiere quando efficienza e capacità progrediscono insieme.
Per gli sviluppatori, le implicazioni sono chiare:
- Migliori prestazioni nei compiti di coding e automazione
- Costi ridotti grazie all’efficienza dei token
- Nuove possibilità con il computer use e il coordinamento multi-agente