Cerca

Claude Opus 4.5: Il modello IA più avanzato al mondo

Claude Opus 4.5: Il modello IA più avanzato al mondo

L’annuncio che ridefinisce l’IA

24 novembre 2025 — Anthropic svela Claude Opus 4.5, il suo modello più avanzato fino ad oggi. Presentato come “il miglior modello al mondo per coding, agenti e computer use”, Opus 4.5 segna una tappa significativa nell’evoluzione dei sistemi di IA.

Introducing Claude Opus 4.5: the best model in the world for coding, agents, and computer use. Opus 4.5 is a step forward in what AI systems can do, and a preview of larger changes to how work gets done.

🇮🇹 Vi presentiamo Claude Opus 4.5: il miglior modello al mondo per coding, agenti e utilizzo del computer. Opus 4.5 è un passo avanti in ciò che i sistemi di IA possono fare e un’anteprima di cambiamenti più ampi nel modo in cui viene svolto il lavoro.@claudeai su X

🔗 Annuncio ufficiale su anthropic.com


Perché Opus 4.5 cambia le regole del gioco

Claude Opus 4.5 non è un semplice aggiornamento incrementale. Questo modello rappresenta un salto qualitativo in diverse aree chiave:

Ragionamento intelligente

Opus 4.5 eccelle nella gestione dell’ambiguità e dei compromessi. Il modello dimostra una maggiore capacità di navigare in situazioni complesse in cui esistono più approcci validi, scegliendo quello più appropriato al contesto.

Gestione estesa del contesto

Grazie alla summarization automatica, Opus 4.5 elimina i limiti di lunghezza della conversazione. Il modello può mantenere il contesto in sessioni di lavoro prolungate senza degrado delle prestazioni.

Coordinamento multi-agente

Uno dei maggiori progressi riguarda la capacità di orchestrare sistemi multi-agente. Opus 4.5 può coordinare più processi autonomi che lavorano in parallelo su compiti complessi.

Computer Use avanzato

Il modello può ora manipolare direttamente:

  • Fogli di calcolo — Analisi e modifica di dati Excel/Sheets
  • Presentazioni — Creazione e modifica di slide
  • Browser — Automazione di compiti web complessi
  • Applicazioni desktop — Interazione con software nativo

Benchmark: I numeri parlano

Prestazioni nell’ingegneria del software

BenchmarkOpus 4.5Miglioramento
SWE-bench VerifiedState-of-the-artLeader assoluto
SWE-bench Multilingual7/8 linguaggiMigliore su 7 linguaggi
Aider Polyglot+10.6%vs Sonnet 4.5
Vending-Bench+29%vs Sonnet 4.5
Terminal Bench+15%vs Sonnet 4.5
BrowseComp-PlusGuadagni significativiRicerca agentica

Un dato saliente

Durante un esame interno di ingegneria di Anthropic con un limite di 2 ore, Opus 4.5 ha ottenuto un punteggio superiore a tutti i candidati umani. Una prima assoluta che illustra il livello raggiunto da questo modello.


Efficienza rivoluzionaria nei token

Uno degli aspetti più impressionanti di Opus 4.5 è la sua efficienza nei token. Il modello produce risultati equivalenti o superiori con significativamente meno token:

Livello di sforzoPrestazioniRiduzione dei token
Sforzo medioUguale a Sonnet 4.5-76% di token
Sforzo massimo+4.3% vs Sonnet 4.5-48% di token
Compiti lunghiMantenuta-65% di token

Cosa significa concretamente

  • Costi ridotti — Meno token = fattura API più leggera
  • Risposte più veloci — Meno generazione = latenza ridotta
  • Ragionamento più efficiente — Meno backtracking ed esplorazione ridondante

Prezzi e disponibilità

Accesso API

ParametroValore
Model IDclaude-opus-4-5-20251101
Prezzo input$5 / milione di token
Prezzo output$25 / milione di token
Context window200K token
Thinking budget64K token

Piattaforme disponibili

  • Anthropic API — Accesso diretto
  • AWS Bedrock — Integrazione cloud Amazon
  • Google Vertex AI — Integrazione cloud Google
  • Applicazioni Claude — claude.ai, desktop, mobile

Cosa dicono le aziende

I feedback dei primi utenti sono unanimi:

GitHub Copilot

Il modello supera i nostri benchmark interni di coding dimezzando l’utilizzo dei token. — Mario Rodriguez, Chief Product Officer

Windsurf AI

Clear winner… best frontier task planning and tool calling.

🇮🇹 Vincitore netto… migliore pianificazione delle attività di frontiera e chiamata degli strumenti.Jeff Wang, CEO

Replit

Using fewer tokens to solve the same problems.

🇮🇹 Utilizzo di meno token per risolvere gli stessi problemi.Michele Catasta, President

Warp

15% improvement over Sonnet 4.5 su Terminal Bench per compiti autonomi. — Zach Lloyd, Founder

Cursor

Notable improvement with improved pricing and intelligence.

🇮🇹 Miglioramento notevole con prezzi e intelligenza migliori.Michael Truell, CEO


Miglioramenti del prodotto

Opus 4.5 è accompagnato da diverse novità nell’ecosistema Claude:

Claude Code — Plan Mode migliorato

  • Domande di chiarimento prima dell’esecuzione
  • File plan.md modificabili dall’utente
  • Migliore coordinamento delle modifiche su più file

Claude Desktop

  • Sessioni parallele locali e remote
  • Cattura schermo integrata
  • Condivisione del contesto cliccando sulle finestre
  • Comando vocale (Caps Lock per parlare)

Claude for Chrome (Disponibile per tutti i piani a pagamento)

Inizialmente in beta, Claude for Chrome è ora disponibile per tutti i piani a pagamento (Pro, Team, Enterprise) dal 18 dicembre 2025. L’estensione permette a Claude di interagire direttamente nel browser:

  • Navigazione autonoma — Sfogliare siti, cliccare, compilare moduli
  • Multi-schede — Lavorare su più schede contemporaneamente
  • Automazione — Estrazione di metriche, gestione file cloud, preparazione calendario
  • Integrazioni — Google Drive, Salesforce, Gmail, CRM
  • Workflow pianificati — Automazioni giornaliere o settimanali
  • Sicurezza — Revisione delle azioni sensibili prima dell’esecuzione

🔗 Saperne di più su Claude for Chrome

Altre integrazioni

  • Claude for Excel — Beta estesa a Max, Team ed Enterprise
  • Conversazioni estese — Nessun limite di lunghezza grazie all’auto-summarization

Sicurezza e allineamento

Anthropic presenta Opus 4.5 come il suo “modello più robustamente allineato fino ad oggi”:

Resistenza agli attacchi

  • Prompt injection — Più difficile da ingannare rispetto a qualsiasi modello concorrente
  • Misuse categories — Punteggi di “comportamento preoccupante” ridotti

System Card

Il documento di sicurezza descrive le misure adottate per garantire un comportamento affidabile e prevedibile, anche in scenari limite complessi.


Specifiche tecniche

SpecificaValore
Context window200K token (default)
Thinking budget64K token (interleaved)
Metodologia di valutazioneMedia di 5 prove indipendenti
Parametro di sforzoConfigurabile (velocità vs capacità)
SamplingTemperatura e top-p standard

Vantaggi architettonici

  • Ragionamento multi-step efficiente che riduce il backtracking
  • Compattazione del contesto ottimizzata
  • Strumenti di memoria per ragionamento sostenuto su sessioni lunghe

Conclusione

Claude Opus 4.5 rappresenta più di un aggiornamento del modello — è una dimostrazione di ciò che l’IA può compiere quando efficienza e capacità progrediscono insieme.

Per gli sviluppatori, le implicazioni sono chiare:

  1. Migliori prestazioni nei compiti di coding e automazione
  2. Costi ridotti grazie all’efficienza dei token
  3. Nuove possibilità con il computer use e il coordinamento multi-agente

Fonti