Claude Opus 4.5: O modelo de IA mais avançado do mundo

O anúncio que redefine a IA

24 de novembro de 2025 — A Anthropic revela o Claude Opus 4.5, seu modelo mais avançado até hoje. Apresentado como “o melhor modelo do mundo para coding, agentes e uso de computador”, o Opus 4.5 marca um marco significativo na evolução dos sistemas de IA.

Introducing Claude Opus 4.5: the best model in the world for coding, agents, and computer use. Opus 4.5 is a step forward in what AI systems can do, and a preview of larger changes to how work gets done.

🇵🇹 Apresentamos o Claude Opus 4.5: o melhor modelo do mundo para coding, agentes e uso de computador. O Opus 4.5 é um passo à frente no que os sistemas de IA podem fazer e uma prévia de mudanças maiores na forma como o trabalho é feito. — @claudeai no X

🔗 Anúncio oficial em anthropic.com

Por que o Opus 4.5 muda o jogo

O Claude Opus 4.5 não é uma simples atualização incremental. Este modelo representa um salto qualitativo em várias áreas-chave:

Raciocínio inteligente

O Opus 4.5 se destaca no gerenciamento de ambiguidade e compensações. O modelo demonstra uma capacidade aumentada de navegar em situações complexas onde existem múltiplas abordagens válidas, escolhendo a mais apropriada para o contexto.

Gerenciamento estendido de contexto

Graças à summarization automática, o Opus 4.5 elimina os limites de duração da conversa. O modelo pode manter o contexto em sessões de trabalho prolongadas sem degradação de desempenho.

Coordenação multiagente

Um dos maiores avanços diz respeito à capacidade de orquestrar sistemas multiagente. O Opus 4.5 pode coordenar múltiplos processos autônomos trabalhando em paralelo em tarefas complexas.

Computer Use avançado

O modelo agora pode manipular diretamente:

Planilhas — Análise e modificação de dados Excel/Sheets
Apresentações — Criação e edição de slides
Navegador — Automação de tarefas web complexas
Aplicativos desktop — Interação com software nativo

Benchmarks: Os números falam

Desempenho em engenharia de software

Benchmark	Opus 4.5	Melhoria
SWE-bench Verified	State-of-the-art	Líder absoluto
SWE-bench Multilingual	7/8 linguagens	Melhor em 7 linguagens
Aider Polyglot	+10.6%	vs Sonnet 4.5
Vending-Bench	+29%	vs Sonnet 4.5
Terminal Bench	+15%	vs Sonnet 4.5
BrowseComp-Plus	Ganhos significativos	Pesquisa agêntica

Um fato marcante

Durante um exame interno de engenharia da Anthropic com um limite de 2 horas, o Opus 4.5 obteve uma pontuação superior a todos os candidatos humanos. Uma novidade que ilustra o nível alcançado por este modelo.

Eficiência revolucionária em tokens

Um dos aspectos mais impressionantes do Opus 4.5 é sua eficiência em tokens. O modelo produz resultados equivalentes ou superiores com significativamente menos tokens:

Nível de esforço	Desempenho	Redução de tokens
Esforço médio	Igual ao Sonnet 4.5	-76% de tokens
Esforço máximo	+4.3% vs Sonnet 4.5	-48% de tokens
Tarefas longas	Mantida	-65% de tokens

O que isso significa concretamente

Custos reduzidos — Menos tokens = fatura de API mais leve
Respostas mais rápidas — Menos geração = latência reduzida
Raciocínio mais eficiente — Menos backtracking e exploração redundante

Preços e disponibilidade

Acesso à API

Parâmetro	Valor
Model ID	`claude-opus-4-5-20251101`
Preço input	$5 / milhão de tokens
Preço output	$25 / milhão de tokens
Context window	200K tokens
Thinking budget	64K tokens

Plataformas disponíveis

API da Anthropic — Acesso direto
AWS Bedrock — Integração em nuvem da Amazon
Google Vertex AI — Integração em nuvem do Google
Aplicativos Claude — claude.ai, desktop, mobile

O que dizem as empresas

O feedback dos primeiros usuários é unânime:

GitHub Copilot

O modelo supera nossos benchmarks internos de coding enquanto reduz o uso de tokens pela metade. — Mario Rodriguez, Chief Product Officer

Windsurf AI

Clear winner… best frontier task planning and tool calling.

🇵🇹 Vencedor claro… melhor planejamento de tarefas de fronteira e chamada de ferramentas. — Jeff Wang, CEO

Replit

Using fewer tokens to solve the same problems.

🇵🇹 Usando menos tokens para resolver os mesmos problemas. — Michele Catasta, President

Warp

15% improvement over Sonnet 4.5 no Terminal Bench para tarefas autônomas. — Zach Lloyd, Founder

Cursor

Notable improvement with improved pricing and intelligence.

🇵🇹 Melhoria notável com melhores preços e inteligência. — Michael Truell, CEO

Melhorias do produto

O Opus 4.5 vem acompanhado de várias novidades no ecossistema Claude:

Claude Code — Plan Mode aprimorado

Perguntas de esclarecimento antes da execução
Arquivos plan.md editáveis pelo usuário
Melhor coordenação de modificações em múltiplos arquivos

Claude Desktop

Sessões paralelas locais e remotas
Captura de tela integrada
Compartilhamento de contexto clicando nas janelas
Comando de voz (Caps Lock para falar)

Claude for Chrome (Disponível para todos os planos pagos)

Inicialmente em beta, o Claude for Chrome agora está disponível para todos os planos pagos (Pro, Team, Enterprise) desde 18 de dezembro de 2025. A extensão permite que o Claude interaja diretamente no navegador:

Navegação autônoma — Percorrer sites, clicar, preencher formulários
Multi-abas — Trabalhar em várias abas simultaneamente
Automação — Extração de métricas, gerenciamento de arquivos na nuvem, preparação de calendário
Integrações — Google Drive, Salesforce, Gmail, CRM
Fluxos de trabalho agendados — Automações diárias ou semanais
Segurança — Revisão de ações sensíveis antes da execução

🔗 Saiba mais sobre o Claude for Chrome

Outras integrações

Claude for Excel — Beta estendida para Max, Team e Enterprise
Conversas estendidas — Sem limites de duração graças à auto-summarization

Segurança e alinhamento

A Anthropic apresenta o Opus 4.5 como seu “modelo mais robustamente alinhado até hoje”:

Resistência a ataques

Prompt injection — Mais difícil de enganar do que qualquer modelo concorrente
Misuse categories — Pontuações de “comportamento preocupante” reduzidas

System Card

O documento de segurança detalha as medidas tomadas para garantir um comportamento confiável e previsível, mesmo em cenários extremos complexos.

Especificações técnicas

Especificação	Valor
Context window	200K tokens (padrão)
Thinking budget	64K tokens (intercalados)
Metodologia de avaliação	Média de 5 testes independentes
Parâmetro de esforço	Configurável (velocidade vs capacidade)
Sampling	Temperatura e top-p padrão

Vantagens arquiteturais

Raciocínio de múltiplas etapas eficiente reduzindo o backtracking
Compactação de contexto otimizada
Ferramentas de memória para raciocínio sustentado em sessões longas

Conclusão

O Claude Opus 4.5 representa mais do que uma atualização de modelo — é uma demonstração do que a IA pode realizar quando a eficiência e a capacidade avançam juntas.

Para os desenvolvedores, as implicações são claras:

Melhor desempenho em tarefas de coding e automação
Custos reduzidos graças à eficiência de tokens
Novas possibilidades com o computer use e a coordenação multiagente