Pesquisar

Claude Opus 4.5: O modelo de IA mais avançado do mundo

Claude Opus 4.5: O modelo de IA mais avançado do mundo

O anúncio que redefine a IA

24 de novembro de 2025 — A Anthropic revela o Claude Opus 4.5, seu modelo mais avançado até hoje. Apresentado como “o melhor modelo do mundo para coding, agentes e uso de computador”, o Opus 4.5 marca um marco significativo na evolução dos sistemas de IA.

Introducing Claude Opus 4.5: the best model in the world for coding, agents, and computer use. Opus 4.5 is a step forward in what AI systems can do, and a preview of larger changes to how work gets done.

🇵🇹 Apresentamos o Claude Opus 4.5: o melhor modelo do mundo para coding, agentes e uso de computador. O Opus 4.5 é um passo à frente no que os sistemas de IA podem fazer e uma prévia de mudanças maiores na forma como o trabalho é feito.@claudeai no X

🔗 Anúncio oficial em anthropic.com


Por que o Opus 4.5 muda o jogo

O Claude Opus 4.5 não é uma simples atualização incremental. Este modelo representa um salto qualitativo em várias áreas-chave:

Raciocínio inteligente

O Opus 4.5 se destaca no gerenciamento de ambiguidade e compensações. O modelo demonstra uma capacidade aumentada de navegar em situações complexas onde existem múltiplas abordagens válidas, escolhendo a mais apropriada para o contexto.

Gerenciamento estendido de contexto

Graças à summarization automática, o Opus 4.5 elimina os limites de duração da conversa. O modelo pode manter o contexto em sessões de trabalho prolongadas sem degradação de desempenho.

Coordenação multiagente

Um dos maiores avanços diz respeito à capacidade de orquestrar sistemas multiagente. O Opus 4.5 pode coordenar múltiplos processos autônomos trabalhando em paralelo em tarefas complexas.

Computer Use avançado

O modelo agora pode manipular diretamente:

  • Planilhas — Análise e modificação de dados Excel/Sheets
  • Apresentações — Criação e edição de slides
  • Navegador — Automação de tarefas web complexas
  • Aplicativos desktop — Interação com software nativo

Benchmarks: Os números falam

Desempenho em engenharia de software

BenchmarkOpus 4.5Melhoria
SWE-bench VerifiedState-of-the-artLíder absoluto
SWE-bench Multilingual7/8 linguagensMelhor em 7 linguagens
Aider Polyglot+10.6%vs Sonnet 4.5
Vending-Bench+29%vs Sonnet 4.5
Terminal Bench+15%vs Sonnet 4.5
BrowseComp-PlusGanhos significativosPesquisa agêntica

Um fato marcante

Durante um exame interno de engenharia da Anthropic com um limite de 2 horas, o Opus 4.5 obteve uma pontuação superior a todos os candidatos humanos. Uma novidade que ilustra o nível alcançado por este modelo.


Eficiência revolucionária em tokens

Um dos aspectos mais impressionantes do Opus 4.5 é sua eficiência em tokens. O modelo produz resultados equivalentes ou superiores com significativamente menos tokens:

Nível de esforçoDesempenhoRedução de tokens
Esforço médioIgual ao Sonnet 4.5-76% de tokens
Esforço máximo+4.3% vs Sonnet 4.5-48% de tokens
Tarefas longasMantida-65% de tokens

O que isso significa concretamente

  • Custos reduzidos — Menos tokens = fatura de API mais leve
  • Respostas mais rápidas — Menos geração = latência reduzida
  • Raciocínio mais eficiente — Menos backtracking e exploração redundante

Preços e disponibilidade

Acesso à API

ParâmetroValor
Model IDclaude-opus-4-5-20251101
Preço input$5 / milhão de tokens
Preço output$25 / milhão de tokens
Context window200K tokens
Thinking budget64K tokens

Plataformas disponíveis

  • API da Anthropic — Acesso direto
  • AWS Bedrock — Integração em nuvem da Amazon
  • Google Vertex AI — Integração em nuvem do Google
  • Aplicativos Claude — claude.ai, desktop, mobile

O que dizem as empresas

O feedback dos primeiros usuários é unânime:

GitHub Copilot

O modelo supera nossos benchmarks internos de coding enquanto reduz o uso de tokens pela metade. — Mario Rodriguez, Chief Product Officer

Windsurf AI

Clear winner… best frontier task planning and tool calling.

🇵🇹 Vencedor claro… melhor planejamento de tarefas de fronteira e chamada de ferramentas.Jeff Wang, CEO

Replit

Using fewer tokens to solve the same problems.

🇵🇹 Usando menos tokens para resolver os mesmos problemas.Michele Catasta, President

Warp

15% improvement over Sonnet 4.5 no Terminal Bench para tarefas autônomas. — Zach Lloyd, Founder

Cursor

Notable improvement with improved pricing and intelligence.

🇵🇹 Melhoria notável com melhores preços e inteligência.Michael Truell, CEO


Melhorias do produto

O Opus 4.5 vem acompanhado de várias novidades no ecossistema Claude:

Claude Code — Plan Mode aprimorado

  • Perguntas de esclarecimento antes da execução
  • Arquivos plan.md editáveis pelo usuário
  • Melhor coordenação de modificações em múltiplos arquivos

Claude Desktop

  • Sessões paralelas locais e remotas
  • Captura de tela integrada
  • Compartilhamento de contexto clicando nas janelas
  • Comando de voz (Caps Lock para falar)

Claude for Chrome (Disponível para todos os planos pagos)

Inicialmente em beta, o Claude for Chrome agora está disponível para todos os planos pagos (Pro, Team, Enterprise) desde 18 de dezembro de 2025. A extensão permite que o Claude interaja diretamente no navegador:

  • Navegação autônoma — Percorrer sites, clicar, preencher formulários
  • Multi-abas — Trabalhar em várias abas simultaneamente
  • Automação — Extração de métricas, gerenciamento de arquivos na nuvem, preparação de calendário
  • Integrações — Google Drive, Salesforce, Gmail, CRM
  • Fluxos de trabalho agendados — Automações diárias ou semanais
  • Segurança — Revisão de ações sensíveis antes da execução

🔗 Saiba mais sobre o Claude for Chrome

Outras integrações

  • Claude for Excel — Beta estendida para Max, Team e Enterprise
  • Conversas estendidas — Sem limites de duração graças à auto-summarization

Segurança e alinhamento

A Anthropic apresenta o Opus 4.5 como seu “modelo mais robustamente alinhado até hoje”:

Resistência a ataques

  • Prompt injection — Mais difícil de enganar do que qualquer modelo concorrente
  • Misuse categories — Pontuações de “comportamento preocupante” reduzidas

System Card

O documento de segurança detalha as medidas tomadas para garantir um comportamento confiável e previsível, mesmo em cenários extremos complexos.


Especificações técnicas

EspecificaçãoValor
Context window200K tokens (padrão)
Thinking budget64K tokens (intercalados)
Metodologia de avaliaçãoMédia de 5 testes independentes
Parâmetro de esforçoConfigurável (velocidade vs capacidade)
SamplingTemperatura e top-p padrão

Vantagens arquiteturais

  • Raciocínio de múltiplas etapas eficiente reduzindo o backtracking
  • Compactação de contexto otimizada
  • Ferramentas de memória para raciocínio sustentado em sessões longas

Conclusão

O Claude Opus 4.5 representa mais do que uma atualização de modelo — é uma demonstração do que a IA pode realizar quando a eficiência e a capacidade avançam juntas.

Para os desenvolvedores, as implicações são claras:

  1. Melhor desempenho em tarefas de coding e automação
  2. Custos reduzidos graças à eficiência de tokens
  3. Novas possibilidades com o computer use e a coordenação multiagente

Fontes