Buscar

Claude Opus 4.5: El modelo de IA más avanzado del mundo

Claude Opus 4.5: El modelo de IA más avanzado del mundo

El anuncio que redefine la IA

24 de noviembre de 2025 — Anthropic presenta Claude Opus 4.5, su modelo más avanzado hasta la fecha. Presentado como “el mejor modelo del mundo para coding, agentes y uso de ordenadores”, Opus 4.5 marca un hito significativo en la evolución de los sistemas de IA.

Introducing Claude Opus 4.5: the best model in the world for coding, agents, and computer use. Opus 4.5 is a step forward in what AI systems can do, and a preview of larger changes to how work gets done.

🇪🇸 Presentamos Claude Opus 4.5: el mejor modelo del mundo para coding, agentes y uso de ordenadores. Opus 4.5 es un paso adelante en lo que los sistemas de IA pueden hacer y un anticipo de cambios mayores en cómo se realiza el trabajo.@claudeai en X

🔗 Anuncio oficial en anthropic.com


Por qué Opus 4.5 cambia las reglas del juego

Claude Opus 4.5 no es una simple actualización incremental. Este modelo representa un salto cualitativo en varias áreas clave:

Razonamiento inteligente

Opus 4.5 sobresale en la gestión de la ambigüedad y los compromisos. El modelo demuestra una mayor capacidad para navegar en situaciones complejas donde existen múltiples enfoques válidos, eligiendo el más apropiado para el contexto.

Gestión extendida del contexto

Gracias a la summarization automática, Opus 4.5 elimina los límites de longitud de conversación. El modelo puede mantener el contexto en sesiones de trabajo prolongadas sin degradación del rendimiento.

Coordinación multi-agente

Uno de los mayores avances se refiere a la capacidad de orquestar sistemas multi-agente. Opus 4.5 puede coordinar múltiples procesos autónomos trabajando en paralelo en tareas complejas.

Computer Use avanzado

El modelo ahora puede manipular directamente:

  • Hojas de cálculo — Análisis y modificación de datos de Excel/Sheets
  • Presentaciones — Creación y edición de diapositivas
  • Navegador — Automatización de tareas web complejas
  • Aplicaciones de escritorio — Interacción con software nativo

Benchmarks: Los números hablan

Rendimiento en ingeniería de software

BenchmarkOpus 4.5Mejora
SWE-bench VerifiedState-of-the-artLíder absoluto
SWE-bench Multilingual7/8 lenguajesMejor en 7 lenguajes
Aider Polyglot+10.6%vs Sonnet 4.5
Vending-Bench+29%vs Sonnet 4.5
Terminal Bench+15%vs Sonnet 4.5
BrowseComp-PlusGanancias significativasInvestigación agéntica

Un dato destacado

Durante un examen interno de ingeniería de Anthropic con un límite de 2 horas, Opus 4.5 obtuvo una puntuación superior a todos los candidatos humanos. Una primicia que ilustra el nivel alcanzado por este modelo.


Eficiencia revolucionaria en tokens

Uno de los aspectos más impresionantes de Opus 4.5 es su eficiencia en tokens. El modelo produce resultados equivalentes o superiores con significativamente menos tokens:

Nivel de esfuerzoRendimientoReducción de tokens
Esfuerzo medioIgual a Sonnet 4.5-76% de tokens
Esfuerzo máximo+4.3% vs Sonnet 4.5-48% de tokens
Tareas largasMantenida-65% de tokens

Qué significa esto concretamente

  • Costes reducidos — Menos tokens = factura de API más ligera
  • Respuestas más rápidas — Menos generación = latencia reducida
  • Razonamiento más eficiente — Menos backtracking y exploración redundante

Precios y disponibilidad

Acceso a la API

ParámetroValor
Model IDclaude-opus-4-5-20251101
Precio input$5 / millón de tokens
Precio output$25 / millón de tokens
Context window200K tokens
Thinking budget64K tokens

Plataformas disponibles

  • API de Anthropic — Acceso directo
  • AWS Bedrock — Integración en la nube de Amazon
  • Google Vertex AI — Integración en la nube de Google
  • Aplicaciones Claude — claude.ai, escritorio, móvil

Lo que dicen las empresas

Los comentarios de los primeros usuarios son unánimes:

GitHub Copilot

El modelo supera nuestros benchmarks internos de coding reduciendo el uso de tokens a la mitad. — Mario Rodriguez, Chief Product Officer

Windsurf AI

Clear winner… best frontier task planning and tool calling.

🇪🇸 Claro ganador… mejor planificación de tareas frontera y llamada de herramientas.Jeff Wang, CEO

Replit

Using fewer tokens to solve the same problems.

🇪🇸 Usando menos tokens para resolver los mismos problemas.Michele Catasta, President

Warp

15% improvement over Sonnet 4.5 sur Terminal Bench para tareas autónomas. — Zach Lloyd, Founder

Cursor

Notable improvement with improved pricing and intelligence.

🇪🇸 Mejora notable con mejores precios e inteligencia.Michael Truell, CEO


Mejoras del producto

Opus 4.5 viene acompañado de varias novedades en el ecosistema Claude:

Claude Code — Plan Mode mejorado

  • Preguntas de aclaración antes de la ejecución
  • Archivos plan.md editables por el usuario
  • Mejor coordinación de modificaciones en múltiples archivos

Claude Desktop

  • Sesiones paralelas locales y remotas
  • Captura de pantalla integrada
  • Compartir contexto haciendo clic en las ventanas
  • Comando de voz (Bloq Mayús para hablar)

Claude for Chrome (Disponible para todos los planes de pago)

Inicialmente en beta, Claude for Chrome está ahora disponible para todos los planes de pago (Pro, Team, Enterprise) desde el 18 de diciembre de 2025. La extensión permite a Claude interactuar directamente en el navegador:

  • Navegación autónoma — Recorrer sitios, hacer clic, rellenar formularios
  • Multi-pestañas — Trabajar en varias pestañas simultáneamente
  • Automatización — Extracción de métricas, gestión de archivos en la nube, preparación de calendarios
  • Integraciones — Google Drive, Salesforce, Gmail, CRM
  • Flujos de trabajo programados — Automatizaciones diarias o semanales
  • Seguridad — Revisión de acciones sensibles antes de la ejecución

🔗 Más información sobre Claude for Chrome

Otras integraciones

  • Claude for Excel — Beta extendida a Max, Team y Enterprise
  • Conversaciones extendidas — Sin límites de longitud gracias a la auto-summarization

Seguridad y alineación

Anthropic presenta Opus 4.5 como su “modelo más robustamente alineado hasta la fecha”:

Resistencia a ataques

  • Prompt injection — Más difícil de engañar que cualquier modelo competidor
  • Misuse categories — Puntuaciones de “comportamiento preocupante” reducidas

System Card

El documento de seguridad detalla las medidas tomadas para garantizar un comportamiento fiable y predecible, incluso en escenarios extremos complejos.


Especificaciones técnicas

EspecificaciónValor
Context window200K tokens (predeterminado)
Thinking budget64K tokens (entrelazados)
Metodología de evaluaciónPromedio de 5 pruebas independientes
Parámetro de esfuerzoConfigurable (velocidad vs capacidad)
SamplingTemperatura y top-p estándar

Ventajas arquitectónicas

  • Razonamiento de múltiples pasos eficiente reduciendo el backtracking
  • Compactación de contexto optimizada
  • Herramientas de memoria para razonamiento sostenido en sesiones largas

Conclusión

Claude Opus 4.5 representa más que una actualización de modelo — es una demostración de lo que la IA puede lograr cuando la eficiencia y la capacidad avanzan juntas.

Para los desarrolladores, las implicaciones son claras:

  1. Mejor rendimiento en tareas de coding y automatización
  2. Costes reducidos gracias a la eficiencia de tokens
  3. Nuevas posibilidades con el computer use y la coordinación multi-agente

Fuentes