Claude Opus 4.5: El modelo de IA más avanzado del mundo

El anuncio que redefine la IA

24 de noviembre de 2025 — Anthropic presenta Claude Opus 4.5, su modelo más avanzado hasta la fecha. Presentado como “el mejor modelo del mundo para coding, agentes y uso de ordenadores”, Opus 4.5 marca un hito significativo en la evolución de los sistemas de IA.

Introducing Claude Opus 4.5: the best model in the world for coding, agents, and computer use. Opus 4.5 is a step forward in what AI systems can do, and a preview of larger changes to how work gets done.

🇪🇸 Presentamos Claude Opus 4.5: el mejor modelo del mundo para coding, agentes y uso de ordenadores. Opus 4.5 es un paso adelante en lo que los sistemas de IA pueden hacer y un anticipo de cambios mayores en cómo se realiza el trabajo. — @claudeai en X

🔗 Anuncio oficial en anthropic.com

Por qué Opus 4.5 cambia las reglas del juego

Claude Opus 4.5 no es una simple actualización incremental. Este modelo representa un salto cualitativo en varias áreas clave:

Razonamiento inteligente

Opus 4.5 sobresale en la gestión de la ambigüedad y los compromisos. El modelo demuestra una mayor capacidad para navegar en situaciones complejas donde existen múltiples enfoques válidos, eligiendo el más apropiado para el contexto.

Gestión extendida del contexto

Gracias a la summarization automática, Opus 4.5 elimina los límites de longitud de conversación. El modelo puede mantener el contexto en sesiones de trabajo prolongadas sin degradación del rendimiento.

Coordinación multi-agente

Uno de los mayores avances se refiere a la capacidad de orquestar sistemas multi-agente. Opus 4.5 puede coordinar múltiples procesos autónomos trabajando en paralelo en tareas complejas.

Computer Use avanzado

El modelo ahora puede manipular directamente:

Hojas de cálculo — Análisis y modificación de datos de Excel/Sheets
Presentaciones — Creación y edición de diapositivas
Navegador — Automatización de tareas web complejas
Aplicaciones de escritorio — Interacción con software nativo

Benchmarks: Los números hablan

Rendimiento en ingeniería de software

Benchmark	Opus 4.5	Mejora
SWE-bench Verified	State-of-the-art	Líder absoluto
SWE-bench Multilingual	7/8 lenguajes	Mejor en 7 lenguajes
Aider Polyglot	+10.6%	vs Sonnet 4.5
Vending-Bench	+29%	vs Sonnet 4.5
Terminal Bench	+15%	vs Sonnet 4.5
BrowseComp-Plus	Ganancias significativas	Investigación agéntica

Un dato destacado

Durante un examen interno de ingeniería de Anthropic con un límite de 2 horas, Opus 4.5 obtuvo una puntuación superior a todos los candidatos humanos. Una primicia que ilustra el nivel alcanzado por este modelo.

Eficiencia revolucionaria en tokens

Uno de los aspectos más impresionantes de Opus 4.5 es su eficiencia en tokens. El modelo produce resultados equivalentes o superiores con significativamente menos tokens:

Nivel de esfuerzo	Rendimiento	Reducción de tokens
Esfuerzo medio	Igual a Sonnet 4.5	-76% de tokens
Esfuerzo máximo	+4.3% vs Sonnet 4.5	-48% de tokens
Tareas largas	Mantenida	-65% de tokens

Qué significa esto concretamente

Costes reducidos — Menos tokens = factura de API más ligera
Respuestas más rápidas — Menos generación = latencia reducida
Razonamiento más eficiente — Menos backtracking y exploración redundante

Precios y disponibilidad

Acceso a la API

Parámetro	Valor
Model ID	`claude-opus-4-5-20251101`
Precio input	$5 / millón de tokens
Precio output	$25 / millón de tokens
Context window	200K tokens
Thinking budget	64K tokens

Plataformas disponibles

API de Anthropic — Acceso directo
AWS Bedrock — Integración en la nube de Amazon
Google Vertex AI — Integración en la nube de Google
Aplicaciones Claude — claude.ai, escritorio, móvil

Lo que dicen las empresas

Los comentarios de los primeros usuarios son unánimes:

GitHub Copilot

El modelo supera nuestros benchmarks internos de coding reduciendo el uso de tokens a la mitad. — Mario Rodriguez, Chief Product Officer

Windsurf AI

Clear winner… best frontier task planning and tool calling.

🇪🇸 Claro ganador… mejor planificación de tareas frontera y llamada de herramientas. — Jeff Wang, CEO

Replit

Using fewer tokens to solve the same problems.

🇪🇸 Usando menos tokens para resolver los mismos problemas. — Michele Catasta, President

Warp

15% improvement over Sonnet 4.5 sur Terminal Bench para tareas autónomas. — Zach Lloyd, Founder

Cursor

Notable improvement with improved pricing and intelligence.

🇪🇸 Mejora notable con mejores precios e inteligencia. — Michael Truell, CEO

Mejoras del producto

Opus 4.5 viene acompañado de varias novedades en el ecosistema Claude:

Claude Code — Plan Mode mejorado

Preguntas de aclaración antes de la ejecución
Archivos plan.md editables por el usuario
Mejor coordinación de modificaciones en múltiples archivos

Claude Desktop

Sesiones paralelas locales y remotas
Captura de pantalla integrada
Compartir contexto haciendo clic en las ventanas
Comando de voz (Bloq Mayús para hablar)

Claude for Chrome (Disponible para todos los planes de pago)

Inicialmente en beta, Claude for Chrome está ahora disponible para todos los planes de pago (Pro, Team, Enterprise) desde el 18 de diciembre de 2025. La extensión permite a Claude interactuar directamente en el navegador:

Navegación autónoma — Recorrer sitios, hacer clic, rellenar formularios
Multi-pestañas — Trabajar en varias pestañas simultáneamente
Automatización — Extracción de métricas, gestión de archivos en la nube, preparación de calendarios
Integraciones — Google Drive, Salesforce, Gmail, CRM
Flujos de trabajo programados — Automatizaciones diarias o semanales
Seguridad — Revisión de acciones sensibles antes de la ejecución

🔗 Más información sobre Claude for Chrome

Otras integraciones

Claude for Excel — Beta extendida a Max, Team y Enterprise
Conversaciones extendidas — Sin límites de longitud gracias a la auto-summarization

Seguridad y alineación

Anthropic presenta Opus 4.5 como su “modelo más robustamente alineado hasta la fecha”:

Resistencia a ataques

Prompt injection — Más difícil de engañar que cualquier modelo competidor
Misuse categories — Puntuaciones de “comportamiento preocupante” reducidas

System Card

El documento de seguridad detalla las medidas tomadas para garantizar un comportamiento fiable y predecible, incluso en escenarios extremos complejos.

Especificaciones técnicas

Especificación	Valor
Context window	200K tokens (predeterminado)
Thinking budget	64K tokens (entrelazados)
Metodología de evaluación	Promedio de 5 pruebas independientes
Parámetro de esfuerzo	Configurable (velocidad vs capacidad)
Sampling	Temperatura y top-p estándar

Ventajas arquitectónicas

Razonamiento de múltiples pasos eficiente reduciendo el backtracking
Compactación de contexto optimizada
Herramientas de memoria para razonamiento sostenido en sesiones largas

Conclusión

Claude Opus 4.5 representa más que una actualización de modelo — es una demostración de lo que la IA puede lograr cuando la eficiencia y la capacidad avanzan juntas.

Para los desarrolladores, las implicaciones son claras:

Mejor rendimiento en tareas de coding y automatización
Costes reducidos gracias a la eficiencia de tokens
Nuevas posibilidades con el computer use y la coordinación multi-agente