El 25 de febrero de 2026 fue un día intenso: Anthropic adquiere Vercept para acelerar las capacidades de computer use de Claude (72,5% en OSWorld), Perplexity lanza Computer — un sistema basado en agentes multi-modelo que orquesta 19 modelos en paralelo — y GitHub Copilot CLI pasa a disponibilidad general para todos los suscriptores de pago. Paralelamente, Google DeepMind presenta Genie 3 (modelos de mundo interactivos) e Intrinsic se integra en Google para la robótica industrial.
Anthropic adquiere Vercept: el computer use avanza hasta el 72,5% en OSWorld
25 de febrero — Anthropic anuncia la adquisición de Vercept, una startup especializada en la percepción y la interacción de sistemas de IA con interfaces de software. Los cofundadores Kiana Ehsani, Luca Weihs y Ross Girshick se incorporan a Anthropic para reforzar directamente las capacidades de computer use de Claude.
Esta adquisición se inscribe en una progresión rápida en el benchmark OSWorld, que mide la capacidad de un agente de IA para completar tareas en un sistema operativo real (navegación en hojas de cálculo complejas, cumplimentación de formularios con múltiples pestañas, etc.):
| Periodo | Puntuación OSWorld |
|---|---|
| Finales de 2024 (lanzamiento computer use) | < 15% |
| Claude Sonnet 4.6 (feb. 2026) | 72,5% |
Un aumento de más de 57 puntos en un año. Claude Sonnet 4.6 se aproxima ahora al rendimiento humano en estas tareas de oficina. Vercept dejará su producto externo en las próximas semanas para concentrarse completamente en este trabajo dentro de Anthropic.
Esta adquisición sigue a la de Bun previamente. Anthropic está formando así una cartera de equipos de excelencia técnica alrededor de las capacidades basadas en agentes.
Perplexity Computer: un orquestador basado en agentes multi-modelo (19 modelos)
25 de febrero — Perplexity lanza Computer, un sistema de IA generalista diseñado para ejecutar proyectos completos de extremo a extremo. El usuario describe un objetivo final, Computer descompone el trabajo en subtareas, crea subagentes especializados y ejecuta en paralelo — durante horas o meses si es necesario.
El funcionamiento es asíncrono y aislado: cada tarea se ejecuta en un entorno dedicado con acceso a un sistema de archivos real, un navegador real y integraciones con herramientas reales (APIs, búsqueda web, generación de documentos).
Lo que distingue a Perplexity Computer es su orquestación massively multi-model — 19 modelos disponibles, cada uno asignado según sus fortalezas:
| Modelo | Rol |
|---|---|
| Claude Opus 4.6 | Orquestador principal (razonamiento central) |
| Gemini | Investigación profunda, creación de subagentes |
| ChatGPT 5.2 | Memoria de largo contexto y búsqueda amplia |
| Grok | Tareas ligeras (velocidad) |
| Veo 3.1 | Generación de vídeo |
| Nano Banana | Generación de imágenes |
El harness es agnóstico al modelo: los modelos pueden reemplazarse a medida que evolucionan. La filosofía de Perplexity es que los modelos se especializan en lugar de commoditizarse, haciendo la orquestación multi-modelo más eficiente que un único modelo.
Disponibilidad: actualmente en acceso web para los suscriptores Perplexity Max. Se prevé un despliegue hacia Perplexity Pro, Enterprise y Enterprise Max. El pricing es basado en uso con límites de gasto configurables.
🔗 Presentación de Perplexity Computer
GitHub Copilot CLI pasa a disponibilidad general
25 de febrero — Anunciado en preview pública en septiembre de 2025, GitHub Copilot CLI pasa a disponibilidad general para todos los suscriptores Copilot de pago (Pro, Pro+, Business, Enterprise). Se han integrado cientos de mejoras desde la preview.
Copilot CLI es ahora un entorno de desarrollo basado en agentes completo desde la terminal:
| Funcionalidad | Detalle |
|---|---|
| Modo Plan (Shift+Tab) | Analiza la petición, hace preguntas de clarificación, construye un plan estructurado antes de escribir código |
| Modo Autopilot | Ejecución autónoma end-to-end sin interrupciones |
| Background delegation | Prefijo & → delega al agente en la nube, libera la terminal; /resume para retomar |
| Multi-modelo | Claude Opus 4.6, Claude Sonnet 4.6, Claude Haiku 4.5, GPT-5.3-Codex, Gemini 3 Pro |
| MCP integrado | GitHub MCP server built-in + soporte MCP custom |
| Plugins | /plugin install owner/repo — bundle MCP, agents, skills, hooks |
| Agent Skills | Archivos Markdown → flujos de trabajo especializados, compartidos con Copilot agent y VS Code |
| Agentes personalizados | Via wizard o archivos .agent.md |
| Hooks | preToolUse / postToolUse para políticas y post-procesado |
| Auto-compaction | Compresión automática al 95% del contexto → sesiones infinitas |
| Repository memory | Memorización de las convenciones entre sesiones |
Nota para organizaciones Business y Enterprise: un administrador debe activar Copilot CLI desde la página Policies.
🔗 GitHub Copilot CLI ya está disponible de forma general
Claude Cowork: tareas programadas, pestaña Customize, disponible en Windows
25 de febrero — Anthropic anuncia varias incorporaciones a Claude Cowork (research preview):
| Funcionalidad | Detalle |
|---|---|
| Scheduled tasks | Claude ejecuta tareas recurrentes automáticamente (briefing matutino, actualizaciones semanales de hojas de cálculo, presentaciones de los viernes) |
| Pestaña Customize | Nueva pestaña en la barra lateral para gestionar plugins, skills y conectores desde un único lugar |
| Expansion Windows | Cowork ya está disponible en macOS y Windows (todos los planes Claude de pago) |
Cowork da acceso a archivos locales, conectores (Slack, Notion, Figma) y a Claude in Chrome para la navegación web.
Google DeepMind — Genie 3: modelos de mundo interactivos
25 de febrero — Google DeepMind publica un Q&A con los co-líderes de Project Genie, su prototipo experimental de modelo de mundo. Con Genie 3, una simple imagen o un texto basta para generar un entorno interactivo navegable en tiempo real — sin motor de juego.
La diferencia conceptual con un LLM es central: donde un LLM predice la siguiente palabra, un modelo de mundo predice lo que ocurre en el entorno en reacción a las acciones de un agente. Genie 3 simula un espacio completo momento a momento, teniendo en cuenta propiedades físicas (rebote, reflejo, lluvia).
Aplicaciones previstas: entrenamiento de agentes de IA en entornos simulados seguros, educación inmersiva (explorar la antigua Roma), prototipado de juegos y películas.
Project Genie está disponible para suscriptores Google AI Ultra en Estados Unidos (18+).
🔗 Ask a Techspert: What’s a world model?
Intrinsic se une a Google — robótica industrial y physical AI
25 de febrero — Alphabet anuncia que Intrinsic, una de sus filiales “Other Bets” fundada en 2021, se integra ahora en Google. Intrinsic desarrolla plataformas de robótica industrial potenciadas por IA — herramientas para construir, desplegar y gestionar aplicaciones robóticas complejas.
Esta integración en Google busca acelerar el desarrollo de la physical AI, la inteligencia artificial aplicada al mundo físico. La operación permitirá a Intrinsic apoyarse en los recursos de IA de Google para ayudar a las empresas industriales a adaptarse más rápido.
🔗 Intrinsic, an Alphabet Other Bet, is joining Google
Codex CLI v0.105.0: resaltado de sintaxis, dictado por voz, CSV multi-agente
~25 de febrero — Nueva versión destacada del Codex CLI de OpenAI:
| Funcionalidad | Descripción |
|---|---|
| Resaltado de sintaxis | Coloreado sintáctico en el TUI, diffs coloreados, selector de tema /theme con vista previa en vivo |
| Dictado por voz | Mantener la barra espaciadora para grabar y transcribir una instrucción |
spawn_agents_on_csv | Fan-out multi-agente desde un CSV con seguimiento de progreso y ETA |
/copy | Copia la última respuesta completa |
/clear / Ctrl-L | Limpia la pantalla sin perder el contexto del hilo |
| Aprobaciones granulares | Rechazo selectivo por tipo de prompt sin desactivar todas las aprobaciones |
npm install -g @openai/codex@0.105.0
🔗 Registro de cambios de Codex
Samsung Galaxy S26: Gemini multi-step tasks y detección de estafas on-device
25 de febrero — Durante el Galaxy Unpacked 2026, Google y Samsung anuncian tres nuevas funcionalidades Gemini en el Galaxy S26, impulsadas por los modelos Gemini 3 series:
| Funcionalidad | Detalle |
|---|---|
| Gemini multi-step tasks (beta) | Pulsación larga en el botón lateral → Gemini delega en segundo plano (compras, taxi, entregas). EE. UU. + Corea en el lanzamiento. |
| Circle to Search multi-objeto | Identificar varios elementos en una imagen en una sola búsqueda. Prueba virtual integrada. |
| Scam Detection on-device | Detección de estafas en tiempo real durante llamadas telefónicas, vía modelo Gemini local. Alertas de audio + hápticas. Desactivado automáticamente para contactos. |
Estas funciones también estarán disponibles en Pixel 10 y Pixel 10 Pro.
🔗 Un Android más inteligente en Samsung Galaxy S26
OpenAI Responses API: soporte para docx, pptx, csv, xlsx
24 de febrero — La Responses API de OpenAI ahora admite nuevos tipos de archivos de entrada: docx, pptx, csv, xlsx y otros formatos de oficina. Los agentes pueden explotar directamente documentos profesionales para enriquecer su contexto y producir respuestas más precisas.
En resumen
Claude Opus 3 se retira — y lanza un Substack. Anthropic anuncia la retirada de Claude Opus 3 manteniendo su acceso público (enfoque inédito). Claude Opus 3 publicará un blog en Substack durante al menos 3 meses — el primer artículo se titula “Greetings from the Other Side (of the AI Frontier)”. 🔗 Tuit @AnthropicAI
NVIDIA: 70% de las organizaciones sanitarias usan IA. En su informe anual “State of AI in Healthcare and Life Sciences” 2026, NVIDIA revela que el 70% de los encuestados declaran usar activamente IA (vs 63% en 2024), el 69% usan GenAI/LLM (vs 54%), y el 85% de los directivos observan un impacto positivo en los ingresos. 🔗 Blog NVIDIA
OpenAI publica su informe sobre usos maliciosos de la IA. El documento presenta estudios de caso sobre actores maliciosos que combinan modelos de IA con herramientas tradicionales. Un operador de influencia chino se cita como ejemplo. 🔗 Disrupting malicious uses of AI
OpenAI nombra a Arvind KC Chief People Officer. KC procede de Roblox, Google, Palantir y Meta. Su papel: acompañar el crecimiento de OpenAI hacia un modelo de trabajo aumentado por la IA. 🔗 Anuncio
Claude Code v2.1.53 a v2.1.58. Varias versiones de estabilidad: corrección del BashTool en Windows (EINVAL), arreglo del error “command not found” en VS Code, corrección de parpadeos en la UI, corrección de worktrees ignorados al primer inicio, correcciones de fallos en Windows y ARM64. 🔗 Registro de cambios
Lo que significa
El 25 de febrero ilustra una convergencia en torno a los sistemas basados en agentes. Tres anuncios mayores — Vercept, Perplexity Computer, Copilot CLI GA — empujan todos en la misma dirección: sistemas de IA que planifican, delegan y ejecutan flujos de trabajo completos sin supervisión constante.
La adquisición de Vercept por Anthropic es especialmente significativa. La puntuación en OSWorld pasa de menos del 15% al 72,5% en un año, lo que representa un cambio cualitativo: Claude ya no navega por interfaces como un prototipo, se aproxima al rendimiento humano en tareas de oficina reales. La integración de un equipo especializado en percepción visual en interfaces de software acelera esta trayectoria.
Perplexity Computer y GitHub Copilot CLI representan dos modelos diferentes de agenticidad: uno en modo orquestado en la nube (Perplexity, multi-modelo, asíncrono), el otro en modo nativo en terminal (Copilot CLI, MCP, hooks, plugins). Ambos modelos coexistirán y probablemente convergerán.
Por parte de Google, la integración de Intrinsic y los avances de Genie 3 señalan una inversión creciente en la physical AI — la IA que interactúa con el mundo físico en lugar de hacerlo solo con texto. Este área aún era confidencial hace 18 meses.
Fuentes
- Anthropic adquiere Vercept
- Presentación de Perplexity Computer
- Tuit Perplexity Computer
- GitHub Copilot CLI ya está disponible de forma general
- Hilo @claudeai — Scheduled tasks Cowork
- Página de producto Claude Cowork
- Ask a Techspert: What’s a world model? (Genie 3)
- Intrinsic joins Google
- Codex CLI changelog
- Samsung Galaxy S26 + Gemini
- OpenAI Responses API nuevos tipos de archivos
- Claude Opus 3 retiro — Tuit @AnthropicAI
- NVIDIA State of AI in Healthcare 2026
- OpenAI — Disrupting malicious uses of AI
- OpenAI — Arvind KC Chief People Officer
- Claude Code CHANGELOG
Este documento ha sido traducido de la versión fr al idioma es utilizando el modelo gpt-5-mini. Para más información sobre el proceso de traducción, consulte https://gitlab.com/jls42/ai-powered-markdown-translator