ai-powered-markdown-translatorArtículo traducido del fr al es con gpt-5.4-mini.
El 19 de mayo de 2026 es una jornada cargada para la IA: Andrej Karpathy abandona la escena para unirse a Anthropic, Google I/O 2026 lanza un conjunto de anuncios agentic en torno a la serie Gemini 3.5, xAI despliega Grok Skills con generación de documentos Office, y Cohere realiza una adquisición estratégica en la biopharma. En paralelo, OpenAI refuerza la procedencia de los contenidos de IA y el mundo generativo de los medios se enriquece con nuevas capacidades.
Andrej Karpathy se une a Anthropic
19 de mayo — Andrej Karpathy anunció en X que se había unido a Anthropic. La noticia generó más de 11,3 millones de vistas, 102 000 menciones “me gusta” y 13 000 compartidos en pocas horas — un compromiso excepcional que mide el impacto de este fichaje en la comunidad.
“Personal update: I’ve joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D. I remain deeply passionate about education and plan to resume my work on it in time.”
🇪🇸 Actualización personal: me he unido a Anthropic. Creo que los próximos años en la frontera de los LLM serán especialmente formativos. Estoy muy entusiasmado con la idea de unirme al equipo y volver a la I+D. Sigo profundamente apasionado por la educación y planeo retomar ese trabajo a su debido tiempo. — @karpathy en X
Karpathy es una de las figuras más reconocidas del sector. Su trayectoria: doctorado en Stanford, miembro fundador de OpenAI, director de IA en Tesla, y luego figura independiente con la serie pedagógica nanoGPT y sus cursos de aprendizaje automático seguidos por millones de personas.
Su llegada a Anthropic refuerza considerablemente el equipo de investigación fundamental en el momento exacto en que la competencia entre los laboratorios frontera se intensifica. Un ex-OpenAI que se une a Anthropic: la señal es fuerte sobre las dinámicas de talento en el sector.
Anthropic no precisó su función exacta. El anuncio coincide con el evento Code with Claude London y varios lanzamientos importantes del mismo día.
Google I/O 2026 — La era agentic de Gemini 3.5
19 de mayo — Google I/O 2026 tiene lugar hoy, con el tema central la era agentic de Gemini (agentic Gemini era). Google anuncia durante la keynote un conjunto coherente de anuncios que giran todos en torno a la capacidad de Gemini para actuar de manera autónoma, proactiva y persistente.
“Three years ago, Gemini started by understanding the world. With Gemini 2, models learned to think and reason. Late last year, Gemini 3 brought any idea to life. Today, we’re continuing that journey with our Gemini 3.5 series, starting with Gemini 3.5 Flash, delivering frontier performance for agents and coding.”
🇪🇸 “Hace tres años, Gemini comenzó por comprender el mundo. Con Gemini 2, los modelos aprendieron a pensar y razonar. A finales del año pasado, Gemini 3 dio vida a cualquier idea. Hoy, continuamos este recorrido con nuestra serie Gemini 3.5, empezando por Gemini 3.5 Flash, que ofrece rendimiento de vanguardia para agentes y codificación.” — @GoogleAI en X
Los anuncios principales de la keynote I/O 2026:
| Anuncio | Categoría |
|---|---|
| Gemini 3.5 Flash | Nuevo modelo (agentes + coding) |
| Gemini Omni | Modelo de vídeo multimodal |
| Gemini Spark | Agente personal 24/7 |
| Daily Brief | Agente matinal personalizado |
| Neural Expressive | Nuevo diseño de la app |
| Managed Agents API | Infraestructura Antigravity para desarrolladores |
| Google AI Studio | Renovado con plantillas de agentes |
Gemini 3.5 Flash — Velocidad e inteligencia para los agentes
19 de mayo — Gemini 3.5 Flash es el primer modelo de la nueva generación 3.5. Está diseñado para combinar inteligencia de vanguardia (frontier intelligence) y velocidad de acción fulgurante (lightning-fast action), especialmente optimizado para los casos de uso de agentes y codificación.
Gemini 3.5 Flash es el motor subyacente del agente Antigravity (Managed Agents API) y de Gemini Spark. Está disponible a través de la API Gemini y en Google AI Studio desde el 19 de mayo.
| Generación | Capacidad clave |
|---|---|
| Gemini 1 | Comprensión del mundo |
| Gemini 2 | Razonamiento y pensamiento |
| Gemini 3 | Creación multimodal |
| Gemini 3.5 Flash | Agentes, coding, velocidad fulgurante |
El modelo también está disponible en disponibilidad general (generally available) en GitHub Copilot el mismo día de su lanzamiento — en los planes Pro, Pro+, Business y Enterprise. GitHub informa de rendimientos cercanos al nivel Pro a la velocidad Flash, con uso eficaz de herramientas, tiempos de respuesta rápidos y alta eficiencia de caché. El despliegue es gradual; los administradores de Copilot Enterprise y Business deben activar la política Gemini 3.5 Flash en los ajustes.
| Atributo de Copilot | Valor |
|---|---|
| Planes afectados | Pro, Pro+, Business, Enterprise |
| IDEs compatibles | VS Code, Visual Studio, JetBrains, Xcode, Eclipse, GitHub Mobile |
| Multiplicador premium | 14× (provisional, susceptible de evolucionar) |
Gemini Omni — Crear cualquier cosa a partir de cualquier cosa
19 de mayo — Google DeepMind lanza Gemini Omni, presentado como “el primer paso hacia un modelo capaz de crear cualquier cosa a partir de cualquier cosa — empezando por el vídeo”. Combina la inteligencia de Gemini con los sistemas de medios generativos de Google (Veo, Imagen).
“We’re dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video. It combines Gemini’s intelligence with our generative media systems - representing a leap forward in world understanding, multimodality, and editing.”
🇪🇸 “Lanzamos Gemini Omni: nuestro primer paso hacia un modelo capaz de crear cualquier cosa a partir de cualquier cosa — empezando por el vídeo. Combina la inteligencia de Gemini con nuestros sistemas de medios generativos, representando un salto adelante en la comprensión del mundo, la multimodalidad y la edición.” — @GoogleDeepMind en X
En la app Gemini, Gemini Omni permite la generación de vídeo cinematográfico de alta calidad a partir de texto, imágenes o vídeos existentes, la edición de vídeo mediante conversación natural (zooms cinematográficos, cambios de fondo con un simple prompt), la creación de avatares IA personalizados parecidos al usuario y la aplicación de plantillas integradas con un toque.
Disponibilidad: Despliegue progresivo desde el 19 de mayo para los suscriptores de Google AI Plus, Pro y Ultra en todo el mundo.
Gemini Spark — Agente personal 24/7
19 de mayo — Google anuncia Gemini Spark, un agente de IA personal disponible 24 horas al día, 7 días a la semana. Es un cambio fundamental en la naturaleza de Gemini: pasa de ser un asistente reactivo a un socio activo que trabaja en segundo plano incluso cuando el usuario cierra su dispositivo (arquitectura en la nube).
Spark funciona sobre Gemini 3.5 Flash mediante la infraestructura Antigravity. Está profundamente integrado en las herramientas Workspace (Gmail, Docs, Slides, Calendar).
| Capacidad | Detalle |
|---|---|
| Tareas recurrentes | Disparadores automáticos (p. ej.: analizar los extractos mensuales) |
| Aprendizaje de habilidades | Bajo instrucción del usuario |
| Flujos de trabajo completos | Resumen de reunión → Google Doc → correo de seguimiento |
| Conexiones MCP | Canva, OpenTable, Instacart desde el lanzamiento |
| Control del usuario | Se solicita confirmación antes de acciones de alto impacto |
Disponibilidad: Pruebas de confianza esta semana; beta para los suscriptores de Google AI Ultra en Estados Unidos la semana siguiente. Llegada a la app macOS Gemini prevista para el verano de 2026.
Managed Agents en la API Gemini — Infraestructura Antigravity abierta
19 de mayo — Google lanza los Managed Agents en la API Gemini, permitiendo a los desarrolladores desplegar agentes con una sola línea de código en un entorno Linux aislado y efímero. La infraestructura está impulsada por el agente Antigravity, construido sobre Gemini 3.5 Flash.
Es la apertura de la infraestructura interna de agentes de Google a los desarrolladores externos. El primer agente gestionado fue Deep Research (diciembre de 2025); ahora los desarrolladores pueden crear los suyos.
| Funcionalidad de desarrollador | Detalle |
|---|---|
| Despliegue | Una sola llamada API — entorno Linux remoto |
| Capacidades | Navegación web, ejecución de código, gestión de archivos |
| Personalización | Archivos AGENTS.md y SKILL.md |
| Sesiones persistentes | Reanudación completa del estado |
| Agentes reutilizables | Registro mediante client.agents.create() |
| Enterprise | Gemini Enterprise Agent Platform (vista previa privada) |
Disponibilidad: Vista previa en la API Gemini desde la noche del 19 de mayo; plantillas en Google AI Studio.
🔗 Anuncio de Managed Agents API
Claude Managed Agents — Sandboxes autoalojados y túneles MCP
19 de mayo — Desde el evento Code with Claude London, Anthropic ha lanzado dos nuevas funcionalidades importantes para Claude Managed Agents.
Self-hosted sandboxes (beta pública) — Los agentes Claude ahora pueden ejecutarse en entornos aislados (sandboxes) alojados en la infraestructura del cliente. Los equipos mantienen los archivos sensibles, paquetes y servicios dentro de su propio perímetro, con sus políticas de red, registros de auditoría y herramientas de seguridad ya en funcionamiento.
MCP tunnels (vista de investigación) — Los agentes pueden alcanzar servidores MCP situados en una red privada sin exponerlos públicamente. Los túneles MCP se gestionan desde la Claude Console y son compatibles tanto con Managed Agents como con la Messages API.
| Funcionalidad | Estado | Proveedores |
|---|---|---|
| Self-hosted sandboxes | Beta pública | Cloudflare, Daytona, Modal, Vercel |
| MCP tunnels | Vista de investigación (acceso bajo demanda) | Vía Claude Console |
🔗 Anuncio de Claude Managed Agents
Grok Skills — Experiencia persistente y documentos Office
18 de mayo — xAI lanzó Skills para Grok 4.3, una funcionalidad de memorización persistente que permite a Grok aprender preferencias, reglas de formato y pasos de flujo de trabajo una sola vez, y luego aplicarlos en todas las conversaciones siguientes.
“I’m leveling up my Skills. Automate your workflows and get things done in record time with prebuilt and custom Skills.”
🇪🇸 “Estoy mejorando mis competencias gracias a Skills. Automatiza tus flujos de trabajo y completa tus tareas a velocidad récord con Skills preconstruidos y personalizados.” — @grok en X
| Tipo de documento | Capacidades |
|---|---|
Word (.docx) | Creación y edición con formato completo (títulos, tablas, viñetas) |
| PowerPoint | Diapositivas con jerarquía visual y notas del orador |
| Excel | Fórmulas, secciones coloreadas, estructura clara |
| Creación, fusión, división y extracción | |
| Skill Creator | Construcción de nuevos skills personalizados mediante la conversación |
Los Skills están disponibles en grok.com, iOS y Android. Los skills personalizados del usuario siempre tienen prioridad sobre los skills integrados por defecto.
Cohere adquiere Reliant AI — IA soberana para la biopharma
19 de mayo — Cohere anuncia la adquisición de Reliant AI, una empresa especializada en IA para la biopharmacia, con oficinas en Montreal y Berlín. Esta operación refuerza la estrategia de IA soberana (sovereign AI) de Cohere en los sectores de la salud y las ciencias de la vida.
“Healthcare represents one of the most consequential opportunities for AI and it demands secure, sovereign, and domain-specific systems.”
🇪🇸 La salud representa una de las oportunidades más importantes para la IA y exige sistemas seguros, soberanos y específicos del dominio. — Aidan Gomez, Co-Founder & CEO, Cohere
Aportaciones de la adquisición:
| Elemento | Detalle |
|---|---|
| Equipo | Investigadores de alto nivel especializados en biopharma |
| Datos | Bases de datos biomédicas propietarias |
| Tecnología | Banco de trabajo de investigación inteligente (intelligent research workbench) |
| Clientes transferidos | GSK, Medicus Pharma, Kyowa Kirin |
Nuevo producto: North for Pharma — Cohere anuncia el desarrollo de un sistema de IA agentic diseñado para los equipos de biopharma que trabajan en I+D, desarrollo clínico y análisis científico. Amplía la suite “North” ya ofrecida para los sectores financiero y de telecomunicaciones.
Karl Moritz Hermann (ex-CEO de Reliant AI) se convierte en VP of AI Verticalizations en Berlín. Marc Bellemare (cofundador, Canada CIFAR AI Chair, Mila) se convierte en VP of Modelling en Montreal.
KPMG × Anthropic — Alianza global (276 000 empleados, 138 países)
19 de mayo — KPMG, una de las mayores firmas de servicios profesionales del mundo, anunció una alianza estratégica global con Anthropic. La firma integra Claude en su plataforma Digital Gateway y da acceso a Claude al conjunto de sus más de 276 000 empleados en 138 países.
Los ejes principales: Claude Cowork y Managed Agents integrados en Digital Gateway, nuevas herramientas para clientes en fiscalidad y legal, KPMG se convierte en socio preferente de Anthropic para fondos de capital inversión, y los equipos de KPMG usan Claude Code (a través de KPMG Blaze) para modernizar sistemas informáticos obsoletos.
“Building an AI agent to help clients adjust to changing tax regulations used to take weeks and required teams to switch between multiple tools and chat windows. With Cowork and Managed Agents integrated in Digital Gateway, that same capability takes minutes.”
🇪🇸 Crear un agente de IA para ayudar a los clientes a adaptarse a la evolución de las regulaciones fiscales solía llevar semanas y requería hacer malabares entre varias herramientas. Con Cowork y Managed Agents integrados en Digital Gateway, esa misma capacidad ahora toma solo unos minutos. — Rema Serafi, Vicepresidenta de Fiscalidad, KPMG US
Este despliegue se apoya en dos años de adopción interna en KPMG en Estados Unidos.
Gemini App — Neural Expressive y Daily Brief
19 de mayo — La app Gemini recibe dos novedades importantes.
Neural Expressive es un nuevo lenguaje de diseño para la era de la IA: animaciones fluidas, colores vivos, nueva tipografía, retroalimentación háptica. La experiencia Gemini Live (conversación por voz) está ahora integrada directamente en la interfaz principal: paso fluido entre escritura y conversación. Despliegue global desde el 19 de mayo en web, Android e iOS para todos los usuarios.
Daily Brief es un agente que genera cada mañana un resumen personalizado basado en Gmail, Calendar y las prioridades del usuario. Va más allá de un simple resumen: organiza, prioriza y sugiere próximas acciones concretas. Despliegue progresivo para los suscriptores Plus, Pro y Ultra, comenzando por Estados Unidos.
OpenAI — C2PA, SynthID y herramienta de verificación pública
19 de mayo — OpenAI anuncia un enfoque multicapa para la procedencia de los contenidos generados por IA, combinando tres mecanismos complementarios.
| Mecanismo | Alcance | Resistencia a las modificaciones |
|---|---|---|
| Metadatos C2PA | Imágenes, audio, vídeo | Media (se puede eliminar) |
| Marca de agua SynthID (Google DeepMind) | Solo imágenes | Alta |
| Herramienta openai.com/verify | Contenidos generados por OpenAI | N/A |
OpenAI integra ahora la marca de agua digital invisible SynthID de Google DeepMind en todas las imágenes generadas mediante ChatGPT, Codex y la API de OpenAI. SynthID codifica el origen directamente en los píxeles de la imagen de forma imperceptible, y resiste la mayoría de las modificaciones habituales (recorte, filtros, compresión). La herramienta pública openai.com/verify permite a cualquiera subir una imagen para detectar la presencia de una marca de agua SynthID — por ahora en vista previa limitada a contenidos de OpenAI.
NVIDIA Sana WM — Modelo del mundo en una sola GPU
19 de mayo — NVIDIA AI presenta Sana WM (World Model). A partir de una sola imagen, una descripción textual y una trayectoria de cámara, el modelo genera videos coherentes y controlables — todo en una sola GPU.
La arquitectura se basa en cuatro innovaciones: Hybrid Linear Attention, Dual-Branch Camera Control, Two-Stage Generation Pipeline y Robust Annotation Pipeline. El proyecto es totalmente open source (paper + code + model).
Wan2.7-Image — Control de paleta de colores
19 de mayo — Alibaba anuncia el control de paleta de colores (Palette Control) para Wan2.7-Image. La función permite extraer la paleta cromática de cualquier imagen — como una obra maestra artística — y aplicarla a una nueva creación. Disponible directamente en wan.video. El anuncio generó 529 742 visualizaciones en X.
ElevenLabs — Voz de Albert Einstein para la enseñanza
19 de mayo — ElevenLabs anuncia la introducción de la voz recreada de Albert Einstein en su plataforma, en forma de un agente conversacional dedicado a la enseñanza. El agente ilustra cómo la IA de voz puede hacer que el aprendizaje sea más interactivo, accesible y multilingüe. Hay una demostración disponible en start.elevenlabs.io. Los profesores pueden acceder al plan Pro gratuito a través del programa Impact.
En paralelo, ElevenLabs anuncia un piloto en Polonia: despliegue de agentes de voz en los servicios públicos de salud (NFZ) este verano.
xAI Grok integrado en OpenClaw — Agente local open-source multi-mensajería
19 de mayo — xAI anuncia la integración de Grok en OpenClaw, un agente personal open-source y local-first (local-first). Los suscriptores de Grok y X Premium ahora pueden usar Grok en OpenClaw, que funciona en cualquier hardware (Mac Mini, portátil, Raspberry Pi) y se conecta a WhatsApp, Telegram, Slack, Discord, Signal e iMessage.
Z.ai GLM-5.1 — N.º 1 open-source SWE-Bench Pro, MIT, contexto de 200K
18 de mayo — Z.ai (Zhipu AI) pone a disposición GLM-5.1 en OrcaRouter. El modelo reclama el primer puesto entre los modelos open-source en SWE-Bench Pro (benchmark de reparación de código en condiciones reales), superando incluso a algunos modelos propietarios. Licencia MIT, contexto de 200K tokens, diseñado para la codificación agéntica de largo recorrido (long-horizon agentic coding).
Breves
-
The Problem Solvers (Anthropic) — Nueva serie de video que muestra a fundadores construyendo con Claude. Primeros episodios: Scott Wu (Cognition/Devin) y Kay Zhu (Genspark). 🔗 claude.com/problem-solvers
-
Manus × Higgsfield (conector MCP) — Manus integra Higgsfield mediante MCP para dar a los creadores un control profesional sobre la generación de imágenes/video dentro de sus flujos de trabajo. 🔗 manus.im/blog
-
OpenAI Guaranteed Capacity — Nueva oferta que permite a las empresas reservar acceso a los recursos de computación de OpenAI mediante compromisos de 1 a 3 años, con descuentos crecientes según la duración. 🔗 openai.com
-
Perplexity Computer — Rho — Rho redujo el tiempo de la reunión semanal en un 90 % y ahorró 120 horas en 12 semanas gracias a Perplexity Computer, que supervisa Slack, Notion, Jira, Figma y Google Docs. 🔗 Perplexity en X
Lo que significa
La convergencia de los Managed Agents. Google y Anthropic anuncian el mismo día, casi a la misma hora, una infraestructura similar bajo el mismo nombre: Managed Agents. En Google, se trata de Antigravity abierto a través de la API Gemini — basta una llamada para desplegar un agente en un sandbox Linux aislado. En Anthropic, se trata de los self-hosted sandboxes (Cloudflare, Daytona, Modal, Vercel) y de los túneles MCP para redes privadas. Esta convergencia no es casual: marca la aparición de una nueva capa de infraestructura de IA estandarizada, entre el modelo bruto y la aplicación final.
La IA enterprise se estructura en torno a la soberanía. La adquisición de Reliant AI por Cohere, la alianza KPMG-Anthropic con Claude en Digital Gateway y la oferta OpenAI Guaranteed Capacity dibujan el mismo movimiento: las grandes organizaciones quieren sistemas de IA dentro de su perímetro, con sus datos, sus reglas de seguridad y compromisos de capacidad a varios años. “Soberano” (sovereign) se ha convertido en la palabra clave de la IA enterprise en 2026.
La carrera por la codificación agéntica de largo recorrido. Gemini 3.5 Flash (optimizado para agentes + coding), GLM-5.1 de Z.ai (N.º 1 open-source SWE-Bench Pro, 200K de contexto), Grok Skills (workflows persistentes) — todos apuntan al mismo caso de uso: un agente que trabaja en una tarea compleja durante horas sin intervención humana. GitHub Copilot integra Gemini 3.5 Flash el mismo día de su lanzamiento, lo que ilustra la rapidez con la que el tooling para desarrolladores absorbe los nuevos modelos.
Proveniencia y confianza en los contenidos de IA. La combinación C2PA + SynthID + openai.com/verify anunciada por OpenAI (con SynthID de Google DeepMind) representa un enfoque multicapa inédito: metadatos para el contexto, marca de agua invisible para la persistencia incluso tras modificaciones, herramienta pública para la verificación. Este movimiento hacia la trazabilidad de los contenidos generados se está convirtiendo progresivamente en una norma de la industria, impulsada conjuntamente por OpenAI, Google y la coalición C2PA.
Fuentes
- Karpathy en X
- Actualizaciones de Claude Managed Agents
- Anthropic × KPMG
- Google I/O 2026 — Próxima evolución de Gemini App
- GoogleAI en X — Gemini 3.5
- GoogleDeepMind en X — Gemini Omni
- API de Managed Agents Gemini
- GitHub Copilot — Gemini 3.5 Flash GA
- GitHub en X — Gemini 3.5 Flash
- Grok Skills
- Cohere adquiere Reliant AI
- Proveniencia de contenido de OpenAI
- NVIDIA Sana WM
- Wan2.7-Image Palette Control
- ElevenLabs Einstein
- xAI Grok × OpenClaw
- Z.ai GLM-5.1