Buscar

Karpathy se une a Anthropic, Google I/O 2026 inaugura la era agentic de Gemini 3.5, Cohere adquiere Reliant AI

Karpathy se une a Anthropic, Google I/O 2026 inaugura la era agentic de Gemini 3.5, Cohere adquiere Reliant AI

ai-powered-markdown-translator

Artículo traducido del fr al es con gpt-5.4-mini.

Ver proyecto en GitHub ↗

El 19 de mayo de 2026 es una jornada cargada para la IA: Andrej Karpathy abandona la escena para unirse a Anthropic, Google I/O 2026 lanza un conjunto de anuncios agentic en torno a la serie Gemini 3.5, xAI despliega Grok Skills con generación de documentos Office, y Cohere realiza una adquisición estratégica en la biopharma. En paralelo, OpenAI refuerza la procedencia de los contenidos de IA y el mundo generativo de los medios se enriquece con nuevas capacidades.


Andrej Karpathy se une a Anthropic

19 de mayo — Andrej Karpathy anunció en X que se había unido a Anthropic. La noticia generó más de 11,3 millones de vistas, 102 000 menciones “me gusta” y 13 000 compartidos en pocas horas — un compromiso excepcional que mide el impacto de este fichaje en la comunidad.

“Personal update: I’ve joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D. I remain deeply passionate about education and plan to resume my work on it in time.”

🇪🇸 Actualización personal: me he unido a Anthropic. Creo que los próximos años en la frontera de los LLM serán especialmente formativos. Estoy muy entusiasmado con la idea de unirme al equipo y volver a la I+D. Sigo profundamente apasionado por la educación y planeo retomar ese trabajo a su debido tiempo.@karpathy en X

Karpathy es una de las figuras más reconocidas del sector. Su trayectoria: doctorado en Stanford, miembro fundador de OpenAI, director de IA en Tesla, y luego figura independiente con la serie pedagógica nanoGPT y sus cursos de aprendizaje automático seguidos por millones de personas.

Su llegada a Anthropic refuerza considerablemente el equipo de investigación fundamental en el momento exacto en que la competencia entre los laboratorios frontera se intensifica. Un ex-OpenAI que se une a Anthropic: la señal es fuerte sobre las dinámicas de talento en el sector.

Anthropic no precisó su función exacta. El anuncio coincide con el evento Code with Claude London y varios lanzamientos importantes del mismo día.


Google I/O 2026 — La era agentic de Gemini 3.5

19 de mayo — Google I/O 2026 tiene lugar hoy, con el tema central la era agentic de Gemini (agentic Gemini era). Google anuncia durante la keynote un conjunto coherente de anuncios que giran todos en torno a la capacidad de Gemini para actuar de manera autónoma, proactiva y persistente.

“Three years ago, Gemini started by understanding the world. With Gemini 2, models learned to think and reason. Late last year, Gemini 3 brought any idea to life. Today, we’re continuing that journey with our Gemini 3.5 series, starting with Gemini 3.5 Flash, delivering frontier performance for agents and coding.”

🇪🇸 “Hace tres años, Gemini comenzó por comprender el mundo. Con Gemini 2, los modelos aprendieron a pensar y razonar. A finales del año pasado, Gemini 3 dio vida a cualquier idea. Hoy, continuamos este recorrido con nuestra serie Gemini 3.5, empezando por Gemini 3.5 Flash, que ofrece rendimiento de vanguardia para agentes y codificación.”@GoogleAI en X

Los anuncios principales de la keynote I/O 2026:

AnuncioCategoría
Gemini 3.5 FlashNuevo modelo (agentes + coding)
Gemini OmniModelo de vídeo multimodal
Gemini SparkAgente personal 24/7
Daily BriefAgente matinal personalizado
Neural ExpressiveNuevo diseño de la app
Managed Agents APIInfraestructura Antigravity para desarrolladores
Google AI StudioRenovado con plantillas de agentes

🔗 Blog de Google I/O 2026


Gemini 3.5 Flash — Velocidad e inteligencia para los agentes

19 de mayoGemini 3.5 Flash es el primer modelo de la nueva generación 3.5. Está diseñado para combinar inteligencia de vanguardia (frontier intelligence) y velocidad de acción fulgurante (lightning-fast action), especialmente optimizado para los casos de uso de agentes y codificación.

Gemini 3.5 Flash es el motor subyacente del agente Antigravity (Managed Agents API) y de Gemini Spark. Está disponible a través de la API Gemini y en Google AI Studio desde el 19 de mayo.

GeneraciónCapacidad clave
Gemini 1Comprensión del mundo
Gemini 2Razonamiento y pensamiento
Gemini 3Creación multimodal
Gemini 3.5 FlashAgentes, coding, velocidad fulgurante

El modelo también está disponible en disponibilidad general (generally available) en GitHub Copilot el mismo día de su lanzamiento — en los planes Pro, Pro+, Business y Enterprise. GitHub informa de rendimientos cercanos al nivel Pro a la velocidad Flash, con uso eficaz de herramientas, tiempos de respuesta rápidos y alta eficiencia de caché. El despliegue es gradual; los administradores de Copilot Enterprise y Business deben activar la política Gemini 3.5 Flash en los ajustes.

Atributo de CopilotValor
Planes afectadosPro, Pro+, Business, Enterprise
IDEs compatiblesVS Code, Visual Studio, JetBrains, Xcode, Eclipse, GitHub Mobile
Multiplicador premium14× (provisional, susceptible de evolucionar)

🔗 Anuncio de GitHub Copilot


Gemini Omni — Crear cualquier cosa a partir de cualquier cosa

19 de mayo — Google DeepMind lanza Gemini Omni, presentado como “el primer paso hacia un modelo capaz de crear cualquier cosa a partir de cualquier cosa — empezando por el vídeo”. Combina la inteligencia de Gemini con los sistemas de medios generativos de Google (Veo, Imagen).

“We’re dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video. It combines Gemini’s intelligence with our generative media systems - representing a leap forward in world understanding, multimodality, and editing.”

🇪🇸 “Lanzamos Gemini Omni: nuestro primer paso hacia un modelo capaz de crear cualquier cosa a partir de cualquier cosa — empezando por el vídeo. Combina la inteligencia de Gemini con nuestros sistemas de medios generativos, representando un salto adelante en la comprensión del mundo, la multimodalidad y la edición.”@GoogleDeepMind en X

En la app Gemini, Gemini Omni permite la generación de vídeo cinematográfico de alta calidad a partir de texto, imágenes o vídeos existentes, la edición de vídeo mediante conversación natural (zooms cinematográficos, cambios de fondo con un simple prompt), la creación de avatares IA personalizados parecidos al usuario y la aplicación de plantillas integradas con un toque.

Disponibilidad: Despliegue progresivo desde el 19 de mayo para los suscriptores de Google AI Plus, Pro y Ultra en todo el mundo.


Gemini Spark — Agente personal 24/7

19 de mayo — Google anuncia Gemini Spark, un agente de IA personal disponible 24 horas al día, 7 días a la semana. Es un cambio fundamental en la naturaleza de Gemini: pasa de ser un asistente reactivo a un socio activo que trabaja en segundo plano incluso cuando el usuario cierra su dispositivo (arquitectura en la nube).

Spark funciona sobre Gemini 3.5 Flash mediante la infraestructura Antigravity. Está profundamente integrado en las herramientas Workspace (Gmail, Docs, Slides, Calendar).

CapacidadDetalle
Tareas recurrentesDisparadores automáticos (p. ej.: analizar los extractos mensuales)
Aprendizaje de habilidadesBajo instrucción del usuario
Flujos de trabajo completosResumen de reunión → Google Doc → correo de seguimiento
Conexiones MCPCanva, OpenTable, Instacart desde el lanzamiento
Control del usuarioSe solicita confirmación antes de acciones de alto impacto

Disponibilidad: Pruebas de confianza esta semana; beta para los suscriptores de Google AI Ultra en Estados Unidos la semana siguiente. Llegada a la app macOS Gemini prevista para el verano de 2026.


Managed Agents en la API Gemini — Infraestructura Antigravity abierta

19 de mayo — Google lanza los Managed Agents en la API Gemini, permitiendo a los desarrolladores desplegar agentes con una sola línea de código en un entorno Linux aislado y efímero. La infraestructura está impulsada por el agente Antigravity, construido sobre Gemini 3.5 Flash.

Es la apertura de la infraestructura interna de agentes de Google a los desarrolladores externos. El primer agente gestionado fue Deep Research (diciembre de 2025); ahora los desarrolladores pueden crear los suyos.

Funcionalidad de desarrolladorDetalle
DespliegueUna sola llamada API — entorno Linux remoto
CapacidadesNavegación web, ejecución de código, gestión de archivos
PersonalizaciónArchivos AGENTS.md y SKILL.md
Sesiones persistentesReanudación completa del estado
Agentes reutilizablesRegistro mediante client.agents.create()
EnterpriseGemini Enterprise Agent Platform (vista previa privada)

Disponibilidad: Vista previa en la API Gemini desde la noche del 19 de mayo; plantillas en Google AI Studio.

🔗 Anuncio de Managed Agents API


Claude Managed Agents — Sandboxes autoalojados y túneles MCP

19 de mayo — Desde el evento Code with Claude London, Anthropic ha lanzado dos nuevas funcionalidades importantes para Claude Managed Agents.

Self-hosted sandboxes (beta pública) — Los agentes Claude ahora pueden ejecutarse en entornos aislados (sandboxes) alojados en la infraestructura del cliente. Los equipos mantienen los archivos sensibles, paquetes y servicios dentro de su propio perímetro, con sus políticas de red, registros de auditoría y herramientas de seguridad ya en funcionamiento.

MCP tunnels (vista de investigación) — Los agentes pueden alcanzar servidores MCP situados en una red privada sin exponerlos públicamente. Los túneles MCP se gestionan desde la Claude Console y son compatibles tanto con Managed Agents como con la Messages API.

FuncionalidadEstadoProveedores
Self-hosted sandboxesBeta públicaCloudflare, Daytona, Modal, Vercel
MCP tunnelsVista de investigación (acceso bajo demanda)Vía Claude Console

🔗 Anuncio de Claude Managed Agents


Grok Skills — Experiencia persistente y documentos Office

18 de mayo — xAI lanzó Skills para Grok 4.3, una funcionalidad de memorización persistente que permite a Grok aprender preferencias, reglas de formato y pasos de flujo de trabajo una sola vez, y luego aplicarlos en todas las conversaciones siguientes.

“I’m leveling up my Skills. Automate your workflows and get things done in record time with prebuilt and custom Skills.”

🇪🇸 “Estoy mejorando mis competencias gracias a Skills. Automatiza tus flujos de trabajo y completa tus tareas a velocidad récord con Skills preconstruidos y personalizados.”@grok en X

Tipo de documentoCapacidades
Word (.docx)Creación y edición con formato completo (títulos, tablas, viñetas)
PowerPointDiapositivas con jerarquía visual y notas del orador
ExcelFórmulas, secciones coloreadas, estructura clara
PDFCreación, fusión, división y extracción
Skill CreatorConstrucción de nuevos skills personalizados mediante la conversación

Los Skills están disponibles en grok.com, iOS y Android. Los skills personalizados del usuario siempre tienen prioridad sobre los skills integrados por defecto.

🔗 Anuncio de Grok Skills


Cohere adquiere Reliant AI — IA soberana para la biopharma

19 de mayo — Cohere anuncia la adquisición de Reliant AI, una empresa especializada en IA para la biopharmacia, con oficinas en Montreal y Berlín. Esta operación refuerza la estrategia de IA soberana (sovereign AI) de Cohere en los sectores de la salud y las ciencias de la vida.

“Healthcare represents one of the most consequential opportunities for AI and it demands secure, sovereign, and domain-specific systems.”

🇪🇸 La salud representa una de las oportunidades más importantes para la IA y exige sistemas seguros, soberanos y específicos del dominio. — Aidan Gomez, Co-Founder & CEO, Cohere

Aportaciones de la adquisición:

ElementoDetalle
EquipoInvestigadores de alto nivel especializados en biopharma
DatosBases de datos biomédicas propietarias
TecnologíaBanco de trabajo de investigación inteligente (intelligent research workbench)
Clientes transferidosGSK, Medicus Pharma, Kyowa Kirin

Nuevo producto: North for Pharma — Cohere anuncia el desarrollo de un sistema de IA agentic diseñado para los equipos de biopharma que trabajan en I+D, desarrollo clínico y análisis científico. Amplía la suite “North” ya ofrecida para los sectores financiero y de telecomunicaciones.

Karl Moritz Hermann (ex-CEO de Reliant AI) se convierte en VP of AI Verticalizations en Berlín. Marc Bellemare (cofundador, Canada CIFAR AI Chair, Mila) se convierte en VP of Modelling en Montreal.

🔗 Anuncio de Cohere


KPMG × Anthropic — Alianza global (276 000 empleados, 138 países)

19 de mayo — KPMG, una de las mayores firmas de servicios profesionales del mundo, anunció una alianza estratégica global con Anthropic. La firma integra Claude en su plataforma Digital Gateway y da acceso a Claude al conjunto de sus más de 276 000 empleados en 138 países.

Los ejes principales: Claude Cowork y Managed Agents integrados en Digital Gateway, nuevas herramientas para clientes en fiscalidad y legal, KPMG se convierte en socio preferente de Anthropic para fondos de capital inversión, y los equipos de KPMG usan Claude Code (a través de KPMG Blaze) para modernizar sistemas informáticos obsoletos.

“Building an AI agent to help clients adjust to changing tax regulations used to take weeks and required teams to switch between multiple tools and chat windows. With Cowork and Managed Agents integrated in Digital Gateway, that same capability takes minutes.”

🇪🇸 Crear un agente de IA para ayudar a los clientes a adaptarse a la evolución de las regulaciones fiscales solía llevar semanas y requería hacer malabares entre varias herramientas. Con Cowork y Managed Agents integrados en Digital Gateway, esa misma capacidad ahora toma solo unos minutos. — Rema Serafi, Vicepresidenta de Fiscalidad, KPMG US

Este despliegue se apoya en dos años de adopción interna en KPMG en Estados Unidos.

🔗 Anuncio de Anthropic × KPMG


Gemini App — Neural Expressive y Daily Brief

19 de mayo — La app Gemini recibe dos novedades importantes.

Neural Expressive es un nuevo lenguaje de diseño para la era de la IA: animaciones fluidas, colores vivos, nueva tipografía, retroalimentación háptica. La experiencia Gemini Live (conversación por voz) está ahora integrada directamente en la interfaz principal: paso fluido entre escritura y conversación. Despliegue global desde el 19 de mayo en web, Android e iOS para todos los usuarios.

Daily Brief es un agente que genera cada mañana un resumen personalizado basado en Gmail, Calendar y las prioridades del usuario. Va más allá de un simple resumen: organiza, prioriza y sugiere próximas acciones concretas. Despliegue progresivo para los suscriptores Plus, Pro y Ultra, comenzando por Estados Unidos.


OpenAI — C2PA, SynthID y herramienta de verificación pública

19 de mayo — OpenAI anuncia un enfoque multicapa para la procedencia de los contenidos generados por IA, combinando tres mecanismos complementarios.

MecanismoAlcanceResistencia a las modificaciones
Metadatos C2PAImágenes, audio, vídeoMedia (se puede eliminar)
Marca de agua SynthID (Google DeepMind)Solo imágenesAlta
Herramienta openai.com/verifyContenidos generados por OpenAIN/A

OpenAI integra ahora la marca de agua digital invisible SynthID de Google DeepMind en todas las imágenes generadas mediante ChatGPT, Codex y la API de OpenAI. SynthID codifica el origen directamente en los píxeles de la imagen de forma imperceptible, y resiste la mayoría de las modificaciones habituales (recorte, filtros, compresión). La herramienta pública openai.com/verify permite a cualquiera subir una imagen para detectar la presencia de una marca de agua SynthID — por ahora en vista previa limitada a contenidos de OpenAI.

🔗 Anuncio de OpenAI


NVIDIA Sana WM — Modelo del mundo en una sola GPU

19 de mayo — NVIDIA AI presenta Sana WM (World Model). A partir de una sola imagen, una descripción textual y una trayectoria de cámara, el modelo genera videos coherentes y controlables — todo en una sola GPU.

La arquitectura se basa en cuatro innovaciones: Hybrid Linear Attention, Dual-Branch Camera Control, Two-Stage Generation Pipeline y Robust Annotation Pipeline. El proyecto es totalmente open source (paper + code + model).

🔗 Anuncio de NVIDIA AI


Wan2.7-Image — Control de paleta de colores

19 de mayo — Alibaba anuncia el control de paleta de colores (Palette Control) para Wan2.7-Image. La función permite extraer la paleta cromática de cualquier imagen — como una obra maestra artística — y aplicarla a una nueva creación. Disponible directamente en wan.video. El anuncio generó 529 742 visualizaciones en X.

🔗 Anuncio de Alibaba Wan


ElevenLabs — Voz de Albert Einstein para la enseñanza

19 de mayo — ElevenLabs anuncia la introducción de la voz recreada de Albert Einstein en su plataforma, en forma de un agente conversacional dedicado a la enseñanza. El agente ilustra cómo la IA de voz puede hacer que el aprendizaje sea más interactivo, accesible y multilingüe. Hay una demostración disponible en start.elevenlabs.io. Los profesores pueden acceder al plan Pro gratuito a través del programa Impact.

En paralelo, ElevenLabs anuncia un piloto en Polonia: despliegue de agentes de voz en los servicios públicos de salud (NFZ) este verano.

🔗 Anuncio de ElevenLabs


xAI Grok integrado en OpenClaw — Agente local open-source multi-mensajería

19 de mayo — xAI anuncia la integración de Grok en OpenClaw, un agente personal open-source y local-first (local-first). Los suscriptores de Grok y X Premium ahora pueden usar Grok en OpenClaw, que funciona en cualquier hardware (Mac Mini, portátil, Raspberry Pi) y se conecta a WhatsApp, Telegram, Slack, Discord, Signal e iMessage.

🔗 Anuncio de xAI


Z.ai GLM-5.1 — N.º 1 open-source SWE-Bench Pro, MIT, contexto de 200K

18 de mayo — Z.ai (Zhipu AI) pone a disposición GLM-5.1 en OrcaRouter. El modelo reclama el primer puesto entre los modelos open-source en SWE-Bench Pro (benchmark de reparación de código en condiciones reales), superando incluso a algunos modelos propietarios. Licencia MIT, contexto de 200K tokens, diseñado para la codificación agéntica de largo recorrido (long-horizon agentic coding).

🔗 Anuncio de OrcaRouter


Breves

  • The Problem Solvers (Anthropic) — Nueva serie de video que muestra a fundadores construyendo con Claude. Primeros episodios: Scott Wu (Cognition/Devin) y Kay Zhu (Genspark). 🔗 claude.com/problem-solvers

  • Manus × Higgsfield (conector MCP) — Manus integra Higgsfield mediante MCP para dar a los creadores un control profesional sobre la generación de imágenes/video dentro de sus flujos de trabajo. 🔗 manus.im/blog

  • OpenAI Guaranteed Capacity — Nueva oferta que permite a las empresas reservar acceso a los recursos de computación de OpenAI mediante compromisos de 1 a 3 años, con descuentos crecientes según la duración. 🔗 openai.com

  • Perplexity Computer — Rho — Rho redujo el tiempo de la reunión semanal en un 90 % y ahorró 120 horas en 12 semanas gracias a Perplexity Computer, que supervisa Slack, Notion, Jira, Figma y Google Docs. 🔗 Perplexity en X


Lo que significa

La convergencia de los Managed Agents. Google y Anthropic anuncian el mismo día, casi a la misma hora, una infraestructura similar bajo el mismo nombre: Managed Agents. En Google, se trata de Antigravity abierto a través de la API Gemini — basta una llamada para desplegar un agente en un sandbox Linux aislado. En Anthropic, se trata de los self-hosted sandboxes (Cloudflare, Daytona, Modal, Vercel) y de los túneles MCP para redes privadas. Esta convergencia no es casual: marca la aparición de una nueva capa de infraestructura de IA estandarizada, entre el modelo bruto y la aplicación final.

La IA enterprise se estructura en torno a la soberanía. La adquisición de Reliant AI por Cohere, la alianza KPMG-Anthropic con Claude en Digital Gateway y la oferta OpenAI Guaranteed Capacity dibujan el mismo movimiento: las grandes organizaciones quieren sistemas de IA dentro de su perímetro, con sus datos, sus reglas de seguridad y compromisos de capacidad a varios años. “Soberano” (sovereign) se ha convertido en la palabra clave de la IA enterprise en 2026.

La carrera por la codificación agéntica de largo recorrido. Gemini 3.5 Flash (optimizado para agentes + coding), GLM-5.1 de Z.ai (N.º 1 open-source SWE-Bench Pro, 200K de contexto), Grok Skills (workflows persistentes) — todos apuntan al mismo caso de uso: un agente que trabaja en una tarea compleja durante horas sin intervención humana. GitHub Copilot integra Gemini 3.5 Flash el mismo día de su lanzamiento, lo que ilustra la rapidez con la que el tooling para desarrolladores absorbe los nuevos modelos.

Proveniencia y confianza en los contenidos de IA. La combinación C2PA + SynthID + openai.com/verify anunciada por OpenAI (con SynthID de Google DeepMind) representa un enfoque multicapa inédito: metadatos para el contexto, marca de agua invisible para la persistencia incluso tras modificaciones, herramienta pública para la verificación. Este movimiento hacia la trazabilidad de los contenidos generados se está convirtiendo progresivamente en una norma de la industria, impulsada conjuntamente por OpenAI, Google y la coalición C2PA.


Fuentes