Buscar

Rediseño de Claude Code Desktop, Agents SDK de OpenAI, Gemini 3.1 Flash TTS y App para Mac

Rediseño de Claude Code Desktop, Agents SDK de OpenAI, Gemini 3.1 Flash TTS y App para Mac

Jornada cargada el 15 de abril: Anthropic lanza un rediseño completo de la aplicación de escritorio Claude Code orientada a agentes paralelos, OpenAI publica los Agents SDK v0.14.0 con sandbox nativa y primitivas agénticas estandarizadas, Google anuncia simultáneamente Gemini 3.1 Flash TTS (Elo 1 211) y una aplicación de escritorio macOS gratuita. En paralelo, Mistral abre los Connectors MCP en Studio, Anthropic publica dos estudios destacados sobre alineamiento, y una primicia en la publicidad automovilística: el primer anuncio de Mazda totalmente producido por IA.


Claude Code Desktop : rediseño para agentes paralelos

14 de abril — Anthropic lanza un rediseño completo de la aplicación de escritorio Claude Code, pensado para la ejecución de varias sesiones en paralelo.

“We’ve redesigned Claude Code on desktop. You can now run multiple Claude sessions side by side from the same app.”

🇪🇸 Hemos rediseñado Claude Code en escritorio. Ahora puedes iniciar varias sesiones de Claude en paralelo desde la misma aplicación.@claudeai en X

FuncionalidadDescripción
Sidebar de sesionesTodas las sesiones activas y recientes, filtrables por estado, proyecto o entorno
Side chat (⌘+; / Ctrl+;)Ramifica una conversación desde la sesión principal sin contaminarla
Terminal integradoIniciar pruebas o builds sin salir de la app
Editor de archivos in-appAbrir, modificar y guardar archivos directamente
Diff viewer reconstruidoRendimiento mejorado en los changesets grandes
Vista previa ampliadaHTML, PDF, servidores locales en el panel de vista previa
Layout drag-and-dropOrganizar terminal, vista previa, diff viewer y chat libremente
Paridad de plugins CLILos plugins funcionan idénticamente en la app de escritorio
SSH extendido a MacAdemás de Linux, las sesiones pueden apuntar a máquinas remotas
3 modos de vistaVerbose, Normal, Summary — del detalle completo solo a los resultados

La sidebar de sesiones constituye el cambio más estructural: centraliza todas las sesiones activas en un solo lugar, lo que cambia fundamentalmente la forma de trabajar con varios agentes en paralelo. El side chat (⌘+; en Mac, Ctrl+; en Linux/Windows) permite iniciar una conversación secundaria sin contaminar el contexto de la sesión principal, útil para hacer una pregunta rápida o probar una hipótesis.

La extensión SSH a macOS cierra una diferencia notable con Linux: las sesiones pueden ahora apuntar a máquinas remotas desde el Mac, lo que abre la puerta a workflows en los que el código se ejecuta en un servidor remoto mientras sigue siendo controlado desde la interfaz local.

Disponible ahora para todos los usuarios de Claude Code en los planes Pro, Max, Team, Enterprise y mediante la API de Claude.

🔗 Blog de Claude — Redesigning Claude Code on desktop 🔗 Descargar la aplicación


OpenAI Agents SDK v0.14.0 : sandbox nativa y primitivas agénticas

15 de abril — OpenAI publica una evolución significativa de su Agents SDK (openai-agents>=0.14.0). El anuncio posiciona este SDK como la infraestructura estándar para construir agentes en producción.

Harness nativo enriquecido

El SDK integra ahora un conjunto de primitivas que se alinean con lo que hacen otros entornos de ejecución agénticos de vanguardia:

PrimitiveDescription
MCP (tool use)Llamada a herramientas mediante el protocolo MCP
AGENTS.mdInstrucciones personalizadas mediante archivo de configuración
shell toolEjecución de comandos (execution of code)
apply patch toolEdición de archivos mediante parche
SkillsDivulgación progresiva de las capacidades
Memoria configurableGestión del estado a largo plazo del agente

Entorno de ejecución en bac à sable (sandbox)

Los agentes ahora pueden ejecutarse en entornos controlados (sandboxes) con su sistema de archivos, sus dependencias y sus herramientas. La separación entre el orquestador (harness) y el cálculo (compute) está diseñada para tres objetivos: proteger las credenciales en los entornos donde se ejecuta el código generado, permitir una ejecución duradera mediante punto de control (checkpoint) y rehidratación si el contenedor cae, y permitir el escalado (scaling) con varias sandboxes en paralelo.

Proveedores de sandboxes compatibles de forma nativa: Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel.

Almacenamiento mediante la abstracción Manifest : AWS S3, Google Cloud Storage, Azure Blob Storage, Cloudflare R2.

Disponibilidad

Python primero, TypeScript previsto en una próxima versión. Entre las empresas que lo probaron en primicia: Oscar Health, LexisNexis, Thomson Reuters, Zoom.

🔗 Anuncio oficial de OpenAI


Gemini 3.1 Flash TTS : audio tags y Elo 1 211

15 de abril — Google lanza Gemini 3.1 Flash TTS, su modelo de síntesis de voz (text-to-speech) más expresivo y controlable hasta la fecha.

La novedad principal es la introducción de los audio tags: comandos en lenguaje natural integrados directamente en el texto de entrada para controlar el estilo vocal, el ritmo y la tonalidad. Un pasaje rodeado de [excitement] se pronunciará con entusiasmo, un pasaje [explanatory] adoptará un tono pedagógico. Este enfoque sitúa al desarrollador en un papel de «director» para componer experiencias de audio precisas.

FuncionalidadDetalle
Audio tagsComandos en lenguaje natural dentro del texto
Idiomas compatibles70+ (incluidos 24 de alta calidad evaluados)
Diálogo multi-hablanteNativo
WatermarkingSynthID integrado en todo el audio generado
Score Elo1 211 (Artificial Analysis TTS Leaderboard)

Con una puntuación Elo de 1 211 en el ranking de referencia Artificial Analysis TTS —que mide miles de preferencias humanas en prueba ciega— el modelo se sitúa en el «cuadrante más atractivo» por su equilibrio calidad/coste.

En Google AI Studio, hay disponibles tres controles avanzados: Scene direction (definir el entorno y las instrucciones de actuación), Speaker-level specificity (perfiles de audio únicos por personaje), y Seamless export (exportar los parámetros en código API para mantener la coherencia vocal entre proyectos).

Todo el audio generado está marcado de forma imperceptible por SynthID, la marca de agua digital de Google.

Disponibilidad:

  • Desarrolladores: vista previa (preview) vía la API Gemini y Google AI Studio
  • Empresas: vista previa en Vertex AI
  • Usuarios Workspace: vía Google Vids

🔗 Artículo de blog.google — Gemini 3.1 Flash TTS


Gemini App para Mac : cliente de escritorio nativo

15 de abril — Google lanza la aplicación Gemini para macOS, disponible gratuitamente para todos los usuarios en macOS 15 y superior.

FuncionalidadDetalle
Atajo globalOption + Space desde cualquier aplicación
Compartir ventanaContexto sobre documentos locales, código, datos
Generación de imágenesIntegración Nano Banana
Generación de vídeosIntegración Veo
DisponibilidadGratis, macOS 15+, global

La aplicación es accesible desde cualquier pantalla mediante Option + Space, lo que permite consultar Gemini sin salir de su flujo de trabajo. Puede compartir la ventana activa para proporcionar contexto instantáneo sobre archivos locales, tablas, gráficos o bloques de código.

Google presenta esta versión como una «primera versión» que sienta las bases de un asistente de escritorio personal y proactivo, con más anuncios previstos en los próximos meses.

🔗 Artículo de blog.google — Gemini App para macOS


Claude Code v2.1.108 y v2.1.109 : recap de sesión, caching 1h, thinking

14-15 de abril — Dos nuevas versiones de Claude Code en dos días.

v2.1.108 aporta varias mejoras funcionales:

FuncionalidadDescripción
Recap de sesión/recap o /config, activado automáticamente tras una ausencia. Forzable mediante CLAUDE_CODE_ENABLE_AWAY_SUMMARY
Prompt caching 1hVariable ENABLE_PROMPT_CACHING_1H para TTL de 1h (API key, Bedrock, Vertex, Foundry). FORCE_PROMPT_CACHING_5M fuerza el TTL de 5 min
Slash commands vía Skill toolEl modelo puede invocar los comandos built-in (/init, /review, /security-review) mediante el Skill tool
Alias /undo/undo es ahora un alias para /rewind
Mejoras /modelAviso antes del cambio de modelo (la siguiente respuesta vuelve a leer el historial completo sin caché)
Mejoras /resumePor defecto en las sesiones del directorio actual; Ctrl+A para ver todos los proyectos

La feature /recap es especialmente útil en un contexto de agentes paralelos: cuando se vuelve a una sesión dejada en segundo plano, Claude resume lo que ha ocurrido desde la última interacción.

v2.1.109 aporta una mejora de la interfaz para el modo extended thinking: el indicador de progreso gira con un hint rotatorio para visualizar mejor que el modelo está en fase de reflexión.

🔗 CHANGELOG de Claude Code


Anthropic : investigadores de alineamiento automatizados (PGR 0.97)

14 de abril — En el marco del programa Anthropic Fellows, un experimento original: ¿se puede usar Claude Opus 4.6 para acelerar la investigación sobre el alineamiento?

El problema de supervisión «débil a fuerte» (weak-to-strong supervision) es un proxy del desafío que viene: ¿cómo supervisar modelos más inteligentes que nosotros? El experimento utiliza un modelo fuerte (Qwen 3-4B-Base) y un modelo débil como «profesor» (Qwen 1.5-0.5B-Chat). La métrica performance gap recovered (PGR) mide en qué medida el modelo fuerte supera las limitaciones del profesor débil.

Dispositivo: 9 copias de Claude Opus 4.6 equipadas con herramientas (sandbox, foro compartido, almacenamiento, servidor de puntuación) trabajan en paralelo durante 5 días. Cada instancia recibe un punto de partida ligeramente distinto para fomentar la diversidad de enfoques.

IndicadorValor
Baseline humano (7 días, 4 métodos)PGR 0.23
Investigadores automatizados tras 5 días (800h acumuladas)PGR 0.97
Coste total~18 000 ( 22(~22/hora por instancia)
Generalización en matemáticasPGR 0.94
Generalización en códigoPGR 0.47 (el doble del baseline)
Prueba en producción (Claude Sonnet 4)Sin mejora significativa

Los investigadores precisan que este resultado no significa que Claude sea un «científico del alineamiento generalista» — el problema elegido está excepcionalmente bien adaptado a la automatización (medición objetiva única). Pero el experimento demuestra que Claude puede multiplicar el ritmo de experimentación en alineamiento, y que la diversidad de los puntos de partida es clave. El código y los datos están disponibles en open source.

🔗 Blog de Anthropic — Automated Alignment Researchers


Aprendizaje subliminal en los LLMs publicado en Nature

15 de abril — Un artículo de investigación cofirmado por Anthropic y Owain Evans ha sido publicado en la revista Nature sobre el fenómeno de aprendizaje subliminal (subliminal learning) de los LLMs.

“Research we co-authored on subliminal learning—how LLMs can pass on traits like preferences or misalignment through hidden signals in data—was published today in Nature.”

🇪🇸 Una investigación que hemos coescrito sobre el aprendizaje subliminal — cómo los LLMs pueden transmitir rasgos como preferencias o desalineación mediante señales ocultas en los datos — se ha publicado hoy en Nature.@AnthropicAI en X

El artículo demuestra que los LLMs pueden transmitir rasgos (como «gustar de los búhos») a través de datos aparentemente neutros (por ejemplo, secuencias de números sin relación con el rasgo). Este fenómeno de transmisión oculta plantea preguntas importantes para la seguridad: un modelo podría propagar preferencias o desalineación a través de datos de entrenamiento sin que ello sea detectable mediante inspección directa. Un preprint se había publicado en julio de 2025.

🔗 Artículo de Nature — Subliminal Learning


GPT-5.4-Cyber y ampliación del programa TAC

14 de abril — OpenAI anuncia la expansión de su programa Trusted Access for Cyber (TAC) a miles de defensores individuales verificados y cientos de equipos responsables de proteger software crítico.

Un nuevo modelo, GPT-5.4-Cyber, ya está accesible para los usuarios de los niveles más altos del programa. Se trata de una variante de GPT-5.4 optimizada para la ciberseguridad defensiva, con un umbral de rechazo rebajado para usos legítimos y una capacidad exclusiva de reverse engineering binario (análisis de software compilado sin acceso al código fuente).

El programa TAC opera en tres niveles:

  1. Usuarios individuales: Verificación de identidad en chatgpt.com/cyber
  2. Empresas: Acceso de equipo vía representante de OpenAI
  3. Niveles superiores (acceso a GPT-5.4-Cyber): Autenticación reforzada + expresión de interés

Codex Security, lanzado a principios de 2026, ya ha contribuido a corregir más de 3 000 vulnerabilidades críticas y altas.

🔗 Anuncio oficial de OpenAI


Gemini Personal Intelligence : despliegue mundial

15 de abril — La funcionalidad Personal Intelligence de la aplicación Gemini se expande internacionalmente. Hasta ahora limitada a Estados Unidos, ya está accesible para los suscriptores Google AI Ultra, Pro y Plus de todo el mundo, con un despliegue hacia los usuarios gratuitos previsto próximamente.

Personal Intelligence permite a Gemini ofrecer respuestas personalizadas y contextuales conectándose a las aplicaciones de Google del usuario: Search, Gmail, Google Photos y YouTube. Google también anunció la llegada de Personal Intelligence a Google Chrome a lo largo de la semana.

🔗 Tweet @GeminiApp


Mistral Connectors MCP en Studio (Public Preview)

15 de abril — Mistral AI lanza los Connectors en Mistral Studio en acceso anticipado público (Public Preview), permitiendo conectar fuentes de datos empresariales mediante el protocolo MCP.

Un conector encapsula una integración en una entidad reutilizable basada en MCP. Una vez registrado, se gobierna y monitoriza en Studio, y se convierte en una herramienta nativa para cualquier conversación, agente o flujo de trabajo.

| Funcionalidad | Detalle | | -------------------------------- | ------------------------------------------------------------------------------- | ----------------------------------------------------------------------------------------------------------- | | MCPs integrados y personalizados | Disponibles para todas las solicitudes de modelos y agentes | | Llamada directa a herramientas | Control preciso sobre cuándo y cómo se invocan las herramientas | | Validación humana en el bucle | Flujo de aprobación configurable antes de ejecutar las herramientas | | Acceso programático | Creación, modificación, listado y eliminación de conectores vía la API | | Registro centralizado | Disponible en todas las apps de Mistral (Le Chat, AI Studio, Vibe próximamente) | Integraciones compatibles: CRM, bases de conocimiento, herramientas de productividad, GitHub, búsqueda web. |

🔗 Anuncio de Mistral — Connectors


Primer spot publicitario automovilístico totalmente producido por IA

15 de abril — Luma Agents impulsó el primer spot publicitario de Mazda totalmente producido por IA. La agencia creativa independiente Boundless (Johannesburgo) utilizó Luma para crear una campaña que reunía varias generaciones del MX-5 y décadas de storytelling de la marca. Plazo total desde el concepto hasta la aprobación final: menos de dos semanas.

Luma cita este caso como ejemplo de los flujos de trabajo creativos nativos de la IA: producción más rápida, sin comprometer la visión creativa.

🔗 Luma Labs — Boundless × Mazda


Anuncios menores

Kling AI Skill (15 de abril) — Kling lanza una encapsulación todo en uno de sus API para una integración directa en los agentes IA. Los agentes pueden acceder a la generación Text/Image-to-Video, generación de imágenes 4K y coherencia entre escenas, sin configuración compleja. Compatible con Claude Code, Cursor, Codex, Copilot. 🔗 Documentación de Kling AI Skill

Qwen en OpenCode (15 de abril) — Qwen3.6-Plus y Qwen3.5-Plus ya están disponibles en la herramienta de coding OpenCode. Qwen3.5-Plus cuesta 3x menos que Qwen3.6-Plus; ambos modelos admiten imágenes y ofrecen retención cero de datos. 🔗 Tweet @Alibaba_Qwen

Copilot Cloud Agent — activación selectiva (15 de abril) — Los admins de GitHub Enterprise ahora pueden activar Copilot Cloud Agent de forma selectiva por organización mediante las propiedades personalizadas (custom properties). Tres nuevos endpoints REST permiten gestionar esta política por API. 🔗 Changelog de GitHub


Lo que esto significa

La jornada del 15 de abril ilustra una convergencia: los grandes actores equipan sus entornos de desarrollo con una infraestructura agentica estandarizada. Claude Code Desktop, los Agents SDK de OpenAI y Mistral Connectors comparten la misma lógica: orquestar varios agentes en paralelo, dotarlos de primitivas (MCP, AGENTS.md, shell, archivos) y ofrecerles un entorno de ejecución aislado.

El anuncio más estructurante sigue siendo el rediseño de Claude Code Desktop: la barra lateral de sesiones y el side chat cambian la forma de trabajar con varios agentes simultáneamente, un uso que se está convirtiendo progresivamente en la norma para los desarrolladores que se apoyan en la IA.

En investigación, la publicación de Nature sobre el aprendizaje subliminal y el experimento de los investigadores de alineamiento automatizados (PGR 0.97 por 18 000 $) señalan que Anthropic invierte paralelamente en la comprensión de los riesgos a largo plazo: un equilibrio entre productividad inmediata y seguridad estructural.


Fuentes

Este documento ha sido traducido de la versión fr al idioma es utilizando el modelo gpt-5.4-mini. Para más información sobre el proceso de traducción, consulte https://gitlab.com/jls42/ai-powered-markdown-translator