Buscar

Project Glasswing y Claude Mythos Preview, Meta Muse Spark, Gemini CLI v0.37.0

Project Glasswing y Claude Mythos Preview, Meta Muse Spark, Gemini CLI v0.37.0

La semana del 5 al 9 de abril de 2026 estuvo dominada por dos anuncios importantes: Anthropic presentó Project Glasswing, una coalición de once grandes empresas tecnológicas en torno a Claude Mythos Preview para detectar vulnerabilidades zero-day a gran escala, mientras Meta regresaba con Muse Spark, su primer modelo no open-weights en un año. En paralelo, Google, OpenAI, GitHub y Perplexity publicaron cada uno actualizaciones destacadas para sus desarrolladores y usuarios.


Project Glasswing y Claude Mythos Preview

7 de abril de 2026 — Anthropic anunció Project Glasswing, una iniciativa de seguridad de software que reúne a once organizaciones: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, The Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks. La iniciativa se apoya en las capacidades de un nuevo modelo frontier en acceso restringido: Claude Mythos Preview.

Lo que hace Mythos Preview

El modelo demostró la capacidad de identificar miles de vulnerabilidades zero-day en los principales sistemas operativos y navegadores web, incluidas algunas que llevaban décadas sin detectarse. Tres ejemplos concretos ilustran el alcance de los hallazgos:

  • Una falla de 27 años en OpenBSD que permite bloquear a distancia cualquier máquina conectada
  • Una vulnerabilidad de 16 años en FFmpeg, oculta en una línea de código probada más de cinco millones de veces sin ser detectada
  • Varias fallas en el núcleo Linux que permiten una escalada de privilegios hasta el control total de la máquina

Estos ejemplos muestran que Mythos Preview no hace detección superficial: encuentra errores de lógica enterrados en bases de código críticas, auditadas de forma continua por miles de investigadores desde hace años.

Benchmarks

El rendimiento de Mythos Preview en los benchmarks de referencia marca un avance claro respecto a Opus 4.6:

BenchmarkMythos PreviewOpus 4.6
SWE-bench Verified93,9 %80,8 %
SWE-bench Pro77,8 %53,4 %
Terminal-Bench 2.082,0 %65,4 %
SWE-bench Multilingüe87,3 %77,8 %
CyberGym (ciberseguridad)83,1 %66,6 %
GPQA Diamond94,6 %91,3 %
Humanity’s Last Exam (sin herramientas)56,8 %40,0 %

El salto en SWE-bench Verified — de 80,8 % a 93,9 % — es especialmente significativo: se trata del benchmark más utilizado para medir la capacidad de un modelo para resolver bugs reales en repositorios open source reales. En CyberGym, dedicado a la ciberseguridad, la ganancia de más de 16 puntos sitúa a Mythos Preview en una categoría aparte para tareas de seguridad ofensiva y defensiva.

Compromiso financiero y gobernanza

Anthropic se compromete con 100 millones de dólares en créditos de uso para los socios del proyecto, acompañados de 4 millones de dólares en donaciones directas a organizaciones de seguridad open source:

  • 2,5 M$ a Alpha-Omega y a la OpenSSF a través de la Linux Foundation
  • 1,5 M$ a la Apache Software Foundation

Este nivel de compromiso financiero indica que Anthropic posiciona Glasswing como una iniciativa a largo plazo, no como una simple asociación de comunicación. El informe sobre las vulnerabilidades corregidas se publicará en los 90 días.

Disponibilidad y precios

Mythos Preview no se ha puesto a disposición pública de inmediato. Una vez termine la fase inicial de créditos, el modelo estará disponible para los participantes al precio de 25 /125/125 por millón de tokens (entrada/salida), a través de la API de Claude, Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry.

Un informe técnico detallado sobre las vulnerabilidades y exploits descubiertos está disponible en el blog Red Team de Anthropic, y la system card completa está publicada en anthropic.com.

“This project represents a watershed moment for AI-assisted cybersecurity — not because of what Claude can do today, but because of what it will be able to do as capabilities continue to scale.”

🇪🇸 Este proyecto representa un momento decisivo para la ciberseguridad asistida por IA — no por lo que Claude puede hacer hoy, sino por lo que será capaz de hacer a medida que las capacidades sigan escalando. — Anuncio oficial de Anthropic

🔗 Project Glasswing · System Card Mythos Preview · Informe Red Team


Meta Muse Spark: regreso de Meta con un modelo cerrado

8 de abril de 2026 — Meta anunció Muse Spark, el primer modelo de la nueva familia “Muse”, desarrollado por Meta Superintelligence Labs (MSL) — una nueva entidad interna dedicada a la investigación en IA avanzada. Es el primer modelo de Meta desde Llama 4 en abril de 2025, es decir, un año de silencio, y sobre todo el primer modelo de Meta no disponible en open-weights.

Capacidades y posicionamiento

Muse Spark se posiciona como un paso hacia la “superinteligencia personal” (personal superintelligence). El modelo cubre varios ámbitos con capacidades avanzadas:

ÁmbitoDescripción
MultimodalPercepción y comprensión visual avanzada, integración de información visual cruzada
RazonamientoRazonamiento paso a paso, pensar antes de responder (test-time reasoning)
SaludAnálisis de imágenes médicas, recomendaciones alimentarias personalizadas
AgentivoCapacidades agentivas para tareas complejas
Contemplating modeOrquestación de varios agentes razonando en paralelo (despliegue progresivo)

El modelo integra la “compresión del pensamiento” (thought compression) para optimizar los tokens de razonamiento, y admite el test-time scaling mediante varios agentes en paralelo. El modo Contemplating, todavía en despliegue progresivo, es una de las funciones más esperadas: permite asignar varios agentes al mismo problema en paralelo, cada uno razonando de forma independiente antes de la síntesis.

Rendimiento

Según Artificial Analysis (8 de abril de 2026), Muse Spark alcanza una puntuación de 52 en el Artificial Analysis Intelligence Index, lo que lo sitúa en el top 4 mundial detrás de Gemini 3.1 Pro, GPT-5.4 y Claude Opus 4.6. Un regreso muy comentado para Meta, que vuelve directamente a la liga de los mejores modelos frontier.

Arquitectura

Meta describe tres ejes de scaling para Muse Spark:

  1. Preentrenamiento: rediseño completo del stack durante nueve meses, con mejoras de arquitectura y de datos
  2. Aprendizaje por refuerzo (Reinforcement Learning): ampliación escalable de las capacidades post-preentrenamiento
  3. Test-time reasoning: razonamiento ampliado sin aumentar la latencia gracias a la paralelización de agentes

Seguridad y disponibilidad

Meta indica haber realizado evaluaciones exhaustivas a través de su Advanced AI Scaling Framework v2. Apollo Research llevó a cabo evaluaciones de terceros sobre un checkpoint previo al lanzamiento y constató comportamientos de rechazo sólidos en ámbitos de alto riesgo (biología, etc.).

Muse Spark está disponible desde el 8 de abril en meta.ai y en la app Meta AI. El acceso API está en preview privada para socios seleccionados — no hay acceso público inmediato.

🔗 Blog de Meta AI — Muse Spark · Tweet de anuncio · Benchmark Artificial Analysis


Anthropic: infraestructura y agentes

Asociación Google + Broadcom — varios gigavatios de TPU desde 2027

6 de abril de 2026 — Anthropic anunció un acuerdo con Google y Broadcom que contempla varios gigavatios de capacidad de cálculo TPU de nueva generación, que entrará en servicio a partir de 2027. Se trata del mayor compromiso de infraestructura en la historia de Anthropic.

El contexto de crecimiento es significativo:

  • Los ingresos anualizados (run-rate revenue) superan ahora los 30 mil millones de dólares, frente a unos 9 mil millones a finales de 2025
  • Más de 1.000 clientes empresariales gastan cada uno más de un millón de dólares al año, frente a más de 500 en febrero de 2026 — es decir, un doble en menos de dos meses

“This groundbreaking partnership with Google and Broadcom is a continuation of our disciplined approach to scaling infrastructure: we are building the capacity necessary to serve the exponential growth we have seen in our customer base while also enabling Claude to define the frontier of AI development.”

🇪🇸 Esta asociación histórica con Google y Broadcom es una continuación de nuestro enfoque disciplinado para escalar la infraestructura: estamos construyendo la capacidad necesaria para atender el crecimiento exponencial que hemos visto en nuestra base de clientes, al tiempo que permitimos que Claude defina la frontera del desarrollo de la IA. — Krishna Rao, CFO de Anthropic

La mayor parte del nuevo cálculo se instalará en Estados Unidos, en continuidad con el compromiso de noviembre de 2025 de invertir 50 mil millones de dólares en la infraestructura estadounidense. Claude sigue siendo el único modelo frontier disponible en las tres grandes plataformas cloud: AWS Bedrock, Google Cloud Vertex AI y Microsoft Azure Foundry.

🔗 Anuncio de asociación

Managed Agents — arquitectura desacoplada, latencia reducida en un 90 %

8 de abril de 2026 — El Engineering Blog de Anthropic publicó un artículo técnico detallando la arquitectura de Managed Agents, el servicio alojado para ejecutar agentes long-running en la plataforma Claude.

La idea central es desacoplar el cerebro (Claude y su harness) de las manos (sandbox de ejecución, herramientas) y de la sesión (registro de eventos). Cada componente pasa a ser una interfaz independiente, reemplazable y escalable por separado.

Resultados medidos del desacoplamiento:

MétricaMejora
p50 TTFT (tiempo hasta el primer token)-60 %
p95 TTFT-90 %

El desacoplamiento también resuelve dos problemas de seguridad: el aislamiento de credentials (los tokens OAuth nunca son accesibles desde el sandbox de ejecución del código) y la resiliencia (si el harness cae, uno nuevo se reinicia desde el último evento de sesión sin pérdida de contexto).

🔗 Escalando Managed Agents


Google Gemini

Gemini CLI v0.37.0 — Sandbox dinámica, Chapters y Browser persistente

8 de abril de 2026 — La versión v0.37.0 de Gemini CLI introduce tres evoluciones para los workflows de desarrollo:

FuncionalidadDescripción
Dynamic Sandbox ExpansionExtensión dinámica del sandbox + soporte worktree para Linux y Windows
Chapters (Narrative Flow)Agrupación temática de las herramientas en “capítulos” para una mejor estructura de sesión
Advanced Browser CapabilitiesSesiones de navegador persistentes y descubrimiento dinámico de herramientas en el browser agent

La funcionalidad Chapters aporta continuidad narrativa a las sesiones largas: cada grupo de acciones forma un “capítulo” con su propia lógica, lo que facilita el seguimiento y la reanudación de una sesión compleja. El browser agent gana en persistencia: las sesiones siguen activas entre llamadas, y las herramientas disponibles se descubren dinámicamente.

🔗 Registro de cambios de Gemini CLI

Simulaciones interactivas y modelos 3D en Gemini App

9 de abril de 2026 — Gemini App ahora puede transformar conceptos complejos en visualizaciones interactivas directamente en el chat. Un usuario puede ajustar parámetros físicos en tiempo real (velocidad, gravedad, masa) y ver el efecto sobre una simulación funcional — órbita lunar, rotación de moléculas, sistemas dinámicos. Disponible en todo el mundo con el modelo Pro en la barra de prompt. No disponible por el momento para las cuentas Education y Workspace.

🔗 Simulaciones 3D en Gemini App

Notebooks Gemini — sincronización con NotebookLM

8 de abril de 2026 — Google lanza los Notebooks en Gemini App: espacios de trabajo persistentes que sincronizan Gemini App y NotebookLM para proyectos complejos. Los notebooks permiten organizar conversaciones, instrucciones personalizadas y archivos (documentos, PDF). Una fuente añadida en Gemini App aparece automáticamente en NotebookLM, y viceversa. Disponible esta semana para los suscriptores Google AI Ultra, Pro y Plus en la web. Próximamente en móvil y con acceso gratuito.

🔗 Notebooks Gemini + NotebookLM


OpenAI

Nuevo nivel Pro a 100 $/mes — 5x más Codex

9 de abril de 2026 — OpenAI introduce un nuevo nivel Pro a **100 /mes,situadoentreelnivelPlus( 20/mes**, situado entre el nivel Plus (~20 /mes) y el Pro existente de 200 $/mes. Ofrece cinco veces más uso de Codex que el nivel Plus, pensado para sesiones largas e intensivas.

NivelPrecioUso de Codex
Plus~20 $/mesEstándar
Pro (nuevo)100 $/mes5× Plus
Pro (existente)200 $/mesMáximo

En paralelo, OpenAI prolonga la promoción de 2x uso de Codex para los suscriptores existentes de 200 $/mes hasta el 31 de mayo de 2026 y reinicia sus límites de velocidad.

”Next phase of enterprise AI” — nota de Denise Dresser

8 de abril de 2026 — La directora de ingresos (Chief Revenue Officer) Denise Dresser publica un resumen tras sus primeros 90 días. Puntos clave: la actividad enterprise representa ahora más del 40 % de los ingresos (en trayectoria hacia la paridad con el gran público a finales de 2026), Codex supera los 3 millones de usuarios semanales (+5x desde principios de 2026), y ChatGPT cuenta con 900 millones de usuarios semanales. OpenAI presenta dos ejes estratégicos: OpenAI Frontier (agentes que atraviesan los sistemas empresariales) y una superapp de IA unificada para los equipos.

🔗 Siguiente fase de la IA empresarial

Safety Fellowship y Child Safety Blueprint

6-8 de abril de 2026 — OpenAI anuncia dos iniciativas de seguridad. El OpenAI Safety Fellowship (6 abr.) es un programa de investigación externa abierto hasta el 3 de mayo de 2026, remunerado con recursos de cálculo, para trabajos sobre evaluación, robustez y supervisión agentiva — calendario: del 14 de septiembre de 2026 al 5 de febrero de 2027. El Child Safety Blueprint (8 abr.) propone un marco de lucha contra la explotación infantil por parte de la IA, coelaborado con el NCMEC, Thorn y la Attorney General Alliance, articulado en torno a tres ejes: modernizar las leyes sobre contenidos CSAM generados por IA, mejorar la denuncia e integrar la seguridad desde el diseño (safety-by-design).

🔗 Safety Fellowship · Child Safety Blueprint


GitHub Copilot

Escaneo de seguridad OWASP Top 10 desde el terminal 9 de abril de 2026 — GitHub Copilot CLI integra un flujo de trabajo de seguridad automatizado directamente desde el terminal. En unos pocos comandos, los desarrolladores pueden lanzar un análisis completo sobre su repositorio, asignar los resultados a las categorías OWASP Top 10, y abrir automáticamente issues de GitHub para cada vulnerabilidad detectada, sin salir del entorno CLI. Un complemento directo a Project Glasswing para los equipos que ya utilizan las herramientas de GitHub.

Agente “Rubber Duck” — revisión automática

8 de abril de 2026 — El equipo de GitHub Research publica un agente “Rubber Duck” para Copilot CLI. Inspirado en la técnica clásica de depuración (explicar el código en voz alta para encontrar problemas), el agente analiza automáticamente el código enviado y genera una revisión estructurada directamente en el terminal. Experimental, pero repostado oficialmente por @github.

🔗 Tweet Copilot CLI OWASP · Tweet agente Rubber Duck


Perplexity

Integración con Plaid — finanzas personales en Perplexity Computer

9 de abril de 2026 — Perplexity lanza una integración con Plaid, permitiendo a los usuarios vincular sus cuentas bancarias, tarjetas de crédito y préstamos directamente en Perplexity Computer. El acceso es de solo lectura — los datos no pasan por los servidores de Perplexity. La red Plaid cubre más de 12 000 instituciones (Chase, Fidelity, Vanguard, Robinhood, etc.). Casos de uso: cálculo del patrimonio neto, seguimiento presupuestario, planificador de reembolso de deudas, proyección de jubilación. Disponible en ordenador en Estados Unidos y Canadá.

TierFuncionalidades
StandardVincular la cartera, acceso básico a Portfolio
Pro / MaxAnálisis avanzados, paneles interactivos

Billion Dollar Build — competición de startups

8 de abril de 2026 — Perplexity lanza “Billion Dollar Build”, una competición de 8 semanas en la que equipos utilizan Perplexity Computer para construir una empresa con una trayectoria hacia 1 000 millones de dólares de valoración. Recompensas para los finalistas: hasta 1 millón de dólares de inversión del Perplexity Fund + hasta 1 millón de dólares en créditos Computer.

🔗 Blog de integración con Plaid · Tweet Billion Dollar Build


Agentes y herramientas

Manus se integra en Slack — tres modos

6 de abril de 2026 — Manus (ahora afiliado a Meta) lanza un conjunto completo de integraciones de Slack articuladas en torno a tres modos: un agente en DM con memoria persistente para tareas personales, una mención @manus en los canales de equipo para tareas colectivas (sin memoria persistente — cada hilo es una nueva tarea), y un conector MCP para automatizar informes y resúmenes en tu nombre desde manus.im. Disponible en plan de pago de Slack.

🔗 Blog Manus para Slack

Genspark AI Workspace 4.0 — Claw Desktop, plugins de Office

8 de abril de 2026 — Genspark lanza la versión 4.0 de su espacio de trabajo IA con cuatro componentes: Claw for Desktop (Computer Use y Browser Use para controlar el ordenador), plugins Microsoft Office para PowerPoint, Excel y Word, Speakly (traducción en tiempo real y toma de notas en reuniones), y Advanced Workflows sobre un nuevo motor OpenCode.

🔗 Blog de Genspark


Medios generativos y hardware

Stability AI Brand Studio — plataforma creativa para marcas

8 de abril de 2026 — Stability AI lanza Brand Studio, una plataforma completa de producción creativa pensada para los equipos de marketing de las empresas. El núcleo del sistema se basa en Brand Central Hub: modelos Brand ID entrenados con los elementos visuales de una marca (estilo fotográfico, paleta, patrones, ubicación del logo). Producer Mode convierte una descripción en un plan de producción estructurado y lo ejecuta automáticamente paso a paso. Curated Model Routing selecciona de forma inteligente el modelo más adecuado entre las ofertas de Stability AI y de terceros (incluidos Seedream y Nano Banana). Para empresa: SSO, controles de acceso por rol, flujos de aprobación. Socio de lanzamiento: la agencia creativa Huge. Disponibilidad: plan Core (prueba gratuita) + plan Enterprise.

🔗 Brand Studio de Stability AI

NVIDIA — Semana Nacional de la Robótica

9 de abril de 2026 — Con motivo de la Semana Nacional de la Robótica, NVIDIA publica un artículo de recursos sobre sus tecnologías Physical AI: NVIDIA Cosmos (modelos fundacionales de mundo), Isaac Sim (simulación), gama Jetson (edge AI), Nemotron y NemoClaw (open source). No hay nuevo anuncio de hardware — una síntesis pedagógica del ecosistema robótico de NVIDIA para desarrolladores.

🔗 Semana de la Robótica de NVIDIA


Claude Code — actualizaciones v2.1.94 / v2.1.96 / v2.1.97

Se publicaron tres nuevas versiones durante la semana.

VersiónFechaPuntos clave
v2.1.945-6 abr.Soporte Bedrock powered by Mantle, esfuerzo por defecto high para API-key/Bedrock/Enterprise, visualización compacta de enlaces Slack MCP
v2.1.967 abr.Corrección de regresión Bedrock: error 403 "Authorization header is missing" con AWS_BEARER_TOKEN_BEDROCK
v2.1.978-9 abr.Alternar vista focus Ctrl+O en modo NO_FLICKER, parámetro refreshInterval de la línea de estado, indicador ● N running en /agents, resaltado de sintaxis Cedar

La v2.1.94 también introduce un cambio de comportamiento notable: los plugins skills declarados mediante "skills": ["./"] usan ahora el campo name del frontmatter en lugar del nombre del directorio. La v2.1.97 corrige varios problemas de permisos Bash (prefijos de variables de entorno, redirecciones de red) y un bug en el que reglas de permisos cuyo nombre coincidía con una propiedad prototype de JavaScript (toString, etc.) eran ignoradas silenciosamente en settings.json.

🔗 CHANGELOG de Claude Code


Lo que esto significa

La semana del 5 al 9 de abril de 2026 marca una aceleración en dos direcciones que se cruzan. Por un lado, Anthropic sale de una lógica de producto de consumo para entrar en una lógica de infraestructura crítica: Project Glasswing y la asociación Google/Broadcom señalan que Anthropic se posiciona como proveedor de capacidades de IA a nivel del ecosistema tecnológico mundial, y no solo como competidor en la carrera de benchmarks. El compromiso de 100 millones de dólares en créditos y 30 000 millones de dólares de ingresos anualizados consolida esta lectura.

Por otro lado, Meta vuelve con Muse Spark rompiendo con su política de open-weights. Es un cambio estratégico significativo: Meta elige competir en el segmento frontier cerrado en lugar de mantener su posicionamiento open source. La creación de Meta Superintelligence Labs y el primer modelo no Llama señalan una profunda reorientación de la estrategia de IA del grupo.

Para los desarrolladores, la semana es densa pero coherente: Gemini CLI gana en persistencia y estructura, GitHub Copilot amplía su ámbito de seguridad, Perplexity avanza hacia los datos personales y Claude Code continúa su ciclo de actualizaciones rápidas.


Fuentes

Este documento ha sido traducido de la versión fr al idioma es utilizando el modelo gpt-5.4-mini. Para obtener más información sobre el proceso de traducción, consulte https://gitlab.com/jls42/ai-powered-markdown-translator