Qwen3.7-Max, incidente de seguridad de GitHub, NVIDIA Verified Agent Skills, Runway Aleph 2.0

Una semana intensa para el ecosistema de IA: Alibaba lanza su modelo insignia Qwen3.7-Max, diseñado para la era agéntica, GitHub revela un incidente de seguridad que implica una extensión maliciosa de VS Code, NVIDIA publica un framework abierto de gobernanza para los skills de agentes, y Runway renueva su modelo de edición de vídeo con Aleph 2.0 y Edit Studio. En cuanto a las herramientas para desarrolladores, Claude Code 2.1.146 renombra /simplify a /code-review y Codex 26.519 introduce los Appshots en macOS.

Qwen3.7-Max — El flagship de Alibaba para la era agéntica

21 de mayo — Alibaba lanza Qwen3.7-Max, su nuevo modelo propietario insignia, diseñado específicamente para agentes autónomos. El modelo sucede a las previews Qwen3.7-Max-Preview y Qwen3.7-Plus-Preview evaluadas en Arena el 18 de mayo.

El posicionamiento es explícitamente “Agent Era”: Qwen3.7-Max apunta a tareas que van más allá de la comprensión puntual para entrar en el ámbito de la autonomía a largo plazo y la orquestación compleja.

Métrica	Valor
Puntuación AAII	56,6
Progresión vs. anterior	+4,8 pts
Horas de autonomía continuas (test núcleo)	35 h
Llamadas a herramientas (test núcleo)	1 000+
Vistas del tuit principal	~325 000

Cinco capacidades anunciadas:

Agente de codificación de extremo a extremo — prototipos frontend, refactorizaciones multiarchivo, depuración real
Productividad de escritorio — tareas mediante integraciones MCP y gestión multiagente
Autonomía a largo plazo — 35 horas consecutivas en una tarea de optimización del kernel, 1 000+ llamadas a herramientas sin alucinación crítica
Agnóstico a scaffolds — compatible con Claude Code, OpenClaw, Qwen Code o cualquier stack personalizada
Razonamiento científico reforzado — puntuación AAII: 56,6 (+4,8 pts)

Según Tongyi Lab (Alibaba), Qwen3.7-Max es “nuestro último modelo propietario diseñado específicamente para la era de los agentes”, con un agente de codificación frontier, un asistente de productividad de escritorio y una autonomía a largo plazo — fiable siempre, agnóstico a scaffolds.

El modelo está disponible a través de Qwen Studio (chat.qwen.ai) y la API de Alibaba Cloud.

🔗 Blog oficial de Qwen3.7-Max

GitHub — Incidente de seguridad: extensión maliciosa de VS Code

20 de mayo — GitHub revela un incidente de seguridad importante: un empleado instaló una extensión maliciosa de VS Code desde el marketplace de Microsoft, lo que permitió acceso no autorizado a repositorios internos de GitHub.

El anuncio inicial en X generó 13,4 millones de vistas, 8 000 reposts y 25 000 me gusta, señal de un impacto comunitario considerable. GitHub publicó un hilo en 5 partes detallando la cronología y las medidas adoptadas.

“1/ Yesterday we detected and contained a compromise of an employee device involving a poisoned VS Code extension. We removed the malicious extension version, isolated the endpoint, and began incident response immediately.”

🇪🇸 Ayer detectamos y contuvimos la intrusión en un dispositivo de un empleado que implicaba una extensión de VS Code envenenada. Eliminamos la versión maliciosa de la extensión, aislamos el punto final y lanzamos inmediatamente la respuesta a incidentes. — @github en X

Lo que ocurrió:

Vector: extensión maliciosa de VS Code del marketplace de Microsoft
Dispositivo de un empleado de GitHub comprometido
Acceso no autorizado a repositorios internos de GitHub

Lo que no se vio afectado (según GitHub):

No hay impacto confirmado en los datos de los clientes (empresas, organizaciones, repositorios públicos o privados)

Acciones inmediatas:

Retirada de la extensión maliciosa
Aislamiento del endpoint comprometido
Análisis de los registros (logs) y rotación de secretos
Vigilancia reforzada de la infraestructura

GitHub se comprometió a publicar un informe completo al finalizar la investigación. Este incidente reaviva el debate sobre la seguridad del marketplace de extensiones de VS Code, que cuenta con decenas de miles de extensiones cuya verificación sigue siendo limitada.

🔗 Anuncio de GitHub en X

NVIDIA Verified Agent Skills — Un estándar abierto para la gobernanza de agentes de IA

21 de mayo — NVIDIA lanza NVIDIA-Verified Agent Skills, un framework de gobernanza abierto para asegurar las capacidades (skills) de los agentes de IA. La iniciativa responde a un problema creciente: los skills aumentan las capacidades de los agentes, pero también introducen posibles vulnerabilidades.

Un skill “verificado” según NVIDIA se basa en cuatro pilares:

Componente	Descripción
Catalogación	Sincronización diaria desde los equipos de producto de NVIDIA
SkillSpector	Escáner de riesgos basado en OWASP LLM y MITRE ATLAS
Firma criptográfica	Firma separada `skill.oms.sig` verificable mediante OpenSSF Model Signing
Skill Card (SKILLCARD.yaml)	Metadatos machine-readable: procedencia, dependencias, limitaciones, estado

El framework detecta especialmente: dependencias vulnerables, inyección de prompts, trigger abuse, excessive agency y tool poisoning.

La especificación técnica es abierta a través de agentskills.io (formato SKILL.md), compatible de forma nativa con Claude Code, OpenAI Codex y Cursor. El repositorio público de skills de NVIDIA está disponible en github.com/nvidia/skills.

“Verified means cataloged, scanned, signed, and documented with a skill card.”

🇪🇸 Verificado significa catalogado, escaneado, firmado y documentado con una ficha de competencia. — NVIDIA Developer Blog, 21 de mayo de 2026

El hecho de que la especificación sea abierta y compatible con las tres principales herramientas de codificación de IA (Claude Code, Codex, Cursor) sugiere una ambición de estándar industrial, no solo de herramienta interna de NVIDIA.

🔗 Blog para desarrolladores de NVIDIA

Runway Aleph 2.0 y Edit Studio — Edición de vídeo hasta 30 segundos en 1080p

21 de mayo — Runway lanza Aleph 2.0, una importante actualización de su modelo de edición de vídeo, acompañada de Edit Studio, una nueva interfaz dirigida a equipos de marketing y cineastas.

La novedad central de Aleph 2.0 es el control image-level: el usuario proporciona un frame editado como referencia visual, y el modelo aplica la modificación de forma coherente a toda la vídeo. A diferencia de los enfoques anteriores, en los que el resultado final era desconocido antes de la generación, este método ofrece un control predecible sobre la output.

Funcionalidad	Detalle
Duración máx.	30 segundos
Resolución	1080p
Control	Frame de referencia de imagen (image-level)
Edición multi-shot	Sí — aplicación automática en varios planos
Acceso	Todos los planes de pago de Runway

Capacidades de edición de Aleph 2.0:

Ediciones localizadas precisas: solo cambia la zona modificada, el resto se preserva
Edición multi-shot: modificaciones aplicadas en vídeos con varios cortes
Clips de hasta 30 s en 1080p — longitud suficiente para anuncios y contenido corto

Casos de uso de Edit Studio: intercambio de producto, cambio de fondo, variación estacional de campaña, corrección de iluminación, eliminación de elementos parásitos, restyling completo.

“With Aleph 2.0, your edited frame defines what the change should look like, and the model carries it through to the right parts of your video.”

🇪🇸 Con Aleph 2.0, tu imagen modificada define el aspecto deseado, y el modelo lo aplica a las partes correspondientes de tu vídeo. — Runway, blog oficial 21 de mayo de 2026

🔗 Anuncio oficial de Runway

Claude Code 2.1.146 — `/code-review` y correcciones de background agents

21 de mayo — Anthropic publica la versión 2.1.146 de Claude Code con una novedad principal y varias correcciones de estabilidad importantes.

El comando /simplify pasa a llamarse /code-review, acompañado de un nivel de esfuerzo opcional (/code-review high). Este cambio reposiciona explícitamente la funcionalidad como herramienta de revisión de código en los flujos de trabajo agénticos.

Área	Corrección
Windows PowerShell	Se corrige la regresión v2.1.124 para pwsh vía winget/Microsoft Store
MCP pagination	`resources/list` y `prompts/list` ya no pierden los items más allá de la página 1
Sessions background	Strobing de Windows Terminal, worktrees NTFS, bloqueos `/background` y `claude agents`
Auto mode	`AskUserQuestion` preservado cuando el skill o el usuario depende de ello
Bedrock	Se corrige la auth cross-account con `awsCredentialExport`
VSCode Voice	Feedback de micrófono silencioso, sugerencias sox para WSLg

🔗 CHANGELOG de Claude Code

Claude Code /usage — Desglose del consumo de tokens por componente

21 de mayo — Boris Cherny (lead de Claude Code en Anthropic) anuncia en X una ampliación significativa del comando /usage: la próxima versión permitirá ver exactamente qué Skills, Agents, MCPs y Plugins consumen tokens en una sesión.

Esta funcionalidad va más allá del rediseño de la UI del día anterior. Aporta una granularidad por componente, permitiendo identificar las extensiones más intensivas en contexto. Ya está disponible en CLI y llegará próximamente a la aplicación Desktop. El anuncio generó 137 527 vistas en X, con numerosas peticiones para desactivar selectivamente conectores no utilizados.

“In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using your tokens CLI today, coming to Desktop next”

🇪🇸 En la próxima versión de Claude Code: ejecuta /usage para ver el reparto del consumo de tokens por Skills, Agents, MCPs y Plugins — disponible hoy en CLI, próximamente en Desktop. — @bcherny en X

Google I/O 2026 — El resumen oficial “100 anuncios”

20 de mayo — Google publica su artículo oficial de resumen “100 things announced at I/O 2026”, documento de referencia para el conjunto de lanzamientos del evento. Entre los anuncios confirmados: Antigravity 2.0 CLI (sucesor de Gemini CLI), Universal Cart (compras en múltiples comercios), Google Pics (gestión inteligente de fotos), Ask YouTube (consulta de vídeos de YouTube), Android XR glasses y la expansión de SynthID. Este documento consolida la magnitud del Google I/O 2026 y sirve como fuente primaria para los desarrolladores que quieran encontrar todos los detalles oficiales.

🔗 Blog de Google — 100 anuncios I/O 2026

Gemini Connected Apps — OpenTable, Canva e Instacart

21 de mayo — Google Gemini amplía sus Connected Apps a tres nuevos socios: OpenTable (reserva de restaurantes), Canva (creación de visuales) e Instacart (compra de alimentos). Gemini ya no se limita a buscar información: realiza acciones concretas en el ecosistema digital del usuario en su nombre. Este anuncio post-I/O traduce de forma tangible la visión agéntica de Gemini Spark: el agente actúa sobre servicios externos populares sin salir de la aplicación.

🔗 Anuncio de Gemini Connected Apps

GitHub Copilot — Cuatro actualizaciones para desarrolladores

Informes métricos migrados a copilot-reports.github.com

20 de mayo — Las URLs de descarga de los informes de Copilot Usage Metrics migran desde el antiguo dominio Azure Front Door (azurefd.net) al dominio estable copilot-reports.github.com. Acción requerida para las organizaciones con firewall o proxy: añadir el nuevo dominio a la allowlist enterprise cuanto antes. El antiguo dominio seguirá activo durante el periodo de transición, pero quedará obsoleto posteriormente. Para las instancias de GitHub Enterprise Cloud, el nuevo dominio sigue el formato copilot-reports.SUBDOMAIN.ghe.com. Se prevé un fallback a *.blob.core.windows.net en caso de indisponibilidad de Azure.

🔗 Changelog de GitHub Copilot

Cloud agent — Claude Haiku 4.5 y GPT-5.4-mini a 0,33x

18 de mayo — El Copilot cloud agent integra dos nuevos modelos económicos: Claude Haiku 4.5 y GPT-5.4-mini, ambos facturados a 0,33x del multiplicador estándar (frente a 1x para los modelos estándar). Esta ampliación permite elegir la herramienta adecuada según la naturaleza de la tarea: modelo ligero y rápido para correcciones simples de lint o tests unitarios, modelo más potente para refactorizaciones complejas. La elección del modelo se realiza al delegar una tarea al cloud agent, lo que permite optimizar la relación coste/calidad según la complejidad real del trabajo.

🔗 Changelog del cloud agent

Chat web — Panel lateral contextual en disponibilidad general

18 de mayo — Copilot Chat en github.com se abre ahora en panel lateral directamente al lado del recurso consultado (PR, issue, repositorio), sin tener que navegar a una página dedicada. El contexto se acumula automáticamente al navegar entre varias PRs y issues en la misma sesión: las referencias entre recursos siguen accesibles sin perder el hilo de la conversación. La experiencia inmersiva de página completa sigue disponible a través de “More → In immersive chat”. También es posible transformar la conversación en una sesión de agente para crear PRs o lanzar una búsqueda profunda. Disponible en GA para todos los planes de Copilot.

🔗 Changelog de Copilot Chat web

Genspark integra Gemini 3.5 Flash gratis

20 de mayo — Genspark integra Gemini 3.5 Flash al día siguiente de su anuncio en Google I/O, disponible gratis en AI Chat Agent y Genspark Claw. La plataforma (más de 70 modelos disponibles simultáneamente) ilustra su estrategia de integración reactiva: adoptar los modelos más recientes sin obligar al usuario a elegir manualmente. Gemini 3.5 Flash representa el modelo Flash más potente de Google hasta la fecha, optimizado para la velocidad de respuesta en tareas complejas.

🔗 Anuncio de Genspark

Kling AI en Cannes — RAPHAEL RAPHAEL, película 100% IA

21 de mayo — Kling AI presenta RAPHAEL RAPHAEL en el Festival de Cannes 2026, un proyecto de largometraje 100% generado por IA a gran escala. Este anuncio es distinto del post del 20 de mayo sobre House of David (primera serie de Hollywood en integrar Kling a escala industrial, 44 millones de espectadores, #1 en Prime Video US). Kling AI consolida así una presencia multi-proyecto en Cannes 2026, afirmando su posición como actor principal de la IA de vídeo para el cine.

🔗 Anuncio de Kling AI

BFL FLUX Erase — Supresión de objetos y borrado de texto

21 de mayo — Black Forest Labs lanza FLUX Erase, funcionalidad de borrado inteligente para las imágenes FLUX. Tres capacidades principales: supresión de objetos (eliminación limpia con reconstrucción coherente del fondo), borrado de texto (supresión preservando el diseño subyacente) y eliminación automática de las sombras asociadas a los objetos borrados. La funcionalidad está diseñada para el retoque de precisión (precision inpainting): solo se modifica la zona objetivo, sin degradar el resto de la imagen. Disponible a través de la herramienta web flux-tools.bfl.ai/erase y la API BFL (docs.bfl.ai/flux_erase), con acceso inmediato sin lista de espera.

🔗 Anuncio de BFL

ElevenReader — Más de 200 000 títulos premium con voz a elegir

21 de mayo — ElevenLabs integra 200 000+ títulos premium en ElevenReader: best-sellers en audiobooks y eBooks bajo licencia, incluidos miles disponibles con la voz del narrador a elegir entre las voces de ElevenLabs. Esta expansión posiciona ElevenReader como una plataforma de lectura audio personalizable, donde el usuario ya no está limitado al narrador original de un libro: puede elegir la voz que prefiera para cualquier título compatible. La aplicación es accesible en elevenreader.io con acceso gratuito para empezar.

🔗 Anuncio de ElevenLabs

xAI Grok × OpenCode — Grok Build en el CLI de código

21 de mayo — Los suscriptores de Grok o X Premium pueden ahora utilizar el modelo Grok Build en OpenCode, editor de código en línea de comandos (CLI coding editor) especializado en inteligencia de codebase. Esta integración sigue a la anunciada en OpenClaw dos días antes — xAI amplía progresivamente su suscripción a más herramientas de terceros. El acceso está incluido en la suscripción Grok/X Premium existente, sin coste adicional. OpenCode se distingue de OpenClaw por su enfoque específico en el código: análisis de base de código, navegación y refactorización asistida.

🔗 Anuncio de xAI

Codex 26.519 — Appshots, Goal mode GA, uso de ordenador bloqueado, compartir plugins

21 de mayo — OpenAI publica Codex 26.519 con varias nuevas funciones de macOS y empresa. Los Appshots permiten enviar la ventana de la aplicación en primer plano a un hilo de Codex mediante una doble pulsación de las dos teclas Command — se capturan la ventana visible y el texto accesible por la API de accesibilidad de macOS. El Goal mode sale del estado experimental y pasa a disponibilidad general (app, extensión IDE, CLI). Remote computer use: Codex ahora puede utilizar las aplicaciones de escritorio después de bloquear el Mac. El compartir plugins está disponible para ChatGPT Business.

Funcionalidad	Estado	Plataformas
Appshots	Nuevo (GA)	Solo macOS
Goal mode	GA (antes experimental)	App, IDE extension, CLI
Remote computer use (Mac bloqueado)	Nuevo	macOS + Codex Mobile
Plugin sharing	Nuevo (Business)	ChatGPT Business

🔗 Changelog de Codex

Breves

Gemini Daily Brief — disponibilidad general — El resumen diario ya está accesible para todos los suscriptores de Google AI Plus, Pro y Ultra (18+), inicialmente en Estados Unidos. 🔗 fuente
Grok × Imagine — assets de videojuegos (8,1M vistas) — Demostración viral de prototipado de assets de videojuegos directamente con Grok y @imagine, con fuerte participación de la comunidad gaming. 🔗 fuente
Cohere Command A+ — pesos W4A4 disponibles en HuggingFace — Los pesos cuantizados W4A4 de Command A+ están disponibles para descarga, lo que permite el despliegue en 2× H100 con +47% de velocidad frente a BF16. 🔗 fuente

Lo que eso significa

La era agéntica se afianza en varios frentes simultáneamente. El lanzamiento de Qwen3.7-Max con 35 horas de autonomía continua y más de 1.000 llamadas a herramientas, combinado con NVIDIA Verified Agent Skills que estandarizan la gobernanza de las capacidades de los agentes, señala que la industria pasa de una fase de experimentación a una fase de estructuración. El hecho de que NVIDIA base su estándar en la spec abierta agentskills.io — compatible con Claude Code, Codex y Cursor — sugiere una convergencia hacia interfaces comunes para los agentes de IA, independientemente del modelo subyacente.

La seguridad de la cadena de herramientas de IA se convierte en un problema crítico. El incidente de GitHub, en el que una extensión maliciosa de VS Code del marketplace oficial de Microsoft comprometió un dispositivo interno, ilustra una nueva superficie de ataque que la industria aún no ha abordado plenamente. El momento es revelador: NVIDIA lanza sus Verified Agent Skills el mismo día que GitHub anuncia su incidente. Las skills y extensiones no verificadas representan un vector de ataque creciente a medida que los agentes de IA toman el control de sistemas críticos.

Las herramientas para desarrolladores se consolidan en torno a la transparencia del consumo. El anuncio de Claude Code /usage con desglose por componente, combinado con los Appshots de Codex y el Goal mode GA, revela una tendencia: las herramientas para desarrolladores de IA de nueva generación deben ahora explicar qué consumen y cómo. La granularidad por Skills/Agents/MCPs/Plugins responde a una demanda concreta de los equipos que despliegan agentes en producción y quieren comprender los costes reales.

La IA generativa de vídeo entra en la industria cinematográfica. Runway Aleph 2.0 con su control predecible a nivel de imagen, Kling AI en Cannes con un largometraje 100% IA (RAPHAEL RAPHAEL) y la confirmación de que House of David (44M viewers, #1 Prime Video US) utiliza Kling a escala industrial marcan un punto de inflexión. Los estudios ya no prueban la tecnología: la integran en sus pipelines de producción estándar.

Qwen3.7-Max, incidente de seguridad de GitHub, NVIDIA Verified Agent Skills, Runway Aleph 2.0

Qwen3.7-Max — El flagship de Alibaba para la era agéntica

GitHub — Incidente de seguridad: extensión maliciosa de VS Code

NVIDIA Verified Agent Skills — Un estándar abierto para la gobernanza de agentes de IA

Runway Aleph 2.0 y Edit Studio — Edición de vídeo hasta 30 segundos en 1080p

Claude Code 2.1.146 — `/code-review` y correcciones de background agents

Claude Code /usage — Desglose del consumo de tokens por componente

Google I/O 2026 — El resumen oficial “100 anuncios”

Gemini Connected Apps — OpenTable, Canva e Instacart

GitHub Copilot — Cuatro actualizaciones para desarrolladores

Informes métricos migrados a copilot-reports.github.com

Cloud agent — Claude Haiku 4.5 y GPT-5.4-mini a 0,33x

Chat web — Panel lateral contextual en disponibilidad general

Genspark integra Gemini 3.5 Flash gratis

Kling AI en Cannes — RAPHAEL RAPHAEL, película 100% IA

BFL FLUX Erase — Supresión de objetos y borrado de texto

ElevenReader — Más de 200 000 títulos premium con voz a elegir

xAI Grok × OpenCode — Grok Build en el CLI de código

Codex 26.519 — Appshots, Goal mode GA, uso de ordenador bloqueado, compartir plugins

Breves

Lo que eso significa

Fuentes

Tabla de contenidos

Qwen3.7-Max, incidente de seguridad de GitHub, NVIDIA Verified Agent Skills, Runway Aleph 2.0

Qwen3.7-Max — El flagship de Alibaba para la era agéntica

GitHub — Incidente de seguridad: extensión maliciosa de VS Code

NVIDIA Verified Agent Skills — Un estándar abierto para la gobernanza de agentes de IA

Runway Aleph 2.0 y Edit Studio — Edición de vídeo hasta 30 segundos en 1080p

Claude Code 2.1.146 — /code-review y correcciones de background agents

Claude Code /usage — Desglose del consumo de tokens por componente

Google I/O 2026 — El resumen oficial “100 anuncios”

Gemini Connected Apps — OpenTable, Canva e Instacart

GitHub Copilot — Cuatro actualizaciones para desarrolladores

Informes métricos migrados a copilot-reports.github.com

Cloud agent — Claude Haiku 4.5 y GPT-5.4-mini a 0,33x

Chat web — Panel lateral contextual en disponibilidad general

Genspark integra Gemini 3.5 Flash gratis

Kling AI en Cannes — RAPHAEL RAPHAEL, película 100% IA

BFL FLUX Erase — Supresión de objetos y borrado de texto

ElevenReader — Más de 200 000 títulos premium con voz a elegir

xAI Grok × OpenCode — Grok Build en el CLI de código

Codex 26.519 — Appshots, Goal mode GA, uso de ordenador bloqueado, compartir plugins

Breves

Lo que eso significa

Fuentes

Claude Code 2.1.146 — `/code-review` y correcciones de background agents