ai-powered-markdown-translatorArtículo traducido del fr al es con gpt-5.4-mini.
Una semana intensa para el ecosistema de IA: Alibaba lanza su modelo insignia Qwen3.7-Max, diseñado para la era agéntica, GitHub revela un incidente de seguridad que implica una extensión maliciosa de VS Code, NVIDIA publica un framework abierto de gobernanza para los skills de agentes, y Runway renueva su modelo de edición de vídeo con Aleph 2.0 y Edit Studio. En cuanto a las herramientas para desarrolladores, Claude Code 2.1.146 renombra /simplify a /code-review y Codex 26.519 introduce los Appshots en macOS.
Qwen3.7-Max — El flagship de Alibaba para la era agéntica
21 de mayo — Alibaba lanza Qwen3.7-Max, su nuevo modelo propietario insignia, diseñado específicamente para agentes autónomos. El modelo sucede a las previews Qwen3.7-Max-Preview y Qwen3.7-Plus-Preview evaluadas en Arena el 18 de mayo.
El posicionamiento es explícitamente “Agent Era”: Qwen3.7-Max apunta a tareas que van más allá de la comprensión puntual para entrar en el ámbito de la autonomía a largo plazo y la orquestación compleja.
| Métrica | Valor |
|---|---|
| Puntuación AAII | 56,6 |
| Progresión vs. anterior | +4,8 pts |
| Horas de autonomía continuas (test núcleo) | 35 h |
| Llamadas a herramientas (test núcleo) | 1 000+ |
| Vistas del tuit principal | ~325 000 |
Cinco capacidades anunciadas:
- Agente de codificación de extremo a extremo — prototipos frontend, refactorizaciones multiarchivo, depuración real
- Productividad de escritorio — tareas mediante integraciones MCP y gestión multiagente
- Autonomía a largo plazo — 35 horas consecutivas en una tarea de optimización del kernel, 1 000+ llamadas a herramientas sin alucinación crítica
- Agnóstico a scaffolds — compatible con Claude Code, OpenClaw, Qwen Code o cualquier stack personalizada
- Razonamiento científico reforzado — puntuación AAII: 56,6 (+4,8 pts)
Según Tongyi Lab (Alibaba), Qwen3.7-Max es “nuestro último modelo propietario diseñado específicamente para la era de los agentes”, con un agente de codificación frontier, un asistente de productividad de escritorio y una autonomía a largo plazo — fiable siempre, agnóstico a scaffolds.
El modelo está disponible a través de Qwen Studio (chat.qwen.ai) y la API de Alibaba Cloud.
GitHub — Incidente de seguridad: extensión maliciosa de VS Code
20 de mayo — GitHub revela un incidente de seguridad importante: un empleado instaló una extensión maliciosa de VS Code desde el marketplace de Microsoft, lo que permitió acceso no autorizado a repositorios internos de GitHub.
El anuncio inicial en X generó 13,4 millones de vistas, 8 000 reposts y 25 000 me gusta, señal de un impacto comunitario considerable. GitHub publicó un hilo en 5 partes detallando la cronología y las medidas adoptadas.
“1/ Yesterday we detected and contained a compromise of an employee device involving a poisoned VS Code extension. We removed the malicious extension version, isolated the endpoint, and began incident response immediately.”
🇪🇸 Ayer detectamos y contuvimos la intrusión en un dispositivo de un empleado que implicaba una extensión de VS Code envenenada. Eliminamos la versión maliciosa de la extensión, aislamos el punto final y lanzamos inmediatamente la respuesta a incidentes. — @github en X
Lo que ocurrió:
- Vector: extensión maliciosa de VS Code del marketplace de Microsoft
- Dispositivo de un empleado de GitHub comprometido
- Acceso no autorizado a repositorios internos de GitHub
Lo que no se vio afectado (según GitHub):
- No hay impacto confirmado en los datos de los clientes (empresas, organizaciones, repositorios públicos o privados)
Acciones inmediatas:
- Retirada de la extensión maliciosa
- Aislamiento del endpoint comprometido
- Análisis de los registros (logs) y rotación de secretos
- Vigilancia reforzada de la infraestructura
GitHub se comprometió a publicar un informe completo al finalizar la investigación. Este incidente reaviva el debate sobre la seguridad del marketplace de extensiones de VS Code, que cuenta con decenas de miles de extensiones cuya verificación sigue siendo limitada.
NVIDIA Verified Agent Skills — Un estándar abierto para la gobernanza de agentes de IA
21 de mayo — NVIDIA lanza NVIDIA-Verified Agent Skills, un framework de gobernanza abierto para asegurar las capacidades (skills) de los agentes de IA. La iniciativa responde a un problema creciente: los skills aumentan las capacidades de los agentes, pero también introducen posibles vulnerabilidades.
Un skill “verificado” según NVIDIA se basa en cuatro pilares:
| Componente | Descripción |
|---|---|
| Catalogación | Sincronización diaria desde los equipos de producto de NVIDIA |
| SkillSpector | Escáner de riesgos basado en OWASP LLM y MITRE ATLAS |
| Firma criptográfica | Firma separada skill.oms.sig verificable mediante OpenSSF Model Signing |
| Skill Card (SKILLCARD.yaml) | Metadatos machine-readable: procedencia, dependencias, limitaciones, estado |
El framework detecta especialmente: dependencias vulnerables, inyección de prompts, trigger abuse, excessive agency y tool poisoning.
La especificación técnica es abierta a través de agentskills.io (formato SKILL.md), compatible de forma nativa con Claude Code, OpenAI Codex y Cursor. El repositorio público de skills de NVIDIA está disponible en github.com/nvidia/skills.
“Verified means cataloged, scanned, signed, and documented with a skill card.”
🇪🇸 Verificado significa catalogado, escaneado, firmado y documentado con una ficha de competencia. — NVIDIA Developer Blog, 21 de mayo de 2026
El hecho de que la especificación sea abierta y compatible con las tres principales herramientas de codificación de IA (Claude Code, Codex, Cursor) sugiere una ambición de estándar industrial, no solo de herramienta interna de NVIDIA.
🔗 Blog para desarrolladores de NVIDIA
Runway Aleph 2.0 y Edit Studio — Edición de vídeo hasta 30 segundos en 1080p
21 de mayo — Runway lanza Aleph 2.0, una importante actualización de su modelo de edición de vídeo, acompañada de Edit Studio, una nueva interfaz dirigida a equipos de marketing y cineastas.
La novedad central de Aleph 2.0 es el control image-level: el usuario proporciona un frame editado como referencia visual, y el modelo aplica la modificación de forma coherente a toda la vídeo. A diferencia de los enfoques anteriores, en los que el resultado final era desconocido antes de la generación, este método ofrece un control predecible sobre la output.
| Funcionalidad | Detalle |
|---|---|
| Duración máx. | 30 segundos |
| Resolución | 1080p |
| Control | Frame de referencia de imagen (image-level) |
| Edición multi-shot | Sí — aplicación automática en varios planos |
| Acceso | Todos los planes de pago de Runway |
Capacidades de edición de Aleph 2.0:
- Ediciones localizadas precisas: solo cambia la zona modificada, el resto se preserva
- Edición multi-shot: modificaciones aplicadas en vídeos con varios cortes
- Clips de hasta 30 s en 1080p — longitud suficiente para anuncios y contenido corto
Casos de uso de Edit Studio: intercambio de producto, cambio de fondo, variación estacional de campaña, corrección de iluminación, eliminación de elementos parásitos, restyling completo.
“With Aleph 2.0, your edited frame defines what the change should look like, and the model carries it through to the right parts of your video.”
🇪🇸 Con Aleph 2.0, tu imagen modificada define el aspecto deseado, y el modelo lo aplica a las partes correspondientes de tu vídeo. — Runway, blog oficial 21 de mayo de 2026
Claude Code 2.1.146 — /code-review y correcciones de background agents
21 de mayo — Anthropic publica la versión 2.1.146 de Claude Code con una novedad principal y varias correcciones de estabilidad importantes.
El comando /simplify pasa a llamarse /code-review, acompañado de un nivel de esfuerzo opcional (/code-review high). Este cambio reposiciona explícitamente la funcionalidad como herramienta de revisión de código en los flujos de trabajo agénticos.
| Área | Corrección |
|---|---|
| Windows PowerShell | Se corrige la regresión v2.1.124 para pwsh vía winget/Microsoft Store |
| MCP pagination | resources/list y prompts/list ya no pierden los items más allá de la página 1 |
| Sessions background | Strobing de Windows Terminal, worktrees NTFS, bloqueos /background y claude agents |
| Auto mode | AskUserQuestion preservado cuando el skill o el usuario depende de ello |
| Bedrock | Se corrige la auth cross-account con awsCredentialExport |
| VSCode Voice | Feedback de micrófono silencioso, sugerencias sox para WSLg |
Claude Code /usage — Desglose del consumo de tokens por componente
21 de mayo — Boris Cherny (lead de Claude Code en Anthropic) anuncia en X una ampliación significativa del comando /usage: la próxima versión permitirá ver exactamente qué Skills, Agents, MCPs y Plugins consumen tokens en una sesión.
Esta funcionalidad va más allá del rediseño de la UI del día anterior. Aporta una granularidad por componente, permitiendo identificar las extensiones más intensivas en contexto. Ya está disponible en CLI y llegará próximamente a la aplicación Desktop. El anuncio generó 137 527 vistas en X, con numerosas peticiones para desactivar selectivamente conectores no utilizados.
“In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using your tokens CLI today, coming to Desktop next”
🇪🇸 En la próxima versión de Claude Code: ejecuta
/usagepara ver el reparto del consumo de tokens por Skills, Agents, MCPs y Plugins — disponible hoy en CLI, próximamente en Desktop. — @bcherny en X
Google I/O 2026 — El resumen oficial “100 anuncios”
20 de mayo — Google publica su artículo oficial de resumen “100 things announced at I/O 2026”, documento de referencia para el conjunto de lanzamientos del evento. Entre los anuncios confirmados: Antigravity 2.0 CLI (sucesor de Gemini CLI), Universal Cart (compras en múltiples comercios), Google Pics (gestión inteligente de fotos), Ask YouTube (consulta de vídeos de YouTube), Android XR glasses y la expansión de SynthID. Este documento consolida la magnitud del Google I/O 2026 y sirve como fuente primaria para los desarrolladores que quieran encontrar todos los detalles oficiales.
🔗 Blog de Google — 100 anuncios I/O 2026
Gemini Connected Apps — OpenTable, Canva e Instacart
21 de mayo — Google Gemini amplía sus Connected Apps a tres nuevos socios: OpenTable (reserva de restaurantes), Canva (creación de visuales) e Instacart (compra de alimentos). Gemini ya no se limita a buscar información: realiza acciones concretas en el ecosistema digital del usuario en su nombre. Este anuncio post-I/O traduce de forma tangible la visión agéntica de Gemini Spark: el agente actúa sobre servicios externos populares sin salir de la aplicación.
🔗 Anuncio de Gemini Connected Apps
GitHub Copilot — Cuatro actualizaciones para desarrolladores
Informes métricos migrados a copilot-reports.github.com
20 de mayo — Las URLs de descarga de los informes de Copilot Usage Metrics migran desde el antiguo dominio Azure Front Door (azurefd.net) al dominio estable copilot-reports.github.com. Acción requerida para las organizaciones con firewall o proxy: añadir el nuevo dominio a la allowlist enterprise cuanto antes. El antiguo dominio seguirá activo durante el periodo de transición, pero quedará obsoleto posteriormente. Para las instancias de GitHub Enterprise Cloud, el nuevo dominio sigue el formato copilot-reports.SUBDOMAIN.ghe.com. Se prevé un fallback a *.blob.core.windows.net en caso de indisponibilidad de Azure.
Cloud agent — Claude Haiku 4.5 y GPT-5.4-mini a 0,33x
18 de mayo — El Copilot cloud agent integra dos nuevos modelos económicos: Claude Haiku 4.5 y GPT-5.4-mini, ambos facturados a 0,33x del multiplicador estándar (frente a 1x para los modelos estándar). Esta ampliación permite elegir la herramienta adecuada según la naturaleza de la tarea: modelo ligero y rápido para correcciones simples de lint o tests unitarios, modelo más potente para refactorizaciones complejas. La elección del modelo se realiza al delegar una tarea al cloud agent, lo que permite optimizar la relación coste/calidad según la complejidad real del trabajo.
Chat web — Panel lateral contextual en disponibilidad general
18 de mayo — Copilot Chat en github.com se abre ahora en panel lateral directamente al lado del recurso consultado (PR, issue, repositorio), sin tener que navegar a una página dedicada. El contexto se acumula automáticamente al navegar entre varias PRs y issues en la misma sesión: las referencias entre recursos siguen accesibles sin perder el hilo de la conversación. La experiencia inmersiva de página completa sigue disponible a través de “More → In immersive chat”. También es posible transformar la conversación en una sesión de agente para crear PRs o lanzar una búsqueda profunda. Disponible en GA para todos los planes de Copilot.
🔗 Changelog de Copilot Chat web
Genspark integra Gemini 3.5 Flash gratis
20 de mayo — Genspark integra Gemini 3.5 Flash al día siguiente de su anuncio en Google I/O, disponible gratis en AI Chat Agent y Genspark Claw. La plataforma (más de 70 modelos disponibles simultáneamente) ilustra su estrategia de integración reactiva: adoptar los modelos más recientes sin obligar al usuario a elegir manualmente. Gemini 3.5 Flash representa el modelo Flash más potente de Google hasta la fecha, optimizado para la velocidad de respuesta en tareas complejas.
Kling AI en Cannes — RAPHAEL RAPHAEL, película 100% IA
21 de mayo — Kling AI presenta RAPHAEL RAPHAEL en el Festival de Cannes 2026, un proyecto de largometraje 100% generado por IA a gran escala. Este anuncio es distinto del post del 20 de mayo sobre House of David (primera serie de Hollywood en integrar Kling a escala industrial, 44 millones de espectadores, #1 en Prime Video US). Kling AI consolida así una presencia multi-proyecto en Cannes 2026, afirmando su posición como actor principal de la IA de vídeo para el cine.
BFL FLUX Erase — Supresión de objetos y borrado de texto
21 de mayo — Black Forest Labs lanza FLUX Erase, funcionalidad de borrado inteligente para las imágenes FLUX. Tres capacidades principales: supresión de objetos (eliminación limpia con reconstrucción coherente del fondo), borrado de texto (supresión preservando el diseño subyacente) y eliminación automática de las sombras asociadas a los objetos borrados. La funcionalidad está diseñada para el retoque de precisión (precision inpainting): solo se modifica la zona objetivo, sin degradar el resto de la imagen. Disponible a través de la herramienta web flux-tools.bfl.ai/erase y la API BFL (docs.bfl.ai/flux_erase), con acceso inmediato sin lista de espera.
ElevenReader — Más de 200 000 títulos premium con voz a elegir
21 de mayo — ElevenLabs integra 200 000+ títulos premium en ElevenReader: best-sellers en audiobooks y eBooks bajo licencia, incluidos miles disponibles con la voz del narrador a elegir entre las voces de ElevenLabs. Esta expansión posiciona ElevenReader como una plataforma de lectura audio personalizable, donde el usuario ya no está limitado al narrador original de un libro: puede elegir la voz que prefiera para cualquier título compatible. La aplicación es accesible en elevenreader.io con acceso gratuito para empezar.
xAI Grok × OpenCode — Grok Build en el CLI de código
21 de mayo — Los suscriptores de Grok o X Premium pueden ahora utilizar el modelo Grok Build en OpenCode, editor de código en línea de comandos (CLI coding editor) especializado en inteligencia de codebase. Esta integración sigue a la anunciada en OpenClaw dos días antes — xAI amplía progresivamente su suscripción a más herramientas de terceros. El acceso está incluido en la suscripción Grok/X Premium existente, sin coste adicional. OpenCode se distingue de OpenClaw por su enfoque específico en el código: análisis de base de código, navegación y refactorización asistida.
Codex 26.519 — Appshots, Goal mode GA, uso de ordenador bloqueado, compartir plugins
21 de mayo — OpenAI publica Codex 26.519 con varias nuevas funciones de macOS y empresa. Los Appshots permiten enviar la ventana de la aplicación en primer plano a un hilo de Codex mediante una doble pulsación de las dos teclas Command — se capturan la ventana visible y el texto accesible por la API de accesibilidad de macOS. El Goal mode sale del estado experimental y pasa a disponibilidad general (app, extensión IDE, CLI). Remote computer use: Codex ahora puede utilizar las aplicaciones de escritorio después de bloquear el Mac. El compartir plugins está disponible para ChatGPT Business.
| Funcionalidad | Estado | Plataformas |
|---|---|---|
| Appshots | Nuevo (GA) | Solo macOS |
| Goal mode | GA (antes experimental) | App, IDE extension, CLI |
| Remote computer use (Mac bloqueado) | Nuevo | macOS + Codex Mobile |
| Plugin sharing | Nuevo (Business) | ChatGPT Business |
Breves
- Gemini Daily Brief — disponibilidad general — El resumen diario ya está accesible para todos los suscriptores de Google AI Plus, Pro y Ultra (18+), inicialmente en Estados Unidos. 🔗 fuente
- Grok × Imagine — assets de videojuegos (8,1M vistas) — Demostración viral de prototipado de assets de videojuegos directamente con Grok y @imagine, con fuerte participación de la comunidad gaming. 🔗 fuente
- Cohere Command A+ — pesos W4A4 disponibles en HuggingFace — Los pesos cuantizados W4A4 de Command A+ están disponibles para descarga, lo que permite el despliegue en 2× H100 con +47% de velocidad frente a BF16. 🔗 fuente
Lo que eso significa
La era agéntica se afianza en varios frentes simultáneamente. El lanzamiento de Qwen3.7-Max con 35 horas de autonomía continua y más de 1.000 llamadas a herramientas, combinado con NVIDIA Verified Agent Skills que estandarizan la gobernanza de las capacidades de los agentes, señala que la industria pasa de una fase de experimentación a una fase de estructuración. El hecho de que NVIDIA base su estándar en la spec abierta agentskills.io — compatible con Claude Code, Codex y Cursor — sugiere una convergencia hacia interfaces comunes para los agentes de IA, independientemente del modelo subyacente.
La seguridad de la cadena de herramientas de IA se convierte en un problema crítico. El incidente de GitHub, en el que una extensión maliciosa de VS Code del marketplace oficial de Microsoft comprometió un dispositivo interno, ilustra una nueva superficie de ataque que la industria aún no ha abordado plenamente. El momento es revelador: NVIDIA lanza sus Verified Agent Skills el mismo día que GitHub anuncia su incidente. Las skills y extensiones no verificadas representan un vector de ataque creciente a medida que los agentes de IA toman el control de sistemas críticos.
Las herramientas para desarrolladores se consolidan en torno a la transparencia del consumo. El anuncio de Claude Code /usage con desglose por componente, combinado con los Appshots de Codex y el Goal mode GA, revela una tendencia: las herramientas para desarrolladores de IA de nueva generación deben ahora explicar qué consumen y cómo. La granularidad por Skills/Agents/MCPs/Plugins responde a una demanda concreta de los equipos que despliegan agentes en producción y quieren comprender los costes reales.
La IA generativa de vídeo entra en la industria cinematográfica. Runway Aleph 2.0 con su control predecible a nivel de imagen, Kling AI en Cannes con un largometraje 100% IA (RAPHAEL RAPHAEL) y la confirmación de que House of David (44M viewers, #1 Prime Video US) utiliza Kling a escala industrial marcan un punto de inflexión. Los estudios ya no prueban la tecnología: la integran en sus pipelines de producción estándar.
Fuentes
- Qwen3.7-Max — Tweet de Alibaba Qwen
- Qwen3.7-Max — Blog oficial
- GitHub — Incidente de seguridad (anuncio inicial)
- GitHub — Incidente de seguridad (hilo detallado)
- NVIDIA Verified Agent Skills — Blog para desarrolladores
- NVIDIA Verified Agent Skills — Tweet
- Runway Aleph 2.0 — Anuncio oficial
- Runway Aleph 2.0 — Tweet
- Claude Code CHANGELOG
- Claude Code /usage breakdown — Boris Cherny
- Google I/O 2026 — 100 anuncios
- Gemini Connected Apps — OpenTable, Canva, Instacart
- GitHub Copilot — Migración de URLs de informes
- GitHub Copilot — Claude Haiku 4.5 y GPT-5.4-mini
- GitHub Copilot Chat web — Panel lateral GA
- Genspark — Gemini 3.5 Flash integrado
- Kling AI — RAPHAEL RAPHAEL en Cannes
- BFL FLUX Erase
- ElevenReader — más de 200.000 títulos
- xAI Grok × OpenCode
- Codex 26.519 — Appshots
- Codex 26.519 — Changelog
- Gemini Daily Brief GA
- Grok × Imagine — assets de videojuegos
- Cohere Command A+ — W4A4 HuggingFace