Buscar

GLM-5.2 open-source MIT, Qwen-Robot Suite y NVIDIA Blackwell domina MLPerf: el 16 de junio de 2026 en IA

GLM-5.2 open-source MIT, Qwen-Robot Suite y NVIDIA Blackwell domina MLPerf: el 16 de junio de 2026 en IA

ai-powered-markdown-translator

Artículo traducido del fr al es con gpt-5.4-mini.

Ver proyecto en GitHub ↗

16 de junio de 2026 — Z.ai publica los pesos open-source MIT de GLM-5.2 (ventana de 1M tokens, dos niveles de razonamiento), Alibaba Qwen presenta la Qwen-Robot Suite compuesta por tres modelos fundamentales para la robótica, NVIDIA Blackwell domina la totalidad de los benchmarks MLPerf Training 6.0 —incluido DeepSeek-V3 671B entrenado en 2,02 minutos sobre 8 192 GPU. GitHub anuncia la disponibilidad general (general availability) de pago de Code Quality el 20 de julio a $10 por desarrollador activo al mes, el June Pixel Drop aporta Gemini Omni de vídeo y la generación musical en los dispositivos Pixel, y la investigación económica de Anthropic cuantifica por primera vez el impacto de la experiencia profesional en Claude Code.


Z.ai GLM-5.2 — pesos open-source MIT disponibles

16 de junio — Z.ai (antes Zhipu AI) publica oficialmente los pesos open-source de GLM-5.2 bajo licencia MIT, materializando el anuncio del 13 de junio. Los pesos ya están disponibles para su descarga en la plataforma de la empresa.

“Introducing GLM-5.2: Frontier Intelligence, Open Weights

  • Significant improvements in coding and agentic tasks
  • Strong long-horizon capabilities with a 1M context window
  • Two levels of reasoning effort: GLM-5.2 (max) pushes the limits, while GLM-5.2 (high) strikes a strong balance”

🇪🇸 Presentación de GLM-5.2: inteligencia de frontera, pesos abiertos. Mejoras significativas en las tareas de codificación y agentivas. Capacidades robustas en secuencias largas con una ventana de contexto de 1 millón de tokens. Dos niveles de esfuerzo de razonamiento: GLM-5.2 (max) lleva los límites al máximo, mientras que GLM-5.2 (high) ofrece un sólido equilibrio.@Zai_org en X

Puntos clave de GLM-5.2:

  • Mejoras significativas en las tareas de codificación (coding) y agentivas
  • Ventana de contexto de 1 millón de tokens — útil para agentes de codificación a gran escala y el procesamiento de documentos largos
  • Dos niveles de esfuerzo de razonamiento complementarios
  • Supera a GLM-5.1 en codificación, uso de herramientas y razonamiento
  • Disponible a través de chat.z.ai
VarianteRazonamientoContextoLicencia
GLM-5.2 (max)Rendimiento máximo1M tokensMIT open-source
GLM-5.2 (high)Equilibrio sólido rendimiento/velocidad1M tokensMIT open-source

La licencia MIT es el indicador más importante: autoriza el uso comercial sin restricciones, lo que hace que GLM-5.2 sea directamente utilizable por empresas que no pueden o no quieren depender de modelos propietarios estadounidenses. El tuit alcanzó 515 000 visualizaciones en pocas horas —una señal fuerte del interés de la comunidad por los modelos open-source de frontera con grandes ventanas de contexto.

🔗 Blog de Z.ai — GLM-5.2


Qwen-Robot Suite — tres modelos fundamentales para la robótica incorporada

16 de junio — Alibaba Qwen anuncia la Qwen-Robot Suite, una pila completa para la inteligencia incorporada (embodied intelligence) compuesta por tres modelos fundamentales distintos y complementarios: navegación, manipulación y modelo del mundo.

Qwen-RobotNav — especialista en navegación móvil:

  • Unifica 5 tareas en un solo modelo: seguimiento de instrucciones, navegación hacia un punto objetivo (point-goal), navegación hacia un objeto objetivo (object-goal), seguimiento de objetos y conducción autónoma
  • Protocolo de observación controlable
  • Interfaz de herramienta para sistemas agentivos

Qwen-RobotManip — especialista en manipulación:

  • Espacio estado-acción unificado para robots heterogéneos
  • Poses delta en el marco de la cámara para un aprendizaje coherente entre distintos cuerpos robóticos (cross-embodiment)
  • Preentrenado sobre un corpus open-source de más de 38 100 horas

Qwen-RobotWorld — modelo de mundo físico:

  • Un solo modelo que cubre más de 20 tipos de cuerpos robóticos
  • Interfaz de acción en lenguaje natural
  • Predice futuros físicamente anclados para la manipulación, la conducción y la navegación

Cada modelo puede utilizarse de forma independiente y puede componerse como una herramienta del mundo físico. Juntos, forman la caja de herramientas de bajo nivel para sistemas agentivos de propósito general.

ModeloEspecialidadDato clave
Qwen-RobotNavNavegación multitarea (5 tareas unificadas)Interfaz de herramienta para sistemas agentivos
Qwen-RobotManipManipulación robótica cross-embodimentCorpus open-source 38 100+ horas
Qwen-RobotWorldModelo del mundo físico20+ tipos de cuerpos robóticos

🔗 Qwen-Robot Suite — anuncio


NVIDIA Blackwell domina MLPerf Training 6.0 — barrido total

16 de junio — NVIDIA ha ganado la totalidad de los benchmarks MLPerf Training 6.0, la referencia industrial para el entrenamiento de IA establecida por el consorcio MLCommons. Es la única plataforma que ha enviado resultados en cada prueba, incluidas las dos nuevas referencias introducidas en esta edición: DeepSeek-V3 (671 mil millones de parámetros, arquitectura MoE) y GPT-OSS-20B.

El rendimiento del sistema GB300 NVL72 (72 GPU Blackwell Ultra interconectadas) es notable:

ModeloPlataformaGPUTiempo
DeepSeek-V3 671B (MoE)GB300 NVL728 1922,02 min
GPT-OSS 20B (MoE)GB300 NVL725127,43 min
Llama 3.1 405BGB200 NVL728 1927,07 min
Llama 3.1 8BGB200 NVL721 0244,46 min
Llama 2 70B LoRAGB300 NVL725120,40 min
FLUX.1 (generación de imágenes)GB300 NVL7251217,1 min
DLRM-dcnv2GB300 NVL72640,67 min

La inclusión de FLUX.1 (modelo de generación de imágenes de Black Forest Labs) en los benchmarks oficiales es destacable: confirma que la infraestructura Blackwell es el estándar de referencia para entrenar los modelos de generación de imágenes más avanzados.

En el plano del software, NVIDIA ha desplegado varias innovaciones en la pila NeMo 26.06: grafos CUDA sobre iteración completa para los MoE, fusiones de núcleos mediante CuTe DSL, precisión MXFP8 para el bloque de atención y optimizaciones del enrutador MoE (aceleración del núcleo 5×). Estas mejoras de software han permitido una ganancia de 1,3× en el rendimiento de DeepSeek-V3 en tres meses sin modificar el hardware, pasando de 1 298 a 1 648 TFLOPS/GPU —un recordatorio de que el rendimiento del hardware es solo una parte de la ecuación.

🔗 NVIDIA — MLPerf Training 6.0


June Pixel Drop 2026 — Gemini Omni vídeo, generación musical, Daily Brief

16 de junio — El June Pixel Drop 2026 introduce varias funciones importantes que integran Gemini directamente en los dispositivos Pixel, con un despliegue progresivo que comenzará en las próximas semanas.

Gemini Omni — creación y edición de vídeo con IA: basta con hablar de forma natural con Gemini para mezclar texto, imágenes y vídeos. Posibilidad de empezar desde cero, remezclar contenidos de la galería, usar modelos predefinidos o incluso crear un avatar de IA personalizado con la imagen y la voz del usuario.

Generación musical en Gemini: el usuario describe una idea o importa una foto, que se transforma en una pista de audio original con letra. El estilo, la voz y el tempo son personalizables desde el menú Herramientas → “Crear música” de la aplicación Gemini.

Daily Brief — agente matinal de IA: disponible para todos los suscriptores de Google AI Plus, Pro y Ultra (18+, Estados Unidos solo por ahora). Este agente organiza la jornada del usuario antes incluso de que se despierte. Voice Translate, que traduce llamadas en tiempo real, se amplía al Pixel 10a (7 idiomas, incluido el francés).

FuncionalidadDisponibilidadNotas
Gemini Omni vídeoPixel (despliegue progresivo)Creación/remezcla por conversación
Generación musicalPixel (app Gemini)Audio + letra, personalizable
Daily BriefGoogle AI Plus/Pro/Ultra, 18+, Estados UnidosAgente matinal de IA
Voice TranslatePixel 10a7 idiomas + hindi en vista previa
Edit with Ask PhotosReino Unido, Alemania, Francia, España, ItaliaEdición fotográfica por conversación

🔗 June Pixel Drop 2026 — blog oficial de Google


GitHub Code Quality — disponibilidad general el 20 de julio, $10 por desarrollador activo

16 de junio — GitHub anuncia que GitHub Code Quality pasará de la vista previa pública a la disponibilidad general (general availability) el 20 de julio de 2026, como producto de pago. Más de 10 000 empresas han participado en la vista previa.

Precios a partir del 20 de julio:

ComponentePrecio
Licencia por desarrollador activo (committer)$10 / desarrollador activo / mes
Funciones de IA (Copilot code review, detección de IA, Copilot Autofix)Facturación por uso
Análisis determinista CodeQLMinutos de GitHub Actions

Nuevas funciones disponibles desde el GA:

  • Despliegue a escala de organización (un solo toggle de administración)
  • Paneles de calidad a nivel de organización
  • Aplicación de la cobertura de código mediante conjuntos de reglas (rulesets)
  • Puntuación de calidad por repositorio y por organización
  • API para la activación y la gestión de resultados

Disponibilidad: solo GitHub Enterprise Cloud y GitHub Team. No disponible en GitHub Enterprise Server. Los clientes que deseen darse de baja antes de la facturación pueden desactivar Code Quality en sus repositorios antes del 20 de julio.

🔗 GitHub Code Quality — anuncio GA


Investigación económica de Anthropic — la experiencia profesional prima sobre el dominio del código

16 de junio — Anthropic publica un estudio económico sobre el uso de Claude Code, basado en el análisis confidencial de unas 400 000 sesiones entre octubre de 2025 y abril de 2026. Primeros resultados cuantificados sobre cómo la experiencia determina el éxito con un agente de codificación de IA.

Resultados clave del estudio (autores: Zoe Hitzig, Maxim Massenkoff, Eva Lyubich, Ryan Heller, Peter McCrory):

IndicadorValor
Sesiones analizadas~400 000
Usuarios distintos~235 000
Periodo cubiertoOct 2025 – Abr 2026
Decisiones de planificación (usuario)~70 %
Decisiones de ejecución (Claude)~80 %
Aumento medio del valor económico de las tareas+25 %
Tasa de éxito verificada (experto de dominio)28–33 %
Tasa de éxito verificada (novato)15 %
Proporción de sesiones de depuración oct → abr33 % → 19 %

Conclusión central: en una sesión típica, el usuario toma ~70 % de las decisiones de planificación (qué hacer) mientras Claude toma ~80 % de las decisiones de ejecución (cómo hacerlo). Los expertos de dominio —no necesariamente desarrolladores— llevan a Claude hacia cadenas de acciones dos veces más largas con cinco veces más contenido por instrucción. La tasa de éxito de las profesiones no técnicas (abogados, directivos, científicos) se sitúa a menos de 7 puntos porcentuales de la de los ingenieros de software. Es la comprensión del problema de negocio, y no el dominio del código, lo que determina el éxito.

🔗 Investigación económica de Anthropic — Claude Code


Anthropic y OpenAI — agentes en producción y despliegue en Europa

Claude Managed Agents — guía para pasar a producción

16 de junio — El equipo Applied AI de Anthropic publica una guía práctica sobre el paso a producción de agentes con Claude Managed Agents. La publicación explica la evolución de las superficies de interacción: del chatbot clásico hacia agentes autónomos planificados, persistentes, con acceso a entornos de ejecución (stateful runtime environments). Dos funciones disponibles desde el 9 de junio: ejecución de agentes sobre un plan definido y almacenamiento de variables de entorno en bóvedas (vaults).

🔗 Building with Claude Managed Agents

Claude Code v2.1.178 — permisos granulares y skills anidados

15 de junio — Claude Code v2.1.178 introduce la sintaxis Tool(param:value) para las reglas de permisos —por ejemplo Agent(model:opus) para bloquear los subagentes Opus. Los skills en directorios .claude/skills/ anidados se cargan automáticamente cuando se trabaja en esas carpetas. El modo auto ahora evalúa los lanzamientos de subagentes mediante el clasificador antes de iniciarlos, cerrando una brecha por la que un subagente podía solicitar una acción bloqueada sin revisión previa.

🔗 Claude Code v2.1.178

Codex app en EEE, Reino Unido y Suiza — Computer Use, Memories, Chronicle

16 de junio — OpenAI despliega cuatro funciones avanzadas de Codex en el Espacio Económico Europeo (EEE), Reino Unido y Suiza: Computer Use (macOS + Windows), la extensión Chrome de Codex, Memories y Chronicle.

Computer Use permite que Codex interactúe con aplicaciones de escritorio: ver, hacer clic, escribir texto. La extensión Chrome permite realizar tareas que requieren un contexto del navegador conectado, trabajando en varias pestañas en segundo plano. Memories memoriza las preferencias y convenciones recurrentes de los repositorios, pero está desactivada por defecto en las tres regiones por cumplimiento normativo. Chronicle, una vista previa opt-in reservada a los suscriptores Pro en macOS, ayuda a Codex a construir recuerdos a partir del contexto reciente de la pantalla. Estas funciones ya estaban disponibles para los usuarios Enterprise fuera del EEE/UK/CH.

🔗 OpenAI — despliegue de Codex EEE/UK/Suiza

Simulación de despliegue de OpenAI — predecir el comportamiento antes del lanzamiento

16 de junio — OpenAI publica su método Deployment Simulation (Simulación de despliegue): reproducir conversaciones reales anonimizadas procedentes de despliegues anteriores con un modelo candidato, para detectar comportamientos indeseables antes de la puesta en producción. Probada en los despliegues GPT-5-series Thinking (~1,3 millones de conversaciones), el error mediano de predicción es de 1,5×, claramente mejor que las evaluaciones sintéticas. El método permitió detectar el “calculator hacking” (una forma de desviación (reward hacking)) antes del lanzamiento de GPT-5.1.

🔗 Deployment Simulation — OpenAI

Codex CLI 0.140.0 — /usage, /import desde Claude Code, Bedrock auth

15 de junio — La versión 0.140.0 de Codex CLI incorpora varias funciones sustanciales. /usage muestra la actividad diaria, semanal y acumulada de tokens de la cuenta. /import permite importar selectivamente la configuración, los ajustes del proyecto y las conversaciones recientes desde Claude Code — una interoperabilidad directa entre dos herramientas competidoras. codex delete elimina definitivamente una sesión con confirmación de seguridad y limpieza de los subagentes asociados. La autenticación administrada de Amazon Bedrock almacena las claves API cifradas localmente y también cubre las credenciales OAuth MCP. En paralelo, correcciones de fiabilidad de MCP (reintentos en arranques transitorios) y recuperación automática de bases de datos SQLite dañadas.

🔗 Codex CLI 0.140.0 — release GitHub


Meta AI — AI Mode en Facebook con Muse Spark

16 de junio — Meta despliega nuevas herramientas de inteligencia artificial en Facebook. AI Mode es un nuevo modo de búsqueda impulsado por Meta AI (propulsado por Muse Spark) que ancla sus respuestas en lo que los usuarios dicen públicamente en las aplicaciones de Meta — Grupos, Reels — ofreciendo perspectivas contextualizadas en lugar de resultados genéricos. Accesible desde el feed o la búsqueda.

Nuevas herramientas creativas: sugerencias para compartir desde la galería con plantillas de collage (cutout templates), efectos de transición de vídeo, preajustes fotográficos (photo presets) que permiten modificar virtualmente la ropa y el peinado, y la opción “Wear It” para llevar virtualmente una camiseta deportiva en las Stories. Todas estas funciones son opt-in y pueden desactivarse.

🔗 Meta — nuevas herramientas de IA en Facebook


NVIDIA SpatialClaw — agente de razonamiento espacial sin entrenamiento

16 de junio — NVIDIA Research publica SpatialClaw, un agente de razonamiento espacial visual training-free (sin entrenamiento adicional). En lugar de llamar a un conjunto fijo de herramientas predefinidas, el agente escribe directamente Python en un núcleo persistente, componiendo dinámicamente módulos de percepción y revisando su estrategia a lo largo de los pasos. Las salidas se convierten en variables Python reutilizables con NumPy y SciPy.

Resultados: +11,2 puntos en 20 benchmarks de razonamiento espacial visual respecto a un agente anterior reciente, de forma coherente en 6 arquitecturas de modelos diferentes, sin ajuste específico para ningún benchmark.

🔗 SpatialClaw — @NVIDIAAI en X


Cohere — afluencia de solicitudes tras la restricción de Anthropic en EE. UU.

15 de junio — Cohere, empresa canadiense de IA generativa, informa que está recibiendo un elevado número de solicitudes entrantes (inbounds) de empresas que buscan alternativas tras la directiva de EE. UU. que restringe el acceso a Anthropic (cubierta el 13 de junio). La firma respondió con humor citando el tuit de Polymarket: “The world needs more Canada 🇨🇦”. El tuit alcanzó 56 000 visualizaciones y 797 me gusta. Este posicionamiento confirma que la directiva estadounidense crea una oportunidad comercial directa para los proveedores soberanos no estadounidenses.

🔗 Cohere — tuit


GitHub Models retirado para los nuevos clientes

16 de junio — GitHub anuncia la retirada progresiva de GitHub Models. A partir del 16 de junio, los nuevos clientes (organizaciones y empresas sin uso preexistente) ya no tienen acceso al servicio, ni en los planes gratuitos ni en los de pago. Los clientes existentes con uso activo no se ven afectados por ahora y pueden seguir utilizando el playground, la API y los modelos disponibles. GitHub precisa que comunicará más adelante los plazos detallados del cierre completo. Para los nuevos proyectos que necesiten acceso a modelos de IA, GitHub dirige hacia Azure AI Foundry, que ofrece un catálogo ampliado de modelos.

🔗 GitHub Models retirement


Breves

  • Claude Code v2.1.179 — 9 correcciones de estabilidad (16 de junio) : las desconexiones en mitad del flujo (mid-stream) se conservan, se corrige el desplazamiento con la rueda en WSL2 bajo Windows Terminal y VS Code (regresión desde v2.1.172), corrección de la sandbox Linux en grandes árboles de directorios. 🔗 v2.1.179

  • Gemini Trusted Tester Program — inscripciones abiertas : Google abre un número limitado de plazas para power users que deseen probar funciones inéditas de Gemini antes de su lanzamiento público. 🔗 Inscripción

  • Gemini — micrófono multilingüe 70+ idiomas (Android e iOS) : el icono del micrófono ahora admite más de 70 idiomas con mezcla libre sin cambiar los ajustes. Anuncio vía @joshwoodward (Director of Product, Gemini App).

  • GitHub Code Quality — activación de organización con un clic (16 de junio) : los administradores de la organización pueden activar o desactivar Code Quality en todos sus repositorios con un solo toggle en los ajustes de seguridad. 🔗 Changelog

  • Copilot usage metrics — enriquecimiento por telemetría del servidor (15 de junio) : los informes de uso de Copilot Enterprise integran ahora los usuarios activos detectados en el servidor (además de la telemetría del cliente), mejorando la cobertura de los DAU en los informes diarios y de 28 días. 🔗 Changelog

  • Manus — cola de mensajes durante la ejecución (16 de junio) : Manus permite ahora poner en cola mensajes para enviar al agente mientras una tarea está en curso. Los mensajes se procesan en orden en cuanto termina la tarea actual. 🔗 Anuncio

  • ChatGPT iOS 1.2026.160 (15 de junio) : explorador de archivos workspace, selector de carpeta, controles de diff, aprobación MCP por chat o global, y renderizado de LaTeX en los mensajes y planes de Codex.


Qué significa esto

La apertura de los pesos MIT de GLM-5.2 y los tres modelos robóticos de Qwen-Robot Suite ilustran la aceleración de la oferta open-source china en los nichos donde los actores estadounidenses siguen siendo en gran parte propietarios. GLM-5.2, con su ventana de 1M tokens bajo licencia MIT, se posiciona directamente como competidor de los modelos comerciales para las empresas que buscan una alternativa soberana — precisamente el nicho que la directiva de EE. UU. que restringe Anthropic ha hecho estratégicamente visible, como confirma la afluencia de solicitudes señalada por Cohere. La robótica es el próximo campo de esta competencia: Qwen-Robot Suite propone una pila completa navegación-manipulación-world model, mientras que SpatialClaw de NVIDIA Research demuestra que un razonamiento espacial avanzado puede lograrse sin fine-tuning — dos enfoques complementarios que dibujan la arquitectura de los sistemas robóticos agénticos de la próxima generación.

En el frente del hardware, los resultados de MLPerf Training 6.0 confirman el dominio de la arquitectura Blackwell a escala industrial: entrenar DeepSeek-V3 (671 mil millones de parámetros) en 2 minutos sobre 8 192 GPU no es una proeza académica, es una capacidad de producción real desplegada en centros de datos cloud. La ganancia de software de 1,3× en el rendimiento de DeepSeek-V3 en tres meses sin cambio de hardware recuerda que la carrera por el rendimiento de la IA es tanto una competición de stacks de software (NeMo, CuTe DSL, MXFP8) como de chips — una dinámica que amplifica las posiciones ya dominantes.

La investigación económica de Anthropic sobre Claude Code aporta una perspectiva importante e intuitiva: la experiencia en el dominio profesional (derecho, gestión, ciencias) determina el éxito con un agente de codificación casi tanto como el dominio del propio código. Las tasas de éxito verificadas muestran una diferencia de solo 7 puntos entre los ingenieros y los no desarrolladores expertos en su campo. Esta es una información estructural para los equipos de producto: el público objetivo de las herramientas de codificación con IA ya no son únicamente los desarrolladores, y el diseño de las interfaces debe tenerlo en cuenta.

En lo relativo a las herramientas para desarrolladores, el 16 de junio concentra varias señales convergentes: el GA de pago de GitHub Code Quality ($10/desarrollador activo), la disponibilidad de Codex con Computer Use en el EEE/Reino Unido/Suiza, los permisos granulares de Claude Code v2.1.178 y el método Deployment Simulation de OpenAI. La calidad del código y la seguridad de los despliegues pasan de ser temas de investigación a productos de pago — una normalización que refleja la creciente madurez del mercado de herramientas de IA para los equipos de desarrollo.


Fuentes