ai-powered-markdown-translatorArtículo traducido del fr al es con gpt-5.4-mini.
El 1 de junio de 2026 quedará como una de las jornadas más densas de la historia reciente de la IA: Anthropic da un paso hacia la bolsa con una presentación S-1 confidencial ante la SEC, mientras una ola de “Physical AI” se extiende al mismo tiempo — NVIDIA Cosmos 3, Cosmos Coalition Runway+NVIDIA, Luma OPAL Lab, MiniMax M3, Qwen-VLA y Qwen3.7-Plus. Al mismo tiempo, OpenAI despliega Rosalind Biodefense para la preparación ante pandemias y publica un marco de gobernanza alineado con la TFAIA californiana y la EU AI Act.
Anthropic presenta confidencialmente un formulario S-1 ante la SEC
1 de junio — Anthropic ha presentado de forma confidencial un proyecto de registro mediante formulario S-1 ante la Comisión de Bolsa y Valores de Estados Unidos (SEC), con vistas a una salida a bolsa (IPO) de sus acciones ordinarias. Esta presentación confidencial es un paso preliminar obligatorio que permite a la SEC revisar el documento antes de cualquier oferta pública.
| Elemento | Valor |
|---|---|
| Tipo de presentación | Formulario S-1 confidencial |
| Regulador | SEC (Estados Unidos) |
| Tipo de acción | Acciones ordinarias |
| Precio / número de acciones | Aún no fijados |
| Estado legal | Presentación preliminar — no es una oferta de venta |
| Fecha | 1 de junio de 2026 |
El anuncio especifica que Anthropic conserva la opción de salir a bolsa una vez finalizado el examen de la SEC, pero que la operación final dependerá de las condiciones del mercado y de otros factores. Esta presentación S-1 se produce como continuación directa del cierre de la Serie H (65 mil millones USD, valoración post-money de 965 mil millones USD) y de unos ingresos anualizados que habrían superado los 47 mil millones USD a mediados de mayo de 2026.
Anthropic sigue siendo una sociedad de beneficio público (PBC — Public Benefit Corporation), estatus que pretende conservar tras una eventual cotización — una distinción legal poco común que impone obligaciones de interés público además de la búsqueda de beneficio.
NVIDIA Cosmos 3 — primer omni-modelo open-source para Physical AI
1 de junio — NVIDIA lanza Cosmos 3, el primer omni-modelo totalmente abierto para la IA física. Unifica lenguaje, imagen, vídeo, audio y generación de acciones en un solo modelo — una primicia mundial.
| Variante | Parámetros | Disponibilidad |
|---|---|---|
| Cosmos 3 Super | 32B | Open-source desde el lanzamiento |
| Cosmos 3 Nano | 8B | Open-source desde el lanzamiento |
El modelo integra de forma nativa el razonamiento visual (native vision reasoning), la generación de mundos (world generation) y la generación de acciones (action generation). Según Artificial Analysis, Cosmos 3 se clasifica de inmediato como #1 entre los modelos open-weight en generación texto a imagen e imagen a vídeo desde el primer día del lanzamiento. Los pesos están disponibles en Hugging Face y NVIDIA NGC.
“Introducing Cosmos 3: Our latest frontier model for Physical AI. Cosmos 3 is the world’s first fully open omnimodel with native vision reasoning, world and action generation.”
🇪🇸 NVIDIA presenta Cosmos 3: su último modelo frontier para la IA física. Cosmos 3 es el primer omni-modelo totalmente abierto del mundo, con razonamiento visual nativo, generación de mundos y generación de acciones. — @NVIDIAAI en X
Cosmos Coalition — Runway + NVIDIA, iniciativa mundial para los world models
1 de junio — Runway se une a NVIDIA como miembro fundador de la Cosmos Coalition, una iniciativa mundial que reúne a laboratorios de IA de primer nivel para construir y hacer accesibles en open-source world models frontier para la IA física.
El objetivo es crear un ecosistema abierto común que permita a cualquier grupo de investigación o industrial usar, modificar y ensamblar estos modelos para sistemas de trabajo productivo. La coalición también integra asociaciones con fabricantes de chips y de hardware.
“Introducing the Cosmos Coalition. A new global initiative with NVIDIA and leading AI labs to build and open-source frontier world models for physical AI.”
🇪🇸 Presentación de la Cosmos Coalition. Una nueva iniciativa mundial con NVIDIA y los principales laboratorios de IA para construir y hacer open-source world models frontier para la IA física. — @runwayml en X
Este lanzamiento coordinado con Cosmos 3 marca un giro estratégico: NVIDIA posiciona la IA física open-source como una cuestión de soberanía tecnológica mundial, frente a la concentración de recursos en unos pocos actores cerrados.
MiniMax M3 — primer open-weight que combina coding frontier, multimodalidad y contexto 1M
1 de junio — MiniMax lanza M3, el primer modelo open-weight que combina simultáneamente tres capacidades frontier. Con 1,7 millones de vistas en pocas horas, es uno de los lanzamientos open-source más seguidos del año.
| Capacidad | Detalle |
|---|---|
| Coding & Agentic frontier | 59,0% SWE-Bench Pro, 66,0% Terminal Bench 2.1 |
| Contexto 1M tokens | MiniMax Sparse Attention |
| Multimodalidad nativa | Desde la etapa cero del entrenamiento |
Benchmarks completos:
| Benchmark | Puntuación |
|---|---|
| SWE-Bench Pro | 59,0% |
| Terminal Bench 2.1 | 66,0% |
| SWE-fficiency | 34,8% |
| KernelBench Hard | 28,8% |
| MCP Atlas | 74,2% |
| BU Bench (browser use) | +26% vs anterior |
M3 está diseñado de forma nativa para agentes informáticos (computer-use agents) y workflows agentivos de larga duración. Los pesos y el informe técnico se publicarán en unos 10 días desde el lanzamiento. Un IDE dedicado, MiniMax Code, se lanza al mismo tiempo, accesible en code.minimax.io. Entre los socios de lanzamiento del primer día figuran Qubrid AI (infraestructura cloud GPU) y Simular (agentes autónomos).
Luma OPAL Lab — laboratorio abierto de Physical AI para la robótica generalista
1 de junio — Luma anuncia la creación de OPAL Lab (Open Science Physical AI Lab), un laboratorio de investigación abierta dedicado a la generalización en robótica.
El fundador Amit (@gravicle) identifica el problema central de la IA física actual: a diferencia de los grandes modelos de lenguaje capaces de generalizar sobre tareas inéditas, los robots solo pueden reproducir tareas específicas en entornos específicos. La robótica sufre una falta de datos que genera una crisis de generalización.
“We are launching Open Physical AI Lab at Luma to solve generalization in robotics. We believe general physical AI is the most consequential problem to solve to improve life on Earth.”
🇪🇸 Lanzamos el Open Physical AI Lab en Luma para resolver el problema de la generalización en robótica. Creemos que la IA física generalista es el problema más crucial que hay que resolver para mejorar la vida en la Tierra. — @gravicle en X
Luma se apoya en 4 años de investigación fundamental en IA multimodal (3D, imagen, vídeo, generación unificada) y en una infraestructura de tratamiento de datos multimodales a escala de internet. Los principios de OPAL Lab: ciencia abierta, métodos y sustratos disponibles para todos, colaboración con la academia, alianzas industriales y evaluaciones de seguridad. El mensaje es explícitamente político: concentrar la infraestructura de inteligencia física mundial en manos de un pequeño número de empresas representa una amenaza profunda para la humanidad.
Qwen3.7-Plus — agente multimodal de Alibaba con visión, coding y contexto largo
1 de junio — Alibaba Tongyi Lab publica Qwen3.7-Plus, su modelo agente multimodal más avanzado. Construido sobre el backbone de texto de Qwen3.7, fusiona visión y lenguaje en una base agente única y versátil.
Benchmarks clave:
| Benchmark | Qwen3.7-Plus | GPT-5.4 | Claude Opus 4.6 Max | Gemini 3.1 Pro |
|---|---|---|---|---|
| Terminal Bench 2.0 | 70,3 | — | 65,4 | — |
| SWE-bench Verified | 77,7 | — | 80,8 | — |
| GPQA Diamond | 90,3 | — | 91,3 | — |
| ScreenSpot Pro | 79,0 | 67,4 | 49,5 | 68,1 |
| AndroidWorld | 81,0 | — | 62,0 | 70,7 |
| BabyVision | 70,4 | 53,1 | 12,6 | 55,9 |
Cuatro capacidades principales: agente híbrido GUI+CLI (percibe pantallas, navega por aplicaciones), asistente de programación y productividad multimodal (desde el mockup frontend hasta la ingeniería compleja), agente visual (percepción, razonamiento, localización y preguntas-respuestas enriquecidas mediante búsqueda web), y generalización multi-entorno a través de Claude Code, OpenClaw, Qwen Code o cualquier otro entorno de agentes.
Disponibilidad: Alibaba Cloud Model Studio, API compatible con OpenAI y protocolo Anthropic (utilizable directamente con Claude Code vía ANTHROPIC_BASE_URL).
Rosalind Biodefense — OpenAI abre GPT-Rosalind a la biología defensiva
29 de mayo — OpenAI anuncia dos iniciativas importantes en torno a la biología defensiva, apoyándose en GPT-Rosalind, su modelo de razonamiento dedicado a las ciencias de la vida.
| Organización | Ámbito | Tipo |
|---|---|---|
| Fourth Eon | Cribado de bioseguridad, síntesis de ADN | Desarrollador de Rosalind Biodefense |
| SecureDNA | Seguridad biológica | Desarrollador de Rosalind Biodefense |
| Lawrence Livermore National Laboratory | Contramedidas médicas | Socio gubernamental |
| Johns Hopkins APL | Ingeniería de proteínas, terapéuticas | Socio gubernamental |
| CEPI | Vacunas pandémicas, respuesta al ébola | Socio gubernamental |
Rosalind Biodefense es un programa de desarrollo abierto a instituciones académicas, organizaciones sin ánimo de lucro, empresas con misión defensiva y equipos gubernamentales. OpenAI financia el acceso a GPT-Rosalind y acompaña los proyectos sobre modelización epidemiológica, detección temprana, cribado, preparación ante pandemias y contramedidas médicas.
“Advances in biology can strengthen our ability to prevent, detect, and respond to biological threats. Our goal is to help build a more robust ecosystem — giving trusted defenders frontier AI to develop and operate new defenses for public health and biodefense.”
🇪🇸 Los avances en biología pueden reforzar nuestra capacidad para prevenir, detectar y responder a las amenazas biológicas. Nuestro objetivo es ayudar a construir un ecosistema más robusto — dando a los defensores de confianza una IA frontier para desarrollar y operar nuevas defensas para la salud pública y la biodefensa. — @OpenAI en X
El acceso ampliado a GPT-Rosalind para socios gubernamentales estadounidenses y aliados se anuncia simultáneamente, con beneficiarios como la CEPI en el marco de su misión “100 Days” de aceleración de vacunas — incluida la respuesta al brote de ébola en curso.
🔗 Rosalind Biodefense — OpenAI
Claude Code v2.1.153 a v2.1.159 — cinco actualizaciones posteriores al 28 de mayo
29 de mayo – 1 de junio — Anthropic publica cinco versiones de Claude Code en los días siguientes al lanzamiento de Opus 4.8.
| Versión | Puntos clave |
|---|---|
| 2.1.153 | Opción skipLfs para marketplace, claude doctor mejorado, correcciones MCP/agentes macOS/Windows |
| 2.1.156 | Corrección crítica — los thinking blocks Opus 4.8 provocaban errores API |
| 2.1.157 | Plugins cargados automáticamente desde .claude/skills/, comando plugin init, EnterWorktree mid-session |
| 2.1.158 | Auto Mode en Bedrock, Vertex y Foundry para Opus 4.7 y Opus 4.8 (CLAUDE_CODE_ENABLE_AUTO_MODE=1) |
| 2.1.159 | Infraestructura interna, ningún cambio visible |
La versión 2.1.157 es la más destacable: los plugins ubicados en .claude/skills/ se cargan ahora automáticamente sin pasar por el marketplace, y EnterWorktree puede alternar entre worktrees gestionados por Claude en mitad de la sesión. La versión 2.1.158 aporta Auto Mode en las principales plataformas cloud, reforzando el despliegue enterprise de Claude Code.
Gemini 3.5 Flash y Gemini Omni en disponibilidad general
29 de mayo — Google marca la disponibilidad general (general availability) de Gemini 3.5 Flash mediante 9 demostraciones en vídeo que cubren Gemini Omni y Gemini 3.5 Flash en acción.
Despliegue de Gemini 3.5 Flash: modelo por defecto en la aplicación Gemini y en AI Mode de Search (global), disponible vía Google Antigravity, la API Gemini en Google AI Studio, Android Studio, Gemini Enterprise Agent Platform y Gemini Enterprise.
Gemini Spark: el agente de IA personal 24/7 impulsado por Gemini 3.5, ahora disponible para todos los suscriptores de Google AI Ultra en Estados Unidos, integrado en Gmail, Docs, Slides y Workspace.
Gemini Omni Flash: desplegado para los suscriptores de Google AI Plus, Pro y Ultra en la aplicación Gemini y Google Flow; disponible sin coste para los usuarios de YouTube Shorts y YouTube Create App; despliegue de API para desarrolladores previsto en las semanas siguientes.
🔗 Demostraciones de Gemini Omni y 3.5 Flash
Qwen-VLA — agente robótico visión-lenguaje-acción para 11 tipos de robots
29 de mayo — Tongyi Lab publica Qwen-VLA, un modelo Vision-Language-Action (VLA) unificado para la inteligencia encarnada general (general embodied intelligence).
Arquitectura: Qwen3.5-4B (backbone lenguaje-visión) + decodificador DiT 1,15B para producir acciones directamente a partir de la percepción visual y del lenguaje natural. El modelo unifica la manipulación de objetos, la navegación espacial y la predicción de trayectorias en un único marco.
Gracias a los prompts con conciencia de la encarnación (embodiment-aware prompts), el mismo modelo funciona en 11 tipos de encarnaciones robóticas — brazo único, doble brazo y plataformas humanoides — sin policy heads ni arquitecturas específicas para cada tarea. El tuit generó 3,1 millones de vistas en dos días, señal del gran interés de la comunidad robótica.
Copilot — la API de métricas añade cohortes de adopción de IA
29 de mayo — GitHub amplía la API de métricas de uso de Copilot con un sistema de cohortes de adopción de IA. Cada usuario activo se clasifica en una de las cuatro fases siguientes, calculadas sobre una ventana móvil de 28 días:
| Fase | Nombre | Criterio |
|---|---|---|
| 0 | No cohort | No hay suficiente engagement |
| 1 | Code first | Finalización de código y/o modo agente IDE |
| 2 | Agent first | Una superficie de agente de GitHub (cloud agent, code review, CLI) |
| 3 | Multi-agent | Dos o más superficies de agente, o la app de GitHub Copilot |
Las métricas expuestas por fase: usuarios activos, interacciones, generación y aceptación de código, líneas añadidas/eliminadas, pull requests creadas/mergadas/revisadas, tiempo mediano de merge. Accesible para administradores enterprise y propietarios de organizaciones. Este sistema permite medir la verdadera madurez de adopción de Copilot y seguir el progreso de los desarrolladores hacia usos agentivos avanzados.
🔗 Changelog de GitHub — API de métricas de uso de Copilot
ElevenLabs firma un MOU con el gobierno de Grecia
28 de mayo — ElevenLabs firma un memorándum de entendimiento con el gobierno griego, en presencia del primer ministro (@PrimeministerGR) y del ministro de Transformación Digital (@papastergiougr), para tres ejes: mejorar el acceso a los servicios públicos mediante IA de voz, promover el turismo y preservar el patrimonio lingüístico griego. Esta alianza gubernamental ilustra la estrategia de ElevenLabs para implantarse en el sector público europeo, apostando por usos institucionales de alta visibilidad.
Frontier Governance Framework — OpenAI alinea sus prácticas con la TFAIA y la EU AI Act
28 de mayo — OpenAI publica su Frontier Governance Framework, un documento de gobernanza pública que traduce el Preparedness Framework interno en obligaciones regulatorias concretas. El objetivo principal: la Transparency in Frontier AI Act (TFAIA) de California y el Código de práctica para la IA de uso general de la EU AI Act.
El framework cubre la evaluación y la mitigación de riesgos en los ámbitos cibernético ofensivo, CBRN (químicos, biológicos, radiológicos, nucleares), manipulación dañina y pérdida de control. También incluye obligaciones de reporte de modelos, gestión de incidentes, recurso a expertos externos y un mecanismo de actualización. OpenAI precisa que el Preparedness Framework sigue siendo su base interna — algunas prácticas van más allá de los requisitos legales actuales.
🔗 Frontier Governance Framework
Guía de evaluaciones de terceros fiables — método y cinco sesgos que controlar
29 de mayo — OpenAI publica una guía metodológica para evaluaciones de terceros rigurosas de modelos de IA frontera. El documento parte de una constatación: las evaluaciones concebidas originalmente para chatbots ya no son adecuadas para sistemas agentivos capaces de usar herramientas y actuar sobre trayectorias largas.
La guía distingue tres tipos de afirmaciones que las evaluaciones deben respaldar: la elicitación de capacidades (lo que el modelo puede hacer en las mejores condiciones), la robustez de las protecciones (resistencia a los ataques) y la comparación entre sistemas. Un concepto central es el “harness” (entorno de ejecución alrededor del modelo), cuyas decisiones pueden cambiar materialmente los resultados — OpenAI cita el impacto de la compacción de contexto en el rendimiento de GPT-5.5 en evaluaciones cibernéticas multietapa.
Se identifican cinco sesgos de validez: reward hacking (explotación de atajos), rechazo que enmascara las capacidades reales, contaminación (memorización de benchmarks), problemas rotos (tareas imposibles o mal puntuadas) y sandbagging (rendimiento deliberadamente bajo durante evaluaciones detectadas). OpenAI se compromete a proporcionar instrucciones de elicitación máxima a los evaluadores terceros y a compartir las trazas de razonamiento.
🔗 Guía de evaluaciones de terceros — OpenAI
Grok Imagine Extend — extensión de vídeo continua
29 de mayo — Grok Imagine lanza Extend, una funcionalidad que permite crear vídeos continuos con transiciones fluidas a partir de un vídeo o de imágenes existentes. La funcionalidad está disponible directamente en la interfaz de Grok Imagine. El tuit de la cuenta @imagine fue republicado por @grok y alcanzó 701 000 visualizaciones. Este anuncio consolida la suite creativa de Grok junto a Grok Build y la API grok-build-0.1.
Codex Computer Use en Windows y control móvil
29 de mayo — OpenAI anuncia que la funcionalidad “computer use” de Codex ya está disponible en Windows. El agente puede ver la pantalla, hacer clic y escribir texto en las aplicaciones de Windows, abriendo la puerta a pruebas nativas, flujos en simulador y correcciones de errores accesibles solo mediante interfaz gráfica. La aplicación móvil de ChatGPT integra simultáneamente compatibilidad con Windows para Codex: lanzamiento, seguimiento y control de tareas desde el teléfono mientras el trabajo continúa en el PC. OpenAI califica esta funcionalidad de «experiencia temprana»; no está disponible en el Espacio Económico Europeo, el Reino Unido ni Suiza.
🔗 Codex Computer Use en Windows
Breves
-
Salesforce + Claude Code — Boris Cherny (@bcherny) comparte un testimonio de Salesforce sobre el uso agentivo de Claude Code: una migración inicialmente estimada en 231 días entregada en 13, 21 endpoints con un 100% de cobertura de pruebas y una bajada del 5% en los incidentes pese a un aumento del volumen de PRs. 🔗 fuente
-
Google I/O 2026 — making-of de IA — Google detalla cómo sus equipos usaron Gemini Omni, Nano Banana, Lyria 3 y Antigravity para producir las experiencias creativas de Google I/O 2026: cortometraje de animación, identidad visual, pre-show musical interactivo, juegos generativos. 🔗 fuente
-
Gemini CLI v0.44.0 — Modo Auto unificado (fusión de los modos especializados), compatibilidad nativa con Sublime Text y Emacs Client, nuevas herramientas de prueba TUI programáticas. 🔗 fuente
-
GitHub Copilot — modelos en evaluación en modo auto — Los usuarios individuales (Free, Pro, Pro+) tienen ahora acceso a los modelos pre-GA mediante la selección automática
auto. Opción de desactivación disponible en los ajustes. 🔗 fuente -
ElevenLabs Summit Varsovia — Vista previa del modelo de voz más expresivo jamás desarrollado por ElevenLabs, revelado por el cofundador Mati. Se trata solo de una vista previa, sin acceso público anunciado. 🔗 fuente
-
Cohere Command A+ — benchmarks de traducción — Command A+ supera a Mistral Medium 3.5, DeepSeek, gpt-oss y Claude Opus 4.6 en WMT24++, así como a Google Translate. Ganancias documentadas: +2,4 pts en francés, +1,9 pts en español, +0,9 pts en alemán. 🔗 fuente
Qué significa esto
La dinámica financiera de Anthropic y la consolidación del sector. La presentación confidencial del S-1 de Anthropic es la noticia más estructurante de la semana. Llega en un contexto de crecimiento extraordinario — 65 mil millones USD levantados en la Serie H, valoración cercana al billón — y señala que las grandes empresas de IA frontera empiezan a considerar seriamente los mercados públicos. La conservación del estatus PBC (Public Benefit Corporation) es un compromiso fuerte: Anthropic busca demostrar que una salida a bolsa es compatible con una misión de seguridad a largo plazo. Este precedente tendrá implicaciones para OpenAI y otros actores que podrían seguir este camino.
La ola Physical AI — hacia una IA que actúa en el mundo real. El 1 de junio marca una convergencia notable en torno a la IA física: NVIDIA Cosmos 3 (primer omni-model open-weight para robots y agentes), Cosmos Coalition (ecosistema abierto Runway+NVIDIA), Luma OPAL Lab (investigación abierta sobre la generalización robótica), MiniMax M3 (contexto 1M + multimodalidad nativa), Qwen-VLA (11 tipos de robots bajo una arquitectura unificada) y Qwen3.7-Plus (agente GUI+CLI en acción en las interfaces). Este conjunto no es una coincidencia: refleja un consenso creciente de que la próxima frontera de la IA es la acción en el espacio físico, y que el open source juega ahí un papel central. La competencia se intensifica entre modelos cerrados y abiertos, especialmente en los benchmarks de robótica y de computer use.
La gobernanza y la seguridad de IA entran en el derecho positivo. La publicación del Frontier Governance Framework de OpenAI, alineado con la TFAIA californiana y la EU AI Act, y la de la guía de evaluaciones de terceros marcan una etapa: las grandes empresas de IA ya no definen sus reglas únicamente de forma interna. Las alinean con legislaciones concretas y publican sus metodologías de evaluación. La iniciativa Rosalind Biodefense ilustra la otra cara de esta gobernanza: poner la IA frontera al servicio de la defensa social (preparación para pandemias, bioseguridad), con controles adaptados.
La infraestructura para desarrolladores se acelera y se fragmenta. Claude Code recibe cinco versiones en cuatro días, incluido el Auto Mode en Bedrock/Vertex/Foundry y la carga automática de plugins locales. Gemini CLI v0.44.0 unifica su modo Auto y amplía las integraciones IDE. GitHub Copilot afina su taxonomía de adopción (4 fases, ventana de 28 días) para ayudar a las organizaciones a medir la madurez real de su adopción de IA. Los desarrolladores disponen ahora de una infraestructura agentiva densa y en rápida evolución: la cuestión ya no es el acceso a los modelos, sino la capacidad de los equipos para integrar estas herramientas en sus flujos de trabajo de forma coherente y medible.
Fuentes
- Anthropic — Presentación S-1 confidencial a la SEC
- NVIDIA Cosmos 3 en X
- Cosmos Coalition — Runway en X
- MiniMax M3 en X
- Luma OPAL Lab en X
- Luma OPAL Lab — @gravicle en X
- Qwen3.7-Plus — Blog de Qwen
- Qwen-VLA en X
- Rosalind Biodefense — OpenAI
- Frontier Governance Framework — OpenAI
- Evaluaciones de terceros fiables — OpenAI
- Codex Computer Use Windows — OpenAI en X
- Grok Imagine Extend en X
- Claude Code Releases
- Gemini Omni y 3.5 Flash — Blog de Google
- API de métricas de uso de Copilot — GitHub Changelog
- ElevenLabs MOU Grecia en X
- ElevenLabs Summit Varsovia en X
- Cohere Command A+ traducción en X
- Gemini CLI changelog
- Google I/O 2026 — making-of de IA
- Salesforce + Claude Code — @bcherny en X
- GitHub Copilot — modelos en evaluación en auto