Buscar

Anthropic revela la auto-mejora recursiva de la IA, NVIDIA Nemotron 3 Ultra open-source, Suno recauda 400M USD

Anthropic revela la auto-mejora recursiva de la IA, NVIDIA Nemotron 3 Ultra open-source, Suno recauda 400M USD

ai-powered-markdown-translator

Artículo traducido del fr al es con gpt-5.4-mini.

Ver proyecto en GitHub ↗

El 4 de junio de 2026 arranca con una publicación histórica del Anthropic Institute: la IA ya está acelerando su propio desarrollo, con más del 80 % del código de Anthropic escrito por Claude y una ganancia de productividad ×8. NVIDIA entrega al mismo tiempo Nemotron 3 Ultra, un modelo MoE de 550 mil millones de parámetros completamente open-source para agentes. OpenAI despliega Dreaming v3, una nueva arquitectura de memoria para ChatGPT 5× menos costosa. GitHub Copilot supera la barrera de un millón de tokens de contexto. Y Suno anuncia una ronda de financiación Serie D de $400 millones, llevando su valoración a $5,4 mil millones.


Anthropic Institute — “When AI builds itself”: la auto-mejora recursiva documentada

4 de junio — The Anthropic Institute publica “When AI builds itself”, la primera documentación oficial, respaldada por cifras internas, del avance hacia una posible auto-mejora recursiva de la IA. Los coautores Marina Favaro y Jack Clark presentan datos internos de mayo de 2026 que muestran que Claude escribe ahora la mayor parte del código de Anthropic.

IndicadorValor (mayo de 2026)
Parte del código de Anthropic escrito por Claude>80% de las líneas fusionadas en producción
Ganancia de productividad código/ingeniero×8 en Q2 2026 vs 2024
Tasa de éxito en tareas abiertas76% (+50 puntos en 6 meses)
Speedup de optimización de código (Mythos Preview)~52× vs ~3× para Opus 4 (mayo de 2025)
Decisiones de investigación mejores que las humanas64% (Mythos Preview vs 51% para Opus 4.5 en nov. 2025)
Encuesta interna — ganancia de productividad estimada×4 con Mythos Preview (130 empleados, marzo de 2026)

El avance de la duración de la tarea autónoma es particularmente notable: Claude Opus 3 manejaba tareas de unos 4 minutos en marzo de 2024, Claude Sonnet 3.7 alcanzaba 1h30 en marzo de 2025, Claude Opus 4.6 opera durante 12 horas en marzo de 2026, y Mythos Preview supera las 16 horas (límite de medición del benchmark METR) en mayo de 2026. La duración se duplica aproximadamente cada 4 meses.

Un resultado concreto: en abril de 2026, agentes Claude resolvieron un problema abierto de seguridad de IA de principio a fin —hipótesis, pruebas, iteraciones— y recuperaron el 97% de la mejora de rendimiento, frente al 23% de dos investigadores humanos durante una semana, por un coste de unos $18 000 de cómputo sobre 800 horas acumuladas.

El artículo explora tres escenarios: un estancamiento (considerado el menos probable), una automatización sustancial con dirección humana estratégica, y la auto-mejora recursiva completa en la que los modelos construyen a sus sucesores sin intervención humana. El artículo concluye con un llamamiento explícito a una pausa coordinada y verificable del desarrollo de IA frontier, condicionada a la participación de los demás laboratorios principales.

“Our internal data shows Claude is accelerating AI development—a possible path to recursive self-improvement, or AI autonomously building a more capable successor. It’s happening faster than we thought, and the implications deserve greater attention.”

🇪🇸 Nuestros datos internos muestran que Claude acelera el desarrollo de la IA — una posible vía hacia la auto-mejora recursiva, o la IA construyendo de forma autónoma un sucesor más capaz. Esto ocurre más rápido de lo previsto, y las implicaciones merecen una atención mayor.@AnthropicAI

🔗 Artículo de Anthropic Institute


NVIDIA Nemotron 3 Ultra — 550B MoE open-source para agentes de larga duración

4 de junio — NVIDIA entrega Nemotron 3 Ultra, un modelo frontier open-source de 550 mil millones de parámetros diseñado específicamente para agentes de IA de larga duración (long-running agents). Este lanzamiento es la materialización efectiva de los pesos open-source — tras el anuncio inicial durante Microsoft Build el 2 de junio, los pesos ya están disponibles en HuggingFace y a través de Ollama Cloud.

CaracterísticaValor
ArquitecturaHíbrida Mamba-Transformer MoE
Parámetros totales550 mil millones
Parámetros activos55 mil millones (NVFP4)
Velocidad de inferencia5× más rápida que los modelos frontier open-source comparables
Reducción de coste agentico-30%
Pesos en HuggingFacenvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4
Acceso cloudOllama Cloud
Harnesses de agentes compatiblesOpenClaw, Hermes Agent (NousResearch), LangChain

La arquitectura híbrida Mamba-Transformer MoE permite realizar más ciclos de razonamiento dentro del mismo presupuesto de tiempo — eso es lo que explica la ganancia de velocidad. Nemotron 3 Ultra está posentrenado para tareas complejas: coding avanzado, investigación profunda, planificación, uso de herramientas y recuperación tras fallos.

NVIDIA publica también los datos sintéticos y las recetas de posentrenamiento, lo que permite a equipos externos reproducir o refinar el proceso.

“Today we’re shipping Nemotron 3 Ultra. A 550B MoE frontier-intelligence open model built for long-running agents. It delivers 5x faster inference and lowers the cost of complex agentic tasks by up to 30% versus other open frontier models.”

🇪🇸 Hoy entregamos Nemotron 3 Ultra. Un modelo MoE open-source de nivel frontier con 550 mil millones de parámetros, diseñado para agentes de larga duración. Ofrece una inferencia 5× más rápida y reduce el coste de las tareas agenticas complejas en un 30% respecto a otros modelos frontier open-source.@NVIDIAAI

🔗 HuggingFace — Nemotron 3 Ultra


Dreaming v3 — una nueva arquitectura de memoria para ChatGPT

4 de junio — OpenAI despliega Dreaming v3, una arquitectura de memoria autónoma completamente rediseñada para ChatGPT. El sistema resuelve las tres limitaciones del mecanismo anterior: la frescura de la información, su corrección con el paso del tiempo y el escalado hacia los usuarios Free.

ObjetivoDescripción
Continuidad contextualMemorizar la información una vez, reutilizarla en futuras conversaciones
Respeto de las preferenciasAplicar las restricciones personales (régimen alimenticio, zona horaria, etc.)
Actualización temporalRevisar automáticamente las memorias — después de un viaje, la IA sabe que has vuelto

La historia del sistema: las saved memories llegaron en abril de 2024 (declaración manual), luego “Dreaming v0” en abril de 2025 (síntesis automática en segundo plano). La versión 3 es arquitectónicamente autónoma, ~5× menos costosa de servir — es esta reducción de coste la que hizo posible la expansión a usuarios Free.

Disponibilidad: hoy para los suscriptores Plus y Pro en Estados Unidos; expansión prevista a otros países y a los usuarios Free y Go en las próximas semanas.

Una página “Memory Summary” permite consultar un resumen legible de lo que ChatGPT sabe del usuario, añadir o corregir información y definir reglas sobre los temas a tratar.

🔗 openai.com — Dreaming


Suno Serie D — $400 millones con una valoración de $5,4 mil millones

3 de junio — Suno anuncia una ronda de financiación Serie D de $400 millones, llevando la valoración de la plataforma de música generativa a $5,4 mil millones. La ronda está liderada por Bond Capital, con la participación de nuevos inversores (IVP, USV — Union Square Ventures, Forerunner Ventures) y el respaldo renovado de Matrix VC, Lightspeed y Menlo Ventures.

La trayectoria de valoración es notable: $125 millones recaudados en mayo de 2024, luego $250 millones en noviembre de 2025 con una valoración de $2,45 mil millones, y ahora $5,4 mil millones — más del doble en siete meses.

Suno se afirma como una de las plataformas creativas de IA mejor financiadas del mundo, con una misión que se mantiene constante: permitir que más personas experimenten la alegría de crear música, sin limitaciones técnicas.

“We’re thrilled to announce Suno’s next chapter: a $400M Series D at a $5.4B valuation!”

🇪🇸 ¡Estamos encantados de anunciar el próximo capítulo de Suno: una Serie D de $400 millones con una valoración de $5,4 mil millones!@suno

🔗 Blog de Suno — The Next Chapter


GitHub Copilot — ventana de contexto de 1M tokens y razonamiento configurable

4 de junio — GitHub Copilot incorpora dos nuevas capacidades importantes disponibles desde hoy en VS Code, Copilot CLI y la aplicación GitHub Copilot.

CapacidadDisponibilidadImpacto créditos IA
Ventana de contexto 1M tokensVS Code, Copilot CLI, app CopilotMás alto
Niveles de razonamiento configurablesVS Code, Copilot CLI, app CopilotMás alto

La ventana de contexto de un millón de tokens permite trabajar sobre bases de código más grandes, documentos más largos y proyectos multiarchivo complejos sin perder el hilo. Hasta ahora, los límites de contexto obligaban a los desarrolladores a fragmentar su trabajo o a simplificar sus solicitudes en proyectos complejos.

Los niveles de razonamiento configurables permiten calibrar el equilibrio velocidad/profundidad y activar la “pensée étendue” (extended thinking) para los desafíos arquitectónicos y de depuración más complejos. GitHub recomienda reservar los parámetros máximos para problemas complejos multiarchivo — el uso de contexto extendido o de razonamiento superior consume más créditos IA por interacción.

La expansión a otras superficies de Copilot está prevista en las próximas semanas.

🔗 GitHub Changelog — Larger context windows


GitHub Copilot — actualizaciones del 4 de junio

Copilot in Visual Studio — Actualización de mayo de 2026

4 de junio — La actualización de mayo de 2026 para Copilot en Visual Studio 2026 refuerza la planificación y la revisión colaborativa.

  • Agent Plan: explora el repositorio en solo lectura, hace preguntas de aclaración y genera un plan detallado guardado en .copilot/plans/plan-{titre}.md. Un botón “Implement plan” cambia al modo agente.
  • Panel Skills: lista todas las habilidades de agentes detectadas desde el espacio de trabajo y el perfil de usuario, con búsqueda por nombre o palabra clave.
  • Diff resumido multiarchivo: tras modificaciones de Copilot en varios archivos, una vista “change summary” para aceptar o deshacer los cambios a nivel global, por archivo o por bloque.
  • Indicador de uso de la ventana de contexto: icono en la parte superior del cuadro de entrada con la opción “Summarize conversation” para liberar espacio.
  • Añadir commits en contexto: clic derecho sobre un commit en Git History para adjuntarlo como contexto en Copilot Chat.

🔗 GitHub Changelog — Visual Studio May update


Copilot Chat en github.com — contexto de PR enriquecido (disponibilidad general)

4 de junio — Copilot Chat pasa de la vista previa pública a la disponibilidad general para todos los titulares de una licencia Copilot, con capacidades enriquecidas al trabajar sobre diffs y pull requests en github.com.

  • Código y chat lado a lado: consulta de la conversación justo al lado del código, comentarios y cambios en línea sin alternar entre la PR y la ventana de chat.
  • Contexto cargado automáticamente: cuando una pregunta trata sobre un diff o una PR, el contexto pertinente se inyecta automáticamente — ya no hace falta copiar y pegar fragmentos.
  • Acceso: botón “Ask about this diff” en la parte superior de cada diff, o mediante el menú desplegable al resaltar una línea de código.

🔗 GitHub Changelog — Copilot Chat PR context


Claude Code v2.1.162

3 de junio — La versión v2.1.162 de Claude Code aporta varias mejoras de UX y correcciones importantes de agentes.

FuncionalidadDescripción
claude agents --json + waitingForEl JSON incluye ahora el motivo de bloqueo de una sesión pendiente (ej.: prompt de permiso)
Persistencia de /effort confirmadaConfirmación explícita cuando el nivel elegido pasa a ser el predeterminado para las nuevas sesiones
Autocomplete slash commandUn clic rellena la orden en el prompt sin ejecutarla — Enter para confirmar
Remote Control footer pillRemote Control se muestra como pill persistente en la parte inferior con enlace a la sesión
Renombrado Windsurf → Devin DesktopActualizado en /ide, /terminal-setup, /scroll-speed

Entre las correcciones: bloqueo silencioso al iniciar si el directorio de configuración es de solo lectura (Claude Code ahora arranca con una configuración en memoria), reglas WebFetch no aplicadas sobre los dominios preaprobados, permisos de Windows con backslashes y varias correcciones de agentes (imágenes con Ctrl+V, sesiones perdidas durante el backgrounding, anchura del terminal en sesiones largas).

🔗 Releases Claude Code v2.1.162


ElevenLabs — Flows Agent y asociación con Hasbro

Flows Agent en ElevenCreative

4 de junio — ElevenLabs lanza Flows Agent en su interfaz ElevenCreative. El usuario describe lo que quiere crear y el agente construye automáticamente el pipeline completo — conectando más de 50 modelos de imagen y vídeo con las herramientas de voz, música y efectos sonoros disponibles en la plataforma, todo en un único canvas unificado.

Un modo “assist” permite al agente solicitar validación antes de cada operación de pago para mantener el control de costes. Así, los equipos de marketing pueden encadenar modalidades y probar variantes creativas a través de distintos productos, idiomas y formatos sin configurar manualmente cada paso.

🔗 ElevenLabs Flows


ElevenLabs × Hasbro — voces de personajes bajo licencia en el Iconic Marketplace

3 de junio — ElevenLabs se asocia con Hasbro para ofrecer voces oficiales de personajes (My Little Pony, Transformers, G.I. Joe) a través del Iconic Marketplace. Las voces se construyen en colaboración con Hasbro y los talentos vocales originales, con derechos de uso claramente definidos para desarrolladores, empresas y creadores de aplicaciones. La oferta busca combinar creatividad de IA y protección de los derechos de propiedad intelectual de las marcas.

🔗 Tweet ElevenLabs × Hasbro


GPT-Rosalind — nuevas capacidades para las ciencias de la vida

3 de junio — OpenAI anuncia una actualización importante de GPT-Rosalind, su modelo especializado para la investigación en ciencias de la vida a escala enterprise. El modelo combina las capacidades agenticas de GPT-5.5 con una inteligencia reforzada en química medicinal y genómica.

BenchmarkDominioPuntuación GPT-RosalindPuntuación GPT-5.5Reducción de tokens
LifeSciBenchCiencias de la vida (6 dominios)Mejor
MedChemBenchQuímica medicinal27,5%25,1%-7,2%
GeneBenchGenómica21,6%20,4%-31%
LabWorkBenchProtocolos wet lab63,2%55,8%-5,3%

Dos nuevos plugins ya están accesibles para todos los usuarios de Codex: Life Sciences Research plugin (recuperación de evidencias con fuentes) y Life Sciences NGS Analysis plugin (workflows bioinformáticos scRNA-seq, bulk RNA-seq). Novo Nordisk es el primer socio anunciado. El acceso se amplía globalmente a organizaciones cualificadas (investigación científica legítima, gobernanza sólida).

🔗 openai.com — GPT-Rosalind


Perplexity lanza el Main Street AI Accelerator con la SBA estadounidense

4 de junio — Perplexity lanza el Main Street AI Accelerator en colaboración con la U.S. Small Business Administration (SBA). El programa pone a disposición $25 millones en créditos de Perplexity Computer: $250 en créditos para hasta 100 000 empresas elegibles, en referencia al 250.º aniversario de Estados Unidos.

Son elegibles las empresas beneficiarias de los préstamos 7(a), 504 y micropréstamos de la SBA. Las solicitudes aún no están abiertas; hay una lista de espera disponible en la página dedicada. La iniciativa se enmarca en la estrategia de Perplexity de विस्तार Computer al tejido económico local estadounidense, tras haber anunciado la semana anterior las 400+ integraciones enterprise de Computer (Intuit QuickBooks, Vercel, Shopify, Canva).

🔗 Main Street AI Accelerator


Cohere gana el 1er premio del desafío de la OTAN sobre IA agéntica

4 de junio — Cohere gana el primer lugar del concurso NATO Agentic AI for Cognitive Warfare Innovation Challenge. El podio completo:

  1. Cohere (1.er lugar)
  2. OpenMinds (2.º lugar)
  3. Ipsos & Thoughtworks (3.er lugar, ex aequo)

La competencia pone de relieve el papel creciente de la IA agéntica para ayudar a las naciones democráticas a comprender, anticipar y responder a las amenazas informativas. Para Cohere, este reconocimiento de la OTAN confirma su posicionamiento en IA soberana para el sector de defensa y gobierno — un eje principal desde su fusión transatlántica con Aleph Alpha en abril de 2026.

🔗 Cohere — Desafío de la OTAN


Pika — Group Chat con agente IA en iOS

4 de junio — Pika lanza el primer Group Chat integrado con un agente IA en su aplicación. Los usuarios invitan a sus contactos a un chat grupal donde el Pika Agent participa en la conversación creativa — ayuda para configurar un teléfono, crear memes en grupo, colaborar en formatos de vídeo cortos. Disponible desde ahora en iOS vía https://pika.me.

🔗 Tweet de Pika


Breves

  • Artículo de Anthropic — analítica de autoservicio con Claude — El equipo de Anthropic publica sus buenas prácticas para construir agentes de análisis de datos de autoservicio con Claude: competencias (skills), fundamentos de datos y evaluaciones. 🔗 Blog de Claude

  • Google Antigravity v2.0.11 — Parche de estabilidad para el IDE impulsado por Gemini: dos correcciones (bloqueos al inicio y botón “Open IDE”), ninguna nueva funcionalidad. 🔗 Changelog de Antigravity

  • GitHub Enterprise Teams GA — Enterprise Teams pasa a disponibilidad general en GitHub Enterprise Cloud: grupos definidos una sola vez a nivel de empresa, asignables a todas las organizaciones, con SCIM, GitHub Apps y auditoría completa. Hasta 2 500 equipos y 5 000 miembros por equipo. 🔗 Changelog de GitHub

  • Genspark — socio de lanzamiento de Agent365 en Microsoft Build — El cofundador Ray Zhong intervino en el escenario de Microsoft Build como socio estratégico global y socio de lanzamiento de Agent365, integrando la IA agéntica en la infraestructura enterprise existente de Microsoft. 🔗 Tweet de Genspark

  • Cohere respalda la estrategia nacional de IA de Canadá — El CEO Aidan Gomez reafirma el arraigo canadiense de Cohere, elogiando la nueva estrategia nacional de IA de Canadá como un paso importante hacia la soberanía tecnológica y la construcción de la IA de próxima generación en el país. 🔗 Tweet de Cohere


Qué significa esto

La auto-mejora de la IA pasa del escenario teórico a los datos internos medidos. La publicación del Anthropic Institute no es una especulación — es un informe de campo con cifras precisas: >80% del código, ×8 de productividad, 76% de tasa de éxito en tareas abiertas. La duración de la tarea autónoma que se duplica cada 4 meses es la señal más concreta de la dinámica en curso. Lo que se debatía en los círculos de seguridad de la IA como un riesgo futuro ahora está documentado como una realidad presente. El llamamiento a una pausa coordinada — con Anthropic como primer solicitante — ilustra la tensión entre la competencia comercial y la prudencia regulatoria.

El open-source de nivel frontier cambia de dimensión. Nemotron 3 Ultra con 550 mil millones de parámetros — completamente open-source, pesos descargables, datos sintéticos y recetas publicadas — redefine lo que significa “open-source” para los modelos frontier. La velocidad de inferencia 5× superior y la reducción de coste del 30% para las tareas agénticas no son marginales: hacen viable la ejecución de agentes complejos fuera de las grandes clouds propietarias. Para los equipos que construyen agentes autónomos, se trata de una nueva infraestructura que se está instalando.

La herramienta para desarrolladores se consolida en torno al agente de larga duración. GitHub Copilot con 1M tokens de contexto, Claude Code v2.1.162 con waitingFor en el JSON agents, Flows Agent de ElevenLabs que construye pipelines multimodales — estos tres anuncios comparten el mismo paradigma: el agente debe gestionar contextos largos, comunicar su estado a otros sistemas y orquestar varias herramientas sin intervención humana. El “razonamiento configurable” de Copilot y el /effort persistente de Claude Code responden a la misma pregunta: ¿cómo puede el usuario calibrar la profundidad de reflexión según la complejidad de la tarea?

La economía de la IA creativa alcanza un umbral simbólico. La valoración de Suno en $5,4 mil millones en siete meses — con un doble de valor — señala que los inversores apuestan por una plataforma de creación musical generativa a escala de gran público. Combinado con las recientes rondas en vídeo (Runway, Pika), el sector de la creación con IA dispone ahora de una capitalización comparable a la de los grandes editores tradicionales de software creativo. La entrada de Hasbro en el Iconic Marketplace de ElevenLabs ilustra cómo los titulares de derechos de propiedad intelectual se adaptan: en lugar de bloquear la IA, la monetizan bajo licencia.


Fuentes