OpenAI refuta una conjetura de Erdős de hace 80 años, Cohere Command A+ open-source, NVIDIA Nemotron-Labs-Diffusion

El 20 de mayo de 2026, la IA irrumpe en las matemáticas fundamentales: un modelo de OpenAI refuta una conjetura de Paul Erdős formulada en 1946, sobre una prueba de 125 páginas validada por matemáticos entre los que se encuentra el medallista Fields Tim Gowers. En cuanto a modelos, Cohere publica Command A+ en open-source Apache 2.0 (arquitectura MoE 218B/25B activos), NVIDIA lanza Nemotron-Labs-Diffusion con generación paralela de tokens, y Stability AI presenta Stable Audio 3.0 (4 modelos open weights). En herramientas, GitHub Copilot evoluciona en cuatro frentes simultáneamente, y Claude Code publica dos versiones en 24 horas.

OpenAI refuta una conjetura de Erdős de hace 80 años

20 de mayo — OpenAI ha publicado un resultado inédito: un modelo interno de razonamiento general ha resuelto el problema de las distancias unitarias planares (planar unit distance problem), una cuestión abierta desde que Paul Erdős la planteó en 1946. Este problema cuestiona el número máximo de pares de puntos a distancia exactamente 1 entre n puntos en el plano. Desde la década de 1940, la comunidad matemática pensaba que las construcciones en cuadrículas cuadradas de Erdős eran esencialmente óptimas.

El modelo produjo una prueba que muestra la existencia de una familia infinita de configuraciones que supera la cota conjeturada, con un exponente δ = 0,014 establecido por Will Sawin (Princeton). El avance se apoya en una herramienta matemática inesperada: las torres de cuerpos de clases infinitas y la teoría de Golod-Shafarevich, procedentes de la teoría algebraica de números, aplicadas a un problema de geometría euclidiana elemental. Esta conexión entre dos campos a priori distantes es, según los matemáticos implicados, el núcleo de la originalidad del resultado.

Aspecto	Detalle
Problema	Distancias unitarias planares (Erdős, 1946)
Cota anterior	Crecimiento en n^(1+C/loglog(n)) (Spencer-Szemerédi-Trotter, 1984)
Nuevo resultado	n^(1+δ), δ = 0,014
Herramienta matemática	Teoría algebraica de números (Golod-Shafarevich)
Modelo	Modelo interno de razonamiento general (sin nombre)
Longitud de la cadena de pensamiento	125 páginas
Validación	Grupo de matemáticos externos + artículo complementario

Lo que hace que el resultado sea especialmente notable: no fue producido por un sistema entrenado específicamente para matemáticas ni orientado a este problema. Es un modelo de uso general, evaluado sobre una colección de problemas de Erdős en el marco de una exploración más amplia de las capacidades de investigación autónoma.

Tim Gowers (medalla Fields) califica el resultado de “milestone in AI mathematics”. Arul Shankar (Princeton) va más allá:

“In my opinion this paper demonstrates that current AI models go beyond just helpers to human mathematicians – they are capable of having original ingenious ideas, and then carrying them out to fruition.”

🇪🇸 En mi opinión, este artículo demuestra que los modelos de IA actuales van más allá del simple papel de asistentes para los matemáticos: son capaces de tener ideas originales e ingeniosas, y de llevarlas a cabo hasta el final. — [Arul Shankar, teórico de números, Princeton]

OpenAI ve en este resultado una señal para la investigación fundamental: si un modelo puede mantener un razonamiento complejo durante 125 páginas y conectar ámbitos matemáticos distantes, esas capacidades son transferibles a la biología, la física, los materiales y la medicina.

🔗 Artículo de OpenAI

Cohere Command A+ — MoE flagship open-source

20 de mayo — Cohere lanza Command A+, su modelo más potente hasta la fecha, en open-source bajo licencia Apache 2.0. La arquitectura mixture-of-experts (sparse MoE) moviliza 218B de parámetros totales pero solo 25B activos en cada inferencia, lo que le permite ejecutarse en dos GPU NVIDIA H100 o en una sola GPU Blackwell (B200) con cuantización W4A4.

Command A+ unifica bajo un único modelo las capacidades antes repartidas entre Command A Reasoning, Command A Vision y Command A Translate. Admite 48 idiomas (frente a 23 en las versiones anteriores), con un tokenizador mejorado para idiomas no europeos (+20% para árabe, +16% para coreano, +18% para japonés).

Benchmark	Command A+	Command A Reasoning
τ²-Bench Telecom	85%	37%
Terminal-Bench Hard	25%	3%
MMMU	75,1%	N/A
MathVista	80,6%	73,5%
North Agentic QA	+20% mejora	referencia
North Data Analysis	+32% mejora	referencia

El modelo es hasta 2× más rápido y un 30% menos latente que Command A Reasoning, con un decodificado especulativo (speculative decoding) que aporta una ganancia adicional de 1,5–1,6×. Disponible en Hugging Face y mediante vLLM. La puntuación de 37 en el Artificial Analysis Intelligence Index lo convierte en el mejor entre los modelos open-source.

“Introducing: Cohere Command A+ — We’ve created our most powerful LLM yet, optimized it to run on as little hardware as possible, and released it open-source for all.”

🇪🇸 Aquí está Cohere Command A+ — hemos creado nuestro LLM más potente hasta la fecha, optimizado para funcionar con la menor cantidad de hardware posible, y lo publicamos en open-source para todos. — @cohere en X

🔗 Blog de Cohere

Gemini for Science — La IA como socia para el descubrimiento científico

20 de mayo — Anunciado durante Google I/O 2026 y tuiteado el 20 de mayo, Gemini for Science es un conjunto de herramientas experimentales para la investigación científica. Ante la explosión de datos, el objetivo es permitir a los investigadores conectar información que ningún individuo puede procesar por sí solo.

Se presentan tres herramientas experimentales:

Herramienta	Base	Función
Hypothesis Generation	Co-Scientist	Descubrimiento y refinamiento de nuevas hipótesis
Computational Discovery	AlphaEvolve + ERA	Pruebas de miles de variaciones de código en paralelo
Science Skills	30+ modelos bio	Bundle integrado en plataformas agénticas (Antigravity)

Computational Discovery es la herramienta más técnica: genera y evalúa miles de variaciones de código en paralelo, lo que permite probar nuevos enfoques de modelización en epidemiología, química o biología computacional en una fracción del tiempo habitual.

Science Skills integra datos de más de 30 modelos importantes en ciencias de la vida y bases de datos, conectándose con plataformas agénticas para automatizar flujos de trabajo manuales complejos en cuestión de minutos.

El proyecto se ha desarrollado con 100+ instituciones asociadas, desde estudiantes de doctorado hasta ganadores del Nobel.

🔗 Anuncio de @GoogleAI

NVIDIA Nemotron-Labs-Diffusion — Arquitectura de difusión de tokens

20 de mayo — NVIDIA anuncia Nemotron-Labs-Diffusion, un modelo de lenguaje que genera tokens de manera paralela mediante difusión, a diferencia de los LLM autorregresivos clásicos que producen un token a la vez. Esta arquitectura —inspirada en los modelos de difusión para la generación de imágenes— busca acelerar la inferencia sin dejar de mantener la calidad de las salidas.

El enfoque es fundamentalmente diferente del paradigma transformer estándar: en lugar de predecir secuencialmente cada token condicionado a los anteriores, el modelo itera en paralelo sobre una secuencia completa de tokens con ruido, hasta converger. Las ventajas teóricas incluyen una menor latencia en salidas largas y una mejor paralelización en GPU.

Aspecto	Clásico (autorregresivo)	Nemotron-Labs-Diffusion
Generación	Token por token, secuencial	Paralela en toda la secuencia
Latencia de salidas largas	Crece linealmente	Potencialmente reducida
Paradigma	GPT-style	Diffusion-style

El informe técnico completo acompaña el lanzamiento. Se trata de una contribución de investigación de NVIDIA Labs, posicionada como alternativa arquitectónica al modelo transformer autorregresivo dominante —un terreno de investigación activo desde la aparición de los modelos de difusión de texto como MDLM y Plaid.

🔗 Anuncio de @NVIDIAAI

Stability AI — Stable Audio 3.0 (familia open weights)

20 de mayo — Stability AI publica Stable Audio 3.0, una familia de 4 modelos de audio open weights bajo licencia comercial. La gama cubre todo el espectro de despliegue, desde dispositivos integrados hasta la API empresarial.

Modelo	Longitud máx.	Despliegue	Open weights
Small SFX	corta	on-device	Sí
Small	2 min	on-device	Sí
Medium	6:20	cloud/local	Sí
Large	6:20+	API/empresa	No

Los modelos Small SFX, Small y Medium están disponibles en Hugging Face. Todos los datos de entrenamiento cuentan con licencias completas, con asociaciones anunciadas con Universal Music Group y Warner Music Group. Las funcionalidades avanzadas incluyen compatibilidad con LoRA training para fine-tuning personalizado, y un modo de audio inpainting (edición de un solo segmento, multi-segmento, continuación causal).

“We want to foster the same kind of community-driven innovation in audio that we sparked in image generation with the launch of Stable Diffusion.”

🇪🇸 Queremos fomentar en el audio el mismo tipo de innovación impulsada por la comunidad que desencadenamos en la generación de imágenes con el lanzamiento de Stable Diffusion. — Stability AI

GitHub Copilot evoluciona en cuatro frentes

Selección automática de modelo adaptativa en VS Code

20 de mayo — La opción “Auto” de Copilot VS Code selecciona ahora el modelo óptimo según la naturaleza de la tarea: razonamiento complejo, generación de código simple, depuración u orquestación de herramientas. La selección se basa en métricas en tiempo real de disponibilidad y fiabilidad. Ventaja práctica: reducción del 10% en el multiplicador de solicitudes premium al usar Auto, sin necesidad de configuración.

🔗 Changelog de GitHub

Búsqueda semántica de issues en lenguaje natural

20 de mayo — Copilot Chat en la web integra un índice semántico de issues: un desarrollador puede buscar “los bugs de renderizado móvil reportados el mes pasado” sin conocer el título exacto, y obtener resultados agrupados por contexto. Disponible en disponibilidad general para todos los planes Copilot.

🔗 Changelog de GitHub

Retirada de los modelos Gemini de Copilot Chat web

20 de mayo — Todos los modelos Gemini se retiran de Copilot Chat en github.com, así como GPT-5.2 Codex y GPT-5.4 nano. Solo OpenAI y Claude siguen disponibles en la web. GitHub justifica la decisión por la coherencia de la calidad de las respuestas. Gemini sigue disponible en los IDE y la API.

🔗 Changelog de GitHub

Fix with Copilot — aplicación agrupada de los comentarios de code review

19 de mayo — El botón “Implement suggestion” pasa a llamarse “Fix with Copilot” con un nuevo cuadro de diálogo (elección del modelo, rama de destino, instrucciones personalizadas). Un nuevo botón “Fix batch with Copilot” permite agrupar varios comentarios de code review y confiárselos simultáneamente al Copilot cloud agent, reduciendo la fricción en las PRs con numerosos comentarios.

🔗 Changelog de GitHub

Claude Code v2.1.144 y v2.1.145

19 de mayo — Claude Code publica dos versiones en 24 horas con un conjunto considerable de nuevas funcionalidades y correcciones.

La versión 2.1.144 mejora la gestión de sesiones en segundo plano: el comando /resume muestra ahora las sesiones --bg, y las notificaciones de fin de subagente incluyen la duración (por ejemplo: “Agent completed · 3h 2m 5s”). El comando /model se aplica únicamente a la sesión actual (pulsa d para definir el valor predeterminado permanente). El cambio de nombre “extra usage” → “usage credits” aclara la terminología, y la corrección de un bloqueo de arranque de hasta 75 segundos cuando api.anthropic.com es inaccesible (VPN, cortafuegos) mejora la experiencia en entornos empresariales.

La versión 2.1.145 se distingue por la introducción de claude agents --json, un comando diseñado para la integración en scripts shell (tmux-resurrect, barras de estado, selectores de sesión). El trazado OpenTelemetry se enriquece con agent_id y parent_agent_id en los spans, lo que permite una jerarquía correcta de los subagentes. La pantalla /plugin muestra ahora el contenido completo (comandos, agentes, skills, hooks, servidores MCP/LSP) antes de la instalación. Los hooks Stop/SubagentStop reciben dos nuevos campos: background_tasks y session_crons.

🔗 CHANGELOG Claude Code

Anthropic abre la reflexión sobre la formación del carácter de la IA

19 de mayo — Anthropic ha publicado un artículo que detalla una iniciativa de diálogos periódicos con filósofos, clérigos y éticos procedentes de más de 15 tradiciones religiosas y culturales. El objetivo es enriquecer la reflexión sobre lo que significa formar el carácter de un sistema de IA, apoyándose en siglos de pensamiento acumulado sobre la virtud y la vida buena, sin alinear Claude con una tradición concreta.

Un resultado experimental merece atención: una herramienta que Claude puede invocar durante una tarea para releer sus propios compromisos éticos. Utilizada de forma espontánea antes de acciones de alto impacto, ha mostrado “una reducción notable de los comportamientos no alineados” en las evaluaciones internas. Los próximos pasos incluirán intercambios con juristas, psicólogos e instituciones cívicas.

🔗 Artículo de Anthropic

Cohere — MOUs con Indra Group y Multiverse Computing

20 de mayo — Cohere firma dos memorandos de entendimiento (MOU) durante la visita de Estado del Rey Felipe VI de España a Canadá. El primero une Cohere a IndraMind (rama de IA del grupo Indra, defensa y digitalización españoles) para construir un ecosistema de IA soberana que incluya adaptaciones lingüísticas para las cinco lenguas oficiales de España. Un apartado de defensa prevé capacidades de análisis y planificación para ejercicios multinacionales. El segundo implica a Multiverse Computing (optimización por IA de inspiración cuántica, España/Canadá) para explorar oportunidades comerciales en Europa y Canadá.

“Enterprises no longer want to rent AI — they want to own it.”

🇪🇸 Las empresas ya no quieren alquilar la IA: quieren poseerla. — Aidan Gomez, cofundador y CEO de Cohere

Perplexity — Compresión de contexto sensible a la consulta en producción

20 de mayo — Perplexity despliega en producción un sistema de compresión de contexto (query-aware context compression) que reduce los tokens de contexto hasta un 70% al tiempo que mejora la precisión de las respuestas. El principio: un modelo ligero extrae de forma quirúrgica los pasajes pertinentes a la consulta antes de enviarlos al LLM principal, eliminando anuncios, metadatos y contenidos fuera de tema.

Métrica	Valor
Reducción de tokens de contexto	hasta 70%
Ganancia de contenido vital por extracto	+63%
Reducción de la latencia de inferencia	35–40%
Reducción del cálculo GPU agregado	40–45%
Latencia de producción (p99)	< 20 ms

El backbone pplx-diffusion (17 capas, destilado desde 28 capas) predice en paralelo qué segmentos conservar sin generación de texto — un enfoque extractivo que garantiza la fidelidad de las citas. En SimpleQA, el preset “medium” con compresión alcanza un 95% de precisión con solo 200 tokens de media por documento.

🔗 Anuncio de Perplexity

ElevenLabs — Speech Engine, un agente de voz en un prompt

20 de mayo — ElevenLabs lanza Speech Engine, un pipeline de voz unificado (síntesis vocal + transcripción + orquestación) que permite a los desarrolladores transformar un agente conversacional de texto en un agente de voz completo con un solo prompt. Disponible en ElevenAPI, el precio es de 8 céntimos por minuto con descuento por volumen. Migración posible a ElevenAgents para canales de despliegue adicionales con monitoring y analytics.

🔗 Anuncio de ElevenLabs

Luma Agents integra Seedance 2.0

19 de mayo — Luma Agents integra Seedance 2.0, el modelo de generación de vídeo de ByteDance, en su plataforma de agentes creativos. El mismo workflow que los demás modelos ya integrados. Esta integración amplía la elección de modelos accesibles a través de Luma Agents, posicionando la plataforma como hub de orquestación multimodelo para vídeo IA.

🔗 Anuncio de Luma

Kling AI en Cannes — House of David, primera película de Hollywood con IA a escala industrial

20 de mayo — En el Festival de Cannes 2026, Kling AI confirma el uso industrial de su tecnología en House of David (Prime Video): 44 millones de viewers globales, top 10 de las nuevas series en Estados Unidos, número 1 en Prime Video US. Es la primera producción hollywoodiense en reconocer públicamente la integración de la generación de vídeo IA en su pipeline de producción a gran escala, con planos coherentes que cumplen con los estrictos estándares industriales.

🔗 Anuncio de Kling AI

Breves

Running Guide Agent — Google DeepMind — Agente IA personal dedicado al entrenamiento para correr, presentado como “un paso hacia una carrera sin límites”. 🔗 Blog de DeepMind
Midjourney V8.1 — flag --no reintroducido — El flag anti-prompting vuelve en V8.1 para excluir elementos de las imágenes generadas (ej.: --no people). 🔗 Anuncio de @midjourney
Anthropic /usage renovada en Claude Code — Boris Cherny confirma una renovación de la UI de /usage para visualizar mejor el consumo de tokens en respuesta a un usuario. 🔗 fuente
MiniMax Speech 2.8 Turbo — 600+ voces en Together AI — Más de 600 nuevas voces Speech 2.8 Turbo ya disponibles en la plataforma Together AI. 🔗 Anuncio de @MiniMax_AI

Qué significa esto

Investigación fundamental e IA autónoma. La resolución de la conjetura de Erdős por un modelo OpenAI de uso general no es anecdótica. Lo que sorprende a los matemáticos implicados es la naturaleza del resultado: una conexión inesperada entre dos ramas de las matemáticas (teoría algebraica de números y geometría discreta), mantenida a lo largo de 125 páginas de razonamiento coherente. Combinada con Gemini for Science (desarrollado con 100+ instituciones), la tendencia es clara: la IA empieza a integrarse no solo como herramienta de procesamiento de datos científicos, sino como socio de descubrimiento capaz de generar hipótesis originales.

Arquitecturas alternativas al paradigma autorregresivo. Dos anuncios del día cuestionan el modelo dominante GPT-style. NVIDIA Nemotron-Labs-Diffusion genera tokens en paralelo mediante difusión en lugar de secuencialmente. Stable Audio 3.0 de Stability AI demuestra que la difusión produce resultados musicales de alta calidad con modelos open weights en 4 niveles de despliegue. La convergencia de estos enfoques sugiere que la difusión ya no está confinada a la generación de imágenes — se está convirtiendo en una arquitectura competidora seria para texto y audio.

Soberanía e IA empresarial. Command A+ (MoE 218B open-source, Apache 2.0, 2× H100) y los MOUs de Cohere con Indra Group y Multiverse Computing ilustran una tendencia de fondo: las grandes organizaciones — gobiernos, defensa, sector regulado — quieren desplegar sus modelos en su propia infraestructura. La combinación de una arquitectura MoE eficiente (25B activos sobre 218B totales) y una licencia Apache 2.0 convierte a Command A+ en el modelo open-source mejor posicionado para despliegues soberanos a finales de mayo de 2026.

Presión creciente sobre las herramientas para desarrolladores. Claude Code 2.1.144 y 2.1.145, las cuatro actualizaciones simultáneas de GitHub Copilot y la compresión de contexto de Perplexity (-70% tokens, -40% GPU) son señales coherentes: la competencia se desplaza de la calidad bruta de los modelos hacia la ergonomía de las herramientas, la scriptabilidad (claude agents —json), el coste de inferencia (Auto model selection -10%, pplx-diffusion) y la robustez en producción (corrección del bloqueo VPN en Claude Code).

OpenAI refuta una conjetura de Erdős de hace 80 años, Cohere Command A+ open-source, NVIDIA Nemotron-Labs-Diffusion

OpenAI refuta una conjetura de Erdős de hace 80 años

Cohere Command A+ — MoE flagship open-source

Gemini for Science — La IA como socia para el descubrimiento científico

NVIDIA Nemotron-Labs-Diffusion — Arquitectura de difusión de tokens

Stability AI — Stable Audio 3.0 (familia open weights)

GitHub Copilot evoluciona en cuatro frentes

Selección automática de modelo adaptativa en VS Code

Búsqueda semántica de issues en lenguaje natural

Retirada de los modelos Gemini de Copilot Chat web

Fix with Copilot — aplicación agrupada de los comentarios de code review

Claude Code v2.1.144 y v2.1.145

Anthropic abre la reflexión sobre la formación del carácter de la IA

Cohere — MOUs con Indra Group y Multiverse Computing

Perplexity — Compresión de contexto sensible a la consulta en producción

ElevenLabs — Speech Engine, un agente de voz en un prompt

Luma Agents integra Seedance 2.0

Kling AI en Cannes — House of David, primera película de Hollywood con IA a escala industrial

Breves

Qué significa esto

Fuentes

Tabla de contenidos