Buscar

AlphaProof Nexus resuelve 9 problemas abiertos, Claude Code Auto Mode en Pro, Copilot Eclipse de código abierto

AlphaProof Nexus resuelve 9 problemas abiertos, Claude Code Auto Mode en Pro, Copilot Eclipse de código abierto

ai-powered-markdown-translator

Artículo traducido del fr al es con gpt-5.4-mini.

Ver proyecto en GitHub ↗

Esta semana, Google DeepMind da un paso importante en la investigación matemática con AlphaProof Nexus, un agente capaz de resolver problemas abiertos desde hace varias décadas. Por el lado de Anthropic, el modo auto de Claude Code se abre al plan Pro e integra Sonnet 4.6. GitHub hace open source el plugin Copilot para Eclipse, y Alibaba activa el caché implícito en Qwen3.7-Max.


AlphaProof Nexus — Un agente de IA resuelve problemas matemáticos abiertos desde hace décadas

25 de mayo de 2026 — Google DeepMind ha anunciado AlphaProof Nexus, un marco agentivo (agentic framework) de investigación de pruebas formales impulsado por Gemini, acompañado de un artículo enviado a arXiv el 21 de mayo (arXiv:2605.22763).

El agente se basa en un bucle que alterna generación mediante Gemini y verificación formal mediante el lenguaje de pruebas Lean. Esta combinación garantiza el rigor matemático de las pruebas producidas: el LLM propone, Lean valida o rechaza, y el agente itera.

Resultados publicados:

ÁmbitoResultadosContexto
Problemas abiertos de Erdős9 resueltos sobre 353 evaluadosDe los cuales 2 abiertos desde hace 56 años
Conjeturas OEIS44 resueltas sobre 492Online Encyclopedia of Integer Sequences
Geometría algebraica1 problema abierto resueltoAbierto desde hace 15 años
Optimización min-max1 cuestión abierta resueltaAbierta desde hace 7 años

El coste por problema resuelto es de unos cientos de dólares — un orden de magnitud que ilustra la eficiencia económica del enfoque agentivo para la investigación matemática formal.

AlphaProof Nexus ya está desplegado en colaboración con matemáticos en varios ámbitos: combinatoria, teoría de grafos, geometría algebraica y óptica cuántica. Este trabajo se inscribe en la continuidad de AlphaProof (2024), que apuntaba a problemas de nivel olímpico. AlphaProof Nexus apunta a problemas abiertos de investigación, marcando un paso hacia el uso de la IA como herramienta de descubrimiento matemático autónomo.

“AI agents are advancing research-level math.”

🇪🇸 Los agentes de IA están haciendo avanzar las matemáticas a nivel de investigación.Pushmeet Kohli, VP Research, Google DeepMind en X

🔗 Artículo arXiv 2605.22763


Claude Code v2.1.149 — Desglose /usage por categoría y 25+ correcciones

23 de mayo de 2026 — Se ha publicado la versión 2.1.149 de Claude Code, concretando la funcionalidad /usage breakdown por categoría anunciada por Boris Cherny la semana anterior.

FuncionalidadDetalle
/usage breakdownDetalle de consumo por categoría: skills, subagentes, plugins, servidor MCP
/diff navigationNavegación por teclado: flechas, j/k, PgUp/PgDn, Home/End
GFM task listsCasillas Markdown ([ ] / [x]) mostradas correctamente
EnterpriseNuevo parámetro gestionado allowAllClaudeAIMcps para managed-mcp.json

La release corrige también una veintena de bugs: eludir permisos de PowerShell en cd, agotamiento de la tabla vnode en macOS con find, congelación del diálogo managed-settings, cambios fantasma en /config, crash de /insights en campos opcionales ausentes, y el spinner de reflexión que permanece ámbar entre llamadas a herramientas.

La versión 2.1.150, publicada el mismo día, solo aporta mejoras internas de infraestructura sin cambios visibles.

🔗 Changelog de Claude Code


Claude Code Auto Mode — Disponible en Pro, Sonnet 4.6 integrado

23 de mayo de 2026 — Anthropic anuncia dos ampliaciones del modo auto de Claude Code :

“Two updates to auto mode: · Now available on the Pro plan · Sonnet 4.6 is now supported, alongside Opus 4.7. Shift+tab, and let Claude run.”

🇪🇸 Dos actualizaciones del modo auto: ahora disponible en el plan Pro; Sonnet 4.6 es compatible, junto con Opus 4.7. Pulsa Mayús+Tab y deja que Claude trabaje.@ClaudeDevs en X

El modo auto, activado mediante Shift+Tab, permite a Claude ejecutar acciones de forma autónoma sin validación manual en cada paso. Hasta ahora reservado a los planes superiores, ahora es accesible para los suscriptores Pro. La incorporación de Sonnet 4.6 ofrece una opción más económica que Opus 4.7 para sesiones largas, reduciendo el consumo de créditos en modo autónomo.

Para acceder a estos cambios: claude update o actualización de la aplicación de escritorio Claude. El anuncio generó 1,18 millones de visualizaciones en X.


GitHub Copilot for Eclipse — Open source bajo licencia MIT

21 de mayo de 2026 — GitHub ha hecho open source el plugin GitHub Copilot para Eclipse, disponible en GitHub bajo licencia MIT en la dirección github.com/microsoft/copilot-for-eclipse.

Todo el conjunto de funcionalidades está expuesto para contribuciones de la comunidad:

FuncionalidadEstado
Code completion (completions en línea)Open source
Next Edit Suggestions (NES)Open source
Chat (flujo de conversación, llamadas a herramientas)Open source
Agent mode (workflows agentivos multistep)Open source
Skills y prompt filesOpen source
BYOK (Bring Your Own Key)Open source
Agentes personalizados, subagentes, plan agent, MCPOpen source

La motivación es la transparencia y la innovación comunitaria en el espíritu del ecosistema abierto de Eclipse. Ya se han recibido contribuciones de la comunidad desde la apertura.

🔗 Anuncio de GitHub Changelog


Qwen3.7-Max — Caché implícito activado en producción

25 de mayo de 2026 — Alibaba activa el caché implícito (implicit caching) en Qwen3.7-Max, su modelo estrella orientado a agentes.

El caché se activa automáticamente para todas las solicitudes API — no se requiere ninguna modificación de código. Los desarrolladores se benefician de inmediato de solicitudes más rápidas y menos costosas en contextos repetitivos. Para tasas de caché más altas y deterministas, Alibaba recomienda el caché explícito, documentado en Alibaba Cloud.

🔗 Tweet @Alibaba_Qwen


Breves

  • MiniMax Hailuo AI en el AIFF de Hong Kong (HKUST) — El 2.º AI Film Festival organizado por la HKUST recibió 1.300 candidaturas de 80 países. Hailuo AI estuvo representado allí junto a Tencent y Z.ai durante una mesa redonda sobre la democratización del cine con IA. 🔗 minimax.io

  • NVIDIA DGX Spark — 16 agentes de IA locales simultáneos — Demostración comunitaria retuiteada por @NVIDIAAI: 2x DGX Spark (GB10) + MiniMax M2.7 NVFP4 hacen funcionar 16 agentes de IA en streaming simultáneo, sin APIs cloud. 🔗 @NVIDIAAI en X


Qué significa esto

Un punto de inflexión para la investigación matemática formal. AlphaProof Nexus marca una ruptura: la IA ya no se limita a problemas de concursos o a benchmarks académicos, sino que aborda problemas abiertos que los matemáticos no han logrado resolver desde hace décadas. La combinación Gemini + Lean crea un bucle de verificación formal que garantiza que las pruebas sean correctas, no solo plausibles. El coste de unos cientos de dólares por problema resuelto sugiere que este enfoque se está volviendo accesible para laboratorios de investigación, no solo para los gigantes del sector.

La madurez de la herramienta agentiva por parte de Anthropic. La llegada del modo auto al plan Pro y la integración de Sonnet 4.6 señalan que Anthropic considera el uso agentivo autónomo lo suficientemente estable para el gran público. La versión 2.1.149, con su breakdown /usage por categoría, responde a una necesidad concreta de los desarrolladores que construyen sistemas multiagente complejos: comprender con precisión qué consume su cuota para optimizar sus arquitecturas.

Apertura frente a soberanía del software. El open source de Copilot para Eclipse bajo MIT y la activación del caché implícito en Qwen3.7-Max ilustran dos estrategias distintas para conquistar a los desarrolladores. GitHub apuesta por la transparencia y el ecosistema Eclipse para ampliar la adopción de Copilot en los entornos Java empresariales. Alibaba apuesta por la reducción automática de costes sin fricción para hacer Qwen3.7-Max más competitivo frente a las alternativas cloud.

La industrialización de los medios generativos avanza. La participación de MiniMax en el AIFF de Hong Kong — 1.300 candidaturas de 80 países — y la demostración de NVIDIA de 16 agentes locales simultáneos en DGX Spark dibujan un ecosistema en el que la creación de vídeo mediante IA penetra en los flujos de trabajo profesionales del cine, tanto en festivales como en infraestructura local.


Fuentes