Căutare

AlphaProof Nexus rezolvă 9 probleme deschise, Claude Code Auto Mode pe Pro, Copilot Eclipse open source

AlphaProof Nexus rezolvă 9 probleme deschise, Claude Code Auto Mode pe Pro, Copilot Eclipse open source

Această săptămână, Google DeepMind face un pas important în cercetarea matematică cu AlphaProof Nexus, un agent capabil să rezolve probleme deschise de câteva decenii. Din partea Anthropic, modul auto al Claude Code se deschide către planul Pro și integrează Sonnet 4.6. GitHub open source pluginul Copilot pentru Eclipse, iar Alibaba activează cache-ul implicit pe Qwen3.7-Max.


AlphaProof Nexus — Un agent IA rezolvă probleme matematice deschise de zeci de ani

25 mai 2026 — Google DeepMind a anunțat AlphaProof Nexus, un cadru agentic (agentic framework) pentru cercetarea demonstrațiilor formale alimentat de Gemini, însoțit de un articol trimis pe arXiv pe 21 mai (arXiv:2605.22763).

Agentul se bazează pe o buclă care alternează generarea prin Gemini și verificarea formală prin limbajul de demonstrație Lean. Această combinație garantează rigoarea matematică a demonstrațiilor produse: LLM-ul propune, Lean validează sau respinge, iar agentul iterează.

Rezultate publicate:

DomeniuRezultateContext
Probleme deschise ale lui Erdős9 rezolvate din 353 evaluateDintre care 2 sunt deschise de 56 de ani
Conjecturi OEIS44 rezolvate din 492Online Encyclopedia of Integer Sequences
Geometrie algebrică1 problemă deschisă rezolvatăDeschisă de 15 ani
Optimizare min-max1 întrebare deschisă rezolvatăDeschisă de 7 ani

Costul pe problemă rezolvată este de câteva sute de dolari — un ordin de mărime care ilustrează eficiența economică a abordării agentice pentru cercetarea matematică formală.

AlphaProof Nexus este deja implementat în colaborare cu matematicieni în mai multe domenii: combinatorică, teoria grafurilor, geometrie algebrică și optică cuantică. Această muncă se înscrie în continuitatea AlphaProof (2024), care viza probleme de nivel olimpiadă. AlphaProof Nexus vizează probleme deschise de cercetare, marcând un pas către utilizarea IA ca instrument autonom de descoperire matematică.

“AI agents are advancing research-level math.”

🇷🇴 Agenții IA duc mai departe matematica la nivelul cercetării.Pushmeet Kohli, VP Research, Google DeepMind pe X

🔗 Articol arXiv 2605.22763


Claude Code v2.1.149 — Detaliu /usage pe categorie și 25+ corecții

23 mai 2026 — Versiunea 2.1.149 a Claude Code a fost publicată, concretizând funcționalitatea /usage breakdown pe categorie anunțată de Boris Cherny săptămâna precedentă.

FuncționalitateDetaliu
/usage breakdownDefalcare a consumului pe categorie: skills, subagenți, pluginuri, server MCP
/diff navigareNavigare cu tastatura: săgeți, j/k, PgUp/PgDn, Home/End
Liste de sarcini GFMCasete de bifare Markdown ([ ] / [x]) afișate corect
EnterpriseNou parametru gestionat allowAllClaudeAIMcps pentru managed-mcp.json

Release-ul corectează, de asemenea, aproximativ douăzeci de bug-uri: ocolirea permisiunilor PowerShell în cd, epuizarea tabelei vnode pe macOS cu find, blocarea dialogului managed-settings, modificări fantomă în /config, crash-ul /insights pe câmpuri opționale lipsă și spinnerul de reflecție rămas chihlimbariu între apelurile de instrumente.

Versiunea 2.1.150, publicată în aceeași zi, nu aduce decât îmbunătățiri interne de infrastructură, fără schimbări vizibile.

🔗 Jurnal de modificări Claude Code


Claude Code Auto Mode — Disponibil pe Pro, Sonnet 4.6 integrat

23 mai 2026 — Anthropic anunță două extinderi ale modului auto al Claude Code :

“Two updates to auto mode: · Now available on the Pro plan · Sonnet 4.6 is now supported, alongside Opus 4.7. Shift+tab, and let Claude run.”

🇷🇴 Două actualizări ale modului auto: acum disponibil pe planul Pro; Sonnet 4.6 este suportat, alături de Opus 4.7. Shift+tab, și lăsați-l pe Claude să lucreze.@ClaudeDevs pe X

Modul auto, activat prin Shift+Tab, îi permite lui Claude să execute acțiuni în mod autonom fără validare manuală la fiecare pas. Până acum rezervat planurilor superioare, este acum accesibil abonaților Pro. Adăugarea Sonnet 4.6 oferă o opțiune mai economică decât Opus 4.7 pentru sesiunile lungi, reducând consumul de credite în modul autonom.

Pentru a accesa aceste schimbări: claude update sau actualizarea aplicației desktop Claude. Anunțul a generat 1,18 milioane de vizualizări pe X.


GitHub Copilot for Eclipse — Open source sub licența MIT

21 mai 2026 — GitHub a făcut open source pluginul GitHub Copilot pentru Eclipse, disponibil pe GitHub sub licența MIT la adresa github.com/microsoft/copilot-for-eclipse.

Întregul set de funcționalități este expus pentru contribuții comunitare:

FuncționalitateStare
Code completion (completări în linie)Open source
Next Edit Suggestions (NES)Open source
Chat (flux de conversație, apeluri de instrumente)Open source
Agent mode (workflow-uri agentice multi-step)Open source
Skills și prompt filesOpen source
BYOK (Bring Your Own Key)Open source
Agenți personalizați, subagenți, plan agent, MCPOpen source

Motivația este transparența și inovația comunitară în spiritul ecosistemului deschis al Eclipse. Au fost deja primite contribuții din partea comunității încă de la deschidere.

🔗 Anunț în GitHub Changelog


Qwen3.7-Max — Cache implicit activat în producție

25 mai 2026 — Alibaba activează cache-ul implicit (implicit caching) pe Qwen3.7-Max, modelul său emblematic orientat către agenți.

Cache-ul se activează automat pentru toate cererile API — nu este necesară nicio modificare de cod. Dezvoltatorii beneficiază imediat de cereri mai rapide și mai puțin costisitoare pe contexte repetitive. Pentru rate de cache mai ridicate și deterministe, Alibaba recomandă cache-ul explicit, documentat pe Alibaba Cloud.

🔗 Tweet despre Qwen3.7-Max implicit caching


Scurt

  • MiniMax Hailuo AI la AIFF Hong Kong (HKUST) — Cea de-a 2-a ediție a AI Film Festival organizat de HKUST a primit 1 300 de candidaturi din 80 de țări. Hailuo AI a fost reprezentat acolo alături de Tencent și Z.ai într-un panel despre democratizarea cinematografiei IA. 🔗 minimax.io

  • NVIDIA DGX Spark — 16 agenți IA locali simultani — Demonstrație comunitară redistribuită de @NVIDIAAI: 2x DGX Spark (GB10) + MiniMax M2.7 NVFP4 rulează 16 agenți IA în streaming simultan, fără API-uri cloud. 🔗 @NVIDIAAI pe X


Ce înseamnă asta

Un punct de cotitură pentru cercetarea matematică formală. AlphaProof Nexus marchează o ruptură: IA nu se mai limitează la probleme de concurs sau la benchmark-uri academice, ci atacă probleme deschise pe care matematicienii nu au reușit să le rezolve de zeci de ani. Combinația Gemini + Lean creează o buclă de verificare formală care garantează că demonstrațiile sunt corecte, nu doar plauzibile. Costul de câteva sute de dolari pe problemă rezolvată sugerează că această abordare devine accesibilă laboratoarelor de cercetare, nu doar giganților din sector.

Maturitatea instrumentelor agentice la Anthropic. Sosirea modului auto pe planul Pro și integrarea Sonnet 4.6 semnalează că Anthropic consideră utilizarea agentică autonomă suficient de stabilă pentru publicul larg. Versiunea 2.1.149, cu defalcarea /usage pe categorie, răspunde unei nevoi concrete a dezvoltatorilor care construiesc sisteme multi-agent complexe: să înțeleagă precis ce le consumă cota pentru a-și optimiza arhitecturile.

Deschidere vs. suveranitate software. Open source-ul Copilot pentru Eclipse sub licența MIT și activarea cache-ului implicit pe Qwen3.7-Max ilustrează două strategii diferite pentru a cuceri dezvoltatorii. GitHub mizează pe transparență și pe ecosistemul Eclipse pentru a lărgi adoptarea Copilot în mediile Java de întreprindere. Alibaba mizează pe reducerea automată a costurilor, fără fricțiune, pentru a face Qwen3.7-Max mai competitiv față de alternativele cloud.

Industrializarea media generative avansează. Participarea MiniMax la AIFF Hong Kong — 1 300 de candidaturi din 80 de țări — și demonstrația NVIDIA cu 16 agenți locali simultani pe DGX Spark conturează un ecosistem în care creația video prin IA pătrunde în fluxurile profesionale din cinema, atât în festivaluri, cât și în infrastructură locală.


Surse

Articol tradus din fr în ro cu gpt-5.4-mini.