AlphaProof Nexus rozwiązuje 9 otwartych problemów, Claude Code Auto Mode na Pro, Copilot Eclipse open source

W tym tygodniu Google DeepMind robi duży krok w badaniach matematycznych dzięki AlphaProof Nexus, agentowi zdolnemu do rozwiązywania otwartych problemów nierozwiązanych od kilkudziesięciu lat. Po stronie Anthropic tryb auto Claude Code trafia na plan Pro i integruje Sonnet 4.6. GitHub udostępnia jako open source wtyczkę Copilot dla Eclipse, a Alibaba aktywuje pamięć podręczną implicit w Qwen3.7-Max.

AlphaProof Nexus — Agent IA rozwiązuje otwarte problemy matematyczne nierozwiązane od dziesięcioleci

25 maja 2026 — Google DeepMind ogłosił AlphaProof Nexus, agentowe (agentic framework) środowisko do badań nad formalnymi dowodami, wspierane przez Gemini, wraz z artykułem przesłanym do arXiv 21 maja (arXiv:2605.22763).

Agent opiera się na pętli naprzemiennego generowania przez Gemini i formalnej weryfikacji za pomocą języka dowodów Lean. To połączenie gwarantuje matematyczną rygorystyczność tworzonych dowodów: LLM proponuje, Lean zatwierdza lub odrzuca, a agent iteruje.

Opublikowane wyniki:

Dziedzina	Wyniki	Kontekst
Otwarte problemy Erdősa	9 rozwiązanych spośród 353 ocenionych	W tym 2 otwarte od 56 lat
Koniektury OEIS	44 rozwiązane spośród 492	Online Encyclopedia of Integer Sequences
Geometria algebraiczna	1 otwarty problem rozwiązany	Otwarty od 15 lat
Optymalizacja min-max	1 otwarte pytanie rozwiązane	Otwarte od 7 lat

Koszt na jeden rozwiązany problem wynosi kilka setek dolarów — rząd wielkości, który pokazuje ekonomiczną efektywność podejścia agentowego w formalnych badaniach matematycznych.

AlphaProof Nexus jest już wdrażany we współpracy z matematykami w kilku dziedzinach: kombinatoryce, teorii grafów, geometrii algebraicznej i optyce kwantowej. Praca ta wpisuje się w ciągłość AlphaProof (2024), który celował w problemy na poziomie olimpiady. AlphaProof Nexus celuje w otwarte problemy badawcze, wyznaczając etap w kierunku używania AI jako autonomicznego narzędzia odkryć matematycznych.

“AI agents are advancing research-level math.”

🇵🇱 Agenci IA przyspieszają rozwój matematyki na poziomie badań. — Pushmeet Kohli, VP Research, Google DeepMind na X

🔗 Artykuł arXiv 2605.22763

Claude Code v2.1.149 — `/usage` breakdown według kategorii i ponad 25 poprawek

23 maja 2026 — Wydano wersję 2.1.149 Claude Code, realizując funkcję /usage breakdown według kategorii ogłoszoną przez Borisa Cherny’ego tydzień wcześniej.

Funkcja	Szczegóły
`/usage` breakdown	Szczegóły zużycia według kategorii: skills, sub-agenci, pluginy, serwer MCP
`/diff` navigation	Nawigacja klawiaturą: strzałki, `j`/`k`, PgUp/PgDn, Home/End
GFM task lists	Pudełka do zaznaczania Markdown (`[ ]` / `[x]`) wyświetlane poprawnie
Enterprise	Nowy zarządzany parametr `allowAllClaudeAIMcps` dla `managed-mcp.json`

Wydanie naprawia także około dwudziestu błędów: obejście uprawnień PowerShell w cd, wyczerpanie tablicy vnode na macOS z find, zawieszenie dialogu managed-settings, fantomowe zmiany w /config, awarię /insights przy brakujących opcjonalnych polach oraz bursztynowy spinner rozumowania pozostający między wywołaniami narzędzi.

Wersja 2.1.150, wydana tego samego dnia, nie wnosi żadnych widocznych zmian poza wewnętrznymi usprawnieniami infrastruktury.

🔗 Changelog Claude Code

Claude Code Auto Mode — Dostępny na Pro, Sonnet 4.6 zintegrowany

23 maja 2026 — Anthropic ogłasza dwa rozszerzenia trybu auto Claude Code:

“Two updates to auto mode: · Now available on the Pro plan · Sonnet 4.6 is now supported, alongside Opus 4.7. Shift+tab, and let Claude run.”

🇵🇱 Dwie aktualizacje trybu auto: od teraz dostępny w planie Pro; Sonnet 4.6 jest obsługiwany obok Opus 4.7. Naciśnij Shift+tab i pozwól Claude’owi pracować. — @ClaudeDevs na X

Tryb auto, aktywowany przez Shift+Tab, pozwala Claude wykonywać działania autonomicznie bez ręcznej weryfikacji na każdym etapie. Dotąd zarezerwowany dla wyższych planów, jest teraz dostępny dla subskrybentów Pro. Dodanie Sonnet 4.6 oferuje bardziej ekonomiczną opcję niż Opus 4.7 dla długich sesji, zmniejszając zużycie kredytów w trybie autonomicznym.

Aby uzyskać dostęp do tych zmian: claude update lub aktualizacja desktopowej aplikacji Claude. Ogłoszenie wygenerowało 1,18 miliona wyświetleń na X.

GitHub Copilot for Eclipse — Open source na licencji MIT

21 maja 2026 — GitHub udostępnił jako open source wtyczkę GitHub Copilot dla Eclipse, dostępną na GitHubie na licencji MIT pod adresem github.com/microsoft/copilot-for-eclipse.

Cały zestaw funkcji jest otwarty na wkład społeczności:

Funkcja	Status
Code completion (uzupełnianie inline)	Open source
Next Edit Suggestions (NES)	Open source
Chat (strumień rozmowy, wywołania narzędzi)	Open source
Agent mode (agentowe workflow multistep)	Open source
Skills i prompt files	Open source
BYOK (Bring Your Own Key)	Open source
Niestandardowi agenci, sub-agenci, plan agent, MCP	Open source

Motywacją są przejrzystość i społecznościowa innowacja w duchu otwartego ekosystemu Eclipse. Pierwsze wkłady od społeczności zostały już zgłoszone w momencie otwarcia.

🔗 Ogłoszenie GitHub Changelog

Qwen3.7-Max — Pamięć podręczna implicit aktywowana w produkcji

25 maja 2026 — Alibaba aktywuje pamięć podręczną implicit (implicit caching) w Qwen3.7-Max, swoim flagowym modelu zorientowanym na agentów.

Pamięć podręczna aktywuje się automatycznie dla wszystkich zapytań API — bez potrzeby zmian w kodzie. Deweloperzy natychmiast zyskują szybsze i tańsze zapytania przy powtarzalnych kontekstach. Dla wyższych i deterministycznych współczynników cache Alibaba zaleca pamięć podręczną explicite, opisaną w Alibaba Cloud.

🔗 Tweet @Alibaba_Qwen

Krótkie wiadomości

MiniMax Hailuo AI na AIFF w Hongkongu (HKUST) — 2. AI Film Festival zorganizowany przez HKUST otrzymał 1300 zgłoszeń z 80 krajów. Hailuo AI był tam reprezentowany obok Tencent i Z.ai podczas panelu o demokratyzacji kina AI. 🔗 minimax.io
NVIDIA DGX Spark — 16 lokalnych agentów IA jednocześnie — Demonstracja społecznościowa podana dalej przez @NVIDIAAI: 2x DGX Spark (GB10) + MiniMax M2.7 NVFP4 uruchamiają 16 agentów IA w jednoczesnym streamingu, bez chmurowych API. 🔗 @NVIDIAAI na X

Co to oznacza

Punkt zwrotny dla formalnych badań matematycznych. AlphaProof Nexus wyznacza przełom: AI nie ogranicza się już do problemów konkursowych czy akademickich benchmarków, lecz bierze się za otwarte problemy, których matematycy nie potrafili rozwiązać od dziesięcioleci. Połączenie Gemini + Lean tworzy pętlę formalnej weryfikacji, która gwarantuje, że dowody są poprawne, a nie tylko wiarygodne. Koszt kilku setek dolarów na rozwiązany problem sugeruje, że podejście to staje się dostępne dla laboratoriów badawczych, a nie tylko dla gigantów branży.

Dojrzałość narzędzi agentowych po stronie Anthropic. Pojawienie się trybu auto na planie Pro i integracja Sonnet 4.6 sygnalizują, że Anthropic uznaje autonomiczne użycie agentowe za wystarczająco stabilne dla szerokiej publiczności. Wersja 2.1.149, z /usage breakdown według kategorii, odpowiada na konkretne potrzeby deweloperów budujących złożone systemy multi-agentowe: precyzyjne zrozumienie, co zużywa ich limit, aby optymalizować architektury.

Otwartość kontra suwerenność oprogramowania. Open source Copilot dla Eclipse na licencji MIT oraz aktywacja pamięci podręcznej implicit w Qwen3.7-Max pokazują dwie różne strategie zdobywania deweloperów. GitHub stawia na przejrzystość i ekosystem Eclipse, aby poszerzyć adopcję Copilot w korporacyjnych środowiskach Java. Alibaba stawia na automatyczne obniżenie kosztów bez tarcia, by uczynić Qwen3.7-Max bardziej konkurencyjnym wobec alternatyw chmurowych.

Industrializacja mediów generatywnych postępuje. Udział MiniMax w AIFF w Hongkongu — 1300 zgłoszeń z 80 krajów — oraz demonstracja NVIDIA pokazująca 16 lokalnych agentów jednocześnie na DGX Spark rysują ekosystem, w którym tworzenie wideo przez AI przenika profesjonalne workflow filmowe, zarówno festiwalowe, jak i lokalnej infrastruktury.