ai-powered-markdown-translatorArtykuł przetłumaczony z fr na pl za pomocą gpt-5.4-mini.
20 maja 2026 roku AI wdziera się do fundamentów matematyki: model OpenAI obala hipotezę Paula Erdősa postawioną w 1946 roku, na podstawie 125-stronicowego dowodu zweryfikowanego przez matematyków, w tym laureata Medalu Fieldsa Tima Gowersa. Po stronie modeli Cohere publikuje Command A+ open-source na licencji Apache 2.0 (architektura MoE 218B/25B aktywnych), NVIDIA uruchamia Nemotron-Labs-Diffusion z równoległym generowaniem tokenów, a Stability AI prezentuje Stable Audio 3.0 (4 modele open weights). W obszarze narzędzi GitHub Copilot rozwija się jednocześnie na czterech frontach, a Claude Code wydaje dwie wersje w 24 godziny.
OpenAI obala 80-letnią hipotezę Erdősa
20 maja — OpenAI opublikowało bezprecedensowy wynik: wewnętrzny model ogólnego rozumowania rozwiązał problem jednostkowych odległości na płaszczyźnie (planar unit distance problem), pytanie otwarte od chwili, gdy Paul Erdős postawił je w 1946 roku. Problem ten pyta o maksymalną liczbę par punktów oddalonych dokładnie o 1 spośród n punktów na płaszczyźnie. Od lat 40. społeczność matematyczna uważała, że konstrukcje Erdősa oparte na siatkach kwadratowych są w zasadzie optymalne.
Model wygenerował dowód pokazujący istnienie nieskończonej rodziny konfiguracji, która przekracza skonjektowaną granicę, z wykładnikiem δ = 0,014 wyznaczonym przez Willa Sawina (Princeton). Przełom opiera się na nieoczekiwanym narzędziu matematycznym: nieskończonych wieżach ciał klasowych i teorii Goloda-Szafarewicza, pochodzących z algebraicznej teorii liczb, zastosowanych do elementarnego problemu geometrii euklidesowej. To połączenie dwóch pozornie odległych dziedzin jest, według zaangażowanych matematyków, sednem oryginalności wyniku.
| Aspekt | Szczegół |
|---|---|
| Problem | Jednostkowe odległości na płaszczyźnie (Erdős, 1946) |
| Poprzednia granica | Wzrost n^(1+C/loglog(n)) (Spencer-Szemerédi-Trotter, 1984) |
| Nowy wynik | n^(1+δ), δ = 0,014 |
| Narzędzie matematyczne | Algebraiczna teoria liczb (Golod-Shafarevich) |
| Model | Wewnętrzny model ogólnego rozumowania (nienazwany) |
| Długość łańcucha myśli | 125 stron |
| Walidacja | Zespół zewnętrznych matematyków + artykuł towarzyszący |
To, co czyni ten wynik szczególnie godnym uwagi: nie został on wygenerowany przez system trenowany specjalnie do matematyki ani ukierunkowany na ten problem. To model ogólnego przeznaczenia, oceniany na kolekcji problemów Erdősa w ramach szerszej eksploracji możliwości autonomicznego badania.
Tim Gowers (Medal Fieldsa) nazywa ten wynik „milestone in AI mathematics”. Arul Shankar (Princeton) idzie dalej:
“In my opinion this paper demonstrates that current AI models go beyond just helpers to human mathematicians – they are capable of having original ingenious ideas, and then carrying them out to fruition.”
🇵🇱 Moim zdaniem ten artykuł pokazuje, że obecne modele AI wykraczają poza prostą rolę asystentów matematyków — są zdolne do posiadania oryginalnych i pomysłowych idei oraz doprowadzania ich do końca. — [Arul Shankar, teoretyk liczb, Princeton]
OpenAI widzi w tym wyniku sygnał dla badań podstawowych: jeśli model potrafi utrzymać złożone rozumowanie na przestrzeni 125 stron i łączyć odległe dziedziny matematyki, te zdolności można przenieść na biologię, fizykę, materiały i medycynę.
Cohere Command A+ — flagowy MoE open-source
20 maja — Cohere uruchamia Command A+, swój najpotężniejszy model do tej pory, w open-source na licencji Apache 2.0. Architektura mixture-of-experts (sparse MoE) wykorzystuje 218B parametrów łącznie, ale tylko 25B aktywnych przy każdym wnioskowaniu, co pozwala uruchomić ją na dwóch GPU NVIDIA H100 lub jednym GPU Blackwell (B200) przy kwantyzacji W4A4.
Command A+ łączy pod jednym modelem możliwości wcześniej rozdzielone między Command A Reasoning, Command A Vision i Command A Translate. Obsługuje 48 języków (w porównaniu z 23 w poprzednich wersjach), z ulepszonym tokenizerem dla języków pozaeuropejskich (+20% dla arabskiego, +16% dla koreańskiego, +18% dla japońskiego).
| Benchmark | Command A+ | Command A Reasoning |
|---|---|---|
| τ²-Bench Telecom | 85% | 37% |
| Terminal-Bench Hard | 25% | 3% |
| MMMU | 75,1% | N/A |
| MathVista | 80,6% | 73,5% |
| North Agentic QA | +20% poprawy | referencja |
| North Data Analysis | +32% poprawy | referencja |
Model jest nawet 2× szybszy i o 30% mniej latentny niż Command A Reasoning, a dekodowanie spekulatywne (speculative decoding) zapewnia dodatkowy wzrost 1,5–1,6×. Dostępny na Hugging Face i przez vLLM. Wynik 37 w Artificial Analysis Intelligence Index czyni go najlepszym spośród modeli open-source.
“Introducing: Cohere Command A+ — We’ve created our most powerful LLM yet, optimized it to run on as little hardware as possible, and released it open-source for all.”
🇵🇱 Oto Cohere Command A+ — stworzyliśmy nasz najpotężniejszy LLM do tej pory, zoptymalizowany tak, aby działał przy jak najmniejszym zużyciu sprzętu, i publikujemy go jako open-source dla wszystkich. — @cohere na X
Gemini for Science — AI jako partner w odkrywaniu naukowym
20 maja — Zapowiedziany podczas Google I/O 2026 i opublikowany na X 20 maja, Gemini for Science to zestaw eksperymentalnych narzędzi do badań naukowych. W obliczu eksplozji danych celem jest umożliwienie badaczom łączenia informacji, których żadna pojedyncza osoba nie może przetworzyć samodzielnie.
Ujawniono trzy eksperymentalne narzędzia:
| Narzędzie | Baza | Funkcja |
|---|---|---|
| Hypothesis Generation | Co-Scientist | Odkrywanie i dopracowywanie nowych hipotez |
| Computational Discovery | AlphaEvolve + ERA | Testowanie tysięcy wariantów kodu równolegle |
| Science Skills | 30+ modeli bio | Zintegrowany bundle dla platform agentowych (Antigravity) |
Computational Discovery to najbardziej techniczne narzędzie: generuje i ocenia tysiące wariantów kodu równolegle, pozwalając testować nowe podejścia do modelowania w epidemiologii, chemii lub biologii obliczeniowej w ułamku zwykłego czasu.
Science Skills integruje dane z ponad 30 głównych modeli w naukach przyrodniczych oraz baz danych, współpracując z platformami agentowymi, aby automatyzować złożone ręczne workflow w kilka minut.
Projekt został rozwinięty we współpracy z ponad 100 instytucjami partnerskimi, od doktorantów po laureatów Nobla.
NVIDIA Nemotron-Labs-Diffusion — architektura dyfuzji tokenów
20 maja — NVIDIA ogłasza Nemotron-Labs-Diffusion, model językowy, który generuje tokeny równolegle za pomocą dyfuzji, w przeciwieństwie do klasycznych autoregresyjnych LLM, które produkują jeden token naraz. Ta architektura — inspirowana modelami dyfuzyjnymi do generowania obrazów — ma na celu przyspieszenie inferencji przy jednoczesnym utrzymaniu jakości wyników.
Podejście to zasadniczo różni się od standardowego paradygmatu transformera: zamiast sekwencyjnie przewidywać każdy token uwarunkowany poprzednimi, model iteruje równolegle na całej zaszumionej sekwencji tokenów, aż do konwergencji. Teoretyczne zalety obejmują niższe opóźnienia przy długich odpowiedziach i lepszą paralelizację na GPU.
| Aspekt | Klasyczny (autoregresyjny) | Nemotron-Labs-Diffusion |
|---|---|---|
| Generowanie | Token po tokenie, sekwencyjnie | Równolegle na całej sekwencji |
| Opóźnienie długich wyjść | Rośnie liniowo | Potencjalnie zredukowane |
| Paradygmat | GPT-style | Diffusion-style |
Pełny raport techniczny towarzyszy wydaniu. Jest to wkład badawczy NVIDIA Labs, pozycjonowany jako architektoniczna alternatywa dla dominującego autoregresyjnego modelu transformera — obszar aktywnych badań od czasu pojawienia się tekstowych modeli dyfuzyjnych, takich jak MDLM i Plaid.
Stability AI — Stable Audio 3.0 (rodzina open weights)
20 maja — Stability AI publikuje Stable Audio 3.0, rodzinę 4 modeli audio open weights na licencji komercyjnej. Linia obejmuje pełne spektrum wdrożeń, od urządzeń wbudowanych po API dla przedsiębiorstw.
| Model | Maks. długość | Wdrożenie | Open weights |
|---|---|---|---|
| Small SFX | krótka | on-device | Tak |
| Small | 2 min | on-device | Tak |
| Medium | 6:20 | cloud/local | Tak |
| Large | 6:20+ | API/enterprise | Nie |
Modele Small SFX, Small i Medium są dostępne na Hugging Face. Wszystkie dane treningowe są w pełni licencjonowane, z ogłoszonymi partnerstwami z Universal Music Group i Warner Music Group. Zaawansowane funkcje obejmują wsparcie LoRA training do niestandardowego fine-tuningu oraz tryb audio inpainting (edycja single-segment, multi-segment, kontynuacja przyczynowa).
“We want to foster the same kind of community-driven innovation in audio that we sparked in image generation with the launch of Stable Diffusion.”
🇵🇱 Chcemy wspierać ten sam rodzaj innowacji napędzanej przez społeczność w audio, jaki uruchomiliśmy w generowaniu obrazów wraz z premierą Stable Diffusion. — Stability AI
GitHub Copilot rozwija się na czterech frontach
Adaptacyjny auto selection model w VS Code
20 maja — Opcja „Auto” w Copilot VS Code teraz wybiera optymalny model w zależności od rodzaju zadania: złożone rozumowanie, proste generowanie kodu, debugowanie lub orkiestracja narzędzi. Wybór opiera się na metrykach dostępności i niezawodności w czasie rzeczywistym. Praktyczna korzyść: redukcja o 10% mnożnika premium requests przy korzystaniu z Auto, bez potrzeby konfiguracji.
Semantyczne wyszukiwanie issues w języku naturalnym
20 maja — Copilot Chat w sieci integruje semantyczny indeks issues: deweloper może szukać „bugów renderowania mobilnego zgłoszonych w zeszłym miesiącu” bez znajomości dokładnego tytułu i otrzymać wyniki pogrupowane według kontekstu. Dostępne w GA dla wszystkich planów Copilot.
Usunięcie modeli Gemini z Copilot Chat web
20 maja — Wszystkie modele Gemini zostają usunięte z Copilot Chat na github.com, podobnie jak GPT-5.2 Codex i GPT-5.4 nano. W sieci pozostają dostępne tylko OpenAI i Claude. GitHub uzasadnia decyzję spójnością jakości odpowiedzi. Gemini pozostaje dostępny w IDE i API.
Fix with Copilot — grupowe zastosowanie uwag z code review
19 maja — Przycisk „Implement suggestion” zostaje przemianowany na „Fix with Copilot” z nowym oknem dialogowym (wybór modelu, docelowa gałąź, niestandardowe instrukcje). Nowy przycisk „Fix batch with Copilot” pozwala grupować wiele komentarzy z code review i przekazywać je jednocześnie agentowi Copilot cloud, zmniejszając tarcie przy PR-ach zawierających wiele komentarzy.
Claude Code v2.1.144 i v2.1.145
19 maja — Claude Code publikuje dwie wersje w ciągu 24 godzin z pokaźnym zestawem nowych funkcji i poprawek.
Wersja 2.1.144 usprawnia zarządzanie sesjami w tle: polecenie /resume wyświetla teraz sesje --bg, a powiadomienia o zakończeniu subagenta zawierają czas trwania (np. „Agent completed · 3h 2m 5s”). Polecenie /model dotyczy wyłącznie bieżącej sesji (naciśnij d, aby ustawić trwały domyślny wybór). Zmiana nazwy „extra usage” → „usage credits” porządkuje terminologię, a poprawka blokady startu do 75 sekund, gdy api.anthropic.com jest niedostępny (VPN, firewall), poprawia doświadczenie w środowisku korporacyjnym.
Wersja 2.1.145 wyróżnia się wprowadzeniem claude agents --json, polecenia zaprojektowanego do integracji w skryptach shell (tmux-resurrect, paski stanu, selektory sesji). Śledzenie OpenTelemetry zostało wzbogacone o agent_id i parent_agent_id w spanach, umożliwiając poprawną hierarchię subagentów. Ekran /plugin pokazuje teraz pełną zawartość (polecenia, agentów, skills, hooki, serwery MCP/LSP) przed instalacją. Hooki Stop/SubagentStop otrzymują dwa nowe pola: background_tasks i session_crons.
Anthropic otwiera refleksję nad formowaniem charakteru AI
19 maja — Anthropic opublikowało artykuł opisujący inicjatywę regularnych dialogów z filozofami, duchownymi i etykami z ponad 15 tradycji religijnych i kulturowych. Celem jest wzbogacenie refleksji nad tym, co oznacza kształtowanie charakteru systemu AI — czerpiąc z wieków skumulowanej myśli o cnocie i dobrym życiu, bez dopasowywania Claude’a do jednej konkretnej tradycji.
Na uwagę zasługuje jeden wynik eksperymentalny: narzędzie, które Claude może wywołać w trakcie zadania, aby ponownie przejrzeć własne zobowiązania etyczne. Używane spontanicznie przed działaniami o dużym wpływie wykazało „wyraźne ograniczenie zachowań niezgodnych” w wewnętrznych ocenach. Kolejne etapy obejmą rozmowy z prawnikami, psychologami i instytucjami obywatelskimi.
Cohere — MOU z Indra Group i Multiverse Computing
20 maja — Cohere podpisuje dwa porozumienia ramowe (MOU) podczas wizyty państwowej króla Filipa VI Hiszpanii w Kanadzie. Pierwsze łączy Cohere z IndraMind (dział AI grupy Indra, hiszpańskiej firmy z obszaru obronności i cyfryzacji) w celu budowy ekosystemu suwerennej AI, obejmującego adaptacje językowe dla pięciu oficjalnych języków Hiszpanii. Część dotycząca obronności przewiduje możliwości analizy i planowania na potrzeby ćwiczeń wielonarodowych. Drugie angażuje Multiverse Computing (optymalizacja AI inspirowana kwantowo, Hiszpania/Kanada), aby zbadać możliwości biznesowe w Europie i Kanadzie.
“Enterprises no longer want to rent AI — they want to own it.”
🇵🇱 Firmy nie chcą już wynajmować AI — chcą ją posiadać. — Aidan Gomez, współzałożyciel i CEO Cohere
Perplexity — Kompresja kontekstu wrażliwa na zapytanie w produkcji
20 maja — Perplexity wdraża produkcyjnie system kompresji kontekstu (query-aware context compression), który redukuje liczbę tokenów kontekstu nawet o 70%, jednocześnie poprawiając dokładność odpowiedzi. Zasada działania: lekki model chirurgicznie wyodrębnia fragmenty istotne dla zapytania, zanim przekaże je do głównego LLM, eliminując reklamy, metadane i treści niepowiązane z tematem.
| Metryka | Wartość |
|---|---|
| Redukcja tokenów kontekstu | do 70% |
| Zysk istotnej treści na fragment | +63% |
| Redukcja opóźnienia inferencji | 35–40% |
| Redukcja łącznych obliczeń GPU | 40–45% |
| Opóźnienie produkcyjne (p99) | < 20 ms |
Backbone pplx-diffusion (17 warstw, skondensowany z 28 warstw) równolegle przewiduje, które segmenty zachować, bez generowania tekstu — podejście ekstrakcyjne, które gwarantuje wierność cytatów. Na SimpleQA preset „medium” z kompresją osiąga 95% dokładności przy średnio tylko 200 tokenach na dokument.
ElevenLabs — Speech Engine, agent głosowy w jednym promptcie
20 maja — ElevenLabs uruchamia Speech Engine, zunifikowany pipeline głosowy (synteza mowy + transkrypcja + orkiestracja), który pozwala deweloperom przekształcić tekstowego agenta konwersacyjnego w pełnego agenta głosowego za pomocą jednego promptu. Dostępny w ElevenAPI, z ceną 8 centów za minutę i malejącymi stawkami wraz z wolumenem. Możliwa migracja do ElevenAgents w celu uzyskania dodatkowych kanałów wdrożeniowych z monitoringiem i analityką.
Luma Agents integruje Seedance 2.0
19 maja — Luma Agents integruje Seedance 2.0, model generowania wideo ByteDance, ze swoją platformą agentów kreatywnych. Ten sam workflow co w przypadku innych już zintegrowanych modeli. Ta integracja poszerza wybór modeli dostępnych przez Luma Agents, pozycjonując platformę jako hub orkiestracji wielomodelowej dla wideo IA.
Kling AI w Cannes — House of David, pierwszy hollywoodzki film z IA na skalę przemysłową
20 maja — Na Festiwalu w Cannes 2026 Kling AI potwierdza przemysłowe wykorzystanie swojej technologii w House of David (Prime Video): 44 miliony globalnych widzów, top 10 nowych seriali w Stanach Zjednoczonych, numer 1 na Prime Video US. To pierwsza hollywoodzka produkcja, która publicznie uznała integrację generowania wideo IA w swoim pipeline produkcyjnym na dużą skalę, z spójnymi ujęciami spełniającymi rygorystyczne standardy przemysłowe.
Krótkie wiadomości
-
Running Guide Agent — Google DeepMind — Osobisty agent IA przeznaczony do treningu biegowego, przedstawiany jako „krok w stronę biegu bez ograniczeń”. 🔗 Blog DeepMind
-
Midjourney V8.1 — flag
--noprzywrócony — Flaga anty-prompting wraca w V8.1, aby wykluczać elementy z generowanych obrazów (np.--no people). 🔗 Ogłoszenie @midjourney -
Anthropic
/usageodświeżone w Claude Code — Boris Cherny potwierdza przebudowę UI/usage, aby lepiej wizualizować zużycie tokenów w odpowiedzi na użytkownika. 🔗 źródło -
MiniMax Speech 2.8 Turbo — 600+ głosów w Together AI — Ponad 600 nowych głosów Speech 2.8 Turbo jest teraz dostępnych na platformie Together AI. 🔗 Ogłoszenie @MiniMax_AI
Co to oznacza
Badania fundamentalne i autonomiczna IA. Rozwiązanie przez model OpenAI ogólnego przeznaczenia hipotezy Erdősa nie jest anegdotyczne. To, co robi wrażenie na zaangażowanych matematykach, to natura wyniku: nieoczekiwane połączenie dwóch gałęzi matematyki (algebraicznej teorii liczb i geometrii dyskretnej), utrzymane przez 125 stron spójnego rozumowania. W połączeniu z Gemini for Science (opracowanym ze 100+ instytucjami) trend jest jasny: IA zaczyna integrować się nie tylko jako narzędzie do przetwarzania danych naukowych, ale jako partner odkryć zdolny do generowania oryginalnych hipotez.
Architektury alternatywne wobec paradygmatu autoregresyjnego. Dwa dzisiejsze ogłoszenia podważają dominujący model w stylu GPT. NVIDIA Nemotron-Labs-Diffusion generuje tokeny równolegle za pomocą dyfuzji, a nie sekwencyjnie. Stable Audio 3.0 od Stability AI pokazuje, że dyfuzja daje wysokiej jakości wyniki muzyczne przy użyciu modeli open weights na 4 poziomach wdrożenia. Zbieżność tych podejść sugeruje, że dyfuzja nie jest już ograniczona do generowania obrazów — staje się poważną konkurencyjną architekturą dla tekstu i audio.
Suwerenność i IA przedsiębiorstw. Command A+ (MoE 218B open-source, Apache 2.0, 2× H100) oraz umowy MOU Cohere z Indra Group i Multiverse Computing ilustrują głęboki trend: duże organizacje — rządy, obronność, sektor regulowany — chcą wdrażać swoje modele we własnej infrastrukturze. Połączenie wydajnej architektury MoE (25B aktywnych na 218B łącznie) i licencji Apache 2.0 czyni z Command A+ najlepiej pozycjonowany model open-source do suwerennych wdrożeń pod koniec maja 2026.
Rosnąca presja na narzędzia dla deweloperów. Claude Code 2.1.144 i 2.1.145, cztery jednoczesne aktualizacje GitHub Copilot oraz kompresja kontekstu Perplexity (-70% tokenów, -40% GPU) to spójne sygnały: konkurencja przesuwa się z surowej jakości modeli na ergonomię narzędzi, możliwość skryptowania (claude agents —json), koszt inferencji (Auto model selection -10%, pplx-diffusion) i niezawodność w produkcji (naprawa blokady VPN w Claude Code).
Źródła
- OpenAI — Model disproves discrete geometry conjecture
- OpenAI na X
- Cohere — blog o Command A+
- Cohere Command A+ na X
- Google AI — Gemini for Science na X
- NVIDIA AI — Nemotron-Labs-Diffusion na X
- Stability AI — Stable Audio 3.0
- GitHub Changelog — Auto model selection VS Code
- GitHub Changelog — Semantic issue search
- GitHub Changelog — Modele dostępne w sieci
- GitHub Changelog — Fix with Copilot
- Claude Code CHANGELOG
- Anthropic — Widening the conversation on frontier AI
- Cohere — MOUs Indra i Multiverse Computing
- Perplexity — Query-aware context compression na X
- Perplexity — Artykuł badawczy
- ElevenLabs — Speech Engine na X
- Luma Labs — Seedance 2.0 na X
- Kling AI — Cannes na X
- Google DeepMind — Running Guide Agent
- Midjourney — Flag —no na X
- Boris Cherny — odświeżone /usage na X
- MiniMax — Speech 2.8 Turbo na X