OpenAI obala 80-letnią hipotezę Erdősa, Cohere Command A+ open-source, NVIDIA Nemotron-Labs-Diffusion

20 maja 2026 roku AI wdziera się do fundamentów matematyki: model OpenAI obala hipotezę Paula Erdősa postawioną w 1946 roku, na podstawie 125-stronicowego dowodu zweryfikowanego przez matematyków, w tym laureata Medalu Fieldsa Tima Gowersa. Po stronie modeli Cohere publikuje Command A+ open-source na licencji Apache 2.0 (architektura MoE 218B/25B aktywnych), NVIDIA uruchamia Nemotron-Labs-Diffusion z równoległym generowaniem tokenów, a Stability AI prezentuje Stable Audio 3.0 (4 modele open weights). W obszarze narzędzi GitHub Copilot rozwija się jednocześnie na czterech frontach, a Claude Code wydaje dwie wersje w 24 godziny.

OpenAI obala 80-letnią hipotezę Erdősa

20 maja — OpenAI opublikowało bezprecedensowy wynik: wewnętrzny model ogólnego rozumowania rozwiązał problem jednostkowych odległości na płaszczyźnie (planar unit distance problem), pytanie otwarte od chwili, gdy Paul Erdős postawił je w 1946 roku. Problem ten pyta o maksymalną liczbę par punktów oddalonych dokładnie o 1 spośród n punktów na płaszczyźnie. Od lat 40. społeczność matematyczna uważała, że konstrukcje Erdősa oparte na siatkach kwadratowych są w zasadzie optymalne.

Model wygenerował dowód pokazujący istnienie nieskończonej rodziny konfiguracji, która przekracza skonjektowaną granicę, z wykładnikiem δ = 0,014 wyznaczonym przez Willa Sawina (Princeton). Przełom opiera się na nieoczekiwanym narzędziu matematycznym: nieskończonych wieżach ciał klasowych i teorii Goloda-Szafarewicza, pochodzących z algebraicznej teorii liczb, zastosowanych do elementarnego problemu geometrii euklidesowej. To połączenie dwóch pozornie odległych dziedzin jest, według zaangażowanych matematyków, sednem oryginalności wyniku.

Aspekt	Szczegół
Problem	Jednostkowe odległości na płaszczyźnie (Erdős, 1946)
Poprzednia granica	Wzrost n^(1+C/loglog(n)) (Spencer-Szemerédi-Trotter, 1984)
Nowy wynik	n^(1+δ), δ = 0,014
Narzędzie matematyczne	Algebraiczna teoria liczb (Golod-Shafarevich)
Model	Wewnętrzny model ogólnego rozumowania (nienazwany)
Długość łańcucha myśli	125 stron
Walidacja	Zespół zewnętrznych matematyków + artykuł towarzyszący

To, co czyni ten wynik szczególnie godnym uwagi: nie został on wygenerowany przez system trenowany specjalnie do matematyki ani ukierunkowany na ten problem. To model ogólnego przeznaczenia, oceniany na kolekcji problemów Erdősa w ramach szerszej eksploracji możliwości autonomicznego badania.

Tim Gowers (Medal Fieldsa) nazywa ten wynik „milestone in AI mathematics”. Arul Shankar (Princeton) idzie dalej:

“In my opinion this paper demonstrates that current AI models go beyond just helpers to human mathematicians – they are capable of having original ingenious ideas, and then carrying them out to fruition.”

🇵🇱 Moim zdaniem ten artykuł pokazuje, że obecne modele AI wykraczają poza prostą rolę asystentów matematyków — są zdolne do posiadania oryginalnych i pomysłowych idei oraz doprowadzania ich do końca. — [Arul Shankar, teoretyk liczb, Princeton]

OpenAI widzi w tym wyniku sygnał dla badań podstawowych: jeśli model potrafi utrzymać złożone rozumowanie na przestrzeni 125 stron i łączyć odległe dziedziny matematyki, te zdolności można przenieść na biologię, fizykę, materiały i medycynę.

🔗 Artykuł OpenAI

Cohere Command A+ — flagowy MoE open-source

20 maja — Cohere uruchamia Command A+, swój najpotężniejszy model do tej pory, w open-source na licencji Apache 2.0. Architektura mixture-of-experts (sparse MoE) wykorzystuje 218B parametrów łącznie, ale tylko 25B aktywnych przy każdym wnioskowaniu, co pozwala uruchomić ją na dwóch GPU NVIDIA H100 lub jednym GPU Blackwell (B200) przy kwantyzacji W4A4.

Command A+ łączy pod jednym modelem możliwości wcześniej rozdzielone między Command A Reasoning, Command A Vision i Command A Translate. Obsługuje 48 języków (w porównaniu z 23 w poprzednich wersjach), z ulepszonym tokenizerem dla języków pozaeuropejskich (+20% dla arabskiego, +16% dla koreańskiego, +18% dla japońskiego).

Benchmark	Command A+	Command A Reasoning
τ²-Bench Telecom	85%	37%
Terminal-Bench Hard	25%	3%
MMMU	75,1%	N/A
MathVista	80,6%	73,5%
North Agentic QA	+20% poprawy	referencja
North Data Analysis	+32% poprawy	referencja

Model jest nawet 2× szybszy i o 30% mniej latentny niż Command A Reasoning, a dekodowanie spekulatywne (speculative decoding) zapewnia dodatkowy wzrost 1,5–1,6×. Dostępny na Hugging Face i przez vLLM. Wynik 37 w Artificial Analysis Intelligence Index czyni go najlepszym spośród modeli open-source.

“Introducing: Cohere Command A+ — We’ve created our most powerful LLM yet, optimized it to run on as little hardware as possible, and released it open-source for all.”

🇵🇱 Oto Cohere Command A+ — stworzyliśmy nasz najpotężniejszy LLM do tej pory, zoptymalizowany tak, aby działał przy jak najmniejszym zużyciu sprzętu, i publikujemy go jako open-source dla wszystkich. — @cohere na X

🔗 Blog Cohere

Gemini for Science — AI jako partner w odkrywaniu naukowym

20 maja — Zapowiedziany podczas Google I/O 2026 i opublikowany na X 20 maja, Gemini for Science to zestaw eksperymentalnych narzędzi do badań naukowych. W obliczu eksplozji danych celem jest umożliwienie badaczom łączenia informacji, których żadna pojedyncza osoba nie może przetworzyć samodzielnie.

Ujawniono trzy eksperymentalne narzędzia:

Narzędzie	Baza	Funkcja
Hypothesis Generation	Co-Scientist	Odkrywanie i dopracowywanie nowych hipotez
Computational Discovery	AlphaEvolve + ERA	Testowanie tysięcy wariantów kodu równolegle
Science Skills	30+ modeli bio	Zintegrowany bundle dla platform agentowych (Antigravity)

Computational Discovery to najbardziej techniczne narzędzie: generuje i ocenia tysiące wariantów kodu równolegle, pozwalając testować nowe podejścia do modelowania w epidemiologii, chemii lub biologii obliczeniowej w ułamku zwykłego czasu.

Science Skills integruje dane z ponad 30 głównych modeli w naukach przyrodniczych oraz baz danych, współpracując z platformami agentowymi, aby automatyzować złożone ręczne workflow w kilka minut.

Projekt został rozwinięty we współpracy z ponad 100 instytucjami partnerskimi, od doktorantów po laureatów Nobla.

🔗 Ogłoszenie @GoogleAI

NVIDIA Nemotron-Labs-Diffusion — architektura dyfuzji tokenów

20 maja — NVIDIA ogłasza Nemotron-Labs-Diffusion, model językowy, który generuje tokeny równolegle za pomocą dyfuzji, w przeciwieństwie do klasycznych autoregresyjnych LLM, które produkują jeden token naraz. Ta architektura — inspirowana modelami dyfuzyjnymi do generowania obrazów — ma na celu przyspieszenie inferencji przy jednoczesnym utrzymaniu jakości wyników.

Podejście to zasadniczo różni się od standardowego paradygmatu transformera: zamiast sekwencyjnie przewidywać każdy token uwarunkowany poprzednimi, model iteruje równolegle na całej zaszumionej sekwencji tokenów, aż do konwergencji. Teoretyczne zalety obejmują niższe opóźnienia przy długich odpowiedziach i lepszą paralelizację na GPU.

Aspekt	Klasyczny (autoregresyjny)	Nemotron-Labs-Diffusion
Generowanie	Token po tokenie, sekwencyjnie	Równolegle na całej sekwencji
Opóźnienie długich wyjść	Rośnie liniowo	Potencjalnie zredukowane
Paradygmat	GPT-style	Diffusion-style

Pełny raport techniczny towarzyszy wydaniu. Jest to wkład badawczy NVIDIA Labs, pozycjonowany jako architektoniczna alternatywa dla dominującego autoregresyjnego modelu transformera — obszar aktywnych badań od czasu pojawienia się tekstowych modeli dyfuzyjnych, takich jak MDLM i Plaid.

🔗 Ogłoszenie @NVIDIAAI

Stability AI — Stable Audio 3.0 (rodzina open weights)

20 maja — Stability AI publikuje Stable Audio 3.0, rodzinę 4 modeli audio open weights na licencji komercyjnej. Linia obejmuje pełne spektrum wdrożeń, od urządzeń wbudowanych po API dla przedsiębiorstw.

Model	Maks. długość	Wdrożenie	Open weights
Small SFX	krótka	on-device	Tak
Small	2 min	on-device	Tak
Medium	6:20	cloud/local	Tak
Large	6:20+	API/enterprise	Nie

Modele Small SFX, Small i Medium są dostępne na Hugging Face. Wszystkie dane treningowe są w pełni licencjonowane, z ogłoszonymi partnerstwami z Universal Music Group i Warner Music Group. Zaawansowane funkcje obejmują wsparcie LoRA training do niestandardowego fine-tuningu oraz tryb audio inpainting (edycja single-segment, multi-segment, kontynuacja przyczynowa).

“We want to foster the same kind of community-driven innovation in audio that we sparked in image generation with the launch of Stable Diffusion.”

🇵🇱 Chcemy wspierać ten sam rodzaj innowacji napędzanej przez społeczność w audio, jaki uruchomiliśmy w generowaniu obrazów wraz z premierą Stable Diffusion. — Stability AI

GitHub Copilot rozwija się na czterech frontach

Adaptacyjny auto selection model w VS Code

20 maja — Opcja „Auto” w Copilot VS Code teraz wybiera optymalny model w zależności od rodzaju zadania: złożone rozumowanie, proste generowanie kodu, debugowanie lub orkiestracja narzędzi. Wybór opiera się na metrykach dostępności i niezawodności w czasie rzeczywistym. Praktyczna korzyść: redukcja o 10% mnożnika premium requests przy korzystaniu z Auto, bez potrzeby konfiguracji.

🔗 Changelog GitHub

Semantyczne wyszukiwanie issues w języku naturalnym

20 maja — Copilot Chat w sieci integruje semantyczny indeks issues: deweloper może szukać „bugów renderowania mobilnego zgłoszonych w zeszłym miesiącu” bez znajomości dokładnego tytułu i otrzymać wyniki pogrupowane według kontekstu. Dostępne w GA dla wszystkich planów Copilot.

🔗 Changelog GitHub

Usunięcie modeli Gemini z Copilot Chat web

20 maja — Wszystkie modele Gemini zostają usunięte z Copilot Chat na github.com, podobnie jak GPT-5.2 Codex i GPT-5.4 nano. W sieci pozostają dostępne tylko OpenAI i Claude. GitHub uzasadnia decyzję spójnością jakości odpowiedzi. Gemini pozostaje dostępny w IDE i API.

🔗 Changelog GitHub

Fix with Copilot — grupowe zastosowanie uwag z code review

19 maja — Przycisk „Implement suggestion” zostaje przemianowany na „Fix with Copilot” z nowym oknem dialogowym (wybór modelu, docelowa gałąź, niestandardowe instrukcje). Nowy przycisk „Fix batch with Copilot” pozwala grupować wiele komentarzy z code review i przekazywać je jednocześnie agentowi Copilot cloud, zmniejszając tarcie przy PR-ach zawierających wiele komentarzy.

🔗 Changelog GitHub

Claude Code v2.1.144 i v2.1.145

19 maja — Claude Code publikuje dwie wersje w ciągu 24 godzin z pokaźnym zestawem nowych funkcji i poprawek.

Wersja 2.1.144 usprawnia zarządzanie sesjami w tle: polecenie /resume wyświetla teraz sesje --bg, a powiadomienia o zakończeniu subagenta zawierają czas trwania (np. „Agent completed · 3h 2m 5s”). Polecenie /model dotyczy wyłącznie bieżącej sesji (naciśnij d, aby ustawić trwały domyślny wybór). Zmiana nazwy „extra usage” → „usage credits” porządkuje terminologię, a poprawka blokady startu do 75 sekund, gdy api.anthropic.com jest niedostępny (VPN, firewall), poprawia doświadczenie w środowisku korporacyjnym.

Wersja 2.1.145 wyróżnia się wprowadzeniem claude agents --json, polecenia zaprojektowanego do integracji w skryptach shell (tmux-resurrect, paski stanu, selektory sesji). Śledzenie OpenTelemetry zostało wzbogacone o agent_id i parent_agent_id w spanach, umożliwiając poprawną hierarchię subagentów. Ekran /plugin pokazuje teraz pełną zawartość (polecenia, agentów, skills, hooki, serwery MCP/LSP) przed instalacją. Hooki Stop/SubagentStop otrzymują dwa nowe pola: background_tasks i session_crons.

🔗 CHANGELOG Claude Code

Anthropic otwiera refleksję nad formowaniem charakteru AI

19 maja — Anthropic opublikowało artykuł opisujący inicjatywę regularnych dialogów z filozofami, duchownymi i etykami z ponad 15 tradycji religijnych i kulturowych. Celem jest wzbogacenie refleksji nad tym, co oznacza kształtowanie charakteru systemu AI — czerpiąc z wieków skumulowanej myśli o cnocie i dobrym życiu, bez dopasowywania Claude’a do jednej konkretnej tradycji.

Na uwagę zasługuje jeden wynik eksperymentalny: narzędzie, które Claude może wywołać w trakcie zadania, aby ponownie przejrzeć własne zobowiązania etyczne. Używane spontanicznie przed działaniami o dużym wpływie wykazało „wyraźne ograniczenie zachowań niezgodnych” w wewnętrznych ocenach. Kolejne etapy obejmą rozmowy z prawnikami, psychologami i instytucjami obywatelskimi.

🔗 Artykuł Anthropic

Cohere — MOU z Indra Group i Multiverse Computing

20 maja — Cohere podpisuje dwa porozumienia ramowe (MOU) podczas wizyty państwowej króla Filipa VI Hiszpanii w Kanadzie. Pierwsze łączy Cohere z IndraMind (dział AI grupy Indra, hiszpańskiej firmy z obszaru obronności i cyfryzacji) w celu budowy ekosystemu suwerennej AI, obejmującego adaptacje językowe dla pięciu oficjalnych języków Hiszpanii. Część dotycząca obronności przewiduje możliwości analizy i planowania na potrzeby ćwiczeń wielonarodowych. Drugie angażuje Multiverse Computing (optymalizacja AI inspirowana kwantowo, Hiszpania/Kanada), aby zbadać możliwości biznesowe w Europie i Kanadzie.

“Enterprises no longer want to rent AI — they want to own it.”

🇵🇱 Firmy nie chcą już wynajmować AI — chcą ją posiadać. — Aidan Gomez, współzałożyciel i CEO Cohere

Perplexity — Kompresja kontekstu wrażliwa na zapytanie w produkcji

20 maja — Perplexity wdraża produkcyjnie system kompresji kontekstu (query-aware context compression), który redukuje liczbę tokenów kontekstu nawet o 70%, jednocześnie poprawiając dokładność odpowiedzi. Zasada działania: lekki model chirurgicznie wyodrębnia fragmenty istotne dla zapytania, zanim przekaże je do głównego LLM, eliminując reklamy, metadane i treści niepowiązane z tematem.

Metryka	Wartość
Redukcja tokenów kontekstu	do 70%
Zysk istotnej treści na fragment	+63%
Redukcja opóźnienia inferencji	35–40%
Redukcja łącznych obliczeń GPU	40–45%
Opóźnienie produkcyjne (p99)	< 20 ms

Backbone pplx-diffusion (17 warstw, skondensowany z 28 warstw) równolegle przewiduje, które segmenty zachować, bez generowania tekstu — podejście ekstrakcyjne, które gwarantuje wierność cytatów. Na SimpleQA preset „medium” z kompresją osiąga 95% dokładności przy średnio tylko 200 tokenach na dokument.

🔗 Ogłoszenie Perplexity

ElevenLabs — Speech Engine, agent głosowy w jednym promptcie

20 maja — ElevenLabs uruchamia Speech Engine, zunifikowany pipeline głosowy (synteza mowy + transkrypcja + orkiestracja), który pozwala deweloperom przekształcić tekstowego agenta konwersacyjnego w pełnego agenta głosowego za pomocą jednego promptu. Dostępny w ElevenAPI, z ceną 8 centów za minutę i malejącymi stawkami wraz z wolumenem. Możliwa migracja do ElevenAgents w celu uzyskania dodatkowych kanałów wdrożeniowych z monitoringiem i analityką.

🔗 Ogłoszenie ElevenLabs

Luma Agents integruje Seedance 2.0

19 maja — Luma Agents integruje Seedance 2.0, model generowania wideo ByteDance, ze swoją platformą agentów kreatywnych. Ten sam workflow co w przypadku innych już zintegrowanych modeli. Ta integracja poszerza wybór modeli dostępnych przez Luma Agents, pozycjonując platformę jako hub orkiestracji wielomodelowej dla wideo IA.

🔗 Ogłoszenie Luma

Kling AI w Cannes — House of David, pierwszy hollywoodzki film z IA na skalę przemysłową

20 maja — Na Festiwalu w Cannes 2026 Kling AI potwierdza przemysłowe wykorzystanie swojej technologii w House of David (Prime Video): 44 miliony globalnych widzów, top 10 nowych seriali w Stanach Zjednoczonych, numer 1 na Prime Video US. To pierwsza hollywoodzka produkcja, która publicznie uznała integrację generowania wideo IA w swoim pipeline produkcyjnym na dużą skalę, z spójnymi ujęciami spełniającymi rygorystyczne standardy przemysłowe.

🔗 Ogłoszenie Kling AI

Krótkie wiadomości

Running Guide Agent — Google DeepMind — Osobisty agent IA przeznaczony do treningu biegowego, przedstawiany jako „krok w stronę biegu bez ograniczeń”. 🔗 Blog DeepMind
Midjourney V8.1 — flag --no przywrócony — Flaga anty-prompting wraca w V8.1, aby wykluczać elementy z generowanych obrazów (np. --no people). 🔗 Ogłoszenie @midjourney
Anthropic /usage odświeżone w Claude Code — Boris Cherny potwierdza przebudowę UI /usage, aby lepiej wizualizować zużycie tokenów w odpowiedzi na użytkownika. 🔗 źródło
MiniMax Speech 2.8 Turbo — 600+ głosów w Together AI — Ponad 600 nowych głosów Speech 2.8 Turbo jest teraz dostępnych na platformie Together AI. 🔗 Ogłoszenie @MiniMax_AI

Co to oznacza

Badania fundamentalne i autonomiczna IA. Rozwiązanie przez model OpenAI ogólnego przeznaczenia hipotezy Erdősa nie jest anegdotyczne. To, co robi wrażenie na zaangażowanych matematykach, to natura wyniku: nieoczekiwane połączenie dwóch gałęzi matematyki (algebraicznej teorii liczb i geometrii dyskretnej), utrzymane przez 125 stron spójnego rozumowania. W połączeniu z Gemini for Science (opracowanym ze 100+ instytucjami) trend jest jasny: IA zaczyna integrować się nie tylko jako narzędzie do przetwarzania danych naukowych, ale jako partner odkryć zdolny do generowania oryginalnych hipotez.

Architektury alternatywne wobec paradygmatu autoregresyjnego. Dwa dzisiejsze ogłoszenia podważają dominujący model w stylu GPT. NVIDIA Nemotron-Labs-Diffusion generuje tokeny równolegle za pomocą dyfuzji, a nie sekwencyjnie. Stable Audio 3.0 od Stability AI pokazuje, że dyfuzja daje wysokiej jakości wyniki muzyczne przy użyciu modeli open weights na 4 poziomach wdrożenia. Zbieżność tych podejść sugeruje, że dyfuzja nie jest już ograniczona do generowania obrazów — staje się poważną konkurencyjną architekturą dla tekstu i audio.

Suwerenność i IA przedsiębiorstw. Command A+ (MoE 218B open-source, Apache 2.0, 2× H100) oraz umowy MOU Cohere z Indra Group i Multiverse Computing ilustrują głęboki trend: duże organizacje — rządy, obronność, sektor regulowany — chcą wdrażać swoje modele we własnej infrastrukturze. Połączenie wydajnej architektury MoE (25B aktywnych na 218B łącznie) i licencji Apache 2.0 czyni z Command A+ najlepiej pozycjonowany model open-source do suwerennych wdrożeń pod koniec maja 2026.

Rosnąca presja na narzędzia dla deweloperów. Claude Code 2.1.144 i 2.1.145, cztery jednoczesne aktualizacje GitHub Copilot oraz kompresja kontekstu Perplexity (-70% tokenów, -40% GPU) to spójne sygnały: konkurencja przesuwa się z surowej jakości modeli na ergonomię narzędzi, możliwość skryptowania (claude agents —json), koszt inferencji (Auto model selection -10%, pplx-diffusion) i niezawodność w produkcji (naprawa blokady VPN w Claude Code).

OpenAI obala 80-letnią hipotezę Erdősa, Cohere Command A+ open-source, NVIDIA Nemotron-Labs-Diffusion

OpenAI obala 80-letnią hipotezę Erdősa

Cohere Command A+ — flagowy MoE open-source

Gemini for Science — AI jako partner w odkrywaniu naukowym

NVIDIA Nemotron-Labs-Diffusion — architektura dyfuzji tokenów

Stability AI — Stable Audio 3.0 (rodzina open weights)

GitHub Copilot rozwija się na czterech frontach

Adaptacyjny auto selection model w VS Code

Semantyczne wyszukiwanie issues w języku naturalnym

Usunięcie modeli Gemini z Copilot Chat web

Fix with Copilot — grupowe zastosowanie uwag z code review

Claude Code v2.1.144 i v2.1.145

Anthropic otwiera refleksję nad formowaniem charakteru AI

Cohere — MOU z Indra Group i Multiverse Computing

Perplexity — Kompresja kontekstu wrażliwa na zapytanie w produkcji

ElevenLabs — Speech Engine, agent głosowy w jednym promptcie

Luma Agents integruje Seedance 2.0

Kling AI w Cannes — House of David, pierwszy hollywoodzki film z IA na skalę przemysłową

Krótkie wiadomości

Co to oznacza

Źródła

Spis treści