Anthropic ujawnia rekurencyjne samo-ulepszanie AI, NVIDIA Nemotron 3 Ultra open-source, Suno pozyskuje 400 mln USD

4 czerwca 2026 otwiera się historyczną publikacją Anthropic Institute: AI już przyspiesza swój własny rozwój, z ponad 80% kodu Anthropic pisanego przez Claude i wzrostem produktywności ×8. NVIDIA jednocześnie udostępnia Nemotron 3 Ultra, model MoE o 550 miliardach parametrów, w pełni open-source, przeznaczony dla agentów. OpenAI wdraża Dreaming v3, nową architekturę pamięci dla ChatGPT 5× tańszą w utrzymaniu. GitHub Copilot przekracza próg miliona tokenów kontekstu. A Suno ogłasza rundę finansowania Serii D na 400 mln USD, podnosząc swoją wycenę do 5,4 mld USD.

Anthropic Institute — “When AI builds itself” : udokumentowane rekurencyjne samo-ulepszanie

4 czerwca — The Anthropic Institute publikuje “When AI builds itself”, pierwszą oficjalną dokumentację, popartą wewnętrznymi liczbami, dotyczącą postępu w kierunku możliwego rekurencyjnego samo-ulepszania AI. Współautorzy Marina Favaro i Jack Clark przedstawiają wewnętrzne dane z maja 2026, które pokazują, że Claude pisze już większość kodu Anthropic.

Wskaźnik	Wartość (maj 2026)
Udział kodu Anthropic pisanego przez Claude	>80% linii scalenych do produkcji
Wzrost produktywności kod/inżynier	×8 w Q2 2026 vs 2024
Skuteczność zadań otwartych	76% (+50 punktów w 6 miesięcy)
Przyspieszenie optymalizacji kodu (Mythos Preview)	~52× vs ~3× dla Opus 4 (maj 2025)
Decyzje badawcze lepsze niż człowiek	64% (Mythos Preview vs 51% dla Opus 4.5 w lis. 2025)
Ankieta wewnętrzna — szacowany wzrost produktywności	×4 z Mythos Preview (130 pracowników, marzec 2026)

Postęp w autonomicznym czasie trwania zadań jest szczególnie uderzający: Claude Opus 3 obsługiwał zadania trwające około 4 minut w marcu 2024, Claude Sonnet 3.7 osiągał 1,5 godziny w marcu 2025, Claude Opus 4.6 działa przez 12 godzin w marcu 2026, a Mythos Preview przekracza 16 godzin (limit pomiaru benchmarku METR) w maju 2026. Czas trwania podwaja się mniej więcej co 4 miesiące.

Jednym konkretnym wynikiem jest to, że w kwietniu 2026 agenci Claude rozwiązali otwarty problem bezpieczeństwa AI od początku do końca — hipotezy, testy, iteracje — i odzyskali 97% zysku wydajności, wobec 23% dla dwóch ludzkich badaczy w ciągu tygodnia, przy koszcie około 18 000 USD obliczeń na łącznie 800 godzin.

Artykuł analizuje trzy scenariusze: plateau (uznawane za najmniej prawdopodobne), istotną automatyzację przy strategicznym kierownictwie człowieka oraz pełne rekurencyjne samo-ulepszanie, w którym modele tworzą swoich następców bez ingerencji człowieka. Artykuł kończy się wyraźnym wezwaniem do skoordynowanej i weryfikowalnej pauzy w rozwoju frontier AI, uzależnionej od udziału innych głównych laboratoriów.

“Our internal data shows Claude is accelerating AI development—a possible path to recursive self-improvement, or AI autonomously building a more capable successor. It’s happening faster than we thought, and the implications deserve greater attention.”

🇵🇱 Nasze wewnętrzne dane pokazują, że Claude przyspiesza rozwój AI — możliwa ścieżka do rekurencyjnego samo-ulepszania, czyli do tego, by AI autonomicznie tworzyła bardziej zdolnego następcę. Dzieje się to szybciej, niż oczekiwaliśmy, a konsekwencje zasługują na większą uwagę. — @AnthropicAI

🔗 Artykuł Anthropic Institute

NVIDIA Nemotron 3 Ultra — 550B MoE open-source dla agentów długotrwałych

4 czerwca — NVIDIA udostępnia Nemotron 3 Ultra, frontierowy model open-source o 550 miliardach parametrów, zaprojektowany specjalnie dla długotrwałych agentów AI (long-running agents). To uruchomienie jest praktyczną realizacją otwartych wag — po początkowym ogłoszeniu podczas Microsoft Build 2 czerwca, wagi są teraz dostępne na HuggingFace oraz przez Ollama Cloud.

Cecha	Wartość
Architektura	Hybrydowy Mamba-Transformer MoE
Łączna liczba parametrów	550 miliardów
Aktywne parametry	55 miliardów (NVFP4)
Szybkość inferencji	5× szybciej niż porównywalne frontierowe modele open-source
Redukcja kosztów agentowych	-30%
Wagi HuggingFace	`nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4`
Dostęp w chmurze	Ollama Cloud
Obsługiwane harnessy agentów	OpenClaw, Hermes Agent (NousResearch), LangChain

Hybrydowa architektura Mamba-Transformer MoE pozwala wykonywać więcej cykli rozumowania w tym samym budżecie czasu — to właśnie wyjaśnia wzrost szybkości. Nemotron 3 Ultra jest docelowo dostrajany pod złożone zadania: zaawansowane coding, pogłębione badania, planowanie, użycie narzędzi i odzyskiwanie po awariach.

NVIDIA publikuje również dane syntetyczne i receptury post-treningu, co pozwala zewnętrznym zespołom odtworzyć lub udoskonalić proces.

“Today we’re shipping Nemotron 3 Ultra. A 550B MoE frontier-intelligence open model built for long-running agents. It delivers 5x faster inference and lowers the cost of complex agentic tasks by up to 30% versus other open frontier models.”

🇵🇱 Dziś udostępniamy Nemotron 3 Ultra. Frontierowy model MoE open-source o 550 miliardach parametrów, zaprojektowany dla długotrwałych agentów. Zapewnia 5× szybszą inferencję i obniża koszt złożonych zadań agentowych o 30% w porównaniu z innymi frontierowymi modelami open-source. — @NVIDIAAI

🔗 HuggingFace — Nemotron 3 Ultra

Dreaming v3 — nowa architektura pamięci dla ChatGPT

4 czerwca — OpenAI wdraża Dreaming v3, całkowicie przeprojektowaną autonomiczną architekturę pamięci dla ChatGPT. System rozwiązuje trzy ograniczenia poprzedniego mechanizmu: aktualność informacji, ich poprawność w czasie oraz skalowanie do użytkowników Free.

Cel	Opis
Ciągłość kontekstowa	Zapamiętać informacje raz i wykorzystywać je w przyszłych rozmowach
Uwzględnianie preferencji	Stosować osobiste ograniczenia (dieta, strefa czasowa itp.)
Aktualizacja w czasie	Automatycznie aktualizować wspomnienia — po podróży AI wie, że wróciłeś

Historia systemu: saved memories pojawiły się w kwietniu 2024 (ręczne deklarowanie), a następnie „Dreaming v0” w kwietniu 2025 (automatyczna synteza w tle). Wersja 3 jest autonomiczna architektonicznie, około 5× tańsza w utrzymaniu — to właśnie ta redukcja kosztów umożliwiła rozszerzenie na użytkowników Free.

Dostępność: dziś dla subskrybentów Plus i Pro w Stanach Zjednoczonych; rozszerzenie na inne kraje oraz użytkowników Free i Go planowane jest w nadchodzących tygodniach.

Strona „Memory Summary” pozwala przejrzeć czytelne podsumowanie tego, co ChatGPT wie o użytkowniku, dodawać lub poprawiać informacje oraz definiować zasady dotyczące tematów, które mają być poruszane.

🔗 openai.com — Dreaming

Suno Seria D — 400 mln USD przy wycenie 5,4 mld USD

3 czerwca — Suno ogłasza rundę finansowania Serii D na 400 mln USD, podnosząc wycenę platformy muzyki generatywnej do 5,4 mld USD. Rundę prowadzi Bond Capital, przy udziale nowych inwestorów (IVP, USV — Union Square Ventures, Forerunner Ventures) oraz przy ponownym wsparciu Matrix VC, Lightspeed i Menlo Ventures.

Trajektoria wyceny jest imponująca: 125 mln USD pozyskane w maju 2024, następnie 250 mln USD w listopadzie 2025 przy wycenie 2,45 mld USD, a teraz 5,4 mld USD — czyli ponad dwukrotny wzrost w siedem miesięcy.

Suno umacnia swoją pozycję jako jedna z najlepiej finansowanych platform kreatywnych AI na świecie, z niezmienną misją: umożliwić większej liczbie osób radość tworzenia muzyki bez ograniczeń technicznych.

“We’re thrilled to announce Suno’s next chapter: a $400M Series D at a $5.4B valuation!”

🇵🇱 Z radością ogłaszamy kolejny rozdział Suno: rundę Serii D na 400 mln USD przy wycenie 5,4 mld USD! — @suno

🔗 Blog Suno — The Next Chapter

GitHub Copilot — okno kontekstu 1M tokenów i konfigurowalne rozumowanie

4 czerwca — GitHub Copilot wprowadza dwie nowe, kluczowe możliwości dostępne od dziś w VS Code, Copilot CLI i aplikacji GitHub Copilot.

Możliwość	Dostępność	Wpływ na kredyty AI
Okno kontekstu 1M tokenów	VS Code, Copilot CLI, aplikacja Copilot	Wyższy
Konfigurowalne poziomy rozumowania	VS Code, Copilot CLI, aplikacja Copilot	Wyższy

Okno kontekstu o wielkości miliona tokenów pozwala pracować na większych bazach kodu, dłuższych dokumentach i złożonych projektach wieloplikowych bez gubienia wątku. Do tej pory limity kontekstu zmuszały programistów do fragmentowania pracy albo upraszczania zapytań w złożonych projektach.

Konfigurowalne poziomy rozumowania pozwalają wyważyć szybkość i głębokość oraz włączyć „extended thinking” (extended thinking) dla najbardziej złożonych wyzwań architektonicznych i debugowania. GitHub zaleca rezerwowanie maksymalnych ustawień dla złożonych problemów wieloplikowych — użycie rozszerzonego kontekstu lub wyższego rozumowania zużywa więcej kredytów AI na interakcję.

Rozszerzenie na inne powierzchnie Copilot jest planowane w nadchodzących tygodniach.

🔗 GitHub Changelog — Larger context windows

GitHub Copilot — aktualizacje z 4 czerwca

Copilot w Visual Studio — aktualizacja z maja 2026

4 czerwca — Aktualizacja z maja 2026 dla Copilot w Visual Studio 2026 wzmacnia planowanie i wspólny przegląd.

Agent Plan: przeszukuje repozytorium w trybie tylko do odczytu, zadaje pytania doprecyzowujące i generuje szczegółowy plan zapisany w .copilot/plans/plan-{titre}.md. Przycisk „Implement plan” przełącza do trybu agenta.
Panel Skills: wyświetla wszystkie wykryte umiejętności agentów ze środowiska pracy i profilu użytkownika, z wyszukiwaniem po nazwie lub słowie kluczowym.
Wieloplikowy diff z podsumowaniem: po zmianach Copilot na wielu plikach widok „change summary” umożliwia zaakceptowanie lub odrzucenie zmian globalnie, per plik lub per blok.
Wskaźnik użycia okna kontekstu: ikona u góry pola wprowadzania z opcją „Summarize conversation”, aby zwolnić miejsce.
Dodawanie commitów w kontekście: klik prawym przyciskiem na commit w Git History, aby dołączyć go jako kontekst w Copilot Chat.

🔗 GitHub Changelog — Visual Studio May update

Copilot Chat na github.com — wzbogacony kontekst PR (ogólna dostępność)

4 czerwca — Copilot Chat przechodzi z publicznego podglądu do ogólnej dostępności dla wszystkich posiadaczy licencji Copilot, z rozszerzonymi możliwościami podczas pracy nad diffami i pull requestami na github.com.

Kod i czat obok siebie: podgląd rozmowy bezpośrednio obok kodu, komentarze i zmiany inline bez przełączania się między PR a oknem czatu.
Kontekst ładowany automatycznie: gdy pytanie dotyczy diffa lub PR, odpowiedni kontekst jest wstrzykiwany automatycznie — nie trzeba już kopiować i wklejać fragmentów.
Dostęp: przycisk „Ask about this diff” u góry każdego diffa albo przez menu rozwijane po zaznaczeniu linii kodu.

🔗 GitHub Changelog — Copilot Chat PR context

Claude Code v2.1.162

3 czerwca — Wersja v2.1.162 Claude Code wprowadza kilka usprawnień UX oraz ważne poprawki dla agentów.

Funkcjonalność	Opis
`claude agents --json` + `waitingFor`	JSON zawiera teraz wzorzec blokady oczekującej sesji (np. prompt uprawnień)
Potwierdzona trwałość `/effort`	Wyraźne potwierdzenie, gdy wybrany poziom staje się domyślny dla nowych sesji
Autouzupełnianie komendy slash	Klik wypełnia komendę w promptcie bez uruchamiania — Enter, aby potwierdzić
Stopka Remote Control w formie pill	Remote Control wyświetla się jako trwała pill na dole z linkiem do sesji
Zmiana nazwy Windsurf → Devin Desktop	Zaktualizowane w `/ide`, `/terminal-setup`, `/scroll-speed`

Wśród poprawek: ciche blokowanie przy starcie, gdy katalog konfiguracji jest tylko do odczytu (Claude Code teraz startuje z konfiguracją w pamięci), reguły WebFetch nie były stosowane wobec wstępnie zatwierdzonych domen, uprawnienia Windows z backslashami oraz kilka poprawek agentów (obrazy Ctrl+V, utracone sesje podczas backgroundingu, szerokość terminala przy długich sesjach).

🔗 Releases Claude Code v2.1.162

ElevenLabs — Flows Agent i partnerstwo z Hasbro

Flows Agent w ElevenCreative

4 czerwca — ElevenLabs uruchamia Flows Agent w swoim interfejsie ElevenCreative. Użytkownik opisuje, co chce stworzyć, a agent automatycznie buduje kompletny pipeline — łącząc ponad 50 modeli obrazu i wideo z narzędziami do głosu, muzyki i efektów dźwiękowych dostępnymi na platformie, na jednym, zunifikowanym canvasie.

Tryb „assist” pozwala agentowi poprosić o zatwierdzenie przed każdą płatną operacją, aby zachować kontrolę nad kosztami. Zespoły marketingowe mogą w ten sposób łączyć modalności i testować warianty kreatywne w różnych produktach, językach i formatach bez ręcznej konfiguracji każdego kroku.

🔗 ElevenLabs Flows

ElevenLabs × Hasbro — licencjonowane głosy postaci w Iconic Marketplace

3 czerwca — ElevenLabs łączy siły z Hasbro, aby oferować oficjalne głosy postaci (My Little Pony, Transformers, G.I. Joe) za pośrednictwem Iconic Marketplace. Głosy są tworzone we współpracy z Hasbro i oryginalnymi talentami głosowymi, z jasno określonymi prawami użytkowania dla deweloperów, firm i twórców aplikacji. Oferta ma łączyć kreatywność AI i ochronę praw własności intelektualnej marek.

🔗 Tweet ElevenLabs × Hasbro

GPT-Rosalind — nowe możliwości dla nauk przyrodniczych

3 czerwca — OpenAI ogłasza ważną aktualizację GPT-Rosalind, swojego modelu specjalistycznego do badań w naukach przyrodniczych na poziomie enterprise. Model łączy agentowe możliwości GPT-5.5 ze wzmocnioną inteligencją w chemii medycznej i genomice.

Benchmark	Dziedzina	Wynik GPT-Rosalind	Wynik GPT-5.5	Redukcja tokenów
LifeSciBench	Nauki przyrodnicze (6 dziedzin)	Najlepszy	—	—
MedChemBench	Chemia medyczna	27,5%	25,1%	-7,2%
GeneBench	Genomika	21,6%	20,4%	-31%
LabWorkBench	Protokoły wet lab	63,2%	55,8%	-5,3%

Dwie nowe wtyczki są teraz dostępne dla wszystkich użytkowników Codex: Life Sciences Research plugin (pozyskiwanie źródeł dowodowych) oraz Life Sciences NGS Analysis plugin (bioinformatyczne workflow scRNA-seq, bulk RNA-seq). Novo Nordisk jest pierwszym ogłoszonym partnerem. Dostęp jest globalnie rozszerzany na kwalifikujące się organizacje (prawowite badania naukowe, solidne zarządzanie).

🔗 openai.com — GPT-Rosalind

Perplexity uruchamia Main Street AI Accelerator z amerykańską SBA

4 czerwca — Perplexity uruchamia Main Street AI Accelerator we współpracy z U.S. Small Business Administration (SBA). Program udostępnia $25 milionów kredytów Perplexity Computer: $250 kredytów dla maksymalnie 100 000 kwalifikujących się firm, nawiązując do 250. rocznicy Stanów Zjednoczonych.

Uprawnione są firmy korzystające z pożyczek 7(a), 504 oraz mikropożyczek SBA. Rekrutacja nie jest jeszcze otwarta; na dedykowanej stronie dostępna jest lista oczekujących. Inicjatywa wpisuje się w strategię Perplexity polegającą na rozszerzaniu Computer na lokalną tkankę gospodarczą USA, po ogłoszeniu w poprzednim tygodniu 400+ integracji enterprise dla Computer (Intuit QuickBooks, Vercel, Shopify, Canva).

🔗 Main Street AI Accelerator

Cohere zdobywa 1. miejsce w konkursie NATO dotyczącym agentowej AI

4 czerwca — Cohere zdobywa pierwsze miejsce w konkursie NATO Agentic AI for Cognitive Warfare Innovation Challenge. Pełne podium:

Cohere (1. miejsce)
OpenMinds (2. miejsce)
Ipsos & Thoughtworks (3. miejsce, ex aequo)

Konkurs podkreśla rosnącą rolę agentowej AI w pomaganiu demokratycznym państwom w rozumieniu, przewidywaniu i reagowaniu na zagrożenia informacyjne. Dla Cohere to wyróżnienie od NATO potwierdza jej pozycjonowanie wokół suwerennej AI dla sektora obronnego i rządowego — kluczowego kierunku od czasu transatlantycznej fuzji z Aleph Alpha w kwietniu 2026.

🔗 Cohere — Challenge NATO

Pika — Group Chat z agentem AI na iOS

4 czerwca — Pika uruchamia pierwszy zintegrowany Group Chat z agentem AI w swojej aplikacji. Użytkownicy zapraszają kontakty do czatu grupowego, w którym Pika Agent uczestniczy w kreatywnej rozmowie — pomaga skonfigurować telefon, tworzyć memy w grupie, współpracować przy krótkich formatach wideo. Dostępne już teraz na iOS przez https://pika.me.

🔗 Tweet Pika

Krótkie wiadomości

Artykuł Anthropic — self-service analytics z Claude — Zespół Anthropic publikuje swoje dobre praktyki dotyczące budowy agentów do analizy danych self-service z Claude: umiejętności (skills), fundamenty danych i ewaluacje. 🔗 Blog Claude
Google Antigravity v2.0.11 — Aktualizacja stabilności dla IDE napędzanego przez Gemini: dwie poprawki (zawieszanie przy uruchamianiu i przycisk „Open IDE”), bez nowych funkcji. 🔗 Dziennik zmian Antigravity
GitHub Enterprise Teams GA — Enterprise Teams osiąga ogólną dostępność na GitHub Enterprise Cloud: grupy definiowane raz na poziomie enterprise, przypisywalne do wszystkich organizacji, z SCIM, GitHub Apps i pełnym audytem. Do 2 500 zespołów i 5 000 członków na zespół. 🔗 Dziennik zmian GitHub
Genspark — partner uruchomienia Agent365 na Microsoft Build — Współzałożyciel Ray Zhong wystąpił na scenie podczas Microsoft Build jako globalny partner strategiczny i partner uruchomienia Agent365, integrując agentową AI z istniejącą infrastrukturą enterprise Microsoft. 🔗 Tweet Genspark
Cohere wspiera krajową strategię AI Kanady — CEO Aidan Gomez potwierdza kanadyjskie zakorzenienie Cohere, chwaląc nową krajową strategię AI Kanady jako ważny krok w stronę suwerenności technologicznej i budowy AI nowej generacji w kraju. 🔗 Tweet Cohere

Co to oznacza

Samodoskonalenie AI przechodzi z teorii do mierzalnych danych wewnętrznych. Publikacja Anthropic Institute nie jest spekulacją — to raport z terenu z konkretnymi liczbami: >80% kodu, ×8 produktywności, 76% skuteczności w zadaniach otwartych. Czas trwania autonomicznego zadania, który podwaja się co 4 miesiące, to najbardziej konkretny sygnał trwającej dynamiki. To, co w kręgach bezpieczeństwa AI było omawiane jako przyszłe ryzyko, zostało teraz udokumentowane jako obecna rzeczywistość. Apel o skoordynowaną przerwę — z Anthropic jako pierwszym wnioskodawcą — pokazuje napięcie między konkurencją komercyjną a ostrożnością regulacyjną.

Open-source klasy frontier zmienia skalę. Nemotron 3 Ultra z 550 miliardami parametrów — w pełni open-source, z możliwością pobrania wag, danymi syntetycznymi i opublikowanymi recepturami — redefiniuje znaczenie „open-source” dla modeli frontier. 5× szybsza inferencja i 30% redukcja kosztów dla zadań agentowych nie są marginalne: czynią wykonalnym uruchamianie złożonych agentów poza wielkimi, własnościowymi chmurami. Dla zespołów budujących autonomicznych agentów to nowa infrastruktura, która właśnie się pojawia.

Narzędzia dla deweloperów konsolidują się wokół agenta długodystansowego. GitHub Copilot z 1M tokenów kontekstu, Claude Code v2.1.162 z waitingFor w JSON agents, Flows Agent od ElevenLabs, który buduje multimodalne pipeline’y — te trzy ogłoszenia łączy ten sam paradygmat: agent musi zarządzać długimi kontekstami, komunikować swój stan innym systemom i orkiestruje wiele narzędzi bez udziału człowieka. „Konfigurowalne rozumowanie” Copilota i /effort Claude Code odpowiadają na to samo pytanie: jak użytkownik może dostroić głębokość rozumowania do złożoności zadania?

Gospodarka kreatywnej AI wchodzi na symboliczny kolejny poziom. Wycena Suno na $5,4 miliarda w siedem miesięcy — przy podwojeniu wartości — sygnalizuje, że inwestorzy stawiają na platformę generatywnego tworzenia muzyki na skalę masowego rynku. W połączeniu z niedawnymi rundami w obszarze wideo (Runway, Pika), sektor kreatywnej AI dysponuje teraz kapitalizacją porównywalną z dużymi tradycyjnymi wydawcami oprogramowania kreatywnego. Wejście Hasbro do Iconic Marketplace od ElevenLabs pokazuje, jak właściciele praw własności intelektualnej się dostosowują: zamiast blokować AI, monetyzują ją na licencji.