ai-powered-markdown-translatorArtykuł przetłumaczony z fr na pl za pomocą gpt-5.4-mini.
4 czerwca 2026 otwiera się historyczną publikacją Anthropic Institute: AI już przyspiesza swój własny rozwój, z ponad 80% kodu Anthropic pisanego przez Claude i wzrostem produktywności ×8. NVIDIA jednocześnie udostępnia Nemotron 3 Ultra, model MoE o 550 miliardach parametrów, w pełni open-source, przeznaczony dla agentów. OpenAI wdraża Dreaming v3, nową architekturę pamięci dla ChatGPT 5× tańszą w utrzymaniu. GitHub Copilot przekracza próg miliona tokenów kontekstu. A Suno ogłasza rundę finansowania Serii D na 400 mln USD, podnosząc swoją wycenę do 5,4 mld USD.
Anthropic Institute — “When AI builds itself” : udokumentowane rekurencyjne samo-ulepszanie
4 czerwca — The Anthropic Institute publikuje “When AI builds itself”, pierwszą oficjalną dokumentację, popartą wewnętrznymi liczbami, dotyczącą postępu w kierunku możliwego rekurencyjnego samo-ulepszania AI. Współautorzy Marina Favaro i Jack Clark przedstawiają wewnętrzne dane z maja 2026, które pokazują, że Claude pisze już większość kodu Anthropic.
| Wskaźnik | Wartość (maj 2026) |
|---|---|
| Udział kodu Anthropic pisanego przez Claude | >80% linii scalenych do produkcji |
| Wzrost produktywności kod/inżynier | ×8 w Q2 2026 vs 2024 |
| Skuteczność zadań otwartych | 76% (+50 punktów w 6 miesięcy) |
| Przyspieszenie optymalizacji kodu (Mythos Preview) | ~52× vs ~3× dla Opus 4 (maj 2025) |
| Decyzje badawcze lepsze niż człowiek | 64% (Mythos Preview vs 51% dla Opus 4.5 w lis. 2025) |
| Ankieta wewnętrzna — szacowany wzrost produktywności | ×4 z Mythos Preview (130 pracowników, marzec 2026) |
Postęp w autonomicznym czasie trwania zadań jest szczególnie uderzający: Claude Opus 3 obsługiwał zadania trwające około 4 minut w marcu 2024, Claude Sonnet 3.7 osiągał 1,5 godziny w marcu 2025, Claude Opus 4.6 działa przez 12 godzin w marcu 2026, a Mythos Preview przekracza 16 godzin (limit pomiaru benchmarku METR) w maju 2026. Czas trwania podwaja się mniej więcej co 4 miesiące.
Jednym konkretnym wynikiem jest to, że w kwietniu 2026 agenci Claude rozwiązali otwarty problem bezpieczeństwa AI od początku do końca — hipotezy, testy, iteracje — i odzyskali 97% zysku wydajności, wobec 23% dla dwóch ludzkich badaczy w ciągu tygodnia, przy koszcie około 18 000 USD obliczeń na łącznie 800 godzin.
Artykuł analizuje trzy scenariusze: plateau (uznawane za najmniej prawdopodobne), istotną automatyzację przy strategicznym kierownictwie człowieka oraz pełne rekurencyjne samo-ulepszanie, w którym modele tworzą swoich następców bez ingerencji człowieka. Artykuł kończy się wyraźnym wezwaniem do skoordynowanej i weryfikowalnej pauzy w rozwoju frontier AI, uzależnionej od udziału innych głównych laboratoriów.
“Our internal data shows Claude is accelerating AI development—a possible path to recursive self-improvement, or AI autonomously building a more capable successor. It’s happening faster than we thought, and the implications deserve greater attention.”
🇵🇱 Nasze wewnętrzne dane pokazują, że Claude przyspiesza rozwój AI — możliwa ścieżka do rekurencyjnego samo-ulepszania, czyli do tego, by AI autonomicznie tworzyła bardziej zdolnego następcę. Dzieje się to szybciej, niż oczekiwaliśmy, a konsekwencje zasługują na większą uwagę. — @AnthropicAI
NVIDIA Nemotron 3 Ultra — 550B MoE open-source dla agentów długotrwałych
4 czerwca — NVIDIA udostępnia Nemotron 3 Ultra, frontierowy model open-source o 550 miliardach parametrów, zaprojektowany specjalnie dla długotrwałych agentów AI (long-running agents). To uruchomienie jest praktyczną realizacją otwartych wag — po początkowym ogłoszeniu podczas Microsoft Build 2 czerwca, wagi są teraz dostępne na HuggingFace oraz przez Ollama Cloud.
| Cecha | Wartość |
|---|---|
| Architektura | Hybrydowy Mamba-Transformer MoE |
| Łączna liczba parametrów | 550 miliardów |
| Aktywne parametry | 55 miliardów (NVFP4) |
| Szybkość inferencji | 5× szybciej niż porównywalne frontierowe modele open-source |
| Redukcja kosztów agentowych | -30% |
| Wagi HuggingFace | nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4 |
| Dostęp w chmurze | Ollama Cloud |
| Obsługiwane harnessy agentów | OpenClaw, Hermes Agent (NousResearch), LangChain |
Hybrydowa architektura Mamba-Transformer MoE pozwala wykonywać więcej cykli rozumowania w tym samym budżecie czasu — to właśnie wyjaśnia wzrost szybkości. Nemotron 3 Ultra jest docelowo dostrajany pod złożone zadania: zaawansowane coding, pogłębione badania, planowanie, użycie narzędzi i odzyskiwanie po awariach.
NVIDIA publikuje również dane syntetyczne i receptury post-treningu, co pozwala zewnętrznym zespołom odtworzyć lub udoskonalić proces.
“Today we’re shipping Nemotron 3 Ultra. A 550B MoE frontier-intelligence open model built for long-running agents. It delivers 5x faster inference and lowers the cost of complex agentic tasks by up to 30% versus other open frontier models.”
🇵🇱 Dziś udostępniamy Nemotron 3 Ultra. Frontierowy model MoE open-source o 550 miliardach parametrów, zaprojektowany dla długotrwałych agentów. Zapewnia 5× szybszą inferencję i obniża koszt złożonych zadań agentowych o 30% w porównaniu z innymi frontierowymi modelami open-source. — @NVIDIAAI
🔗 HuggingFace — Nemotron 3 Ultra
Dreaming v3 — nowa architektura pamięci dla ChatGPT
4 czerwca — OpenAI wdraża Dreaming v3, całkowicie przeprojektowaną autonomiczną architekturę pamięci dla ChatGPT. System rozwiązuje trzy ograniczenia poprzedniego mechanizmu: aktualność informacji, ich poprawność w czasie oraz skalowanie do użytkowników Free.
| Cel | Opis |
|---|---|
| Ciągłość kontekstowa | Zapamiętać informacje raz i wykorzystywać je w przyszłych rozmowach |
| Uwzględnianie preferencji | Stosować osobiste ograniczenia (dieta, strefa czasowa itp.) |
| Aktualizacja w czasie | Automatycznie aktualizować wspomnienia — po podróży AI wie, że wróciłeś |
Historia systemu: saved memories pojawiły się w kwietniu 2024 (ręczne deklarowanie), a następnie „Dreaming v0” w kwietniu 2025 (automatyczna synteza w tle). Wersja 3 jest autonomiczna architektonicznie, około 5× tańsza w utrzymaniu — to właśnie ta redukcja kosztów umożliwiła rozszerzenie na użytkowników Free.
Dostępność: dziś dla subskrybentów Plus i Pro w Stanach Zjednoczonych; rozszerzenie na inne kraje oraz użytkowników Free i Go planowane jest w nadchodzących tygodniach.
Strona „Memory Summary” pozwala przejrzeć czytelne podsumowanie tego, co ChatGPT wie o użytkowniku, dodawać lub poprawiać informacje oraz definiować zasady dotyczące tematów, które mają być poruszane.
Suno Seria D — 400 mln USD przy wycenie 5,4 mld USD
3 czerwca — Suno ogłasza rundę finansowania Serii D na 400 mln USD, podnosząc wycenę platformy muzyki generatywnej do 5,4 mld USD. Rundę prowadzi Bond Capital, przy udziale nowych inwestorów (IVP, USV — Union Square Ventures, Forerunner Ventures) oraz przy ponownym wsparciu Matrix VC, Lightspeed i Menlo Ventures.
Trajektoria wyceny jest imponująca: 125 mln USD pozyskane w maju 2024, następnie 250 mln USD w listopadzie 2025 przy wycenie 2,45 mld USD, a teraz 5,4 mld USD — czyli ponad dwukrotny wzrost w siedem miesięcy.
Suno umacnia swoją pozycję jako jedna z najlepiej finansowanych platform kreatywnych AI na świecie, z niezmienną misją: umożliwić większej liczbie osób radość tworzenia muzyki bez ograniczeń technicznych.
“We’re thrilled to announce Suno’s next chapter: a $400M Series D at a $5.4B valuation!”
🇵🇱 Z radością ogłaszamy kolejny rozdział Suno: rundę Serii D na 400 mln USD przy wycenie 5,4 mld USD! — @suno
🔗 Blog Suno — The Next Chapter
GitHub Copilot — okno kontekstu 1M tokenów i konfigurowalne rozumowanie
4 czerwca — GitHub Copilot wprowadza dwie nowe, kluczowe możliwości dostępne od dziś w VS Code, Copilot CLI i aplikacji GitHub Copilot.
| Możliwość | Dostępność | Wpływ na kredyty AI |
|---|---|---|
| Okno kontekstu 1M tokenów | VS Code, Copilot CLI, aplikacja Copilot | Wyższy |
| Konfigurowalne poziomy rozumowania | VS Code, Copilot CLI, aplikacja Copilot | Wyższy |
Okno kontekstu o wielkości miliona tokenów pozwala pracować na większych bazach kodu, dłuższych dokumentach i złożonych projektach wieloplikowych bez gubienia wątku. Do tej pory limity kontekstu zmuszały programistów do fragmentowania pracy albo upraszczania zapytań w złożonych projektach.
Konfigurowalne poziomy rozumowania pozwalają wyważyć szybkość i głębokość oraz włączyć „extended thinking” (extended thinking) dla najbardziej złożonych wyzwań architektonicznych i debugowania. GitHub zaleca rezerwowanie maksymalnych ustawień dla złożonych problemów wieloplikowych — użycie rozszerzonego kontekstu lub wyższego rozumowania zużywa więcej kredytów AI na interakcję.
Rozszerzenie na inne powierzchnie Copilot jest planowane w nadchodzących tygodniach.
🔗 GitHub Changelog — Larger context windows
GitHub Copilot — aktualizacje z 4 czerwca
Copilot w Visual Studio — aktualizacja z maja 2026
4 czerwca — Aktualizacja z maja 2026 dla Copilot w Visual Studio 2026 wzmacnia planowanie i wspólny przegląd.
- Agent Plan: przeszukuje repozytorium w trybie tylko do odczytu, zadaje pytania doprecyzowujące i generuje szczegółowy plan zapisany w
.copilot/plans/plan-{titre}.md. Przycisk „Implement plan” przełącza do trybu agenta. - Panel Skills: wyświetla wszystkie wykryte umiejętności agentów ze środowiska pracy i profilu użytkownika, z wyszukiwaniem po nazwie lub słowie kluczowym.
- Wieloplikowy diff z podsumowaniem: po zmianach Copilot na wielu plikach widok „change summary” umożliwia zaakceptowanie lub odrzucenie zmian globalnie, per plik lub per blok.
- Wskaźnik użycia okna kontekstu: ikona u góry pola wprowadzania z opcją „Summarize conversation”, aby zwolnić miejsce.
- Dodawanie commitów w kontekście: klik prawym przyciskiem na commit w Git History, aby dołączyć go jako kontekst w Copilot Chat.
🔗 GitHub Changelog — Visual Studio May update
Copilot Chat na github.com — wzbogacony kontekst PR (ogólna dostępność)
4 czerwca — Copilot Chat przechodzi z publicznego podglądu do ogólnej dostępności dla wszystkich posiadaczy licencji Copilot, z rozszerzonymi możliwościami podczas pracy nad diffami i pull requestami na github.com.
- Kod i czat obok siebie: podgląd rozmowy bezpośrednio obok kodu, komentarze i zmiany inline bez przełączania się między PR a oknem czatu.
- Kontekst ładowany automatycznie: gdy pytanie dotyczy diffa lub PR, odpowiedni kontekst jest wstrzykiwany automatycznie — nie trzeba już kopiować i wklejać fragmentów.
- Dostęp: przycisk „Ask about this diff” u góry każdego diffa albo przez menu rozwijane po zaznaczeniu linii kodu.
🔗 GitHub Changelog — Copilot Chat PR context
Claude Code v2.1.162
3 czerwca — Wersja v2.1.162 Claude Code wprowadza kilka usprawnień UX oraz ważne poprawki dla agentów.
| Funkcjonalność | Opis |
|---|---|
claude agents --json + waitingFor | JSON zawiera teraz wzorzec blokady oczekującej sesji (np. prompt uprawnień) |
Potwierdzona trwałość /effort | Wyraźne potwierdzenie, gdy wybrany poziom staje się domyślny dla nowych sesji |
| Autouzupełnianie komendy slash | Klik wypełnia komendę w promptcie bez uruchamiania — Enter, aby potwierdzić |
| Stopka Remote Control w formie pill | Remote Control wyświetla się jako trwała pill na dole z linkiem do sesji |
| Zmiana nazwy Windsurf → Devin Desktop | Zaktualizowane w /ide, /terminal-setup, /scroll-speed |
Wśród poprawek: ciche blokowanie przy starcie, gdy katalog konfiguracji jest tylko do odczytu (Claude Code teraz startuje z konfiguracją w pamięci), reguły WebFetch nie były stosowane wobec wstępnie zatwierdzonych domen, uprawnienia Windows z backslashami oraz kilka poprawek agentów (obrazy Ctrl+V, utracone sesje podczas backgroundingu, szerokość terminala przy długich sesjach).
🔗 Releases Claude Code v2.1.162
ElevenLabs — Flows Agent i partnerstwo z Hasbro
Flows Agent w ElevenCreative
4 czerwca — ElevenLabs uruchamia Flows Agent w swoim interfejsie ElevenCreative. Użytkownik opisuje, co chce stworzyć, a agent automatycznie buduje kompletny pipeline — łącząc ponad 50 modeli obrazu i wideo z narzędziami do głosu, muzyki i efektów dźwiękowych dostępnymi na platformie, na jednym, zunifikowanym canvasie.
Tryb „assist” pozwala agentowi poprosić o zatwierdzenie przed każdą płatną operacją, aby zachować kontrolę nad kosztami. Zespoły marketingowe mogą w ten sposób łączyć modalności i testować warianty kreatywne w różnych produktach, językach i formatach bez ręcznej konfiguracji każdego kroku.
ElevenLabs × Hasbro — licencjonowane głosy postaci w Iconic Marketplace
3 czerwca — ElevenLabs łączy siły z Hasbro, aby oferować oficjalne głosy postaci (My Little Pony, Transformers, G.I. Joe) za pośrednictwem Iconic Marketplace. Głosy są tworzone we współpracy z Hasbro i oryginalnymi talentami głosowymi, z jasno określonymi prawami użytkowania dla deweloperów, firm i twórców aplikacji. Oferta ma łączyć kreatywność AI i ochronę praw własności intelektualnej marek.
GPT-Rosalind — nowe możliwości dla nauk przyrodniczych
3 czerwca — OpenAI ogłasza ważną aktualizację GPT-Rosalind, swojego modelu specjalistycznego do badań w naukach przyrodniczych na poziomie enterprise. Model łączy agentowe możliwości GPT-5.5 ze wzmocnioną inteligencją w chemii medycznej i genomice.
| Benchmark | Dziedzina | Wynik GPT-Rosalind | Wynik GPT-5.5 | Redukcja tokenów |
|---|---|---|---|---|
| LifeSciBench | Nauki przyrodnicze (6 dziedzin) | Najlepszy | — | — |
| MedChemBench | Chemia medyczna | 27,5% | 25,1% | -7,2% |
| GeneBench | Genomika | 21,6% | 20,4% | -31% |
| LabWorkBench | Protokoły wet lab | 63,2% | 55,8% | -5,3% |
Dwie nowe wtyczki są teraz dostępne dla wszystkich użytkowników Codex: Life Sciences Research plugin (pozyskiwanie źródeł dowodowych) oraz Life Sciences NGS Analysis plugin (bioinformatyczne workflow scRNA-seq, bulk RNA-seq). Novo Nordisk jest pierwszym ogłoszonym partnerem. Dostęp jest globalnie rozszerzany na kwalifikujące się organizacje (prawowite badania naukowe, solidne zarządzanie).
Perplexity uruchamia Main Street AI Accelerator z amerykańską SBA
4 czerwca — Perplexity uruchamia Main Street AI Accelerator we współpracy z U.S. Small Business Administration (SBA). Program udostępnia $25 milionów kredytów Perplexity Computer: $250 kredytów dla maksymalnie 100 000 kwalifikujących się firm, nawiązując do 250. rocznicy Stanów Zjednoczonych.
Uprawnione są firmy korzystające z pożyczek 7(a), 504 oraz mikropożyczek SBA. Rekrutacja nie jest jeszcze otwarta; na dedykowanej stronie dostępna jest lista oczekujących. Inicjatywa wpisuje się w strategię Perplexity polegającą na rozszerzaniu Computer na lokalną tkankę gospodarczą USA, po ogłoszeniu w poprzednim tygodniu 400+ integracji enterprise dla Computer (Intuit QuickBooks, Vercel, Shopify, Canva).
Cohere zdobywa 1. miejsce w konkursie NATO dotyczącym agentowej AI
4 czerwca — Cohere zdobywa pierwsze miejsce w konkursie NATO Agentic AI for Cognitive Warfare Innovation Challenge. Pełne podium:
- Cohere (1. miejsce)
- OpenMinds (2. miejsce)
- Ipsos & Thoughtworks (3. miejsce, ex aequo)
Konkurs podkreśla rosnącą rolę agentowej AI w pomaganiu demokratycznym państwom w rozumieniu, przewidywaniu i reagowaniu na zagrożenia informacyjne. Dla Cohere to wyróżnienie od NATO potwierdza jej pozycjonowanie wokół suwerennej AI dla sektora obronnego i rządowego — kluczowego kierunku od czasu transatlantycznej fuzji z Aleph Alpha w kwietniu 2026.
Pika — Group Chat z agentem AI na iOS
4 czerwca — Pika uruchamia pierwszy zintegrowany Group Chat z agentem AI w swojej aplikacji. Użytkownicy zapraszają kontakty do czatu grupowego, w którym Pika Agent uczestniczy w kreatywnej rozmowie — pomaga skonfigurować telefon, tworzyć memy w grupie, współpracować przy krótkich formatach wideo. Dostępne już teraz na iOS przez https://pika.me.
Krótkie wiadomości
-
Artykuł Anthropic — self-service analytics z Claude — Zespół Anthropic publikuje swoje dobre praktyki dotyczące budowy agentów do analizy danych self-service z Claude: umiejętności (skills), fundamenty danych i ewaluacje. 🔗 Blog Claude
-
Google Antigravity v2.0.11 — Aktualizacja stabilności dla IDE napędzanego przez Gemini: dwie poprawki (zawieszanie przy uruchamianiu i przycisk „Open IDE”), bez nowych funkcji. 🔗 Dziennik zmian Antigravity
-
GitHub Enterprise Teams GA — Enterprise Teams osiąga ogólną dostępność na GitHub Enterprise Cloud: grupy definiowane raz na poziomie enterprise, przypisywalne do wszystkich organizacji, z SCIM, GitHub Apps i pełnym audytem. Do 2 500 zespołów i 5 000 członków na zespół. 🔗 Dziennik zmian GitHub
-
Genspark — partner uruchomienia Agent365 na Microsoft Build — Współzałożyciel Ray Zhong wystąpił na scenie podczas Microsoft Build jako globalny partner strategiczny i partner uruchomienia Agent365, integrując agentową AI z istniejącą infrastrukturą enterprise Microsoft. 🔗 Tweet Genspark
-
Cohere wspiera krajową strategię AI Kanady — CEO Aidan Gomez potwierdza kanadyjskie zakorzenienie Cohere, chwaląc nową krajową strategię AI Kanady jako ważny krok w stronę suwerenności technologicznej i budowy AI nowej generacji w kraju. 🔗 Tweet Cohere
Co to oznacza
Samodoskonalenie AI przechodzi z teorii do mierzalnych danych wewnętrznych. Publikacja Anthropic Institute nie jest spekulacją — to raport z terenu z konkretnymi liczbami: >80% kodu, ×8 produktywności, 76% skuteczności w zadaniach otwartych. Czas trwania autonomicznego zadania, który podwaja się co 4 miesiące, to najbardziej konkretny sygnał trwającej dynamiki. To, co w kręgach bezpieczeństwa AI było omawiane jako przyszłe ryzyko, zostało teraz udokumentowane jako obecna rzeczywistość. Apel o skoordynowaną przerwę — z Anthropic jako pierwszym wnioskodawcą — pokazuje napięcie między konkurencją komercyjną a ostrożnością regulacyjną.
Open-source klasy frontier zmienia skalę. Nemotron 3 Ultra z 550 miliardami parametrów — w pełni open-source, z możliwością pobrania wag, danymi syntetycznymi i opublikowanymi recepturami — redefiniuje znaczenie „open-source” dla modeli frontier. 5× szybsza inferencja i 30% redukcja kosztów dla zadań agentowych nie są marginalne: czynią wykonalnym uruchamianie złożonych agentów poza wielkimi, własnościowymi chmurami. Dla zespołów budujących autonomicznych agentów to nowa infrastruktura, która właśnie się pojawia.
Narzędzia dla deweloperów konsolidują się wokół agenta długodystansowego. GitHub Copilot z 1M tokenów kontekstu, Claude Code v2.1.162 z waitingFor w JSON agents, Flows Agent od ElevenLabs, który buduje multimodalne pipeline’y — te trzy ogłoszenia łączy ten sam paradygmat: agent musi zarządzać długimi kontekstami, komunikować swój stan innym systemom i orkiestruje wiele narzędzi bez udziału człowieka. „Konfigurowalne rozumowanie” Copilota i /effort Claude Code odpowiadają na to samo pytanie: jak użytkownik może dostroić głębokość rozumowania do złożoności zadania?
Gospodarka kreatywnej AI wchodzi na symboliczny kolejny poziom. Wycena Suno na $5,4 miliarda w siedem miesięcy — przy podwojeniu wartości — sygnalizuje, że inwestorzy stawiają na platformę generatywnego tworzenia muzyki na skalę masowego rynku. W połączeniu z niedawnymi rundami w obszarze wideo (Runway, Pika), sektor kreatywnej AI dysponuje teraz kapitalizacją porównywalną z dużymi tradycyjnymi wydawcami oprogramowania kreatywnego. Wejście Hasbro do Iconic Marketplace od ElevenLabs pokazuje, jak właściciele praw własności intelektualnej się dostosowują: zamiast blokować AI, monetyzują ją na licencji.
Źródła
- Anthropic Institute — Kiedy AI buduje samo siebie
- Tweet @AnthropicAI — samodoskonalenie
- NVIDIA Nemotron 3 Ultra — @NVIDIAAI
- HuggingFace — Nemotron 3 Ultra
- OpenAI — Dreaming v3 (pamięć ChatGPT)
- Suno — Seria D $400M
- Suno Blog — The Next Chapter
- GitHub Changelog — Copilot 1M context + rozumowanie
- GitHub Changelog — Copilot Visual Studio May update
- GitHub Changelog — Copilot Chat PR context GA
- Claude Code v2.1.162 — GitHub Releases
- ElevenLabs Flows Agent — @ElevenLabs
- ElevenLabs Iconic Marketplace
- ElevenLabs × Hasbro — @ElevenLabs
- OpenAI — nowe możliwości GPT-Rosalind
- Perplexity — Main Street AI Accelerator
- Main Street AI Accelerator — strona dedykowana
- Cohere — Challenge NATO 1. miejsce
- Pika — Group Chat iOS
- Anthropic blog — self-service analytics
- Google Antigravity v2.0.11 changelog
- GitHub Enterprise Teams GA
- Genspark — Agent365 Microsoft Build
- Cohere — krajowa strategia AI Kanady