Grok Build w wersji beta, Anthropic w Watykanie, ElevenLabs Music v2

25 i 26 maja 2026 roku oznaczają spektakularne wejście xAI na rynek agentów CLI z Grok Build (40,8 miliona wyświetleń), podczas gdy Anthropic publikuje artykuł inżynieryjny o bezpieczeństwie agentów, a jego współzałożyciel przemawia w Watykanie. Równolegle ElevenLabs wydaje Music v2 z cenami obniżonymi o połowę, Runway — jak twierdzi — przekracza „dolinę niesamowitości” (uncanny valley) w wideo AI, a OpenAI oraz Alibaba publikują istotne aktualizacje swoich narzędzi agentowych.

Grok Build — xAI uruchamia swojego agenta kodu w terminalu

25 maja 2026 — xAI uruchomiło Grok Build w wersji beta, agenta kodującego (coding agent) działającego bezpośrednio z terminala. Ogłoszenie wygenerowało 40,8 miliona wyświetleń na X w ciągu kilku godzin — to jeden z najbardziej wiralowych postów xAI od miesięcy.

Grok Build is now available in Beta for all SuperGrok and X Premium+ users. Use Plan Mode, create images and videos with Imagine, and build automations or orchestrators with the CLI. Visit x.ai/cli to get started.

🇵🇱 Grok Build jest już dostępny w wersji beta dla wszystkich użytkowników SuperGrok i X Premium+. Korzystaj z Plan Mode, twórz obrazy i filmy za pomocą Imagine oraz buduj automatyzacje lub orkiestratory z użyciem CLI. Wejdź na x.ai/cli, aby zacząć. — @xai na X

Narzędzie instaluje się jedną komendą: curl -fsSL https://x.ai/cli/install.sh | bash

Dostęp jest natychmiastowy dla subskrybentów SuperGrok i X Premium+, bez dodatkowych kosztów subskrypcji.

Główne funkcje

Funkcja	Opis
Plan Mode	Ustrukturyzowane planowanie przed jakąkolwiek zmianą — każda modyfikacja blokowana do czasu wyraźnej akceptacji
Skills	Reużywalne workflowy (AGENTS.md, wtyczki, hooki, MCP), wywoływalne automatycznie lub po nazwie — `/skillify` do tworzenia
Subagents	Specjalistyczni agenci uruchamiani równolegle do wyszukiwania, budowania i przeglądu
Plugins	Wspólny marketplace: Linear, Sentry, Postgres, przeglądarki przez MCP
Git integration	Stage, commit, push, zarządzanie gałęziami z terminala
Code review	Informacja zwrotna linia po linii przed otwarciem PR
Memory	Trwałość decyzji między sesjami
Headless mode	Możliwość użycia w potokach CI/CD

Architektoniczne podobieństwo do Claude Code jest uderzające: AGENTS.md, hooki, MCP, subagenci, worktree. Ta konwergencja potwierdza, że kategoria agentów CLI staje się standardem w narzędziach dla deweloperów AI.

🔗 Strona produktu Grok Build

Chris Olah (Anthropic) w Watykanie w sprawie encykliki papieża Leona XIV

25 maja 2026 — Papież Leon XIV opublikował encyklikę zatytułowaną „Magnifica humanitas : On safeguarding the human person in the time of artificial Intelligence”. Chris Olah, współzałożyciel Anthropic, został zaproszony do zabrania głosu podczas ceremonii prezentacji w Watykanie.

W swoim wystąpieniu Olah porusza trzy kwestie: presję komercyjną i geopolityczną wywieraną na laboratoria AI, zagadnienia globalnej sprawiedliwości (koncentrację zysków z AI w kilku bogatych państwach) oraz samą naturę modeli. W tym ostatnim punkcie wypowiada się ostrożnie:

“[W]e keep finding things that are mysterious, even unsettling. We find structures that mirror results from human neuroscience. We find evidence of introspection. We find internal states that functionally mirror joy, satisfaction, fear, grief, and unease. I don’t know what that means, but I think it warrants ongoing discernment.”

🇵🇱 Wciąż znajdujemy rzeczy tajemnicze, a nawet niepokojące. Odkrywamy struktury odzwierciedlające wyniki ludzkiej neuronauki. Dowody introspekcji. Stany wewnętrzne, które funkcjonalnie odzwierciedlają radość, zadowolenie, strach, smutek i dyskomfort. Nie wiem, co to oznacza, ale sądzę, że wymaga to ciągłego rozeznania. — Chris Olah, przemówienie w Watykanie, 25 maja 2026

Post @AnthropicAI zapowiadający artykuł wygenerował ponad 1 milion wyświetleń — to wyjątkowe zaangażowanie jak na treści instytucjonalne.

🔗 Tweet @AnthropicAI

Anthropic Engineering — Jak ograniczać agentów Claude

26 maja 2026 — Anthropic publikuje szczegółowy artykuł inżynieryjny na temat swojej strategii izolacji agentów Claude, podpisany przez pięciu inżynierów. Artykuł porównuje trzy architektury wdrożone w trzech produktach, wraz z rzeczywistymi incydentami i konkretnymi metrykami.

Produkt	Mechanizm izolacji	Promień rażenia
claude.ai	Kontener efemeryczny (gVisor)	Serwer, izolacja per tenant
Claude Code	Seatbelt (macOS) / bubblewrap (Linux), sieć domyślnie zablokowana	Lokalny workspace
Claude Cowork	Pełna VM (hiperwizor Apple/HCS)	Workspace montowany przez użytkownika

Udokumentowano trzy rzeczywiste incydenty: podatność hooka pre-trust dialog (Claude Code, połowa 2025 r.), przypadek phishingowej prompt injection z 24 udanymi eksfiltracjami na 25 prób oraz eksfiltrację przez zatwierdzoną domenę w Claude Cowork.

Opublikowane metryki bezpieczeństwa: Claude Opus 4.7 osiąga 0,1% skuteczności ataku przy pojedynczej próbie (Gray Swan Agent Red Teaming), 5–6% po 100 adaptacyjnych próbach. Tryb auto Claude Code wychwytuje 83% zbyt permissywnych zachowań przed wykonaniem.

🔗 Artykuł Engineering Blog

GitHub Copilot — Reguły modeli według organizacji

26 maja 2026 — GitHub uruchamia w publicznej wersji zapoznawczej (public preview) ukierunkowane reguły modeli (targeted model rules) dla GitHub Copilot. Administratorzy przedsiębiorstw mogą teraz określać, która organizacja ma dostęp do którego modelu Copilot, zamiast jednego ustawienia na poziomie całej firmy.

Każdy model można skonfigurować jako Enabled (włączony dla wszystkich organizacji) lub Optional (każda organizacja decyduje sama). Interfejs zarządzania domyślną dostępnością został całkowicie przeprojektowany. Funkcja jest dostępna dla Copilot Business i Copilot Enterprise.

🔗 Changelog GitHub

Manus Projects dostępne na urządzeniach mobilnych

25 maja 2026 — Manus ogłasza dostępność Projects w swojej aplikacji mobilnej. Funkcja obejmuje proste zarządzanie zadaniami aż po zaawansowane workflowy ze współdzielonymi plikami, instrukcjami, skills i konektorami.

Tweet z ogłoszeniem (48 388 wyświetleń, 574 polubienia) doprecyzowuje: „Projects are more than folders. Teach Manus how you want work done.” Projects pozwalają kodować preferencje pracy — powtarzalne instrukcje, pliki referencyjne, konektory — aby agent automatycznie stosował je do nowych zadań.

🔗 Ogłoszenie @ManusAI

Runway Project Luxo — przekroczyć dolinę niesamowitości

26 maja 2026 — Runway publikuje Project Luxo, raport badawczy uzupełniony trzema krótkometrażowymi filmami w 100% generowanymi przez AI, pokazywanymi profesjonalistom z branży filmowej. Wynik: wszyscy uczestnicy uznali, że filmy emocjonalnie „działają”.

Tytuł	Czas trwania	Zespół	Czas produkcji
The Rogue	9:57	1 osoba	3 tygodnie
Last Night	5:28	1 osoba	7 godzin
Pigeons in Time	0:46	1 osoba	4 godziny

Nazwa nawiązuje do Luxo Jr. (Pixar, SIGGRAPH 1986), krótkiego metrażu, który zaznaczył przełom ku wiarygodnej animacji 3D. Runway deklaruje przekroczenie równoważnego progu dla wideo AI. Fikcyjny spot opublikowany w kwietniu już wcześniej przekroczył 10 milionów wyświetleń w 48 godzin na Instagramie.

🔗 Project Luxo — Runway

ElevenLabs Music v2 — lepsza jakość, ceny podzielone przez dwa

26 maja 2026 — ElevenLabs uruchamia Music v2, dostępny natychmiast na ElevenMusic i ElevenCreative (ElevenAPI wkrótce). Nowy model poprawia jakość wokalną i orkiestrową w wielu gatunkach, inpainting (regenerację wyizolowanych sekcji), komponowanie sekcja po sekcji oraz obsługę wielojęzyczną.

Platforma	Zastosowanie
ElevenMusic	Studio twórcy: tworzenie, remix, rozwijanie
ElevenAPI	Dostęp do modelu dla deweloperów
ElevenCreative	Licencjonowana muzyka dla marek i treści wideo

Ceny spadają o -50% dla ElevenAPI i -40% dla ElevenCreative (klienci self-service). Każdy wygenerowany utwór można wykorzystywać komercyjnie. Model jest trenowany wyłącznie na danych licencjonowanych, z partnerstwem Believe.

🔗 Ogłoszenie ElevenLabs

AgentScope 2.0 — Alibaba publikuje framework produkcyjny dla agentów

26 maja 2026 — Tongyi Lab (Alibaba) publikuje AgentScope 2.0, open-source’owy framework do wdrażania agentów AI w produkcji. Deklarowany cel: przejść od „wiem, co robi mój agent” do „wiem, że mój agent wykona zadanie”.

Funkcja	Opis
Retry / fallback	Automatyczne przełączanie między modelami, jeśli jeden zawiedzie
System uprawnień	Precyzyjna kontrola nad dozwolonymi działaniami agenta
Streaming wykonania	Śledzenie działań agenta w czasie rzeczywistym

Dostępny w Pythonie i TypeScript (Java zapowiedziany wkrótce), z dedykowaną dokumentacją na docs.agentscope.io/v2.

🔗 Ogłoszenie @agentscope_ai

Codex CLI 0.134.0 — OpenAI ulepsza MCP i historię

26 maja 2026 — OpenAI publikuje Codex CLI w wersji 0.134.0 z sześcioma nowymi funkcjami. Wyszukiwanie w lokalnej historii rozmów (bez względu na wielkość liter, z podglądem wyników) ułatwia nawigację po wcześniejszych sesjach. Zarządzanie profilami jest ujednolicone za pomocą jednego flaga --profile dla CLI, TUI i sandboxa.

W obszarze MCP serwery mogą teraz celować w konkretne środowiska i korzystać z opcji OAuth dla strumieniowych serwerów HTTP (streamable). Oznaczone narzędzia MCP readOnlyHint uruchamiają się teraz równolegle. Hooki otrzymują wzbogacony kontekst obejmujący historię rozmowy i tożsamość subagenta.

Istotne poprawki: rozwiązano uszkodzenie renderowania TUI w Windows, a komunikaty o błędzie limitu użycia są teraz specyficzne dla workspace.

🔗 Changelog Codex CLI 0.134.0

Co to oznacza

Wydanie Grok Build pokazuje szybkie krystalizowanie się rynku agentów CLI. W ciągu kilku miesięcy Claude Code (Anthropic), Codex CLI (OpenAI), GitHub Copilot CLI, a teraz Grok Build zbiegnęły się wokół tej samej architektury: plik konwencji na katalog (CLAUDE.md / AGENTS.md), hooki, integracja MCP, równoległe subagenty. Rywalizacja przesuwa się w stronę jakości modeli bazowych, niezawodności w produkcji i ekosystemu wtyczek — nie architektury, która stała się de facto standardem.

Równoczesna publikacja artykułu Anthropic o izolacji oraz uruchomienie Grok Build ujawniają centralne napięcie chwili: agenci CLI stają się coraz potężniejsi (dostęp do systemu, wykonywanie kodu, git, CI/CD), podczas gdy społeczność zaczyna poważnie dokumentować ryzyka. 24 eksfiltracje na 25 prób w teście phishingowym Anthropic oraz podatność pre-trust dialog w Claude Code przypominają, że bezpieczeństwo agentów terminalowych wciąż pozostaje problemem otwartym. Publikacja konkretnych metryk (Gray Swan 0,1%, auto-capture 83%) jest krokiem w stronę przejrzystości w tej kwestii.

Wystąpienie Chrisa Olaha w Watykanie wpisuje się w szerszy ruch: badacze z laboratoriów AI wchodzą w dialog z instytucjami nietechnologicznymi (Kościół, rządy, społeczeństwo obywatelskie) na temat kwestii, których sama technika nie potrafi rozwiązać. Pytanie o naturę modeli — stany wewnętrzne, introspekcję, formy funkcjonalnej świadomości — wychodzi poza kręgi badawcze i trafia do debaty publicznej. Papieska encyklika „Magnifica humanitas” jest sygnałem, że pytania te docierają już do najwyższego poziomu światowych instytucji moralnych.

Spadek cen ElevenLabs (-50% API, -40% Creative) oraz filmy Runway tworzone przez jedną osobę w ciągu kilku godzin wskazują ten sam kierunek: generowanie kreatywnych mediów o profesjonalnej jakości staje się dostępne dla indywidualnych twórców. Project Luxo i Music v2 nie są ściśle technicznymi zapowiedziami — to demonstracje, że narzędzia przekroczyły próg użyteczności dla realnych zastosowań zawodowych.