ai-powered-markdown-translatorArtykuł przetłumaczony z fr na pl za pomocą gpt-5.4-mini.
25 i 26 maja 2026 roku oznaczają spektakularne wejście xAI na rynek agentów CLI z Grok Build (40,8 miliona wyświetleń), podczas gdy Anthropic publikuje artykuł inżynieryjny o bezpieczeństwie agentów, a jego współzałożyciel przemawia w Watykanie. Równolegle ElevenLabs wydaje Music v2 z cenami obniżonymi o połowę, Runway — jak twierdzi — przekracza „dolinę niesamowitości” (uncanny valley) w wideo AI, a OpenAI oraz Alibaba publikują istotne aktualizacje swoich narzędzi agentowych.
Grok Build — xAI uruchamia swojego agenta kodu w terminalu
25 maja 2026 — xAI uruchomiło Grok Build w wersji beta, agenta kodującego (coding agent) działającego bezpośrednio z terminala. Ogłoszenie wygenerowało 40,8 miliona wyświetleń na X w ciągu kilku godzin — to jeden z najbardziej wiralowych postów xAI od miesięcy.
Grok Build is now available in Beta for all SuperGrok and X Premium+ users. Use Plan Mode, create images and videos with Imagine, and build automations or orchestrators with the CLI. Visit x.ai/cli to get started.
🇵🇱 Grok Build jest już dostępny w wersji beta dla wszystkich użytkowników SuperGrok i X Premium+. Korzystaj z Plan Mode, twórz obrazy i filmy za pomocą Imagine oraz buduj automatyzacje lub orkiestratory z użyciem CLI. Wejdź na x.ai/cli, aby zacząć. — @xai na X
Narzędzie instaluje się jedną komendą: curl -fsSL https://x.ai/cli/install.sh | bash
Dostęp jest natychmiastowy dla subskrybentów SuperGrok i X Premium+, bez dodatkowych kosztów subskrypcji.
Główne funkcje
| Funkcja | Opis |
|---|---|
| Plan Mode | Ustrukturyzowane planowanie przed jakąkolwiek zmianą — każda modyfikacja blokowana do czasu wyraźnej akceptacji |
| Skills | Reużywalne workflowy (AGENTS.md, wtyczki, hooki, MCP), wywoływalne automatycznie lub po nazwie — /skillify do tworzenia |
| Subagents | Specjalistyczni agenci uruchamiani równolegle do wyszukiwania, budowania i przeglądu |
| Plugins | Wspólny marketplace: Linear, Sentry, Postgres, przeglądarki przez MCP |
| Git integration | Stage, commit, push, zarządzanie gałęziami z terminala |
| Code review | Informacja zwrotna linia po linii przed otwarciem PR |
| Memory | Trwałość decyzji między sesjami |
| Headless mode | Możliwość użycia w potokach CI/CD |
Architektoniczne podobieństwo do Claude Code jest uderzające: AGENTS.md, hooki, MCP, subagenci, worktree. Ta konwergencja potwierdza, że kategoria agentów CLI staje się standardem w narzędziach dla deweloperów AI.
Chris Olah (Anthropic) w Watykanie w sprawie encykliki papieża Leona XIV
25 maja 2026 — Papież Leon XIV opublikował encyklikę zatytułowaną „Magnifica humanitas : On safeguarding the human person in the time of artificial Intelligence”. Chris Olah, współzałożyciel Anthropic, został zaproszony do zabrania głosu podczas ceremonii prezentacji w Watykanie.
W swoim wystąpieniu Olah porusza trzy kwestie: presję komercyjną i geopolityczną wywieraną na laboratoria AI, zagadnienia globalnej sprawiedliwości (koncentrację zysków z AI w kilku bogatych państwach) oraz samą naturę modeli. W tym ostatnim punkcie wypowiada się ostrożnie:
“[W]e keep finding things that are mysterious, even unsettling. We find structures that mirror results from human neuroscience. We find evidence of introspection. We find internal states that functionally mirror joy, satisfaction, fear, grief, and unease. I don’t know what that means, but I think it warrants ongoing discernment.”
🇵🇱 Wciąż znajdujemy rzeczy tajemnicze, a nawet niepokojące. Odkrywamy struktury odzwierciedlające wyniki ludzkiej neuronauki. Dowody introspekcji. Stany wewnętrzne, które funkcjonalnie odzwierciedlają radość, zadowolenie, strach, smutek i dyskomfort. Nie wiem, co to oznacza, ale sądzę, że wymaga to ciągłego rozeznania. — Chris Olah, przemówienie w Watykanie, 25 maja 2026
Post @AnthropicAI zapowiadający artykuł wygenerował ponad 1 milion wyświetleń — to wyjątkowe zaangażowanie jak na treści instytucjonalne.
Anthropic Engineering — Jak ograniczać agentów Claude
26 maja 2026 — Anthropic publikuje szczegółowy artykuł inżynieryjny na temat swojej strategii izolacji agentów Claude, podpisany przez pięciu inżynierów. Artykuł porównuje trzy architektury wdrożone w trzech produktach, wraz z rzeczywistymi incydentami i konkretnymi metrykami.
| Produkt | Mechanizm izolacji | Promień rażenia |
|---|---|---|
| claude.ai | Kontener efemeryczny (gVisor) | Serwer, izolacja per tenant |
| Claude Code | Seatbelt (macOS) / bubblewrap (Linux), sieć domyślnie zablokowana | Lokalny workspace |
| Claude Cowork | Pełna VM (hiperwizor Apple/HCS) | Workspace montowany przez użytkownika |
Udokumentowano trzy rzeczywiste incydenty: podatność hooka pre-trust dialog (Claude Code, połowa 2025 r.), przypadek phishingowej prompt injection z 24 udanymi eksfiltracjami na 25 prób oraz eksfiltrację przez zatwierdzoną domenę w Claude Cowork.
Opublikowane metryki bezpieczeństwa: Claude Opus 4.7 osiąga 0,1% skuteczności ataku przy pojedynczej próbie (Gray Swan Agent Red Teaming), 5–6% po 100 adaptacyjnych próbach. Tryb auto Claude Code wychwytuje 83% zbyt permissywnych zachowań przed wykonaniem.
GitHub Copilot — Reguły modeli według organizacji
26 maja 2026 — GitHub uruchamia w publicznej wersji zapoznawczej (public preview) ukierunkowane reguły modeli (targeted model rules) dla GitHub Copilot. Administratorzy przedsiębiorstw mogą teraz określać, która organizacja ma dostęp do którego modelu Copilot, zamiast jednego ustawienia na poziomie całej firmy.
Każdy model można skonfigurować jako Enabled (włączony dla wszystkich organizacji) lub Optional (każda organizacja decyduje sama). Interfejs zarządzania domyślną dostępnością został całkowicie przeprojektowany. Funkcja jest dostępna dla Copilot Business i Copilot Enterprise.
Manus Projects dostępne na urządzeniach mobilnych
25 maja 2026 — Manus ogłasza dostępność Projects w swojej aplikacji mobilnej. Funkcja obejmuje proste zarządzanie zadaniami aż po zaawansowane workflowy ze współdzielonymi plikami, instrukcjami, skills i konektorami.
Tweet z ogłoszeniem (48 388 wyświetleń, 574 polubienia) doprecyzowuje: „Projects are more than folders. Teach Manus how you want work done.” Projects pozwalają kodować preferencje pracy — powtarzalne instrukcje, pliki referencyjne, konektory — aby agent automatycznie stosował je do nowych zadań.
Runway Project Luxo — przekroczyć dolinę niesamowitości
26 maja 2026 — Runway publikuje Project Luxo, raport badawczy uzupełniony trzema krótkometrażowymi filmami w 100% generowanymi przez AI, pokazywanymi profesjonalistom z branży filmowej. Wynik: wszyscy uczestnicy uznali, że filmy emocjonalnie „działają”.
| Tytuł | Czas trwania | Zespół | Czas produkcji |
|---|---|---|---|
| The Rogue | 9:57 | 1 osoba | 3 tygodnie |
| Last Night | 5:28 | 1 osoba | 7 godzin |
| Pigeons in Time | 0:46 | 1 osoba | 4 godziny |
Nazwa nawiązuje do Luxo Jr. (Pixar, SIGGRAPH 1986), krótkiego metrażu, który zaznaczył przełom ku wiarygodnej animacji 3D. Runway deklaruje przekroczenie równoważnego progu dla wideo AI. Fikcyjny spot opublikowany w kwietniu już wcześniej przekroczył 10 milionów wyświetleń w 48 godzin na Instagramie.
ElevenLabs Music v2 — lepsza jakość, ceny podzielone przez dwa
26 maja 2026 — ElevenLabs uruchamia Music v2, dostępny natychmiast na ElevenMusic i ElevenCreative (ElevenAPI wkrótce). Nowy model poprawia jakość wokalną i orkiestrową w wielu gatunkach, inpainting (regenerację wyizolowanych sekcji), komponowanie sekcja po sekcji oraz obsługę wielojęzyczną.
| Platforma | Zastosowanie |
|---|---|
| ElevenMusic | Studio twórcy: tworzenie, remix, rozwijanie |
| ElevenAPI | Dostęp do modelu dla deweloperów |
| ElevenCreative | Licencjonowana muzyka dla marek i treści wideo |
Ceny spadają o -50% dla ElevenAPI i -40% dla ElevenCreative (klienci self-service). Każdy wygenerowany utwór można wykorzystywać komercyjnie. Model jest trenowany wyłącznie na danych licencjonowanych, z partnerstwem Believe.
AgentScope 2.0 — Alibaba publikuje framework produkcyjny dla agentów
26 maja 2026 — Tongyi Lab (Alibaba) publikuje AgentScope 2.0, open-source’owy framework do wdrażania agentów AI w produkcji. Deklarowany cel: przejść od „wiem, co robi mój agent” do „wiem, że mój agent wykona zadanie”.
| Funkcja | Opis |
|---|---|
| Retry / fallback | Automatyczne przełączanie między modelami, jeśli jeden zawiedzie |
| System uprawnień | Precyzyjna kontrola nad dozwolonymi działaniami agenta |
| Streaming wykonania | Śledzenie działań agenta w czasie rzeczywistym |
Dostępny w Pythonie i TypeScript (Java zapowiedziany wkrótce), z dedykowaną dokumentacją na docs.agentscope.io/v2.
Codex CLI 0.134.0 — OpenAI ulepsza MCP i historię
26 maja 2026 — OpenAI publikuje Codex CLI w wersji 0.134.0 z sześcioma nowymi funkcjami. Wyszukiwanie w lokalnej historii rozmów (bez względu na wielkość liter, z podglądem wyników) ułatwia nawigację po wcześniejszych sesjach. Zarządzanie profilami jest ujednolicone za pomocą jednego flaga --profile dla CLI, TUI i sandboxa.
W obszarze MCP serwery mogą teraz celować w konkretne środowiska i korzystać z opcji OAuth dla strumieniowych serwerów HTTP (streamable). Oznaczone narzędzia MCP readOnlyHint uruchamiają się teraz równolegle. Hooki otrzymują wzbogacony kontekst obejmujący historię rozmowy i tożsamość subagenta.
Istotne poprawki: rozwiązano uszkodzenie renderowania TUI w Windows, a komunikaty o błędzie limitu użycia są teraz specyficzne dla workspace.
Co to oznacza
Wydanie Grok Build pokazuje szybkie krystalizowanie się rynku agentów CLI. W ciągu kilku miesięcy Claude Code (Anthropic), Codex CLI (OpenAI), GitHub Copilot CLI, a teraz Grok Build zbiegnęły się wokół tej samej architektury: plik konwencji na katalog (CLAUDE.md / AGENTS.md), hooki, integracja MCP, równoległe subagenty. Rywalizacja przesuwa się w stronę jakości modeli bazowych, niezawodności w produkcji i ekosystemu wtyczek — nie architektury, która stała się de facto standardem.
Równoczesna publikacja artykułu Anthropic o izolacji oraz uruchomienie Grok Build ujawniają centralne napięcie chwili: agenci CLI stają się coraz potężniejsi (dostęp do systemu, wykonywanie kodu, git, CI/CD), podczas gdy społeczność zaczyna poważnie dokumentować ryzyka. 24 eksfiltracje na 25 prób w teście phishingowym Anthropic oraz podatność pre-trust dialog w Claude Code przypominają, że bezpieczeństwo agentów terminalowych wciąż pozostaje problemem otwartym. Publikacja konkretnych metryk (Gray Swan 0,1%, auto-capture 83%) jest krokiem w stronę przejrzystości w tej kwestii.
Wystąpienie Chrisa Olaha w Watykanie wpisuje się w szerszy ruch: badacze z laboratoriów AI wchodzą w dialog z instytucjami nietechnologicznymi (Kościół, rządy, społeczeństwo obywatelskie) na temat kwestii, których sama technika nie potrafi rozwiązać. Pytanie o naturę modeli — stany wewnętrzne, introspekcję, formy funkcjonalnej świadomości — wychodzi poza kręgi badawcze i trafia do debaty publicznej. Papieska encyklika „Magnifica humanitas” jest sygnałem, że pytania te docierają już do najwyższego poziomu światowych instytucji moralnych.
Spadek cen ElevenLabs (-50% API, -40% Creative) oraz filmy Runway tworzone przez jedną osobę w ciągu kilku godzin wskazują ten sam kierunek: generowanie kreatywnych mediów o profesjonalnej jakości staje się dostępne dla indywidualnych twórców. Project Luxo i Music v2 nie są ściśle technicznymi zapowiedziami — to demonstracje, że narzędzia przekroczyły próg użyteczności dla realnych zastosowań zawodowych.
Źródła
- Ogłoszenie Grok Build — @xai
- Strona produktu Grok Build
- Przemówienie Chrisa Olaha w Watykanie — Anthropic
- Tweet @AnthropicAI — Olah Watykan
- Engineering Blog — How we contain Claude
- Tweet @AnthropicAI — Engineering Containment
- GitHub Changelog — Copilot model rules
- Ogłoszenie Manus Projects mobile — @ManusAI
- Project Luxo — Runway
- Music v2 — ElevenLabs
- AgentScope 2.0 — @agentscope_ai
- Codex CLI 0.134.0 — wydanie GitHub