Runway Agent, Grok Build CLI, ChatGPT Finanse osobiste, Copilot App Desktop i scenariusze 2028 w konkurencji AI

Intensywny tydzień: Runway Agent zamienia produkcję wideo w rozmowę, xAI wchodzi do wyścigu terminalowych coding agents CLI z Grok Build, ChatGPT zabiera się za finanse osobiste przez Plaid, a GitHub udostępnia swoją Copilot App desktop w technical preview. Tymczasem Anthropic publikuje dokument polityczny o konkurencji AI USA/Chiny w horyzoncie 2028, a Perplexity Computer łączy się ze Snowflake dla enterprise analytics.

Runway Agent — kreatywny partner AI do pełnej produkcji wideo

13 maja — Runway uruchamia Runway Agent, konwersacyjnego kreatywnego partnera zdolnego tworzyć całe filmy — wraz z sound design i montażem — w jednej sesji, na podstawie zwykłej rozmowy. Opublikowana 15 maja demonstracja pokazuje stworzenie kompletnej reklamy od product shot, bez ręcznej ingerencji między etapami.

Możliwość	Opis
Pełna produkcja	Ideacja + sound design + montaż w jednej rozmowie
Typy treści	Reklamy, shorty, treści społecznościowe
Punkt wejścia	app.runwayml.com/agent
Zaangażowanie X	499 800 wyświetleń, 237 zakładek

Różnica względem zwykłych narzędzi generatywnych jest strukturalna: Runway Agent nie tworzy jedynie pojedynczych klipów, lecz orkiestruje cały kreatywny pipeline. Użytkownik opisuje swoją potrzebę („reklama tego produktu, energiczny ton, 30 sekund”), a agent planuje, generuje, składa i dostarcza.

Meet Runway Agent. Your new AI creative partner that helps you ideate and execute fully finished, sound designed and edited videos. All with just a simple conversation.

🇵🇱 Poznaj Runway Agent. Twój nowy kreatywny partner AI, który pomaga Ci wyobrażać sobie i tworzyć w pełni gotowe filmy, ze sound design i montażem. Wszystko to za pomocą zwykłej rozmowy. — @runwayml na X

Premiera następuje tydzień po ogłoszeniu ekspansji do Japonii (zobacz kolejny rozdział), sygnalizując równoległą strategię wzrostu geograficznego i produktowego.

🔗 Runway Agent

Grok Build Early Beta — terminal-native CLI agent do kodowania od xAI

14 maja — xAI uruchamia Grok Build w otwartej becie: terminal-native CLI agent do tworzenia oprogramowania, bezpośredni konkurent Claude Code i Gemini CLI. Dostępny najpierw dla subskrybentów SuperGrok Heavy (99 USD/mies. w cenie wprowadzającej, normalnie 299 USD/mies.), CLI instaluje się przez curl -fsSL https://x.ai/cli/install.sh | bash.

Funkcjonalność	Szczegóły
Model bazowy	Grok 4.3 beta, architektura Heavy 16 agentów
Okno kontekstu	2M tokenów
Plan/review/approve	Tryb planowania do zatwierdzenia przed wykonaniem, czytelne diffs
Równoległe podagenty	Delegowanie do specjalistów równolegle, wsparcie worktree
Integracje	AGENTS.md, plugins, hooks, skills, serwery MCP kompatybilne
Tryb headless	Flaga `-p`, pełne wsparcie ACP dla skryptów i automations
Feedback	Wbudowana komenda `/feedback`

Grok Build wchodzi bezpośrednio do rywalizacji w segmencie coding agents CLI, który skupia dziś trzech graczy: Claude Code (Anthropic), Gemini CLI (Google) i Grok Build (xAI). Deklarowaną przewagą jest gotowa po wyjęciu z pudełka kompatybilność z istniejącymi narzędziami (AGENTS.md, serwery MCP) oraz wieloagentowa, równoległa architektura Grok 4.3. Ogłoszenie wygenerowało 53 miliony wyświetleń na X.

🔗 Grok Build

ChatGPT Personal Finance — połączenie kont bankowych przez Plaid

15 maja — OpenAI uruchamia w podglądzie (preview) dla abonentów Pro w Stanach Zjednoczonych nową funkcję finansów osobistych w ChatGPT. Użytkownicy mogą teraz łączyć swoje konta finansowe przez Plaid, uzyskiwać dostęp do ujednoliconego pulpitu i zadawać pytania w języku naturalnym oparte na ich rzeczywistych danych.

Plan	Dostęp	Region
Pro	Natychmiastowy preview	Tylko Stany Zjednoczone
Plus	Wkrótce	—
Free	Docelowo	—

Kluczowe funkcje:

Połączenie z ponad 12 000 instytucji finansowych przez Plaid (integracja z Intuit wkrótce)
Ujednolicony pulpit: portfel, wydatki, subskrypcje, nadchodzące płatności
Finansowe memories (Financial memories): ChatGPT pamięta cele, długi, wspólne projekty
Domyślny model: GPT-5.5 Thinking (GPT-5.5 Pro dla abonentów Pro)
ChatGPT nie może wykonywać operacji ani widzieć pełnych numerów kont
Odłączenie konta powoduje usunięcie danych w ciągu 30 dni

W wewnętrznym benchmarku ocenianym z udziałem ponad 50 profesjonalistów finansowych: GPT-5.5 Thinking osiąga 79/100, a GPT-5.5 Pro 82,5/100 w złożonych zadaniach z finansów osobistych. Partnerstwo z Intuit pozwoli wyjść poza same odpowiedzi — rekomendacja karty kredytowej z weryfikacją kwalifikacji i wnioskiem online, konsekwencje podatkowe z konsultacją eksperta.

🔗 ChatGPT Personal Finance

GitHub Copilot App — aplikacja desktopowa w technical preview

14 maja — GitHub uruchamia GitHub Copilot App w technical preview: natywną desktopową aplikację GitHub do agentowego tworzenia oprogramowania. Copilot Business i Enterprise mają do niej dostęp od momentu aktywacji przez organizację (wdrożenie w tygodniu 14 maja) ; Copilot Pro i Pro+ muszą zapisać się do early access z stopniowym wdrażaniem.

Funkcjonalność	Opis
Izolowane sesje	Każda sesja ma własną gałąź, pliki, rozmowę i stan zadania
Start from GitHub context	Start z issue, PR, promptu lub poprzedniej sesji
Ujednolicone inbox	Widok issue/PR do obsłużenia we wszystkich połączonych repozytoriach
Pauza/wznowienie	Wyjście z sesji i powrót dokładnie tam, gdzie została przerwana
Zautomatyzowane workflow	Skills + prompty do triage, zależności, release notes, cleanup
Terminal + wbudowana przeglądarka	Walidacja zmian bezpośrednio w aplikacji
Agent Merge	Agent obsługuje komentarze z review, poprawia checks i automatycznie robi merge

Wymagania admina: włączone preview + Copilot CLI włączony w policy settings.

Aplikacja reprezentuje zbieżność agentowych możliwości Copilot w dedykowanym środowisku desktopowym, odrębnym od pluginu IDE i interfejsu webowego. Agent Merge to najbardziej zaawansowana funkcja: agent czyta komentarze z review, wprowadza poprawki, rozwiązuje blokujące checks i robi merge — bez ludzkiej interwencji na etapach pośrednich.

🔗 GitHub Copilot App Technical Preview

Copilot CLI agent i ujednolicone sesje w JetBrains IDEs

13 maja — GitHub dostarcza dużą aktualizację wtyczki GitHub Copilot dla JetBrains IDEs z wprowadzeniem Copilot CLI agent w public preview.

Funkcjonalność	Opis
Copilot CLI agent	Delegowanie długich zadań z JetBrains do lokalnego CLI agent
Worktree isolation	Agent pracuje w oddzielnym worktree Git, nie dotykając bieżącej gałęzi
Workspace isolation	Agent stosuje zmiany bezpośrednio dla szybkiej iteracji
Ujednolicony widok sesji	Wszystkie sesje agenta ze statusem, typem i czasem w jednym miejscu
Ask question tool	Agent może zadawać ukierunkowane pytania doprecyzowujące
Global .agent.md	Własne agenty w `~/.copilot/agents`, dostępne wszędzie
Wsparcie GHES sign-in	GitHub Enterprise Server w przepływie uwierzytelniania

Wycofanie: tryb “Edit” został usunięty w tej aktualizacji.

Izolacja worktree jest kluczowa: agent CLI pracuje w dedykowanej, odizolowanej gałęzi Git, pozwalając użytkownikowi nadal pracować na głównej gałęzi, podczas gdy agent równolegle wykonuje długie zadania.

🔗 Copilot CLI agent JetBrains

Anthropic — Scenariusze 2028 dla globalnej konkurencji AI

14 maja — Anthropic opublikował dokument polityczny (policy paper) zatytułowany “2028: Two scenarios for global AI leadership”, przedstawiający jego stanowisko w sprawie konkurencji AI między Stanami Zjednoczonymi a Chinami. Artykuł wygenerował 3,8 miliona wyświetleń na X w 24 godziny.

Dokument opisuje dwa hipotetyczne scenariusze na 2028 rok:

Scenariusz 1 — Skonsolidowana przewaga demokratyczna: Stany Zjednoczone i ich sojusznicy utrzymują przewagę 12 do 24 miesięcy nad granicą modeli. Kontrole eksportu półprzewodników są wzmacniane, ataki przez distillation zostają powstrzymane, a amerykańska AI dominuje światową gospodarkę.

Scenariusz 2 — Wyścig łeb w łeb z Chinami: Chińska Partia Komunistyczna zdoła utrzymać się na poziomie granicy dzięki obchodzeniu kontroli eksportu (przemyt chipów, offshore data centers) oraz masowym atakom przez distillation na amerykańskie modele.

Wskaźnik	Wartość
Wyświetlenia na X	3,8 miliona
Zalecana docelowa przewaga USA	12–24 miesiące w 2028
Compute Huawei vs NVIDIA 2026	4% w wydajności całkowitej
Compute Huawei vs NVIDIA 2027	2% (szac.)

Anthropic identyfikuje cztery fronty konkurencji: inteligencję (możliwości modeli), krajową adopcję, globalną dystrybucję i odporność. Rekomendowane są trzy kierunki działań politycznych: zamknięcie luk w kontrolach eksportowych, przeciwdziałanie nielegalnym atakom przez distillation oraz promowanie globalnego eksportu amerykańskiej AI.

We’ve published a paper that explains our views on AI competition between the US and China. The US and democratic allies hold the lead in frontier AI today.

🇵🇱 Opublikowaliśmy dokument wyjaśniający nasze stanowisko w sprawie konkurencji AI między Stanami Zjednoczonymi a Chinami. Stany Zjednoczone i ich demokratyczni sojusznicy utrzymują dziś pozycję lidera w AI granicznej. — @AnthropicAI na X

🔗 2028: Two scenarios for global AI leadership

Perplexity Computer + Snowflake — enterprise workflows na żywych danych

14 maja — Perplexity Computer łączy się teraz ze Snowflake, umożliwiając wykonywanie end-to-end workflow bezpośrednio na żywych danych z data warehouse. Udokumentowane przypadki użycia obejmują analizę pipeline, śledzenie wykorzystania produktu i analitykę klienta.

Integracja pozycjonuje Perplexity Computer w segmencie enterprise self-service analytics: analityk może zadawać pytania w języku naturalnym o swoje dane Snowflake i otrzymywać zautomatyzowane workflow — ekstrakcję, transformację, wizualizację — bez kodu. Ogłoszenie wygenerowało 60 761 wyświetleń i 99 zakładek na X, z istotnym enterprise traction.

🔗 Perplexity Computer + Snowflake

PayPal — 74 000 zadań tygodniowo na Perplexity Enterprise

13 maja — Perplexity publikuje case study klienta PayPal: firma wykonuje 74 000 zadań tygodniowo poprzez Perplexity Enterprise w zastosowaniach model validation i channel analytics. To jak dotąd najwyższa publicznie ujawniona liczba użycia enterprise podana przez Perplexity dla pojedynczego klienta. Ogłoszenie, wraz z wpisem na blogu opisującym workflow PayPal, wygenerowało 61 442 wyświetlenia i 81 zakładek na X — znaczące zaangażowanie jak na news B2B. Ten case study, połączony z integracją Snowflake ogłoszoną następnego dnia, rysuje spójną strategię awansu Perplexity Computer w enterprise.

🔗 PayPal + Perplexity Enterprise

Codex w aplikacji mobilnej ChatGPT (iOS i Android)

14 maja — Codex jest teraz dostępny w aplikacji mobilnej ChatGPT (iOS i Android), w preview na wszystkich planach, w tym Free i Go. OpenAI informuje, że 4 miliony użytkowników korzystają z Codex co tydzień.

Funkcjonalność	Opis
Połączenie wielu maszyn	Laptop, Mac mini, zarządzane zdalne środowisko
Stan w czasie rzeczywistym	Zrzuty ekranu, wyjścia terminala, diffs, wyniki testów
Akcje z poziomu telefonu	Start, odblokowanie, zatwierdzenie, zmiana modelu
Remote SSH	Teraz w ogólnej dostępności (generally available)
Hooks	W ogólnej dostępności — skan promptów, walidatory, własne memories
Programmatic tokens	Do pipeline CI, dostępne Enterprise i Business
Zgodność HIPAA	Dla lokalnego Codex na przestrzeniach roboczych ChatGPT Enterprise

You’ve been asking for this one… Now in preview: Codex in the ChatGPT mobile app. Start new work, review outputs, steer execution, and approve next steps, all from the ChatGPT mobile app. Codex will keep running on your laptop, Mac mini, or devbox.

🇵🇱 Czekaliście na to… Teraz w preview: Codex w aplikacji mobilnej ChatGPT. Uruchamiaj nowe zadania, sprawdzaj wyniki, kieruj wykonaniem i zatwierdzaj kolejne kroki — wszystko z poziomu aplikacji mobilnej ChatGPT. Codex będzie nadal działać na Twoim laptopie, Mac mini lub devbox. — @OpenAI na X

🔗 Codex na mobile

Anthropic — Claude for Small Business, Gates Foundation, PwC

Claude for Small Business

13 maja — Anthropic uruchamia Claude for Small Business: 15 workflow agentowych i 15 wstępnie skonfigurowanych skills dla małych firm, poprzez Claude Cowork. Połączone narzędzia obejmują QuickBooks, PayPal, HubSpot, Canva, Docusign, Google Workspace i Microsoft 365. Funkcje obejmują payroll, monthly close, śledzenie cash flow, kampanie marketingowe i przypomnienia o fakturach. Trasa “Claude SMB Tour” rozpoczyna się 14 maja w Chicago (100 menedżerów MŚP na każdym etapie, miesięczna subskrypcja Claude Max gratis).

🔗 Claude for Small Business

Partnerstwo za 200 milionów USD z Gates Foundation

14 maja — Anthropic i Bill & Melinda Gates Foundation ogłaszają partnerstwo o wartości 200 milionów USD na cztery lata. Kredyty Claude, granty i wsparcie techniczne obejmują cztery obszary: global health (szczepionki i terapie chorób krajów o niskich dochodach — polio, HPV, stan przedrzucawkowy), life sciences, edukację K-12 w Afryce Subsaharyjskiej i Indiach oraz mobility ekonomiczną dla solopreneurów i rolników. Docelowa populacja po stronie zdrowia to 4,6 miliarda osób bez dostępu do podstawowej opieki.

🔗 Partnerstwo z Gates Foundation

Rozszerzony sojusz z PwC

14 maja — PwC wdroży Claude Code i Claude Cowork wśród swoich zespołów w USA, a następnie globalnie. Sojusz tworzy wspólne Centre of Excellence oraz program certyfikacji dla 30 000 specjalistów PwC. Obecne wdrożenia produkcyjne raportują zyski do 70%: underwriting ubezpieczeniowy skrócony z 10 tygodni do 10 dni, obsługa incydentów cyberbezpieczeństwa z kilku godzin do kilku minut. Uruchomiona zostaje nowa jednostka “Office of the CFO”, skierowana do sektorów regulowanych.

🔗 PwC + Anthropic

Claude Code v2.1.141-142 — hooki terminalSequence, flagi claude agents + Fast mode Opus 4.7

Dwie wersje opublikowane 14 i 15 maja 2026 przynoszą istotne ulepszenia w Claude Code, w szczególności w zarządzaniu hookami, sesjach w tle i trybie Fast.

Nowość (v2.1.142)	Szczegół
Nowe flagi `claude agents`	`--add-dir`, `--settings`, `--mcp-config`, `--plugin-dir`, `--permission-mode`, `--model`, `--effort`, `--dangerously-skip-permissions`
Fast mode → Opus 4.7	Domyślnie od teraz (zmienna `CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1`, aby wrócić do Opus 4.6)
Wtyczki SKILL.md w katalogu głównym	Wtyczka z `SKILL.md` w katalogu głównym bez podkatalogu `skills/` jest teraz udostępniana jako umiejętność

Nowość (v2.1.141)	Szczegół
`terminalSequence` w hookach	Powiadomienia na pulpicie, tytuły okien, dzwonki bez terminala sterującego
`claude agents --cwd <chemin>`	Filtrowanie listy sesji według katalogu
`ANTHROPIC_WORKSPACE_ID`	Federacja tożsamości obciążenia roboczego (workload identity federation)
Rewind “Summarize up to here”	Kompresja wcześniejszego kontekstu z menu Rewind
Bursztynowy spinner	Sygnalizuje, że Claude nadal pracuje po 10 sekundach

Istotne poprawki (v2.1.142): MCP_TOOL_TIMEOUT nie ograniczał już wywołań HTTP/SSE do 60 sekund; crash-loop demona po brew upgrade; deadlock Windows na dysku sieciowym. Wersja v2.1.141 zawierała również ponad 40 poprawek dotyczących sesji w tle, wtyczek MCP, hooków i renderowania terminala.

🔗 CHANGELOG Claude Code

Claude Code — cotygodniowe limity +50% do 13 lipca

13 maja — @ClaudeDevs ogłasza zwiększenie 50% cotygodniowych limitów Claude Code do 13 lipca 2026 o 18:00 PDT, dla wszystkich planów Pro, Max, Team i Enterprise. Podwyżka dotyczy CLI, rozszerzeń IDE, desktopu i webu — bez konieczności podejmowania działań przez użytkownika. Sumuje się z podwojeniem limitów na 5 godzin ogłoszonym 6 maja.

🔗 ClaudeDevs na X

GitHub — dodatkowe aktualizacje Copilot

Copilot Memory — preferencje użytkownika (Pro i Pro+)

15 maja — Copilot Memory rozszerza swój zasięg na poziom użytkownika (early access). Wcześniej pamięć przechowywała tylko informacje na poziomie repozytorium. Teraz osobiste preferencje (styl commitów, struktura pull requestów, ton komunikacji) podążają za użytkownikiem we wszystkich jego repozytoriach i agentach. Można nimi zarządzać w osobistych ustawieniach Copilot Memory.

🔗 Copilot Memory na poziomie użytkownika

Copilot cloud agent — automatyczny wybór modelu

14 maja — Tryb “Auto” w model pickerze cloud agenta pozwala Copilotowi inteligentnie wybierać najlepszy model w zależności od kondycji systemu i wydajności. Zalety: 10% zniżki na normalny mnożnik, brak tygodniowego rate limitu w tym trybie.

🔗 Automatyczny wybór modelu

Agent tasks REST API (Business/Enterprise)

13 maja — Użytkownicy Copilot Business i Enterprise mogą teraz uruchamiać zadania cloud agenta przez nowe Agent tasks REST API (public preview). Przypadki użycia: masowy refactoring w wielu repozytoriach, inicjalizacja repozytoriów z wewnętrznego portalu deweloperskiego, automatyczne przygotowywanie release notes. Uwierzytelnianie przez PAT (classic i fine-grained) oraz tokeny OAuth. Wsparcie dla tokenów instalacyjnych GitHub App i Copilot Pro/Pro+ wkrótce.

🔗 Agent tasks REST API

Metryki Copilot dla zespołów przez API

14 maja — API metryk Copilot udostępnia nowy raport user-teams przez dwa endpointy (/enterprises/{enterprise}/copilot/metrics/reports/user-teams-1-day i /orgs/{org}/copilot/metrics/reports/user-teams-1-day). Pozwala to tworzyć metryki adopcji na poziomie zespołu (aktywni użytkownicy, uzupełnienia, czaty, według języka/IDE/modelu). Ograniczenie: wykluczone zespoły liczące mniej niż 5 użytkowników.

🔗 Metryki Copilot na poziomie zespołu

GitHub Actions — migracje obrazów czerwiec 2026

14 maja — Trzy migracje GitHub Actions do uwzględnienia:

Migracja	Data
Obrazy Arm64 przejęte przez GitHub (od Arm Limited)	W toku
`windows-latest` / `windows-2025` → VS 2026	8–15 czerwca 2026
`macos-latest` → macOS 26	Od 15 czerwca 2026, 30 dni

Aby się przygotować: runs-on: windows-2025-vs2026 (test VS 2026), runs-on: windows-2022 (pozostań przy VS 2022), runs-on: macos-15 (pozostań przy macOS 15).

🔗 Nadchodzące migracje obrazów

Rozszerzenie Runway w Japonii — biuro w Tokio + 40 milionów USD

15 maja — Runway otwiera biuro w Tokio z początkową inwestycją 40 milionów USD. Japonia stała się trzecim największym rynkiem Runway na świecie, a liczba klientów enterprise potroiła się w 12 miesięcy. Klienci: Yamaha, NHN, SoftBank — w sektorach marketingu, reklamy i treści kreatywnych. Rozszerzenie przede wszystkim celuje w japońskich liderów gamingu, mediów i robotyki. Start następuje w tym samym tygodniu co Runway Agent (zobacz sekcję powyżej), sygnalizując jednoczesną strategię wzrostu na osi produktu i geografii. Ogłoszenie wygenerowało 86 600 wyświetleń i 139 zapisów na X.

🔗 Runway w Japonii

Media AI — NVIDIA OpenShell, FLUX Outpainting, ElevenCreative

NVIDIA OpenShell v0.0.41

15 maja — NVIDIA publikuje wersję v0.0.41 swojego open source’owego narzędzia compute OpenShell. Nowości: zarządzanie politykami sterowane przez agentów (agent-driven policy management), flagi zasobów sandbox w CLI, własny CA dla weryfikacji TLS OIDC, pobieranie do sandboxa z kontrolami granic workspace. Kontynuacja wersji v0.0.37 (11 maja).

🔗 OpenShell v0.0.41 na GitHub

Black Forest Labs — FLUX Outpainting

14 maja — Black Forest Labs uruchamia FLUX Outpainting, umożliwiające rozszerzenie dowolnego obrazu do dowolnego formatu obrazu. Kluczowe rozwiązanie: typowe problemy z zachowaniem spójności na krawędziach (ucięcia światła, dryf tekstur, widoczne szwy) są rozwiązywane na poziomie modelu — nie w postprocessingu. Narzędzie otrzymuje obraz i geometrię płótna, a następnie tworzy spójne rozszerzenie sceny.

🔗 Black Forest Labs na X

ElevenLabs — szablony w ElevenCreative

13 maja — ElevenLabs uruchamia Templates w ElevenCreative: gotowe do użycia kreatywne workflow (upload input → selection of template → output). Przypadki użycia: produkcja setek wariantów reklam, przekształcanie selfie w animowane postacie cartoon. Dostępne w web i mobile z taką samą liczbą kroków niezależnie od projektu. 625 254 wyświetlenia pod ogłoszeniem na X.

🔗 Szablony ElevenCreative

xAI — konsolidacja API i Hermes Agent

Wycofanie 8 modeli API — przekierowanie do Grok 4.3

15 maja — xAI wycofuje 8 modeli ze swojego API o 12:00 PT: grok-4-1-fast-reasoning, grok-4-1-fast-non-reasoning, grok-4-fast-reasoning, grok-4-fast-non-reasoning, grok-4-0709, grok-code-fast-1, grok-3, grok-imagine-image-pro. Slugi pozostają ważne, ale przekierowują automatycznie.

Przekierowanie	Cennik
Modele tekstowe → `grok-4.3`	$1,25/1M tokenów wejściowych, $2,50/1M tokenów wyjściowych
Modele reasoning → `grok-4.3` z `low reasoning effort`	—
Modele non-reasoning → `grok-4.3` z `none reasoning effort`	—
`grok-imagine-image-pro` → `grok-imagine-image-quality`	—

Deweloperzy są zachęcani do jawnej migracji, aby kontrolować poziom rozumowania, za który są naliczane opłaty.

🔗 Migracja xAI — 15 maja

Grok w Hermes Agent od Nous Research

15 maja — xAI integruje się z Hermes Agent, open-source’owym agentem z trwałą pamięcią od Nous Research. Subskrybenci Grok (dowolny tier) mogą używać swojej subskrypcji w Hermes, który działa stale na komputerze, w sandboxie lub na VPS. Hermes ma dostęp do Grok 4.3 (tekst i reasoning), Grok TTS (odpowiedzi głosowe) i Grok Imagine (obrazy/wideo). Kompatybilny z WhatsApp, Discord, Telegram, Signal. Instalacja: curl -fsSL .../install.sh | bash + hermes model → wybierz xAI Grok OAuth.

🔗 Grok + Hermes Agent

Perplexity Computer — architektura bezpieczeństwa by default

13 maja — Perplexity publikuje techniczne szczegóły architektury bezpieczeństwa Perplexity Computer. Każde zadanie uruchamia się we własnym, odizolowanym sandboxie na poziomie sprzętowym (hardware-isolated) z izolacją sieciową VPC. Treści zewnętrzne są skanowane równolegle przez klasyfikatory ML i model BrowseSafe, zanim agenci wykonają działania. Wielowarstwowa architektura zaprojektowana dla agentów computer use w środowisku enterprise.

🔗 Bezpieczeństwo Perplexity Computer

ChatGPT — bezpieczeństwo w wrażliwych rozmowach

14 maja — OpenAI opisuje Safety summaries ChatGPT: krótkie, rzeczowe notatki o istotnym dla bezpieczeństwa kontekście wcześniejszych rozmów, generowane przez model wytrenowany do rozumowania bezpieczeństwa. Mechanizm rozwiązuje przypadek, w którym wiadomość wygląda niewinnie samodzielnie, ale ujawnia ryzyko w kontekście długiej rozmowy.

Scenariusz	Poprawa
Samobójstwo/samookaleczenie (długa rozmowa)	+50% bezpiecznych odpowiedzi
Krzywda wobec innych (długa rozmowa)	+16%
Krzywda wobec innych (GPT-5.5 Instant, wiele rozmów)	+52%
Samobójstwo/samookaleczenie (GPT-5.5 Instant, wiele rozmów)	+39%

Wynik trafności podsumowań: 4,93/5 przy ponad 4 000 ocen. Opracowane wspólnie z psychiatrami i psychologami specjalizującymi się w prewencji samobójstw i psychologii sądowej. Nie wykryto pogorszenia w zwykłych rozmowach.

🔗 Safety summaries ChatGPT

OpenAI — odpowiedź na atak supply chain npm TanStack

13 maja — OpenAI został dotknięty atakiem “Mini Shai-Hulud” wymierzonym w bibliotekę open-source TanStack npm, zidentyfikowanym 11 maja. Dwa urządzenia pracowników zostały skompromitowane, z ograniczonym dostępem do wewnętrznych repozytoriów kodu źródłowego. Brak naruszenia danych użytkowników, brak wpływu na własność intelektualną.

Użytkownicy macOS muszą zaktualizować swoje aplikacje przed 12 czerwca 2026 — po tej dacie wersje podpisane starymi certyfikatami przestaną działać:

Aplikacja macOS	Ostatnia wersja ze starym certyfikatem
ChatGPT Desktop	1.2026.125
Codex App	26.506.31421
Codex CLI	0.130.0
Atlas	1.2026.119.1

Brak wymaganych działań dla Windows i iOS.

🔗 Odpowiedź OpenAI — TanStack

Gemini CLI v0.42.0

13 maja — Gemini CLI publikuje wersję v0.42.0 z trzema głównymi funkcjami:

Nowość	Opis
Auto Memory Inbox	Kanoniczne zarządzanie skills przez kontrakt “canonical-patch”; przegląd i walidacja pamięci wyekstrahowanych w sesji
Gemma 4 jako domyślna	Włączone dla wszystkich użytkowników przez API Gemini, bez dodatkowej konfiguracji
Ulepszenia trybu głosowego	Wizualne animacje fali, ostrzeżenia o prywatności i zgodności dla Gemini Live

Inne zmiany: flaga --delete dla komendy /exit, nowa komenda /commands list, renderowanie LaTeX w Unicode w terminalu.

🔗 Gemini CLI v0.42.0

Cohere Project Pursue — Compass na odtajnionych archiwach UFO

14 maja — Cohere uruchamia Project Pursue, fikcyjne odtajnione archiwum UFO/UAP (styl lat 90., estetyka “Netscape Navigator 4.7”), oparte na prawdziwych odtajnionych amerykańskich dokumentach rządowych opublikowanych 8 maja 2026 (FBI, CIA, State Department). Demo jest wizytówką Cohere Compass, ich produktu do inteligentnego wyszukiwania w danych nieustrukturyzowanych — skanach dokumentów rękopiśmiennych i maszynopisów. Kreatywna kampania z 35 320 wyświetleniami i 126 zapisami.

🔗 Project Pursue

Krótkie wiadomości

Grok Code Fast 1 wycofany w Copilot — wycofanie weszło w życie 15 maja we wszystkich doświadczeniach GitHub Copilot (Chat, inline edits, ask/agent, completion). Sugerowane alternatywy: GPT-5 mini lub Claude Haiku 4.5. 🔗 Ogłoszenie
Pola timestamp w GitHub Projects — trzy nowe natywne pola (Created, Updated, Closed), które można dodać do dowolnego widoku, aby sortować i filtrować według daty utworzenia, modyfikacji lub zamknięcia. 🔗 Ogłoszenie
Enterprise Installation API — public preview — GitHub App może teraz wykryć swoją instalację w enterprise i pobrać jej installation ID za pomocą nowego API, wypełniając lukę względem istniejących API org/repo/user. 🔗 Ogłoszenie
Runway AI Festival 4. edycja — 10 filmów finalistów — 10 filmów wybranych do 4. międzynarodowego festiwalu AI Runway. Wydarzenia w NY (11 czerwca) i LA (18 czerwca 2026). 🔗 Ogłoszenie
Suno — wzbogacone profile użytkowników — upload obrazu okładki, edycja bio, dodawanie linków społecznościowych, przypinanie 5 piosenek z opisami, wyświetlanie playlist. 🔗 Suno na X
Codex na Windows — artykuł inżynieryjny — David Wiesen (OpenAI) opisuje architekturę sandbox Windows w Codex: syntetyczne SID-y, tokeny z ograniczonym zapisem, dedykowani użytkownicy (CodexSandboxOffline, CodexSandboxOnline), reguły Windows Firewall. Wniosek: Windows nie oferuje jednej uniwersalnej prymitywy, więc rozwiązanie polega na złożeniu kilku mechanizmów. 🔗 Artykuł

Co to oznacza

Agentic coding CLI staje się polem bitwy trzech graczy. W ciągu kilku tygodni Claude Code (Anthropic), Gemini CLI (Google) i Grok Build (xAI) wchodzą w bezpośrednią konkurencję w tym samym segmencie: agenta deweloperskiego sterowanego z terminala. Grok Build oferuje 2M tokenów kontekstu i architekturę równoległych multi-agentów; Claude Code odpowiada +50% tygodniowych limitów i trybem Fast na Opus 4.7; GitHub Copilot ujednolica doświadczenie w dedykowanej aplikacji desktopowej i wzmocnionym pluginie JetBrains. Pytanie nie brzmi już „czy agent potrafi kodować?”, ale „który agent najlepiej da się wpiąć w mój istniejący workflow?”.

AI osadza się w workflow finansowych i enterprise na dużą skalę. ChatGPT Personal Finance z Plaid oznacza wejście OpenAI do bardzo wrażliwego sektora — 12 000 instytucji finansowych, GPT-5.5 Thinking domyślnie, partnerstwo z Intuit, aby dojść aż do wnioskowania kredytowego. Równolegle Perplexity Computer integruje Snowflake (60 761 wyświetleń pod ogłoszeniem) i wskazuje PayPal z 74 000 zadań tygodniowo. PwC i Anthropic ogłaszają 30 000 certyfikacji i zyski rzędu 70%. AI nie „prowadzi” już eksperymentów — integruje się z systemami finansowymi i produkcyjnymi pipeline’ami danych.

Produkcja treści kreatywnych przechodzi w orkiestrację konwersacyjną. Runway Agent nie generuje klipów — tworzy kompletne filmy (dźwięk + montaż) z rozmowy. FLUX Outpainting rozwiązuje problemy spójności na krawędziach na poziomie modelu. ElevenCreative dodaje standaryzowane szablony, aby uprzemysłowić produkcję reklam. Wspólny trend: AI kreatywna przechodzi od jednorazowego narzędzia do kompletnej linii produkcyjnej, z mniejszą liczbą ręcznych interwencji między etapami.

Geopolityka AI wchodzi do rejestru instytucjonalnego. Artykuł Anthropic o scenariuszach 2028 (3,8M wyświetleń) i partnerstwo z Gates Foundation (200M USD) sygnalizują, że laboratoria frontier nie pozycjonują się już wyłącznie jako firmy technologiczne, lecz jako aktorzy globalnej polityki publicznej. Rywalizacja USA/Chiny w obszarze półprzewodników i modeli frontier staje się równie mocnym argumentem handlowym, co kwestią bezpieczeństwa narodowego. Partnerstwo PwC, certyfikacje dla 30 000 profesjonalistów oraz ekspansja Runway do Japonii (40M USD) pokazują, że duże organizacje włączają AI do swoich stałych struktur — nie na zasadzie eksperymentu.