Szukaj

Runway Agent, Grok Build CLI, ChatGPT Finanse osobiste, Copilot App Desktop i scenariusze 2028 w konkurencji AI

Runway Agent, Grok Build CLI, ChatGPT Finanse osobiste, Copilot App Desktop i scenariusze 2028 w konkurencji AI

ai-powered-markdown-translator

Artykuł przetłumaczony z fr na pl za pomocą gpt-5.4-mini.

Zobacz projekt na GitHubie ↗

Intensywny tydzień: Runway Agent zamienia produkcję wideo w rozmowę, xAI wchodzi do wyścigu terminalowych coding agents CLI z Grok Build, ChatGPT zabiera się za finanse osobiste przez Plaid, a GitHub udostępnia swoją Copilot App desktop w technical preview. Tymczasem Anthropic publikuje dokument polityczny o konkurencji AI USA/Chiny w horyzoncie 2028, a Perplexity Computer łączy się ze Snowflake dla enterprise analytics.


Runway Agent — kreatywny partner AI do pełnej produkcji wideo

13 maja — Runway uruchamia Runway Agent, konwersacyjnego kreatywnego partnera zdolnego tworzyć całe filmy — wraz z sound design i montażem — w jednej sesji, na podstawie zwykłej rozmowy. Opublikowana 15 maja demonstracja pokazuje stworzenie kompletnej reklamy od product shot, bez ręcznej ingerencji między etapami.

MożliwośćOpis
Pełna produkcjaIdeacja + sound design + montaż w jednej rozmowie
Typy treściReklamy, shorty, treści społecznościowe
Punkt wejściaapp.runwayml.com/agent
Zaangażowanie X499 800 wyświetleń, 237 zakładek

Różnica względem zwykłych narzędzi generatywnych jest strukturalna: Runway Agent nie tworzy jedynie pojedynczych klipów, lecz orkiestruje cały kreatywny pipeline. Użytkownik opisuje swoją potrzebę („reklama tego produktu, energiczny ton, 30 sekund”), a agent planuje, generuje, składa i dostarcza.

Meet Runway Agent. Your new AI creative partner that helps you ideate and execute fully finished, sound designed and edited videos. All with just a simple conversation.

🇵🇱 Poznaj Runway Agent. Twój nowy kreatywny partner AI, który pomaga Ci wyobrażać sobie i tworzyć w pełni gotowe filmy, ze sound design i montażem. Wszystko to za pomocą zwykłej rozmowy.@runwayml na X

Premiera następuje tydzień po ogłoszeniu ekspansji do Japonii (zobacz kolejny rozdział), sygnalizując równoległą strategię wzrostu geograficznego i produktowego.

🔗 Runway Agent


Grok Build Early Beta — terminal-native CLI agent do kodowania od xAI

14 maja — xAI uruchamia Grok Build w otwartej becie: terminal-native CLI agent do tworzenia oprogramowania, bezpośredni konkurent Claude Code i Gemini CLI. Dostępny najpierw dla subskrybentów SuperGrok Heavy (99 USD/mies. w cenie wprowadzającej, normalnie 299 USD/mies.), CLI instaluje się przez curl -fsSL https://x.ai/cli/install.sh | bash.

FunkcjonalnośćSzczegóły
Model bazowyGrok 4.3 beta, architektura Heavy 16 agentów
Okno kontekstu2M tokenów
Plan/review/approveTryb planowania do zatwierdzenia przed wykonaniem, czytelne diffs
Równoległe podagentyDelegowanie do specjalistów równolegle, wsparcie worktree
IntegracjeAGENTS.md, plugins, hooks, skills, serwery MCP kompatybilne
Tryb headlessFlaga -p, pełne wsparcie ACP dla skryptów i automations
FeedbackWbudowana komenda /feedback

Grok Build wchodzi bezpośrednio do rywalizacji w segmencie coding agents CLI, który skupia dziś trzech graczy: Claude Code (Anthropic), Gemini CLI (Google) i Grok Build (xAI). Deklarowaną przewagą jest gotowa po wyjęciu z pudełka kompatybilność z istniejącymi narzędziami (AGENTS.md, serwery MCP) oraz wieloagentowa, równoległa architektura Grok 4.3. Ogłoszenie wygenerowało 53 miliony wyświetleń na X.

🔗 Grok Build


ChatGPT Personal Finance — połączenie kont bankowych przez Plaid

15 maja — OpenAI uruchamia w podglądzie (preview) dla abonentów Pro w Stanach Zjednoczonych nową funkcję finansów osobistych w ChatGPT. Użytkownicy mogą teraz łączyć swoje konta finansowe przez Plaid, uzyskiwać dostęp do ujednoliconego pulpitu i zadawać pytania w języku naturalnym oparte na ich rzeczywistych danych.

PlanDostępRegion
ProNatychmiastowy previewTylko Stany Zjednoczone
PlusWkrótce
FreeDocelowo

Kluczowe funkcje:

  • Połączenie z ponad 12 000 instytucji finansowych przez Plaid (integracja z Intuit wkrótce)
  • Ujednolicony pulpit: portfel, wydatki, subskrypcje, nadchodzące płatności
  • Finansowe memories (Financial memories): ChatGPT pamięta cele, długi, wspólne projekty
  • Domyślny model: GPT-5.5 Thinking (GPT-5.5 Pro dla abonentów Pro)
  • ChatGPT nie może wykonywać operacji ani widzieć pełnych numerów kont
  • Odłączenie konta powoduje usunięcie danych w ciągu 30 dni

W wewnętrznym benchmarku ocenianym z udziałem ponad 50 profesjonalistów finansowych: GPT-5.5 Thinking osiąga 79/100, a GPT-5.5 Pro 82,5/100 w złożonych zadaniach z finansów osobistych. Partnerstwo z Intuit pozwoli wyjść poza same odpowiedzi — rekomendacja karty kredytowej z weryfikacją kwalifikacji i wnioskiem online, konsekwencje podatkowe z konsultacją eksperta.

🔗 ChatGPT Personal Finance


GitHub Copilot App — aplikacja desktopowa w technical preview

14 maja — GitHub uruchamia GitHub Copilot App w technical preview: natywną desktopową aplikację GitHub do agentowego tworzenia oprogramowania. Copilot Business i Enterprise mają do niej dostęp od momentu aktywacji przez organizację (wdrożenie w tygodniu 14 maja) ; Copilot Pro i Pro+ muszą zapisać się do early access z stopniowym wdrażaniem.

FunkcjonalnośćOpis
Izolowane sesjeKażda sesja ma własną gałąź, pliki, rozmowę i stan zadania
Start from GitHub contextStart z issue, PR, promptu lub poprzedniej sesji
Ujednolicone inboxWidok issue/PR do obsłużenia we wszystkich połączonych repozytoriach
Pauza/wznowienieWyjście z sesji i powrót dokładnie tam, gdzie została przerwana
Zautomatyzowane workflowSkills + prompty do triage, zależności, release notes, cleanup
Terminal + wbudowana przeglądarkaWalidacja zmian bezpośrednio w aplikacji
Agent MergeAgent obsługuje komentarze z review, poprawia checks i automatycznie robi merge

Wymagania admina: włączone preview + Copilot CLI włączony w policy settings.

Aplikacja reprezentuje zbieżność agentowych możliwości Copilot w dedykowanym środowisku desktopowym, odrębnym od pluginu IDE i interfejsu webowego. Agent Merge to najbardziej zaawansowana funkcja: agent czyta komentarze z review, wprowadza poprawki, rozwiązuje blokujące checks i robi merge — bez ludzkiej interwencji na etapach pośrednich.

🔗 GitHub Copilot App Technical Preview


Copilot CLI agent i ujednolicone sesje w JetBrains IDEs

13 maja — GitHub dostarcza dużą aktualizację wtyczki GitHub Copilot dla JetBrains IDEs z wprowadzeniem Copilot CLI agent w public preview.

FunkcjonalnośćOpis
Copilot CLI agentDelegowanie długich zadań z JetBrains do lokalnego CLI agent
Worktree isolationAgent pracuje w oddzielnym worktree Git, nie dotykając bieżącej gałęzi
Workspace isolationAgent stosuje zmiany bezpośrednio dla szybkiej iteracji
Ujednolicony widok sesjiWszystkie sesje agenta ze statusem, typem i czasem w jednym miejscu
Ask question toolAgent może zadawać ukierunkowane pytania doprecyzowujące
Global .agent.mdWłasne agenty w ~/.copilot/agents, dostępne wszędzie
Wsparcie GHES sign-inGitHub Enterprise Server w przepływie uwierzytelniania

Wycofanie: tryb “Edit” został usunięty w tej aktualizacji.

Izolacja worktree jest kluczowa: agent CLI pracuje w dedykowanej, odizolowanej gałęzi Git, pozwalając użytkownikowi nadal pracować na głównej gałęzi, podczas gdy agent równolegle wykonuje długie zadania.

🔗 Copilot CLI agent JetBrains


Anthropic — Scenariusze 2028 dla globalnej konkurencji AI

14 maja — Anthropic opublikował dokument polityczny (policy paper) zatytułowany “2028: Two scenarios for global AI leadership”, przedstawiający jego stanowisko w sprawie konkurencji AI między Stanami Zjednoczonymi a Chinami. Artykuł wygenerował 3,8 miliona wyświetleń na X w 24 godziny.

Dokument opisuje dwa hipotetyczne scenariusze na 2028 rok:

Scenariusz 1 — Skonsolidowana przewaga demokratyczna: Stany Zjednoczone i ich sojusznicy utrzymują przewagę 12 do 24 miesięcy nad granicą modeli. Kontrole eksportu półprzewodników są wzmacniane, ataki przez distillation zostają powstrzymane, a amerykańska AI dominuje światową gospodarkę.

Scenariusz 2 — Wyścig łeb w łeb z Chinami: Chińska Partia Komunistyczna zdoła utrzymać się na poziomie granicy dzięki obchodzeniu kontroli eksportu (przemyt chipów, offshore data centers) oraz masowym atakom przez distillation na amerykańskie modele.

WskaźnikWartość
Wyświetlenia na X3,8 miliona
Zalecana docelowa przewaga USA12–24 miesiące w 2028
Compute Huawei vs NVIDIA 20264% w wydajności całkowitej
Compute Huawei vs NVIDIA 20272% (szac.)

Anthropic identyfikuje cztery fronty konkurencji: inteligencję (możliwości modeli), krajową adopcję, globalną dystrybucję i odporność. Rekomendowane są trzy kierunki działań politycznych: zamknięcie luk w kontrolach eksportowych, przeciwdziałanie nielegalnym atakom przez distillation oraz promowanie globalnego eksportu amerykańskiej AI.

We’ve published a paper that explains our views on AI competition between the US and China. The US and democratic allies hold the lead in frontier AI today.

🇵🇱 Opublikowaliśmy dokument wyjaśniający nasze stanowisko w sprawie konkurencji AI między Stanami Zjednoczonymi a Chinami. Stany Zjednoczone i ich demokratyczni sojusznicy utrzymują dziś pozycję lidera w AI granicznej.@AnthropicAI na X

🔗 2028: Two scenarios for global AI leadership


Perplexity Computer + Snowflake — enterprise workflows na żywych danych

14 maja — Perplexity Computer łączy się teraz ze Snowflake, umożliwiając wykonywanie end-to-end workflow bezpośrednio na żywych danych z data warehouse. Udokumentowane przypadki użycia obejmują analizę pipeline, śledzenie wykorzystania produktu i analitykę klienta.

Integracja pozycjonuje Perplexity Computer w segmencie enterprise self-service analytics: analityk może zadawać pytania w języku naturalnym o swoje dane Snowflake i otrzymywać zautomatyzowane workflow — ekstrakcję, transformację, wizualizację — bez kodu. Ogłoszenie wygenerowało 60 761 wyświetleń i 99 zakładek na X, z istotnym enterprise traction.

🔗 Perplexity Computer + Snowflake


PayPal — 74 000 zadań tygodniowo na Perplexity Enterprise

13 maja — Perplexity publikuje case study klienta PayPal: firma wykonuje 74 000 zadań tygodniowo poprzez Perplexity Enterprise w zastosowaniach model validation i channel analytics. To jak dotąd najwyższa publicznie ujawniona liczba użycia enterprise podana przez Perplexity dla pojedynczego klienta. Ogłoszenie, wraz z wpisem na blogu opisującym workflow PayPal, wygenerowało 61 442 wyświetlenia i 81 zakładek na X — znaczące zaangażowanie jak na news B2B. Ten case study, połączony z integracją Snowflake ogłoszoną następnego dnia, rysuje spójną strategię awansu Perplexity Computer w enterprise.

🔗 PayPal + Perplexity Enterprise


Codex w aplikacji mobilnej ChatGPT (iOS i Android)

14 maja — Codex jest teraz dostępny w aplikacji mobilnej ChatGPT (iOS i Android), w preview na wszystkich planach, w tym Free i Go. OpenAI informuje, że 4 miliony użytkowników korzystają z Codex co tydzień.

FunkcjonalnośćOpis
Połączenie wielu maszynLaptop, Mac mini, zarządzane zdalne środowisko
Stan w czasie rzeczywistymZrzuty ekranu, wyjścia terminala, diffs, wyniki testów
Akcje z poziomu telefonuStart, odblokowanie, zatwierdzenie, zmiana modelu
Remote SSHTeraz w ogólnej dostępności (generally available)
HooksW ogólnej dostępności — skan promptów, walidatory, własne memories
Programmatic tokensDo pipeline CI, dostępne Enterprise i Business
Zgodność HIPAADla lokalnego Codex na przestrzeniach roboczych ChatGPT Enterprise

You’ve been asking for this one… Now in preview: Codex in the ChatGPT mobile app. Start new work, review outputs, steer execution, and approve next steps, all from the ChatGPT mobile app. Codex will keep running on your laptop, Mac mini, or devbox.

🇵🇱 Czekaliście na to… Teraz w preview: Codex w aplikacji mobilnej ChatGPT. Uruchamiaj nowe zadania, sprawdzaj wyniki, kieruj wykonaniem i zatwierdzaj kolejne kroki — wszystko z poziomu aplikacji mobilnej ChatGPT. Codex będzie nadal działać na Twoim laptopie, Mac mini lub devbox.@OpenAI na X

🔗 Codex na mobile


Anthropic — Claude for Small Business, Gates Foundation, PwC

Claude for Small Business

13 maja — Anthropic uruchamia Claude for Small Business: 15 workflow agentowych i 15 wstępnie skonfigurowanych skills dla małych firm, poprzez Claude Cowork. Połączone narzędzia obejmują QuickBooks, PayPal, HubSpot, Canva, Docusign, Google Workspace i Microsoft 365. Funkcje obejmują payroll, monthly close, śledzenie cash flow, kampanie marketingowe i przypomnienia o fakturach. Trasa “Claude SMB Tour” rozpoczyna się 14 maja w Chicago (100 menedżerów MŚP na każdym etapie, miesięczna subskrypcja Claude Max gratis).

🔗 Claude for Small Business


Partnerstwo za 200 milionów USD z Gates Foundation

14 maja — Anthropic i Bill & Melinda Gates Foundation ogłaszają partnerstwo o wartości 200 milionów USD na cztery lata. Kredyty Claude, granty i wsparcie techniczne obejmują cztery obszary: global health (szczepionki i terapie chorób krajów o niskich dochodach — polio, HPV, stan przedrzucawkowy), life sciences, edukację K-12 w Afryce Subsaharyjskiej i Indiach oraz mobility ekonomiczną dla solopreneurów i rolników. Docelowa populacja po stronie zdrowia to 4,6 miliarda osób bez dostępu do podstawowej opieki.

🔗 Partnerstwo z Gates Foundation


Rozszerzony sojusz z PwC

14 maja — PwC wdroży Claude Code i Claude Cowork wśród swoich zespołów w USA, a następnie globalnie. Sojusz tworzy wspólne Centre of Excellence oraz program certyfikacji dla 30 000 specjalistów PwC. Obecne wdrożenia produkcyjne raportują zyski do 70%: underwriting ubezpieczeniowy skrócony z 10 tygodni do 10 dni, obsługa incydentów cyberbezpieczeństwa z kilku godzin do kilku minut. Uruchomiona zostaje nowa jednostka “Office of the CFO”, skierowana do sektorów regulowanych.

🔗 PwC + Anthropic


Claude Code v2.1.141-142 — hooki terminalSequence, flagi claude agents + Fast mode Opus 4.7

Dwie wersje opublikowane 14 i 15 maja 2026 przynoszą istotne ulepszenia w Claude Code, w szczególności w zarządzaniu hookami, sesjach w tle i trybie Fast.

Nowość (v2.1.142)Szczegół
Nowe flagi claude agents--add-dir, --settings, --mcp-config, --plugin-dir, --permission-mode, --model, --effort, --dangerously-skip-permissions
Fast mode → Opus 4.7Domyślnie od teraz (zmienna CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1, aby wrócić do Opus 4.6)
Wtyczki SKILL.md w katalogu głównymWtyczka z SKILL.md w katalogu głównym bez podkatalogu skills/ jest teraz udostępniana jako umiejętność
Nowość (v2.1.141)Szczegół
terminalSequence w hookachPowiadomienia na pulpicie, tytuły okien, dzwonki bez terminala sterującego
claude agents --cwd <chemin>Filtrowanie listy sesji według katalogu
ANTHROPIC_WORKSPACE_IDFederacja tożsamości obciążenia roboczego (workload identity federation)
Rewind “Summarize up to here”Kompresja wcześniejszego kontekstu z menu Rewind
Bursztynowy spinnerSygnalizuje, że Claude nadal pracuje po 10 sekundach

Istotne poprawki (v2.1.142): MCP_TOOL_TIMEOUT nie ograniczał już wywołań HTTP/SSE do 60 sekund; crash-loop demona po brew upgrade; deadlock Windows na dysku sieciowym. Wersja v2.1.141 zawierała również ponad 40 poprawek dotyczących sesji w tle, wtyczek MCP, hooków i renderowania terminala.

🔗 CHANGELOG Claude Code


Claude Code — cotygodniowe limity +50% do 13 lipca

13 maja — @ClaudeDevs ogłasza zwiększenie 50% cotygodniowych limitów Claude Code do 13 lipca 2026 o 18:00 PDT, dla wszystkich planów Pro, Max, Team i Enterprise. Podwyżka dotyczy CLI, rozszerzeń IDE, desktopu i webu — bez konieczności podejmowania działań przez użytkownika. Sumuje się z podwojeniem limitów na 5 godzin ogłoszonym 6 maja.

🔗 ClaudeDevs na X


GitHub — dodatkowe aktualizacje Copilot

Copilot Memory — preferencje użytkownika (Pro i Pro+)

15 maja — Copilot Memory rozszerza swój zasięg na poziom użytkownika (early access). Wcześniej pamięć przechowywała tylko informacje na poziomie repozytorium. Teraz osobiste preferencje (styl commitów, struktura pull requestów, ton komunikacji) podążają za użytkownikiem we wszystkich jego repozytoriach i agentach. Można nimi zarządzać w osobistych ustawieniach Copilot Memory.

🔗 Copilot Memory na poziomie użytkownika


Copilot cloud agent — automatyczny wybór modelu

14 maja — Tryb “Auto” w model pickerze cloud agenta pozwala Copilotowi inteligentnie wybierać najlepszy model w zależności od kondycji systemu i wydajności. Zalety: 10% zniżki na normalny mnożnik, brak tygodniowego rate limitu w tym trybie.

🔗 Automatyczny wybór modelu


Agent tasks REST API (Business/Enterprise)

13 maja — Użytkownicy Copilot Business i Enterprise mogą teraz uruchamiać zadania cloud agenta przez nowe Agent tasks REST API (public preview). Przypadki użycia: masowy refactoring w wielu repozytoriach, inicjalizacja repozytoriów z wewnętrznego portalu deweloperskiego, automatyczne przygotowywanie release notes. Uwierzytelnianie przez PAT (classic i fine-grained) oraz tokeny OAuth. Wsparcie dla tokenów instalacyjnych GitHub App i Copilot Pro/Pro+ wkrótce.

🔗 Agent tasks REST API


Metryki Copilot dla zespołów przez API

14 maja — API metryk Copilot udostępnia nowy raport user-teams przez dwa endpointy (/enterprises/{enterprise}/copilot/metrics/reports/user-teams-1-day i /orgs/{org}/copilot/metrics/reports/user-teams-1-day). Pozwala to tworzyć metryki adopcji na poziomie zespołu (aktywni użytkownicy, uzupełnienia, czaty, według języka/IDE/modelu). Ograniczenie: wykluczone zespoły liczące mniej niż 5 użytkowników.

🔗 Metryki Copilot na poziomie zespołu


GitHub Actions — migracje obrazów czerwiec 2026

14 maja — Trzy migracje GitHub Actions do uwzględnienia:

MigracjaData
Obrazy Arm64 przejęte przez GitHub (od Arm Limited)W toku
windows-latest / windows-2025 → VS 20268–15 czerwca 2026
macos-latest → macOS 26Od 15 czerwca 2026, 30 dni

Aby się przygotować: runs-on: windows-2025-vs2026 (test VS 2026), runs-on: windows-2022 (pozostań przy VS 2022), runs-on: macos-15 (pozostań przy macOS 15).

🔗 Nadchodzące migracje obrazów


Rozszerzenie Runway w Japonii — biuro w Tokio + 40 milionów USD

15 maja — Runway otwiera biuro w Tokio z początkową inwestycją 40 milionów USD. Japonia stała się trzecim największym rynkiem Runway na świecie, a liczba klientów enterprise potroiła się w 12 miesięcy. Klienci: Yamaha, NHN, SoftBank — w sektorach marketingu, reklamy i treści kreatywnych. Rozszerzenie przede wszystkim celuje w japońskich liderów gamingu, mediów i robotyki. Start następuje w tym samym tygodniu co Runway Agent (zobacz sekcję powyżej), sygnalizując jednoczesną strategię wzrostu na osi produktu i geografii. Ogłoszenie wygenerowało 86 600 wyświetleń i 139 zapisów na X.

🔗 Runway w Japonii


Media AI — NVIDIA OpenShell, FLUX Outpainting, ElevenCreative

NVIDIA OpenShell v0.0.41

15 maja — NVIDIA publikuje wersję v0.0.41 swojego open source’owego narzędzia compute OpenShell. Nowości: zarządzanie politykami sterowane przez agentów (agent-driven policy management), flagi zasobów sandbox w CLI, własny CA dla weryfikacji TLS OIDC, pobieranie do sandboxa z kontrolami granic workspace. Kontynuacja wersji v0.0.37 (11 maja).

🔗 OpenShell v0.0.41 na GitHub


Black Forest Labs — FLUX Outpainting

14 maja — Black Forest Labs uruchamia FLUX Outpainting, umożliwiające rozszerzenie dowolnego obrazu do dowolnego formatu obrazu. Kluczowe rozwiązanie: typowe problemy z zachowaniem spójności na krawędziach (ucięcia światła, dryf tekstur, widoczne szwy) są rozwiązywane na poziomie modelu — nie w postprocessingu. Narzędzie otrzymuje obraz i geometrię płótna, a następnie tworzy spójne rozszerzenie sceny.

🔗 Black Forest Labs na X


ElevenLabs — szablony w ElevenCreative

13 maja — ElevenLabs uruchamia Templates w ElevenCreative: gotowe do użycia kreatywne workflow (upload input → selection of template → output). Przypadki użycia: produkcja setek wariantów reklam, przekształcanie selfie w animowane postacie cartoon. Dostępne w web i mobile z taką samą liczbą kroków niezależnie od projektu. 625 254 wyświetlenia pod ogłoszeniem na X.

🔗 Szablony ElevenCreative


xAI — konsolidacja API i Hermes Agent

Wycofanie 8 modeli API — przekierowanie do Grok 4.3

15 maja — xAI wycofuje 8 modeli ze swojego API o 12:00 PT: grok-4-1-fast-reasoning, grok-4-1-fast-non-reasoning, grok-4-fast-reasoning, grok-4-fast-non-reasoning, grok-4-0709, grok-code-fast-1, grok-3, grok-imagine-image-pro. Slugi pozostają ważne, ale przekierowują automatycznie.

PrzekierowanieCennik
Modele tekstowe → grok-4.3$1,25/1M tokenów wejściowych, $2,50/1M tokenów wyjściowych
Modele reasoning → grok-4.3 z low reasoning effort
Modele non-reasoning → grok-4.3 z none reasoning effort
grok-imagine-image-progrok-imagine-image-quality

Deweloperzy są zachęcani do jawnej migracji, aby kontrolować poziom rozumowania, za który są naliczane opłaty.

🔗 Migracja xAI — 15 maja


Grok w Hermes Agent od Nous Research

15 maja — xAI integruje się z Hermes Agent, open-source’owym agentem z trwałą pamięcią od Nous Research. Subskrybenci Grok (dowolny tier) mogą używać swojej subskrypcji w Hermes, który działa stale na komputerze, w sandboxie lub na VPS. Hermes ma dostęp do Grok 4.3 (tekst i reasoning), Grok TTS (odpowiedzi głosowe) i Grok Imagine (obrazy/wideo). Kompatybilny z WhatsApp, Discord, Telegram, Signal. Instalacja: curl -fsSL .../install.sh | bash + hermes model → wybierz xAI Grok OAuth.

🔗 Grok + Hermes Agent


Perplexity Computer — architektura bezpieczeństwa by default

13 maja — Perplexity publikuje techniczne szczegóły architektury bezpieczeństwa Perplexity Computer. Każde zadanie uruchamia się we własnym, odizolowanym sandboxie na poziomie sprzętowym (hardware-isolated) z izolacją sieciową VPC. Treści zewnętrzne są skanowane równolegle przez klasyfikatory ML i model BrowseSafe, zanim agenci wykonają działania. Wielowarstwowa architektura zaprojektowana dla agentów computer use w środowisku enterprise.

🔗 Bezpieczeństwo Perplexity Computer


ChatGPT — bezpieczeństwo w wrażliwych rozmowach

14 maja — OpenAI opisuje Safety summaries ChatGPT: krótkie, rzeczowe notatki o istotnym dla bezpieczeństwa kontekście wcześniejszych rozmów, generowane przez model wytrenowany do rozumowania bezpieczeństwa. Mechanizm rozwiązuje przypadek, w którym wiadomość wygląda niewinnie samodzielnie, ale ujawnia ryzyko w kontekście długiej rozmowy.

ScenariuszPoprawa
Samobójstwo/samookaleczenie (długa rozmowa)+50% bezpiecznych odpowiedzi
Krzywda wobec innych (długa rozmowa)+16%
Krzywda wobec innych (GPT-5.5 Instant, wiele rozmów)+52%
Samobójstwo/samookaleczenie (GPT-5.5 Instant, wiele rozmów)+39%

Wynik trafności podsumowań: 4,93/5 przy ponad 4 000 ocen. Opracowane wspólnie z psychiatrami i psychologami specjalizującymi się w prewencji samobójstw i psychologii sądowej. Nie wykryto pogorszenia w zwykłych rozmowach.

🔗 Safety summaries ChatGPT


OpenAI — odpowiedź na atak supply chain npm TanStack

13 maja — OpenAI został dotknięty atakiem “Mini Shai-Hulud” wymierzonym w bibliotekę open-source TanStack npm, zidentyfikowanym 11 maja. Dwa urządzenia pracowników zostały skompromitowane, z ograniczonym dostępem do wewnętrznych repozytoriów kodu źródłowego. Brak naruszenia danych użytkowników, brak wpływu na własność intelektualną.

Użytkownicy macOS muszą zaktualizować swoje aplikacje przed 12 czerwca 2026 — po tej dacie wersje podpisane starymi certyfikatami przestaną działać:

Aplikacja macOSOstatnia wersja ze starym certyfikatem
ChatGPT Desktop1.2026.125
Codex App26.506.31421
Codex CLI0.130.0
Atlas1.2026.119.1

Brak wymaganych działań dla Windows i iOS.

🔗 Odpowiedź OpenAI — TanStack


Gemini CLI v0.42.0

13 maja — Gemini CLI publikuje wersję v0.42.0 z trzema głównymi funkcjami:

NowośćOpis
Auto Memory InboxKanoniczne zarządzanie skills przez kontrakt “canonical-patch”; przegląd i walidacja pamięci wyekstrahowanych w sesji
Gemma 4 jako domyślnaWłączone dla wszystkich użytkowników przez API Gemini, bez dodatkowej konfiguracji
Ulepszenia trybu głosowegoWizualne animacje fali, ostrzeżenia o prywatności i zgodności dla Gemini Live

Inne zmiany: flaga --delete dla komendy /exit, nowa komenda /commands list, renderowanie LaTeX w Unicode w terminalu.

🔗 Gemini CLI v0.42.0


Cohere Project Pursue — Compass na odtajnionych archiwach UFO

14 maja — Cohere uruchamia Project Pursue, fikcyjne odtajnione archiwum UFO/UAP (styl lat 90., estetyka “Netscape Navigator 4.7”), oparte na prawdziwych odtajnionych amerykańskich dokumentach rządowych opublikowanych 8 maja 2026 (FBI, CIA, State Department). Demo jest wizytówką Cohere Compass, ich produktu do inteligentnego wyszukiwania w danych nieustrukturyzowanych — skanach dokumentów rękopiśmiennych i maszynopisów. Kreatywna kampania z 35 320 wyświetleniami i 126 zapisami.

🔗 Project Pursue


Krótkie wiadomości

  • Grok Code Fast 1 wycofany w Copilot — wycofanie weszło w życie 15 maja we wszystkich doświadczeniach GitHub Copilot (Chat, inline edits, ask/agent, completion). Sugerowane alternatywy: GPT-5 mini lub Claude Haiku 4.5. 🔗 Ogłoszenie

  • Pola timestamp w GitHub Projects — trzy nowe natywne pola (Created, Updated, Closed), które można dodać do dowolnego widoku, aby sortować i filtrować według daty utworzenia, modyfikacji lub zamknięcia. 🔗 Ogłoszenie

  • Enterprise Installation API — public preview — GitHub App może teraz wykryć swoją instalację w enterprise i pobrać jej installation ID za pomocą nowego API, wypełniając lukę względem istniejących API org/repo/user. 🔗 Ogłoszenie

  • Runway AI Festival 4. edycja — 10 filmów finalistów — 10 filmów wybranych do 4. międzynarodowego festiwalu AI Runway. Wydarzenia w NY (11 czerwca) i LA (18 czerwca 2026). 🔗 Ogłoszenie

  • Suno — wzbogacone profile użytkowników — upload obrazu okładki, edycja bio, dodawanie linków społecznościowych, przypinanie 5 piosenek z opisami, wyświetlanie playlist. 🔗 Suno na X

  • Codex na Windows — artykuł inżynieryjny — David Wiesen (OpenAI) opisuje architekturę sandbox Windows w Codex: syntetyczne SID-y, tokeny z ograniczonym zapisem, dedykowani użytkownicy (CodexSandboxOffline, CodexSandboxOnline), reguły Windows Firewall. Wniosek: Windows nie oferuje jednej uniwersalnej prymitywy, więc rozwiązanie polega na złożeniu kilku mechanizmów. 🔗 Artykuł


Co to oznacza

Agentic coding CLI staje się polem bitwy trzech graczy. W ciągu kilku tygodni Claude Code (Anthropic), Gemini CLI (Google) i Grok Build (xAI) wchodzą w bezpośrednią konkurencję w tym samym segmencie: agenta deweloperskiego sterowanego z terminala. Grok Build oferuje 2M tokenów kontekstu i architekturę równoległych multi-agentów; Claude Code odpowiada +50% tygodniowych limitów i trybem Fast na Opus 4.7; GitHub Copilot ujednolica doświadczenie w dedykowanej aplikacji desktopowej i wzmocnionym pluginie JetBrains. Pytanie nie brzmi już „czy agent potrafi kodować?”, ale „który agent najlepiej da się wpiąć w mój istniejący workflow?”.

AI osadza się w workflow finansowych i enterprise na dużą skalę. ChatGPT Personal Finance z Plaid oznacza wejście OpenAI do bardzo wrażliwego sektora — 12 000 instytucji finansowych, GPT-5.5 Thinking domyślnie, partnerstwo z Intuit, aby dojść aż do wnioskowania kredytowego. Równolegle Perplexity Computer integruje Snowflake (60 761 wyświetleń pod ogłoszeniem) i wskazuje PayPal z 74 000 zadań tygodniowo. PwC i Anthropic ogłaszają 30 000 certyfikacji i zyski rzędu 70%. AI nie „prowadzi” już eksperymentów — integruje się z systemami finansowymi i produkcyjnymi pipeline’ami danych.

Produkcja treści kreatywnych przechodzi w orkiestrację konwersacyjną. Runway Agent nie generuje klipów — tworzy kompletne filmy (dźwięk + montaż) z rozmowy. FLUX Outpainting rozwiązuje problemy spójności na krawędziach na poziomie modelu. ElevenCreative dodaje standaryzowane szablony, aby uprzemysłowić produkcję reklam. Wspólny trend: AI kreatywna przechodzi od jednorazowego narzędzia do kompletnej linii produkcyjnej, z mniejszą liczbą ręcznych interwencji między etapami.

Geopolityka AI wchodzi do rejestru instytucjonalnego. Artykuł Anthropic o scenariuszach 2028 (3,8M wyświetleń) i partnerstwo z Gates Foundation (200M USD) sygnalizują, że laboratoria frontier nie pozycjonują się już wyłącznie jako firmy technologiczne, lecz jako aktorzy globalnej polityki publicznej. Rywalizacja USA/Chiny w obszarze półprzewodników i modeli frontier staje się równie mocnym argumentem handlowym, co kwestią bezpieczeństwa narodowego. Partnerstwo PwC, certyfikacje dla 30 000 profesjonalistów oraz ekspansja Runway do Japonii (40M USD) pokazują, że duże organizacje włączają AI do swoich stałych struktur — nie na zasadzie eksperymentu.

Źródła