Karpathy dołącza do Anthropic, Google I/O 2026 rozpoczyna agentową erę Gemini 3.5, Cohere przejmuje Reliant AI

19 maja 2026 to intensywny dzień dla AI: Andrej Karpathy odchodzi, by dołączyć do Anthropic, Google I/O 2026 uruchamia zestaw agentowych ogłoszeń wokół serii Gemini 3.5, xAI wdraża Grok Skills z generowaniem dokumentów Office, a Cohere dokonuje strategicznego przejęcia w biofarmacji. Równolegle OpenAI wzmacnia pochodzenie treści AI, a świat generatywnych mediów zyskuje nowe możliwości.

Andrej Karpathy dołącza do Anthropic

19 maja — Andrej Karpathy ogłosił na X, że dołączył do Anthropic. Wiadomość wygenerowała ponad 11,3 miliona wyświetleń, 102 000 polubień i 13 000 udostępnień w ciągu kilku godzin — wyjątkowe zaangażowanie, które pokazuje wpływ tego zatrudnienia w społeczności.

“Personal update: I’ve joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D. I remain deeply passionate about education and plan to resume my work on it in time.”

🇵🇱 Aktualizacja osobista: dołączyłem do Anthropic. Uważam, że najbliższe lata na granicy LLM będą szczególnie kształcące. Jestem bardzo podekscytowany dołączeniem do zespołu i powrotem do R&D. Nadal głęboko pasjonuje mnie edukacja i planuję wrócić do tej pracy we właściwym czasie. — @karpathy na X

Karpathy jest jedną z najbardziej rozpoznawalnych postaci w branży. Jego droga: doktorat na Stanfordzie, współzałożyciel OpenAI, dyrektor ds. AI w Tesli, a następnie niezależna postać ze szkoleniową serią nanoGPT i kursami uczenia maszynowego śledzonymi przez miliony osób.

Jego przejście do Anthropic znacząco wzmacnia zespół badań podstawowych dokładnie w momencie, gdy rywalizacja między laboratoriami granicznymi się zaostrza. Były pracownik OpenAI, który dołącza do Anthropic — to mocny sygnał dotyczący dynamiki talentów w sektorze.

Anthropic nie sprecyzowało jego dokładnej roli. Ogłoszenie zbiega się w czasie z wydarzeniem Code with Claude London oraz kilkoma dużymi premierami tego samego dnia.

Google I/O 2026 — agentowa era Gemini 3.5

19 maja — Google I/O 2026 odbywa się dziś, a jego centralnym tematem jest agentowa era Gemini (agentic Gemini era). Google ogłasza podczas keynote spójny zestaw zapowiedzi, które wszystkie krążą wokół zdolności Gemini do działania autonomicznego, proaktywnego i trwałego.

“Three years ago, Gemini started by understanding the world. With Gemini 2, models learned to think and reason. Late last year, Gemini 3 brought any idea to life. Today, we’re continuing that journey with our Gemini 3.5 series, starting with Gemini 3.5 Flash, delivering frontier performance for agents and coding.”

🇵🇱 „Trzy lata temu Gemini zaczęło od rozumienia świata. W Gemini 2 modele nauczyły się myśleć i rozumować. Pod koniec zeszłego roku Gemini 3 tchnęło życie w każdy pomysł. Dziś kontynuujemy tę drogę z naszą serią Gemini 3.5, zaczynając od Gemini 3.5 Flash, które zapewnia najwyższą wydajność dla agentów i kodowania.” — @GoogleAI na X

Główne ogłoszenia keynote I/O 2026:

Ogłoszenie	Kategoria
Gemini 3.5 Flash	Nowy model (agenci + kodowanie)
Gemini Omni	Multimodalny model wideo
Gemini Spark	Osobisty agent 24/7
Daily Brief	Spersonalizowany poranny agent
Neural Expressive	Nowy projekt aplikacji
Managed Agents API	Infrastruktura Antigravity dla deweloperów
Google AI Studio	Odświeżone z szablonami agentów

🔗 Blog Google I/O 2026

Gemini 3.5 Flash — szybkość i inteligencja dla agentów

19 maja — Gemini 3.5 Flash to pierwszy model nowej generacji 3.5. Został zaprojektowany tak, aby łączyć najwyższej klasy inteligencję (frontier intelligence) z błyskawiczną szybkością działania (lightning-fast action), z optymalizacją pod kątem zastosowań agentowych i kodowania.

Gemini 3.5 Flash jest podstawowym silnikiem agenta Antigravity (Managed Agents API) oraz Gemini Spark. Jest dostępny przez API Gemini i w Google AI Studio od 19 maja.

Generacja	Kluczowa zdolność
Gemini 1	Rozumienie świata
Gemini 2	Rozumowanie i myślenie
Gemini 3	Tworzenie multimodalne
Gemini 3.5 Flash	Agenci, kodowanie, błyskawiczna szybkość

Model jest również dostępny w ogólnej dostępności (generally available) w GitHub Copilot tego samego dnia, w którym ma premierę — w planach Pro, Pro+, Business i Enterprise. GitHub raportuje wydajność zbliżoną do poziomu Pro przy szybkości Flash, z efektywnym użyciem narzędzi, szybkim czasem odpowiedzi i wysoką skutecznością cache. Wdrożenie odbywa się stopniowo; administratorzy Copilot Enterprise i Business muszą włączyć politykę Gemini 3.5 Flash w ustawieniach.

Atrybut Copilot	Wartość
Objęte plany	Pro, Pro+, Business, Enterprise
Obsługiwane IDE	VS Code, Visual Studio, JetBrains, Xcode, Eclipse, GitHub Mobile
Mnożnik premium	14× (tymczasowy, może ulec zmianie)

🔗 Ogłoszenie GitHub Copilot

Gemini Omni — tworzenie czegokolwiek z czegokolwiek

19 maja — Google DeepMind uruchamia Gemini Omni, przedstawiany jako „pierwszy krok w stronę modelu zdolnego tworzyć cokolwiek z czegokolwiek — zaczynając od wideo”. Łączy inteligencję Gemini z generatywnymi systemami medialnymi Google (Veo, Imagen).

“We’re dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video. It combines Gemini’s intelligence with our generative media systems - representing a leap forward in world understanding, multimodality, and editing.”

🇵🇱 „Uruchamiamy Gemini Omni: nasz pierwszy krok w stronę modelu zdolnego tworzyć cokolwiek z czegokolwiek — zaczynając od wideo. Łączy on inteligencję Gemini z naszymi generatywnymi systemami medialnymi, stanowiąc duży krok naprzód w rozumieniu świata, multimodalności i edycji.” — @GoogleDeepMind na X

W aplikacji Gemini Gemini Omni umożliwia generowanie wysokiej jakości filmów kinowych z tekstu, obrazów lub istniejących filmów, edycję wideo za pomocą naturalnej rozmowy (kinematograficzne zbliżenia, zmiany tła prostym promptem), tworzenie spersonalizowanych awatarów AI podobnych do użytkownika oraz stosowanie wbudowanych szablonów jednym tapnięciem.

Dostępność: Stopniowe wdrażanie od 19 maja dla subskrybentów Google AI Plus, Pro i Ultra na całym świecie.

Gemini Spark — osobisty agent 24/7

19 maja — Google ogłasza Gemini Spark, osobistego agenta AI dostępnego 24 godziny na dobę, 7 dni w tygodniu. To fundamentalna zmiana w naturze Gemini: przechodzi ono z reaktywnego asystenta do aktywnego partnera, który pracuje w tle nawet wtedy, gdy użytkownik zamknie urządzenie (architektura chmurowa).

Spark działa na Gemini 3.5 Flash przez infrastrukturę Antigravity. Jest głęboko zintegrowany z narzędziami Workspace (Gmail, Docs, Slides, Calendar).

Zdolność	Szczegół
Zadania cykliczne	Automatyczne wyzwalacze (np. analiza miesięcznych zestawień)
Nauka umiejętności	Na polecenie użytkownika
Pełne workflow	Podsumowanie spotkania → Google Doc → e-mail z follow-upem
Połączenia MCP	Canva, OpenTable, Instacart od premiery
Kontrola użytkownika	Wymagane potwierdzenie przed działaniami o dużym wpływie

Dostępność: Testy w zaufanym środowisku w tym tygodniu; beta dla subskrybentów Google AI Ultra w Stanach Zjednoczonych w następnym tygodniu. Pojawienie się w aplikacji Gemini na macOS planowane jest na lato 2026.

Managed Agents w API Gemini — otwarta infrastruktura Antigravity

19 maja — Google uruchamia Managed Agents w API Gemini, umożliwiając deweloperom wdrażanie agentów za pomocą jednej linii kodu w izolowanym, efemerycznym środowisku Linux. Infrastruktura jest zasilana przez agenta Antigravity, zbudowanego na Gemini 3.5 Flash.

To otwarcie wewnętrznej infrastruktury agentów Google dla zewnętrznych deweloperów. Pierwszym zarządzanym agentem był Deep Research (grudzień 2025); teraz deweloperzy mogą tworzyć własnych.

Funkcja deweloperska	Szczegół
Wdrożenie	Jedno wywołanie API — zdalne środowisko Linux
Możliwości	Nawigacja po sieci, wykonywanie kodu, zarządzanie plikami
Personalizacja	Pliki `AGENTS.md` i `SKILL.md`
Trwałe sesje	Pełne wznawianie stanu
Wielokrotnego użytku agenty	Rejestracja przez `client.agents.create()`
Enterprise	Gemini Enterprise Agent Platform (prywatny podgląd)

Dostępność: Preview w API Gemini od 19 maja wieczorem; szablony w Google AI Studio.

🔗 Ogłoszenie Managed Agents API

Claude Managed Agents — samodzielnie hostowane sandboksy i tunele MCP

19 maja — Podczas wydarzenia Code with Claude London Anthropic uruchomiło dwie nowe, duże funkcje dla Claude Managed Agents.

Self-hosted sandboxes (publiczna beta) — Agenci Claude mogą teraz działać w sandboksach (sandboxes) hostowanych w infrastrukturze klienta. Zespoły zachowują w swoim własnym zakresie wrażliwe pliki, pakiety i usługi, wraz z obowiązującymi politykami sieciowymi, dziennikami audytu i narzędziami bezpieczeństwa.

MCP tunnels (research preview) — Agenci mogą łączyć się z serwerami MCP znajdującymi się w prywatnej sieci bez wystawiania ich publicznie. Tunele MCP są zarządzane z poziomu Claude Console i obsługiwane zarówno w Managed Agents, jak i w Messages API.

Funkcja	Status	Dostawcy
Self-hosted sandboxes	Publiczna beta	Cloudflare, Daytona, Modal, Vercel
MCP tunnels	Research preview (dostęp na żądanie)	Przez Claude Console

🔗 Ogłoszenie Claude Managed Agents

Grok Skills — trwała ekspertyza i dokumenty Office

18 maja — xAI uruchomiło Skills dla Grok 4.3, funkcję trwałego zapamiętywania, która pozwala Grok uczyć się preferencji, reguł formatowania i kroków workflow tylko raz, a następnie stosować je we wszystkich kolejnych rozmowach.

“I’m leveling up my Skills. Automate your workflows and get things done in record time with prebuilt and custom Skills.”

🇵🇱 Podnoszę swoje kompetencje dzięki Skills. Automatyzuj swoje workflow i wykonuj zadania w rekordowym tempie dzięki gotowym i spersonalizowanym Skills. — @grok na X

Typ dokumentu	Możliwości
Word (`.docx`)	Tworzenie i edycja z pełnym formatowaniem (nagłówki, tabele, wypunktowania)
PowerPoint	Slajdy z hierarchią wizualną i notatkami prelegenta
Excel	Formuły, kolorowe sekcje, przejrzysta struktura
PDF	Tworzenie, scalanie, dzielenie i ekstrakcja
Skill Creator	Tworzenie nowych, niestandardowych skills przez rozmowę

Skills są dostępne na grok.com, iOS i Android. Niestandardowe skills użytkownika zawsze mają pierwszeństwo przed domyślnymi, wbudowanymi skills.

🔗 Ogłoszenie Grok Skills

Cohere przejmuje Reliant AI — suwerenna AI dla biofarmacji

19 maja — Cohere ogłasza przejęcie Reliant AI, firmy specjalizującej się w AI dla biofarmacji, z biurami w Montrealu i Berlinie. Operacja wzmacnia strategię suwerennej AI (sovereign AI) Cohere w sektorach zdrowia i nauk przyrodniczych.

“Healthcare represents one of the most consequential opportunities for AI and it demands secure, sovereign, and domain-specific systems.”

🇵🇱 Ochrona zdrowia stanowi jedną z najważniejszych szans dla AI i wymaga systemów bezpiecznych, suwerennych oraz wyspecjalizowanych domenowo. — Aidan Gomez, współzałożyciel i CEO, Cohere

Korzyści z przejęcia:

Element	Szczegół
Zespół	Najwyższej klasy badacze specjalizujący się w biofarmacji
Dane	Zastrzeżone bazy danych biomedycznych
Technologia	Inteligentny warsztat badawczy (intelligent research workbench)
Przeniesieni klienci	GSK, Medicus Pharma, Kyowa Kirin

Nowy produkt: North for Pharma — Cohere ogłasza rozwój agentowego systemu AI zaprojektowanego dla zespołów biofarmaceutycznych pracujących nad R&D, rozwojem klinicznym i analizą naukową. Rozszerza on pakiet „North”, już oferowany dla sektorów finansowego i telekomunikacyjnego.

Karl Moritz Hermann (były CEO Reliant AI) zostaje VP of AI Verticalizations w Berlinie. Marc Bellemare (współzałożyciel, Canada CIFAR AI Chair, Mila) zostaje VP of Modelling w Montrealu.

🔗 Ogłoszenie Cohere

KPMG × Anthropic — globalny sojusz (276 000 pracowników, 138 krajów)

19 maja — KPMG, jedna z największych firm świadczących usługi profesjonalne na świecie, ogłosiła globalny strategiczny sojusz z Anthropic. Firma integruje Claude ze swoją platformą Digital Gateway i daje dostęp do Claude wszystkim swoim ponad 276 000 pracowników w 138 krajach.

Główne obszary: Claude Cowork i Managed Agents zintegrowane z Digital Gateway, nowe narzędzia dla klientów w obszarze podatków i prawa, KPMG staje się preferowanym partnerem Anthropic dla funduszy private equity, a zespoły KPMG używają Claude Code (przez KPMG Blaze) do modernizacji przestarzałych systemów informatycznych.

“Building an AI agent to help clients adjust to changing tax regulations used to take weeks and required teams to switch between multiple tools and chat windows. With Cowork and Managed Agents integrated in Digital Gateway, that same capability takes minutes.”

🇵🇱 Stworzenie agenta AI, który pomaga klientom dostosować się do zmieniających się przepisów podatkowych, wcześniej zajmowało tygodnie i wymagało żonglowania wieloma narzędziami. Dzięki Cowork i Managed Agents zintegrowanym z Digital Gateway ta sama możliwość zajmuje teraz zaledwie kilka minut. — Rema Serafi, wiceprezes ds. podatków, KPMG US

To wdrożenie opiera się na dwóch latach wewnętrznej adopcji w KPMG w Stanach Zjednoczonych.

🔗 Ogłoszenie Anthropic × KPMG

Gemini App — Neural Expressive i Daily Brief

19 maja — Aplikacja Gemini otrzymuje dwie duże nowości.

Neural Expressive to nowy język projektowania dla ery AI: płynne animacje, żywe kolory, nowa typografia, reakcja haptyczna. Doświadczenie Gemini Live (rozmowa głosowa) jest teraz zintegrowane bezpośrednio z głównym interfejsem — płynne przechodzenie między pisaniem a rozmową. Globalne wdrożenie od 19 maja na web, Android i iOS dla wszystkich użytkowników.

Daily Brief to agent, który każdego ranka generuje spersonalizowane podsumowanie oparte na Gmailu, Calendar i priorytetach użytkownika. Idzie dalej niż zwykłe streszczenie: organizuje, priorytetyzuje i proponuje konkretne kolejne działania. Stopniowe wdrożenie dla subskrybentów Plus, Pro i Ultra, zaczynając od Stanów Zjednoczonych.

OpenAI — C2PA, SynthID i publiczne narzędzie weryfikacyjne

19 maja — OpenAI ogłasza wielowarstwowe podejście do pochodzenia treści generowanych przez AI, łączące trzy uzupełniające się mechanizmy.

Mechanizm	Zakres	Odporność na modyfikacje
Metadane C2PA	Obrazy, audio, wideo	Średnia (możliwe do usunięcia)
Wodny znak SynthID (Google DeepMind)	Tylko obrazy	Wysoka
Narzędzie openai.com/verify	Treści generowane przez OpenAI	N/D

OpenAI integruje teraz niewidoczny cyfrowy znak wodny SynthID od Google DeepMind we wszystkich obrazach generowanych przez ChatGPT, Codex i API OpenAI. SynthID koduje pochodzenie bezpośrednio w pikselach obrazu w sposób niewyczuwalny i jest odporny na większość typowych modyfikacji (kadrowanie, filtry, kompresja). Publiczne narzędzie openai.com/verify pozwala każdemu przesłać obraz, aby wykryć obecność znaku wodnego SynthID — na razie w ograniczonym podglądzie do treści OpenAI.

🔗 Ogłoszenie OpenAI

NVIDIA Sana WM — Model świata na pojedynczym GPU

19 maja — NVIDIA AI prezentuje Sana WM (World Model). Na podstawie pojedynczego obrazu, opisu tekstowego i trajektorii kamery model generuje spójne i sterowalne wideo — wszystko na jednym GPU.

Architektura opiera się na czterech innowacjach: Hybrid Linear Attention, Dual-Branch Camera Control, Two-Stage Generation Pipeline oraz Robust Annotation Pipeline. Projekt jest w pełni open source (artykuł + kod + model).

🔗 Ogłoszenie NVIDIA AI

Wan2.7-Image — Kontrola palety kolorów

19 maja — Alibaba ogłasza kontrolę palety kolorów (Palette Control) dla Wan2.7-Image. Funkcja pozwala wyodrębnić paletę barw z dowolnego obrazu — niczym z dzieła sztuki — i zastosować ją w nowej kreacji. Dostępne bezpośrednio na wan.video. Ogłoszenie wygenerowało 529 742 wyświetlenia na X.

🔗 Ogłoszenie Alibaba Wan

ElevenLabs — Głos Alberta Einsteina do nauczania

19 maja — ElevenLabs ogłasza wprowadzenie odtworzonego głosu Alberta Einsteina na swojej platformie, w formie agenta konwersacyjnego przeznaczonego do nauczania. Agent pokazuje, jak głosowa AI może uczynić naukę bardziej interaktywną, dostępną i wielojęzyczną. Demonstracja jest dostępna na start.elevenlabs.io. Nauczyciele mogą uzyskać darmowy plan Pro w ramach programu Impact.

Równolegle ElevenLabs ogłasza pilotaż w Polsce: wdrożenie agentów głosowych w publicznych usługach zdrowotnych (NFZ) tego lata.

🔗 Ogłoszenie ElevenLabs

xAI Grok zintegrowany z OpenClaw — lokalny agent open-source do wielu komunikatorów

19 maja — xAI ogłasza integrację Groka z OpenClaw, osobistym agentem open-source i lokalnym z założenia (local-first). Subskrybenci Grok i X Premium mogą teraz używać Groka w OpenClaw, który działa na dowolnym sprzęcie (Mac Mini, laptop, Raspberry Pi) i łączy się z WhatsApp, Telegram, Slack, Discord, Signal oraz iMessage.

🔗 Ogłoszenie xAI

Z.ai GLM-5.1 — Nr 1 open-source SWE-Bench Pro, MIT, 200K kontekstu

18 maja — Z.ai (Zhipu AI) udostępnia GLM-5.1 na OrcaRouter. Model twierdzi, że zajmuje pierwsze miejsce wśród modeli open-source na SWE-Bench Pro (benchmark naprawy kodu w warunkach rzeczywistych), przewyższając nawet niektóre modele własnościowe. Licencja MIT, kontekst 200K tokenów, zaprojektowany do długotrwałego programowania agentowego (long-horizon agentic coding).

🔗 Ogłoszenie OrcaRouter

Krótkie informacje

The Problem Solvers (Anthropic) — Nowa seria wideo pokazująca założycieli budujących z Claude. Pierwsze odcinki: Scott Wu (Cognition/Devin) i Kay Zhu (Genspark). 🔗 claude.com/problem-solvers
Manus × Higgsfield (connector MCP) — Manus integruje Higgsfield przez MCP, aby dać twórcom profesjonalną kontrolę nad generowaniem obrazów/wideo w ich workflow. 🔗 manus.im/blog
OpenAI Guaranteed Capacity — Nowa oferta pozwalająca firmom rezerwować dostęp do zasobów obliczeniowych OpenAI poprzez zobowiązania na 1 do 3 lat, ze wzrastającymi rabatami zależnie od czasu trwania. 🔗 openai.com
Perplexity Computer — Rho — Rho skróciło tygodniowy czas spotkań o 90% i zaoszczędziło 120 godzin w ciągu 12 tygodni dzięki Perplexity Computer, który monitoruje Slack, Notion, Jira, Figma i Google Docs. 🔗 Perplexity na X

Co to oznacza

Konwergencja Managed Agents. Google i Anthropic ogłaszają tego samego dnia, niemal o tej samej godzinie, podobną infrastrukturę pod tą samą nazwą: Managed Agents. W przypadku Google jest to Antigravity otwarte przez API Gemini — jedno wywołanie wystarcza, aby wdrożyć agenta w odizolowanym sandboksie Linux. U Anthropic są to self-hosted sandboxes (Cloudflare, Daytona, Modal, Vercel) oraz tunele MCP dla sieci prywatnych. Ta konwergencja nie jest przypadkiem: oznacza pojawienie się nowej, standaryzowanej warstwy infrastruktury AI, pomiędzy surowym modelem a końcową aplikacją.

AI enterprise organizuje się wokół suwerenności. Przejęcie Reliant AI przez Cohere, sojusz KPMG-Anthropic z Claude w Digital Gateway oraz oferta OpenAI Guaranteed Capacity pokazują ten sam kierunek: duże organizacje chcą systemów AI w swoim obszarze, z własnymi danymi, własnymi zasadami bezpieczeństwa i wieloletnimi zobowiązaniami dotyczącymi mocy obliczeniowej. „Suwerenny” (sovereign) stał się słowem-kluczem AI enterprise w 2026 roku.

Wyścig o długoterminowe programowanie agentowe. Gemini 3.5 Flash (optymalizowany pod agentów + coding), GLM-5.1 od Z.ai (Nr 1 open-source SWE-Bench Pro, 200K kontekstu), Grok Skills (trwałe workflow) — wszystkie celują w ten sam przypadek użycia: agent, który pracuje nad złożonym zadaniem przez wiele godzin bez udziału człowieka. GitHub Copilot integruje Gemini 3.5 Flash tego samego dnia, w którym następuje jego premiera, co pokazuje, z jaką prędkością narzędzia dla deweloperów absorbują nowe modele.

Pochodzenie i zaufanie do treści AI. Połączenie C2PA + SynthID + openai.com/verify ogłoszone przez OpenAI (z SynthID od Google DeepMind) reprezentuje niespotykane, wielowarstwowe podejście: metadane dla kontekstu, niewidoczny znak wodny dla trwałości nawet po modyfikacji, publiczne narzędzie do weryfikacji. Ten ruch w stronę śledzenia pochodzenia generowanych treści stopniowo staje się normą branżową, wspieraną wspólnie przez OpenAI, Google i koalicję C2PA.