Project Glasswing i Claude Mythos Preview, Meta Muse Spark, Gemini CLI v0.37.0

Tydzień od 5 do 9 kwietnia 2026 był zdominowany przez dwa duże ogłoszenia: Anthropic zaprezentowało Project Glasswing, koalicję jedenastu dużych firm technologicznych wokół Claude Mythos Preview do wykrywania podatności zero-day na dużą skalę, podczas gdy Meta wróciła z Muse Spark, swoim pierwszym modelem bez open-weights od roku. Równolegle Google, OpenAI, GitHub i Perplexity opublikowały istotne aktualizacje dla swoich deweloperów i użytkowników.

Project Glasswing i Claude Mythos Preview

7 kwietnia 2026 — Anthropic ogłosiło Project Glasswing, inicjatywę bezpieczeństwa oprogramowania skupiającą jedenaście organizacji: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, The Linux Foundation, Microsoft, NVIDIA i Palo Alto Networks. Inicjatywa opiera się na możliwościach nowego modelu frontier o ograniczonym dostępie: Claude Mythos Preview.

Co robi Mythos Preview

Model wykazał zdolność identyfikowania tysięcy podatności zero-day w głównych systemach operacyjnych i przeglądarkach internetowych, w tym takich, które pozostawały niewykryte przez dziesięciolecia. Trzy konkretne przykłady ilustrują skalę odkryć:

Luka sprzed 27 lat w OpenBSD, pozwalająca zdalnie zawiesić dowolną podłączoną maszynę
Podatność sprzed 16 lat w FFmpeg, ukryta w jednej linii kodu testowanej ponad pięć milionów razy bez wykrycia
Kilka luk w jądrze Linux umożliwiających eskalację uprawnień aż do pełnej kontroli nad maszyną

Te przykłady pokazują, że Mythos Preview nie ogranicza się do wykrywania powierzchownych problemów — odnajduje błędy logiczne ukryte w krytycznych bazach kodu, od lat nieustannie audytowanych przez tysiące badaczy.

Benchmarki

Wyniki Mythos Preview na benchmarkach referencyjnych pokazują wyraźny postęp względem Opus 4.6:

Benchmark	Mythos Preview	Opus 4.6
SWE-bench Verified	93,9 %	80,8 %
SWE-bench Pro	77,8 %	53,4 %
Terminal-Bench 2.0	82,0 %	65,4 %
SWE-bench Multilingual	87,3 %	77,8 %
CyberGym (cyberbezpieczeństwo)	83,1 %	66,6 %
GPQA Diamond	94,6 %	91,3 %
Humanity’s Last Exam (bez narzędzi)	56,8 %	40,0 %

Skok na SWE-bench Verified — z 80,8 % do 93,9 % — jest szczególnie istotny: to najczęściej używany benchmark do mierzenia zdolności modelu do rozwiązywania rzeczywistych błędów w prawdziwych repozytoriach open source. W CyberGym, poświęconym cyberbezpieczeństwu, wzrost o ponad 16 punktów stawia Mythos Preview w osobnej kategorii dla zadań bezpieczeństwa ofensywnego i defensywnego.

Zaangażowanie finansowe i zarządzanie

Anthropic zobowiązuje się do przekazania 100 milionów dolarów w kredytach użycia dla partnerów projektu, wraz z 4 milionami dolarów w bezpośrednich darowiznach dla organizacji bezpieczeństwa open source:

2,5 mln $ dla Alpha-Omega i OpenSSF za pośrednictwem Linux Foundation
1,5 mln $ dla Apache Software Foundation

Ten poziom zaangażowania finansowego pokazuje, że Anthropic traktuje Glasswing jako inicjatywę długoterminową, a nie zwykłe partnerstwo wizerunkowe. Raport o naprawionych podatnościach zostanie opublikowany w ciągu 90 dni.

Dostępność i ceny

Mythos Preview nie jest od razu publicznie udostępniony. Po wyczerpaniu początkowej puli kredytów model będzie dostępny dla uczestników w cenie 25 $/125$ za milion tokenów (wejście/wyjście), przez API Claude, Amazon Bedrock, Google Cloud Vertex AI i Microsoft Foundry.

Szczegółowy raport techniczny o odkrytych podatnościach i exploitach jest dostępny na blogu Red Team Anthropic, a pełna system card została opublikowana na anthropic.com.

“This project represents a watershed moment for AI-assisted cybersecurity — not because of what Claude can do today, but because of what it will be able to do as capabilities continue to scale.”

🇵🇱 Ten projekt stanowi przełomowy moment dla cyberbezpieczeństwa wspieranego przez AI — nie ze względu na to, co Claude potrafi dziś, lecz ze względu na to, do czego będzie zdolny, gdy możliwości będą nadal się skalować. — Oficjalne ogłoszenie Anthropic

🔗 Project Glasswing · System Card Mythos Preview · Raport Red Team

Meta Muse Spark: powrót Meta z zamkniętym modelem

8 kwietnia 2026 — Meta ogłosiła Muse Spark, pierwszy model nowej rodziny “Muse”, opracowany przez Meta Superintelligence Labs (MSL) — nowy wewnętrzny podmiot zajmujący się badaniami nad zaawansowaną AI. To pierwszy model Meta od czasu Llama 4 w kwietniu 2025, czyli po roku ciszy, a przede wszystkim pierwszy model Meta niedostępny w open-weights.

Możliwości i pozycjonowanie

Muse Spark jest pozycjonowany jako krok w stronę “personal superintelligence” (personal superintelligence). Model obejmuje kilka obszarów z zaawansowanymi możliwościami:

Obszar	Opis
Multimodalny	Zaawansowana percepcja i rozumienie wizualne, integracja informacji wizualnych z różnych źródeł
Rozumowanie	Rozumowanie krok po kroku, myślenie przed odpowiedzią (test-time reasoning)
Zdrowie	Analiza obrazów medycznych, spersonalizowane rekomendacje żywieniowe
Agentyczne	Możliwości agentowe do złożonych zadań
Contemplating mode	Orkiestracja wielu agentów rozumujących równolegle (wdrażanie stopniowe)

Model integruje “compression of thought” (thought compression) w celu optymalizacji tokenów rozumowania i obsługuje test-time scaling poprzez wielu równoległych agentów. Tryb Contemplating, nadal we wdrażaniu stopniowym, jest jedną z najbardziej oczekiwanych funkcji: pozwala przydzielić kilku agentów do tego samego problemu równolegle, z których każdy rozumuje niezależnie przed syntezą.

Wyniki

Według Artificial Analysis (8 kwietnia 2026), Muse Spark osiąga wynik 52 w Artificial Analysis Intelligence Index, co plasuje go w globalnej czołówce 4 za Gemini 3.1 Pro, GPT-5.4 i Claude Opus 4.6. To zauważony powrót Meta, która wraca bezpośrednio do grona najlepszych modeli frontier.

Architektura

Meta opisuje trzy osie skalowania dla Muse Spark:

Pretraining: całkowita przebudowa stacku w ciągu dziewięciu miesięcy, z ulepszeniami architektury i danych
Reinforcement Learning: skalowalne wzmacnianie możliwości po pretrainingu
Test-time reasoning: rozszerzone rozumowanie bez zwiększania latencji dzięki równoległości agentów

Bezpieczeństwo i dostępność

Meta informuje, że przeprowadziła rozbudowane ewaluacje za pomocą swojego Advanced AI Scaling Framework v2. Apollo Research wykonało niezależne ewaluacje na checkpointcie przedpremierowym i stwierdziło solidne zachowania odmowy w obszarach wysokiego ryzyka (biologia itp.).

Muse Spark jest dostępny od 8 kwietnia na meta.ai oraz w aplikacji Meta AI. Dostęp API jest w prywatnym preview dla wybranych partnerów — brak natychmiastowego publicznego dostępu.

🔗 Blog Meta AI — Muse Spark · Tweet ogłaszający · Benchmark Artificial Analysis

Anthropic: infrastruktura i agenci

Partnerstwo Google + Broadcom — wiele gigawatów TPU od 2027

6 kwietnia 2026 — Anthropic ogłosiło umowę z Google i Broadcom dotyczącą wielu gigawatów nowej generacji mocy obliczeniowej TPU, która ma wejść do użytku od 2027 roku. To największe zobowiązanie infrastrukturalne w historii Anthropic.

Kontekst wzrostu jest znaczący:

Roczny przychód w ujęciu run-rate (run-rate revenue) przekracza obecnie 30 miliardów dolarów, wobec około 9 miliardów pod koniec 2025
Ponad 1 000 klientów biznesowych wydaje każdy ponad milion dolarów rocznie, wobec 500+ w lutym 2026 — czyli podwojenie w mniej niż dwa miesiące

“This groundbreaking partnership with Google and Broadcom is a continuation of our disciplined approach to scaling infrastructure: we are building the capacity necessary to serve the exponential growth we have seen in our customer base while also enabling Claude to define the frontier of AI development.”

🇵🇱 To przełomowe partnerstwo z Google i Broadcom jest kontynuacją naszego zdyscyplinowanego podejścia do skalowania infrastruktury: budujemy możliwości niezbędne do obsłużenia wykładniczego wzrostu, jaki obserwujemy w naszej bazie klientów, jednocześnie umożliwiając Claude wyznaczanie granicy rozwoju AI. — Krishna Rao, CFO Anthropic

Większość nowej mocy obliczeniowej zostanie zainstalowana w Stanach Zjednoczonych, zgodnie z listopadowym zobowiązaniem z 2025 roku do zainwestowania 50 miliardów dolarów w amerykańską infrastrukturę. Claude pozostaje jedynym modelem frontier dostępnym na trzech głównych platformach chmurowych: AWS Bedrock, Google Cloud Vertex AI i Microsoft Azure Foundry.

🔗 Ogłoszenie partnerstwa

Managed Agents — architektura rozdzielona, latencja mniejsza o 90 %

8 kwietnia 2026 — Engineering Blog Anthropic opublikował artykuł techniczny opisujący architekturę Managed Agents, hostowanej usługi do uruchamiania long-running agentów na platformie Claude.

Centralna idea polega na rozdzieleniu mózgu (Claude i jego harness) od rąk (sandbox wykonawczy, narzędzia) oraz od sesji (dziennik zdarzeń). Każdy komponent staje się niezależnym interfejsem, możliwym do wymiany i skalowania osobno.

Zmierzona poprawa po rozdzieleniu:

Metryka	Poprawa
p50 TTFT (czas do pierwszego tokenu)	-60 %
p95 TTFT	-90 %

Rozdzielenie rozwiązuje także dwa problemy bezpieczeństwa: izolację credentials (tokeny OAuth nigdy nie są dostępne z sandboxu wykonawczego kodu) oraz odporność (jeśli harness ulegnie awarii, nowy uruchamia się od ostatniego wydarzenia sesji bez utraty kontekstu).

🔗 Scaling Managed Agents

Google Gemini

Gemini CLI v0.37.0 — Dynamic Sandbox, Chapters i persistent browser

8 kwietnia 2026 — Wersja v0.37.0 Gemini CLI wprowadza trzy usprawnienia dla workflow deweloperskich:

Funkcja	Opis
Dynamic Sandbox Expansion	Dynamiczne rozszerzanie sandbox + obsługa worktree dla Linux i Windows
Chapters (Narrative Flow)	Tematyczne grupowanie narzędzi w “rozdziały” dla lepszej struktury sesji
Advanced Browser Capabilities	Trwałe sesje przeglądarki i dynamiczne wykrywanie narzędzi w browser agent

Funkcja Chapters nadaje długim sesjom narracyjną ciągłość: każda grupa działań tworzy “rozdział” z własną logiką, co ułatwia śledzenie i wznawianie złożonej sesji. Browser agent zyskuje trwałość — sesje pozostają aktywne między wywołaniami, a dostępne narzędzia są wykrywane dynamicznie.

🔗 Dziennik zmian Gemini CLI

Interaktywne symulacje i modele 3D w Gemini App

9 kwietnia 2026 — Gemini App potrafi teraz przekształcać złożone koncepcje w interaktywne wizualizacje bezpośrednio w czacie. Użytkownik może regulować parametry fizyczne w czasie rzeczywistym (prędkość, grawitacja, masa) i obserwować efekt w działającej symulacji — orbita Księżyca, rotacja cząsteczek, systemy dynamiczne. Dostępne globalnie z modelem Pro w pasku promptu. Tymczasowo niedostępne dla kont Education i Workspace.

🔗 Symulacje 3D w Gemini App

Notebooks Gemini — synchronizacja z NotebookLM

8 kwietnia 2026 — Google uruchamia Notebooks w Gemini App: trwałe przestrzenie robocze synchronizujące Gemini App i NotebookLM dla złożonych projektów. Notebooks pozwalają organizować rozmowy, niestandardowe instrukcje i pliki (dokumenty, PDF). Źródło dodane w Gemini App pojawia się automatycznie w NotebookLM i odwrotnie. Dostępne w tym tygodniu dla subskrybentów Google AI Ultra, Pro i Plus w wersji web. Mobile i dostęp bezpłatny wkrótce.

🔗 Notebooks Gemini + NotebookLM

OpenAI

Nowy próg Pro za 100 $/mies. — 5x więcej Codex

9 kwietnia 2026 — OpenAI wprowadza nowy próg Pro za **100 $/mies.**, pozycjonowany między progiem Plus (~20$ /mies.) a istniejącym Pro za 200 $/mies. Oferuje pięć razy więcej użycia Codex niż próg Plus, zaprojektowany dla długich i intensywnych sesji.

Próg	Cena	Użycie Codex
Plus	~20 $/mies.	Standardowe
Pro (nowy)	100 $/mies.	5× Plus
Pro (istniejący)	200 $/mies.	Maksymalne

Równolegle OpenAI przedłuża promocję 2x użycia Codex dla obecnych subskrybentów płacących 200 $/mies. do 31 maja 2026 i resetuje ich limity przepustowości.

”Next phase of enterprise AI” — nota Denise Dresser

8 kwietnia 2026 — Chief Revenue Officer Denise Dresser publikuje podsumowanie po swoich pierwszych 90 dniach. Kluczowe punkty: działalność enterprise odpowiada teraz za ponad 40 % przychodów (na ścieżce do parytetu z rynkiem konsumenckim pod koniec 2026), Codex przekracza 3 miliony użytkowników tygodniowo (+5x od początku 2026), a ChatGPT ma 900 milionów użytkowników tygodniowo. OpenAI przedstawia dwa strategiczne kierunki: OpenAI Frontier (agenci przechodzący przez systemy enterprise) oraz zunifikowaną AI superapp dla zespołów.

🔗 Next phase of enterprise AI

Safety Fellowship i Child Safety Blueprint

6-8 kwietnia 2026 — OpenAI ogłasza dwie inicjatywy bezpieczeństwa. OpenAI Safety Fellowship (6 kwi.) to zewnętrzny program badawczy otwarty do 3 maja 2026, wynagradzany zasobami obliczeniowymi, dla prac nad ewaluacją, odpornością i nadzorem agentowym — harmonogram: 14 września 2026 do 5 lutego 2027. Child Safety Blueprint (8 kwi.) proponuje ramy walki z wykorzystywaniem dzieci przez AI, współtworzone z NCMEC, Thorn i Attorney General Alliance, oparte na trzech filarach: modernizacji przepisów dotyczących treści CSAM generowanych przez AI, usprawnieniu zgłaszania oraz wbudowaniu bezpieczeństwa od projektu (safety-by-design).

🔗 Safety Fellowship · Child Safety Blueprint

GitHub Copilot

Skan bezpieczeństwa OWASP Top 10 z terminala 9 kwietnia 2026 — GitHub Copilot CLI integruje zautomatyzowany workflow bezpieczeństwa bezpośrednio z terminala. W kilku komendach deweloperzy mogą uruchomić pełny skan swojego repozytorium, przypisać wyniki do kategorii OWASP Top 10 i automatycznie otworzyć issues GitHub dla każdej wykrytej luki — bez opuszczania środowiska CLI. Bezpośrednie uzupełnienie Project Glasswing dla zespołów, które już korzystają z narzędzi GitHub.

Agent “Rubber Duck” — automatyczny review

8 kwietnia 2026 — Zespół GitHub Research publikuje agenta “Rubber Duck” dla Copilot CLI. Zainspirowany klasyczną techniką debugowania (tłumaczenie kodu na głos, aby znaleźć problemy), agent automatycznie analizuje przesłany kod i formułuje ustrukturyzowany review bezpośrednio w terminalu. Eksperymentalny, ale oficjalnie repostowany przez @github.

🔗 Tweet Copilot CLI OWASP · Tweet agenta Rubber Duck

Perplexity

Integracja Plaid — finanse osobiste w Perplexity Computer

9 kwietnia 2026 — Perplexity uruchamia integrację z Plaid, umożliwiając użytkownikom połączenie kont bankowych, kart kredytowych i pożyczek bezpośrednio w Perplexity Computer. Dostęp jest w trybie tylko do odczytu — dane nie przechodzą przez serwery Perplexity. Sieć Plaid obejmuje ponad 12 000 instytucji (Chase, Fidelity, Vanguard, Robinhood itd.). Przypadki użycia: obliczanie majątku netto, śledzenie budżetu, planista spłaty długów, prognoza emerytalna. Dostępne na komputerach w Stanach Zjednoczonych i Kanadzie.

Poziom	Funkcje
Standard	Połączenie portfela, podstawowy dostęp do Portfolio
Pro / Max	Zaawansowane analizy, interaktywne pulpity nawigacyjne

Billion Dollar Build — konkurs dla startupów

8 kwietnia 2026 — Perplexity uruchamia “Billion Dollar Build”, 8-tygodniowy konkurs, w którym zespoły używają Perplexity Computer do zbudowania firmy z trajektorią do 1 miliarda dolarów wyceny. Nagrody dla finalistów: do 1 miliona dolarów inwestycji z Perplexity Fund + do 1 miliona dolarów w kredytach Computer.

🔗 Blog o integracji Plaid · Tweet Billion Dollar Build

Agenci i narzędzia

Manus integruje się ze Slackiem — trzy tryby

6 kwietnia 2026 — Manus (obecnie powiązany z Meta) uruchamia pełen zestaw integracji Slack oparty na trzech trybach: agent w DM z trwałą pamięcią do zadań osobistych, wzmianka @manus na kanałach zespołowych do zadań zbiorowych (bez trwałej pamięci — każdy wątek to nowe zadanie) oraz łącznik MCP do automatyzowania raportów i podsumowań w Twoim imieniu z poziomu manus.im. Dostępne w płatnym planie Slacka.

🔗 Blog Manus dla Slacka

Genspark AI Workspace 4.0 — Claw Desktop, pluginy Office

8 kwietnia 2026 — Genspark uruchamia wersję 4.0 swojego środowiska pracy AI z czterema komponentami: Claw for Desktop (Computer Use i Browser Use do sterowania komputerem), pluginy Microsoft Office dla PowerPoint, Excel i Word, Speakly (tłumaczenie w czasie rzeczywistym i notatki ze spotkań) oraz Advanced Workflows na nowym silniku OpenCode.

🔗 Blog Genspark

Media generatywne i hardware

Stability AI Brand Studio — platforma kreatywna dla marek

8 kwietnia 2026 — Stability AI uruchamia Brand Studio, kompleksową platformę produkcji kreatywnej zaprojektowaną dla zespołów marketingowych w firmach. Sercem systemu jest Brand Central Hub: modele Brand ID trenowane na wizualnych elementach marki (styl fotograficzny, paleta, wzory, umiejscowienie logo). Producer Mode przekształca opis w ustrukturyzowany plan produkcji i wykonuje go automatycznie krok po kroku. Curated Model Routing inteligentnie wybiera najbardziej odpowiedni model spośród ofert Stability AI i firm trzecich (w tym Seedream i Nano Banana). Po stronie enterprise: SSO, kontrola dostępu oparta na rolach, workflowy akceptacji. Partner startowy: agencja kreatywna Huge. Dostępność: plan Core (bezpłatny okres próbny) + plan Enterprise.

🔗 Brand Studio przez Stability AI

NVIDIA — Tydzień Narodowy Robotyki

9 kwietnia 2026 — Z okazji Tygodnia Narodowego Robotyki NVIDIA publikuje artykuł-zasób o swoich technologiach Physical AI: NVIDIA Cosmos (fundamentalne modele świata), Isaac Sim (symulacja), gama Jetson (edge AI), Nemotron i NemoClaw (open source). Bez nowej zapowiedzi hardware — pedagogiczne podsumowanie ekosystemu robotycznego NVIDIA dla deweloperów.

🔗 Tydzień Robotyki NVIDIA

Claude Code — aktualizacje v2.1.94 / v2.1.96 / v2.1.97

W ciągu tygodnia opublikowano trzy nowe wersje.

Wersja	Data	Kluczowe punkty
v2.1.94	5-6 kwi.	Obsługa Bedrock powered by Mantle, domyślny effort `high` dla API-key/Bedrock/Enterprise, kompaktowe wyświetlanie linków Slack MCP
v2.1.96	7 kwi.	Poprawka regresji Bedrock: błąd `403 "Authorization header is missing"` z `AWS_BEARER_TOKEN_BEDROCK`
v2.1.97	8-9 kwi.	Przełącznik widoku focus `Ctrl+O` w trybie NO_FLICKER, parametr `refreshInterval` paska statusu, wskaźnik `● N running` w `/agents`, kolorowanie składni Cedar

Wersja v2.1.94 wprowadza również istotną zmianę zachowania: pluginy skills deklarowane przez "skills": ["./"] korzystają teraz z pola name frontmatter zamiast nazwy katalogu. Wersja v2.1.97 naprawia kilka problemów z uprawnieniami Bash (prefiksy zmiennych środowiskowych, przekierowania sieciowe) oraz błąd, w którym reguły uprawnień, których nazwa odpowiadała właściwości prototypu JavaScript (toString itd.), były cicho ignorowane w settings.json.

🔗 CHANGELOG Claude Code

Co to oznacza

Tydzień od 5 do 9 kwietnia 2026 r. oznacza przyspieszenie w dwóch kierunkach, które się przecinają. Z jednej strony Anthropic wychodzi z logiki produktu konsumenckiego i wchodzi w logikę krytycznej infrastruktury: Project Glasswing i partnerstwo Google/Broadcom sygnalizują, że Anthropic pozycjonuje się jako dostawca możliwości AI na poziomie globalnego ekosystemu technologicznego, a nie tylko jako konkurent w wyścigu benchmarków. Zaangażowanie 100 milionów dolarów w kredytach i 30 miliardów dolarów rocznych przychodów potwierdza tę interpretację.

Z drugiej strony Meta wraca z Muse Spark, zrywając ze swoją polityką open-weights. To istotna zmiana strategiczna: Meta wybiera konkurencję w zamkniętym segmencie frontier zamiast utrzymywać pozycjonowanie open source. Utworzenie Meta Superintelligence Labs i pierwszy model spoza rodziny Llama sygnalizują głęboką zmianę strategii AI grupy.

Dla deweloperów tydzień jest gęsty, ale spójny: Gemini CLI zyskuje trwałość i strukturę, GitHub Copilot rozszerza zakres bezpieczeństwa, Perplexity idzie w kierunku danych osobistych, a Claude Code kontynuuje szybki cykl aktualizacji.

Źródła

Ten dokument został przetłumaczony z wersji fr na język pl przy użyciu modelu gpt-5.4-mini. Aby uzyskać więcej informacji na temat procesu tłumaczenia, odwiedź https://gitlab.com/jls42/ai-powered-markdown-translator