Szukaj

Project Glasswing i Claude Mythos Preview, Meta Muse Spark, Gemini CLI v0.37.0

Project Glasswing i Claude Mythos Preview, Meta Muse Spark, Gemini CLI v0.37.0

Tydzień od 5 do 9 kwietnia 2026 był zdominowany przez dwa duże ogłoszenia: Anthropic zaprezentowało Project Glasswing, koalicję jedenastu dużych firm technologicznych wokół Claude Mythos Preview do wykrywania podatności zero-day na dużą skalę, podczas gdy Meta wróciła z Muse Spark, swoim pierwszym modelem bez open-weights od roku. Równolegle Google, OpenAI, GitHub i Perplexity opublikowały istotne aktualizacje dla swoich deweloperów i użytkowników.


Project Glasswing i Claude Mythos Preview

7 kwietnia 2026 — Anthropic ogłosiło Project Glasswing, inicjatywę bezpieczeństwa oprogramowania skupiającą jedenaście organizacji: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, The Linux Foundation, Microsoft, NVIDIA i Palo Alto Networks. Inicjatywa opiera się na możliwościach nowego modelu frontier o ograniczonym dostępie: Claude Mythos Preview.

Co robi Mythos Preview

Model wykazał zdolność identyfikowania tysięcy podatności zero-day w głównych systemach operacyjnych i przeglądarkach internetowych, w tym takich, które pozostawały niewykryte przez dziesięciolecia. Trzy konkretne przykłady ilustrują skalę odkryć:

  • Luka sprzed 27 lat w OpenBSD, pozwalająca zdalnie zawiesić dowolną podłączoną maszynę
  • Podatność sprzed 16 lat w FFmpeg, ukryta w jednej linii kodu testowanej ponad pięć milionów razy bez wykrycia
  • Kilka luk w jądrze Linux umożliwiających eskalację uprawnień aż do pełnej kontroli nad maszyną

Te przykłady pokazują, że Mythos Preview nie ogranicza się do wykrywania powierzchownych problemów — odnajduje błędy logiczne ukryte w krytycznych bazach kodu, od lat nieustannie audytowanych przez tysiące badaczy.

Benchmarki

Wyniki Mythos Preview na benchmarkach referencyjnych pokazują wyraźny postęp względem Opus 4.6:

BenchmarkMythos PreviewOpus 4.6
SWE-bench Verified93,9 %80,8 %
SWE-bench Pro77,8 %53,4 %
Terminal-Bench 2.082,0 %65,4 %
SWE-bench Multilingual87,3 %77,8 %
CyberGym (cyberbezpieczeństwo)83,1 %66,6 %
GPQA Diamond94,6 %91,3 %
Humanity’s Last Exam (bez narzędzi)56,8 %40,0 %

Skok na SWE-bench Verified — z 80,8 % do 93,9 % — jest szczególnie istotny: to najczęściej używany benchmark do mierzenia zdolności modelu do rozwiązywania rzeczywistych błędów w prawdziwych repozytoriach open source. W CyberGym, poświęconym cyberbezpieczeństwu, wzrost o ponad 16 punktów stawia Mythos Preview w osobnej kategorii dla zadań bezpieczeństwa ofensywnego i defensywnego.

Zaangażowanie finansowe i zarządzanie

Anthropic zobowiązuje się do przekazania 100 milionów dolarów w kredytach użycia dla partnerów projektu, wraz z 4 milionami dolarów w bezpośrednich darowiznach dla organizacji bezpieczeństwa open source:

  • 2,5 mln $ dla Alpha-Omega i OpenSSF za pośrednictwem Linux Foundation
  • 1,5 mln $ dla Apache Software Foundation

Ten poziom zaangażowania finansowego pokazuje, że Anthropic traktuje Glasswing jako inicjatywę długoterminową, a nie zwykłe partnerstwo wizerunkowe. Raport o naprawionych podatnościach zostanie opublikowany w ciągu 90 dni.

Dostępność i ceny

Mythos Preview nie jest od razu publicznie udostępniony. Po wyczerpaniu początkowej puli kredytów model będzie dostępny dla uczestników w cenie 25 /125/125 za milion tokenów (wejście/wyjście), przez API Claude, Amazon Bedrock, Google Cloud Vertex AI i Microsoft Foundry.

Szczegółowy raport techniczny o odkrytych podatnościach i exploitach jest dostępny na blogu Red Team Anthropic, a pełna system card została opublikowana na anthropic.com.

“This project represents a watershed moment for AI-assisted cybersecurity — not because of what Claude can do today, but because of what it will be able to do as capabilities continue to scale.”

🇵🇱 Ten projekt stanowi przełomowy moment dla cyberbezpieczeństwa wspieranego przez AI — nie ze względu na to, co Claude potrafi dziś, lecz ze względu na to, do czego będzie zdolny, gdy możliwości będą nadal się skalować. — Oficjalne ogłoszenie Anthropic

🔗 Project Glasswing · System Card Mythos Preview · Raport Red Team


Meta Muse Spark: powrót Meta z zamkniętym modelem

8 kwietnia 2026 — Meta ogłosiła Muse Spark, pierwszy model nowej rodziny “Muse”, opracowany przez Meta Superintelligence Labs (MSL) — nowy wewnętrzny podmiot zajmujący się badaniami nad zaawansowaną AI. To pierwszy model Meta od czasu Llama 4 w kwietniu 2025, czyli po roku ciszy, a przede wszystkim pierwszy model Meta niedostępny w open-weights.

Możliwości i pozycjonowanie

Muse Spark jest pozycjonowany jako krok w stronę “personal superintelligence” (personal superintelligence). Model obejmuje kilka obszarów z zaawansowanymi możliwościami:

ObszarOpis
MultimodalnyZaawansowana percepcja i rozumienie wizualne, integracja informacji wizualnych z różnych źródeł
RozumowanieRozumowanie krok po kroku, myślenie przed odpowiedzią (test-time reasoning)
ZdrowieAnaliza obrazów medycznych, spersonalizowane rekomendacje żywieniowe
AgentyczneMożliwości agentowe do złożonych zadań
Contemplating modeOrkiestracja wielu agentów rozumujących równolegle (wdrażanie stopniowe)

Model integruje “compression of thought” (thought compression) w celu optymalizacji tokenów rozumowania i obsługuje test-time scaling poprzez wielu równoległych agentów. Tryb Contemplating, nadal we wdrażaniu stopniowym, jest jedną z najbardziej oczekiwanych funkcji: pozwala przydzielić kilku agentów do tego samego problemu równolegle, z których każdy rozumuje niezależnie przed syntezą.

Wyniki

Według Artificial Analysis (8 kwietnia 2026), Muse Spark osiąga wynik 52 w Artificial Analysis Intelligence Index, co plasuje go w globalnej czołówce 4 za Gemini 3.1 Pro, GPT-5.4 i Claude Opus 4.6. To zauważony powrót Meta, która wraca bezpośrednio do grona najlepszych modeli frontier.

Architektura

Meta opisuje trzy osie skalowania dla Muse Spark:

  1. Pretraining: całkowita przebudowa stacku w ciągu dziewięciu miesięcy, z ulepszeniami architektury i danych
  2. Reinforcement Learning: skalowalne wzmacnianie możliwości po pretrainingu
  3. Test-time reasoning: rozszerzone rozumowanie bez zwiększania latencji dzięki równoległości agentów

Bezpieczeństwo i dostępność

Meta informuje, że przeprowadziła rozbudowane ewaluacje za pomocą swojego Advanced AI Scaling Framework v2. Apollo Research wykonało niezależne ewaluacje na checkpointcie przedpremierowym i stwierdziło solidne zachowania odmowy w obszarach wysokiego ryzyka (biologia itp.).

Muse Spark jest dostępny od 8 kwietnia na meta.ai oraz w aplikacji Meta AI. Dostęp API jest w prywatnym preview dla wybranych partnerów — brak natychmiastowego publicznego dostępu.

🔗 Blog Meta AI — Muse Spark · Tweet ogłaszający · Benchmark Artificial Analysis


Anthropic: infrastruktura i agenci

Partnerstwo Google + Broadcom — wiele gigawatów TPU od 2027

6 kwietnia 2026 — Anthropic ogłosiło umowę z Google i Broadcom dotyczącą wielu gigawatów nowej generacji mocy obliczeniowej TPU, która ma wejść do użytku od 2027 roku. To największe zobowiązanie infrastrukturalne w historii Anthropic.

Kontekst wzrostu jest znaczący:

  • Roczny przychód w ujęciu run-rate (run-rate revenue) przekracza obecnie 30 miliardów dolarów, wobec około 9 miliardów pod koniec 2025
  • Ponad 1 000 klientów biznesowych wydaje każdy ponad milion dolarów rocznie, wobec 500+ w lutym 2026 — czyli podwojenie w mniej niż dwa miesiące

“This groundbreaking partnership with Google and Broadcom is a continuation of our disciplined approach to scaling infrastructure: we are building the capacity necessary to serve the exponential growth we have seen in our customer base while also enabling Claude to define the frontier of AI development.”

🇵🇱 To przełomowe partnerstwo z Google i Broadcom jest kontynuacją naszego zdyscyplinowanego podejścia do skalowania infrastruktury: budujemy możliwości niezbędne do obsłużenia wykładniczego wzrostu, jaki obserwujemy w naszej bazie klientów, jednocześnie umożliwiając Claude wyznaczanie granicy rozwoju AI. — Krishna Rao, CFO Anthropic

Większość nowej mocy obliczeniowej zostanie zainstalowana w Stanach Zjednoczonych, zgodnie z listopadowym zobowiązaniem z 2025 roku do zainwestowania 50 miliardów dolarów w amerykańską infrastrukturę. Claude pozostaje jedynym modelem frontier dostępnym na trzech głównych platformach chmurowych: AWS Bedrock, Google Cloud Vertex AI i Microsoft Azure Foundry.

🔗 Ogłoszenie partnerstwa

Managed Agents — architektura rozdzielona, latencja mniejsza o 90 %

8 kwietnia 2026 — Engineering Blog Anthropic opublikował artykuł techniczny opisujący architekturę Managed Agents, hostowanej usługi do uruchamiania long-running agentów na platformie Claude.

Centralna idea polega na rozdzieleniu mózgu (Claude i jego harness) od rąk (sandbox wykonawczy, narzędzia) oraz od sesji (dziennik zdarzeń). Każdy komponent staje się niezależnym interfejsem, możliwym do wymiany i skalowania osobno.

Zmierzona poprawa po rozdzieleniu:

MetrykaPoprawa
p50 TTFT (czas do pierwszego tokenu)-60 %
p95 TTFT-90 %

Rozdzielenie rozwiązuje także dwa problemy bezpieczeństwa: izolację credentials (tokeny OAuth nigdy nie są dostępne z sandboxu wykonawczego kodu) oraz odporność (jeśli harness ulegnie awarii, nowy uruchamia się od ostatniego wydarzenia sesji bez utraty kontekstu).

🔗 Scaling Managed Agents


Google Gemini

Gemini CLI v0.37.0 — Dynamic Sandbox, Chapters i persistent browser

8 kwietnia 2026 — Wersja v0.37.0 Gemini CLI wprowadza trzy usprawnienia dla workflow deweloperskich:

FunkcjaOpis
Dynamic Sandbox ExpansionDynamiczne rozszerzanie sandbox + obsługa worktree dla Linux i Windows
Chapters (Narrative Flow)Tematyczne grupowanie narzędzi w “rozdziały” dla lepszej struktury sesji
Advanced Browser CapabilitiesTrwałe sesje przeglądarki i dynamiczne wykrywanie narzędzi w browser agent

Funkcja Chapters nadaje długim sesjom narracyjną ciągłość: każda grupa działań tworzy “rozdział” z własną logiką, co ułatwia śledzenie i wznawianie złożonej sesji. Browser agent zyskuje trwałość — sesje pozostają aktywne między wywołaniami, a dostępne narzędzia są wykrywane dynamicznie.

🔗 Dziennik zmian Gemini CLI

Interaktywne symulacje i modele 3D w Gemini App

9 kwietnia 2026 — Gemini App potrafi teraz przekształcać złożone koncepcje w interaktywne wizualizacje bezpośrednio w czacie. Użytkownik może regulować parametry fizyczne w czasie rzeczywistym (prędkość, grawitacja, masa) i obserwować efekt w działającej symulacji — orbita Księżyca, rotacja cząsteczek, systemy dynamiczne. Dostępne globalnie z modelem Pro w pasku promptu. Tymczasowo niedostępne dla kont Education i Workspace.

🔗 Symulacje 3D w Gemini App

Notebooks Gemini — synchronizacja z NotebookLM

8 kwietnia 2026 — Google uruchamia Notebooks w Gemini App: trwałe przestrzenie robocze synchronizujące Gemini App i NotebookLM dla złożonych projektów. Notebooks pozwalają organizować rozmowy, niestandardowe instrukcje i pliki (dokumenty, PDF). Źródło dodane w Gemini App pojawia się automatycznie w NotebookLM i odwrotnie. Dostępne w tym tygodniu dla subskrybentów Google AI Ultra, Pro i Plus w wersji web. Mobile i dostęp bezpłatny wkrótce.

🔗 Notebooks Gemini + NotebookLM


OpenAI

Nowy próg Pro za 100 $/mies. — 5x więcej Codex

9 kwietnia 2026 — OpenAI wprowadza nowy próg Pro za **100 /mies.,pozycjonowanymiędzyprogiemPlus( 20/mies.**, pozycjonowany między progiem Plus (~20 /mies.) a istniejącym Pro za 200 $/mies. Oferuje pięć razy więcej użycia Codex niż próg Plus, zaprojektowany dla długich i intensywnych sesji.

PrógCenaUżycie Codex
Plus~20 $/mies.Standardowe
Pro (nowy)100 $/mies.5× Plus
Pro (istniejący)200 $/mies.Maksymalne

Równolegle OpenAI przedłuża promocję 2x użycia Codex dla obecnych subskrybentów płacących 200 $/mies. do 31 maja 2026 i resetuje ich limity przepustowości.

”Next phase of enterprise AI” — nota Denise Dresser

8 kwietnia 2026 — Chief Revenue Officer Denise Dresser publikuje podsumowanie po swoich pierwszych 90 dniach. Kluczowe punkty: działalność enterprise odpowiada teraz za ponad 40 % przychodów (na ścieżce do parytetu z rynkiem konsumenckim pod koniec 2026), Codex przekracza 3 miliony użytkowników tygodniowo (+5x od początku 2026), a ChatGPT ma 900 milionów użytkowników tygodniowo. OpenAI przedstawia dwa strategiczne kierunki: OpenAI Frontier (agenci przechodzący przez systemy enterprise) oraz zunifikowaną AI superapp dla zespołów.

🔗 Next phase of enterprise AI

Safety Fellowship i Child Safety Blueprint

6-8 kwietnia 2026 — OpenAI ogłasza dwie inicjatywy bezpieczeństwa. OpenAI Safety Fellowship (6 kwi.) to zewnętrzny program badawczy otwarty do 3 maja 2026, wynagradzany zasobami obliczeniowymi, dla prac nad ewaluacją, odpornością i nadzorem agentowym — harmonogram: 14 września 2026 do 5 lutego 2027. Child Safety Blueprint (8 kwi.) proponuje ramy walki z wykorzystywaniem dzieci przez AI, współtworzone z NCMEC, Thorn i Attorney General Alliance, oparte na trzech filarach: modernizacji przepisów dotyczących treści CSAM generowanych przez AI, usprawnieniu zgłaszania oraz wbudowaniu bezpieczeństwa od projektu (safety-by-design).

🔗 Safety Fellowship · Child Safety Blueprint


GitHub Copilot

Skan bezpieczeństwa OWASP Top 10 z terminala 9 kwietnia 2026 — GitHub Copilot CLI integruje zautomatyzowany workflow bezpieczeństwa bezpośrednio z terminala. W kilku komendach deweloperzy mogą uruchomić pełny skan swojego repozytorium, przypisać wyniki do kategorii OWASP Top 10 i automatycznie otworzyć issues GitHub dla każdej wykrytej luki — bez opuszczania środowiska CLI. Bezpośrednie uzupełnienie Project Glasswing dla zespołów, które już korzystają z narzędzi GitHub.

Agent “Rubber Duck” — automatyczny review

8 kwietnia 2026 — Zespół GitHub Research publikuje agenta “Rubber Duck” dla Copilot CLI. Zainspirowany klasyczną techniką debugowania (tłumaczenie kodu na głos, aby znaleźć problemy), agent automatycznie analizuje przesłany kod i formułuje ustrukturyzowany review bezpośrednio w terminalu. Eksperymentalny, ale oficjalnie repostowany przez @github.

🔗 Tweet Copilot CLI OWASP · Tweet agenta Rubber Duck


Perplexity

Integracja Plaid — finanse osobiste w Perplexity Computer

9 kwietnia 2026 — Perplexity uruchamia integrację z Plaid, umożliwiając użytkownikom połączenie kont bankowych, kart kredytowych i pożyczek bezpośrednio w Perplexity Computer. Dostęp jest w trybie tylko do odczytu — dane nie przechodzą przez serwery Perplexity. Sieć Plaid obejmuje ponad 12 000 instytucji (Chase, Fidelity, Vanguard, Robinhood itd.). Przypadki użycia: obliczanie majątku netto, śledzenie budżetu, planista spłaty długów, prognoza emerytalna. Dostępne na komputerach w Stanach Zjednoczonych i Kanadzie.

PoziomFunkcje
StandardPołączenie portfela, podstawowy dostęp do Portfolio
Pro / MaxZaawansowane analizy, interaktywne pulpity nawigacyjne

Billion Dollar Build — konkurs dla startupów

8 kwietnia 2026 — Perplexity uruchamia “Billion Dollar Build”, 8-tygodniowy konkurs, w którym zespoły używają Perplexity Computer do zbudowania firmy z trajektorią do 1 miliarda dolarów wyceny. Nagrody dla finalistów: do 1 miliona dolarów inwestycji z Perplexity Fund + do 1 miliona dolarów w kredytach Computer.

🔗 Blog o integracji Plaid · Tweet Billion Dollar Build


Agenci i narzędzia

Manus integruje się ze Slackiem — trzy tryby

6 kwietnia 2026 — Manus (obecnie powiązany z Meta) uruchamia pełen zestaw integracji Slack oparty na trzech trybach: agent w DM z trwałą pamięcią do zadań osobistych, wzmianka @manus na kanałach zespołowych do zadań zbiorowych (bez trwałej pamięci — każdy wątek to nowe zadanie) oraz łącznik MCP do automatyzowania raportów i podsumowań w Twoim imieniu z poziomu manus.im. Dostępne w płatnym planie Slacka.

🔗 Blog Manus dla Slacka

Genspark AI Workspace 4.0 — Claw Desktop, pluginy Office

8 kwietnia 2026 — Genspark uruchamia wersję 4.0 swojego środowiska pracy AI z czterema komponentami: Claw for Desktop (Computer Use i Browser Use do sterowania komputerem), pluginy Microsoft Office dla PowerPoint, Excel i Word, Speakly (tłumaczenie w czasie rzeczywistym i notatki ze spotkań) oraz Advanced Workflows na nowym silniku OpenCode.

🔗 Blog Genspark


Media generatywne i hardware

Stability AI Brand Studio — platforma kreatywna dla marek

8 kwietnia 2026 — Stability AI uruchamia Brand Studio, kompleksową platformę produkcji kreatywnej zaprojektowaną dla zespołów marketingowych w firmach. Sercem systemu jest Brand Central Hub: modele Brand ID trenowane na wizualnych elementach marki (styl fotograficzny, paleta, wzory, umiejscowienie logo). Producer Mode przekształca opis w ustrukturyzowany plan produkcji i wykonuje go automatycznie krok po kroku. Curated Model Routing inteligentnie wybiera najbardziej odpowiedni model spośród ofert Stability AI i firm trzecich (w tym Seedream i Nano Banana). Po stronie enterprise: SSO, kontrola dostępu oparta na rolach, workflowy akceptacji. Partner startowy: agencja kreatywna Huge. Dostępność: plan Core (bezpłatny okres próbny) + plan Enterprise.

🔗 Brand Studio przez Stability AI

NVIDIA — Tydzień Narodowy Robotyki

9 kwietnia 2026 — Z okazji Tygodnia Narodowego Robotyki NVIDIA publikuje artykuł-zasób o swoich technologiach Physical AI: NVIDIA Cosmos (fundamentalne modele świata), Isaac Sim (symulacja), gama Jetson (edge AI), Nemotron i NemoClaw (open source). Bez nowej zapowiedzi hardware — pedagogiczne podsumowanie ekosystemu robotycznego NVIDIA dla deweloperów.

🔗 Tydzień Robotyki NVIDIA


Claude Code — aktualizacje v2.1.94 / v2.1.96 / v2.1.97

W ciągu tygodnia opublikowano trzy nowe wersje.

WersjaDataKluczowe punkty
v2.1.945-6 kwi.Obsługa Bedrock powered by Mantle, domyślny effort high dla API-key/Bedrock/Enterprise, kompaktowe wyświetlanie linków Slack MCP
v2.1.967 kwi.Poprawka regresji Bedrock: błąd 403 "Authorization header is missing" z AWS_BEARER_TOKEN_BEDROCK
v2.1.978-9 kwi.Przełącznik widoku focus Ctrl+O w trybie NO_FLICKER, parametr refreshInterval paska statusu, wskaźnik ● N running w /agents, kolorowanie składni Cedar

Wersja v2.1.94 wprowadza również istotną zmianę zachowania: pluginy skills deklarowane przez "skills": ["./"] korzystają teraz z pola name frontmatter zamiast nazwy katalogu. Wersja v2.1.97 naprawia kilka problemów z uprawnieniami Bash (prefiksy zmiennych środowiskowych, przekierowania sieciowe) oraz błąd, w którym reguły uprawnień, których nazwa odpowiadała właściwości prototypu JavaScript (toString itd.), były cicho ignorowane w settings.json.

🔗 CHANGELOG Claude Code


Co to oznacza

Tydzień od 5 do 9 kwietnia 2026 r. oznacza przyspieszenie w dwóch kierunkach, które się przecinają. Z jednej strony Anthropic wychodzi z logiki produktu konsumenckiego i wchodzi w logikę krytycznej infrastruktury: Project Glasswing i partnerstwo Google/Broadcom sygnalizują, że Anthropic pozycjonuje się jako dostawca możliwości AI na poziomie globalnego ekosystemu technologicznego, a nie tylko jako konkurent w wyścigu benchmarków. Zaangażowanie 100 milionów dolarów w kredytach i 30 miliardów dolarów rocznych przychodów potwierdza tę interpretację.

Z drugiej strony Meta wraca z Muse Spark, zrywając ze swoją polityką open-weights. To istotna zmiana strategiczna: Meta wybiera konkurencję w zamkniętym segmencie frontier zamiast utrzymywać pozycjonowanie open source. Utworzenie Meta Superintelligence Labs i pierwszy model spoza rodziny Llama sygnalizują głęboką zmianę strategii AI grupy.

Dla deweloperów tydzień jest gęsty, ale spójny: Gemini CLI zyskuje trwałość i strukturę, GitHub Copilot rozszerza zakres bezpieczeństwa, Perplexity idzie w kierunku danych osobistych, a Claude Code kontynuuje szybki cykl aktualizacji.


Źródła

Ten dokument został przetłumaczony z wersji fr na język pl przy użyciu modelu gpt-5.4-mini. Aby uzyskać więcej informacji na temat procesu tłumaczenia, odwiedź https://gitlab.com/jls42/ai-powered-markdown-translator