ai-powered-markdown-translatorPrzetłumaczony artykuł z fr na pl z gpt-5.4-mini.
Intensywny tydzień dla ekosystemu AI: Alibaba uruchamia swój flagowy model Qwen3.7-Max zaprojektowany dla ery agentowej, GitHub ujawnia incydent bezpieczeństwa związany ze złośliwym rozszerzeniem VS Code, NVIDIA publikuje otwarty framework zarządzania dla skills agentów, a Runway odświeża swój model do edycji wideo z Aleph 2.0 i Edit Studio. Po stronie narzędzi dla deweloperów Claude Code 2.1.146 zmienia nazwę /simplify na /code-review, a Codex 26.519 wprowadza Appshots na macOS.
Qwen3.7-Max — Flagowiec Alibaby dla ery agentowej
21 maja — Alibaba uruchamia Qwen3.7-Max, swój nowy flagowy model własnościowy, zaprojektowany specjalnie dla autonomicznych agentów. Model jest następcą wersji preview Qwen3.7-Max-Preview i Qwen3.7-Plus-Preview ocenianych na Arena 18 maja.
Pozycjonowanie jest wyraźnie „Agent Era”: Qwen3.7-Max celuje w zadania wykraczające poza jednorazowe zrozumienie i wchodzące w obszar długotrwałej autonomii oraz złożonej orkiestracji.
| Metryka | Wartość |
|---|---|
| Score AAII | 56,6 |
| Zmiana względem poprzedniej wersji | +4,8 pkt |
| Ciągłe godziny autonomii (test jądra) | 35 h |
| Wywołania narzędzi (test jądra) | 1 000+ |
| Wyświetlenia głównego tweeta | ~325 000 |
Pięć ogłoszonych możliwości:
- Agent kodowania end-to-end — prototypy frontend, wieloplikowe refaktoryzacje, rzeczywiste debugowanie
- Produktywność biurowa — zadania poprzez integracje MCP i zarządzanie wieloma agentami
- Długotrwała autonomia — 35 kolejnych godzin przy zadaniu optymalizacji jądra, 1 000+ wywołań narzędzi bez krytycznych halucynacji
- Niezależność od scaffoldów — kompatybilny z Claude Code, OpenClaw, Qwen Code lub dowolnym własnym stosem
- Wzmocnione rozumowanie naukowe — wynik AAII: 56,6 (+4,8 pkt)
Według Tongyi Lab (Alibaba), Qwen3.7-Max jest „naszym najnowszym modelem własnościowym zaprojektowanym specjalnie dla ery agentów”, z czołowym agentem kodowania, asystentem produktywności biurowej i długotrwałą autonomią — niezawodnym za każdym razem, niezależnym od scaffoldów.
Model jest dostępny przez Qwen Studio (chat.qwen.ai) oraz API Alibaba Cloud.
GitHub — Incydent bezpieczeństwa: złośliwe rozszerzenie VS Code
20 maja — GitHub ujawnia poważny incydent bezpieczeństwa: pracownik zainstalował złośliwe rozszerzenie VS Code z marketplace Microsoftu, co umożliwiło nieautoryzowany dostęp do wewnętrznych repozytoriów GitHub.
Początkowe ogłoszenie na X wygenerowało 13,4 miliona wyświetleń, 8 000 repostów i 25 000 polubień — znak znaczącego wpływu na społeczność. GitHub opublikował 5-częściowy wątek szczegółowo opisujący oś czasu i podjęte działania.
“1/ Yesterday we detected and contained a compromise of an employee device involving a poisoned VS Code extension. We removed the malicious extension version, isolated the endpoint, and began incident response immediately.”
🇵🇱 Wczoraj wykryliśmy i powstrzymaliśmy kompromitację urządzenia pracownika związaną ze skażonym rozszerzeniem VS Code. Usunęliśmy złośliwą wersję rozszerzenia, odizolowaliśmy punkt końcowy i natychmiast rozpoczęliśmy reagowanie na incydent. — @github na X
Co się wydarzyło:
- Wektor: złośliwe rozszerzenie VS Code z marketplace Microsoftu
- Urządzenie pracownika GitHub zostało skompromitowane
- Nieautoryzowany dostęp do wewnętrznych repozytoriów GitHub
Co nie zostało dotknięte (według GitHub):
- Brak potwierdzonego wpływu na dane klientów (firmy, organizacje, repozytoria publiczne lub prywatne)
Natychmiastowe działania:
- Usunięcie złośliwego rozszerzenia
- Izolacja skompromitowanego endpointu
- Analiza dzienników (logs) i rotacja sekretów
- Zwiększony monitoring infrastruktury
GitHub zobowiązał się opublikować pełny raport po zakończeniu dochodzenia. Ten incydent ponownie rozpala debatę o bezpieczeństwie marketplace rozszerzeń VS Code, który zawiera dziesiątki tysięcy rozszerzeń, a ich weryfikacja pozostaje ograniczona.
NVIDIA Verified Agent Skills — Otwarty standard zarządzania agentami AI
21 maja — NVIDIA uruchamia NVIDIA-Verified Agent Skills, otwarty framework zarządzania służący do zabezpieczania możliwości (skills) agentów AI. Inicjatywa odpowiada na rosnący problem: skills zwiększają możliwości agentów, ale wprowadzają także potencjalne podatności.
„Zweryfikowany” skill według NVIDIA opiera się na czterech filarach:
| Składnik | Opis |
|---|---|
| Katalogowanie | Codzienna synchronizacja z zespołów produktowych NVIDIA |
| SkillSpector | Skaner ryzyka oparty na OWASP LLM i MITRE ATLAS |
| Podpis kryptograficzny | Podpis odłączony skill.oms.sig weryfikowalny przez OpenSSF Model Signing |
| Skill Card (SKILLCARD.yaml) | Metadane machine-readable: pochodzenie, zależności, ograniczenia, status |
Framework wykrywa między innymi: podatne zależności, prompt injection, trigger abuse, excessive agency oraz tool poisoning.
Specyfikacja techniczna jest dostępna publicznie przez agentskills.io (format SKILL.md), natywnie kompatybilna z Claude Code, OpenAI Codex i Cursor. Publiczne repozytorium skills NVIDIA jest dostępne na github.com/nvidia/skills.
“Verified means cataloged, scanned, signed, and documented with a skill card.”
🇵🇱 Zweryfikowany oznacza skatalogowany, przeskanowany, podpisany i udokumentowany kartą kompetencji. — NVIDIA Developer Blog, 21 maja 2026
Fakt, że specyfikacja jest otwarta i kompatybilna z trzema głównymi narzędziami do kodowania AI (Claude Code, Codex, Cursor), sugeruje ambicję stworzenia standardu branżowego, a nie tylko wewnętrznego narzędzia NVIDIA.
Runway Aleph 2.0 i Edit Studio — Edycja wideo do 30 sekund w 1080p
21 maja — Runway uruchamia Aleph 2.0, dużą aktualizację swojego modelu do edycji wideo, wraz z Edit Studio, nowym interfejsem przeznaczonym dla zespołów marketingowych i filmowców.
Centralną nowością Aleph 2.0 jest control image-level: użytkownik podaje edytowaną klatkę jako wizualną referencję, a model stosuje zmianę spójnie do całego wideo. W przeciwieństwie do wcześniejszych podejść, w których wynik końcowy był nieznany przed generacją, ta metoda zapewnia przewidywalną kontrolę nad outputem.
| Funkcjonalność | Szczegół |
|---|---|
| Maks. długość | 30 sekund |
| Rozdzielczość | 1080p |
| Kontrola | Referencyjna klatka obrazu (image-level) |
| Edycja multi-shot | Tak — automatyczne zastosowanie na wielu ujęciach |
| Dostęp | Wszystkie płatne plany Runway |
Możliwości edycji Aleph 2.0:
- Precyzyjne edycje lokalne: zmienia się tylko zmodyfikowany obszar, reszta pozostaje zachowana
- Edycja multi-shot: zmiany stosowane do filmów z wieloma cięciami
- Klipy do 30 s w 1080p — wystarczająca długość dla reklam i krótkich treści
Przypadki użycia Edit Studio: zamiana produktu, zmiana tła, sezonowa wariacja kampanii, korekta oświetlenia, usuwanie elementów zakłócających, pełny restyling.
“With Aleph 2.0, your edited frame defines what the change should look like, and the model carries it through to the right parts of your video.”
🇵🇱 Dzięki Aleph 2.0 wasz zmodyfikowany obraz definiuje pożądany wygląd, a model stosuje go do odpowiednich części waszego wideo. — Runway, oficjalny blog 21 maja 2026
Claude Code 2.1.146 — /code-review i poprawki background agents
21 maja — Anthropic publikuje wersję 2.1.146 Claude Code z jedną główną nowością i kilkoma istotnymi poprawkami stabilności.
Polecenie /simplify zostaje przemianowane na /code-review, wraz z opcjonalnym poziomem wysiłku (/code-review high). Ta zmiana wyraźnie pozycjonuje funkcję jako narzędzie do przeglądu kodu w agentowych workflow.
| Obszar | Poprawka |
|---|---|
| Windows PowerShell | Poprawiono regresję v2.1.124 dla pwsh przez winget/Microsoft Store |
| Paginacja MCP | resources/list i prompts/list nie tracą już elementów poza stroną 1 |
| Sesje background | Strobing Windows Terminal, worktrees NTFS, blokady /background i claude agents |
| Auto mode | AskUserQuestion zachowane, gdy zależy od niego skill lub użytkownik |
| Bedrock | Poprawiono uwierzytelnianie cross-account z awsCredentialExport |
| VSCode Voice | Cichy feedback mikrofonu, sugestie sox dla WSLg |
Claude Code /usage — Rozbicie zużycia tokenów według komponentów
21 maja — Boris Cherny (lead Claude Code w Anthropic) ogłasza na X znaczące rozszerzenie polecenia /usage: następna wersja pozwoli dokładnie zobaczyć, które Skills, Agents, MCPs i Plugins zużywają tokeny w sesji.
Ta funkcja wykracza poza wczorajszy redesign UI. Wprowadza granularność na poziomie komponentów — umożliwiając identyfikację najbardziej zasobożernych rozszerzeń w kontekście. Jest już dostępna w CLI i wkrótce trafi do aplikacji Desktop. Ogłoszenie wygenerowało 137 527 wyświetleń na X, wraz z licznymi prośbami o selektywne wyłączanie nieużywanych konektorów.
“In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using your tokens CLI today, coming to Desktop next”
🇵🇱 W następnej wersji Claude Code: uruchom
/usage, aby zobaczyć podział zużycia tokenów według Skills, Agents, MCPs i Plugins — dziś dostępne w CLI, wkrótce na Desktop. — @bcherny na X
Google I/O 2026 — Oficjalne podsumowanie „100 ogłoszeń”
20 maja — Google publikuje swój oficjalny artykuł podsumowujący „100 things announced at I/O 2026”, dokument referencyjny dla wszystkich premier wydarzenia. Wśród potwierdzonych ogłoszeń: Antigravity 2.0 CLI (następca Gemini CLI), Universal Cart (zakupy w wielu sklepach), Google Pics (inteligentne zarządzanie zdjęciami), Ask YouTube (zadawanie pytań o filmy YouTube), Android XR glasses oraz rozszerzenie SynthID. Dokument ten konsoliduje skalę Google I/O 2026 i służy jako podstawowe źródło dla deweloperów chcących poznać wszystkie oficjalne szczegóły.
🔗 Blog Google — 100 ogłoszeń I/O 2026
Gemini Connected Apps — OpenTable, Canva i Instacart
21 maja — Google Gemini rozszerza swoje Connected Apps o trzech nowych partnerów: OpenTable (rezerwacja restauracji), Canva (tworzenie grafik) i Instacart (zakupy spożywcze). Gemini nie ogranicza się już do wyszukiwania informacji — podejmuje konkretne działania w ekosystemie cyfrowym użytkownika w jego imieniu. To ogłoszenie po I/O konkretnie odzwierciedla agentową wizję Gemini Spark: agent działa na popularnych usługach zewnętrznych bez opuszczania aplikacji.
🔗 Ogłoszenie Gemini Connected Apps
GitHub Copilot — Cztery aktualizacje dla deweloperów
Raporty metryk przeniesione do copilot-reports.github.com
20 maja — URL-e pobierania raportów Copilot Usage Metrics migrują ze starej domeny Azure Front Door (azurefd.net) do stabilnej domeny copilot-reports.github.com. Wymagana akcja dla organizacji z firewallem lub proxy: dodać nową domenę do allowlist enterprise jak najszybciej. Stara domena pozostaje aktywna w okresie przejściowym, ale zostanie później wycofana. Dla instancji GitHub Enterprise Cloud nowa domena ma format copilot-reports.SUBDOMAIN.ghe.com. W razie niedostępności Azure przewidziano fallback do *.blob.core.windows.net.
Cloud agent — Claude Haiku 4.5 i GPT-5.4-mini w 0,33x
18 maja — Copilot cloud agent integruje dwa nowe ekonomiczne modele: Claude Haiku 4.5 i GPT-5.4-mini, oba rozliczane na poziomie 0,33x standardowego mnożnika (zamiast 1x dla modeli standardowych). Ta ekspansja pozwala wybrać odpowiednie narzędzie w zależności od charakteru zadania — lekki i szybki model do prostych poprawek lint lub testów jednostkowych, mocniejszy model do złożonych refaktoryzacji. Wybór modelu następuje w momencie delegowania zadania do cloud agenta, co pozwala optymalizować stosunek koszt/jakość zgodnie z rzeczywistą złożonością pracy.
Chat web — Kontekstowy panel boczny w ogólnej dostępności
18 maja — Copilot Chat na github.com otwiera się teraz w panelu bocznym bezpośrednio obok oglądanego zasobu (PR, issue, repozytorium), bez konieczności przechodzenia na osobną stronę. Kontekst zbiera się automatycznie podczas przechodzenia między wieloma PR-ami i issue w tej samej sesji — odwołania między zasobami pozostają dostępne bez utraty wątku rozmowy. Pełnoekranowe, immersyjne doświadczenie nadal jest dostępne przez „More → In immersive chat”. Można również przekształcić rozmowę w sesję agentową, aby tworzyć PR-y lub uruchomić dogłębne wyszukiwanie. Dostępne w GA dla wszystkich planów Copilot.
Genspark integruje Gemini 3.5 Flash za darmo
20 maja — Genspark integruje Gemini 3.5 Flash już dzień po jego ogłoszeniu na Google I/O, dostępny bezpłatnie w AI Chat Agent i Genspark Claw. Platforma (70+ modeli dostępnych równocześnie) pokazuje swoją strategię reaktywnej integracji: przyjmować najnowsze modele bez zmuszania użytkownika do ręcznego wyboru. Gemini 3.5 Flash to jak dotąd najbardziej wydajny model Flash Google, zoptymalizowany pod szybkość odpowiedzi w złożonych zadaniach.
Kling AI w Cannes — RAPHAEL RAPHAEL, film 100% AI
21 maja — Kling AI prezentuje RAPHAEL RAPHAEL na Festiwalu Filmowym w Cannes 2026, projekt pełnometrażowego filmu wygenerowanego w 100% przez AI na dużą skalę. Ogłoszenie to jest odrębne od posta z 20 maja o House of David (pierwszy hollywoodzki serial wykorzystujący Kling na skalę przemysłową, 44 miliony widzów, #1 na Prime Video US). Kling AI umacnia więc wieloprojektową obecność w Cannes 2026, potwierdzając swoją pozycję jako główny gracz AI wideo dla kina.
BFL FLUX Erase — Usuwanie obiektów i kasowanie tekstu
21 maja — Black Forest Labs uruchamia FLUX Erase, inteligentną funkcję usuwania dla obrazów FLUX. Trzy główne możliwości: usuwanie obiektów (czyste usunięcie z koherentną rekonstrukcją tła), kasowanie tekstu (usunięcie przy zachowaniu podlegającego projektu) oraz automatyczne usuwanie cieni związanych z usuniętymi obiektami. Funkcja została zaprojektowana do precyzyjnej retuszy (precision inpainting): zmieniany jest tylko obszar docelowy, bez pogarszania reszty obrazu. Dostępna przez narzędzie web flux-tools.bfl.ai/erase oraz API BFL (docs.bfl.ai/flux_erase), z natychmiastowym dostępem bez listy oczekujących.
ElevenReader — 200 000+ tytułów premium z wybranym głosem
21 maja — ElevenLabs integruje 200 000+ tytułów premium w ElevenReader: bestsellery w audiobookach i e-bookach na licencji, w tym tysiące dostępnych z głosem narratora do wyboru spośród głosów ElevenLabs. Ta ekspansja pozycjonuje ElevenReader jako platformę personalizowanego czytania audio, w której użytkownik nie jest już ograniczony do oryginalnego narratora książki: może wybrać głos, który woli, dla dowolnego kompatybilnego tytułu. Aplikacja jest dostępna na elevenreader.io z bezpłatnym dostępem na start.
xAI Grok × OpenCode — Grok Build w CLI do kodu
21 maja — Subskrybenci Grok lub X Premium mogą teraz używać modelu Grok Build w OpenCode, edytorze kodu w wierszu poleceń (CLI coding editor) wyspecjalizowanym w inteligencji bazy kodu. Ta integracja następuje po tej ogłoszonej w OpenClaw dwa dni wcześniej — xAI stopniowo rozszerza swoją subskrypcję na kolejne narzędzia firm trzecich. Dostęp jest wliczony w istniejącą subskrypcję Grok/X Premium, bez dodatkowych kosztów. OpenCode wyróżnia się na tle OpenClaw swoim konkretnym naciskiem na kod: analizę bazy kodu, nawigację i wspomagany refaktoring.
Codex 26.519 — Appshots, Goal mode GA, zablokowane computer use, udostępnianie pluginów
21 maja — OpenAI publikuje Codex 26.519 z kilkoma nowymi funkcjami dla macOS i firm. Appshots pozwalają wysłać okno aplikacji na pierwszy plan do wątku Codex poprzez dwukrotne naciśnięcie obu klawiszy Command — widoczne okno oraz tekst dostępny przez API dostępności macOS są przechwytywane. Goal mode opuszcza status eksperymentalny i przechodzi do ogólnej dostępności (aplikacja, rozszerzenie IDE, CLI). Remote computer use: Codex może teraz używać aplikacji biurkowych po zablokowaniu Maca. Udostępnianie pluginów jest dostępne dla ChatGPT Business.
| Funkcja | Status | Platformy |
|---|---|---|
| Appshots | Nowe (GA) | Tylko macOS |
| Goal mode | GA (było eksperymentalne) | Aplikacja, rozszerzenie IDE, CLI |
| Remote computer use (zablokowany Mac) | Nowe | macOS + Codex Mobile |
| Udostępnianie pluginów | Nowe (Business) | ChatGPT Business |
Krótkie wiadomości
- Gemini Daily Brief — ogólna dostępność — Codzienne podsumowanie jest teraz dostępne dla wszystkich subskrybentów Google AI Plus, Pro i Ultra (18+), początkowo w Stanach Zjednoczonych. 🔗 źródło
- Grok × Imagine — zasoby do gier wideo (8,1 mln wyświetleń) — Wirusowa demonstracja prototypowania zasobów do gier bezpośrednio z Grok i @imagine, z dużym zaangażowaniem społeczności graczy. 🔗 źródło
- Cohere Command A+ — wagi W4A4 dostępne na HuggingFace — Skwantowane wagi W4A4 Command A+ można pobrać, co umożliwia wdrożenie na 2× H100 z szybkością +47% względem BF16. 🔗 źródło
Co to oznacza
Era agentowa umacnia się na wielu frontach jednocześnie. Uruchomienie Qwen3.7-Max z 35 godzinami ciągłej autonomii i 1000+ wywołaniami narzędzi, połączone z NVIDIA Verified Agent Skills, które standaryzują zarządzanie możliwościami agentów, sygnalizuje, że branża przechodzi z fazy eksperymentów do fazy strukturyzacji. Fakt, że NVIDIA opiera swój standard na otwartej specyfikacji agentskills.io — kompatybilnej z Claude Code, Codex i Cursor — sugeruje zbieżność w kierunku wspólnych interfejsów dla agentów AI, niezależnie od modelu bazowego.
Bezpieczeństwo łańcucha narzędzi AI staje się krytycznym wyzwaniem. Incydent GitHub, w którym złośliwe rozszerzenie VS Code z oficjalnego marketplace Microsoftu skompromitowało urządzenie wewnętrzne, pokazuje nową powierzchnię ataku, której branża jeszcze nie fully addressed. Timing jest wymowny: NVIDIA uruchamia swoje Verified Agent Skills tego samego dnia, w którym GitHub ogłasza swój incydent. Nieweryfikowane skills i rozszerzenia stanowią rosnący wektor ataku w miarę jak agenci AI przejmują kontrolę nad systemami krytycznymi.
Narzędzia dla developerów konsolidują się wokół przejrzystości zużycia. Ogłoszenie Claude Code /usage z rozbiciem według komponentów, połączone z Appshots w Codex i Goal mode GA, ujawnia trend: narzędzia AI dla developerów nowej generacji muszą teraz wyjaśniać, co zużywają i jak. Szczegółowość na poziomie Skills/Agents/MCPs/Plugins odpowiada na konkretne potrzeby zespołów, które wdrażają agentów na produkcji i chcą rozumieć rzeczywiste koszty.
Generatywna AI wideo wchodzi do przemysłu filmowego. Runway Aleph 2.0 z przewidywalną kontrolą na poziomie obrazu, Kling AI w Cannes z pełnometrażowym filmem w 100% AI (RAPHAEL RAPHAEL) oraz potwierdzenie, że House of David (44 mln widzów, #1 Prime Video US) używa Kling na skalę przemysłową, oznaczają punkt zwrotny. Studia nie testują już tej technologii — integrują ją ze swoimi standardowymi pipeline’ami produkcyjnymi.
Źródła
- Qwen3.7-Max — Tweet Alibaba Qwen
- Qwen3.7-Max — Oficjalny blog
- GitHub — Incydent bezpieczeństwa (pierwotne ogłoszenie)
- GitHub — Incydent bezpieczeństwa (szczegółowy wątek)
- NVIDIA Verified Agent Skills — Blog deweloperski
- NVIDIA Verified Agent Skills — Tweet
- Runway Aleph 2.0 — Oficjalne ogłoszenie
- Runway Aleph 2.0 — Tweet
- Claude Code CHANGELOG
- Claude Code /usage breakdown — Boris Cherny
- Google I/O 2026 — 100 ogłoszeń
- Gemini Connected Apps — OpenTable, Canva, Instacart
- GitHub Copilot — Migracja adresów URL raportów
- GitHub Copilot — Claude Haiku 4.5 i GPT-5.4-mini
- GitHub Copilot Chat web — Panel boczny GA
- Genspark — zintegrowany Gemini 3.5 Flash
- Kling AI — RAPHAEL RAPHAEL w Cannes
- BFL FLUX Erase
- ElevenReader — 200 000+ tytułów
- xAI Grok × OpenCode
- Codex 26.519 — Appshots
- Codex 26.519 — Changelog
- Gemini Daily Brief GA
- Grok × Imagine — zasoby do gier wideo
- Cohere Command A+ — W4A4 HuggingFace