Szukaj

Qwen3.7-Max, incydent bezpieczeństwa GitHub, NVIDIA Verified Agent Skills, Runway Aleph 2.0

Qwen3.7-Max, incydent bezpieczeństwa GitHub, NVIDIA Verified Agent Skills, Runway Aleph 2.0

ai-powered-markdown-translator

Przetłumaczony artykuł z fr na pl z gpt-5.4-mini.

Zobacz projekt na GitHubie ↗

Intensywny tydzień dla ekosystemu AI: Alibaba uruchamia swój flagowy model Qwen3.7-Max zaprojektowany dla ery agentowej, GitHub ujawnia incydent bezpieczeństwa związany ze złośliwym rozszerzeniem VS Code, NVIDIA publikuje otwarty framework zarządzania dla skills agentów, a Runway odświeża swój model do edycji wideo z Aleph 2.0 i Edit Studio. Po stronie narzędzi dla deweloperów Claude Code 2.1.146 zmienia nazwę /simplify na /code-review, a Codex 26.519 wprowadza Appshots na macOS.


Qwen3.7-Max — Flagowiec Alibaby dla ery agentowej

21 maja — Alibaba uruchamia Qwen3.7-Max, swój nowy flagowy model własnościowy, zaprojektowany specjalnie dla autonomicznych agentów. Model jest następcą wersji preview Qwen3.7-Max-Preview i Qwen3.7-Plus-Preview ocenianych na Arena 18 maja.

Pozycjonowanie jest wyraźnie „Agent Era”: Qwen3.7-Max celuje w zadania wykraczające poza jednorazowe zrozumienie i wchodzące w obszar długotrwałej autonomii oraz złożonej orkiestracji.

MetrykaWartość
Score AAII56,6
Zmiana względem poprzedniej wersji+4,8 pkt
Ciągłe godziny autonomii (test jądra)35 h
Wywołania narzędzi (test jądra)1 000+
Wyświetlenia głównego tweeta~325 000

Pięć ogłoszonych możliwości:

  1. Agent kodowania end-to-end — prototypy frontend, wieloplikowe refaktoryzacje, rzeczywiste debugowanie
  2. Produktywność biurowa — zadania poprzez integracje MCP i zarządzanie wieloma agentami
  3. Długotrwała autonomia — 35 kolejnych godzin przy zadaniu optymalizacji jądra, 1 000+ wywołań narzędzi bez krytycznych halucynacji
  4. Niezależność od scaffoldów — kompatybilny z Claude Code, OpenClaw, Qwen Code lub dowolnym własnym stosem
  5. Wzmocnione rozumowanie naukowe — wynik AAII: 56,6 (+4,8 pkt)

Według Tongyi Lab (Alibaba), Qwen3.7-Max jest „naszym najnowszym modelem własnościowym zaprojektowanym specjalnie dla ery agentów”, z czołowym agentem kodowania, asystentem produktywności biurowej i długotrwałą autonomią — niezawodnym za każdym razem, niezależnym od scaffoldów.

Model jest dostępny przez Qwen Studio (chat.qwen.ai) oraz API Alibaba Cloud.

🔗 Oficjalny blog Qwen3.7-Max


GitHub — Incydent bezpieczeństwa: złośliwe rozszerzenie VS Code

20 maja — GitHub ujawnia poważny incydent bezpieczeństwa: pracownik zainstalował złośliwe rozszerzenie VS Code z marketplace Microsoftu, co umożliwiło nieautoryzowany dostęp do wewnętrznych repozytoriów GitHub.

Początkowe ogłoszenie na X wygenerowało 13,4 miliona wyświetleń, 8 000 repostów i 25 000 polubień — znak znaczącego wpływu na społeczność. GitHub opublikował 5-częściowy wątek szczegółowo opisujący oś czasu i podjęte działania.

“1/ Yesterday we detected and contained a compromise of an employee device involving a poisoned VS Code extension. We removed the malicious extension version, isolated the endpoint, and began incident response immediately.”

🇵🇱 Wczoraj wykryliśmy i powstrzymaliśmy kompromitację urządzenia pracownika związaną ze skażonym rozszerzeniem VS Code. Usunęliśmy złośliwą wersję rozszerzenia, odizolowaliśmy punkt końcowy i natychmiast rozpoczęliśmy reagowanie na incydent.@github na X

Co się wydarzyło:

  • Wektor: złośliwe rozszerzenie VS Code z marketplace Microsoftu
  • Urządzenie pracownika GitHub zostało skompromitowane
  • Nieautoryzowany dostęp do wewnętrznych repozytoriów GitHub

Co nie zostało dotknięte (według GitHub):

  • Brak potwierdzonego wpływu na dane klientów (firmy, organizacje, repozytoria publiczne lub prywatne)

Natychmiastowe działania:

  • Usunięcie złośliwego rozszerzenia
  • Izolacja skompromitowanego endpointu
  • Analiza dzienników (logs) i rotacja sekretów
  • Zwiększony monitoring infrastruktury

GitHub zobowiązał się opublikować pełny raport po zakończeniu dochodzenia. Ten incydent ponownie rozpala debatę o bezpieczeństwie marketplace rozszerzeń VS Code, który zawiera dziesiątki tysięcy rozszerzeń, a ich weryfikacja pozostaje ograniczona.

🔗 Ogłoszenie GitHub na X


NVIDIA Verified Agent Skills — Otwarty standard zarządzania agentami AI

21 maja — NVIDIA uruchamia NVIDIA-Verified Agent Skills, otwarty framework zarządzania służący do zabezpieczania możliwości (skills) agentów AI. Inicjatywa odpowiada na rosnący problem: skills zwiększają możliwości agentów, ale wprowadzają także potencjalne podatności.

„Zweryfikowany” skill według NVIDIA opiera się na czterech filarach:

SkładnikOpis
KatalogowanieCodzienna synchronizacja z zespołów produktowych NVIDIA
SkillSpectorSkaner ryzyka oparty na OWASP LLM i MITRE ATLAS
Podpis kryptograficznyPodpis odłączony skill.oms.sig weryfikowalny przez OpenSSF Model Signing
Skill Card (SKILLCARD.yaml)Metadane machine-readable: pochodzenie, zależności, ograniczenia, status

Framework wykrywa między innymi: podatne zależności, prompt injection, trigger abuse, excessive agency oraz tool poisoning.

Specyfikacja techniczna jest dostępna publicznie przez agentskills.io (format SKILL.md), natywnie kompatybilna z Claude Code, OpenAI Codex i Cursor. Publiczne repozytorium skills NVIDIA jest dostępne na github.com/nvidia/skills.

“Verified means cataloged, scanned, signed, and documented with a skill card.”

🇵🇱 Zweryfikowany oznacza skatalogowany, przeskanowany, podpisany i udokumentowany kartą kompetencji. — NVIDIA Developer Blog, 21 maja 2026

Fakt, że specyfikacja jest otwarta i kompatybilna z trzema głównymi narzędziami do kodowania AI (Claude Code, Codex, Cursor), sugeruje ambicję stworzenia standardu branżowego, a nie tylko wewnętrznego narzędzia NVIDIA.

🔗 Blog deweloperski NVIDIA


Runway Aleph 2.0 i Edit Studio — Edycja wideo do 30 sekund w 1080p

21 maja — Runway uruchamia Aleph 2.0, dużą aktualizację swojego modelu do edycji wideo, wraz z Edit Studio, nowym interfejsem przeznaczonym dla zespołów marketingowych i filmowców.

Centralną nowością Aleph 2.0 jest control image-level: użytkownik podaje edytowaną klatkę jako wizualną referencję, a model stosuje zmianę spójnie do całego wideo. W przeciwieństwie do wcześniejszych podejść, w których wynik końcowy był nieznany przed generacją, ta metoda zapewnia przewidywalną kontrolę nad outputem.

FunkcjonalnośćSzczegół
Maks. długość30 sekund
Rozdzielczość1080p
KontrolaReferencyjna klatka obrazu (image-level)
Edycja multi-shotTak — automatyczne zastosowanie na wielu ujęciach
DostępWszystkie płatne plany Runway

Możliwości edycji Aleph 2.0:

  • Precyzyjne edycje lokalne: zmienia się tylko zmodyfikowany obszar, reszta pozostaje zachowana
  • Edycja multi-shot: zmiany stosowane do filmów z wieloma cięciami
  • Klipy do 30 s w 1080p — wystarczająca długość dla reklam i krótkich treści

Przypadki użycia Edit Studio: zamiana produktu, zmiana tła, sezonowa wariacja kampanii, korekta oświetlenia, usuwanie elementów zakłócających, pełny restyling.

“With Aleph 2.0, your edited frame defines what the change should look like, and the model carries it through to the right parts of your video.”

🇵🇱 Dzięki Aleph 2.0 wasz zmodyfikowany obraz definiuje pożądany wygląd, a model stosuje go do odpowiednich części waszego wideo. — Runway, oficjalny blog 21 maja 2026

🔗 Oficjalne ogłoszenie Runway


Claude Code 2.1.146 — /code-review i poprawki background agents

21 maja — Anthropic publikuje wersję 2.1.146 Claude Code z jedną główną nowością i kilkoma istotnymi poprawkami stabilności.

Polecenie /simplify zostaje przemianowane na /code-review, wraz z opcjonalnym poziomem wysiłku (/code-review high). Ta zmiana wyraźnie pozycjonuje funkcję jako narzędzie do przeglądu kodu w agentowych workflow.

ObszarPoprawka
Windows PowerShellPoprawiono regresję v2.1.124 dla pwsh przez winget/Microsoft Store
Paginacja MCPresources/list i prompts/list nie tracą już elementów poza stroną 1
Sesje backgroundStrobing Windows Terminal, worktrees NTFS, blokady /background i claude agents
Auto modeAskUserQuestion zachowane, gdy zależy od niego skill lub użytkownik
BedrockPoprawiono uwierzytelnianie cross-account z awsCredentialExport
VSCode VoiceCichy feedback mikrofonu, sugestie sox dla WSLg

🔗 CHANGELOG Claude Code


Claude Code /usage — Rozbicie zużycia tokenów według komponentów

21 maja — Boris Cherny (lead Claude Code w Anthropic) ogłasza na X znaczące rozszerzenie polecenia /usage: następna wersja pozwoli dokładnie zobaczyć, które Skills, Agents, MCPs i Plugins zużywają tokeny w sesji.

Ta funkcja wykracza poza wczorajszy redesign UI. Wprowadza granularność na poziomie komponentów — umożliwiając identyfikację najbardziej zasobożernych rozszerzeń w kontekście. Jest już dostępna w CLI i wkrótce trafi do aplikacji Desktop. Ogłoszenie wygenerowało 137 527 wyświetleń na X, wraz z licznymi prośbami o selektywne wyłączanie nieużywanych konektorów.

“In the next version of Claude Code: run /usage to see a breakdown of which Skills, Agents, MCPs, and Plugins are using your tokens CLI today, coming to Desktop next”

🇵🇱 W następnej wersji Claude Code: uruchom /usage, aby zobaczyć podział zużycia tokenów według Skills, Agents, MCPs i Plugins — dziś dostępne w CLI, wkrótce na Desktop.@bcherny na X


Google I/O 2026 — Oficjalne podsumowanie „100 ogłoszeń”

20 maja — Google publikuje swój oficjalny artykuł podsumowujący „100 things announced at I/O 2026”, dokument referencyjny dla wszystkich premier wydarzenia. Wśród potwierdzonych ogłoszeń: Antigravity 2.0 CLI (następca Gemini CLI), Universal Cart (zakupy w wielu sklepach), Google Pics (inteligentne zarządzanie zdjęciami), Ask YouTube (zadawanie pytań o filmy YouTube), Android XR glasses oraz rozszerzenie SynthID. Dokument ten konsoliduje skalę Google I/O 2026 i służy jako podstawowe źródło dla deweloperów chcących poznać wszystkie oficjalne szczegóły.

🔗 Blog Google — 100 ogłoszeń I/O 2026


Gemini Connected Apps — OpenTable, Canva i Instacart

21 maja — Google Gemini rozszerza swoje Connected Apps o trzech nowych partnerów: OpenTable (rezerwacja restauracji), Canva (tworzenie grafik) i Instacart (zakupy spożywcze). Gemini nie ogranicza się już do wyszukiwania informacji — podejmuje konkretne działania w ekosystemie cyfrowym użytkownika w jego imieniu. To ogłoszenie po I/O konkretnie odzwierciedla agentową wizję Gemini Spark: agent działa na popularnych usługach zewnętrznych bez opuszczania aplikacji.

🔗 Ogłoszenie Gemini Connected Apps


GitHub Copilot — Cztery aktualizacje dla deweloperów

Raporty metryk przeniesione do copilot-reports.github.com

20 maja — URL-e pobierania raportów Copilot Usage Metrics migrują ze starej domeny Azure Front Door (azurefd.net) do stabilnej domeny copilot-reports.github.com. Wymagana akcja dla organizacji z firewallem lub proxy: dodać nową domenę do allowlist enterprise jak najszybciej. Stara domena pozostaje aktywna w okresie przejściowym, ale zostanie później wycofana. Dla instancji GitHub Enterprise Cloud nowa domena ma format copilot-reports.SUBDOMAIN.ghe.com. W razie niedostępności Azure przewidziano fallback do *.blob.core.windows.net.

🔗 Changelog GitHub Copilot

Cloud agent — Claude Haiku 4.5 i GPT-5.4-mini w 0,33x

18 maja — Copilot cloud agent integruje dwa nowe ekonomiczne modele: Claude Haiku 4.5 i GPT-5.4-mini, oba rozliczane na poziomie 0,33x standardowego mnożnika (zamiast 1x dla modeli standardowych). Ta ekspansja pozwala wybrać odpowiednie narzędzie w zależności od charakteru zadania — lekki i szybki model do prostych poprawek lint lub testów jednostkowych, mocniejszy model do złożonych refaktoryzacji. Wybór modelu następuje w momencie delegowania zadania do cloud agenta, co pozwala optymalizować stosunek koszt/jakość zgodnie z rzeczywistą złożonością pracy.

🔗 Changelog cloud agent

Chat web — Kontekstowy panel boczny w ogólnej dostępności

18 maja — Copilot Chat na github.com otwiera się teraz w panelu bocznym bezpośrednio obok oglądanego zasobu (PR, issue, repozytorium), bez konieczności przechodzenia na osobną stronę. Kontekst zbiera się automatycznie podczas przechodzenia między wieloma PR-ami i issue w tej samej sesji — odwołania między zasobami pozostają dostępne bez utraty wątku rozmowy. Pełnoekranowe, immersyjne doświadczenie nadal jest dostępne przez „More → In immersive chat”. Można również przekształcić rozmowę w sesję agentową, aby tworzyć PR-y lub uruchomić dogłębne wyszukiwanie. Dostępne w GA dla wszystkich planów Copilot.

🔗 Changelog Copilot Chat web

Genspark integruje Gemini 3.5 Flash za darmo

20 maja — Genspark integruje Gemini 3.5 Flash już dzień po jego ogłoszeniu na Google I/O, dostępny bezpłatnie w AI Chat Agent i Genspark Claw. Platforma (70+ modeli dostępnych równocześnie) pokazuje swoją strategię reaktywnej integracji: przyjmować najnowsze modele bez zmuszania użytkownika do ręcznego wyboru. Gemini 3.5 Flash to jak dotąd najbardziej wydajny model Flash Google, zoptymalizowany pod szybkość odpowiedzi w złożonych zadaniach.

🔗 Ogłoszenie Genspark


Kling AI w Cannes — RAPHAEL RAPHAEL, film 100% AI

21 maja — Kling AI prezentuje RAPHAEL RAPHAEL na Festiwalu Filmowym w Cannes 2026, projekt pełnometrażowego filmu wygenerowanego w 100% przez AI na dużą skalę. Ogłoszenie to jest odrębne od posta z 20 maja o House of David (pierwszy hollywoodzki serial wykorzystujący Kling na skalę przemysłową, 44 miliony widzów, #1 na Prime Video US). Kling AI umacnia więc wieloprojektową obecność w Cannes 2026, potwierdzając swoją pozycję jako główny gracz AI wideo dla kina.

🔗 Ogłoszenie Kling AI


BFL FLUX Erase — Usuwanie obiektów i kasowanie tekstu

21 maja — Black Forest Labs uruchamia FLUX Erase, inteligentną funkcję usuwania dla obrazów FLUX. Trzy główne możliwości: usuwanie obiektów (czyste usunięcie z koherentną rekonstrukcją tła), kasowanie tekstu (usunięcie przy zachowaniu podlegającego projektu) oraz automatyczne usuwanie cieni związanych z usuniętymi obiektami. Funkcja została zaprojektowana do precyzyjnej retuszy (precision inpainting): zmieniany jest tylko obszar docelowy, bez pogarszania reszty obrazu. Dostępna przez narzędzie web flux-tools.bfl.ai/erase oraz API BFL (docs.bfl.ai/flux_erase), z natychmiastowym dostępem bez listy oczekujących.

🔗 Ogłoszenie BFL


ElevenReader — 200 000+ tytułów premium z wybranym głosem

21 maja — ElevenLabs integruje 200 000+ tytułów premium w ElevenReader: bestsellery w audiobookach i e-bookach na licencji, w tym tysiące dostępnych z głosem narratora do wyboru spośród głosów ElevenLabs. Ta ekspansja pozycjonuje ElevenReader jako platformę personalizowanego czytania audio, w której użytkownik nie jest już ograniczony do oryginalnego narratora książki: może wybrać głos, który woli, dla dowolnego kompatybilnego tytułu. Aplikacja jest dostępna na elevenreader.io z bezpłatnym dostępem na start.

🔗 Ogłoszenie ElevenLabs


xAI Grok × OpenCode — Grok Build w CLI do kodu

21 maja — Subskrybenci Grok lub X Premium mogą teraz używać modelu Grok Build w OpenCode, edytorze kodu w wierszu poleceń (CLI coding editor) wyspecjalizowanym w inteligencji bazy kodu. Ta integracja następuje po tej ogłoszonej w OpenClaw dwa dni wcześniej — xAI stopniowo rozszerza swoją subskrypcję na kolejne narzędzia firm trzecich. Dostęp jest wliczony w istniejącą subskrypcję Grok/X Premium, bez dodatkowych kosztów. OpenCode wyróżnia się na tle OpenClaw swoim konkretnym naciskiem na kod: analizę bazy kodu, nawigację i wspomagany refaktoring.

🔗 Ogłoszenie xAI


Codex 26.519 — Appshots, Goal mode GA, zablokowane computer use, udostępnianie pluginów

21 maja — OpenAI publikuje Codex 26.519 z kilkoma nowymi funkcjami dla macOS i firm. Appshots pozwalają wysłać okno aplikacji na pierwszy plan do wątku Codex poprzez dwukrotne naciśnięcie obu klawiszy Command — widoczne okno oraz tekst dostępny przez API dostępności macOS są przechwytywane. Goal mode opuszcza status eksperymentalny i przechodzi do ogólnej dostępności (aplikacja, rozszerzenie IDE, CLI). Remote computer use: Codex może teraz używać aplikacji biurkowych po zablokowaniu Maca. Udostępnianie pluginów jest dostępne dla ChatGPT Business.

FunkcjaStatusPlatformy
AppshotsNowe (GA)Tylko macOS
Goal modeGA (było eksperymentalne)Aplikacja, rozszerzenie IDE, CLI
Remote computer use (zablokowany Mac)NowemacOS + Codex Mobile
Udostępnianie pluginówNowe (Business)ChatGPT Business

🔗 Changelog Codex


Krótkie wiadomości

  • Gemini Daily Brief — ogólna dostępność — Codzienne podsumowanie jest teraz dostępne dla wszystkich subskrybentów Google AI Plus, Pro i Ultra (18+), początkowo w Stanach Zjednoczonych. 🔗 źródło
  • Grok × Imagine — zasoby do gier wideo (8,1 mln wyświetleń) — Wirusowa demonstracja prototypowania zasobów do gier bezpośrednio z Grok i @imagine, z dużym zaangażowaniem społeczności graczy. 🔗 źródło
  • Cohere Command A+ — wagi W4A4 dostępne na HuggingFace — Skwantowane wagi W4A4 Command A+ można pobrać, co umożliwia wdrożenie na 2× H100 z szybkością +47% względem BF16. 🔗 źródło

Co to oznacza

Era agentowa umacnia się na wielu frontach jednocześnie. Uruchomienie Qwen3.7-Max z 35 godzinami ciągłej autonomii i 1000+ wywołaniami narzędzi, połączone z NVIDIA Verified Agent Skills, które standaryzują zarządzanie możliwościami agentów, sygnalizuje, że branża przechodzi z fazy eksperymentów do fazy strukturyzacji. Fakt, że NVIDIA opiera swój standard na otwartej specyfikacji agentskills.io — kompatybilnej z Claude Code, Codex i Cursor — sugeruje zbieżność w kierunku wspólnych interfejsów dla agentów AI, niezależnie od modelu bazowego.

Bezpieczeństwo łańcucha narzędzi AI staje się krytycznym wyzwaniem. Incydent GitHub, w którym złośliwe rozszerzenie VS Code z oficjalnego marketplace Microsoftu skompromitowało urządzenie wewnętrzne, pokazuje nową powierzchnię ataku, której branża jeszcze nie fully addressed. Timing jest wymowny: NVIDIA uruchamia swoje Verified Agent Skills tego samego dnia, w którym GitHub ogłasza swój incydent. Nieweryfikowane skills i rozszerzenia stanowią rosnący wektor ataku w miarę jak agenci AI przejmują kontrolę nad systemami krytycznymi.

Narzędzia dla developerów konsolidują się wokół przejrzystości zużycia. Ogłoszenie Claude Code /usage z rozbiciem według komponentów, połączone z Appshots w Codex i Goal mode GA, ujawnia trend: narzędzia AI dla developerów nowej generacji muszą teraz wyjaśniać, co zużywają i jak. Szczegółowość na poziomie Skills/Agents/MCPs/Plugins odpowiada na konkretne potrzeby zespołów, które wdrażają agentów na produkcji i chcą rozumieć rzeczywiste koszty.

Generatywna AI wideo wchodzi do przemysłu filmowego. Runway Aleph 2.0 z przewidywalną kontrolą na poziomie obrazu, Kling AI w Cannes z pełnometrażowym filmem w 100% AI (RAPHAEL RAPHAEL) oraz potwierdzenie, że House of David (44 mln widzów, #1 Prime Video US) używa Kling na skalę przemysłową, oznaczają punkt zwrotny. Studia nie testują już tej technologii — integrują ją ze swoimi standardowymi pipeline’ami produkcyjnymi.


Źródła