Szukaj

DiffusionGemma 4x szybszy, dynamiczne przepływy pracy Claude Code w GA, Grok Voice #1 EVA-Bench

ai-powered-markdown-translator

Przetłumaczony artykuł z fr na pl z gpt-5.4-mini.

Zobacz projekt na GitHubie ↗

10 czerwca 2026 to dzień pełen nowości: Google DeepMind uruchamia DiffusionGemma, nową architekturę generowania tekstu metodą dyfuzji, osiągającą 1 000 tokenów na sekundę na H100, natychmiast zoptymalizowaną przez NVIDIA pod sprzęt lokalny. Po stronie narzędzi dla deweloperów Anthropic wprowadza dynamiczne przepływy pracy Claude Code do ogólnej dostępności z rekurencyjnością agentów do 5 poziomów, a xAI pozycjonuje Grok Voice Think Fast 1.0 jako numer jeden w benchmarku EVA-Bench. GitHub, OpenAI, Perplexity i Cohere dopełniają dzień bogaty w ogłoszenia.


DiffusionGemma: równoległe generowanie bloków po 256 tokenów, 4x szybciej na GPU

10 czerwca — Google DeepMind uruchamia DiffusionGemma, eksperymentalny otwarty model o 26 miliardach parametrów (architektura Mieszanka Ekspertów, Mixture of Experts) opublikowany na licencji Apache 2.0. Jego cecha szczególna: zamiast generować token po tokenie jak każdy klasyczny model autoregresyjny, generuje całe bloki 256 tokenów jednocześnie, stosując tę samą iteracyjną zasadę odszumiania co modele dyfuzji obrazów.

Rezultat: nawet 4x szybciej na dedykowanym GPU. Model aktywuje tylko 3,8 miliarda parametrów podczas inferencji, co pozwala zmieścić go w 18 GB VRAM po kwantyzacji — dostępne na wysokiej klasy konsumenckich GPU. Dwukierunkowa uwaga otwiera zastosowania trudne dla modeli autoregresyjnych: edycję inline, uzupełnianie kodu, sekwencje aminokwasów, grafy matematyczne.

NVIDIA natychmiast zoptymalizowała DiffusionGemma pod swoje GPU, wykorzystując tensorowe rdzenie obliczeniowe (Tensor Cores), podczas gdy architektury autoregresyjne są ograniczane przez przepustowość pamięci. Zmierzone wydajności na różnych platformach:

SprzętWydajność
NVIDIA H100 (serwer)1 000 tokenów/s
NVIDIA DGX Stationdo 800 tokenów/s
NVIDIA DGX Spark (lokalnie)150 tokenów/s
GeForce RTX 5090 (skwantyzowany)700+ tokenów/s
GeForce RTX 4090 (skwantyzowany)wsparcie dla llama.cpp wkrótce

Wagi są dostępne na Hugging Face z natychmiastowym wsparciem w HF Transformers, vLLM i Unsloth. Model można również bezpłatnie przetestować na build.nvidia.com.

Ważne: Google wyraźnie zaznacza, że jakość wyników pozostaje niższa niż w przypadku standardowych modeli Gemma 4. DiffusionGemma jest skierowany do deweloperów eksplorujących lokalne, interaktywne przepływy pracy — szybkie iteracje, edycję inline — a nie do produkcji.

“DiffusionGemma is our new experimental open model with up to 4x faster output on dedicated GPUs. Instead of predicting word-by-word, it generates entire blocks of text simultaneously.”

🇵🇱 DiffusionGemma to nasz nowy eksperymentalny otwarty model, oferujący do 4 razy szybsze wyjście na dedykowanym GPU. Zamiast przewidywać słowa jedno po drugim, generuje jednocześnie całe bloki tekstu.@GoogleDeepMind na X

🔗 Ogłoszenie Google DeepMind · 🔗 Optymalizacja NVIDIA


Claude Code v2.1.172: dynamiczne przepływy pracy w ogólnej dostępności, rekurencyjni podagenci do 5 poziomów

10 czerwca — Anthropic ogłasza, że dynamiczne przepływy pracy (dynamic workflows) Claude Code przechodzą do ogólnej dostępności. Zaprezentowane jako research preview 28 maja, pozwalają Claude projektować własną orkiestrację i uruchamiać od kilkudziesięciu do setek podagentów równolegle, aby kompleksowo obsługiwać złożone zadania od początku do końca.

Wersja v2.1.172 CLI, opublikowana tego samego dnia, wprowadza związaną z tym kluczową możliwość: podagenci mogą teraz tworzyć własnych podagentów, aż do 5 poziomów zagnieżdżenia. To techniczny fundament, który czyni dynamiczne przepływy pracy operacyjnymi na dużą skalę.

Główne przypadki użycia:

  • polowanie na błędy w skali całego repozytorium, audyty bezpieczeństwa
  • migracje kodu obejmujące tysiące plików (np. portowanie Bun z Zig do Rust w 11 dni)
  • adversarialna weryfikacja wyniku przed dostarczeniem

Dostępność i warunki:

ElementSzczegół
PlanyMax, Team, Enterprise (jeśli włączone przez administratora), API Claude
Platformy chmuroweAmazon Bedrock, Vertex AI, Microsoft Foundry
AktywacjaPolecenie Create a workflow lub parametr ultracode (effort xhigh)
Głębokość podagentówDo 5 poziomów
Wersja CLIv2.1.172

Warto zauważyć: dynamiczne przepływy pracy zużywają znacznie więcej tokenów niż standardowa sesja Claude Code. Claude Code wyświetla potwierdzenie przed pierwszym uruchomieniem. Administratorzy Enterprise mogą wyłączyć tę funkcję poprzez zarządzane ustawienia.

Inne zmiany w v2.1.172: naprawa błędu sesji trwale zablokowanych z kontekstem 1M bez kredytów, pasek wyszukiwania w przeglądarce /plugin, Amazon Bedrock teraz odczytuje region AWS z ~/.aws jeśli AWS_REGION nie jest zdefiniowane, liczne poprawki stabilności dla agentów działających w tle.

🔗 Ogłoszenie @claudeai · 🔗 Blog Dynamic Workflows · 🔗 CHANGELOG


Grok Voice Think Fast 1.0 — numer jeden EVA-Bench

10 czerwca — xAI ogłasza Grok Voice Think Fast 1.0, swój model głosowy, który zajmuje miejsce na granicy Pareto rankingu EVA-Bench ServiceNow AI Research. Granica Pareto oznacza, że żaden inny system w ewaluacji nie przewyższa jednocześnie jego dokładności i jakości doświadczenia użytkownika.

xAI podkreśla trzy cechy: naturalny timing, intonację dopasowaną do kontekstu i ciepło odbierane podobnie jak u człowieka. Model jest dostępny przez xAI Voice API pod adresem x.ai/api/voice, w cenie przedstawianej jako wyraźnie niższa niż u konkurencji.

MetrykaWartość
Ranking EVA-BenchGranica Pareto (numer 1)
DostępnośćAPI x.ai/api/voice
Pozycjonowanie cenoweUłamek ceny konkurencji (według xAI)

“Grok Voice offers state-of-the-art performance with human-like timing, tone, and warmth. And it’s a fraction the price of competitors.”

🇵🇱 Grok Voice oferuje najnowocześniejszą wydajność z ludzkopodobnym timingiem, tonem i ciepłem. A jego cena to ułamek ceny konkurencji.@xai na X

🔗 Wyniki EVA-Bench


NVIDIA Confidential Computing w Apple Private Cloud Compute (WWDC 2026)

9 czerwca — Zapowiedziana podczas WWDC 2026, ta trójstronna integracja Apple–NVIDIA–Google stanowi strukturalny krok dla prywatności AI w chmurze. GPU NVIDIA Blackwell z Confidential Computing są teraz zintegrowane z infrastrukturą Private Cloud Compute (PCC) firmy Apple, która wykracza poza centra danych Apple do Google Cloud.

Cel: przetwarzanie zapytań Apple Intelligence po stronie serwera z absolutną kryptograficzną gwarancją prywatności — nikt, nawet twórcy systemu, nie może uzyskać dostępu do danych, rozmów ani czatów użytkowników.

Mechanizmy ochrony:

  • zaufanie zakorzenione w sprzęcie (hardware-rooted trust): weryfikacja, że infrastruktura nie została naruszona
  • szyfrowane ścieżki komunikacji między komponentami
  • attestation zdalne (remote attestation): oprogramowanie sprawdza stan bezpieczeństwa platformy przed jakimkolwiek transferem wrażliwych danych
  • wsparcie dla przyspieszonej inferencji bez kompromisów w wydajności GPU

Ta architektura pozwala Apple rozszerzyć Apple Intelligence na Google Cloud przy jednoczesnym utrzymaniu zobowiązań dotyczących prywatności — rzadkie połączenie w branży. Dla NVIDIA to wdrożenie Confidential Computing Blackwell na dużą skalę w publicznej implementacji.

🔗 Blog NVIDIA


Anthropic: zaplanowani agenci, skarbce sekretów i ramy regulacyjne

Claude Managed Agents — zaplanowane wdrożenia i skarbce zmiennych

9 czerwca — Dwie nowe funkcje trafiają do publicznej bety w Claude Managed Agents, ogłoszone podczas Code with Claude Tokyo:

Zaplanowane wdrożenia (scheduled deployments): agenci mogą teraz uruchamiać się automatycznie według harmonogramu, bez ręcznej interwencji — codzienne raporty, okresowe kontrole, regularne pipeline’y danych.

Zmienne w skarbcach (vaults): agenci uzyskują dostęp do swoich sekretów i konfiguracji poprzez zarządzany sejf, bez ujawniania kluczy w kodzie lub konfiguracjach sesji.

FunkcjaStatus
Zaplanowane wdrożeniaPubliczna beta
Zmienne w skarbcachPubliczna beta
PlatformaClaude Managed Agents

🔗 What’s new in Claude Managed Agents

Policy on the AI Exponential — ramy regulacyjne Anthropic

10 czerwca — Anthropic publikuje Policy on the AI Exponential, dokument ram polityki publicznej wraz z esejem Dario Amodei. Wniosek: możliwości AI rosną w tempie wykładniczym, za którym proces legislacyjny nie został zaprojektowany, by nadążać.

Dokument dotyczy modeli trenowanych z użyciem ponad 10²⁵ operacji zmiennoprzecinkowych (FLOP), tworzonych przez firmy generujące ponad USD 500 milionów przychodów związanych z AI lub wydające ponad USD 1 miliard na R&D AI. Wskazuje cztery kategorie ryzyka katastroficznego: ryzyko biologiczne, cybernetyczne, utrata kontroli nad systemami AI oraz automatyzacja samego R&D AI.

Proponowany obowiązekOpis
TransparentnośćObowiązkowe testy, publikacja wyników
Niezależna ewaluacjaCo najmniej jeden kwalifikowany zewnętrzny ewaluator
BezpieczeństwoOchrona wag przed aktorami państwowymi
Władza rządowaUprawnienie do blokowania lub opóźniania niebezpiecznych modeli

“AI is advancing at a pace our policymaking institutions were never built for—and the gap between the two is becoming the central challenge of the technology.”

🇵🇱 AI rozwija się w tempie, do którego nasze instytucje legislacyjne nie zostały zaprojektowane — a przepaść między nimi staje się kluczowym wyzwaniem, jakie stawia ta technologia.@AnthropicAI na X

🔗 Policy on the AI Exponential


GitHub Copilot: aplikacja otwarta dla wszystkich, widoczne sesje agentów i przegląd bezpieczeństwa w CLI

Copilot App — technical preview otwarta bez listy oczekujących

10 czerwca — Technical preview aplikacji GitHub Copilot jest teraz dostępny dla wszystkich subskrybentów Copilot Pro, Pro+, Max, Business i Enterprise, bez listy oczekujących. Ta aplikacja desktopowa zaprojektowana dla agentów centralizuje zarządzanie sesjami agentów, tworzenie pull requestów i sterowanie zadaniami deweloperskimi z poziomu pulpitu — od zgłoszenia do PR w jednym miejscu.

🔗 Ogłoszenie @github

Copilot Chat teraz widzi sesje agentów

10 czerwca — GitHub ulepsza przejście między Copilot Chat a agentem w chmurze. W Copilot Chat dostępne są teraz dwa nowe narzędzia: Get agent logs (logi sesji agenta na pull requestcie, możliwe do przeszukiwania bezpośrednio w rozmowie) oraz Session search (wyszukiwanie i podsumowanie poprzednich sesji według tematu, tytułu lub daty). Status trwającej sesji jest teraz odzwierciedlany w czasie rzeczywistym w czacie.

🔗 Changelog

Copilot CLI — komenda /security-review (eksperymentalny public preview)

10 czerwca — Nowa komenda slash /security-review jest dostępna w eksperymentalnym public preview w GitHub Copilot CLI. Analizuje lokalne zmiany kodu bezpośrednio z terminala: iniekcje (SQL, polecenia), XSS, niebezpieczne przetwarzanie danych, path traversal, słabą kryptografię. Wyniki są oceniane według powagi i pewności, z sugestiami możliwymi do zastosowania bez opuszczania terminala. Komenda jest niezależna od GitHub code scanning i Dependabot — uzupełnia je lekką analizą na żądanie.

🔗 Changelog

Manus — Zoom Connector

9 czerwca — Manus uruchamia konektor Zoom, pozwalający agentowi automatycznie analizować treści spotkań dostępnych z poziomu połączonego konta: podsumowania, transkrypcje, nagrania, notatki, agendy, tablice, informacje o uczestnikach. Trzy główne przypadki użycia: analiza spotkania na żądanie, automatyczny cykliczny przegląd z raportem w Slacku lub e-mailu oraz analiza trendów na wielu spotkaniach. Ograniczenie: Manus ma dostęp tylko do zasobów, które połączone konto Zoom ma uprawnienia oglądać.

🔗 Blog Manus


xAI i Kimi: partnerstwa i swarm agentów

Grok + eToro — Agent Tori zasilany danymi X w czasie rzeczywistym

10 czerwca — xAI i eToro ogłaszają, że Tori, agent AI eToro (40 milionów użytkowników w 75 krajach), integruje teraz modele xAI i dane w czasie rzeczywistym z platformy X do analizy sentymentu rynkowego (market sentiment). Tori może odczytywać zmiany sentymentu w czasie rzeczywistym, śledzić sygnały na żywo i analizować informacje. Ta sama inteligencja czasu rzeczywistego jest dostępna dla wszystkich deweloperów poprzez konsolę API xAI.

🔗 xAI News

Kimi Agent Swarm — prognoza 104 meczów Mistrzostw Świata 2026

9 czerwca — Kimi (Moonshot AI) wdraża 300 podagentów równolegle do prognozowania 104 meczów FIFA World Cup 2026. Każdy agent ma własny kąt analityczny: taktyki, forma zawodników, dane historyczne, sentyment publiczny, pogoda, psychologia, ruchy kursów. System wykorzystuje modele Elo/FIFA, Poisson/Dixon-Coles, symulacje Monte Carlo i dynamiczną aktualizację bayesowską. Zidentyfikowany sygnał: szacowane prawdopodobieństwo tytułu Niemiec na ~11,3 % wobec ~7,4 % na rynkach bukmacherskich.

🔗 Ogłoszenie @Kimi_Moonshot


OpenAI Codex: migracja z Claude Code i showcase Ableton

Codex app 26.608 — migracja z Claude Code i przebudowa pluginów

9 czerwca — Aktualizacja Codex app 26.608 wprowadza przepływ migracji (Migrate to Codex) umożliwiający automatyczne importowanie konfiguracji z Claude Code i Claude Cowork, także podczas pierwszego uruchomienia aplikacji. Interfejs pluginów został całkowicie przebudowany z oddzielnymi zakładkami, marketplace’em z filtrami kategorii, ulepszoną nawigacją klawiaturową. Wyszukiwanie w ustawieniach zostało rozszerzone o Git i personalizacje wizualne.

FunkcjaSzczegół
Migracja Claude Code/CoworkAutomatyczny import, także podczas onboardingu
Ekran pluginówZakładki, marketplace, filtry kategorii
Wyszukiwanie ustawieńRozszerzone o Git, personalizacje wizualne

🔗 Codex Changelog


Perplexity i Cohere: orkiestracja wielomodelowa i benchmark głosowy

Perplexity Computer integruje Claude Fable 5 jako orkiestratora

10 czerwca — Perplexity ogłasza integrację Claude Fable 5 jako modelu orkiestratora w Perplexity Computer, swoim wieloetapowym interfejsie agentowym. Integracja ta jest zarezerwowana dla subskrybentów Pro i Max.

🔗 Ogłoszenie @perplexity_ai

Cohere Transcribe nr 1 w benchmarku Far-Field ASR Hugging Face

10 czerwcaCohere Transcribe, open-source’owy model rozpoznawania mowy od Cohere, zajmuje pierwsze miejsce w nowym benchmarku Far-Field ASR Hugging Face, zaprojektowanym do testowania odporności w rzeczywistych środowiskach audio (sale konferencyjne, centra kontaktowe, rozmowy telefoniczne).

ModelWER Far-Field ASR
Cohere Transcribe17,9
IBM Granite Speech~19,8
NVIDIA Parakeet~21,5

Model pozostaje na licencji Apache 2.0 i może działać lokalnie. Już wcześniej zajmował pierwsze miejsce w ogólnym leaderboardzie OpenASR w marcu 2026 r.

🔗 Ogłoszenie @cohere


Gemini App: nowe funkcje dla małych firm

10 czerwca — Podczas wydarzenia Google for Brazil w São Paulo Google ogłasza dwie funkcje Gemini App skierowane do małych firm, a globalne wdrożenie planowane jest na czerwiec 2026 r.

Połączenie z Google Business Profile: użytkownicy łączą swój profil bezpośrednio w aplikacji Gemini. Po połączeniu Gemini uzyskuje dostęp do opinii klientów, pytań i danych o wynikach, aby proponować spersonalizowane rekomendacje: miesięczną analizę wyników, tworzenie odpowiedzi na opinie w tonie marki, aktualizację godzin otwarcia i profilu.

Business notebooks: scentralizowana przestrzeń, w której firma porządkuje swoje rozmowy, źródła i profil Google Business. Gemini wykorzystuje ją jako bazę wiedzy, aby utrzymywać ciągłość rozmów i proponować proaktywne alerty (nieodpowiedziane pytanie klientki, brak wpisanych godzin świątecznych).

🔗 Blog Google


Krótkie wiadomości

  • Awaria Gemini 10 czerwca — Dyrektor produktu Josh Woodward zgłasza awarię usługi o 19:31, a częściowe poprawki zostały już wdrożone. 🔗 @joshwoodward
  • GitHub Enterprise — 500 cost centers — Limit centrów kosztów na firmę wzrasta z 250 do 500, automatycznie i bez wymaganej konfiguracji. 🔗 Changelog
  • Dependabot obsługuje Deno — Aktualizacje wersji Deno są obsługiwane poprzez wpis deno w .github/dependabot.yml (na razie bez aktualizacji bezpieczeństwa). 🔗 Changelog
  • npm v12 — zmiany niezgodne w lipcu 2026 — Skrypty instalacyjne, zależności Git i zdalne URL-e będą domyślnie blokowane. Zalecana aktualizacja do npm 11.16.0+, aby się przygotować. 🔗 Changelog
  • Alibaba Wan — Fisheye Lens — Nowe narzędzie przekształcające standardowe obrazy w okrągłe, ultraszerokokątne ujęcia w stylu fish-eye, dodane do galerii umiejętności wizualnych Wan. 🔗 @Alibaba_Wan
  • Z-Image-Engineer-V6 — Wymienny enkoder tekstu dla Z-Image-Turbo (Tongyi Lab / Alibaba), który zamienia proste prompty w filmowe opisy. Dostępny na Hugging Face. 🔗 @Ali_TongyiLab
  • Qwen-Image-Edit-2511 + LoRA — Nowa społecznościowa przestrzeń Hugging Face dla Qwen-Image-Edit-2511 z wszechstronną matrycą LoRA (face swap, pozy, wirtualne przymierzanie, renderowanie wielokątnych ujęć). 🔗 @Ali_TongyiLab
  • ChatGPT for iOS 1.2026.153 — nowe funkcje Codex Mobile — worktrees, /goal.
  • Codex w Ableton Live — @OpenAIDevs pokazuje muzyka @sound4movement, który używa Codex do automatycznej konfiguracji Ableton Live na podstawie opisu utworu. 🔗 @OpenAIDevs
  • Cohere Labs — AI i przyszłość pracy — Publikacja raportu o lukach dowodowych w debacie nad wpływem AI na zatrudnienie, inaugurująca nowy kierunek badań. 🔗 @cohere

Co to oznacza

Nowe architektury inferencji: koniec token po tokenie? DiffusionGemma to pierwsza publiczna, szeroko zakrojona demonstracja otwartej architektury dyfuzyjnej dla tekstu, a natychmiastowe zainteresowanie ze strony NVIDIA — która zoptymalizowała model tego samego dnia co jego premiera — potwierdza, że ten kierunek jest traktowany poważnie przemysłowo. Zysk 4x na dedykowanym GPU nie jest anegdotyczny: przenosi wąskie gardło z przepustowości pamięci (zmora modeli autoregresyjnych) na rdzenie obliczeniowe tensorów. Obecne ograniczenie (jakość niższa niż Gemma 4) i wyraźne ukierunkowanie na deweloperów, a nie na produkcję, wskazują, że to ścieżka badawcza, a nie natychmiastowy zamiennik — ale benchmark Pareto Grok Voice na EVA-Bench, w innym obszarze (głos), pokazuje, że wyścig o efektywność toczy się już równolegle na kilku frontach architektonicznych.

Autonomia agentowa: od obietnicy do infrastruktury. GA dynamicznych workflowów Claude Code z rekurencją na 5 poziomach, połączona z planowanymi wdrożeniami i sejfami sekretów Claude Managed Agents, materializuje zmianę paradygmatu: agenci nie są już jednorazowymi narzędziami, lecz trwałymi, planowalnymi procesami z bezpiecznym dostępem do sekretów. Inicjatywa Kimi Agent Swarm (300 podagentów w 104 meczach) ilustruje ten sam ruch po stronie Moonshot AI. A Perplexity Computer, który integruje Claude Fable 5 jako orchestratora, sygnalizuje, że konkurencja w obszarze agentów rozgrywa się zarówno na poziomie narzędzi, jak i samych modeli.

Prywatność i zaufanie: oś Apple–NVIDIA–Google. Integracja NVIDIA Confidential Computing w Apple PCC na Google Cloud ma strukturalne znaczenie: pokazuje, że publiczne wdrożenie może łączyć przyspieszenie GPU, kryptograficzne gwarancje prywatności i infrastrukturę chmurową strony trzeciej. To nie nisza — Apple Intelligence trafia do setek milionów urządzeń. Jeśli ta architektura się upowszechni, może stać się de facto standardem dla usług AI przetwarzających wrażliwe dane osobowe.

Ekosystem deweloperski: konsolidacja i konkurencja w narzędziach. Fakt, że Codex 26.608 oferuje ścieżkę migracji z Claude Code, nie jest przypadkowy: to uznanie, że deweloperzy zainwestowali swoją konfigurację w konkurencyjne narzędzia i że trzeba obniżyć koszt przejścia. Z kolei GitHub Copilot przyspiesza w podejściu „agent-native” (aplikacja bez listy oczekujących, sesje agentów widoczne na czacie, przegląd bezpieczeństwa w CLI). 10 czerwca rysuje ekosystem, w którym różnicowanie odbywa się mniej na poziomie surowych możliwości modeli, a bardziej na głębokości integracji z codziennymi workflowami deweloperskimi.


Źródła