ai-powered-markdown-translatorPrzetłumaczony artykuł z fr na pl z gpt-5.4-mini.
10 czerwca 2026 to dzień pełen nowości: Google DeepMind uruchamia DiffusionGemma, nową architekturę generowania tekstu metodą dyfuzji, osiągającą 1 000 tokenów na sekundę na H100, natychmiast zoptymalizowaną przez NVIDIA pod sprzęt lokalny. Po stronie narzędzi dla deweloperów Anthropic wprowadza dynamiczne przepływy pracy Claude Code do ogólnej dostępności z rekurencyjnością agentów do 5 poziomów, a xAI pozycjonuje Grok Voice Think Fast 1.0 jako numer jeden w benchmarku EVA-Bench. GitHub, OpenAI, Perplexity i Cohere dopełniają dzień bogaty w ogłoszenia.
DiffusionGemma: równoległe generowanie bloków po 256 tokenów, 4x szybciej na GPU
10 czerwca — Google DeepMind uruchamia DiffusionGemma, eksperymentalny otwarty model o 26 miliardach parametrów (architektura Mieszanka Ekspertów, Mixture of Experts) opublikowany na licencji Apache 2.0. Jego cecha szczególna: zamiast generować token po tokenie jak każdy klasyczny model autoregresyjny, generuje całe bloki 256 tokenów jednocześnie, stosując tę samą iteracyjną zasadę odszumiania co modele dyfuzji obrazów.
Rezultat: nawet 4x szybciej na dedykowanym GPU. Model aktywuje tylko 3,8 miliarda parametrów podczas inferencji, co pozwala zmieścić go w 18 GB VRAM po kwantyzacji — dostępne na wysokiej klasy konsumenckich GPU. Dwukierunkowa uwaga otwiera zastosowania trudne dla modeli autoregresyjnych: edycję inline, uzupełnianie kodu, sekwencje aminokwasów, grafy matematyczne.
NVIDIA natychmiast zoptymalizowała DiffusionGemma pod swoje GPU, wykorzystując tensorowe rdzenie obliczeniowe (Tensor Cores), podczas gdy architektury autoregresyjne są ograniczane przez przepustowość pamięci. Zmierzone wydajności na różnych platformach:
| Sprzęt | Wydajność |
|---|---|
| NVIDIA H100 (serwer) | 1 000 tokenów/s |
| NVIDIA DGX Station | do 800 tokenów/s |
| NVIDIA DGX Spark (lokalnie) | 150 tokenów/s |
| GeForce RTX 5090 (skwantyzowany) | 700+ tokenów/s |
| GeForce RTX 4090 (skwantyzowany) | wsparcie dla llama.cpp wkrótce |
Wagi są dostępne na Hugging Face z natychmiastowym wsparciem w HF Transformers, vLLM i Unsloth. Model można również bezpłatnie przetestować na build.nvidia.com.
Ważne: Google wyraźnie zaznacza, że jakość wyników pozostaje niższa niż w przypadku standardowych modeli Gemma 4. DiffusionGemma jest skierowany do deweloperów eksplorujących lokalne, interaktywne przepływy pracy — szybkie iteracje, edycję inline — a nie do produkcji.
“DiffusionGemma is our new experimental open model with up to 4x faster output on dedicated GPUs. Instead of predicting word-by-word, it generates entire blocks of text simultaneously.”
🇵🇱 DiffusionGemma to nasz nowy eksperymentalny otwarty model, oferujący do 4 razy szybsze wyjście na dedykowanym GPU. Zamiast przewidywać słowa jedno po drugim, generuje jednocześnie całe bloki tekstu. — @GoogleDeepMind na X
🔗 Ogłoszenie Google DeepMind · 🔗 Optymalizacja NVIDIA
Claude Code v2.1.172: dynamiczne przepływy pracy w ogólnej dostępności, rekurencyjni podagenci do 5 poziomów
10 czerwca — Anthropic ogłasza, że dynamiczne przepływy pracy (dynamic workflows) Claude Code przechodzą do ogólnej dostępności. Zaprezentowane jako research preview 28 maja, pozwalają Claude projektować własną orkiestrację i uruchamiać od kilkudziesięciu do setek podagentów równolegle, aby kompleksowo obsługiwać złożone zadania od początku do końca.
Wersja v2.1.172 CLI, opublikowana tego samego dnia, wprowadza związaną z tym kluczową możliwość: podagenci mogą teraz tworzyć własnych podagentów, aż do 5 poziomów zagnieżdżenia. To techniczny fundament, który czyni dynamiczne przepływy pracy operacyjnymi na dużą skalę.
Główne przypadki użycia:
- polowanie na błędy w skali całego repozytorium, audyty bezpieczeństwa
- migracje kodu obejmujące tysiące plików (np. portowanie Bun z Zig do Rust w 11 dni)
- adversarialna weryfikacja wyniku przed dostarczeniem
Dostępność i warunki:
| Element | Szczegół |
|---|---|
| Plany | Max, Team, Enterprise (jeśli włączone przez administratora), API Claude |
| Platformy chmurowe | Amazon Bedrock, Vertex AI, Microsoft Foundry |
| Aktywacja | Polecenie Create a workflow lub parametr ultracode (effort xhigh) |
| Głębokość podagentów | Do 5 poziomów |
| Wersja CLI | v2.1.172 |
Warto zauważyć: dynamiczne przepływy pracy zużywają znacznie więcej tokenów niż standardowa sesja Claude Code. Claude Code wyświetla potwierdzenie przed pierwszym uruchomieniem. Administratorzy Enterprise mogą wyłączyć tę funkcję poprzez zarządzane ustawienia.
Inne zmiany w v2.1.172: naprawa błędu sesji trwale zablokowanych z kontekstem 1M bez kredytów, pasek wyszukiwania w przeglądarce /plugin, Amazon Bedrock teraz odczytuje region AWS z ~/.aws jeśli AWS_REGION nie jest zdefiniowane, liczne poprawki stabilności dla agentów działających w tle.
🔗 Ogłoszenie @claudeai · 🔗 Blog Dynamic Workflows · 🔗 CHANGELOG
Grok Voice Think Fast 1.0 — numer jeden EVA-Bench
10 czerwca — xAI ogłasza Grok Voice Think Fast 1.0, swój model głosowy, który zajmuje miejsce na granicy Pareto rankingu EVA-Bench ServiceNow AI Research. Granica Pareto oznacza, że żaden inny system w ewaluacji nie przewyższa jednocześnie jego dokładności i jakości doświadczenia użytkownika.
xAI podkreśla trzy cechy: naturalny timing, intonację dopasowaną do kontekstu i ciepło odbierane podobnie jak u człowieka. Model jest dostępny przez xAI Voice API pod adresem x.ai/api/voice, w cenie przedstawianej jako wyraźnie niższa niż u konkurencji.
| Metryka | Wartość |
|---|---|
| Ranking EVA-Bench | Granica Pareto (numer 1) |
| Dostępność | API x.ai/api/voice |
| Pozycjonowanie cenowe | Ułamek ceny konkurencji (według xAI) |
“Grok Voice offers state-of-the-art performance with human-like timing, tone, and warmth. And it’s a fraction the price of competitors.”
🇵🇱 Grok Voice oferuje najnowocześniejszą wydajność z ludzkopodobnym timingiem, tonem i ciepłem. A jego cena to ułamek ceny konkurencji. — @xai na X
NVIDIA Confidential Computing w Apple Private Cloud Compute (WWDC 2026)
9 czerwca — Zapowiedziana podczas WWDC 2026, ta trójstronna integracja Apple–NVIDIA–Google stanowi strukturalny krok dla prywatności AI w chmurze. GPU NVIDIA Blackwell z Confidential Computing są teraz zintegrowane z infrastrukturą Private Cloud Compute (PCC) firmy Apple, która wykracza poza centra danych Apple do Google Cloud.
Cel: przetwarzanie zapytań Apple Intelligence po stronie serwera z absolutną kryptograficzną gwarancją prywatności — nikt, nawet twórcy systemu, nie może uzyskać dostępu do danych, rozmów ani czatów użytkowników.
Mechanizmy ochrony:
- zaufanie zakorzenione w sprzęcie (hardware-rooted trust): weryfikacja, że infrastruktura nie została naruszona
- szyfrowane ścieżki komunikacji między komponentami
- attestation zdalne (remote attestation): oprogramowanie sprawdza stan bezpieczeństwa platformy przed jakimkolwiek transferem wrażliwych danych
- wsparcie dla przyspieszonej inferencji bez kompromisów w wydajności GPU
Ta architektura pozwala Apple rozszerzyć Apple Intelligence na Google Cloud przy jednoczesnym utrzymaniu zobowiązań dotyczących prywatności — rzadkie połączenie w branży. Dla NVIDIA to wdrożenie Confidential Computing Blackwell na dużą skalę w publicznej implementacji.
Anthropic: zaplanowani agenci, skarbce sekretów i ramy regulacyjne
Claude Managed Agents — zaplanowane wdrożenia i skarbce zmiennych
9 czerwca — Dwie nowe funkcje trafiają do publicznej bety w Claude Managed Agents, ogłoszone podczas Code with Claude Tokyo:
Zaplanowane wdrożenia (scheduled deployments): agenci mogą teraz uruchamiać się automatycznie według harmonogramu, bez ręcznej interwencji — codzienne raporty, okresowe kontrole, regularne pipeline’y danych.
Zmienne w skarbcach (vaults): agenci uzyskują dostęp do swoich sekretów i konfiguracji poprzez zarządzany sejf, bez ujawniania kluczy w kodzie lub konfiguracjach sesji.
| Funkcja | Status |
|---|---|
| Zaplanowane wdrożenia | Publiczna beta |
| Zmienne w skarbcach | Publiczna beta |
| Platforma | Claude Managed Agents |
🔗 What’s new in Claude Managed Agents
Policy on the AI Exponential — ramy regulacyjne Anthropic
10 czerwca — Anthropic publikuje Policy on the AI Exponential, dokument ram polityki publicznej wraz z esejem Dario Amodei. Wniosek: możliwości AI rosną w tempie wykładniczym, za którym proces legislacyjny nie został zaprojektowany, by nadążać.
Dokument dotyczy modeli trenowanych z użyciem ponad 10²⁵ operacji zmiennoprzecinkowych (FLOP), tworzonych przez firmy generujące ponad USD 500 milionów przychodów związanych z AI lub wydające ponad USD 1 miliard na R&D AI. Wskazuje cztery kategorie ryzyka katastroficznego: ryzyko biologiczne, cybernetyczne, utrata kontroli nad systemami AI oraz automatyzacja samego R&D AI.
| Proponowany obowiązek | Opis |
|---|---|
| Transparentność | Obowiązkowe testy, publikacja wyników |
| Niezależna ewaluacja | Co najmniej jeden kwalifikowany zewnętrzny ewaluator |
| Bezpieczeństwo | Ochrona wag przed aktorami państwowymi |
| Władza rządowa | Uprawnienie do blokowania lub opóźniania niebezpiecznych modeli |
“AI is advancing at a pace our policymaking institutions were never built for—and the gap between the two is becoming the central challenge of the technology.”
🇵🇱 AI rozwija się w tempie, do którego nasze instytucje legislacyjne nie zostały zaprojektowane — a przepaść między nimi staje się kluczowym wyzwaniem, jakie stawia ta technologia. — @AnthropicAI na X
🔗 Policy on the AI Exponential
GitHub Copilot: aplikacja otwarta dla wszystkich, widoczne sesje agentów i przegląd bezpieczeństwa w CLI
Copilot App — technical preview otwarta bez listy oczekujących
10 czerwca — Technical preview aplikacji GitHub Copilot jest teraz dostępny dla wszystkich subskrybentów Copilot Pro, Pro+, Max, Business i Enterprise, bez listy oczekujących. Ta aplikacja desktopowa zaprojektowana dla agentów centralizuje zarządzanie sesjami agentów, tworzenie pull requestów i sterowanie zadaniami deweloperskimi z poziomu pulpitu — od zgłoszenia do PR w jednym miejscu.
Copilot Chat teraz widzi sesje agentów
10 czerwca — GitHub ulepsza przejście między Copilot Chat a agentem w chmurze. W Copilot Chat dostępne są teraz dwa nowe narzędzia: Get agent logs (logi sesji agenta na pull requestcie, możliwe do przeszukiwania bezpośrednio w rozmowie) oraz Session search (wyszukiwanie i podsumowanie poprzednich sesji według tematu, tytułu lub daty). Status trwającej sesji jest teraz odzwierciedlany w czasie rzeczywistym w czacie.
Copilot CLI — komenda /security-review (eksperymentalny public preview)
10 czerwca — Nowa komenda slash /security-review jest dostępna w eksperymentalnym public preview w GitHub Copilot CLI. Analizuje lokalne zmiany kodu bezpośrednio z terminala: iniekcje (SQL, polecenia), XSS, niebezpieczne przetwarzanie danych, path traversal, słabą kryptografię. Wyniki są oceniane według powagi i pewności, z sugestiami możliwymi do zastosowania bez opuszczania terminala. Komenda jest niezależna od GitHub code scanning i Dependabot — uzupełnia je lekką analizą na żądanie.
Manus — Zoom Connector
9 czerwca — Manus uruchamia konektor Zoom, pozwalający agentowi automatycznie analizować treści spotkań dostępnych z poziomu połączonego konta: podsumowania, transkrypcje, nagrania, notatki, agendy, tablice, informacje o uczestnikach. Trzy główne przypadki użycia: analiza spotkania na żądanie, automatyczny cykliczny przegląd z raportem w Slacku lub e-mailu oraz analiza trendów na wielu spotkaniach. Ograniczenie: Manus ma dostęp tylko do zasobów, które połączone konto Zoom ma uprawnienia oglądać.
xAI i Kimi: partnerstwa i swarm agentów
Grok + eToro — Agent Tori zasilany danymi X w czasie rzeczywistym
10 czerwca — xAI i eToro ogłaszają, że Tori, agent AI eToro (40 milionów użytkowników w 75 krajach), integruje teraz modele xAI i dane w czasie rzeczywistym z platformy X do analizy sentymentu rynkowego (market sentiment). Tori może odczytywać zmiany sentymentu w czasie rzeczywistym, śledzić sygnały na żywo i analizować informacje. Ta sama inteligencja czasu rzeczywistego jest dostępna dla wszystkich deweloperów poprzez konsolę API xAI.
🔗 xAI News
Kimi Agent Swarm — prognoza 104 meczów Mistrzostw Świata 2026
9 czerwca — Kimi (Moonshot AI) wdraża 300 podagentów równolegle do prognozowania 104 meczów FIFA World Cup 2026. Każdy agent ma własny kąt analityczny: taktyki, forma zawodników, dane historyczne, sentyment publiczny, pogoda, psychologia, ruchy kursów. System wykorzystuje modele Elo/FIFA, Poisson/Dixon-Coles, symulacje Monte Carlo i dynamiczną aktualizację bayesowską. Zidentyfikowany sygnał: szacowane prawdopodobieństwo tytułu Niemiec na ~11,3 % wobec ~7,4 % na rynkach bukmacherskich.
OpenAI Codex: migracja z Claude Code i showcase Ableton
Codex app 26.608 — migracja z Claude Code i przebudowa pluginów
9 czerwca — Aktualizacja Codex app 26.608 wprowadza przepływ migracji (Migrate to Codex) umożliwiający automatyczne importowanie konfiguracji z Claude Code i Claude Cowork, także podczas pierwszego uruchomienia aplikacji. Interfejs pluginów został całkowicie przebudowany z oddzielnymi zakładkami, marketplace’em z filtrami kategorii, ulepszoną nawigacją klawiaturową. Wyszukiwanie w ustawieniach zostało rozszerzone o Git i personalizacje wizualne.
| Funkcja | Szczegół |
|---|---|
| Migracja Claude Code/Cowork | Automatyczny import, także podczas onboardingu |
| Ekran pluginów | Zakładki, marketplace, filtry kategorii |
| Wyszukiwanie ustawień | Rozszerzone o Git, personalizacje wizualne |
Perplexity i Cohere: orkiestracja wielomodelowa i benchmark głosowy
Perplexity Computer integruje Claude Fable 5 jako orkiestratora
10 czerwca — Perplexity ogłasza integrację Claude Fable 5 jako modelu orkiestratora w Perplexity Computer, swoim wieloetapowym interfejsie agentowym. Integracja ta jest zarezerwowana dla subskrybentów Pro i Max.
Cohere Transcribe nr 1 w benchmarku Far-Field ASR Hugging Face
10 czerwca — Cohere Transcribe, open-source’owy model rozpoznawania mowy od Cohere, zajmuje pierwsze miejsce w nowym benchmarku Far-Field ASR Hugging Face, zaprojektowanym do testowania odporności w rzeczywistych środowiskach audio (sale konferencyjne, centra kontaktowe, rozmowy telefoniczne).
| Model | WER Far-Field ASR |
|---|---|
| Cohere Transcribe | 17,9 |
| IBM Granite Speech | ~19,8 |
| NVIDIA Parakeet | ~21,5 |
Model pozostaje na licencji Apache 2.0 i może działać lokalnie. Już wcześniej zajmował pierwsze miejsce w ogólnym leaderboardzie OpenASR w marcu 2026 r.
Gemini App: nowe funkcje dla małych firm
10 czerwca — Podczas wydarzenia Google for Brazil w São Paulo Google ogłasza dwie funkcje Gemini App skierowane do małych firm, a globalne wdrożenie planowane jest na czerwiec 2026 r.
Połączenie z Google Business Profile: użytkownicy łączą swój profil bezpośrednio w aplikacji Gemini. Po połączeniu Gemini uzyskuje dostęp do opinii klientów, pytań i danych o wynikach, aby proponować spersonalizowane rekomendacje: miesięczną analizę wyników, tworzenie odpowiedzi na opinie w tonie marki, aktualizację godzin otwarcia i profilu.
Business notebooks: scentralizowana przestrzeń, w której firma porządkuje swoje rozmowy, źródła i profil Google Business. Gemini wykorzystuje ją jako bazę wiedzy, aby utrzymywać ciągłość rozmów i proponować proaktywne alerty (nieodpowiedziane pytanie klientki, brak wpisanych godzin świątecznych).
Krótkie wiadomości
- Awaria Gemini 10 czerwca — Dyrektor produktu Josh Woodward zgłasza awarię usługi o 19:31, a częściowe poprawki zostały już wdrożone. 🔗 @joshwoodward
- GitHub Enterprise — 500 cost centers — Limit centrów kosztów na firmę wzrasta z 250 do 500, automatycznie i bez wymaganej konfiguracji. 🔗 Changelog
- Dependabot obsługuje Deno — Aktualizacje wersji Deno są obsługiwane poprzez wpis
denow.github/dependabot.yml(na razie bez aktualizacji bezpieczeństwa). 🔗 Changelog - npm v12 — zmiany niezgodne w lipcu 2026 — Skrypty instalacyjne, zależności Git i zdalne URL-e będą domyślnie blokowane. Zalecana aktualizacja do npm 11.16.0+, aby się przygotować. 🔗 Changelog
- Alibaba Wan — Fisheye Lens — Nowe narzędzie przekształcające standardowe obrazy w okrągłe, ultraszerokokątne ujęcia w stylu fish-eye, dodane do galerii umiejętności wizualnych Wan. 🔗 @Alibaba_Wan
- Z-Image-Engineer-V6 — Wymienny enkoder tekstu dla Z-Image-Turbo (Tongyi Lab / Alibaba), który zamienia proste prompty w filmowe opisy. Dostępny na Hugging Face. 🔗 @Ali_TongyiLab
- Qwen-Image-Edit-2511 + LoRA — Nowa społecznościowa przestrzeń Hugging Face dla Qwen-Image-Edit-2511 z wszechstronną matrycą LoRA (face swap, pozy, wirtualne przymierzanie, renderowanie wielokątnych ujęć). 🔗 @Ali_TongyiLab
- ChatGPT for iOS 1.2026.153 — nowe funkcje Codex Mobile — worktrees,
/goal. - Codex w Ableton Live — @OpenAIDevs pokazuje muzyka @sound4movement, który używa Codex do automatycznej konfiguracji Ableton Live na podstawie opisu utworu. 🔗 @OpenAIDevs
- Cohere Labs — AI i przyszłość pracy — Publikacja raportu o lukach dowodowych w debacie nad wpływem AI na zatrudnienie, inaugurująca nowy kierunek badań. 🔗 @cohere
Co to oznacza
Nowe architektury inferencji: koniec token po tokenie? DiffusionGemma to pierwsza publiczna, szeroko zakrojona demonstracja otwartej architektury dyfuzyjnej dla tekstu, a natychmiastowe zainteresowanie ze strony NVIDIA — która zoptymalizowała model tego samego dnia co jego premiera — potwierdza, że ten kierunek jest traktowany poważnie przemysłowo. Zysk 4x na dedykowanym GPU nie jest anegdotyczny: przenosi wąskie gardło z przepustowości pamięci (zmora modeli autoregresyjnych) na rdzenie obliczeniowe tensorów. Obecne ograniczenie (jakość niższa niż Gemma 4) i wyraźne ukierunkowanie na deweloperów, a nie na produkcję, wskazują, że to ścieżka badawcza, a nie natychmiastowy zamiennik — ale benchmark Pareto Grok Voice na EVA-Bench, w innym obszarze (głos), pokazuje, że wyścig o efektywność toczy się już równolegle na kilku frontach architektonicznych.
Autonomia agentowa: od obietnicy do infrastruktury. GA dynamicznych workflowów Claude Code z rekurencją na 5 poziomach, połączona z planowanymi wdrożeniami i sejfami sekretów Claude Managed Agents, materializuje zmianę paradygmatu: agenci nie są już jednorazowymi narzędziami, lecz trwałymi, planowalnymi procesami z bezpiecznym dostępem do sekretów. Inicjatywa Kimi Agent Swarm (300 podagentów w 104 meczach) ilustruje ten sam ruch po stronie Moonshot AI. A Perplexity Computer, który integruje Claude Fable 5 jako orchestratora, sygnalizuje, że konkurencja w obszarze agentów rozgrywa się zarówno na poziomie narzędzi, jak i samych modeli.
Prywatność i zaufanie: oś Apple–NVIDIA–Google. Integracja NVIDIA Confidential Computing w Apple PCC na Google Cloud ma strukturalne znaczenie: pokazuje, że publiczne wdrożenie może łączyć przyspieszenie GPU, kryptograficzne gwarancje prywatności i infrastrukturę chmurową strony trzeciej. To nie nisza — Apple Intelligence trafia do setek milionów urządzeń. Jeśli ta architektura się upowszechni, może stać się de facto standardem dla usług AI przetwarzających wrażliwe dane osobowe.
Ekosystem deweloperski: konsolidacja i konkurencja w narzędziach. Fakt, że Codex 26.608 oferuje ścieżkę migracji z Claude Code, nie jest przypadkowy: to uznanie, że deweloperzy zainwestowali swoją konfigurację w konkurencyjne narzędzia i że trzeba obniżyć koszt przejścia. Z kolei GitHub Copilot przyspiesza w podejściu „agent-native” (aplikacja bez listy oczekujących, sesje agentów widoczne na czacie, przegląd bezpieczeństwa w CLI). 10 czerwca rysuje ekosystem, w którym różnicowanie odbywa się mniej na poziomie surowych możliwości modeli, a bardziej na głębokości integracji z codziennymi workflowami deweloperskimi.
Źródła
- DiffusionGemma — Blog Google DeepMind
- DiffusionGemma — Optymalizacja NVIDIA
- @GoogleDeepMind na X
- Claude Code — Dynamic Workflows GA
- @claudeai na X
- Claude Code CHANGELOG
- Claude Managed Agents — What’s new
- Anthropic — Policy on the AI Exponential
- @AnthropicAI na X
- Grok Voice Think Fast 1.0 — @xai na X
- EVA-Bench wyniki
- xAI Voice API
- NVIDIA Confidential Computing × Apple PCC
- GitHub Copilot App — @github na X
- Copilot Chat agent sessions — Changelog
- Copilot CLI /security-review — Changelog
- Manus Zoom Connector
- Grok + eToro — xAI News
- Kimi Agent Swarm — @Kimi_Moonshot na X
- Codex app 26.608 — Changelog
- Perplexity Computer × Claude Fable 5 — @perplexity_ai
- Cohere Transcribe #1 Far-Field ASR — @cohere
- Gemini App — funkcje dla MŚP
- Awaria Gemini — @joshwoodward
- GitHub Enterprise cost centers
- Dependabot Deno
- npm v12 breaking changes
- Alibaba Wan Fisheye Lens — @Alibaba_Wan
- Z-Image-Engineer-V6 — @Ali_TongyiLab
- Qwen-Image-Edit-2511 — @Ali_TongyiLab
- @OpenAIDevs — Codex Ableton
- Cohere Labs — przyszłość pracy — @cohere