Gemma 4 12B open-source, Ideogram 4.0 open-weights, Perplexity Computer na Windows, Stargate Michigan

3 czerwca 2026 r. skupia falę ważnych ogłoszeń open-source: Google publikuje Gemma 4 12B (multimodalny, edge, Apache 2.0) i uruchamia Co-Scientist, swój wieloagentowy system do badań naukowych. Ideogram udostępnia wagi swojej wersji 4.0. Perplexity wprowadza swojego agenta Personal Computer na Windows. OpenAI inauguruje The Barn, centrum danych 1 GW w Michigan. GitHub Copilot wypuszcza dużą aktualizację dla VS Code, JetBrains, Eclipse i rozliczeń. Po stronie xAI, Grok Imagine 1.5 Preview jest dostępny przez API, a głosy Grok trafiają do Vapi.

Gemma 4 12B — open-source’owy model multimodalny do laptopów

3 czerwca — Google uruchamia Gemma 4 12B, ujednolicony model multimodalny zaprojektowany do działania bezpośrednio na laptopach i urządzeniach brzegowych (edge computing). Jego główną cechą techniczną jest architektura bez oddzielnego enkodera (encoder-free), która upraszcza wdrożenie i ogranicza zależności programowe. Model został wydany na licencji Apache 2.0, co sprawia, że można go swobodnie wykorzystywać do celów komercyjnych i badawczych.

Cecha	Wartość
Parametry	12 miliardów
Modalności	Tekst + obraz (jednolity)
Architektura	Bez oddzielnego enkodera (encoder-free)
Licencja	Apache 2.0
Docelowy sprzęt	Laptopy, edge computing
Dostępność	Do pobrania już teraz

Ogłoszenie wygenerowało 620 000 wyświetleń i 5 000 polubień na X, co czyni je jednym z najbardziej angażujących ogłoszeń open-source tygodnia. Udostępniony przez Google DeepMind, Gemma 4 12B wpisuje się w ciągłość wcześniejszych modeli Gemma, ale robi krok naprzód, łącząc wizję i tekst w jednym kompaktowym modelu.

Dla deweloperów model ten otwiera konkretną drogę do multimodalnych aplikacji AI wdrażalnych poza chmurą — na maszynach z konsumenckimi GPU, bez subskrypcji API.

🔗 Tweet premierowy @googlegemma

Google DeepMind Co-Scientist — wieloagentowy partner do badań naukowych

2 czerwca — Google DeepMind prezentuje Co-Scientist, wieloagentowy system oparty na Gemini, zaprojektowany tak, aby działać jak prawdziwy partner w badaniach naukowych. Jego podstawowa zdolność to generowanie, debatowanie i rozwijanie hipotez dotyczących złożonych problemów naukowych w sposób autonomiczny, przy niewielkiej interwencji człowieka.

Co-Scientist nie jest zwykłym narzędziem do streszczania czy wyszukiwania dokumentów. Potrafi proponować oryginalne hipotezy, konfrontować je wewnętrznie między agentami, a następnie je dopracowywać — cykl ideacja-debata-ewolucja, dotąd zarezerwowany dla ludzkich zespołów badawczych. System został oceniony przez światowych ekspertów naukowych na specjalistycznych benchmarkach.

Dostępność: wczesny dostęp dla indywidualnych badaczy przez Hypothesis Generation (lista oczekujących). Trwają współprace ze światowymi ekspertami naukowymi, aby ocenić wydajność w konkretnych dziedzinach.

“We believe AI can be a dedicated research partner to help discover the next breakthrough.”

🇵🇱 Wierzymy, że AI może być dedykowanym partnerem badawczym, pomagającym odkryć kolejny przełom. — @GoogleDeepMind

Ogłoszenie wygenerowało 144 000 wyświetleń na X. W kontekście sektora naukowego pod presją przyspieszania cykli odkryć, Co-Scientist bezpośrednio celuje w indywidualnych badaczy, którzy nie mają zasobów dużego zespołu.

🔗 Artykuł deepmind.google

Ideogram 4.0 — do pobrania open-source’owe wagi, możliwy fine-tuning

3 czerwca — Ideogram ogłasza Ideogram 4.0, przedstawiany jako „najlepszy open-source’owy model obrazu na świecie”. Ogłoszenie wyróżnia się radykalnie otwartą filozofią: wagi modelu można pobrać, deweloperzy mogą go dostrajać (fine-tune) na własnych danych i wdrażać na własnej infrastrukturze.

Aspekt	Szczegół
Dostępność	Wszystkie plany Ideogram + API (od teraz)
Wagi Hugging Face	`ideogram-ai/ideogram-4-nf4`
Demo	huggingface.co/spaces/multimodalart/ideogram4
Fine-tuning	Dozwolony na danych własnościowych
Wdrożenie	Możliwa własna infrastruktura
Zaangażowanie X	396 800 wyświetleń — duża wiralowość

Ogłoszenie zostało podchwycone i docenione przez Hugging Face jako przykład postępu jakości modeli otwartych. Hasło „Think it. Make it. Own it.” podsumowuje tę filozofię: w przeciwieństwie do zwykle zamkniętych modeli generatywnych obrazu (Midjourney, DALL-E, nowszy Stable Diffusion), Ideogram 4.0 proponuje model pełnej własności dla studiów i deweloperów.

Dla zespołów kreatywnych korzyść jest natychmiastowa: można personalizować styl na własnych danych bez zależności od zewnętrznej usługi i wdrażać go wewnętrznie.

🔗 Ogłoszenie @ideogram_ai

Perplexity Personal Computer trafia na Windows

3 czerwca — Perplexity ogłasza pojawienie się swojego agenta Personal Computer na Windows. Dotąd dostępny wyłącznie na macOS, agent przygotowuje się do podboju systemu operacyjnego Microsoftu.

“Personal Computer is coming to Windows. Personal Computer for Windows runs on your machine and orchestrates across the apps and files you use every day. We’ll roll out first to paying Max and Enterprise Max subscribers on the waitlist.”

🇵🇱 Personal Computer trafia na Windows. Personal Computer dla Windows działa na twojej maszynie i orkiestruje aplikacje oraz pliki, z których korzystasz każdego dnia. Najpierw wdrożymy go dla płatnych subskrybentów Max i Enterprise Max zapisanych na listę oczekujących. — @perplexity_ai

Personal Computer działa lokalnie na maszynie użytkownika — orkiestruje codzienne aplikacje i pliki bez pełnego przechodzenia przez chmurę. To hybrydowe podejście lokalne/chmurowe stawia Perplexity w odrębnej kategorii od czysto chmurowych agentów: użytkownik zachowuje kontrolę nad swoimi wrażliwymi danymi.

Wdrożenie rozpocznie się wśród subskrybentów Max i Enterprise Max zapisanych na listę oczekujących przez perplexity.ai/personal-computer.

Perplexity Computer — ponad 400 integracji dla firm

Tego samego dnia Perplexity doprecyzowuje zakres firmowych możliwości agenta: ponad 400 narzędzi połączonych, obejmujących wszystkie typy przedsiębiorstw. Wśród cytowanych integracji znajdują się: Intuit QuickBooks (księgowość), Vercel (wdrażanie webowe), Shopify (e-commerce) i Canva (projektowanie).

To uzupełniające ogłoszenie pozycjonuje Perplexity Computer jako uniwersalnego agenta biznesowego zdolnego integrować się z istniejącymi przepływami pracy bez zastępowania obecnych narzędzi.

🔗 Integracje dla firm

Stargate Michigan — The Barn, centrum danych 1 GW w Saline

1 czerwca — OpenAI i gubernator Gretchen Whitmer inaugurują pierwsze wbicie łopaty pod The Barn, kampus centrum danych o mocy 1 gigawata w Saline, Michigan. Projekt wpisuje się w program Stargate OpenAI — długoterminowy wysiłek budowy infrastruktury dla zaawansowanej AI, we współpracy z Oracle, Related Digital, Walbridge i Blackstone.

Metryka	Wartość
Moc	1 GW
Lokalizacja	Saline, Michigan
Miejsca pracy przy budowie	2 500+ (związkowe)
Stałe miejsca pracy	450
Miejsca pracy w hrabstwie + pośrednie	2 500
Inwestycja w centrum rekreacyjne	$10M (Oracle + Related Digital)
Prognozowane wpływy podatkowe	$1 miliard (okres dzierżawy)
Kredyty Codex dla studentów	do $45M
Uprawnieni studenci	400 000+

Zobowiązania wobec społeczności są jednoznaczne: lokalni mieszkańcy nie poniosą kosztów infrastruktury na swoich rachunkach za prąd. Chłodzenie działa w obiegu zamkniętym, przy zużyciu wody równoważnym zwykłemu biurowcowi.

Program studencki Michigan oferuje do $45 milionów w kredytach Codex dla 400 000 studentów uniwersytetów, community colleges i szkół zawodowych w stanie (18 lat i więcej, rok akademicki 2026-2027).

🔗 Ogłoszenie openai.com

GitHub Copilot w VS Code — wydania z maja (v1.120–v1.123)

3 czerwca — GitHub publikuje miesięczne podsumowanie Copilota dla VS Code, obejmujące wersje v1.120 do v1.123 dostarczane przez cały maj 2026 r. Ta gruntowna aktualizacja konsoliduje kilka miesięcy prac nad agentami, synchronizacją i bezpieczeństwem.

Najważniejsze nowości:

Okno Agents (stabilny preview): interfejs agent-first do pracy nad wieloma projektami jednocześnie, z szybką nawigacją i przeglądem zmian
Zdalni agenci (preview): uruchamianie na zdalnych maszynach przez SSH lub Dev Tunnels — sesje pozostają aktywne nawet po rozłączeniu klienta
Agent Host Protocol (AHP): otwarty protokół do synchronizacji stanu sesji między wieloma klientami
Session sync: sesje czatu synchronizują się automatycznie z kontem GitHub, dostępne między maszynami i obszarami roboczymi
/chronicle: odpytywanie o przeszłe sesje, generowanie codziennych raportów stand-up, otrzymywanie spersonalizowanych porad produktywności
Bezpieczeństwo terminala: hasła, PIN-y i kody weryfikacyjne wpisane w terminalu nigdy nie są przekazywane do modelu językowego
Ocena ryzyka poleceń (eksperymentalna): potwierdzenia terminala zawierają poziomy ryzyka generowane przez AI
BYOK air-gapped: modele BYOK działają w odizolowanych środowiskach bez dostępu do GitHub
Konfigurowalne modele narzędziowe: wybór modeli dla tytułów, podsumowań, sugestii zmiany nazw, wiadomości commit i wykrywania intencji
Wbudowana przeglądarka: emulacja urządzeń mobilnych, zaawansowane zrzuty ekranu (viewport, zaznaczony obszar, cała strona), lokalny podgląd HTML
Renderowanie Mermaid i YAML front matter: natywnie zintegrowane w podglądzie Markdown
Kompresja wyników terminala: gadatliwe wzorce (testy, buildy, linters, Docker, menedżery pakietów) kompresowane automatycznie

Kształtuje się model pracy wieloagentowej: wiele sesji agentów może działać równolegle w oknie Agents, każda z własnym kontekstem i historią synchronizowaną z kontem GitHub.

🔗 Changelog VS Code maj

Copilot Code Review — skills MCP i poziom analizy Medium (public preview)

2 czerwca — GitHub uruchamia w public preview dwie kluczowe funkcje dla Copilot code review, umożliwiające dostosowanie automatycznych przeglądów do kontekstu i złożoności każdego zespołu.

Skills i obsługa MCP: zespoły mogą teraz konfigurować niestandardowe skills agenta (pliki .github/skills/code-review/SKILL.md) oraz połączenia z serwerami MCP, aby wzbogacać każdą recenzję o kontekst wewnętrznych narzędzi — śledzenie issue, dokumentację, katalogi usług, narzędzia incydentowe. Konfiguracja MCP odbywa się w ustawieniach repozytorium → Copilot → MCP servers. Każda istniejąca konfiguracja MCP dla cloud agent jest automatycznie stosowana do recenzji — jednorazowa inwestycja, spójne zachowanie na obu agentach.

Poziom „Medium”: nowy pośredni próg kieruje złożone pull requesty do modelu o wyższym rozumowaniu, zaprojektowanego do wykrywania subtelnych błędów, analizowania logiki bezpieczeństwa i obsługi zmian między usługami. Poziom „Low” pozostaje szybkim i ekonomicznym domyślnym wyborem dla prostych modyfikacji. Medium zużywa więcej AI Credits niż Low, z wyraźnymi sygnałami kosztu w interfejsie. Administratorzy ustawiają poziom per repozytorium.

Workflowy Actions są również konfigurowalne, co pozwala kontrolować środowisko obliczeniowe używane przez Copilota do przeglądów. Dostępne dla Copilot Pro, Pro+, Business i Enterprise.

🔗 Shape Copilot Code Review

Copilot CLI i wzmocnione możliwości agentowe w JetBrains IDEs

2 czerwca — GitHub ogłasza pojawienie się Copilot CLI w JetBrains z selektorem agentów umożliwiającym wybór między trybem Agent (autonomiczny), Ask (szybka pomoc), Custom agents (niestandardowe) lub Plan (wspólne planowanie). Trzy nowe komendy wzbogacają sesje CLI:

/remote : sterowanie sesją CLI z github.com lub aplikacji mobilnej
/compact : ręczne kompresowanie kontekstu długich sesji
/chronicle : analizowanie historii, generowanie raportów stand-up i otrzymywanie spersonalizowanych porad

Panel debugowania agenta (public preview) pokazuje chronologiczny dziennik interakcji — szczególnie przydatny do debugowania niestandardowych agentów i złożonych workflowów wieloagentowych. Wysiłek myślenia modeli rozumujących jest konfigurowalny bezpośrednio z selektora modeli, co pozwala dostosować głębokość analizy do zadania.

Sesje Cloud agent są teraz zintegrowane w ujednoliconym widoku sesji, co pozwala zarządzać wszystkimi sesjami (lokalnymi, CLI, cloud) z jednego miejsca. Edytor dostosowań agenta centralizuje tworzenie i zarządzanie skills, instrukcjami i promptami.

Nowe opcje logowania: Google i Apple dołączają do dostępnych metod sign-in. Wśród funkcji, które przeszły do GA: agent skills, agent hooks, pliki promptów i Anthropic Thinking. Trwa stopniowe wdrażanie, aby Copilot CLI agent stał się domyślnym doświadczeniem w JetBrains.

🔗 Changelog Copilot JetBrains

Rozliczenia i plany GitHub Copilot — usage-based billing GA, Copilot Max

1 czerwca — GitHub aktywuje rozliczanie oparte na użyciu (AI Credits) dla wszystkich planów Copilot od 1 czerwca 2026 r. Każdy plan zawiera miesięczny limit AI Credits; po jego wyczerpaniu użytkownicy mogą kontynuować, konfigurując dodatkowy budżet wydatków z limitami zdefiniowanymi przez administratorów.

Zmiany strukturalne:

Copilot code review teraz zużywa minuty GitHub Actions jako uzupełnienie AI Credits — administratorzy mogą skonfigurować domyślny runner dla wszystkich recenzji na poziomie organizacji, bez konfiguracji per repozytorium
Budżety per użytkownik w GA: administratorzy organizacji i firm definiują budżety uniwersalne lub specyficzne dla użytkownika, z powiadomieniami e-mail przy zbliżaniu się do limitów
Copilot Max: ulepszenie dostępne już dziś dla istniejących subskrybentów Student, Pro i Pro+ — wyższy limit i wyższe limity wydatków dla intensywnych workflowów
Nowe zapisy wstrzymane dla Student, Pro, Pro+ i Max — ponowne uruchomienie planowane w najbliższych tygodniach

Ważna uwaga dla zespołów Enterprise: administratorzy będą musieli aktywować alternatywny model GPT-5.5 przez polityki modeli, aby zastąpić wycofywany GPT-4.1. Po aktywacji GPT-5.5 pojawia się w selektorze modeli Copilot Chat w VS Code i na github.com.

🔗 Aktualizacja rozliczeń i planów

Grok Imagine 1.5 Preview dostępny w API xAI

3 czerwca — xAI ogłasza dostępność Grok Imagine 1.5 Preview w API xAI, dostępnego pod adresem x.ai/api/imagine. To ważna aktualizacja możliwości generowania obrazów w Grok — wersja 1.5 Preview zastępuje Grok Imagine i stanowi nową generację modelu obrazu xAI, dostępnego bezpośrednio przez API dla deweloperów.

Aspekt	Szczegół
Model	Grok Imagine 1.5 Preview
Dostęp	API xAI — x.ai/api/imagine
Status	Preview (brak oficjalnej strony produktu w momencie skanowania)
Dostępność	Deweloperzy przez API już teraz
Zaangażowanie X	164 800 wyświetleń, ~1 000 polubień

Tweet z ogłoszeniem pochodzi z konta @grok i został natychmiast podany dalej przez @xai — sygnał priorytetu dla zespołu. Grok Imagine był już dostępny w interfejsie Grok, ale dostępność API wersji 1.5 Preview otwiera generowanie obrazów xAI dla deweloperów, którzy chcą zintegrować je w swoich aplikacjach.

Grok Imagine 1.5 Preview wpisuje się w rosnącą pozycję xAI w segmencie multimodalnym: tego samego dnia API głosowe Grok STT i Grok TTS rozszerzają swój zasięg poprzez integrację z Vapi. Ekosystem xAI obejmuje teraz tekst, obraz i głos przez API, oferując pełną alternatywę dla ofert OpenAI i Google w tym segmencie.

🔗 Ogłoszenie @grok

Grok STT i TTS dostępne na Vapi

3 czerwca — API głosowe xAI — Grok STT (rozpoznawanie mowy) i Grok TTS (synteza mowy) — są teraz zintegrowane w Vapi, platformie enterprise voice AI. Uruchomione w kwietniu 2026, te API rozszerzają teraz swój zasięg na deweloperów agentów głosowych dla przedsiębiorstw poprzez Vapi.

Ogłoszenie wygenerowało 433 300 wyświetleń, 1 100 polubień i 272 ponowne udostępnienia — to duże zaangażowanie jak na techniczne ogłoszenie o integracji. Vapi umożliwia tworzenie niestandardowych agentów głosowych; integracja Grok STT/TTS dodaje tam modele głosowe xAI jako konkurencyjną opcję wobec ofert ElevenLabs, Deepgram lub OpenAI.

🔗 Grok na Vapi

NVIDIA CVPR 2026 — skills agentów Physical AI dla AV, robotyki, wizji AI i Alpamayo 2 Super 32B

3 czerwca — Z okazji CVPR 2026 (Denver, 3–7 czerwca) NVIDIA ujawnia nową generację skills agentów Physical AI obejmującą cały cykl badawczy dla pojazdów autonomicznych, robotyki i wizji AI.

Kluczowe ogłoszenia dla pojazdów autonomicznych:

AlpaGym : framework uczenia ze wzmocnieniem (reinforcement learning) w pętli zamkniętej, skalowalny do tysięcy GPU
OmniDreams : generatywny world model warunkowany działaniem
Alpamayo 2 Super : open-source model VLA (Vision-Language-Action) z 32 miliardami parametrów do autonomicznej jazdy poziomu 4

Dla robotyki: Isaac Sim 6.0 z natywnymi konektorami agentów, skills mobilności, uczenie ze wzmocnieniem sim-to-real oraz Cosmos-H-Surgical-Simulator dla robotyki chirurgicznej.

Dla wizji AI: Metropolis skills do generowania syntetycznych anomalii wizualnych oraz skill Defect Image Generation do inspekcji przemysłowej.

Physical AI Dataset NVIDIA przekracza 15 milionów pobrań na Hugging Face. Skills są dostępne na GitHubie i NVIDIA Brev z darmowymi kredytami próbnymi na H100.

🔗 NVIDIA CVPR 2026 Physical AI

NVIDIA Transaction Foundation Models — Revolut, Mastercard, Adyen, Stripe

1 czerwca — NVIDIA pokazuje, jak duże instytucje finansowe zbliżają się do transaction foundation models — modeli bazowych trenowanych na miliardach własnych zdarzeń finansowych.

Instytucja	Podejście	Kluczowy wynik
Revolut	PRAGMA — 24 miliardy zdarzeń, 26 mln użytkowników, 100+ krajów	Jeden model przewyższa modele specjalistyczne (fraud, credit, reco)
Mastercard	Duży model tabelaryczny na miliardach transakcji (NVIDIA NeMo AutoModel)	Zastosowania: fraud, credit, loyalty
Adyen	Modele wdrożone na skalę $1 billion płatności, RL dla konwersji	”0,1% autoryzacji = ogromny wpływ”
Stripe	Kontekst behawioralny transakcji	$112 miliardów blokowanego fraudu/rok, -38% wskaźnika fraudu

NVIDIA udostępnia przykład rozwoju “Build Your Own Transaction Foundation Model” dostępny na AWS SageMaker HyperPod i Nebius AI Cloud.

🔗 NVIDIA Transaction Foundation Models

Anthropic — Partner Network, cyber threats i Claude Code /fork

Claude Partner Network — Services Track i Partner Hub

3 czerwca — Anthropic rozszerza swoją sieć partnerów o dwie nowe struktury: Services Track i Claude Partner Hub.

Services Track to system trzystopniowy oceniający firmy konsultingowe na podstawie ich rzeczywistej praktyki z Claude:

Poziom	Aktywnych certyfikacji	Wdrożonych klientów	Publicznych referencji
Select	10+	2+ (12 miesięcy)	1+
Preferred	100+	15+	3+
Global Premier	1 000+	100+ (3 regiony)	15+

Claude Partner Hub to portal z codzienną aktualizacją postępu każdego partnera oraz konektorem MCP do odpytywania informacji z Hubu bezpośrednio z Claude.

Kluczowe liczby: $100 milionów zainwestowanych w szkolenia partnerów, 40 000+ zgłoszeń od startu w marcu, 10 000+ certyfikowanych konsultantów do tej pory. Wśród zaangażowanych firm: Accenture (30 000 przeszkolonych specjalistów), Deloitte (470 000 osób), KPMG (276 000+), Cognizant, PwC.

🔗 Services Track i Partner Hub

Raport MITRE ATT&CK — rok zagrożeń cybernetycznych aktywowanych przez AI

3 czerwca — Zespół Frontier Red Team Anthropic publikuje analizę 832 zablokowanych kont między marcem 2025 a marcem 2026, zmapowanych na ramy MITRE ATT&CK.

Trzy główne wnioski:

Wskaźnik	Liczba
Przeanalizowane konta	832 (marzec 2025 – marzec 2026)
Użycie AI do pisania malware	560/832 (67,3%)
Aktorzy średniego+ ryzyka na początku okresu	33%
Aktorzy średniego+ ryzyka na końcu okresu	56% (+1,7×)
Rozbita operacja szpiegowska	listopad 2025 — wynik maks. 100/100

Orkiestracja agentowa — model automatycznie łączący kolejne etapy ataku — nie jest jeszcze objęta ramami MITRE ATT&CK. Anthropic rozpoczęło rozmowy z MITRE, aby rozwinąć te ramy, i publikuje te dane w ślad za raportem DBIR 2026 firmy Verizon.

🔗 Raport Anthropic — zagrożenia cyber AI

Claude Code /fork przeprojektowany — agent w tle z dokładnym kontekstem

3 czerwca — Anthropic zmienia zachowanie /fork w Claude Code. Nowy /fork uruchamia agenta w tle, który dziedziczy dokładnie kontekst bieżącej sesji (system prompt, narzędzia, historia, model, cache promptu) i zwraca wynik do sesji źródłowej.

Polecenie	Zachowanie
`/fork` (nowe)	Uruchamia agenta w tle z dokładnym kontekstem + prompt cache → wynik zwracany w sesji
`/branch` (ex-/fork)	Kopiuje transkrypt do nowej sesji sterowanej ręcznie

Ta zmiana wpisuje /fork w ewolucję Claude Code w stronę modelu pracy wieloagentowej.

🔗 Tweet @ClaudeDevs

OpenAI Blueprint — demokratyczne zarządzanie frontier AI

3 czerwca — OpenAI publikuje dokument polityki publicznej (“blueprint”), opisujący, jak Stany Zjednoczone mogą zbudować trwałe federalne ramy do zarządzania systemami frontier AI.

Strategia w 3 filarach:

Ramy krajowe — oprzeć się na wyłaniającym się konsensusie ustaw stanowych (California SB 53, New York RAISE Act, Illinois SB 315)
Wzmocnienie CAISI — uczynić Center for AI Safety and Innovation główną federalną instytucją odpowiedzialną za bezpieczeństwo frontier AI
Plan odporności narodowej — zmobilizować rząd wobec wyzwań bezpieczeństwa narodowego i bezpieczeństwa publicznego stawianych przez frontier AI

Blueprint jest następstwem Executive Order “Promoting Advanced Artificial Intelligence Innovation and Security” opublikowanego dzień wcześniej przez Biały Dom.

🔗 Blueprint OpenAI

Gemini CLI v0.45.0 i kreatywne narzędzia Wan

Gemini CLI v0.45.0

3 czerwca — Google publikuje stabilną wersję v0.45.0 Gemini CLI z przebudową architektury ContextManager (centralnego komponentu zarządzania kontekstem konwersacji), aby poprawić niezawodność i wydajność.

Funkcjonalność	Szczegół
Context Simplification	Duża przebudowa ContextManager
A2A Usage Metadata	Ekspozycja metadanych w protokole Agent-to-Agent
Correctifs Termux	Rozwiązanie nieskończonych pętli ponawiania (środowisko Android)
PTY resize	Naprawa błędów zmiany rozmiaru
Topic updates	Wymuszone sekwencyjne wykonywanie, aby uniknąć konfliktów

🔗 Changelog Gemini CLI

Wan — nowe skills Extract Line Art i Render

3 czerwca — Wan (model wideo i obrazu Alibaba Tongyi Lab) uruchamia dwa nowe narzędzia kreatywne: Extract Line Art (konwersja złożonych wizualizacji w czysty, precyzyjny rysunek liniowy) oraz Render (natychmiastowa transformacja rysunku liniowego w dopracowane wizualizacje). Oba skills są dostępne na create.wan.video/lab/skill. Ogłoszenie wygenerowało prawie 600 000 wyświetleń w kilka godzin.

🔗 Ogłoszenie Wan

GPT-4.1 usunięty z Copilot — zastąpiony przez GPT-5.5

2 czerwca — GitHub oficjalnie wycofuje GPT-4.1 ze wszystkich doświadczeń GitHub Copilot (chat, edycje inline, tryby ask i agent, code completions), ze skutkiem od 1 czerwca 2026. Zalecana alternatywa to GPT-5.5. Administratorzy Enterprise muszą włączyć dostęp do GPT-5.5 poprzez polityki modeli w ustawieniach Copilot. Nie jest wymagana żadna ręczna akcja, aby usunąć GPT-4.1.

🔗 GPT-4.1 wycofany

Copilot Code Review dla Azure Repos (preview techniczne)

2 czerwca — GitHub uruchamia w preview technicznym Copilot code review dla Azure Repos. Użytkownicy mogą poprosić o review Copilot bezpośrednio z pull requestu Azure DevOps — komentarze inline, sugestie usprawnień, wykrywanie problemów. Nie jest wymagana licencja GitHub Copilot dla klientów Azure DevOps. Użycie jest rozliczane w AI credits GitHub, niezależnie od istniejących planów Copilot.

🔗 Copilot Code Review — Azure Repos

Cohere Co/plot — open source narzędzie do wizualizacji dla badań AI

3 czerwca — Cohere Labs publikuje co/plot, open source narzędzie do wizualizacji danych dla badaczy AI. Powstało z konkretnej potrzeby podczas rozwoju Tiny Aya (wielojęzyczny model 70+ języków), co/plot usuwa ograniczenia Matplotlib (pełne ponowne uruchomienia przy każdej zmianie) i Figmy (odłączonej od rzeczywistych danych).

Narzędzie oferuje szybkie prototypowanie z domyślnym i konfigurowalnym stylem, osadzonym w rzeczywistych danych. Opublikowane w duchu open science, jest dostępne pod adresem coplot.vercel.app.

🔗 Cohere co/plot

Krótkie wiadomości

Claude Code v2.1.161 — Nowa wersja: OTEL_RESOURCE_ATTRIBUTES jako etykiety metryk, niezależne parallel tool calls w przypadku częściowej awarii, ulepszony clipboard Linux (wl-copy/xclip/xsel), poprawki /autofix-pr w worktrees git. 🔗 Releases
Anthropic popiera Executive Order AI — Anthropic chwali EO “Promoting Advanced Artificial Intelligence Innovation and Security” i ogłasza współpracę z Białym Domem przy jego wdrożeniu. 🔗 Tweet AnthropicAI
GitHub Copilot w Eclipse — BYOK dostępny dla Business i Enterprise, odświeżony interfejs czatu, skills i pliki promptów, bloki refleksji (Thinking blocks), lepsze wsparcie ABAP. 🔗 Eclipse changelog
NVIDIA Research CVPR — NVIDIA Research prezentuje prace nad zaawansowanym chwytaniem, inteligentną jazdą autonomiczną i trenowaniem agentów na dużą skalę na CVPR 2026. 🔗 NVIDIA Blog
Fun-Realtime-TTS #1 Speech Arena — Fun-Realtime-TTS od Alibaba (zespół TONGYI_SpeechAI) zajmuje pierwsze miejsce w Speech Arena Leaderboard firmy Artificial Analysis (Elo 1 219), wyprzedzając Google Gemini 3.1 Flash TTS i Inworld Realtime TTS-2. 🔗 Tweet @Ali_TongyiLab
Go by Gopuff — asystent zakupowy AI — Start “Go by Gopuff”, osobistego asystenta zakupowego współtworzonego z xAI, napędzanego modelami Grok (tekst, audio, obraz) do ekspresowej dostawy w kilka minut. 🔗 Ogłoszenie xAI
OpenAI teaser “It’s time to fly.” — OpenAI opublikowało przypięty tweet “It’s time to fly.” z osadzonym wideo (68k+ wyświetleń, podany dalej przez @OpenAIDevs). W momencie skanowania nie była dostępna żadna powiązana strona produktu — nadchodzące ogłoszenie nie zostało jeszcze opublikowane. 🔗 Tweet @OpenAI

Co to oznacza

Fala open-source/open-weights nabiera rozpędu. Gemma 4 12B (Apache 2.0, edge, multimodal) i Ideogram 4.0 (pobieralne wagi, swobodny fine-tuning) ucieleśniają trend strukturalny: duże zespoły publikują konkurencyjne modele na liberalnych licencjach, zmniejszając przepaść między ofertami zamkniętymi a alternatywami open-source. Dla deweloperów 3 czerwca oznacza rzadki moment, w którym model wizji i model obrazu z najwyższej półki stają się jednocześnie dostępne bez ograniczeń komercyjnych.

Agenci lokalni/desktopowi stają się nowym polem konkurencji. Perplexity Personal Computer na Windows — działający bezpośrednio na maszynie — odpowiada na jasną potrzebę: firmy chcą autonomii agentów bez wystawiania swoich wrażliwych danych do chmury. Co-Scientist od DeepMind kieruje się do indywidualnych badaczy jako partner do rozumowania naukowego. Przeprojektowany Claude Code /fork jako agent w tle wieloagentowy dopełnia ten obraz: trzy różne ekosystemy (Perplexity, Google, Anthropic) zmierzają ku temu samemu paradygmatowi — agent pracujący równolegle, z bogatym kontekstem, bez stałej ingerencji człowieka.

GitHub Copilot umacnia swoją przewagę w narzędziach dla deweloperów. Czerwcowa fala — usage-based billing GA, Copilot Max, Code Review Medium, CLI JetBrains, session sync, BYOK air-gapped — nie jest zbiorem odrębnych funkcji, lecz spójną platformą popychającą w stronę modelu: jeden agent dostępny ze wszystkich IDE, wszystkich maszyn, z poziomem kontroli (MCP, skills, effort of thinking) dopasowanym do każdego zespołu. Zastąpienie GPT-4.1 przez GPT-5.5 wpisuje się w tę logikę ciągłej modernizacji.

Physical AI i infrastruktura AI zakorzeniają się w gospodarce realnej. Stargate Michigan (1 GW, 2 500 miejsc pracy w związkach zawodowych, $1 miliard prognozowanych wpływów podatkowych) i NVIDIA CVPR 2026 (Alpamayo 2 Super 32B dla autonomicznej jazdy poziomu 4, datasety Physical AI z 15 milionami pobrań) sygnalizują, że AI wychodzi z czysto software’owego rejestru i wchodzi w obszary o wysokiej intensywności fizycznej — data center, pojazdy autonomiczne, robotyka. Instytucje finansowe (Revolut, Mastercard, Adyen, Stripe) podążają tą samą logiką: modele bazowe trenowane na ich własnych danych, a nie ogólne API.