Szukaj

Gemma 4 12B open-source, Ideogram 4.0 open-weights, Perplexity Computer na Windows, Stargate Michigan

ai-powered-markdown-translator

Artykuł przetłumaczony z fr na pl za pomocą gpt-5.4-mini.

Zobacz projekt na GitHubie ↗

3 czerwca 2026 r. skupia falę ważnych ogłoszeń open-source: Google publikuje Gemma 4 12B (multimodalny, edge, Apache 2.0) i uruchamia Co-Scientist, swój wieloagentowy system do badań naukowych. Ideogram udostępnia wagi swojej wersji 4.0. Perplexity wprowadza swojego agenta Personal Computer na Windows. OpenAI inauguruje The Barn, centrum danych 1 GW w Michigan. GitHub Copilot wypuszcza dużą aktualizację dla VS Code, JetBrains, Eclipse i rozliczeń. Po stronie xAI, Grok Imagine 1.5 Preview jest dostępny przez API, a głosy Grok trafiają do Vapi.


Gemma 4 12B — open-source’owy model multimodalny do laptopów

3 czerwca — Google uruchamia Gemma 4 12B, ujednolicony model multimodalny zaprojektowany do działania bezpośrednio na laptopach i urządzeniach brzegowych (edge computing). Jego główną cechą techniczną jest architektura bez oddzielnego enkodera (encoder-free), która upraszcza wdrożenie i ogranicza zależności programowe. Model został wydany na licencji Apache 2.0, co sprawia, że można go swobodnie wykorzystywać do celów komercyjnych i badawczych.

CechaWartość
Parametry12 miliardów
ModalnościTekst + obraz (jednolity)
ArchitekturaBez oddzielnego enkodera (encoder-free)
LicencjaApache 2.0
Docelowy sprzętLaptopy, edge computing
DostępnośćDo pobrania już teraz

Ogłoszenie wygenerowało 620 000 wyświetleń i 5 000 polubień na X, co czyni je jednym z najbardziej angażujących ogłoszeń open-source tygodnia. Udostępniony przez Google DeepMind, Gemma 4 12B wpisuje się w ciągłość wcześniejszych modeli Gemma, ale robi krok naprzód, łącząc wizję i tekst w jednym kompaktowym modelu.

Dla deweloperów model ten otwiera konkretną drogę do multimodalnych aplikacji AI wdrażalnych poza chmurą — na maszynach z konsumenckimi GPU, bez subskrypcji API.

🔗 Tweet premierowy @googlegemma


Google DeepMind Co-Scientist — wieloagentowy partner do badań naukowych

2 czerwca — Google DeepMind prezentuje Co-Scientist, wieloagentowy system oparty na Gemini, zaprojektowany tak, aby działać jak prawdziwy partner w badaniach naukowych. Jego podstawowa zdolność to generowanie, debatowanie i rozwijanie hipotez dotyczących złożonych problemów naukowych w sposób autonomiczny, przy niewielkiej interwencji człowieka.

Co-Scientist nie jest zwykłym narzędziem do streszczania czy wyszukiwania dokumentów. Potrafi proponować oryginalne hipotezy, konfrontować je wewnętrznie między agentami, a następnie je dopracowywać — cykl ideacja-debata-ewolucja, dotąd zarezerwowany dla ludzkich zespołów badawczych. System został oceniony przez światowych ekspertów naukowych na specjalistycznych benchmarkach.

Dostępność: wczesny dostęp dla indywidualnych badaczy przez Hypothesis Generation (lista oczekujących). Trwają współprace ze światowymi ekspertami naukowymi, aby ocenić wydajność w konkretnych dziedzinach.

“We believe AI can be a dedicated research partner to help discover the next breakthrough.”

🇵🇱 Wierzymy, że AI może być dedykowanym partnerem badawczym, pomagającym odkryć kolejny przełom.@GoogleDeepMind

Ogłoszenie wygenerowało 144 000 wyświetleń na X. W kontekście sektora naukowego pod presją przyspieszania cykli odkryć, Co-Scientist bezpośrednio celuje w indywidualnych badaczy, którzy nie mają zasobów dużego zespołu.

🔗 Artykuł deepmind.google


Ideogram 4.0 — do pobrania open-source’owe wagi, możliwy fine-tuning

3 czerwca — Ideogram ogłasza Ideogram 4.0, przedstawiany jako „najlepszy open-source’owy model obrazu na świecie”. Ogłoszenie wyróżnia się radykalnie otwartą filozofią: wagi modelu można pobrać, deweloperzy mogą go dostrajać (fine-tune) na własnych danych i wdrażać na własnej infrastrukturze.

AspektSzczegół
DostępnośćWszystkie plany Ideogram + API (od teraz)
Wagi Hugging Faceideogram-ai/ideogram-4-nf4
Demohuggingface.co/spaces/multimodalart/ideogram4
Fine-tuningDozwolony na danych własnościowych
WdrożenieMożliwa własna infrastruktura
Zaangażowanie X396 800 wyświetleń — duża wiralowość

Ogłoszenie zostało podchwycone i docenione przez Hugging Face jako przykład postępu jakości modeli otwartych. Hasło „Think it. Make it. Own it.” podsumowuje tę filozofię: w przeciwieństwie do zwykle zamkniętych modeli generatywnych obrazu (Midjourney, DALL-E, nowszy Stable Diffusion), Ideogram 4.0 proponuje model pełnej własności dla studiów i deweloperów.

Dla zespołów kreatywnych korzyść jest natychmiastowa: można personalizować styl na własnych danych bez zależności od zewnętrznej usługi i wdrażać go wewnętrznie.

🔗 Ogłoszenie @ideogram_ai


Perplexity Personal Computer trafia na Windows

3 czerwca — Perplexity ogłasza pojawienie się swojego agenta Personal Computer na Windows. Dotąd dostępny wyłącznie na macOS, agent przygotowuje się do podboju systemu operacyjnego Microsoftu.

“Personal Computer is coming to Windows. Personal Computer for Windows runs on your machine and orchestrates across the apps and files you use every day. We’ll roll out first to paying Max and Enterprise Max subscribers on the waitlist.”

🇵🇱 Personal Computer trafia na Windows. Personal Computer dla Windows działa na twojej maszynie i orkiestruje aplikacje oraz pliki, z których korzystasz każdego dnia. Najpierw wdrożymy go dla płatnych subskrybentów Max i Enterprise Max zapisanych na listę oczekujących.@perplexity_ai

Personal Computer działa lokalnie na maszynie użytkownika — orkiestruje codzienne aplikacje i pliki bez pełnego przechodzenia przez chmurę. To hybrydowe podejście lokalne/chmurowe stawia Perplexity w odrębnej kategorii od czysto chmurowych agentów: użytkownik zachowuje kontrolę nad swoimi wrażliwymi danymi.

Wdrożenie rozpocznie się wśród subskrybentów Max i Enterprise Max zapisanych na listę oczekujących przez perplexity.ai/personal-computer.

Perplexity Computer — ponad 400 integracji dla firm

Tego samego dnia Perplexity doprecyzowuje zakres firmowych możliwości agenta: ponad 400 narzędzi połączonych, obejmujących wszystkie typy przedsiębiorstw. Wśród cytowanych integracji znajdują się: Intuit QuickBooks (księgowość), Vercel (wdrażanie webowe), Shopify (e-commerce) i Canva (projektowanie).

To uzupełniające ogłoszenie pozycjonuje Perplexity Computer jako uniwersalnego agenta biznesowego zdolnego integrować się z istniejącymi przepływami pracy bez zastępowania obecnych narzędzi.

🔗 Integracje dla firm


Stargate Michigan — The Barn, centrum danych 1 GW w Saline

1 czerwca — OpenAI i gubernator Gretchen Whitmer inaugurują pierwsze wbicie łopaty pod The Barn, kampus centrum danych o mocy 1 gigawata w Saline, Michigan. Projekt wpisuje się w program Stargate OpenAI — długoterminowy wysiłek budowy infrastruktury dla zaawansowanej AI, we współpracy z Oracle, Related Digital, Walbridge i Blackstone.

MetrykaWartość
Moc1 GW
LokalizacjaSaline, Michigan
Miejsca pracy przy budowie2 500+ (związkowe)
Stałe miejsca pracy450
Miejsca pracy w hrabstwie + pośrednie2 500
Inwestycja w centrum rekreacyjne$10M (Oracle + Related Digital)
Prognozowane wpływy podatkowe$1 miliard (okres dzierżawy)
Kredyty Codex dla studentówdo $45M
Uprawnieni studenci400 000+

Zobowiązania wobec społeczności są jednoznaczne: lokalni mieszkańcy nie poniosą kosztów infrastruktury na swoich rachunkach za prąd. Chłodzenie działa w obiegu zamkniętym, przy zużyciu wody równoważnym zwykłemu biurowcowi.

Program studencki Michigan oferuje do $45 milionów w kredytach Codex dla 400 000 studentów uniwersytetów, community colleges i szkół zawodowych w stanie (18 lat i więcej, rok akademicki 2026-2027).

🔗 Ogłoszenie openai.com


GitHub Copilot w VS Code — wydania z maja (v1.120–v1.123)

3 czerwca — GitHub publikuje miesięczne podsumowanie Copilota dla VS Code, obejmujące wersje v1.120 do v1.123 dostarczane przez cały maj 2026 r. Ta gruntowna aktualizacja konsoliduje kilka miesięcy prac nad agentami, synchronizacją i bezpieczeństwem.

Najważniejsze nowości:

  • Okno Agents (stabilny preview): interfejs agent-first do pracy nad wieloma projektami jednocześnie, z szybką nawigacją i przeglądem zmian
  • Zdalni agenci (preview): uruchamianie na zdalnych maszynach przez SSH lub Dev Tunnels — sesje pozostają aktywne nawet po rozłączeniu klienta
  • Agent Host Protocol (AHP): otwarty protokół do synchronizacji stanu sesji między wieloma klientami
  • Session sync: sesje czatu synchronizują się automatycznie z kontem GitHub, dostępne między maszynami i obszarami roboczymi
  • /chronicle: odpytywanie o przeszłe sesje, generowanie codziennych raportów stand-up, otrzymywanie spersonalizowanych porad produktywności
  • Bezpieczeństwo terminala: hasła, PIN-y i kody weryfikacyjne wpisane w terminalu nigdy nie są przekazywane do modelu językowego
  • Ocena ryzyka poleceń (eksperymentalna): potwierdzenia terminala zawierają poziomy ryzyka generowane przez AI
  • BYOK air-gapped: modele BYOK działają w odizolowanych środowiskach bez dostępu do GitHub
  • Konfigurowalne modele narzędziowe: wybór modeli dla tytułów, podsumowań, sugestii zmiany nazw, wiadomości commit i wykrywania intencji
  • Wbudowana przeglądarka: emulacja urządzeń mobilnych, zaawansowane zrzuty ekranu (viewport, zaznaczony obszar, cała strona), lokalny podgląd HTML
  • Renderowanie Mermaid i YAML front matter: natywnie zintegrowane w podglądzie Markdown
  • Kompresja wyników terminala: gadatliwe wzorce (testy, buildy, linters, Docker, menedżery pakietów) kompresowane automatycznie

Kształtuje się model pracy wieloagentowej: wiele sesji agentów może działać równolegle w oknie Agents, każda z własnym kontekstem i historią synchronizowaną z kontem GitHub.

🔗 Changelog VS Code maj


Copilot Code Review — skills MCP i poziom analizy Medium (public preview)

2 czerwca — GitHub uruchamia w public preview dwie kluczowe funkcje dla Copilot code review, umożliwiające dostosowanie automatycznych przeglądów do kontekstu i złożoności każdego zespołu.

Skills i obsługa MCP: zespoły mogą teraz konfigurować niestandardowe skills agenta (pliki .github/skills/code-review/SKILL.md) oraz połączenia z serwerami MCP, aby wzbogacać każdą recenzję o kontekst wewnętrznych narzędzi — śledzenie issue, dokumentację, katalogi usług, narzędzia incydentowe. Konfiguracja MCP odbywa się w ustawieniach repozytorium → Copilot → MCP servers. Każda istniejąca konfiguracja MCP dla cloud agent jest automatycznie stosowana do recenzji — jednorazowa inwestycja, spójne zachowanie na obu agentach.

Poziom „Medium”: nowy pośredni próg kieruje złożone pull requesty do modelu o wyższym rozumowaniu, zaprojektowanego do wykrywania subtelnych błędów, analizowania logiki bezpieczeństwa i obsługi zmian między usługami. Poziom „Low” pozostaje szybkim i ekonomicznym domyślnym wyborem dla prostych modyfikacji. Medium zużywa więcej AI Credits niż Low, z wyraźnymi sygnałami kosztu w interfejsie. Administratorzy ustawiają poziom per repozytorium.

Workflowy Actions są również konfigurowalne, co pozwala kontrolować środowisko obliczeniowe używane przez Copilota do przeglądów. Dostępne dla Copilot Pro, Pro+, Business i Enterprise.

🔗 Shape Copilot Code Review


Copilot CLI i wzmocnione możliwości agentowe w JetBrains IDEs

2 czerwca — GitHub ogłasza pojawienie się Copilot CLI w JetBrains z selektorem agentów umożliwiającym wybór między trybem Agent (autonomiczny), Ask (szybka pomoc), Custom agents (niestandardowe) lub Plan (wspólne planowanie). Trzy nowe komendy wzbogacają sesje CLI:

  • /remote : sterowanie sesją CLI z github.com lub aplikacji mobilnej
  • /compact : ręczne kompresowanie kontekstu długich sesji
  • /chronicle : analizowanie historii, generowanie raportów stand-up i otrzymywanie spersonalizowanych porad

Panel debugowania agenta (public preview) pokazuje chronologiczny dziennik interakcji — szczególnie przydatny do debugowania niestandardowych agentów i złożonych workflowów wieloagentowych. Wysiłek myślenia modeli rozumujących jest konfigurowalny bezpośrednio z selektora modeli, co pozwala dostosować głębokość analizy do zadania.

Sesje Cloud agent są teraz zintegrowane w ujednoliconym widoku sesji, co pozwala zarządzać wszystkimi sesjami (lokalnymi, CLI, cloud) z jednego miejsca. Edytor dostosowań agenta centralizuje tworzenie i zarządzanie skills, instrukcjami i promptami.

Nowe opcje logowania: Google i Apple dołączają do dostępnych metod sign-in. Wśród funkcji, które przeszły do GA: agent skills, agent hooks, pliki promptów i Anthropic Thinking. Trwa stopniowe wdrażanie, aby Copilot CLI agent stał się domyślnym doświadczeniem w JetBrains.

🔗 Changelog Copilot JetBrains


Rozliczenia i plany GitHub Copilot — usage-based billing GA, Copilot Max

1 czerwca — GitHub aktywuje rozliczanie oparte na użyciu (AI Credits) dla wszystkich planów Copilot od 1 czerwca 2026 r. Każdy plan zawiera miesięczny limit AI Credits; po jego wyczerpaniu użytkownicy mogą kontynuować, konfigurując dodatkowy budżet wydatków z limitami zdefiniowanymi przez administratorów.

Zmiany strukturalne:

  • Copilot code review teraz zużywa minuty GitHub Actions jako uzupełnienie AI Credits — administratorzy mogą skonfigurować domyślny runner dla wszystkich recenzji na poziomie organizacji, bez konfiguracji per repozytorium
  • Budżety per użytkownik w GA: administratorzy organizacji i firm definiują budżety uniwersalne lub specyficzne dla użytkownika, z powiadomieniami e-mail przy zbliżaniu się do limitów
  • Copilot Max: ulepszenie dostępne już dziś dla istniejących subskrybentów Student, Pro i Pro+ — wyższy limit i wyższe limity wydatków dla intensywnych workflowów
  • Nowe zapisy wstrzymane dla Student, Pro, Pro+ i Max — ponowne uruchomienie planowane w najbliższych tygodniach

Ważna uwaga dla zespołów Enterprise: administratorzy będą musieli aktywować alternatywny model GPT-5.5 przez polityki modeli, aby zastąpić wycofywany GPT-4.1. Po aktywacji GPT-5.5 pojawia się w selektorze modeli Copilot Chat w VS Code i na github.com.

🔗 Aktualizacja rozliczeń i planów


Grok Imagine 1.5 Preview dostępny w API xAI

3 czerwca — xAI ogłasza dostępność Grok Imagine 1.5 Preview w API xAI, dostępnego pod adresem x.ai/api/imagine. To ważna aktualizacja możliwości generowania obrazów w Grok — wersja 1.5 Preview zastępuje Grok Imagine i stanowi nową generację modelu obrazu xAI, dostępnego bezpośrednio przez API dla deweloperów.

AspektSzczegół
ModelGrok Imagine 1.5 Preview
DostępAPI xAI — x.ai/api/imagine
StatusPreview (brak oficjalnej strony produktu w momencie skanowania)
DostępnośćDeweloperzy przez API już teraz
Zaangażowanie X164 800 wyświetleń, ~1 000 polubień

Tweet z ogłoszeniem pochodzi z konta @grok i został natychmiast podany dalej przez @xai — sygnał priorytetu dla zespołu. Grok Imagine był już dostępny w interfejsie Grok, ale dostępność API wersji 1.5 Preview otwiera generowanie obrazów xAI dla deweloperów, którzy chcą zintegrować je w swoich aplikacjach.

Grok Imagine 1.5 Preview wpisuje się w rosnącą pozycję xAI w segmencie multimodalnym: tego samego dnia API głosowe Grok STT i Grok TTS rozszerzają swój zasięg poprzez integrację z Vapi. Ekosystem xAI obejmuje teraz tekst, obraz i głos przez API, oferując pełną alternatywę dla ofert OpenAI i Google w tym segmencie.

🔗 Ogłoszenie @grok


Grok STT i TTS dostępne na Vapi

3 czerwca — API głosowe xAI — Grok STT (rozpoznawanie mowy) i Grok TTS (synteza mowy) — są teraz zintegrowane w Vapi, platformie enterprise voice AI. Uruchomione w kwietniu 2026, te API rozszerzają teraz swój zasięg na deweloperów agentów głosowych dla przedsiębiorstw poprzez Vapi.

Ogłoszenie wygenerowało 433 300 wyświetleń, 1 100 polubień i 272 ponowne udostępnienia — to duże zaangażowanie jak na techniczne ogłoszenie o integracji. Vapi umożliwia tworzenie niestandardowych agentów głosowych; integracja Grok STT/TTS dodaje tam modele głosowe xAI jako konkurencyjną opcję wobec ofert ElevenLabs, Deepgram lub OpenAI.

🔗 Grok na Vapi


NVIDIA CVPR 2026 — skills agentów Physical AI dla AV, robotyki, wizji AI i Alpamayo 2 Super 32B

3 czerwca — Z okazji CVPR 2026 (Denver, 3–7 czerwca) NVIDIA ujawnia nową generację skills agentów Physical AI obejmującą cały cykl badawczy dla pojazdów autonomicznych, robotyki i wizji AI.

Kluczowe ogłoszenia dla pojazdów autonomicznych:

  • AlpaGym : framework uczenia ze wzmocnieniem (reinforcement learning) w pętli zamkniętej, skalowalny do tysięcy GPU
  • OmniDreams : generatywny world model warunkowany działaniem
  • Alpamayo 2 Super : open-source model VLA (Vision-Language-Action) z 32 miliardami parametrów do autonomicznej jazdy poziomu 4

Dla robotyki: Isaac Sim 6.0 z natywnymi konektorami agentów, skills mobilności, uczenie ze wzmocnieniem sim-to-real oraz Cosmos-H-Surgical-Simulator dla robotyki chirurgicznej.

Dla wizji AI: Metropolis skills do generowania syntetycznych anomalii wizualnych oraz skill Defect Image Generation do inspekcji przemysłowej.

Physical AI Dataset NVIDIA przekracza 15 milionów pobrań na Hugging Face. Skills są dostępne na GitHubie i NVIDIA Brev z darmowymi kredytami próbnymi na H100.

🔗 NVIDIA CVPR 2026 Physical AI


NVIDIA Transaction Foundation Models — Revolut, Mastercard, Adyen, Stripe

1 czerwca — NVIDIA pokazuje, jak duże instytucje finansowe zbliżają się do transaction foundation models — modeli bazowych trenowanych na miliardach własnych zdarzeń finansowych.

InstytucjaPodejścieKluczowy wynik
RevolutPRAGMA — 24 miliardy zdarzeń, 26 mln użytkowników, 100+ krajówJeden model przewyższa modele specjalistyczne (fraud, credit, reco)
MastercardDuży model tabelaryczny na miliardach transakcji (NVIDIA NeMo AutoModel)Zastosowania: fraud, credit, loyalty
AdyenModele wdrożone na skalę $1 billion płatności, RL dla konwersji”0,1% autoryzacji = ogromny wpływ”
StripeKontekst behawioralny transakcji$112 miliardów blokowanego fraudu/rok, -38% wskaźnika fraudu

NVIDIA udostępnia przykład rozwoju “Build Your Own Transaction Foundation Model” dostępny na AWS SageMaker HyperPod i Nebius AI Cloud.

🔗 NVIDIA Transaction Foundation Models


Anthropic — Partner Network, cyber threats i Claude Code /fork

Claude Partner Network — Services Track i Partner Hub

3 czerwca — Anthropic rozszerza swoją sieć partnerów o dwie nowe struktury: Services Track i Claude Partner Hub.

Services Track to system trzystopniowy oceniający firmy konsultingowe na podstawie ich rzeczywistej praktyki z Claude:

PoziomAktywnych certyfikacjiWdrożonych klientówPublicznych referencji
Select10+2+ (12 miesięcy)1+
Preferred100+15+3+
Global Premier1 000+100+ (3 regiony)15+

Claude Partner Hub to portal z codzienną aktualizacją postępu każdego partnera oraz konektorem MCP do odpytywania informacji z Hubu bezpośrednio z Claude.

Kluczowe liczby: $100 milionów zainwestowanych w szkolenia partnerów, 40 000+ zgłoszeń od startu w marcu, 10 000+ certyfikowanych konsultantów do tej pory. Wśród zaangażowanych firm: Accenture (30 000 przeszkolonych specjalistów), Deloitte (470 000 osób), KPMG (276 000+), Cognizant, PwC.

🔗 Services Track i Partner Hub


Raport MITRE ATT&CK — rok zagrożeń cybernetycznych aktywowanych przez AI

3 czerwca — Zespół Frontier Red Team Anthropic publikuje analizę 832 zablokowanych kont między marcem 2025 a marcem 2026, zmapowanych na ramy MITRE ATT&CK.

Trzy główne wnioski:

WskaźnikLiczba
Przeanalizowane konta832 (marzec 2025 – marzec 2026)
Użycie AI do pisania malware560/832 (67,3%)
Aktorzy średniego+ ryzyka na początku okresu33%
Aktorzy średniego+ ryzyka na końcu okresu56% (+1,7×)
Rozbita operacja szpiegowskalistopad 2025 — wynik maks. 100/100

Orkiestracja agentowa — model automatycznie łączący kolejne etapy ataku — nie jest jeszcze objęta ramami MITRE ATT&CK. Anthropic rozpoczęło rozmowy z MITRE, aby rozwinąć te ramy, i publikuje te dane w ślad za raportem DBIR 2026 firmy Verizon.

🔗 Raport Anthropic — zagrożenia cyber AI


Claude Code /fork przeprojektowany — agent w tle z dokładnym kontekstem

3 czerwca — Anthropic zmienia zachowanie /fork w Claude Code. Nowy /fork uruchamia agenta w tle, który dziedziczy dokładnie kontekst bieżącej sesji (system prompt, narzędzia, historia, model, cache promptu) i zwraca wynik do sesji źródłowej.

PolecenieZachowanie
/fork (nowe)Uruchamia agenta w tle z dokładnym kontekstem + prompt cache → wynik zwracany w sesji
/branch (ex-/fork)Kopiuje transkrypt do nowej sesji sterowanej ręcznie

Ta zmiana wpisuje /fork w ewolucję Claude Code w stronę modelu pracy wieloagentowej.

🔗 Tweet @ClaudeDevs


OpenAI Blueprint — demokratyczne zarządzanie frontier AI

3 czerwca — OpenAI publikuje dokument polityki publicznej (“blueprint”), opisujący, jak Stany Zjednoczone mogą zbudować trwałe federalne ramy do zarządzania systemami frontier AI.

Strategia w 3 filarach:

  1. Ramy krajowe — oprzeć się na wyłaniającym się konsensusie ustaw stanowych (California SB 53, New York RAISE Act, Illinois SB 315)
  2. Wzmocnienie CAISI — uczynić Center for AI Safety and Innovation główną federalną instytucją odpowiedzialną za bezpieczeństwo frontier AI
  3. Plan odporności narodowej — zmobilizować rząd wobec wyzwań bezpieczeństwa narodowego i bezpieczeństwa publicznego stawianych przez frontier AI

Blueprint jest następstwem Executive Order “Promoting Advanced Artificial Intelligence Innovation and Security” opublikowanego dzień wcześniej przez Biały Dom.

🔗 Blueprint OpenAI


Gemini CLI v0.45.0 i kreatywne narzędzia Wan

Gemini CLI v0.45.0

3 czerwca — Google publikuje stabilną wersję v0.45.0 Gemini CLI z przebudową architektury ContextManager (centralnego komponentu zarządzania kontekstem konwersacji), aby poprawić niezawodność i wydajność.

FunkcjonalnośćSzczegół
Context SimplificationDuża przebudowa ContextManager
A2A Usage MetadataEkspozycja metadanych w protokole Agent-to-Agent
Correctifs TermuxRozwiązanie nieskończonych pętli ponawiania (środowisko Android)
PTY resizeNaprawa błędów zmiany rozmiaru
Topic updatesWymuszone sekwencyjne wykonywanie, aby uniknąć konfliktów

🔗 Changelog Gemini CLI


Wan — nowe skills Extract Line Art i Render

3 czerwca — Wan (model wideo i obrazu Alibaba Tongyi Lab) uruchamia dwa nowe narzędzia kreatywne: Extract Line Art (konwersja złożonych wizualizacji w czysty, precyzyjny rysunek liniowy) oraz Render (natychmiastowa transformacja rysunku liniowego w dopracowane wizualizacje). Oba skills są dostępne na create.wan.video/lab/skill. Ogłoszenie wygenerowało prawie 600 000 wyświetleń w kilka godzin.

🔗 Ogłoszenie Wan


GPT-4.1 usunięty z Copilot — zastąpiony przez GPT-5.5

2 czerwca — GitHub oficjalnie wycofuje GPT-4.1 ze wszystkich doświadczeń GitHub Copilot (chat, edycje inline, tryby ask i agent, code completions), ze skutkiem od 1 czerwca 2026. Zalecana alternatywa to GPT-5.5. Administratorzy Enterprise muszą włączyć dostęp do GPT-5.5 poprzez polityki modeli w ustawieniach Copilot. Nie jest wymagana żadna ręczna akcja, aby usunąć GPT-4.1.

🔗 GPT-4.1 wycofany


Copilot Code Review dla Azure Repos (preview techniczne)

2 czerwca — GitHub uruchamia w preview technicznym Copilot code review dla Azure Repos. Użytkownicy mogą poprosić o review Copilot bezpośrednio z pull requestu Azure DevOps — komentarze inline, sugestie usprawnień, wykrywanie problemów. Nie jest wymagana licencja GitHub Copilot dla klientów Azure DevOps. Użycie jest rozliczane w AI credits GitHub, niezależnie od istniejących planów Copilot.

🔗 Copilot Code Review — Azure Repos


Cohere Co/plot — open source narzędzie do wizualizacji dla badań AI

3 czerwca — Cohere Labs publikuje co/plot, open source narzędzie do wizualizacji danych dla badaczy AI. Powstało z konkretnej potrzeby podczas rozwoju Tiny Aya (wielojęzyczny model 70+ języków), co/plot usuwa ograniczenia Matplotlib (pełne ponowne uruchomienia przy każdej zmianie) i Figmy (odłączonej od rzeczywistych danych).

Narzędzie oferuje szybkie prototypowanie z domyślnym i konfigurowalnym stylem, osadzonym w rzeczywistych danych. Opublikowane w duchu open science, jest dostępne pod adresem coplot.vercel.app.

🔗 Cohere co/plot


Krótkie wiadomości

  • Claude Code v2.1.161 — Nowa wersja: OTEL_RESOURCE_ATTRIBUTES jako etykiety metryk, niezależne parallel tool calls w przypadku częściowej awarii, ulepszony clipboard Linux (wl-copy/xclip/xsel), poprawki /autofix-pr w worktrees git. 🔗 Releases

  • Anthropic popiera Executive Order AI — Anthropic chwali EO “Promoting Advanced Artificial Intelligence Innovation and Security” i ogłasza współpracę z Białym Domem przy jego wdrożeniu. 🔗 Tweet AnthropicAI

  • GitHub Copilot w Eclipse — BYOK dostępny dla Business i Enterprise, odświeżony interfejs czatu, skills i pliki promptów, bloki refleksji (Thinking blocks), lepsze wsparcie ABAP. 🔗 Eclipse changelog

  • NVIDIA Research CVPR — NVIDIA Research prezentuje prace nad zaawansowanym chwytaniem, inteligentną jazdą autonomiczną i trenowaniem agentów na dużą skalę na CVPR 2026. 🔗 NVIDIA Blog

  • Fun-Realtime-TTS #1 Speech Arena — Fun-Realtime-TTS od Alibaba (zespół TONGYI_SpeechAI) zajmuje pierwsze miejsce w Speech Arena Leaderboard firmy Artificial Analysis (Elo 1 219), wyprzedzając Google Gemini 3.1 Flash TTS i Inworld Realtime TTS-2. 🔗 Tweet @Ali_TongyiLab

  • Go by Gopuff — asystent zakupowy AI — Start “Go by Gopuff”, osobistego asystenta zakupowego współtworzonego z xAI, napędzanego modelami Grok (tekst, audio, obraz) do ekspresowej dostawy w kilka minut. 🔗 Ogłoszenie xAI

  • OpenAI teaser “It’s time to fly.” — OpenAI opublikowało przypięty tweet “It’s time to fly.” z osadzonym wideo (68k+ wyświetleń, podany dalej przez @OpenAIDevs). W momencie skanowania nie była dostępna żadna powiązana strona produktu — nadchodzące ogłoszenie nie zostało jeszcze opublikowane. 🔗 Tweet @OpenAI


Co to oznacza

Fala open-source/open-weights nabiera rozpędu. Gemma 4 12B (Apache 2.0, edge, multimodal) i Ideogram 4.0 (pobieralne wagi, swobodny fine-tuning) ucieleśniają trend strukturalny: duże zespoły publikują konkurencyjne modele na liberalnych licencjach, zmniejszając przepaść między ofertami zamkniętymi a alternatywami open-source. Dla deweloperów 3 czerwca oznacza rzadki moment, w którym model wizji i model obrazu z najwyższej półki stają się jednocześnie dostępne bez ograniczeń komercyjnych.

Agenci lokalni/desktopowi stają się nowym polem konkurencji. Perplexity Personal Computer na Windows — działający bezpośrednio na maszynie — odpowiada na jasną potrzebę: firmy chcą autonomii agentów bez wystawiania swoich wrażliwych danych do chmury. Co-Scientist od DeepMind kieruje się do indywidualnych badaczy jako partner do rozumowania naukowego. Przeprojektowany Claude Code /fork jako agent w tle wieloagentowy dopełnia ten obraz: trzy różne ekosystemy (Perplexity, Google, Anthropic) zmierzają ku temu samemu paradygmatowi — agent pracujący równolegle, z bogatym kontekstem, bez stałej ingerencji człowieka.

GitHub Copilot umacnia swoją przewagę w narzędziach dla deweloperów. Czerwcowa fala — usage-based billing GA, Copilot Max, Code Review Medium, CLI JetBrains, session sync, BYOK air-gapped — nie jest zbiorem odrębnych funkcji, lecz spójną platformą popychającą w stronę modelu: jeden agent dostępny ze wszystkich IDE, wszystkich maszyn, z poziomem kontroli (MCP, skills, effort of thinking) dopasowanym do każdego zespołu. Zastąpienie GPT-4.1 przez GPT-5.5 wpisuje się w tę logikę ciągłej modernizacji.

Physical AI i infrastruktura AI zakorzeniają się w gospodarce realnej. Stargate Michigan (1 GW, 2 500 miejsc pracy w związkach zawodowych, $1 miliard prognozowanych wpływów podatkowych) i NVIDIA CVPR 2026 (Alpamayo 2 Super 32B dla autonomicznej jazdy poziomu 4, datasety Physical AI z 15 milionami pobrań) sygnalizują, że AI wychodzi z czysto software’owego rejestru i wchodzi w obszary o wysokiej intensywności fizycznej — data center, pojazdy autonomiczne, robotyka. Instytucje finansowe (Revolut, Mastercard, Adyen, Stripe) podążają tą samą logiką: modele bazowe trenowane na ich własnych danych, a nie ogólne API.


Źródła