Claude Opus 4.7 dostępny, Codex przechodzi na computer use w macOS, OpenAI uruchamia GPT-Rosalind

16 kwietnia to dzień wyjątkowo intensywny: Anthropic uruchamia Claude Opus 4.7 w ogólnej dostępności z istotnymi usprawnieniami w benchmarkach agentowych, OpenAI jednocześnie prezentuje Codex z computer use na macOS oraz GPT-Rosalind, swój pierwszy model frontier poświęcony naukom przyrodniczym. Google wzbogaca aplikację Gemini o generowanie spersonalizowanych obrazów dzięki Nano Banana 2 i Google Photos, Perplexity uruchamia Personal Computer dla Mac, a GitHub otwiera komendę gh skill do międzyagentowego zarządzania umiejętnościami (skills).

Claude Opus 4.7 : dostępność ogólna

16 kwietnia — Anthropic uruchamia Claude Opus 4.7 w ogólnym dostępie (generally available). Model zastępuje Opus 4.6, oferując zauważalny postęp w długich zadaniach, autonomii agentowej i precyzji podążania za instrukcjami.

“Opus 4.7 handles complex, long-running tasks with rigor and consistency, pays precise attention to instructions, and devises ways to verify its own outputs before reporting back.”

🇵🇱 Opus 4.7 radzi sobie z długimi i złożonymi zadaniami z rygorem i konsekwencją, zwraca szczególną uwagę na instrukcje i projektuje sposoby weryfikowania własnych wyników przed ich przekazaniem. — @claudeai na X

Główne możliwości

Funkcjonalność	Opis
Wizja wysokiej rozdzielczości	Obrazy do 2 576 px na dłuższym boku (~3,75 megapiksela), 3× wyższa rozdzielczość niż wcześniej
Poziom wysiłku xhigh	Poziom pośredni między `high` i `max`, precyzyjna kontrola rozumowania/opóźnienia
Pamięć systemu plików	Lepsza trwałość między sesjami pracy
Wzmocniona autonomia	Weryfikacja wyników przed wysłaniem, ścisłe przestrzeganie instrukcji
Jakość profesjonalna	Wyższej jakości interfejsy, slajdy i dokumenty

Benchmarks

Benchmark	Opus 4.7	Opus 4.6	GPT-5.4	Gemini 3.1 Pro
SWE-bench Pro	64.3%	53.4%	57.7%	54.2%
SWE-bench Verified	87.6%	80.8%	—	80.6%
Terminal-Bench 2.0	69.4%	65.4%	75.1%*	68.5%
Rozumowanie multidyscyplinarne (z narzędziami)	54.7%	53.3%	58.7%	51.4%
Użycie narzędzi na dużą skalę – MCP-Atlas	77.3%	75.8%	68.1%	73.9%
Computer use – OSWorld Verified	78.0%	72.7%	75.0%	—
Zaawansowane rozumowanie – GPQA Diamond	94.2%	91.3%	94.4%	94.3%
Rozumowanie wizualne (z narzędziami)	91.0%	84.7%	—	—

* GPT-5.4 : wynik zgłoszony automatycznie z określonym harness

Najbardziej wyraźne zyski dotyczą SWE-bench Pro (+10,9 punktu), rozumowania wizualnego (+6,3 punktu z narzędziami) oraz MCP-Atlas (+1,5 punktu) — czyli benchmarków bezpośrednio powiązanych z zastosowaniami agentowymi.

Cennik i dostępność

Opus 4.7 jest dostępny już dziś poprzez API Claude (identyfikator claude-opus-4-7), Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry oraz we wszystkich produktach Claude. Cena pozostaje taka sama jak w Opus 4.6: $5 za milion tokenów wejściowych,$ 25 za wyjściowe.

Dwa ważne aspekty dla deweloperów migrujących z Opus 4.6: nowy tokenizer może generować od 1,0× do 1,35× więcej tokenów w zależności od typu treści, a Opus 4.7 tworzy więcej tokenów rozumowania przy wysokich poziomach wysiłku. Anthropic opublikował dedykowany przewodnik migracji.

Opus 4.7 jest również pierwszym modelem korzystającym z nowych zabezpieczeń cyberbezpieczeństwa projektu Glasswing. Program weryfikacji cyber (Cyber Verification Program) jest otwarty dla uprawnionych specjalistów.

🔗 Oficjalny artykuł Anthropic

Claude Code v2.1.111 : /ultrareview, auto mode Max, xhigh domyślnie

16 kwietnia — Wersja 2.1.111 Claude Code towarzyszy premierze Opus 4.7, wprowadzając kilka istotnych dodatków.

Funkcjonalność	Opis
`/ultrareview`	Dogłębny code review w trybie równoległym multi-agentowym. Bez argumentu = bieżąca gałąź; `/ultrareview <PR#>` dla PR na GitHubie. 3 darmowe próby dla Pro i Max.
Auto mode dla Max	Auto mode (Claude samodzielnie decyduje o uprawnieniach) jest teraz dostępny dla subskrybentów Max z Opus 4.7.
Wysiłek xhigh domyślnie	Domyślny poziom wysiłku zostaje podniesiony do `xhigh` dla wszystkich planów.
`/less-permission-prompts`	Skanuje transkrypty i proponuje priorytetyzowaną listę uprawnień dla `.claude/settings.json`.
PowerShell tool	Obsługa PowerShell (stopniowe wdrażanie). Można włączyć przez `CLAUDE_CODE_USE_POWERSHELL_TOOL=1` na Linux/macOS.
Nazwane plany	Plany nazywane według początkowego promptu (`fix-auth-race-snug-otter.md`) zamiast losowo.
Komendy read-only	`cd`, `ls`, `cat` i komendy read-only nie wywołują już prośby o uprawnienia.

Wersja 2.1.112 (wdrożona wieczorem 16 kwietnia) natychmiast naprawia błąd „claude-opus-4-7 is temporarily unavailable” pojawiający się w trybie auto.

Boris Cherny (@bcherny) ogłosił również zwiększenie limitów rate dla wszystkich subskrybentów, aby zrekompensować wyższy wolumen tokenów rozumowania w Opus 4.7. Błąd rate limiting przy zapytaniach o długim kontekście został naprawiony, a limity 5-godzinne i tygodniowe zresetowane.

GitHub Copilot również integruje Opus 4.7 w GA już dziś, z stopniowym wdrażaniem w VS Code, Visual Studio, CLI, GitHub Mobile i pozostałych klientach Copilot. Dla Copilot Pro+ zastąpi on Opus 4.5 i 4.6 w nadchodzących tygodniach. Obowiązuje promocyjny cennik (mnożnik 7.5×) do 30 kwietnia.

🔗 CHANGELOG Claude Code 🔗 Tweet @bcherny 🔗 Claude Opus 4.7 w GitHub Copilot

OpenAI : Codex przechodzi na computer use, GPT-Rosalind i cyber ecosystem

Codex — computer use na macOS, wbudowana przeglądarka, trwała pamięć

16 kwietnia — OpenAI publikuje ważną aktualizację Codex, używanego przez ponad 3 miliony deweloperów tygodniowo. Ta wersja rozszerza Codex daleko poza kod.

“Codex can now use your computer alongside you, seeing, clicking, and typing with its own cursor.”

🇵🇱 Codex może teraz używać twojego komputera razem z tobą, widzieć, klikać i pisać własnym kursorem. — @OpenAI

Computer use (używanie komputera) — Kilka agentów Codex może pracować jednocześnie na macOS bez zakłócania działania otwartych aplikacji. Przypadki użycia: iterowanie nad interfejsami (frontend), testowanie aplikacji, praca w aplikacjach bez wystawionego API. Dostępność w UE/UK wkrótce.

Funkcjonalność	Opis
Wbudowana przeglądarka	Bezpośrednie komentowanie stron internetowych, aby instruować agenta w zakresie rozwoju frontend i gier
Generowanie obrazów	Integracja `gpt-image-1.5` do tworzenia assetów i makiet w tym samym przepływie pracy
Ponad 90 nowych pluginów	Atlassian Rovo, CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon, Remotion, Render, Superpowers…
Trwała pamięć	Preferencje, poprawki i kontekst gromadzone między sesjami
Zaplanowane automatyzacje	Zadania cykliczne na dni lub tygodnie, z automatycznym wybudzaniem
SSH devboxes	Połączenie z zdalnymi serwerami (alpha)
Wiele kart terminala	Kilka terminali jednocześnie

🔗 Oficjalny artykuł OpenAI

GPT-Rosalind — pierwszy frontier model nauk przyrodniczych

16 kwietnia — OpenAI uruchamia GPT-Rosalind, swój pierwszy model frontier poświęcony biologii, odkrywaniu leków (drug discovery) i medycynie translacyjnej. Nazwa jest hołdem dla Rosalind Franklin, której prace pomogły ujawnić strukturę DNA.

GPT-Rosalind jest zoptymalizowany pod syntezę literatury naukowej, generowanie hipotez, planowanie eksperymentów i analizę danych biologicznych.

Benchmark	Wynik
BixBench (rzeczywista bioinformatyka)	Najlepsza wydajność spośród modeli z opublikowanymi wynikami
LABBench2	Przewyższa GPT-5.4 w 6 zadaniach z 11
Predykcja sekwencji RNA (Dyno Therapeutics)	Top 95. percentyla ludzkich ekspertów (best-of-10)
Generowanie sekwencji RNA (Dyno Therapeutics)	~84. percentyl ludzkich ekspertów (best-of-10)

Darmowy plugin Life Sciences dla Codex jest dostępny na GitHubie: zapewnia dostęp do ponad 50 publicznych baz danych biologicznych (genomika człowieka, proteomika, biochemia). GPT-Rosalind jest dostępny w zapowiedzi badawczej (research preview) dla kwalifikujących się klientów Enterprise w USA poprzez program Trusted Access. Użycie nie zużywa istniejących kredytów podczas preview.

Ogłoszeni partnerzy: Amgen, Novo Nordisk, Moderna, Thermo Fisher Scientific, NVIDIA, Allen Institute, UCSF School of Pharmacy, Los Alamos National Laboratory.

🔗 Oficjalny artykuł OpenAI

Cyber defense ecosystem — $10M kredytów API

16 kwietnia — OpenAI przeznacza 10 milionów dolarów w kredytach API na wsparcie zespołów bezpieczeństwa open source i badaczy podatności. Pierwsi beneficjenci: Socket, Semgrep, Calif, Trail of Bits.

Program Trusted Access for Cyber rozszerza się na nowe organizacje: Bank of America, BlackRock, BNY, Citi, Cisco, CrowdStrike, Goldman Sachs, JPMorgan Chase, Morgan Stanley, NVIDIA, Oracle, Zscaler. GPT-5.4-Cyber jest również udostępniany amerykańskiemu Centrum ds. Standardów i Innowacji w AI (CAISI) oraz brytyjskiemu Instytutowi Bezpieczeństwa AI (UK AISI) do niezależnych ocen.

🔗 Oficjalny artykuł OpenAI

Gemini : spersonalizowane obrazy z Nano Banana 2 i Google Photos

16 kwietnia — Google prezentuje nowe funkcje generowania spersonalizowanych obrazów w aplikacji Gemini, napędzane przez Personal Intelligence (inteligencję osobistą), Nano Banana 2 i bibliotekę Google Photos użytkownika.

Dotąd stworzenie naprawdę osobistego obrazu w Gemini wymagało szczegółowych promptów (prompts) i ręcznie przesłanych zdjęć. Personal Intelligence daje teraz Gemini domyślne rozumienie kontekstu użytkownika: wystarczą proste polecenia, takie jak „Narysuj mój wymarzony dom” albo „Stwórz obraz moich rzeczy niezbędnych na bezludną wyspę”, a Gemini automatycznie uzupełnia szczegóły z połączonych aplikacji Google.

Po połączeniu biblioteki Google Photos użytkownik może generować obrazy, na których pojawia się on sam i jego bliscy. Dzięki etykietom już utworzonym w Photos (ludzie, zwierzęta domowe) wystarczy prośba w stylu: „Stwórz obraz w claymationie mnie i mojej rodziny podczas naszej ulubionej aktywności”.

Funkcjonalność	Szczegół
Dostępne style	Akwarela, węgiel, farba olejna, claymation
Przycisk Źródła	Pokazuje, które zdjęcie zostało wybrane automatycznie
Doprecyzowanie	Wskazanie, co było nieprawidłowe, wybór innego zdjęcia referencyjnego
Prywatność	Gemini NIE trenuje na prywatnej bibliotece Google Photos
Opt-in	Połączenie aplikacji Google pozostaje opcjonalne i konfigurowalne

Dostępność: wdrażanie trwa kilka dni dla subskrybentów Google AI Plus, Pro i Ultra, na razie tylko w USA. Wkrótce pojawi się w Gemini w Chrome desktop i dla większej liczby użytkowników.

🔗 Artykuł blog.google

Gemini CLI v0.38.0

14 kwietnia — Wersja v0.38.0 Gemini CLI jest dostępna z kilkoma usprawnieniami doświadczenia w linii poleceń.

Funkcjonalność	Szczegół
Chapters (strumień narracyjny)	Grupuje interakcje w „rozdziały” zgodnie z intencją i użyciem narzędzi
Context Compression Service	Inteligentnie destyluje historię dla długich sesji
Trwałe zatwierdzenia	Zatwierdzanie uruchamiania narzędzi bez ponownego pytania za każdym razem
Poprawka migotania UI	Naprawa niestabilnego renderowania poprzez tryb Terminal Buffer

🔗 Changelog Gemini CLI

Perplexity Personal Computer : lokalny agent na Mac

16 kwietnia — Perplexity uruchamia Personal Computer, funkcję lokalnego agenta zintegrowaną z aplikacją Mac.

“Today we’re releasing Personal Computer. Personal Computer integrates with the Perplexity Mac App for secure orchestration across your local files, native apps, and browser. We’re rolling this out to all Perplexity Max subscribers and everyone on the waitlist starting today.”

🇵🇱 Dziś uruchamiamy Personal Computer. Personal Computer integruje się z aplikacją Perplexity na Macu, zapewniając bezpieczną orkiestrację twoich lokalnych plików, natywnych aplikacji i przeglądarki. Udostępniamy to wszystkim subskrybentom Perplexity Max oraz osobom z listy oczekujących od dziś. — @perplexity_ai na X

Agent bezpiecznie orkiestruje lokalne pliki, natywne aplikacje i przeglądarkę, bez korzystania z chmury w przypadku danych wrażliwych. Wdrażanie odbywa się stopniowo: najpierw subskrybenci Perplexity Max, a następnie lista oczekujących.

To wyraźny zwrot dla Perplexity: po zbudowaniu reputacji na wyszukiwarce internetowej opartej na AI, firma teraz mierzy się z lokalną orkiestracją na komputerze stacjonarnym — obszarem już eksplorowanym przez Apple Intelligence i Operator od OpenAI.

🔗 perplexity.ai/computer

GitHub : komenda `gh skill` w publicznym preview

16 kwietnia — GitHub uruchamia gh skill w publicznym preview w GitHub CLI (v2.90.0+). Ta nowa komenda pozwala instalować, odkrywać, aktualizować i publikować agent skills — przenośne zestawy instrukcji, skryptów i zasobów, które konfigurują zachowanie agentów AI.

gh skill install github/awesome-copilot documentation-writer
gh skill install github/awesome-copilot doc-writer --agent claude-code
gh skill search mcp-apps
gh skill update --all

Skills działają na wielu platformach: GitHub Copilot, Claude Code, Cursor, Codex, Gemini CLI i Antigravity. Komenda zawiera mechanizmy bezpieczeństwa łańcucha dostaw (supply chain): przypinanie przez tag lub SHA commita, niezmienne release’y oraz śledzenie pochodzenia poprzez frontmatter. Otwarta specyfikacja jest dostępna na agentskills.io.

🔗 Changelog GitHub

Qwen3.6-35B-A3B open-source i Meta Muse Spark Safety

Qwen3.6-35B-A3B : open-source MoE na licencji Apache 2.0

15–16 kwietnia — Alibaba ogłasza udostępnienie jako open-source Qwen3.6-35B-A3B, sparsowego modelu MoE (mixture-of-experts) z 35 miliardami parametrów łącznie, ale tylko 3 miliardami aktywnych parametrów na inferencję.

Aspekt	Szczegół
Architektura	MoE sparse: 35B parametrów, 3B aktywnych
Licencja	Apache 2.0
Multimodalność	Natywna (wizja + rozumowanie)
Tryby	Thinking / non-thinking

Benchmark	Qwen3.6-35B-A3B
SWE-bench Verified	73,4
SWE-bench Multilingual	67,2
AIME 2026	92,7
GPQA	86,0

Dostępny na Hugging Face / ModelScope, Qwen Studio oraz przez API Alibaba Cloud (qwen3.6-flash). Natywnie kompatybilny z Claude Code, Qwen Code i OpenClaw. 🔗 Oficjalny blog Qwen

Meta Muse Spark: opublikowano raport bezpieczeństwa

15 kwietnia — Meta AI publikuje raport bezpieczeństwa i gotowości (Safety & Preparedness Report) dla Muse Spark, swojego pierwszego multimodalnego modelu bez open-weights opracowanego przez Meta Superintelligence Labs.

Aspekt	Szczegół
Użyte ramy	Meta Advanced AI Scaling Framework
Oceniane ryzyka	Chemiczne/biologiczne, cyberbezpieczeństwo, utrata kontroli
Wynik chem/bio	Ryzyko początkowo „potencjalnie wysokie” → zatwierdzone środki zaradcze → akceptowalne ryzyko resztkowe

Raport ten stanowi istotny krok: Meta stosuje teraz formalną procedurę oceny bezpieczeństwa przed wdrożeniem dla swoich zaawansowanych modeli, podobną do podejść Anthropic i OpenAI.

🔗 Raport bezpieczeństwa Muse Spark

Media i różne aktualizacje

Runway publikuje dwie aktualizacje 16 kwietnia: Seedance 2.0 przechodzi na rendering 1080p, a Runway Characters integruje teraz animację za pomocą skryptu tekstowego (wybierz postać, napisz skrypt, wygeneruj). NVIDIA jest obecna na NAB Show 2026, aby demonstrować AI w produkcji mediów, zaangażowaniu fanów i monetyzacji treści.

Grok iOS otrzymuje animowany wskaźnik wizualny w trybie głosowym: małe kółko pokazuje teraz, że Grok aktywnie słucha.

🔗 Runway — Seedance 2.0 w 1080p 🔗 Runway Characters — animacja za pomocą skryptu

Co to oznacza

16 kwietnia pokazuje dzień agentowej konwergencji na wszystkich frontach: Claude Opus 4.7, Codex z computer use, Perplexity Personal Computer i gh skill dzielą tę samą logikę — agentów zdolnych działać na lokalnym systemie (pliki, aplikacje, komputer), koordynowanych między wieloma platformami za pośrednictwem przenośnych standardów.

Polecenie gh skill jest szczególnie istotne: poprzez ustanowienie otwartej specyfikacji instalacji międzyagentowej (Copilot, Claude Code, Cursor, Codex, Gemini CLI), GitHub tworzy wspólną infrastrukturę, która mogłaby stać się npm install świata agentowego.

GPT-Rosalind oznacza z kolei ewolucję w strategii OpenAI: po modelach ogólnego przeznaczenia firma zaczyna tworzyć wyspecjalizowane modele frontier dla poszczególnych dziedzin — podejście przypominające dywersyfikację wertykalną, którą Google DeepMind badał już w biologii obliczeniowej.

Źródła

Ten dokument został przetłumaczony z wersji fr na język pl przy użyciu modelu gpt-5.4-mini. Aby uzyskać więcej informacji o procesie tłumaczenia, odwiedź https://gitlab.com/jls42/ai-powered-markdown-translator

Claude Opus 4.7 dostępny, Codex przechodzi na computer use w macOS, OpenAI uruchamia GPT-Rosalind

Claude Opus 4.7 : dostępność ogólna

Główne możliwości

Benchmarks

Cennik i dostępność

Claude Code v2.1.111 : /ultrareview, auto mode Max, xhigh domyślnie

OpenAI : Codex przechodzi na computer use, GPT-Rosalind i cyber ecosystem

Codex — computer use na macOS, wbudowana przeglądarka, trwała pamięć

GPT-Rosalind — pierwszy frontier model nauk przyrodniczych

Cyber defense ecosystem — $10M kredytów API

Gemini : spersonalizowane obrazy z Nano Banana 2 i Google Photos

Gemini CLI v0.38.0

Perplexity Personal Computer : lokalny agent na Mac

GitHub : komenda gh skill w publicznym preview

Qwen3.6-35B-A3B open-source i Meta Muse Spark Safety

Qwen3.6-35B-A3B : open-source MoE na licencji Apache 2.0

Meta Muse Spark: opublikowano raport bezpieczeństwa

Media i różne aktualizacje

Co to oznacza

Źródła

GitHub : komenda `gh skill` w publicznym preview