16 kwietnia to dzień wyjątkowo intensywny: Anthropic uruchamia Claude Opus 4.7 w ogólnej dostępności z istotnymi usprawnieniami w benchmarkach agentowych, OpenAI jednocześnie prezentuje Codex z computer use na macOS oraz GPT-Rosalind, swój pierwszy model frontier poświęcony naukom przyrodniczym. Google wzbogaca aplikację Gemini o generowanie spersonalizowanych obrazów dzięki Nano Banana 2 i Google Photos, Perplexity uruchamia Personal Computer dla Mac, a GitHub otwiera komendę gh skill do międzyagentowego zarządzania umiejętnościami (skills).
Claude Opus 4.7 : dostępność ogólna
16 kwietnia — Anthropic uruchamia Claude Opus 4.7 w ogólnym dostępie (generally available). Model zastępuje Opus 4.6, oferując zauważalny postęp w długich zadaniach, autonomii agentowej i precyzji podążania za instrukcjami.
“Opus 4.7 handles complex, long-running tasks with rigor and consistency, pays precise attention to instructions, and devises ways to verify its own outputs before reporting back.”
🇵🇱 Opus 4.7 radzi sobie z długimi i złożonymi zadaniami z rygorem i konsekwencją, zwraca szczególną uwagę na instrukcje i projektuje sposoby weryfikowania własnych wyników przed ich przekazaniem. — @claudeai na X
Główne możliwości
| Funkcjonalność | Opis |
|---|---|
| Wizja wysokiej rozdzielczości | Obrazy do 2 576 px na dłuższym boku (~3,75 megapiksela), 3× wyższa rozdzielczość niż wcześniej |
| Poziom wysiłku xhigh | Poziom pośredni między high i max, precyzyjna kontrola rozumowania/opóźnienia |
| Pamięć systemu plików | Lepsza trwałość między sesjami pracy |
| Wzmocniona autonomia | Weryfikacja wyników przed wysłaniem, ścisłe przestrzeganie instrukcji |
| Jakość profesjonalna | Wyższej jakości interfejsy, slajdy i dokumenty |
Benchmarks
| Benchmark | Opus 4.7 | Opus 4.6 | GPT-5.4 | Gemini 3.1 Pro |
|---|---|---|---|---|
| SWE-bench Pro | 64.3% | 53.4% | 57.7% | 54.2% |
| SWE-bench Verified | 87.6% | 80.8% | — | 80.6% |
| Terminal-Bench 2.0 | 69.4% | 65.4% | 75.1%* | 68.5% |
| Rozumowanie multidyscyplinarne (z narzędziami) | 54.7% | 53.3% | 58.7% | 51.4% |
| Użycie narzędzi na dużą skalę – MCP-Atlas | 77.3% | 75.8% | 68.1% | 73.9% |
| Computer use – OSWorld Verified | 78.0% | 72.7% | 75.0% | — |
| Zaawansowane rozumowanie – GPQA Diamond | 94.2% | 91.3% | 94.4% | 94.3% |
| Rozumowanie wizualne (z narzędziami) | 91.0% | 84.7% | — | — |
* GPT-5.4 : wynik zgłoszony automatycznie z określonym harness
Najbardziej wyraźne zyski dotyczą SWE-bench Pro (+10,9 punktu), rozumowania wizualnego (+6,3 punktu z narzędziami) oraz MCP-Atlas (+1,5 punktu) — czyli benchmarków bezpośrednio powiązanych z zastosowaniami agentowymi.
Cennik i dostępność
Opus 4.7 jest dostępny już dziś poprzez API Claude (identyfikator claude-opus-4-7), Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry oraz we wszystkich produktach Claude. Cena pozostaje taka sama jak w Opus 4.6: 25 za wyjściowe.
Dwa ważne aspekty dla deweloperów migrujących z Opus 4.6: nowy tokenizer może generować od 1,0× do 1,35× więcej tokenów w zależności od typu treści, a Opus 4.7 tworzy więcej tokenów rozumowania przy wysokich poziomach wysiłku. Anthropic opublikował dedykowany przewodnik migracji.
Opus 4.7 jest również pierwszym modelem korzystającym z nowych zabezpieczeń cyberbezpieczeństwa projektu Glasswing. Program weryfikacji cyber (Cyber Verification Program) jest otwarty dla uprawnionych specjalistów.
Claude Code v2.1.111 : /ultrareview, auto mode Max, xhigh domyślnie
16 kwietnia — Wersja 2.1.111 Claude Code towarzyszy premierze Opus 4.7, wprowadzając kilka istotnych dodatków.
| Funkcjonalność | Opis |
|---|---|
/ultrareview | Dogłębny code review w trybie równoległym multi-agentowym. Bez argumentu = bieżąca gałąź; /ultrareview <PR#> dla PR na GitHubie. 3 darmowe próby dla Pro i Max. |
| Auto mode dla Max | Auto mode (Claude samodzielnie decyduje o uprawnieniach) jest teraz dostępny dla subskrybentów Max z Opus 4.7. |
| Wysiłek xhigh domyślnie | Domyślny poziom wysiłku zostaje podniesiony do xhigh dla wszystkich planów. |
/less-permission-prompts | Skanuje transkrypty i proponuje priorytetyzowaną listę uprawnień dla .claude/settings.json. |
| PowerShell tool | Obsługa PowerShell (stopniowe wdrażanie). Można włączyć przez CLAUDE_CODE_USE_POWERSHELL_TOOL=1 na Linux/macOS. |
| Nazwane plany | Plany nazywane według początkowego promptu (fix-auth-race-snug-otter.md) zamiast losowo. |
| Komendy read-only | cd, ls, cat i komendy read-only nie wywołują już prośby o uprawnienia. |
Wersja 2.1.112 (wdrożona wieczorem 16 kwietnia) natychmiast naprawia błąd „claude-opus-4-7 is temporarily unavailable” pojawiający się w trybie auto.
Boris Cherny (@bcherny) ogłosił również zwiększenie limitów rate dla wszystkich subskrybentów, aby zrekompensować wyższy wolumen tokenów rozumowania w Opus 4.7. Błąd rate limiting przy zapytaniach o długim kontekście został naprawiony, a limity 5-godzinne i tygodniowe zresetowane.
GitHub Copilot również integruje Opus 4.7 w GA już dziś, z stopniowym wdrażaniem w VS Code, Visual Studio, CLI, GitHub Mobile i pozostałych klientach Copilot. Dla Copilot Pro+ zastąpi on Opus 4.5 i 4.6 w nadchodzących tygodniach. Obowiązuje promocyjny cennik (mnożnik 7.5×) do 30 kwietnia.
🔗 CHANGELOG Claude Code 🔗 Tweet @bcherny 🔗 Claude Opus 4.7 w GitHub Copilot
OpenAI : Codex przechodzi na computer use, GPT-Rosalind i cyber ecosystem
Codex — computer use na macOS, wbudowana przeglądarka, trwała pamięć
16 kwietnia — OpenAI publikuje ważną aktualizację Codex, używanego przez ponad 3 miliony deweloperów tygodniowo. Ta wersja rozszerza Codex daleko poza kod.
“Codex can now use your computer alongside you, seeing, clicking, and typing with its own cursor.”
🇵🇱 Codex może teraz używać twojego komputera razem z tobą, widzieć, klikać i pisać własnym kursorem. — @OpenAI
Computer use (używanie komputera) — Kilka agentów Codex może pracować jednocześnie na macOS bez zakłócania działania otwartych aplikacji. Przypadki użycia: iterowanie nad interfejsami (frontend), testowanie aplikacji, praca w aplikacjach bez wystawionego API. Dostępność w UE/UK wkrótce.
| Funkcjonalność | Opis |
|---|---|
| Wbudowana przeglądarka | Bezpośrednie komentowanie stron internetowych, aby instruować agenta w zakresie rozwoju frontend i gier |
| Generowanie obrazów | Integracja gpt-image-1.5 do tworzenia assetów i makiet w tym samym przepływie pracy |
| Ponad 90 nowych pluginów | Atlassian Rovo, CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon, Remotion, Render, Superpowers… |
| Trwała pamięć | Preferencje, poprawki i kontekst gromadzone między sesjami |
| Zaplanowane automatyzacje | Zadania cykliczne na dni lub tygodnie, z automatycznym wybudzaniem |
| SSH devboxes | Połączenie z zdalnymi serwerami (alpha) |
| Wiele kart terminala | Kilka terminali jednocześnie |
GPT-Rosalind — pierwszy frontier model nauk przyrodniczych
16 kwietnia — OpenAI uruchamia GPT-Rosalind, swój pierwszy model frontier poświęcony biologii, odkrywaniu leków (drug discovery) i medycynie translacyjnej. Nazwa jest hołdem dla Rosalind Franklin, której prace pomogły ujawnić strukturę DNA.
GPT-Rosalind jest zoptymalizowany pod syntezę literatury naukowej, generowanie hipotez, planowanie eksperymentów i analizę danych biologicznych.
| Benchmark | Wynik |
|---|---|
| BixBench (rzeczywista bioinformatyka) | Najlepsza wydajność spośród modeli z opublikowanymi wynikami |
| LABBench2 | Przewyższa GPT-5.4 w 6 zadaniach z 11 |
| Predykcja sekwencji RNA (Dyno Therapeutics) | Top 95. percentyla ludzkich ekspertów (best-of-10) |
| Generowanie sekwencji RNA (Dyno Therapeutics) | ~84. percentyl ludzkich ekspertów (best-of-10) |
Darmowy plugin Life Sciences dla Codex jest dostępny na GitHubie: zapewnia dostęp do ponad 50 publicznych baz danych biologicznych (genomika człowieka, proteomika, biochemia). GPT-Rosalind jest dostępny w zapowiedzi badawczej (research preview) dla kwalifikujących się klientów Enterprise w USA poprzez program Trusted Access. Użycie nie zużywa istniejących kredytów podczas preview.
Ogłoszeni partnerzy: Amgen, Novo Nordisk, Moderna, Thermo Fisher Scientific, NVIDIA, Allen Institute, UCSF School of Pharmacy, Los Alamos National Laboratory.
Cyber defense ecosystem — $10M kredytów API
16 kwietnia — OpenAI przeznacza 10 milionów dolarów w kredytach API na wsparcie zespołów bezpieczeństwa open source i badaczy podatności. Pierwsi beneficjenci: Socket, Semgrep, Calif, Trail of Bits.
Program Trusted Access for Cyber rozszerza się na nowe organizacje: Bank of America, BlackRock, BNY, Citi, Cisco, CrowdStrike, Goldman Sachs, JPMorgan Chase, Morgan Stanley, NVIDIA, Oracle, Zscaler. GPT-5.4-Cyber jest również udostępniany amerykańskiemu Centrum ds. Standardów i Innowacji w AI (CAISI) oraz brytyjskiemu Instytutowi Bezpieczeństwa AI (UK AISI) do niezależnych ocen.
Gemini : spersonalizowane obrazy z Nano Banana 2 i Google Photos
16 kwietnia — Google prezentuje nowe funkcje generowania spersonalizowanych obrazów w aplikacji Gemini, napędzane przez Personal Intelligence (inteligencję osobistą), Nano Banana 2 i bibliotekę Google Photos użytkownika.
Dotąd stworzenie naprawdę osobistego obrazu w Gemini wymagało szczegółowych promptów (prompts) i ręcznie przesłanych zdjęć. Personal Intelligence daje teraz Gemini domyślne rozumienie kontekstu użytkownika: wystarczą proste polecenia, takie jak „Narysuj mój wymarzony dom” albo „Stwórz obraz moich rzeczy niezbędnych na bezludną wyspę”, a Gemini automatycznie uzupełnia szczegóły z połączonych aplikacji Google.
Po połączeniu biblioteki Google Photos użytkownik może generować obrazy, na których pojawia się on sam i jego bliscy. Dzięki etykietom już utworzonym w Photos (ludzie, zwierzęta domowe) wystarczy prośba w stylu: „Stwórz obraz w claymationie mnie i mojej rodziny podczas naszej ulubionej aktywności”.
| Funkcjonalność | Szczegół |
|---|---|
| Dostępne style | Akwarela, węgiel, farba olejna, claymation |
| Przycisk Źródła | Pokazuje, które zdjęcie zostało wybrane automatycznie |
| Doprecyzowanie | Wskazanie, co było nieprawidłowe, wybór innego zdjęcia referencyjnego |
| Prywatność | Gemini NIE trenuje na prywatnej bibliotece Google Photos |
| Opt-in | Połączenie aplikacji Google pozostaje opcjonalne i konfigurowalne |
Dostępność: wdrażanie trwa kilka dni dla subskrybentów Google AI Plus, Pro i Ultra, na razie tylko w USA. Wkrótce pojawi się w Gemini w Chrome desktop i dla większej liczby użytkowników.
Gemini CLI v0.38.0
14 kwietnia — Wersja v0.38.0 Gemini CLI jest dostępna z kilkoma usprawnieniami doświadczenia w linii poleceń.
| Funkcjonalność | Szczegół |
|---|---|
| Chapters (strumień narracyjny) | Grupuje interakcje w „rozdziały” zgodnie z intencją i użyciem narzędzi |
| Context Compression Service | Inteligentnie destyluje historię dla długich sesji |
| Trwałe zatwierdzenia | Zatwierdzanie uruchamiania narzędzi bez ponownego pytania za każdym razem |
| Poprawka migotania UI | Naprawa niestabilnego renderowania poprzez tryb Terminal Buffer |
Perplexity Personal Computer : lokalny agent na Mac
16 kwietnia — Perplexity uruchamia Personal Computer, funkcję lokalnego agenta zintegrowaną z aplikacją Mac.
“Today we’re releasing Personal Computer. Personal Computer integrates with the Perplexity Mac App for secure orchestration across your local files, native apps, and browser. We’re rolling this out to all Perplexity Max subscribers and everyone on the waitlist starting today.”
🇵🇱 Dziś uruchamiamy Personal Computer. Personal Computer integruje się z aplikacją Perplexity na Macu, zapewniając bezpieczną orkiestrację twoich lokalnych plików, natywnych aplikacji i przeglądarki. Udostępniamy to wszystkim subskrybentom Perplexity Max oraz osobom z listy oczekujących od dziś. — @perplexity_ai na X
Agent bezpiecznie orkiestruje lokalne pliki, natywne aplikacje i przeglądarkę, bez korzystania z chmury w przypadku danych wrażliwych. Wdrażanie odbywa się stopniowo: najpierw subskrybenci Perplexity Max, a następnie lista oczekujących.
To wyraźny zwrot dla Perplexity: po zbudowaniu reputacji na wyszukiwarce internetowej opartej na AI, firma teraz mierzy się z lokalną orkiestracją na komputerze stacjonarnym — obszarem już eksplorowanym przez Apple Intelligence i Operator od OpenAI.
GitHub : komenda gh skill w publicznym preview
16 kwietnia — GitHub uruchamia gh skill w publicznym preview w GitHub CLI (v2.90.0+). Ta nowa komenda pozwala instalować, odkrywać, aktualizować i publikować agent skills — przenośne zestawy instrukcji, skryptów i zasobów, które konfigurują zachowanie agentów AI.
gh skill install github/awesome-copilot documentation-writer
gh skill install github/awesome-copilot doc-writer --agent claude-code
gh skill search mcp-apps
gh skill update --all
Skills działają na wielu platformach: GitHub Copilot, Claude Code, Cursor, Codex, Gemini CLI i Antigravity. Komenda zawiera mechanizmy bezpieczeństwa łańcucha dostaw (supply chain): przypinanie przez tag lub SHA commita, niezmienne release’y oraz śledzenie pochodzenia poprzez frontmatter. Otwarta specyfikacja jest dostępna na agentskills.io.
Qwen3.6-35B-A3B open-source i Meta Muse Spark Safety
Qwen3.6-35B-A3B : open-source MoE na licencji Apache 2.0
15–16 kwietnia — Alibaba ogłasza udostępnienie jako open-source Qwen3.6-35B-A3B, sparsowego modelu MoE (mixture-of-experts) z 35 miliardami parametrów łącznie, ale tylko 3 miliardami aktywnych parametrów na inferencję.
| Aspekt | Szczegół |
|---|---|
| Architektura | MoE sparse: 35B parametrów, 3B aktywnych |
| Licencja | Apache 2.0 |
| Multimodalność | Natywna (wizja + rozumowanie) |
| Tryby | Thinking / non-thinking |
| Benchmark | Qwen3.6-35B-A3B |
|---|---|
| SWE-bench Verified | 73,4 |
| SWE-bench Multilingual | 67,2 |
| AIME 2026 | 92,7 |
| GPQA | 86,0 |
Dostępny na Hugging Face / ModelScope, Qwen Studio oraz przez API Alibaba Cloud (qwen3.6-flash). Natywnie kompatybilny z Claude Code, Qwen Code i OpenClaw. 🔗 Oficjalny blog Qwen
Meta Muse Spark: opublikowano raport bezpieczeństwa
15 kwietnia — Meta AI publikuje raport bezpieczeństwa i gotowości (Safety & Preparedness Report) dla Muse Spark, swojego pierwszego multimodalnego modelu bez open-weights opracowanego przez Meta Superintelligence Labs.
| Aspekt | Szczegół |
|---|---|
| Użyte ramy | Meta Advanced AI Scaling Framework |
| Oceniane ryzyka | Chemiczne/biologiczne, cyberbezpieczeństwo, utrata kontroli |
| Wynik chem/bio | Ryzyko początkowo „potencjalnie wysokie” → zatwierdzone środki zaradcze → akceptowalne ryzyko resztkowe |
Raport ten stanowi istotny krok: Meta stosuje teraz formalną procedurę oceny bezpieczeństwa przed wdrożeniem dla swoich zaawansowanych modeli, podobną do podejść Anthropic i OpenAI.
🔗 Raport bezpieczeństwa Muse Spark
Media i różne aktualizacje
Runway publikuje dwie aktualizacje 16 kwietnia: Seedance 2.0 przechodzi na rendering 1080p, a Runway Characters integruje teraz animację za pomocą skryptu tekstowego (wybierz postać, napisz skrypt, wygeneruj). NVIDIA jest obecna na NAB Show 2026, aby demonstrować AI w produkcji mediów, zaangażowaniu fanów i monetyzacji treści.
Grok iOS otrzymuje animowany wskaźnik wizualny w trybie głosowym: małe kółko pokazuje teraz, że Grok aktywnie słucha.
🔗 Runway — Seedance 2.0 w 1080p 🔗 Runway Characters — animacja za pomocą skryptu
Co to oznacza
16 kwietnia pokazuje dzień agentowej konwergencji na wszystkich frontach: Claude Opus 4.7, Codex z computer use, Perplexity Personal Computer i gh skill dzielą tę samą logikę — agentów zdolnych działać na lokalnym systemie (pliki, aplikacje, komputer), koordynowanych między wieloma platformami za pośrednictwem przenośnych standardów.
Polecenie gh skill jest szczególnie istotne: poprzez ustanowienie otwartej specyfikacji instalacji międzyagentowej (Copilot, Claude Code, Cursor, Codex, Gemini CLI), GitHub tworzy wspólną infrastrukturę, która mogłaby stać się npm install świata agentowego.
GPT-Rosalind oznacza z kolei ewolucję w strategii OpenAI: po modelach ogólnego przeznaczenia firma zaczyna tworzyć wyspecjalizowane modele frontier dla poszczególnych dziedzin — podejście przypominające dywersyfikację wertykalną, którą Google DeepMind badał już w biologii obliczeniowej.
Źródła
- Anthropic — Wprowadzenie Claude Opus 4.7
- Tweet @claudeai — Opus 4.7 GA
- Tweet @bcherny — Zwiększone limity rate
- CHANGELOG Claude Code (GitHub)
- GitHub Changelog — Claude Opus 4.7 w Copilot
- OpenAI — Codex do prawie wszystkiego
- OpenAI — Wprowadzenie GPT-Rosalind
- OpenAI — Przyspieszanie ekosystemu obrony przed cyberzagrożeniami
- blog.google — Gemini: spersonalizowane obrazy z Nano Banana 2
- Changelog Gemini CLI
- perplexity.ai/computer
- Tweet @perplexity_ai — Personal Computer
- GitHub Changelog — gh skill
- Blog Qwen — Qwen3.6-35B-A3B
- Meta AI — Raport bezpieczeństwa Muse Spark
- Tweet @runwayml — Seedance 2.0 1080p
- Tweet @runwayml — Runway Characters script
Ten dokument został przetłumaczony z wersji fr na język pl przy użyciu modelu gpt-5.4-mini. Aby uzyskać więcej informacji o procesie tłumaczenia, odwiedź https://gitlab.com/jls42/ai-powered-markdown-translator