Szukaj

Claude Opus 4.7 dostępny, Codex przechodzi na computer use w macOS, OpenAI uruchamia GPT-Rosalind

Claude Opus 4.7 dostępny, Codex przechodzi na computer use w macOS, OpenAI uruchamia GPT-Rosalind

16 kwietnia to dzień wyjątkowo intensywny: Anthropic uruchamia Claude Opus 4.7 w ogólnej dostępności z istotnymi usprawnieniami w benchmarkach agentowych, OpenAI jednocześnie prezentuje Codex z computer use na macOS oraz GPT-Rosalind, swój pierwszy model frontier poświęcony naukom przyrodniczym. Google wzbogaca aplikację Gemini o generowanie spersonalizowanych obrazów dzięki Nano Banana 2 i Google Photos, Perplexity uruchamia Personal Computer dla Mac, a GitHub otwiera komendę gh skill do międzyagentowego zarządzania umiejętnościami (skills).


Claude Opus 4.7 : dostępność ogólna

16 kwietnia — Anthropic uruchamia Claude Opus 4.7 w ogólnym dostępie (generally available). Model zastępuje Opus 4.6, oferując zauważalny postęp w długich zadaniach, autonomii agentowej i precyzji podążania za instrukcjami.

“Opus 4.7 handles complex, long-running tasks with rigor and consistency, pays precise attention to instructions, and devises ways to verify its own outputs before reporting back.”

🇵🇱 Opus 4.7 radzi sobie z długimi i złożonymi zadaniami z rygorem i konsekwencją, zwraca szczególną uwagę na instrukcje i projektuje sposoby weryfikowania własnych wyników przed ich przekazaniem.@claudeai na X

Główne możliwości

FunkcjonalnośćOpis
Wizja wysokiej rozdzielczościObrazy do 2 576 px na dłuższym boku (~3,75 megapiksela), 3× wyższa rozdzielczość niż wcześniej
Poziom wysiłku xhighPoziom pośredni między high i max, precyzyjna kontrola rozumowania/opóźnienia
Pamięć systemu plikówLepsza trwałość między sesjami pracy
Wzmocniona autonomiaWeryfikacja wyników przed wysłaniem, ścisłe przestrzeganie instrukcji
Jakość profesjonalnaWyższej jakości interfejsy, slajdy i dokumenty

Benchmarks

BenchmarkOpus 4.7Opus 4.6GPT-5.4Gemini 3.1 Pro
SWE-bench Pro64.3%53.4%57.7%54.2%
SWE-bench Verified87.6%80.8%80.6%
Terminal-Bench 2.069.4%65.4%75.1%*68.5%
Rozumowanie multidyscyplinarne (z narzędziami)54.7%53.3%58.7%51.4%
Użycie narzędzi na dużą skalę – MCP-Atlas77.3%75.8%68.1%73.9%
Computer use – OSWorld Verified78.0%72.7%75.0%
Zaawansowane rozumowanie – GPQA Diamond94.2%91.3%94.4%94.3%
Rozumowanie wizualne (z narzędziami)91.0%84.7%

* GPT-5.4 : wynik zgłoszony automatycznie z określonym harness

Najbardziej wyraźne zyski dotyczą SWE-bench Pro (+10,9 punktu), rozumowania wizualnego (+6,3 punktu z narzędziami) oraz MCP-Atlas (+1,5 punktu) — czyli benchmarków bezpośrednio powiązanych z zastosowaniami agentowymi.

Cennik i dostępność

Opus 4.7 jest dostępny już dziś poprzez API Claude (identyfikator claude-opus-4-7), Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry oraz we wszystkich produktach Claude. Cena pozostaje taka sama jak w Opus 4.6: 5zamiliontokenoˊwwejsˊciowych,5 za milion tokenów wejściowych, 25 za wyjściowe.

Dwa ważne aspekty dla deweloperów migrujących z Opus 4.6: nowy tokenizer może generować od 1,0× do 1,35× więcej tokenów w zależności od typu treści, a Opus 4.7 tworzy więcej tokenów rozumowania przy wysokich poziomach wysiłku. Anthropic opublikował dedykowany przewodnik migracji.

Opus 4.7 jest również pierwszym modelem korzystającym z nowych zabezpieczeń cyberbezpieczeństwa projektu Glasswing. Program weryfikacji cyber (Cyber Verification Program) jest otwarty dla uprawnionych specjalistów.

🔗 Oficjalny artykuł Anthropic


Claude Code v2.1.111 : /ultrareview, auto mode Max, xhigh domyślnie

16 kwietnia — Wersja 2.1.111 Claude Code towarzyszy premierze Opus 4.7, wprowadzając kilka istotnych dodatków.

FunkcjonalnośćOpis
/ultrareviewDogłębny code review w trybie równoległym multi-agentowym. Bez argumentu = bieżąca gałąź; /ultrareview <PR#> dla PR na GitHubie. 3 darmowe próby dla Pro i Max.
Auto mode dla MaxAuto mode (Claude samodzielnie decyduje o uprawnieniach) jest teraz dostępny dla subskrybentów Max z Opus 4.7.
Wysiłek xhigh domyślnieDomyślny poziom wysiłku zostaje podniesiony do xhigh dla wszystkich planów.
/less-permission-promptsSkanuje transkrypty i proponuje priorytetyzowaną listę uprawnień dla .claude/settings.json.
PowerShell toolObsługa PowerShell (stopniowe wdrażanie). Można włączyć przez CLAUDE_CODE_USE_POWERSHELL_TOOL=1 na Linux/macOS.
Nazwane planyPlany nazywane według początkowego promptu (fix-auth-race-snug-otter.md) zamiast losowo.
Komendy read-onlycd, ls, cat i komendy read-only nie wywołują już prośby o uprawnienia.

Wersja 2.1.112 (wdrożona wieczorem 16 kwietnia) natychmiast naprawia błąd „claude-opus-4-7 is temporarily unavailable” pojawiający się w trybie auto.

Boris Cherny (@bcherny) ogłosił również zwiększenie limitów rate dla wszystkich subskrybentów, aby zrekompensować wyższy wolumen tokenów rozumowania w Opus 4.7. Błąd rate limiting przy zapytaniach o długim kontekście został naprawiony, a limity 5-godzinne i tygodniowe zresetowane.

GitHub Copilot również integruje Opus 4.7 w GA już dziś, z stopniowym wdrażaniem w VS Code, Visual Studio, CLI, GitHub Mobile i pozostałych klientach Copilot. Dla Copilot Pro+ zastąpi on Opus 4.5 i 4.6 w nadchodzących tygodniach. Obowiązuje promocyjny cennik (mnożnik 7.5×) do 30 kwietnia.

🔗 CHANGELOG Claude Code 🔗 Tweet @bcherny 🔗 Claude Opus 4.7 w GitHub Copilot


OpenAI : Codex przechodzi na computer use, GPT-Rosalind i cyber ecosystem

Codex — computer use na macOS, wbudowana przeglądarka, trwała pamięć

16 kwietnia — OpenAI publikuje ważną aktualizację Codex, używanego przez ponad 3 miliony deweloperów tygodniowo. Ta wersja rozszerza Codex daleko poza kod.

“Codex can now use your computer alongside you, seeing, clicking, and typing with its own cursor.”

🇵🇱 Codex może teraz używać twojego komputera razem z tobą, widzieć, klikać i pisać własnym kursorem.@OpenAI

Computer use (używanie komputera) — Kilka agentów Codex może pracować jednocześnie na macOS bez zakłócania działania otwartych aplikacji. Przypadki użycia: iterowanie nad interfejsami (frontend), testowanie aplikacji, praca w aplikacjach bez wystawionego API. Dostępność w UE/UK wkrótce.

FunkcjonalnośćOpis
Wbudowana przeglądarkaBezpośrednie komentowanie stron internetowych, aby instruować agenta w zakresie rozwoju frontend i gier
Generowanie obrazówIntegracja gpt-image-1.5 do tworzenia assetów i makiet w tym samym przepływie pracy
Ponad 90 nowych pluginówAtlassian Rovo, CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon, Remotion, Render, Superpowers…
Trwała pamięćPreferencje, poprawki i kontekst gromadzone między sesjami
Zaplanowane automatyzacjeZadania cykliczne na dni lub tygodnie, z automatycznym wybudzaniem
SSH devboxesPołączenie z zdalnymi serwerami (alpha)
Wiele kart terminalaKilka terminali jednocześnie

🔗 Oficjalny artykuł OpenAI

GPT-Rosalind — pierwszy frontier model nauk przyrodniczych

16 kwietnia — OpenAI uruchamia GPT-Rosalind, swój pierwszy model frontier poświęcony biologii, odkrywaniu leków (drug discovery) i medycynie translacyjnej. Nazwa jest hołdem dla Rosalind Franklin, której prace pomogły ujawnić strukturę DNA.

GPT-Rosalind jest zoptymalizowany pod syntezę literatury naukowej, generowanie hipotez, planowanie eksperymentów i analizę danych biologicznych.

BenchmarkWynik
BixBench (rzeczywista bioinformatyka)Najlepsza wydajność spośród modeli z opublikowanymi wynikami
LABBench2Przewyższa GPT-5.4 w 6 zadaniach z 11
Predykcja sekwencji RNA (Dyno Therapeutics)Top 95. percentyla ludzkich ekspertów (best-of-10)
Generowanie sekwencji RNA (Dyno Therapeutics)~84. percentyl ludzkich ekspertów (best-of-10)

Darmowy plugin Life Sciences dla Codex jest dostępny na GitHubie: zapewnia dostęp do ponad 50 publicznych baz danych biologicznych (genomika człowieka, proteomika, biochemia). GPT-Rosalind jest dostępny w zapowiedzi badawczej (research preview) dla kwalifikujących się klientów Enterprise w USA poprzez program Trusted Access. Użycie nie zużywa istniejących kredytów podczas preview.

Ogłoszeni partnerzy: Amgen, Novo Nordisk, Moderna, Thermo Fisher Scientific, NVIDIA, Allen Institute, UCSF School of Pharmacy, Los Alamos National Laboratory.

🔗 Oficjalny artykuł OpenAI

Cyber defense ecosystem — $10M kredytów API

16 kwietnia — OpenAI przeznacza 10 milionów dolarów w kredytach API na wsparcie zespołów bezpieczeństwa open source i badaczy podatności. Pierwsi beneficjenci: Socket, Semgrep, Calif, Trail of Bits.

Program Trusted Access for Cyber rozszerza się na nowe organizacje: Bank of America, BlackRock, BNY, Citi, Cisco, CrowdStrike, Goldman Sachs, JPMorgan Chase, Morgan Stanley, NVIDIA, Oracle, Zscaler. GPT-5.4-Cyber jest również udostępniany amerykańskiemu Centrum ds. Standardów i Innowacji w AI (CAISI) oraz brytyjskiemu Instytutowi Bezpieczeństwa AI (UK AISI) do niezależnych ocen.

🔗 Oficjalny artykuł OpenAI


Gemini : spersonalizowane obrazy z Nano Banana 2 i Google Photos

16 kwietnia — Google prezentuje nowe funkcje generowania spersonalizowanych obrazów w aplikacji Gemini, napędzane przez Personal Intelligence (inteligencję osobistą), Nano Banana 2 i bibliotekę Google Photos użytkownika.

Dotąd stworzenie naprawdę osobistego obrazu w Gemini wymagało szczegółowych promptów (prompts) i ręcznie przesłanych zdjęć. Personal Intelligence daje teraz Gemini domyślne rozumienie kontekstu użytkownika: wystarczą proste polecenia, takie jak „Narysuj mój wymarzony dom” albo „Stwórz obraz moich rzeczy niezbędnych na bezludną wyspę”, a Gemini automatycznie uzupełnia szczegóły z połączonych aplikacji Google.

Po połączeniu biblioteki Google Photos użytkownik może generować obrazy, na których pojawia się on sam i jego bliscy. Dzięki etykietom już utworzonym w Photos (ludzie, zwierzęta domowe) wystarczy prośba w stylu: „Stwórz obraz w claymationie mnie i mojej rodziny podczas naszej ulubionej aktywności”.

FunkcjonalnośćSzczegół
Dostępne styleAkwarela, węgiel, farba olejna, claymation
Przycisk ŹródłaPokazuje, które zdjęcie zostało wybrane automatycznie
DoprecyzowanieWskazanie, co było nieprawidłowe, wybór innego zdjęcia referencyjnego
PrywatnośćGemini NIE trenuje na prywatnej bibliotece Google Photos
Opt-inPołączenie aplikacji Google pozostaje opcjonalne i konfigurowalne

Dostępność: wdrażanie trwa kilka dni dla subskrybentów Google AI Plus, Pro i Ultra, na razie tylko w USA. Wkrótce pojawi się w Gemini w Chrome desktop i dla większej liczby użytkowników.

🔗 Artykuł blog.google

Gemini CLI v0.38.0

14 kwietnia — Wersja v0.38.0 Gemini CLI jest dostępna z kilkoma usprawnieniami doświadczenia w linii poleceń.

FunkcjonalnośćSzczegół
Chapters (strumień narracyjny)Grupuje interakcje w „rozdziały” zgodnie z intencją i użyciem narzędzi
Context Compression ServiceInteligentnie destyluje historię dla długich sesji
Trwałe zatwierdzeniaZatwierdzanie uruchamiania narzędzi bez ponownego pytania za każdym razem
Poprawka migotania UINaprawa niestabilnego renderowania poprzez tryb Terminal Buffer

🔗 Changelog Gemini CLI


Perplexity Personal Computer : lokalny agent na Mac

16 kwietnia — Perplexity uruchamia Personal Computer, funkcję lokalnego agenta zintegrowaną z aplikacją Mac.

“Today we’re releasing Personal Computer. Personal Computer integrates with the Perplexity Mac App for secure orchestration across your local files, native apps, and browser. We’re rolling this out to all Perplexity Max subscribers and everyone on the waitlist starting today.”

🇵🇱 Dziś uruchamiamy Personal Computer. Personal Computer integruje się z aplikacją Perplexity na Macu, zapewniając bezpieczną orkiestrację twoich lokalnych plików, natywnych aplikacji i przeglądarki. Udostępniamy to wszystkim subskrybentom Perplexity Max oraz osobom z listy oczekujących od dziś.@perplexity_ai na X

Agent bezpiecznie orkiestruje lokalne pliki, natywne aplikacje i przeglądarkę, bez korzystania z chmury w przypadku danych wrażliwych. Wdrażanie odbywa się stopniowo: najpierw subskrybenci Perplexity Max, a następnie lista oczekujących.

To wyraźny zwrot dla Perplexity: po zbudowaniu reputacji na wyszukiwarce internetowej opartej na AI, firma teraz mierzy się z lokalną orkiestracją na komputerze stacjonarnym — obszarem już eksplorowanym przez Apple Intelligence i Operator od OpenAI.

🔗 perplexity.ai/computer


GitHub : komenda gh skill w publicznym preview

16 kwietnia — GitHub uruchamia gh skill w publicznym preview w GitHub CLI (v2.90.0+). Ta nowa komenda pozwala instalować, odkrywać, aktualizować i publikować agent skills — przenośne zestawy instrukcji, skryptów i zasobów, które konfigurują zachowanie agentów AI.

gh skill install github/awesome-copilot documentation-writer
gh skill install github/awesome-copilot doc-writer --agent claude-code
gh skill search mcp-apps
gh skill update --all

Skills działają na wielu platformach: GitHub Copilot, Claude Code, Cursor, Codex, Gemini CLI i Antigravity. Komenda zawiera mechanizmy bezpieczeństwa łańcucha dostaw (supply chain): przypinanie przez tag lub SHA commita, niezmienne release’y oraz śledzenie pochodzenia poprzez frontmatter. Otwarta specyfikacja jest dostępna na agentskills.io.

🔗 Changelog GitHub


Qwen3.6-35B-A3B open-source i Meta Muse Spark Safety

Qwen3.6-35B-A3B : open-source MoE na licencji Apache 2.0

15–16 kwietnia — Alibaba ogłasza udostępnienie jako open-source Qwen3.6-35B-A3B, sparsowego modelu MoE (mixture-of-experts) z 35 miliardami parametrów łącznie, ale tylko 3 miliardami aktywnych parametrów na inferencję.

AspektSzczegół
ArchitekturaMoE sparse: 35B parametrów, 3B aktywnych
LicencjaApache 2.0
MultimodalnośćNatywna (wizja + rozumowanie)
TrybyThinking / non-thinking
BenchmarkQwen3.6-35B-A3B
SWE-bench Verified73,4
SWE-bench Multilingual67,2
AIME 202692,7
GPQA86,0

Dostępny na Hugging Face / ModelScope, Qwen Studio oraz przez API Alibaba Cloud (qwen3.6-flash). Natywnie kompatybilny z Claude Code, Qwen Code i OpenClaw. 🔗 Oficjalny blog Qwen

Meta Muse Spark: opublikowano raport bezpieczeństwa

15 kwietnia — Meta AI publikuje raport bezpieczeństwa i gotowości (Safety & Preparedness Report) dla Muse Spark, swojego pierwszego multimodalnego modelu bez open-weights opracowanego przez Meta Superintelligence Labs.

AspektSzczegół
Użyte ramyMeta Advanced AI Scaling Framework
Oceniane ryzykaChemiczne/biologiczne, cyberbezpieczeństwo, utrata kontroli
Wynik chem/bioRyzyko początkowo „potencjalnie wysokie” → zatwierdzone środki zaradcze → akceptowalne ryzyko resztkowe

Raport ten stanowi istotny krok: Meta stosuje teraz formalną procedurę oceny bezpieczeństwa przed wdrożeniem dla swoich zaawansowanych modeli, podobną do podejść Anthropic i OpenAI.

🔗 Raport bezpieczeństwa Muse Spark


Media i różne aktualizacje

Runway publikuje dwie aktualizacje 16 kwietnia: Seedance 2.0 przechodzi na rendering 1080p, a Runway Characters integruje teraz animację za pomocą skryptu tekstowego (wybierz postać, napisz skrypt, wygeneruj). NVIDIA jest obecna na NAB Show 2026, aby demonstrować AI w produkcji mediów, zaangażowaniu fanów i monetyzacji treści.

Grok iOS otrzymuje animowany wskaźnik wizualny w trybie głosowym: małe kółko pokazuje teraz, że Grok aktywnie słucha.

🔗 Runway — Seedance 2.0 w 1080p 🔗 Runway Characters — animacja za pomocą skryptu


Co to oznacza

16 kwietnia pokazuje dzień agentowej konwergencji na wszystkich frontach: Claude Opus 4.7, Codex z computer use, Perplexity Personal Computer i gh skill dzielą tę samą logikę — agentów zdolnych działać na lokalnym systemie (pliki, aplikacje, komputer), koordynowanych między wieloma platformami za pośrednictwem przenośnych standardów.

Polecenie gh skill jest szczególnie istotne: poprzez ustanowienie otwartej specyfikacji instalacji międzyagentowej (Copilot, Claude Code, Cursor, Codex, Gemini CLI), GitHub tworzy wspólną infrastrukturę, która mogłaby stać się npm install świata agentowego.

GPT-Rosalind oznacza z kolei ewolucję w strategii OpenAI: po modelach ogólnego przeznaczenia firma zaczyna tworzyć wyspecjalizowane modele frontier dla poszczególnych dziedzin — podejście przypominające dywersyfikację wertykalną, którą Google DeepMind badał już w biologii obliczeniowej.


Źródła

Ten dokument został przetłumaczony z wersji fr na język pl przy użyciu modelu gpt-5.4-mini. Aby uzyskać więcej informacji o procesie tłumaczenia, odwiedź https://gitlab.com/jls42/ai-powered-markdown-translator