Ogłoszenie, które redefiniuje AI
24 listopada 2025 — Anthropic ujawnia Claude Opus 4.5, swój najbardziej zaawansowany model do tej pory. Przedstawiany jako “najlepszy na świecie model do kodowania, agentów i obsługi komputera”, Opus 4.5 stanowi znaczący krok w ewolucji systemów AI.
Introducing Claude Opus 4.5: the best model in the world for coding, agents, and computer use. Opus 4.5 is a step forward in what AI systems can do, and a preview of larger changes to how work gets done.
🇵🇱 Przedstawiamy Claude Opus 4.5: najlepszy na świecie model do kodowania, agentów i obsługi komputera. Opus 4.5 to krok naprzód w tym, co potrafią systemy AI, i zapowiedź większych zmian w sposobie wykonywania pracy. — @claudeai na X
🔗 Oficjalne ogłoszenie na anthropic.com
Dlaczego Opus 4.5 zmienia zasady gry
Claude Opus 4.5 to nie tylko przyrostowa aktualizacja. Ten model reprezentuje skok jakościowy w kilku kluczowych obszarach:
Inteligentne rozumowanie
Opus 4.5 wyróżnia się w zarządzaniu niejednoznacznością i kompromisami. Model wykazuje zwiększoną zdolność do nawigowania w złożonych sytuacjach, w których istnieje wiele prawidłowych podejść, wybierając to najbardziej odpowiednie dla kontekstu.
Rozszerzone zarządzanie kontekstem
Dzięki automatycznej summarization, Opus 4.5 eliminuje limity długości rozmowy. Model może utrzymywać kontekst podczas długich sesji roboczych bez spadku wydajności.
Koordynacja wielu agentów
Jeden z największych postępów dotyczy zdolności do orkiestracji systemów wieloagentowych. Opus 4.5 może koordynować wiele autonomicznych procesów pracujących równolegle nad złożonymi zadaniami.
Zaawansowane Computer Use
Model może teraz bezpośrednio manipulować:
- Arkuszami kalkulacyjnymi — Analiza i modyfikacja danych Excel/Sheets
- Prezentacjami — Tworzenie i edycja slajdów
- Przeglądarką — Automatyzacja złożonych zadań internetowych
- Aplikacjami desktopowymi — Interakcja z natywnym oprogramowaniem
Benchmarki: Liczby mówią same za siebie
Wydajność w inżynierii oprogramowania
| Benchmark | Opus 4.5 | Poprawa |
|---|---|---|
| SWE-bench Verified | State-of-the-art | Absolutny lider |
| SWE-bench Multilingual | 7/8 języków | Najlepszy w 7 językach |
| Aider Polyglot | +10.6% | vs Sonnet 4.5 |
| Vending-Bench | +29% | vs Sonnet 4.5 |
| Terminal Bench | +15% | vs Sonnet 4.5 |
| BrowseComp-Plus | Znaczące zyski | Badania agentowe |
Istotny fakt
Podczas wewnętrznego egzaminu inżynierskiego Anthropic z limitem 2 godzin, Opus 4.5 uzyskał wynik wyższy niż wszyscy ludzcy kandydaci. To nowość, która ilustruje poziom osiągnięty przez ten model.
Rewolucyjna wydajność tokenów
Jednym z najbardziej imponujących aspektów Opus 4.5 jest jego wydajność tokenowa. Model generuje równoważne lub lepsze wyniki przy użyciu znacznie mniejszej liczby tokenów:
| Poziom wysiłku | Wydajność | Redukcja tokenów |
|---|---|---|
| Średni wysiłek | Równa Sonnet 4.5 | -76% tokenów |
| Maksymalny wysiłek | +4.3% vs Sonnet 4.5 | -48% tokenów |
| Długie zadania | Utrzymana | -65% tokenów |
Co to oznacza w praktyce
- Zredukowane koszty — Mniej tokenów = niższy rachunek za API
- Szybsze odpowiedzi — Mniej generowania = zmniejszone opóźnienie
- Bardziej wydajne rozumowanie — Mniej backtrackingu i zbędnej eksploracji
Cennik i dostępność
Dostęp API
| Parametr | Wartość |
|---|---|
| Model ID | claude-opus-4-5-20251101 |
| Cena input | $5 / milion tokenów |
| Cena output | $25 / milion tokenów |
| Context window | 200K tokenów |
| Thinking budget | 64K tokenów |
Dostępne platformy
- Anthropic API — Bezpośredni dostęp
- AWS Bedrock — Integracja chmurowa Amazon
- Google Vertex AI — Integracja chmurowa Google
- Aplikacje Claude — claude.ai, desktop, mobile
Co mówią firmy
Opinie pierwszych użytkowników są zgodne:
GitHub Copilot
Model przewyższa nasze wewnętrzne benchmarki kodowania, jednocześnie zmniejszając zużycie tokenów o połowę. — Mario Rodriguez, Chief Product Officer
Windsurf AI
Clear winner… best frontier task planning and tool calling.
🇵🇱 Zdecydowany zwycięzca… najlepsze planowanie zadań granicznych i wywoływanie narzędzi. — Jeff Wang, CEO
Replit
Using fewer tokens to solve the same problems.
🇵🇱 Używanie mniejszej liczby tokenów do rozwiązywania tych samych problemów. — Michele Catasta, President
Warp
15% improvement over Sonnet 4.5 na Terminal Bench dla zadań autonomicznych. — Zach Lloyd, Founder
Cursor
Notable improvement with improved pricing and intelligence.
🇵🇱 Znacząca poprawa z lepszymi cenami i inteligencją. — Michael Truell, CEO
Ulepszenia produktu
Opus 4.5 towarzyszy kilka nowości w ekosystemie Claude:
Claude Code — Ulepszony Plan Mode
- Pytania wyjaśniające przed wykonaniem
- Pliki
plan.mdedytowalne przez użytkownika - Lepsza koordynacja modyfikacji w wielu plikach
Claude Desktop
- Równoległe sesje lokalne i zdalne
- Zintegrowane zrzuty ekranu
- Udostępnianie kontekstu poprzez kliknięcie na okna
- Polecenia głosowe (Caps Lock, aby mówić)
Claude for Chrome (Dostępny dla wszystkich planów płatnych)
Początkowo w wersji beta, Claude for Chrome jest teraz dostępny dla wszystkich płatnych planów (Pro, Team, Enterprise) od 18 grudnia 2025. Rozszerzenie pozwala Claude na bezpośrednią interakcję w przeglądarce:
- Autonomiczna nawigacja — Przeglądanie stron, klikanie, wypełnianie formularzy
- Wiele kart — Praca na wielu kartach jednocześnie
- Automatyzacja — Ekstrakcja metryk, zarządzanie plikami w chmurze, przygotowanie kalendarza
- Integracje — Google Drive, Salesforce, Gmail, CRM
- Zaplanowane przepływy pracy — Automatyzacje dzienne lub tygodniowe
- Bezpieczeństwo — Przegląd wrażliwych działań przed wykonaniem
🔗 Dowiedz się więcej o Claude for Chrome
Inne integracje
- Claude for Excel — Beta rozszerzona na Max, Team i Enterprise
- Rozszerzone rozmowy — Brak limitów długości dzięki auto-summarization
Bezpieczeństwo i dopasowanie
Anthropic przedstawia Opus 4.5 jako swój “najbardziej solidnie dopasowany model do tej pory”:
Odporność na ataki
- Prompt injection — Trudniejszy do oszukania niż jakikolwiek model konkurencji
- Misuse categories — Zmniejszone wyniki “niepokojącego zachowania”
System Card
Dokument bezpieczeństwa szczegółowo opisuje środki podjęte w celu zapewnienia niezawodnego i przewidywalnego zachowania, nawet w złożonych scenariuszach brzegowych.
Specyfikacje techniczne
| Specyfikacja | Wartość |
|---|---|
| Context window | 200K tokenów (domyślnie) |
| Thinking budget | 64K tokenów (przeplatane) |
| Metodologia oceny | Średnia z 5 niezależnych prób |
| Parametr wysiłku | Konfigurowalny (szybkość vs zdolność) |
| Sampling | Standardowa temperatura i top-p |
Zalety architektury
- Wydajne rozumowanie wieloetapowe redukujące backtracking
- Zoptymalizowana kompakcja kontekstu
- Narzędzia pamięci do podtrzymywanego rozumowania w długich sesjach
Wniosek
Claude Opus 4.5 reprezentuje więcej niż aktualizację modelu — to demonstracja tego, co AI może osiągnąć, gdy wydajność i możliwości postępują razem.
Dla programistów implikacje są jasne:
- Lepsza wydajność w zadaniach kodowania i automatyzacji
- Zredukowane koszty dzięki wydajności tokenowej
- Nowe możliwości z użyciem komputera i koordynacją wielu agentów