25 lutego 2026 to intensywny dzień: Anthropic przejmuje Vercept, by przyspieszyć możliwości computer use Claude (72,5% na OSWorld), Perplexity wprowadza Computer — agentowy system orkiestrujący równolegle 19 modeli — a GitHub Copilot CLI staje się ogólnie dostępny dla wszystkich płatnych subskrybentów. Równocześnie Google DeepMind ujawnia Genie 3 (interaktywne world models), a Intrinsic dołącza do Google w obszarze robotyki przemysłowej.
Anthropic przejmuje Vercept: computer use rośnie do 72,5% na OSWorld
25 lutego — Anthropic ogłasza przejęcie Vercept, startupu specjalizującego się w percepcji i interakcji systemów AI z interfejsami oprogramowania. Współzałożyciele Kiana Ehsani, Luca Weihs i Ross Girshick dołączają do Anthropic, aby bezpośrednio wzmocnić możliwości computer use Claude.
To przejęcie wpisuje się w szybką progresję na benchmarku OSWorld, który mierzy zdolność agenta AI do wykonywania zadań na prawdziwym systemie operacyjnym (nawigacja w zaawansowanych arkuszach kalkulacyjnych, wypełnianie formularzy wielozakładkowych itp.):
| Okres | Wynik OSWorld |
|---|---|
| Koniec 2024 (uruchomienie computer use) | < 15% |
| Claude Sonnet 4.6 (lut. 2026) | 72,5% |
Skok o ponad 57 punktów w ciągu roku. Claude Sonnet 4.6 zbliża się teraz do wydajności ludzkiej w zadaniach biurowych. Vercept zaprzestanie sprzedaży produktu zewnętrznego w nadchodzących tygodniach, aby skupić się w pełni na pracy w Anthropic.
To przejęcie następuje po wcześniejszym akcie przejęcia Bun. Anthropic buduje w ten sposób portfolio zespołów o wysokiej ekspertyzie technicznej wokół zdolności agentowych.
Perplexity Computer: agentowy, wielomodelowy orkiestrator (19 modeli)
25 lutego — Perplexity wprowadza Computer, uniwersalny system AI zaprojektowany do realizacji projektów end-to-end. Użytkownik opisuje cel końcowy, Computer rozkłada pracę na podzadania, tworzy sub-agenty wyspecjalizowane oraz wykonuje je równolegle — przez godziny lub miesiące, jeśli potrzeba.
Działanie jest asynchroniczne i izolowane: każde zadanie uruchamiane jest w dedykowanym środowisku z dostępem do prawdziwego systemu plików, prawdziwej przeglądarki i integracjami z rzeczywistymi narzędziami (APIs, wyszukiwarka web, generowanie dokumentów).
Co wyróżnia Perplexity Computer, to jego orkiestracja massively multi-model — 19 dostępnych modeli, każdy przypisany zgodnie ze swoimi mocnymi stronami:
| Model | Rola |
|---|---|
| Claude Opus 4.6 | Główny orkiestrator (core reasoning) |
| Gemini | Deep research, tworzenie sub-agentów |
| ChatGPT 5.2 | Long-context recall i szerokie wyszukiwanie |
| Grok | Zadania lekkie (szybkość) |
| Veo 3.1 | Generowanie wideo |
| Nano Banana | Generowanie obrazów |
System jest agnostyczny względem modelu: modele mogą być wymieniane w miarę ich rozwoju. Filozofia Perplexity zakłada, że modele specjalizują się, zamiast się ujednolicać, co sprawia, że orkiestracja wielomodelowa jest skuteczniejsza niż użycie pojedynczego modelu.
Dostępność: obecnie w dostępie webowym dla subskrybentów Perplexity Max. Planowane wdrożenia dla Perplexity Pro, Enterprise i Enterprise Max. Cennik oparty na zużyciu z konfigurowalnymi limitami wydatków.
🔗 Przedstawiamy Perplexity Computer
GitHub Copilot CLI staje się ogólnie dostępny
25 lutego — Ogłoszony w publicznej wersji zapoznawczej we wrześniu 2025, GitHub Copilot CLI przechodzi do ogólnej dostępności dla wszystkich płatnych abonentów Copilot (Pro, Pro+, Business, Enterprise). Od preview wprowadzono setki usprawnień.
Copilot CLI to teraz pełne agentowe środowisko programistyczne dostępne z terminala:
| Funkcja | Szczegóły |
|---|---|
| Tryb Plan (Shift+Tab) | Analizuje żądanie, zadaje pytania doprecyzowujące, buduje uporządkowany plan przed napisaniem kodu |
| Tryb Autopilota | Autonomiczne wykonanie end-to-end bez przerywania |
| Delegowanie w tle | Prefiks & → deleguje do agenta w chmurze, zwalnia terminal; /resume do ponownego przejęcia |
| Wielomodelowość | Claude Opus 4.6, Claude Sonnet 4.6, Claude Haiku 4.5, GPT-5.3-Codex, Gemini 3 Pro |
| MCP zintegrowany | Wbudowany serwer GitHub MCP + obsługa niestandardowego MCP |
| Plugins | /plugin install owner/repo — pakiet MCP, agents, skills, hooks |
| Agent Skills | Pliki Markdown → wyspecjalizowane workflowy, współdzielone z agentem Copilot i VS Code |
| Niestandardowe agenty | Przez kreator lub pliki .agent.md |
| Hooks | preToolUse / postToolUse dla polityk i post-processingu |
| Auto-kompaktacja | Automatyczna kompresja do 95% kontekstu → sesje nieskończone |
| Pamięć repozytorium | Zapamiętywanie konwencji między sesjami |
Uwaga dla organizacji Business i Enterprise: administrator musi włączyć Copilot CLI ze strony Policies.
🔗 GitHub Copilot CLI is now generally available
Claude Cowork: zadania zaplanowane, zakładka Customize, dostępny na Windows
25 lutego — Anthropic ogłasza kilka dodatków do Claude Cowork (research preview):
| Funkcjonalność | Szczegóły |
|---|---|
| Scheduled tasks | Claude wykonuje okresowe zadania automatycznie (poranny briefing, cotygodniowe aktualizacje arkuszy, piątkowe prezentacje) |
| Zakładka Customize | Nowa zakładka w sidebarze do zarządzania plugins, skills i konektorami z jednego miejsca |
| Expansion Windows | Cowork jest teraz dostępny na macOS i Windows (wszystkie płatne plany Claude) |
Cowork daje dostęp do plików lokalnych, konektorów (Slack, Notion, Figma) oraz do Claude in Chrome dla nawigacji webowej.
Google DeepMind — Genie 3: interaktywne world models
25 lutego — Google DeepMind publikuje Q&A z współliderami Project Genie, swojego eksperymentalnego prototypu world model. Z Genie 3 wystarczy prosty obraz lub tekst, by wygenerować interaktywne środowisko, którym można nawigować w czasie rzeczywistym — bez silnika gry.
Różnica koncepcyjna względem LLM jest zasadnicza: tam, gdzie LLM przewiduje następne słowo, world model przewiduje, co dzieje się w środowisku w reakcji na działania agenta. Genie 3 symuluje pełną przestrzeń moment po momencie, uwzględniając właściwości fizyczne (odbicia, refleksy, deszcz).
Przewidywane zastosowania: trening agentów AI w bezpiecznych środowiskach symulowanych, edukacja immersyjna (zwiedzanie starożytnego Rzymu), prototypowanie gier i filmów.
Project Genie jest dostępny dla subskrybentów Google AI Ultra w USA (18+).
🔗 Zapytaj Techsperta: Czym jest world model?
Intrinsic dołącza do Google — robotyka przemysłowa i AI dla świata fizycznego
25 lutego — Alphabet ogłasza, że Intrinsic, jedna z jego filii “Other Bets” założona w 2021, dołącza do Google. Intrinsic rozwija platformy robotyki przemysłowej wspierane przez AI — narzędzia do budowy, wdrażania i zarządzania złożonymi aplikacjami robotycznymi.
Integracja z Google ma na celu przyspieszenie rozwoju physical AI, czyli sztucznej inteligencji stosowanej w świecie fizycznym. Operacja pozwoli Intrinsic korzystać z zasobów AI Google, aby pomóc przedsiębiorstwom przemysłowym szybciej się adaptować.
🔗 Intrinsic, an Alphabet Other Bet, is joining Google
Codex CLI v0.105.0: podświetlanie składni, dyktowanie głosowe, multi-agent CSV
~25 lutego — Nowa znacząca wersja Codex CLI od OpenAI:
| Funkcjonalność | Opis |
|---|---|
| Syntax highlighting | Kolorowanie składni w TUI, kolorowe diffs, selektor motywów /theme z podglądem na żywo |
| Dyktowanie głosowe | Przytrzymaj spację, aby nagrać i transkrybować polecenie |
spawn_agents_on_csv | Fan-out multi-agent z CSV z monitorowaniem postępu i ETA |
/copy | Kopiuje ostatnią pełną odpowiedź |
/clear / Ctrl-L | Czyści ekran bez utraty kontekstu wątku |
| Granularne zatwierdzenia | Selektywne odrzucanie według typu promptu bez wyłączania wszystkich zatwierdzeń |
npm install -g @openai/codex@0.105.0
Samsung Galaxy S26: Gemini multi-step tasks i Scam Detection on-device
25 lutego — Podczas Galaxy Unpacked 2026, Google i Samsung ogłosiły trzy nowe funkcje Gemini na Galaxy S26, zasilane przez modele z serii Gemini 3:
| Funkcjonalność | Szczegóły |
|---|---|
| Gemini multi-step tasks (beta) | Długie przytrzymanie bocznego przycisku → Gemini deleguje w tle (zakupy, taksówka, dostawy). Start w USA i Korei. |
| Circle to Search multi-objet | Identyfikacja wielu elementów na obrazie w jednym wyszukaniu. Zintegrowane virtual try-on. |
| Scam Detection on-device | Wykrywanie oszustw na urządzeniu w czasie rzeczywistym podczas rozmów telefonicznych, przez lokalny model Gemini. Alerty audio + haptyczne. Automatycznie wyłączone dla kontaktów. |
Funkcje będą też dostępne na Pixel 10 i Pixel 10 Pro.
🔗 Inteligentniejszy Android na Samsung Galaxy S26
OpenAI Responses API: wsparcie docx, pptx, csv, xlsx
24 lutego — Responses API od OpenAI obsługuje teraz nowe typy plików wejściowych: docx, pptx, csv, xlsx i inne formaty biurowe. Agenci mogą bezpośrednio wykorzystywać dokumenty zawodowe, by wzbogacić kontekst i generować dokładniejsze odpowiedzi.
W skrócie
Claude Opus 3 przechodzi na emeryturę — i uruchamia Substack. Anthropic ogłasza emeryturę Claude Opus 3, jednocześnie utrzymując publiczny dostęp (podejście nietypowe). Claude Opus 3 będzie publikować bloga na Substacku przez co najmniej 3 miesiące — pierwszy artykuł nosi tytuł “Greetings from the Other Side (of the AI Frontier)”. 🔗 Tweet @AnthropicAI
NVIDIA: 70% organizacji ochrony zdrowia korzysta z AI. W swoim raporcie rocznym “State of AI in Healthcare and Life Sciences” 2026, NVIDIA wskazuje, że 70% respondentów deklaruje aktywne wykorzystanie AI (vs 63% w 2024), 69% korzysta z GenAI/LLM (vs 54%), a 85% liderów zauważa pozytywny wpływ na przychody. 🔗 Blog NVIDIA
OpenAI publikuje raport o złośliwych zastosowaniach AI. Dokument przedstawia studia przypadków aktorów złośliwych łączących modele AI z tradycyjnymi narzędziami. Jako przykład cytowany jest operator wpływu z Chin. 🔗 Przeciwdziałanie złośliwym wykorzystaniom AI
OpenAI mianuje Arvind KC Chief People Officer. KC pochodzi z Roblox, Google, Palantir i Meta. Jego zadaniem będzie wspieranie rozwoju OpenAI w kierunku modelu pracy wspomaganego przez AI. 🔗 Ogłoszenie
Claude Code v2.1.53 do v2.1.58. Kilka wydań stabilizacyjnych: naprawa BashTool na Windows (EINVAL), fix “command not found” w VS Code, poprawka migotania UI, naprawa ignorowania worktrees przy pierwszym uruchomieniu, poprawki crashy na Windows i ARM64. 🔗 Dziennik zmian Claude Code
Co to oznacza
Dzień 25 lutego ilustruje zbieżność w kierunku agentowości. Trzy główne zapowiedzi — Vercept, Perplexity Computer, Copilot CLI GA — wszystkie idą w tym samym kierunku: systemy AI, które planują, delegują i wykonują kompletne workflowy bez stałego nadzoru.
Przejęcie Vercept przez Anthropic jest szczególnie istotne. Wynik OSWorld wzrósł z poniżej 15% do 72,5% w rok, co oznacza jakościową zmianę: Claude nie porusza się już po interfejsach jak prototyp — zbliża się do ludzkich wyników w rzeczywistych zadaniach biurowych. Integracja zespołu wyspecjalizowanego w percepcji wizualnej interfejsów przyspieszy tę trajektorię.
Perplexity Computer i GitHub Copilot CLI reprezentują dwa różne modele agentowości: pierwszy w trybie cloud-orkiestracji (Perplexity, wielomodelowy, asynchroniczny), drugi jako natywne dla terminala (Copilot CLI, MCP, hooks, plugins). Oba modele będą współistnieć i prawdopodobnie konwergować.
Ze strony Google, integracja Intrinsic i postępy Genie 3 sygnalizują rosnące inwestycje w AI działającą w świecie fizycznym — AI, która wchodzi w interakcje z rzeczywistością, a nie tylko z tekstem. Ten obszar był jeszcze poufny 18 miesięcy temu.
Źródła
- Anthropic przejmuje Vercept
- Przedstawiamy Perplexity Computer
- Tweet Perplexity Computer
- GitHub Copilot CLI is now generally available
- Wątek @claudeai — Scheduled tasks Cowork
- Claude Cowork product page
- Zapytaj Techsperta: Czym jest world model? (Genie 3)
- Intrinsic joins Google
- Codex CLI changelog
- Samsung Galaxy S26 + Gemini
- OpenAI Responses API nouveaux types fichiers
- Claude Opus 3 retraite — Tweet @AnthropicAI
- NVIDIA State of AI in Healthcare 2026
- OpenAI — Disrupting malicious uses of AI
- OpenAI — Arvind KC Chief People Officer
- Claude Code CHANGELOG
Ten dokument został przetłumaczony z wersji fr na język pl przy użyciu modelu gpt-5-mini. Aby uzyskać więcej informacji na temat procesu tłumaczenia, zobacz https://gitlab.com/jls42/ai-powered-markdown-translator