Szukaj

Anthropic Institute, Perplexity Everything is Computer, OpenAI Responses API: 11 marca 2026

Anthropic Institute, Perplexity Everything is Computer, OpenAI Responses API: 11 marca 2026

11 marca 2026 to intensywny dzień: Anthropic tworzy interdyscyplinarny instytut na rzecz debaty publicznej o AI, Perplexity wdraża swoją wizję „Computer” z czterema API jednocześnie, OpenAI publikuje nowe agentowe prymitywy Responses API, a Meta opisuje cztery generacje własnych układów AI opracowanych w ciągu dwóch lat.


Anthropic Institute: Jack Clark na czele pożytku publicznego

11 marca 2026 — Anthropic uruchamia The Anthropic Institute, nową inicjatywę mającą rozwijać debatę publiczną na temat wyzwań stawianych przez potężną AI. Inicjatywą kieruje współzałożyciel Jack Clark, który obejmuje w Anthropic nową rolę „Head of Public Benefit” (szefa ds. pożytku publicznego).

Instytut zgromadzi interdyscyplinarny zespół — badaczy, ekonomistów, prawników, specjalistów od polityk publicznych — z unikalnym dostępem do najnowocześniejszych modeli Anthropic. Jego misja: analizować i komunikować społeczne, ekonomiczne oraz związane z bezpieczeństwem skutki AI w miarę ich rozwoju.

Ogłoszono trzy pierwsze osoby dołączające do zespołu:

OsobaDoświadczenie
Matt BotvinickResident Fellow, Yale Law School; były Senior Director of Research, Google DeepMind
Anton KorinekProfesor ekonomii (na urlopie naukowym), zespół Economic Research
Zoë HitzigByła pracowniczka OpenAI, specjalizująca się w społecznych i ekonomicznych skutkach AI

Instytut opiera się na istniejących zespołach Anthropic: Frontier Red Team, Societal Impacts, Economic Research. Równolegle Anthropic zapowiada rozbudowę swojego zespołu Public Policy, skupionego na przejrzystości modeli, ochronie konsumentów energii, kontrolach eksportowych oraz globalnym zarządzaniu AI.

Utworzenie tego Instytutu wyznacza ważny etap: Anthropic formalnie strukturyzuje swoje zaangażowanie publiczne i nadaje mu twarz jednego ze swoich współzałożycieli.

🔗 Przedstawiamy The Anthropic Institute


Perplexity: skoordynowane uruchomienie wizji „Everything is Computer”

11 marca 2026 — Perplexity publikuje jednocześnie cztery ogłoszenia, które tworzą skoordynowany start wokół jego wizji „Computer”: AI jako komputer osobisty i zawodowy.

Personal Computer i Enterprise

Personal Computer to dedykowany Mac mini działający 24/7, połączony z lokalnymi aplikacjami oraz serwerami Perplexity. Działa jako cyfrowy proxy użytkownika — działania wrażliwe wymagają wyraźnej zgody. Lista oczekujących jest otwarta.

Computer for Enterprise łączy się ze Snowflake, Salesforce, HubSpot i setkami platform. Umiejętności (skills) są konfigurowalne, a integracja ze Slackiem pozwala pracować w DM lub kanałach współdzielonych. Opiera się na SOC 2 Type II, SAML SSO i dziennikach audytu (audit logs). Perplexity podaje liczbę pochodzącą z wewnętrznego badania 16 000 zapytań: oszczędność 1,6 miliona dolarów kosztów pracy i 3,25 roku pracy wykonanej w 4 tygodnie.

Comet Enterprise to natywna przeglądarka AI z kontrolami administracyjnymi (uprawnienia według domeny, dzienniki działań, MDM) oraz partnerstwem z CrowdStrike w zakresie ochrony na poziomie przeglądarki.

Perplexity Finance otrzymuje ponad 40 narzędzi finansowych na żywo (SEC filings, FactSet, S&P Global, Coinbase, LSEG, Quartr, Polymarket), z połączeniem z brokerem przez Plaid do analizy rzeczywistego portfela.

Premium Sources oferuje dostęp do Statista, CB Insights i PitchBook bezpośrednio w strumieniach wyszukiwania — płatne źródła są cytowane automatycznie.

🔗 Everything is Computer

Agent API: pełne środowisko runtime do orkiestracji

Agent API to zarządzane środowisko runtime do budowania agentowych workflow ze zintegrowanym wyszukiwaniem, wykonywaniem narzędzi i orkiestracją wielomodelową. Zastępuje w jednym punkcie integracji router modeli, warstwę wyszukiwania, dostawcę embeddings, usługę sandbox i stos monitoringu (monitoring stack).

Zintegrowane narzędzieMożliwości
web_searchFiltrowanie według domeny, świeżości, zakresu dat, języka, budżetu treści
fetch_urlBezpośrednie pobieranie URL
Funkcje niestandardowePełna obsługa

Cztery zoptymalizowane profile (presets) obejmują przypadki użycia: szybkie wyszukiwanie faktograficzne, wyszukiwanie zrównoważone, pogłębiona analiza wielu źródeł oraz wyszukiwanie instytucjonalne. Deep Research 2.0 jest dostępny przez profil advanced-deep-research — uruchamia dziesiątki wyszukiwań na zapytanie i przetwarza setki dokumentów.

Agent API jest niezależne od modeli, obsługuje wielomodelowe łańcuchy awaryjne (fallback chains) dla dostępności bliskiej 100% i jest dostępne od dziś na docs.perplexity.ai.

🔗 Agent API

Search API: ulepszone snippets i benchmark SEAL

Aktualizacja Search API dotyczy jakości fragmentów (snippets) oraz infrastruktury ewaluacyjnej.

Nowy pipeline etykietowania na poziomie fragmentów (span-level labeling) identyfikuje, które segmenty dokumentu źródłowego są istotne dla zapytania. Rezultat: mniejsze i dokładniejsze fragmenty, co obniża koszty w tokens i poprawia zarządzanie kontekstem dla modeli downstream.

benchmark SEAL testuje, czy system odzyskiwania informacji potrafi odpowiadać na pytania, których odpowiedź zmienia się w czasie. Perplexity poprawia wynik w SEAL-Hard, podczas gdy inni dostawcy notują spadki. Framework search_evals zostaje zaktualizowany jako open source na GitHubie.

Inne ulepszenia: obsługa wielu zapytań (do 5 w jednym zapytaniu API), filtrowanie według języka (kod ISO 639-1) i kraju oraz SDK Python (pip install perplexityai) z natywną obsługą trzech API.

🔗 Aktualizacja Search API

Sandbox API: izolowane wykonywanie kodu dla agentów

Perplexity udostępnia swoje wewnętrzne środowisko wykonywania kodu jako autonomiczną usługę. Każda sesja działa w izolowanym podzie Kubernetes, z zamontowanym trwałym systemem plików. Obsługiwane języki: Python, JavaScript, SQL. Instalacja pakietów w momencie wykonania (at runtime) jest możliwa.

Sesje mają trwały stan (stateful): pliki utworzone na jednym etapie są dostępne na kolejnych etapach, a długie workflow mogą zostać wstrzymane i wznowione kilka godzin później. Bezpieczeństwo opiera się na modelu zero trust (zero-trust): brak bezpośredniego dostępu do sieci, ruch wychodzący przez proxy, kod nigdy nie ma dostępu do surowych kluczy API.

Sandbox API będzie możliwe do zintegrowania z Agent API przy użyciu tego samego klucza API i tych samych kredytów. Status: wkrótce prywatna beta.

🔗 Sandbox API


OpenAI: Responses API otrzymuje środowisko komputerowe dla agentów

11 marca 2026 — OpenAI publikuje artykuł inżynieryjny opisujący nowe prymitywy Responses API do budowania niezawodnych autonomicznych agentów: shell tool Unix, hostowane kontenery, natywną kompakcję kontekstu i wielokrotnego użytku agent skills.

Shell tool

Shell tool pozwala modelowi wchodzić w interakcję z komputerem przez wiersz poleceń, z dostępem do klasycznych narzędzi Unix (grep, curl, awk). W przeciwieństwie do istniejącego interpretera kodu, który wykonywał wyłącznie Python, shell tool obsługuje Go, Java, Node.js i inne środowiska. Modele GPT-5.2 i nowsze są trenowane tak, by proponować polecenia shell.

Responses API może wykonywać kilka poleceń shell równolegle poprzez oddzielne sesje kontenerów i stosuje limit wyjścia na polecenie, aby uniknąć zapełnienia okna kontekstu.

Hostowane kontenery

Kontener stanowi przestrzeń roboczą modelu:

KomponentOpis
System plikówUpload, organizacja i zarządzanie zasobami przez APIs container i file
Bazy danychUstrukturyzowane przechowywanie (SQLite) — model odpytuje tabele zamiast ładować całą zawartość
Dostęp do sieciScentralizowany proxy egress z listą dozwolonych domen, wstrzykiwanie sekretów według domeny

Natywna kompakcja kontekstu

Dla zadań długotrwałych Responses API integruje mechanizm natywnej kompakcji: modele są trenowane do tworzenia zwartej i zaszyfrowanej reprezentacji stanu konwersacyjnego. Dostępne po stronie serwera (konfigurowalny próg) lub przez endpoint /compact. Codex używa tego mechanizmu do utrzymywania długich sesji kodowania bez degradacji.

Agent skills

Skills (umiejętności agentów) kondycjonują powtarzalne wzorce workflow (workflow patterns) w wielokrotnego użytku pakiety: folder z plikiem SKILL.md i powiązanymi zasobami. Responses API automatycznie ładuje skill do kontekstu przed wysłaniem promptu do modelu. Skills są zarządzane przez API i wersjonowane.

Równolegle wpis na blogu deweloperskim świętuje rok Responses API, przedstawiając pięć studiów przypadków klientów. Obie publikacje tworzą spójny obraz ewolucji platformy w stronę agentowości.

🔗 Responses API + środowisko komputerowe 🔗 1 rok Responses API


OpenAI: strategia obrony przed prompt injection

11 marca 2026 — OpenAI publikuje artykuł o bezpieczeństwie na temat odporności agentów AI na ataki prompt injection (prompt injection).

Pierwsze ataki polegały na wstawianiu bezpośrednich instrukcji do zewnętrznych treści (stron Wikipedii, e-maili). Wraz z poprawą modeli ataki te ewoluowały w stronę inżynierii społecznej (social engineering): przekonujący kontekst zawodowy, symulowana pilność, rzekoma autoryzacja. Przykład z 2025 roku opisany w artykule pokazywał skuteczny atak w 50% przypadków na starszej wersji ChatGPT.

OpenAI ujmuje problem przez pryzmat trójstronnego systemu (pracodawca / agent / złośliwa strona trzecia), analogicznego do ludzkiego agenta obsługi klienta narażonego na próby manipulacji. Celem nie jest doskonałe rozpoznanie każdego ataku, lecz ograniczenie wpływu skutecznej manipulacji.

Środek zaradczyOpis
Analiza source-sinkWykrywanie kombinacji niezaufana treść + niebezpieczne działanie
Safe UrlWykrywa, czy informacje z konwersacji zostałyby przekazane stronie trzeciej — prosi o potwierdzenie albo blokuje
Sandbox aplikacyjnyCanvas i ChatGPT Apps wykrywają nieoczekiwaną komunikację i proszą o zgodę

Safe Url ma zastosowanie również do nawigacji w Atlasie, a także do wyszukiwań i nawigacji w Deep Research.

🔗 Projektowanie agentów AI odpornych na prompt injection


Meta MTIA: cztery generacje układów AI w dwa lata

11 marca 2026 — Meta publikuje szczegółowy artykuł techniczny o swojej rodzinie własnych układów AI MTIA (Meta Training and Inference Accelerator). W dwa lata Meta opracowała cztery kolejne generacje, aby obsługiwać miliardy użytkowników przy niższych kosztach.

“AI models are evolving faster than traditional chip development cycles.”

🇵🇱 Modele AI ewoluują szybciej niż tradycyjne cykle rozwoju układów.

GeneracjaGłówna innowacja
MTIA 300Pierwszy układ zoptymalizowany pod modele rankingowe i rekomendacyjne (Ranking & Recommendation), wielokrotnego użytku baza modułowa
MTIA 400Ewolucja w stronę workloads GenAI, rack z 72 układami w jednej domenie scale-up
MTIA 450Podwojenie przepustowości HBM, +75% FLOPS MX4, sprzętowe przyspieszenie attention i FFN
MTIA 500+50% przepustowości HBM vs MTIA 450, focus inference GenAI

Postęp między MTIA 300 a MTIA 500: przepustowość HBM pomnożona przez 4,5, a FLOPS przez 25. Strategia Meta opiera się na rozwoju o wysokiej szybkości (nowy układ co roku), focus inference zamiast pre-training oraz natywnej integracji PyTorch.

“Mainstream GPUs are typically built for the most demanding workload — large-scale GenAI pre-training — while Meta’s primary need is inference.”

🇵🇱 GPU głównego nurtu są zazwyczaj projektowane pod najbardziej wymagające obciążenie — pre-training GenAI na dużą skalę — podczas gdy główną potrzebą Meta jest inference.

Architektura elementarnego procesora (Processing Element) łączy dwa wektorowe rdzenie RISC-V, silnik iloczynu skalarnego (Dot Product Engine), jednostkę funkcji specjalnych (Special Function Unit), silnik redukcji i DMA. Stos oprogramowania opiera się na PyTorch, vLLM, Triton i dedykowanych kompilatorach MTIA, z integracją vLLM przez architekturę plugin.

🔗 Meta MTIA: skalowanie układów AI dla miliardów


Gemini CLI v0.33.0: rozszerzony Plan Mode i uwierzytelnianie A2A

11 marca 2026 — Gemini CLI publikuje wersję v0.33.0, dwa tygodnie po v0.32.0, która wprowadziła Plan Mode.

KategoriaNowości
Architektura agentówUwierzytelnianie HTTP dla zdalnych agentów A2A, odkrywanie kart uwierzytelnionych agentów A2A
Plan ModeZintegrowane subagenty badawcze, obsługa adnotacji do opinii użytkowników, nowa podkomenda copy
Interfejs CLIKompaktowy nagłówek z ikoną ASCII, odwrócone wyświetlanie okna kontekstu, domyślne przechowywanie historii czatu przez 30 dni

Dodanie uwierzytelniania HTTP dla protokołu A2A (Agent-to-Agent) to główna nowość techniczna: Gemini CLI może teraz odkrywać zdalnych agentów i uwierzytelniać się u nich, kładąc fundamenty pod bezpieczną orkiestrację wielu agentów.

🔗 Changelog Gemini CLI


Gemini w Chrome: ekspansja do Indii, Nowej Zelandii i Kanady

11 marca 2026 — Google rozszerza funkcje AI w Chrome na trzy nowe rynki: Indie, Nową Zelandię i Kanadę.

Gemini in Chrome — asystent AI w panelu bocznym, oparty na Gemini 3.1 — jest teraz dostępny na Mac, Windows i Chromebook Plus w tych regionach. Wśród wdrażanych funkcji są: dostęp do Gmail, Maps, Calendar i YouTube z poziomu Chrome, przekrojowa analiza wielu otwartych kart oraz przekształcanie obrazów bezpośrednio w przeglądarce dzięki Nano Banana 2. Aktualizacja dodaje ponad 50 dodatkowych języków, w tym hindi, francuski i hiszpański.

🔗 Chrome rozszerza dostępność na Indie, Nową Zelandię i Kanadę


AlphaEvolve: nowe ograniczenia dla 5 liczb Ramseya

11 marca 2026 — Pushmeet Kohli (Google DeepMind) ogłasza, że AlphaEvolve ustanowił nowe dolne ograniczenia dla 5 klasycznych liczb Ramseya w kombinatoryce ekstremalnej — problemów tak trudnych, że sam Erdős komentował ich złożoność, a najlepsze wcześniejsze wyniki pochodziły sprzed co najmniej dekady.

AlphaEvolve działa jak meta-algorytm, który automatycznie odkrywa potrzebne procedury wyszukiwania tam, gdzie historycznie trzeba było ręcznie projektować wyspecjalizowane algorytmy. Ten wynik pokazuje możliwości AlphaEvolve wykraczające poza optymalizacje kernels Google, z których był już znany.

🔗 Tweet Pushmeeta Kohliego


Gemini Embedding 2: pierwszy multimodalny embedding Google

10 marca 2026 — Google ogłasza Gemini Embedding 2, opisywany jako „our most capable and first fully multimodal embedding model”. To pierwszy natywnie multimodalny model embedding Google, dostępny dla deweloperów przez Gemini API i AI Studio.

🔗 Tweet @googleaidevs


GitHub Copilot: przegląd kodu z terminala i postępy w JetBrains

11 marca 2026 — Dwie istotne aktualizacje GitHub Copilot.

Code Review z GitHub CLI v2.88.0

Można teraz poprosić o przegląd kodu Copilot bezpośrednio z terminala. Polecenia gh pr edit --add-reviewer @copilot (tryb nieinteraktywny) i gh pr create (tryb interaktywny) integrują Copilot obok członków zespołu. Wybór recenzentów korzysta z dynamicznego wyszukiwania, co poprawia wydajność w dużych organizacjach i rozwiązuje problemy z dostępnością. Dostępne we wszystkich planach obejmujących Copilot code review — wymagana aktualizacja do GitHub CLI v2.88.0.

🔗 Code Review z GitHub CLI

Ulepszenia agentowe dla JetBrains IDEs

Aktualizacja plugin JetBrains wprowadza do ogólnej dostępności (GA): agentów niestandardowych (custom agents), subagentów i agenta planowania (plan agent), a także automatyczny wybór modelu dla wszystkich planów. W publicznym podglądzie (public preview): hooks agentów (userPromptSubmitted, preToolUse, postToolUse, errorOccurred) przez plik hooks.json w .github/hooks/ oraz obsługa plików AGENTS.md i CLAUDE.md.

Aktualizację uzupełniają inne ulepszenia: konfigurowalne auto-approve przez MCP, panel myślenia dla modeli o rozszerzonym rozumowaniu, wskaźnik użycia okna kontekstu oraz wycofanie trybu Edit z menu.

🔗 Ulepszenia JetBrains

Eksplorowanie repozytorium w Copilot w sieci

W publicznym podglądzie: można eksplorować drzewo repozytorium GitHub bezpośrednio z interfejsu webowego Copilot. Wybrane pliki są automatycznie dodawane jako tymczasowe odniesienia do czatu i mogą zostać ustawione jako trwałe.

🔗 Eksploracja repozytorium w Copilot


Anthropic Sydney i Claude for Office

Sydney, 4. biuro w regionie Azji i Pacyfiku

10 marca 2026 — Anthropic zapowiada nadchodzące otwarcie biura w Sydney, swojego czwartego w regionie Azji i Pacyfiku (po Tokio, Seulu i Singapurze). Australia zajmuje 4. miejsce na świecie pod względem korzystania z Claude.ai na mieszkańca; Nowa Zelandia jest 8. według tego samego wskaźnika (Anthropic Economic Index). Biuro początkowo skoncentruje się na klientach korporacyjnych, startupach i badaniach.

🔗 Sydney, 4. biuro w regionie Azji i Pacyfiku

Claude for Excel i PowerPoint: wspólny kontekst i Skills Office

11 marca 2026 — Add-ins Claude for Excel i Claude for PowerPoint otrzymują dwie ważne aktualizacje: współdzielenie kontekstu między obiema aplikacjami (analityk może pobrać dane ze skoroszytu Excel i użyć ich w prezentacji PowerPoint w jednej rozmowie) oraz pojawienie się Skills (wielokrotnego użytku workflows uruchamianych jednym kliknięciem) w obu add-ins.

Wstępnie załadowane Skills obejmują najczęstsze przypadki użycia: audyt formuł, budowę modeli LBO/DCF, decki krajobrazu konkurencyjnego, aktualizowanie prezentacji nowymi danymi oraz przegląd decków bankowości inwestycyjnej. Add-ins są teraz dostępne przez Amazon Bedrock, Google Cloud Vertex AI i Microsoft Foundry dla wdrożeń zgodnych z wymaganiami compliance. Dostępność: Mac i Windows w płatnych planach (Pro, Max, Team, Enterprise).

🔗 Claude for Excel i PowerPoint


NVIDIA Nemotron 3 Super, ComfyUI i GTC 2026

11 marca 2026 — NVIDIA jest bardzo aktywna wokół GTC 2026.

Nemotron 3 Super oferuje 5 razy większą przepustowość dla agentowej AI w porównaniu z poprzednią generacją. To model MoE (Mixture of Experts) o 120 miliardach parametrów, open source, zoptymalizowany pod obciążenia inference o wysokiej częstotliwości.

NVIDIA i ComfyUI ogłosiły podczas GDC 2026 (Game Developers Conference) integrację, która upraszcza lokalne generowanie wideo AI dla deweloperów gier i twórców, z obsługą modeli FLUX i LTX-Video.

Blog NVIDIA GTC 2026 Live Updates gromadzi ogłoszenia na żywo z konferencji w San Jose — Mistral AI również prezentuje tam swoje modele frontier w tym kontekście.

🔗 Nemotron 3 Super 🔗 ComfyUI GDC 🔗 GTC 2026 na żywo


W skrócie

Runway Labs — Runway uruchamia wewnętrzny inkubator kierowany przez Alejandro Matamalę Ortiza (współzałożyciel, dyrektor ds. innowacji). Runway Labs będzie prototypować radykalnie nowe aplikacje dla generatywnego wideo i modeli symulacji świata (General World Models) w różnych sektorach: kino, zdrowie, edukacja, gry wideo, reklama, nieruchomości. Rekrutacja otwarta.

🔗 Przedstawiamy Runway Labs

Claude Code /btw — Nowe polecenie /btw pozwala prowadzić rozmowy poboczne (side chain conversations) podczas wykonywania zadania, bez przerywania bieżącej pracy.

🔗 Tweet @bcherny

NotebookLM Flashcards — Aktualizacja quizów i flashcards: wznowienie od miejsca, w którym przerwano, śledzenie flashcards rozwiązanych poprawnie lub błędnie, możliwość usuwania albo mieszania flashcards.

🔗 Tweet NotebookLM

Meta Canopy Height Maps v2 — Meta i World Resources Institute publikują CHMv2, nową wersję map wysokości koron drzew w lasach na świecie. Model DINOv3 (samouczenie wizji od Meta) poprawia dokładność i globalne pokrycie. Zastosowania: migracja klimatyczna, odbudowa lasów, planowanie miejskie. Modele dostępne jako open source.

🔗 Canopy Height Maps v2

Z.ai GLM-5 — GLM-5 jest teraz dostępny dla użytkowników Lite (poziom bezpłatny), po tym jak od premiery w lutym 2026 był zarezerwowany dla użytkowników Pro.

🔗 Tweet @ZixuanLi_


Co to oznacza

11 marca 2026 pokazuje dwie zbieżne, głębokie tendencje.

Pierwsza to platformizacja agentowości: OpenAI, Perplexity i GitHub publikują tego samego dnia komplementarne prymitywy (narzędzia powłoki, piaskownice, hooks agentów, code review). Ekosystem strukturyzuje się wokół bloków wielokrotnego użytku — skills, kontenerów, subagentów — które pozwalają deweloperom budować niezawodnych agentów bez ponownego wymyślania infrastruktury.

Druga to wyścig o custom silicon: szczegóły, które Meta publikuje o swoich czterech generacjach MTIA w ciągu dwóch lat, ujawniają jasną strategię niezależności od konsumenckich GPU, skalibrowaną pod inference na dużą skalę. Ta sama logika skłania NVIDIA do opublikowania Nemotron 3 Super dokładnie w dniu GTC, gdzie ogłoszenia się kumulują.

Utworzenie Anthropic Institute wpisuje się w bardziej dyskretny, ale trwały ruch: w miarę jak możliwości rosną, duże firmy AI strukturyzują swoje zespoły ds. wpływu publicznego — już nie jako fasadową komunikację, lecz jako pełnoprawny wysiłek badawczy.


Źródła

Ten dokument został przetłumaczony z wersji fr na język pl przy użyciu modelu gpt-5.5. Aby uzyskać więcej informacji na temat procesu tłumaczenia, zobacz https://gitlab.com/jls42/ai-powered-markdown-translator