Code Review dla Claude Code, OpenAI przejmuje Promptfoo, Runway Characters API

Dzień 10 marca 2026 przyniósł trzy ważne ogłoszenia: Anthropic uruchamia Code Review dla Claude Code — zespół agentów automatycznie na każdym pull request, dostępny w wersji przedpremierowej dla planów Team i Enterprise; OpenAI przejmuje Promptfoo, platformę bezpieczeństwa AI open source używaną przez 25% firm z listy Fortune 500; oraz Runway udostępnia API Characters, umożliwiające tworzenie konwersacyjnych awatarów w czasie rzeczywistym opartych na modelu GWM-1. Równocześnie GitHub, Google, NVIDIA i Perplexity wprowadziły szereg istotnych aktualizacji.

Code Review dla Claude Code — zespół agentów na każdym PR

Anthropic 9 marca wprowadził nową funkcję dla Claude Code: Code Review. Dostępna w wersji przedpremierowej (research preview) dla planów Team i Enterprise, automatycznie wdraża zespół agentów na każdym pull request, by wykrywać błędy, które umykają indywidualnym przeglądom.

System jest bezpośrednio inspirowany rozwiązaniem stosowanym wewnętrznie przez Anthropic. Firma zauważa, że produkcja kodu na inżyniera wzrosła o 200% w ciągu roku, co przekształciło przegląd kodu w wąskie gardło. Przed Code Review jedynie 16% wewnętrznych PR-ów otrzymywało znaczące komentarze. Po włączeniu Code Review odsetek ten wzrósł do 84% w przypadku dużych PR-ów (powyżej 1 000 zmienionych linii).

Agenci działają równolegle i dostosowują głębokość analizy do wielkości zmiany: trywialny PR otrzymuje lekką rewizję, skomplikowany refaktoring angażuje więcej agentów. Konkretny przykład: zmiana jednej linii w serwisie produkcyjnym, pozornie nieistotna, umożliwiła wykrycie krytycznej luki bezpieczeństwa. U klienta TrueNAS Code Review zidentyfikował istniejący błąd w refaktorze szyfrowania ZFS.

Funkcja jest wyraźnie pozycjonowana jako droższa niż istniejąca open source GitHub Action, ze względu na głębokość analizy. Administratorom udostępniono narzędzia kontroli:

Levier de contrôle	Description
Plafond mensuel par organisation	Limite totale sur toutes les revues du mois
Contrôle par dépôt	Activer les revues uniquement sur les dépôts choisis
Tableau de bord analytique	Suivi des PRs revues, taux d’acceptation, coûts totaux

Aby aktywować Code Review: ustawienia Claude Code → zainstalować GitHub App → wybrać repozytoria. Deweloperzy nie muszą nic konfigurować — rewizje rozpoczynają się automatycznie przy każdym nowym PR.

“When a PR opens, Claude dispatches a team of agents to catch the bugs that slip past individual reviewers.”

🇵🇱 Gdy otwiera się PR, Claude uruchamia zespół agentów, aby wykryć błędy, które umykają podczas indywidualnych przeglądów. — @claudeai na X

🔗 Blog: Wprowadzenie Code Review do Claude Code

OpenAI przejmuje Promptfoo

9 marca — OpenAI ogłosiło przejęcie Promptfoo, platformy bezpieczeństwa AI współzałożonej przez Iana Webstera i Michaela D’Angelo. Narzędzie jest używane przez ponad 25% firm z listy Fortune 500 do identyfikowania i naprawiania luk w systemach AI będących w fazie rozwoju.

Po finalizacji przejęcia technologia Promptfoo zostanie zintegrowana bezpośrednio z OpenAI Frontier, platformą enterprise OpenAI do wdrażania współpracowników AI (AI coworkers). Do Frontier zostaną dodane trzy funkcje:

Capacité	Description
Tests de sécurité intégrés	Détection d’injections de prompt, jailbreaks, fuites de données et comportements hors politique
Intégration dans les workflows de développement	Identification et correction des risques agents en amont du déploiement
Conformité et traçabilité	Rapports et historique pour les exigences de gouvernance (compliance)

Promptfoo pozostanie open source na dotychczasowej licencji, a OpenAI będzie kontynuować wsparcie dla istniejących klientów. Finalizacja transakcji zależy od zwykłych warunków zamknięcia.

🔗 OpenAI to acquire Promptfoo

Runway Characters — API agentów wideo w czasie rzeczywistym

9 marca — Runway uruchomił Characters, API pozwalające tworzyć konwersacyjne postacie w czasie rzeczywistym. Oparte na ich modelu świata GWM-1, generuje ekspresyjne awatary z pojedynczego obrazu, bez konieczności fine-tuningu.

Postacie obsługują pełną ekspresję konwersacyjną — mimikę, ruchy oczu, synchronizację ust (lip-sync), gesty — bez pogorszenia jakości przy długich rozmowach. Każdy aspekt można spersonalizować przez API: głos, osobowość, bazę wiedzy, dostępne akcje.

Platforma jest skierowana głównie do wsparcia klienta, szkoleń i doświadczeń marketingowych. Pierwsi partnerzy to BBC i Silverside. API jest już dostępne na dev.runwayml.com, z 30 darmowymi kredytami przy założeniu konta.

🔗 Introducing Runway Characters

Interaktywne wizualizacje matematyki i nauk ścisłych w ChatGPT

10 marca — OpenAI uruchomiło dynamiczne interaktywne wizualizacje do nauki matematyki i nauk ścisłych w ChatGPT. Dostępne dla wszystkich zalogowanych użytkowników, obejmują ponad 70 podstawowych koncepcji.

Dla każdego pojęcia ChatGPT może teraz wyjaśnić zagadnienie za pomocą dynamicznej wizualizacji, pozwolić użytkownikowi na zmianę zmiennych w czasie rzeczywistym i pokazać natychmiastowy efekt na wykresach i równaniach. Wśród objętych tematów: twierdzenie Pitagorasa, prawo Coulomba, energia kinetyczna, tożsamości trygonometryczne, procent składany, równanie gazu doskonałego.

OpenAI cytuje liczbę: 140 milionów osób korzysta z ChatGPT co tydzień, by uczyć się matematyki i nauk ścisłych. Funkcja wpisuje się w inicjatywy NextGenAI i OpenAI Learning Lab.

🔗 New ways to learn math and science in ChatGPT

Skills Codex dla utrzymania SDK Agents — +45% mergowanych PR-ów

9 marca — OpenAI opublikowało studium przypadku dotyczące wykorzystania Codex i systemu skills do automatyzacji utrzymania swoich SDK Agents (Python i TypeScript). Między grudniem 2025 a lutym 2026 to podejście pozwoliło zmiergować 457 PR-ów, w porównaniu do 316 w poprzednim okresie, czyli +45%.

Zespół używa lokalnych skills (.agents/skills/) i pliku AGENTS.md do automatyzacji powtarzalnych workflowów. Wśród wdrożonych skills:

Skill	Fonction
`code-change-verification`	Format, lint, types, tests — vérification obligatoire
`docs-sync`	Audit documentation vs code
`pr-draft-summary`	Génération automatique du titre et de la description PR
`integration-tests`	Tests sur Node.js, Bun, Deno, Cloudflare Workers

Oba SDK mają znaczącą adopcję: ~14,7 miliona pobrań na PyPI w ciągu 30 dni dla Pythona, ~1,5 miliona dla TypeScript na npm.

🔗 Using skills to accelerate OSS maintenance

Perplexity Computer integruje Claude Code i GitHub CLI

9 marca — Perplexity ogłosiło integrację Claude Code i interfejsu wiersza poleceń (Command Line Interface) GitHub bezpośrednio w Perplexity Computer, swoim środowisku agentowym uruchomionym pod koniec lutego.

Użytkownicy mogą teraz uruchamiać Claude Code — narzędzie CLI Anthropic umożliwiające interakcję ze złożonymi bazami kodu — bez opuszczania Perplexity Computer. GitHub CLI pozwala wykonywać operacje na repozytoriach bezpośrednio z interfejsu. W udostępnionej demonstracji zespół poddał Perplexity Computer rzeczywistemu projektowi open source, by zilustrować jego możliwości. Ta ewolucja pozycjonuje Perplexity Computer jako zintegrowane środowisko programistyczne sterowane przez AI.

🔗 Tweet @AskPerplexity

Dependabot obsługuje pre-commit hooks

10 marca — GitHub Dependabot obsługuje teraz automatyczne aktualizacje pre-commit hooks. Wystarczy dodać pre-commit jako ekosystem w dependabot.yml, aby Dependabot analizował .pre-commit-config.yaml, wykrywał nowe wersje i otwierał pull requesty z aktualizacjami.

Uwzględniono aktualizacje grupowe, changelogi w PR-ach oraz zachowanie formatowania YAML. Funkcja działa z hookami hostowanymi na GitHub, GitLab, Bitbucket i innych platformach Git. Obsługuje hooki przypięte do tagów Git lub SHA commitów.

🔗 Dependabot now supports pre-commit hooks

Genspark zostaje partnerem premierowym Microsoft Agent 365

10 marca — Genspark został ogłoszony partnerem premierowym Microsoft Agent 365. Platforma może teraz działać w Teams, Word i innych aplikacjach Microsoft 365, w bezpiecznym środowisku przedsiębiorstwa. W oficjalnym ogłoszeniu Microsoft cytuje CEO Erica Jinga.

🔗 Tweet @genspark_ai

Gemini w Google Workspace — głębsza integracja

10 marca — Google ogłosił optymalizację Gemini specjalnie dostosowaną do każdego produktu w Workspace. W Google Drive nowa funkcja “Ask Gemini” pozwala użytkownikom zadawać pytania dotyczące zawartości plików bezpośrednio z interfejsu Drive. Podobne optymalizacje wdrożono w Docs, Sheets i Slides.

🔗 Tweet @GoogleAI

NVIDIA × Thinky Machines — 1 gigawatt systemów Vera Rubin

10 marca — NVIDIA ogłosiła partnerstwo z Thinky Machines w celu wdrożenia co najmniej 1 gigawatta systemów NVIDIA Vera Rubin przeznaczonych do treningu modeli AI frontier. To wdrożenie reprezentuje znaczącą infrastrukturę obliczeniową dedykowaną modelom frontier.

🔗 Tweet @NVIDIAAI

NVIDIA Nemotron 3 Nano 30B — dostępny bezpłatnie na OpenRouter

9 marca — NVIDIA Nemotron 3 Nano 30B jest dostępny bezpłatnie na OpenRouter. Model stał się najczęściej używanym przez OpenClaw na platformie, głównie do budowy systemów agentowych. Darmowa wersja jest dostępna pod adresem openrouter.ai/nvidia/nemotron-3-nano-30b-a3b:free.

🔗 Nemotron 3 Nano 30B sur OpenRouter

Skróty

Claude Code v2.1.72 (10 marca) — Aktualizacja konserwacyjna z kilkoma przydatnymi dodatkami. /plan akceptuje teraz bezpośredni argument (np. /plan fix the auth bug), co pozwala wejść w tryb planu i rozpocząć natychmiast bez kroku pośredniego. ExitWorktree pozwala agentom poprawnie zakończyć sesję w izolowanym worktree. /copy zapisuje zaznaczenie bezpośrednio do pliku, bez użycia schowka systemowego — przydatne w środowiskach zdalnych (SSH, kontenery). Zmienna CLAUDE_CODE_DISABLE_CRON umożliwia wyłączenie bieżących cron jobs /loop w trakcie sesji. Poziomy wysiłku rozumowania zostały uproszczone: low (○), medium (◐) i high (●), najwyższy poziom został usunięty. W poprawkach: cache promptów w wywołaniach SDK został naprawiony, zmniejszając liczbę tokenów wejściowych nawet do 12× w niektórych workflowach — bezpośredni wpływ na koszty API. Rozmiar bundla zmniejsza się o ~510 KB, a kilka błędów w trybie głosowym (opóźnienia, fałszywe błędy “No speech detected”) zostało naprawionych.

IH-Challenge — dataset dla hierarchii instrukcji (10 marca, OpenAI) — OpenAI publikuje open source IH-Challenge, zestaw danych treningowych do uczenia przez wzmocnienie mający poprawić odporność LLM na konflikty instrukcji i injekcje promptów (prompt injection). Wewnętrzny model GPT-5 Mini-R trenowany na tych danych poprawia wynik na benchmarku Developer/User Conflict z 0,83 do 0,95, bez istotnej regresji w zdolnościach ogólnych.

Codex Security rozszerzony na konta ChatGPT Pro (7 marca, OpenAI) — Agent aplikacyjnego bezpieczeństwa Codex Security, uruchomiony w research preview 6 marca, jest teraz dostępny dla subskrybentów ChatGPT Pro.

Grok: obrazy w trybie głosowym (8 marca, xAI) — Grok umożliwia teraz dołączenie obrazu podczas sesji w trybie głosowym, do analizy wizualnej w czasie rzeczywistym bez opuszczania rozmowy. Dostępne w aplikacji mobilnej.

Antigravity v1.20.5 (9 marca, Google) — Aktualizacja stabilności. CLI Google odczytuje teraz reguły z AGENTS.md oprócz GEMINI.md. Auto-continue włączone domyślnie. Naprawiono błąd w liczeniu tokenów, który mógł powodować przedwczesne zakończenie rozmowy.

NotebookLM — w 100% konfigurowalne style infografik (10 marca, Google) — Funkcja Custom Infographic styles jest teraz udostępniona wszystkim użytkownikom NotebookLM.

Gemini na Pixel — automatyczne zadania w tle (10 marca, Google) — Gemini na Pixel potrafi obsługiwać codzienne zadania w tle (zakupy, rezerwacje przejazdów, uzupełnianie zapasów) podczas gdy użytkownik zachowuje kontrolę.

ElevenLabs “11 Voices” (9 marca) — Światowa premiera serialu dokumentalnego “11 Voices” na SXSW, w piątek 13 marca o 14:30. Seria przedstawia osoby, które straciły głos i opowiadają własne historie dzięki technologii głosowej AI ElevenLabs.

Co to znaczy

Code Review dla Claude Code reprezentuje strukturalną zmianę w sposobie, w jaki zespoły developerskie mogą integrować AI w swoje workflowy. Najważniejszy wskaźnik — 16% → 84% pokrycia dużych PR-ów — pokazuje, że agentowe AI zaczyna rozwiązywać realne problemy organizacyjne, nie tylko techniczne. Przyjęte pozycjonowanie cenowe (droższe niż lekka GitHub Action) sygnalizuje, że Anthropic celuje w zespoły skłonne zapłacić za głębokość, a nie za wolumen.

Przejęcie Promptfoo przez OpenAI przyspiesza konsolidację rynku bezpieczeństwa AI. Integrując narzędzia red-teaming bezpośrednio w platformie Frontier, OpenAI dąży do tego, by bezpieczeństwo aplikacyjne AI było tak zintegrowane jak testy w obecnych pipeline’ach CI/CD.

Runway Characters zaznacza postęp w komercjalizacji agentów wideo: standardowe API, brak fine-tuningu, 30 darmowych kredytów — bariera wejścia dla konwersacyjnych awatarów w czasie rzeczywistym znacząco spada.

Sources - Blog: Wprowadzanie przeglądu kodu do Claude Code

Ten dokument został przetłumaczony z wersji fr na język pl przy użyciu modelu gpt-5-mini. Aby uzyskać więcej informacji na temat procesu tłumaczenia, zobacz https://gitlab.com/jls42/ai-powered-markdown-translator