Code Review für Claude Code, OpenAI übernimmt Promptfoo, Runway Characters API

Der 10. März 2026 ist geprägt von drei wichtigen Ankündigungen: Anthropic bringt Code Review für Claude Code, ein automatisiertes Agententeam bei jeder Pull Request, das jetzt als Vorschau (research preview) für Team- und Enterprise-Pläne verfügbar ist; OpenAI übernimmt Promptfoo, die Open-Source-Plattform für KI-Sicherheit, die von 25 % des Fortune 500 genutzt wird; und Runway öffnet seine Characters-API, die die Erstellung von konversationellen Echtzeit-Avataren auf Basis des GWM-1-Modells ermöglicht. Parallel dazu veröffentlichen GitHub, Google, NVIDIA und Perplexity mehrere bemerkenswerte Updates.

Code Review für Claude Code — ein Agententeam bei jeder PR

Anthropic hat am 9. März eine neue Funktion für Claude Code angekündigt: Code Review. In der Research Preview (research preview) für Team- und Enterprise-Pläne verfügbar, setzt sie automatisch ein Team von Agenten auf jede Pull Request, um Bugs zu identifizieren, die bei individuellen Reviews übersehen werden.

Das System ist direkt inspiriert von dem, was Anthropic intern einsetzt. Das Unternehmen beobachtet, dass die Codeproduktion pro Ingenieur innerhalb eines Jahres um 200 % gestiegen ist, wodurch Code-Reviews zum Engpass werden. Vor Code Review erhielten intern nur 16 % der PRs substanzielle Kommentare. Mit aktiviertem Code Review steigt dieser Wert bei großen PRs (mehr als 1.000 geänderte Zeilen) auf 84 %.

Die Agenten arbeiten parallel und passen ihre Analyse-Tiefe an die Größe der Änderung an: Eine triviale PR erhält eine leichte Review, ein komplexes Refactoring mobilisiert mehr Agenten. Ein konkretes Beispiel: Eine Änderung von nur einer Zeile in einem Produktionsdienst, scheinbar harmlos, ermöglichte das Entdecken einer kritischen Sicherheitslücke. Beim Kunden TrueNAS fand Code Review einen bereits vorhandenen Bug in einem Refactor der ZFS-Verschlüsselung.

Die Funktion wird ausdrücklich als teurer positioniert als die existierende Open-Source-GitHub Action, wegen der tieferen Analyse. Administratoren stehen Kontrollwerkzeuge zur Verfügung:

Levier de contrôle	Description
Plafond mensuel par organisation	Limite totale sur toutes les revues du mois
Contrôle par dépôt	Activer les revues uniquement sur les dépôts choisis
Tableau de bord analytique	Suivi des PRs revues, taux d’acceptation, coûts totaux

Um Code Review zu aktivieren: Claude Code → Einstellungen → GitHub App installieren → Repositories auswählen. Entwickler müssen nichts konfigurieren — Reviews starten automatisch bei jeder neuen PR.

“When a PR opens, Claude dispatches a team of agents to catch the bugs that slip past individual reviewers.”

🇩🇪 “Wenn eine PR geöffnet wird, setzt Claude ein Team von Agenten ein, um Fehler zu entdecken, die bei individuellen Code-Reviews unbemerkt bleiben.” — @claudeai auf X

🔗 Blog : Code Review für Claude Code einführen

OpenAI übernimmt Promptfoo

9. März — OpenAI gibt die Übernahme von Promptfoo bekannt, einer von Ian Webster und Michael D’Angelo mitbegründeten Plattform für KI-Sicherheit. Das Tool wird von mehr als 25 % der Fortune-500-Unternehmen genutzt, um Schwachstellen in KI-Systemen während der Entwicklung zu identifizieren und zu beheben.

Nach Abschluss der Übernahme wird die Promptfoo-Technologie direkt in OpenAI Frontier integriert, die Enterprise-Plattform von OpenAI zum Bereitstellen von KI-Kollegen (AI coworkers). Drei Fähigkeiten werden zu Frontier hinzugefügt:

Capacité	Description
Tests de sécurité intégrés	Détection d’injections de prompt, jailbreaks, fuites de données et comportements hors politique
Intégration dans les workflows de développement	Identification et correction des risques agents en amont du déploiement
Conformité et traçabilité	Rapports et historique pour les exigences de gouvernance (compliance)

Promptfoo bleibt unter seiner aktuellen Open-Source-Lizenz verfügbar und OpenAI wird weiterhin Support für bestehende Kunden leisten. Der Abschluss steht unter den üblichen Closing-Bedingungen.

🔗 OpenAI to acquire Promptfoo

Runway Characters — API für Echtzeit-Videoagenten

9. März — Runway stellt Characters vor, eine API zur Erstellung konversationeller Echtzeit-Charaktere. Basierend auf ihrem Weltmodell GWM-1 generiert sie aus einem einzigen Bild ausdrucksstarke Avatare, ohne dass Feintuning (fine-tuning) erforderlich ist.

Die Figuren bieten vollständige konversationelle Expressivität — Gesichtsausdruck, Augenbewegungen, Lippen-Synchronisation (lip-sync), Gestik — ohne Verschlechterung bei langen Gesprächen. Jeder Aspekt ist über die API anpassbar: Stimme, Persönlichkeit, Wissensbasis, verfügbare Aktionen.

Die Plattform zielt vor allem auf Kundensupport, Schulungen und Marketing-Erlebnisse ab. Zu den ersten Partnern gehören BBC und Silverside. Die API ist ab sofort auf dev.runwayml.com zugänglich, mit 30 kostenlosen Credits bei Kontoerstellung.

🔗 Vorstellung von Runway Characters

Interaktive Visualisierungen für Mathe und Naturwissenschaften in ChatGPT

10. März — OpenAI bringt dynamische interaktive Visualisierungen zum Lernen von Mathematik und Naturwissenschaften in ChatGPT. Verfügbar für alle angemeldeten Nutzer, decken sie über 70 grundlegende Konzepte ab.

Für jedes Konzept kann ChatGPT nun mit einer dynamischen Visualisierung erklären, dem Nutzer erlauben, Variablen in Echtzeit zu ändern und die unmittelbaren Auswirkungen in Diagrammen und Gleichungen zu zeigen. Zu den behandelten Konzepten gehören: Satz des Pythagoras, Coulombsches Gesetz, kinetische Energie, trigonometrische Identitäten, Zinseszins, Zustandsgleichung idealer Gase.

OpenAI nennt eine Zahl: 140 Millionen Menschen nutzen ChatGPT jede Woche, um Mathematik und Naturwissenschaften zu lernen. Die Funktion ist Teil der Initiativen NextGenAI und OpenAI Learning Lab.

🔗 Neue Wege, Mathematik und Naturwissenschaften in ChatGPT zu lernen

Skills Codex für die Wartung der SDK Agents — +45 % gemergte PRs

9. März — OpenAI veröffentlicht einen Erfahrungsbericht zur Nutzung von Codex und dem Skill-System zur Automatisierung der Wartung seiner SDK Agents (Python und TypeScript). Zwischen Dezember 2025 und Februar 2026 führte dieser Ansatz zum Mergen von 457 PRs gegenüber 316 im Vorzeitraum, also +45 %.

Das Team nutzt lokale Skills (.agents/skills/) und eine Datei AGENTS.md zur Automatisierung wiederkehrender Workflows. Zu den eingesetzten Skills gehören:

Skill	Funktion
`code-change-verification`	Format, lint, types, tests — vérification obligatoire
`docs-sync`	Audit documentation vs code
`pr-draft-summary`	Génération automatique du titre et de la description PR
`integration-tests`	Tests sur Node.js, Bun, Deno, Cloudflare Workers

Beide SDKs haben eine signifikante Verbreitung: ~14,7 Millionen PyPI-Downloads über 30 Tage für Python, ~1,5 Millionen für TypeScript auf npm.

🔗 Using skills to accelerate OSS maintenance

Perplexity Computer integriert Claude Code und GitHub CLI

9. März — Perplexity kündigt die Integration von Claude Code und der Kommandozeilen-Schnittstelle (Command Line Interface) GitHub direkt in Perplexity Computer an, seiner agentischen Umgebung, die Ende Februar gestartet wurde.

Nutzer können nun Claude Code — das CLI-Tool von Anthropic zur Interaktion mit komplexen Codebasen — direkt in Perplexity Computer ausführen, ohne die Umgebung zu verlassen. GitHub CLI ermöglicht Operationen an Repositories direkt aus der Oberfläche. In der gezeigten Demo hat das Team Perplexity Computer an ein reales Open-Source-Projekt angesetzt, um die Fähigkeiten zu demonstrieren. Diese Entwicklung positioniert Perplexity Computer als eine von KI gesteuerte integrierte Entwicklungsumgebung.

🔗 Tweet @AskPerplexity

Dependabot unterstützt jetzt pre-commit hooks

10. März — GitHub Dependabot unterstützt jetzt automatische Updates für pre-commit hooks. Es reicht, pre-commit als Ökosystem in dependabot.yml hinzuzufügen, damit Dependabot .pre-commit-config.yaml analysiert, neue Versionen erkennt und Update-Pull-Requests öffnet.

Gebündelte Updates, Changelogs in den PRs und die Erhaltung des YAML-Formates sind enthalten. Die Funktion arbeitet mit Hooks, die auf GitHub, GitLab, Bitbucket und anderen Git-Plattformen gehostet werden. Sie unterstützt Hooks, die an Git-Tags oder Commit-SHAs gebunden sind.

🔗 Dependabot now supports pre-commit hooks

Genspark wird Launch-Partner von Microsoft Agent 365

10. März — Genspark wurde als Launch-Partner von Microsoft Agent 365 angekündigt. Die Plattform kann nun in Teams, Word und anderen Microsoft-365-Anwendungen betrieben werden, innerhalb der sicheren Unternehmensumgebung. CEO Eric Jing wird in der offiziellen Microsoft-Ankündigung zitiert.

🔗 Tweet @genspark_ai

Gemini in Google Workspace — tiefere Integration

10. März — Google kündigt Optimierungen von Gemini an, die speziell auf einzelne Workspace-Produkte zugeschnitten sind. In Google Drive erlaubt die neue Funktion “Ask Gemini” Nutzern, den Inhalt ihrer Dateien direkt aus der Drive-Oberfläche abzufragen. Ähnliche Optimierungen wurden in Docs, Sheets und Slides ausgerollt.

🔗 Tweet @GoogleAI

NVIDIA × Thinky Machines — 1 Gigawatt Vera Rubin-Systeme

10. März — NVIDIA gibt eine Partnerschaft mit Thinky Machines bekannt, um mindestens 1 Gigawatt an NVIDIA Vera Rubin-Systemen für das Training von Frontier-Modellen bereitzustellen. Diese Bereitstellung stellt eine groß angelegte Recheninfrastruktur für Frontier-Modelle dar.

🔗 Tweet @NVIDIAAI

NVIDIA Nemotron 3 Nano 30B — kostenlos auf OpenRouter verfügbar

9. März — NVIDIA Nemotron 3 Nano 30B ist kostenlos auf OpenRouter verfügbar. Das Modell ist auf der Plattform der meistgenutzte von OpenClaw, vor allem für den Aufbau agentischer Systeme. Eine kostenlose Version ist unter openrouter.ai/nvidia/nemotron-3-nano-30b-a3b:free zugänglich.

🔗 Nemotron 3 Nano 30B sur OpenRouter

Kurznachrichten

Claude Code v2.1.72 (10. März) — Wartungsupdate mit mehreren nützlichen Ergänzungen. /plan akzeptiert jetzt ein direktes Argument (z. B. /plan fix the auth bug), was erlaubt, in den Plan-Modus zu wechseln und sofort zu starten ohne Zwischenschritt. ExitWorktree ermöglicht es Agenten, eine isolierte worktree-Session sauber zu verlassen. /copy schreibt die Auswahl direkt in eine Datei statt in die System-Zwischenablage — praktisch in entfernten Umgebungen (SSH, Container). Die Variable CLAUDE_CODE_DISABLE_CRON erlaubt das Deaktivieren laufender Cron-Jobs /loop während einer Session. Die Reasoning-Aufwandsstufen wurden vereinfacht: low (○), medium (◐) und high (●); die maximale Stufe wurde entfernt. Bei den Fixes: Der Prompt-Cache in SDK-Aufrufen wurde korrigiert, wodurch Eingangs-Tokens in bestimmten Workflows bis zu 12× reduziert werden — ein direkter Einfluss auf API-Kosten. Die Bundle-Größe schrumpft um ~510 KB, und mehrere Bugs des Voice-Modus (Latenz, falsche “No speech detected”-Fehler) wurden behoben.

IH-Challenge — Datensatz für Instruction-Hierarchie (10. März, OpenAI) — OpenAI veröffentlicht IH-Challenge als Open Source, ein Trainings-Dataset für Reinforcement Learning zur Verbesserung der Robustheit von LLMs gegenüber Instruktionskonflikten und Prompt-Injektionen (prompt injection). Das interne Modell GPT-5 Mini-R, auf diesen Daten trainiert, verbessert sich im Developer/User Conflict-Benchmark von 0,83 auf 0,95, ohne nennenswerte Regressionen in allgemeinen Fähigkeiten.

Codex Security für ChatGPT Pro-Konten erweitert (7. März, OpenAI) — Der Application-Security-Agent Codex Security, am 6. März in der Vorschau (research preview) gestartet, ist jetzt für ChatGPT Pro-Abonnenten verfügbar.

Grok: Bilder im Voice-Modus (8. März, xAI) — Grok erlaubt nun das Anhängen eines Bildes während einer Voice-Session zur Echtzeit-Analyse, ohne die Unterhaltung zu verlassen. Verfügbar in der mobilen App.

Antigravity v1.20.5 (9. März, Google) — Stabilitäts-Update. Das Google-CLI liest jetzt Regeln aus AGENTS.md zusätzlich zu GEMINI.md. Auto-Continue standardmäßig aktiviert. Fix eines Token-Zählfehlers, der vorzeitiges Ende von Konversationen verursachen konnte.

NotebookLM — 100 % anpassbare Infografik-Stile (10. März, Google) — Die Funktion Custom Infographic styles ist jetzt für alle NotebookLM-Nutzer ausgerollt.

Gemini auf Pixel — automatische Hintergrundaufgaben (10. März, Google) — Gemini auf Pixel kann alltägliche Aufgaben im Hintergrund verwalten (Einkäufe, Fahrtbuchungen, Nachbestellungen), während der Nutzer die Kontrolle behält.

ElevenLabs “11 Voices” (9. März) — Weltpremiere der Doku-Reihe “11 Voices” beim SXSW, Freitag, 13. März um 14:30. Die Serie zeigt Menschen, die ihre Stimme verloren haben und ihre Geschichten mithilfe der KI-Sprachtechnologie von ElevenLabs erzählen.

Was das bedeutet

Code Review für Claude Code stellt einen strukturellen Wandel darin dar, wie Entwicklerteams KI in ihre Workflows integrieren können. Die eindrücklichste Kennzahl — 16 % → 84 % Abdeckung bei großen PRs — zeigt, dass agentische KI beginnt, echte organisatorische Probleme zu lösen, nicht nur technische. Die bewusste Preispositionierung (teurer als die leichte GitHub Action) signalisiert, dass Anthropic Teams ansprechen will, die für Tiefe bezahlen, nicht für Volumen.

Die Übernahme von Promptfoo durch OpenAI beschleunigt die Konsolidierung des Marktes für KI-Sicherheit. Indem Tools für Red-Teaming direkt in die Frontier-Plattform integriert werden, versucht OpenAI, application-level KI-Sicherheit so eng in Deployments zu verankern wie Tests heute in CI/CD-Pipelines.

Runway Characters markiert einen Schritt in der Kommerzialisierung von Video-Agenten: eine standardisierte API, kein Fine-Tuning, 30 kostenlose Credits — die Eintrittsbarriere für konversationelle Echtzeit-Avatare sinkt deutlich.

Quellen - Blog: Code-Review in Claude Code einführen

Dieses Dokument wurde aus der fr-Version in die Sprache de unter Verwendung des Modells gpt-5-mini übersetzt. Für weitere Informationen zum Übersetzungsprozess konsultieren Sie https://gitlab.com/jls42/ai-powered-markdown-translator