Runway Agent, Grok Build CLI, ChatGPT Personal Finance, Copilot App Desktop und KI-Wettbewerbsszenarien 2028

Eine ereignisreiche Woche: Runway Agent verwandelt die Videoproduktion in ein Gespräch, xAI steigt mit Grok Build in den Wettbewerb der CLI-Coding-Agents ein, ChatGPT greift über Plaid auf persönliche Finanzen zu, und GitHub liefert seine Copilot App Desktop in technischer Vorschau aus. Gleichzeitig veröffentlicht Anthropic ein politisches Papier zum KI-Wettlauf USA/China mit Blick auf 2028, und Perplexity Computer verbindet sich für Enterprise-Analytik mit Snowflake.

Runway Agent — kreativer KI-Partner für die vollständige Videoproduktion

13. Mai — Runway startet Runway Agent, einen konversationsfähigen kreativen Partner, der komplette Videos erzeugen kann — einschließlich Sounddesign und Schnitt — in einer einzigen Sitzung aus einem einfachen Gespräch heraus. Die am 15. Mai veröffentlichte Demonstration zeigt die Erstellung einer vollständigen Anzeige ausgehend von einem Product Shot, ohne manuelle Eingriffe zwischen den Schritten.

Fähigkeit	Beschreibung
Vollständige Produktion	Ideenfindung + Sounddesign + Schnitt in einer Unterhaltung
Inhaltstypen	Anzeigen, Shorts, Social-Media-Inhalte
Einstiegspunkt	app.runwayml.com/agent
X-Engagement	499 800 Aufrufe, 237 Lesezeichen

Der Unterschied zu üblichen generativen Tools ist strukturell: Runway Agent erzeugt nicht nur einzelne Clips, sondern orchestriert die gesamte kreative Pipeline. Der Nutzer beschreibt sein Bedürfnis („eine Anzeige für dieses Produkt, energiegeladener Ton, 30 Sekunden“), der Agent plant, generiert, setzt zusammen und liefert aus.

Meet Runway Agent. Your new AI creative partner that helps you ideate and execute fully finished, sound designed and edited videos. All with just a simple conversation.

🇩🇪 Entdecken Sie Runway Agent. Ihr neuer kreativer KI-Partner, der Ihnen hilft, vollständig fertige Videos mit Sounddesign und Schnitt zu konzipieren und zu produzieren. Und das alles mit einem einfachen Gespräch. — @runwayml auf X

Der Start erfolgt eine Woche nach der Ankündigung der Expansion nach Japan (siehe nächster Abschnitt) und signalisiert eine gleichzeitige geografische und produktbezogene Wachstumsstrategie.

🔗 Runway Agent

Grok Build Early Beta — terminal-nativer CLI-Coding-Agent von xAI

14. Mai — xAI startet Grok Build in offener Beta: einen terminal-nativen CLI-Agenten für die Softwareentwicklung, direkter Konkurrent von Claude Code und Gemini CLI. Zunächst verfügbar für SuperGrok-Heavy-Abonnenten (99 USD/Monat zum Einführungspreis, normalerweise 299 USD/Monat), wird die CLI via curl -fsSL https://x.ai/cli/install.sh | bash installiert.

Funktion	Detail
Zugrunde liegendes Modell	Grok 4.3 beta, Heavy-Architektur mit 16 Agents
Kontextfenster	2M tokens
Plan/review/approve	Plan-Modus zur Bestätigung vor der Ausführung, lesbare Diffs
Parallele Sub-Agents	Delegierung an Spezialisten parallel, Worktree-Support
Integrationen	AGENTS.md, Plugins, Hooks, Skills, MCP servers kompatibel
Headless-Modus	Flag `-p`, vollständiger ACP-Support für Skripte und Automatisierungen
Feedback	Integrierter Befehl `/feedback`

Grok Build tritt direkt im Segment der CLI-Coding-Agents an, in dem nun drei Akteure dominieren: Claude Code (Anthropic), Gemini CLI (Google) und Grok Build (xAI). Das hervorgehobene Differenzierungsmerkmal ist die Out-of-the-box-Kompatibilität mit bestehenden Tools (AGENTS.md, MCP servers) und die parallele Multi-Agenten-Architektur von Grok 4.3. Die Ankündigung erzeugte 53 Millionen Aufrufe auf X.

🔗 Grok Build

ChatGPT Personal Finance — Kontoverknüpfung per Plaid

15. Mai — OpenAI startet in der Vorschau (preview) für Pro-Abonnenten in den USA eine neue Funktion für persönliche Finanzen in ChatGPT. Nutzer können nun ihre Finanzkonten über Plaid verbinden, auf ein einheitliches Dashboard zugreifen und Fragen in natürlicher Sprache auf Basis ihrer echten Daten stellen.

Plan	Zugriff	Region
Pro	Sofortige Vorschau	Nur USA
Plus	Demnächst	—
Free	Langfristiges Ziel	—

Zentrale Funktionen:

Verbindung zu mehr als 12 000 Finanzinstituten über Plaid (Intuit-Integration folgt)
Einheitliches Dashboard: Portfolio, Ausgaben, Abonnements, anstehende Zahlungen
Finanzielle Erinnerungen (Financial memories): ChatGPT behält Ziele, Schulden, gemeinsame Projekte
Standardmodell: GPT-5.5 Thinking (GPT-5.5 Pro für Pro-Abonnenten)
ChatGPT kann keine Transaktionen durchführen und sieht nicht die vollständigen Kontonummern
Kontotrennung führt zur Löschung der Daten innerhalb von 30 Tagen

In einem internen Benchmark, bewertet mit mehr als 50 Finanzfachleuten, erreicht GPT-5.5 Thinking 79/100 und GPT-5.5 Pro 82,5/100 bei komplexen Aufgaben im Bereich persönliche Finanzen. Die Partnerschaft mit Intuit wird Antworten über die reine Ausgabe hinaus ermöglichen — etwa Kreditkartenempfehlungen mit Berechtigungsprüfung und Online-Antrag sowie steuerliche Implikationen mit Expertenberatung.

🔗 ChatGPT Personal Finance

GitHub Copilot App — Desktop-Anwendung in technischer Vorschau

14. Mai — GitHub startet die GitHub Copilot App in technischer Vorschau: eine native GitHub-Desktop-App für agentische Entwicklung. Copilot Business und Enterprise haben nach Aktivierung durch die Organisation Zugriff darauf (Rollout in der Woche vom 14. Mai); Copilot Pro und Pro+ müssen sich für den Early Access anmelden, mit gestaffelter Einführung.

Funktion	Beschreibung
Isolierte Sessions	Jede Session hat ihren eigenen Branch, ihre eigenen Dateien, ihren eigenen Gesprächsverlauf und ihren eigenen Aufgabenstatus
Start from GitHub context	Starten aus einem Issue, PR, Prompt oder einer vorherigen Session
Einheitlicher Inbox	Ansicht der zu bearbeitenden Issues/PRs über alle verbundenen Repositories hinweg
Pause/Fortsetzen	Eine Session verlassen und exakt an der Stelle wieder aufnehmen, an der sie unterbrochen wurde
Automatisierte Workflows	Skills + Prompts für Triage, Abhängigkeiten, Release Notes, Cleanup
Integriertes Terminal + Browser	Änderungen direkt in der App validieren
Agent Merge	Der Agent bearbeitet Review-Kommentare, korrigiert Checks und merged automatisch

Admin-Voraussetzungen: Previews aktiviert + Copilot CLI in den Policy-Einstellungen aktiviert.

Die Anwendung steht für die Konvergenz der agentischen Copilot-Funktionen in einer dedizierten Desktop-Umgebung, getrennt vom IDE-Plugin und der Weboberfläche. Agent Merge ist die fortschrittlichste Funktion: Der Agent liest Review-Kommentare, nimmt Korrekturen vor, behebt blockierende Checks und merged — ohne menschliches Eingreifen in den Zwischenschritten.

🔗 Copilot App Technical Preview

Copilot CLI Agent und vereinheitlichte Sessions in JetBrains IDEs

13. Mai — GitHub liefert ein großes Update des Plugins GitHub Copilot für JetBrains IDEs mit der Einführung des Copilot CLI Agent in öffentlicher Vorschau.

Funktion	Beschreibung
Copilot CLI Agent	Lange Aufgaben aus JetBrains an einen lokalen CLI-Agenten delegieren
Worktree-Isolation	Der Agent arbeitet in einem separaten Git-Worktree, ohne den aktuellen Branch zu berühren
Workspace-Isolation	Der Agent wendet Änderungen direkt an, für schnelle Iterationen
Vereinheitlichte Session-Ansicht	Alle Agent-Sessions mit Status, Typ und Dauer an einem Ort
Ask question tool	Der Agent kann gezielte Rückfragen zur Klärung stellen
Global .agent.md	Benutzerdefinierte Agents in `~/.copilot/agents`, überall verfügbar
Support für GHES sign-in	GitHub Enterprise Server im Authentifizierungsfluss

Veraltetes Feature: Der Modus „Edit“ wird in diesem Update entfernt.

Die Worktree-Isolation ist der Schlüssel: Der CLI-Agent arbeitet in einem dedizierten, isolierten Git-Branch, sodass der Nutzer weiter am Hauptbranch arbeiten kann, während der Agent lange Aufgaben parallel ausführt.

🔗 Copilot CLI Agent JetBrains

Anthropic — Szenarien 2028 für den globalen KI-Wettbewerb

14. Mai — Anthropic hat ein politisches Dokument (policy paper) mit dem Titel “2028: Two scenarios for global AI leadership” veröffentlicht, das seine Positionen zum KI-Wettbewerb zwischen den USA und China darlegt. Der Artikel erzielte innerhalb von 24 Stunden 3,8 Millionen Aufrufe auf X.

Das Dokument beschreibt zwei hypothetische Szenarien für 2028:

Szenario 1 — Konsolidierter demokratischer Vorsprung: Die USA und ihre Verbündeten halten einen Vorsprung von 12 bis 24 Monaten an der Modellgrenze. Die Exportkontrollen für Halbleiter werden verschärft, Distillation-Angriffe abgewehrt, und die US-KI dominiert die Weltwirtschaft.

Szenario 2 — Kopf-an-Kopf-Rennen mit China: Die Kommunistische Partei Chinas schafft es, durch Umgehungen der Exportkontrollen (Chip-Schmuggel, Offshore-Rechenzentren) und massive Distillation-Angriffe auf US-Modelle auf dem Stand der Frontier zu bleiben.

Indikator	Wert
Aufrufe auf X	3,8 Millionen
Empfohlener Zielvorsprung der USA	12–24 Monate in 2028
Compute Huawei vs NVIDIA 2026	4% in der Gesamtleistung
Compute Huawei vs NVIDIA 2027	2% (geschätzt)

Anthropic identifiziert vier Wettbewerbsfelder: Intelligenz (Modellfähigkeiten), nationale Adoption, globale Distribution und Resilienz. Drei politische Handlungsachsen werden empfohlen: Schlupflöcher in den Exportkontrollen schließen, illegale Distillation-Angriffe abwehren und den weltweiten Export US-amerikanischer KI fördern.

We’ve published a paper that explains our views on AI competition between the US and China. The US and democratic allies hold the lead in frontier AI today.

🇩🇪 Wir haben ein Dokument veröffentlicht, das unsere Positionen zum KI-Wettbewerb zwischen den Vereinigten Staaten und China erklärt. Die Vereinigten Staaten und ihre demokratischen Verbündeten halten heute die Führung bei Frontier-KI. — @AnthropicAI auf X

🔗 2028: Two scenarios for global AI leadership

Perplexity Computer + Snowflake — Enterprise-Workflows auf Live-Daten

14. Mai — Perplexity Computer verbindet sich jetzt mit Snowflake und ermöglicht es, End-to-End-Workflows direkt auf Live-Daten eines Data Warehouse auszuführen. Die dokumentierten Anwendungsfälle umfassen Pipeline-Analysen, Produktnutzungs-Tracking und Kundenanalytik.

Die Integration positioniert Perplexity Computer im Segment der Self-Service-Enterprise-Analytik: Ein Analyst kann in natürlicher Sprache Fragen zu seinen Snowflake-Daten stellen und automatisierte Workflows erhalten — Extraktion, Transformation, Visualisierung — ohne Code. Die Ankündigung erzielte 60 761 Aufrufe und 99 Lesezeichen auf X, mit signifikanter Enterprise-Dynamik.

🔗 Perplexity Computer + Snowflake

PayPal — 74 000 wöchentliche Aufgaben auf Perplexity Enterprise

13. Mai — Perplexity veröffentlicht den PayPal-Kundenbericht: Das Unternehmen führt 74 000 wöchentliche Aufgaben über Perplexity Enterprise für Anwendungsfälle der Modellvalidierung und Channel Analytics aus. Es ist bislang die höchste öffentlich kommunizierte Enterprise-Nutzungszahl von Perplexity für einen einzelnen Kunden. Die Ankündigung, begleitet von einem Blogartikel mit Details zu den PayPal-Workflows, erzielte 61 442 Aufrufe und 81 Lesezeichen auf X — ein beträchtliches Engagement für eine B2B-Meldung. Dieser Kundenfall, kombiniert mit der am Folgetag angekündigten Snowflake-Integration, zeichnet eine kohärente Enterprise-Upgrade-Strategie für Perplexity Computer.

🔗 PayPal + Perplexity Enterprise

Codex in der mobilen ChatGPT-App (iOS und Android)

14. Mai — Codex ist jetzt in der mobilen ChatGPT-App (iOS und Android) verfügbar, in Vorschau für alle Tarife einschließlich Free und Go. OpenAI gibt an, dass 4 Millionen Nutzer Codex jede Woche verwenden.

Funktion	Beschreibung
Multi-Maschinen-Verbindung	Laptop, Mac mini, verwaltete entfernte Umgebung
Echtzeitstatus	Screenshots, Terminal-Ausgaben, Diffs, Testergebnisse
Aktionen vom Mobilgerät aus	Starten, Entsperren, Genehmigen, Modell wechseln
Remote SSH	Jetzt allgemein verfügbar (generally available)
Hooks	Allgemein verfügbar — Prompt-Scanning, Validatoren, benutzerdefinierte Erinnerungen
Programmatic Tokens	Für CI-Pipelines, verfügbar für Enterprise und Business
HIPAA-Konformität	Für Codex lokal auf ChatGPT-Enterprise-Arbeitsbereichen

You’ve been asking for this one… Now in preview: Codex in the ChatGPT mobile app. Start new work, review outputs, steer execution, and approve next steps, all from the ChatGPT mobile app. Codex will keep running on your laptop, Mac mini, or devbox.

🇩🇪 Sie haben darauf gewartet… Jetzt in der Vorschau: Codex in der mobilen ChatGPT-App. Starten Sie neue Arbeiten, prüfen Sie Ergebnisse, leiten Sie die Ausführung und genehmigen Sie die nächsten Schritte — alles direkt aus der mobilen ChatGPT-App. Codex wird weiterhin auf Ihrem Laptop, Mac mini oder Devbox ausgeführt. — @OpenAI auf X

🔗 Codex auf Mobilgeräten

Anthropic — Claude for Small Business, Gates Foundation, PwC

Claude for Small Business

13. Mai — Anthropic startet Claude for Small Business: 15 agentische Workflows und 15 vorkonfigurierte Skills für kleine Unternehmen, über Claude Cowork. Zu den verbundenen Tools gehören QuickBooks, PayPal, HubSpot, Canva, Docusign, Google Workspace und Microsoft 365. Die Funktionen decken Gehaltsabrechnung, Monatsabschluss, Cashflow-Tracking, Marketingkampagnen und Rechnungserinnerungen ab. Eine „Claude SMB Tour“ beginnt am 14. Mai in Chicago (100 KMU-Verantwortliche pro Stopp, ein Monat Claude Max gratis).

🔗 Claude for Small Business

200-Millionen-USD-Partnerschaft mit der Gates Foundation

14. Mai — Anthropic und die Bill & Melinda Gates Foundation kündigen eine 200-Millionen-USD-Partnerschaft über vier Jahre an. Claude-Credits, Fördermittel und technische Unterstützung decken vier Bereiche ab: globale Gesundheit (Impfstoffe und Therapien für Krankheiten in Ländern mit niedrigem Einkommen — Polio, HPV, Präeklampsie), Biowissenschaften, K-12-Bildung in Subsahara-Afrika und Indien sowie wirtschaftliche Mobilität für Solopreneure und Landwirte. Die Zielbevölkerung im Gesundheitsbereich umfasst 4,6 Milliarden Menschen ohne Zugang zu grundlegender Versorgung.

🔗 Gates Foundation Partnership

Erweitertes Bündnis mit PwC

14. Mai — PwC wird Claude Code und Claude Cowork zunächst in seinen US-Teams und anschließend weltweit einführen. Das Bündnis schafft ein gemeinsames Center of Excellence und ein Zertifizierungsprogramm für 30 000 PwC-Fachkräfte. Die aktuellen Produktionsrollouts berichten von Effizienzgewinnen von bis zu 70%: Versicherungszeichnungsprozesse von 10 Wochen auf 10 Tage verkürzt, Reaktion auf Cybersecurity-Vorfälle von mehreren Stunden auf wenige Minuten. Eine neue Einheit „Office of the CFO“ wird gestartet, mit Fokus auf regulierte Branchen.

🔗 PwC + Anthropic

Claude Code v2.1.141-142 — terminalSequence hooks, claude agents flags + Fast mode Opus 4.7

Zwei am 14. und 15. Mai 2026 veröffentlichte Versionen bringen erhebliche Verbesserungen für Claude Code, insbesondere bei der Verwaltung von Hooks, Hintergrundsitzungen und dem Fast-Modus.

Neuheit (v2.1.142)	Detail
Neue Flags `claude agents`	`--add-dir`, `--settings`, `--mcp-config`, `--plugin-dir`, `--permission-mode`, `--model`, `--effort`, `--dangerously-skip-permissions`
Fast mode → Opus 4.7	Standardmäßig jetzt (Variable `CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1` zum Zurückkehren zu Opus 4.6)
Plugins SKILL.md im Root	Ein Plugin mit `SKILL.md` im Root ohne Unterordner `skills/` wird jetzt als Kompetenz angezeigt

Neuheit (v2.1.141)	Detail
`terminalSequence` in hooks	Desktop-Benachrichtigungen, Fenstertitel, Klingeltöne ohne Kontrollterminal
`claude agents --cwd <chemin>`	Die Sitzungsliste nach Verzeichnis filtern
`ANTHROPIC_WORKSPACE_ID`	Federation von Workload-Identitäten (workload identity federation)
Rewind “Summarize up to here”	Komprimierung des vorherigen Kontexts aus dem Rewind-Menü
Amber Spinner	Zeigt an, dass Claude nach 10 Sekunden immer noch arbeitet

Bemerkenswerte Fehlerbehebungen (v2.1.142): MCP_TOOL_TIMEOUT beschränkte HTTP/SSE-Aufrufe nicht mehr auf 60 Sekunden; Crash-Loop des Daemons nach brew upgrade; Windows-Deadlock auf Netzlaufwerk. v2.1.141 enthielt außerdem 40+ Korrekturen für Hintergrundsitzungen, MCP-Plugins, Hooks und Terminal-Rendering.

🔗 CHANGELOG Claude Code

Claude Code — Wöchentliche Limits +50% bis zum 13. Juli

13. Mai — @ClaudeDevs kündigt eine Erhöhung der 50% der wöchentlichen Claude-Code-Limits bis zum 13. Juli 2026 um 18 Uhr PDT an, für alle Pro-, Max-, Team- und Enterprise-Pläne. Die Erhöhung gilt für CLI, IDE-Erweiterungen, Desktop und Web — keine Aktion durch den Nutzer erforderlich. Sie addiert sich mit der am 6. Mai angekündigten Verdopplung der Limits über 5 Stunden.

🔗 ClaudeDevs auf X

GitHub — Zusätzliche Copilot-Updates

Copilot Memory — Nutzereinstellungen (Pro und Pro+)

15. Mai — Copilot Memory erweitert seinen Umfang auf Benutzerebene (early access). Zuvor speicherte das Gedächtnis nur Informationen auf Repository-Ebene. Ab sofort folgen persönliche Präferenzen (Commit-Stil, Struktur von Pull Requests, Kommunikationston) dem Nutzer über alle seine Repositories und Agenten hinweg. Verwaltung in den persönlichen Copilot-Memory-Einstellungen.

🔗 Copilot Memory Benutzerstufe

Copilot-Cloud-Agent — automatische Modellauswahl

14. Mai — Der Modus “Auto” im Model Picker des Cloud-Agents ermöglicht es Copilot, intelligent das beste Modell entsprechend dem Systemzustand und der Leistung auszuwählen. Vorteile: 10% Rabatt auf den normalen Multiplikator, kein wöchentliches Rate Limit mit diesem Modus.

🔗 Automatische Modellauswahl

Agent tasks REST API (Business/Enterprise)

13. Mai — Copilot-Business- und Enterprise-Nutzer können jetzt Aufgaben des Cloud-Agents über die neue Agent tasks REST API (public preview) starten. Anwendungsfälle: massives Refactoring über mehrere Repositories hinweg, Initialisierung von Repositories aus einem internen Entwicklerportal, automatische Vorbereitung von Release Notes. Authentifizierung über PAT (classic und fine-grained) sowie OAuth-Tokens. Unterstützung für GitHub App Installation Tokens und Copilot Pro/Pro+ folgt.

🔗 Agent tasks REST API

Copilot-Metriken pro Team über API

14. Mai — Die Copilot-Metrik-API stellt einen neuen Bericht user-teams über zwei Endpunkte (/enterprises/{enterprise}/copilot/metrics/reports/user-teams-1-day und /orgs/{org}/copilot/metrics/reports/user-teams-1-day) bereit. Ermöglicht die Erstellung von Adoptionsmetriken pro Team (aktive Nutzer, Completes, Chats, nach Sprache/IDE/Modell). Einschränkung: Teams mit weniger als 5 Nutzern sind ausgeschlossen.

🔗 Copilot-Metriken auf Teamebene

GitHub Actions — Bildmigrationen Juni 2026

14. Mai — Drei GitHub-Actions-Migrationen stehen an:

Migration	Datum
Von GitHub übernommene Arm64-Images (von Arm Limited)	Laufend
`windows-latest` / `windows-2025` → VS 2026	8.–15. Juni 2026
`macos-latest` → macOS 26	Ab 15. Juni 2026, 30 Tage

Zur Vorbereitung: runs-on: windows-2025-vs2026 (VS 2026 testen), runs-on: windows-2022 (bei VS 2022 bleiben), runs-on: macos-15 (bei macOS 15 bleiben).

🔗 Bevorstehende Bildmigrationen

Runway-Expansion in Japan — Tokio-Büro + 40 Millionen USD

15. Mai — Runway eröffnet ein Büro in Tokio mit einer Anfangsinvestition von 40 Millionen USD. Japan ist mit einer Verdreifachung der Unternehmenskunden in 12 Monaten zum drittgrößten Markt von Runway weltweit geworden. Kunden: Yamaha, NHN, SoftBank — in den Bereichen Marketing, Werbung und kreative Inhalte. Die Expansion zielt in erster Linie auf japanische Marktführer aus Gaming, Medien und Robotik. Der Start fällt in dieselbe Woche wie Runway Agent (siehe Abschnitt oben) und signalisiert eine gleichzeitige Wachstumsstrategie auf Produkt- und geografischer Ebene. Die Ankündigung erzielte 86.600 Aufrufe und 139 Lesezeichen auf X.

🔗 Runway in Japan

KI-Medien — NVIDIA OpenShell, FLUX Outpainting, ElevenCreative

NVIDIA OpenShell v0.0.41

15. Mai — NVIDIA veröffentlicht die Version v0.0.41 seines Open-Source-Compute-Tools OpenShell. Neuigkeiten: agentengesteuerte Richtlinienverwaltung (agent-driven policy management), Sandbox-Ressourcenflags in der CLI, benutzerdefinierte CA-Unterstützung für die OIDC-TLS-Prüfung, Sandbox-Downloads mit Workspace-Grenzkontrollen. Fortsetzung von v0.0.37 (11. Mai).

🔗 OpenShell v0.0.41 auf GitHub

Black Forest Labs — FLUX Outpainting

14. Mai — Black Forest Labs startet FLUX Outpainting, das es ermöglicht, jedes Bild auf jedes Seitenverhältnis zu erweitern. Der entscheidende Fortschritt: Die üblichen Probleme mit Randkohärenz (Lichtabbrüche, Texturdrifts, sichtbare Nähte) werden auf Modellebene behandelt — nicht per Post-Processing. Das Tool erhält ein Bild und eine Canvas-Geometrie und erzeugt eine kohärente Szenenerweiterung.

🔗 Black Forest Labs auf X

ElevenLabs — Vorlagen in ElevenCreative

13. Mai — ElevenLabs startet die Templates in ElevenCreative: sofort einsatzbereite kreative Workflows (Upload von Input → Auswahl der Vorlage → Output). Anwendungsfälle: Produktion von Hunderten Werbevarianten, Umwandlung von Selfies in animierte Cartoon-Charaktere. Verfügbar im Web und mobil mit derselben Anzahl von Schritten unabhängig vom Projekt. 625.254 Aufrufe der X-Ankündigung.

🔗 ElevenCreative Templates

xAI — API-Konsolidierung und Hermes Agent

Ausmusterung von 8 API-Modellen — Weiterleitung zu Grok 4.3

15. Mai — xAI zieht um 12 Uhr PT 8 Modelle aus seiner API zurück: grok-4-1-fast-reasoning, grok-4-1-fast-non-reasoning, grok-4-fast-reasoning, grok-4-fast-non-reasoning, grok-4-0709, grok-code-fast-1, grok-3, grok-imagine-image-pro. Die Slugs bleiben gültig, werden aber automatisch weitergeleitet.

Weiterleitung	Preisgestaltung
Textmodelle → `grok-4.3`	$1,25/1M Tokens Eingabe, $2,50/1M Tokens Ausgabe
Reasoning-Modelle → `grok-4.3` mit `low reasoning effort`	—
Nicht-Reasoning-Modelle → `grok-4.3` mit `none reasoning effort`	—
`grok-imagine-image-pro` → `grok-imagine-image-quality`	—

Entwickler werden ermutigt, explizit zu migrieren, um die abgerechnete Reasoning-Stufe zu kontrollieren.

🔗 xAI-Migration — 15. Mai

Grok in Hermes Agent von Nous Research

15. Mai — xAI integriert sich in Hermes Agent, den Open-Source-Agenten mit persistierendem Speicher von Nous Research. Grok-Abonnenten (jeder Tarif) können ihr Abonnement in Hermes verwenden, das dauerhaft auf Computer, Sandbox oder VPS läuft. Hermes greift auf Grok 4.3 (Text und Reasoning), Grok TTS (Sprachantworten) und Grok Imagine (Bilder/Videos) zu. Kompatibel mit WhatsApp, Discord, Telegram, Signal. Installation: curl -fsSL .../install.sh | bash + hermes model → xAI Grok OAuth auswählen.

🔗 Grok + Hermes Agent

Perplexity Computer — Security-by-default-Architektur

13. Mai — Perplexity veröffentlicht die technischen Details der Sicherheitsarchitektur von Perplexity Computer. Jede Aufgabe läuft in ihrer eigenen, hardwareisolierten (hardware-isolated) Sandbox mit VPC-Netzwerkisolierung. Externer Inhalt wird parallel von ML-Klassifikatoren und dem Modell BrowseSafe gescannt, bevor die Agenten handeln. Mehrschichtige Architektur für Computer-Use-Agenten in Enterprise-Umgebungen.

🔗 Perplexity Computer Sicherheit

ChatGPT — Sicherheit in sensiblen Gesprächen

14. Mai — OpenAI erläutert die Safety summaries von ChatGPT: kurze sachliche Notizen zum relevanten Sicherheitskontext früherer Gespräche, erzeugt von einem Modell, das für Sicherheits-Reasoning trainiert wurde. Der Mechanismus adressiert den Fall, dass eine Nachricht isoliert harmlos erscheint, aber im Kontext eines langen Gesprächs ein Risiko offenbart.

Szenario	Verbesserung
Suizid/Selbstverletzung (langes Gespräch)	+50% sichere Antworten
Schaden an anderen (langes Gespräch)	+16%
Schaden an anderen (GPT-5.5 Instant, mehrere Gespräche)	+52%
Suizid/Selbstverletzung (GPT-5.5 Instant, mehrere Gespräche)	+39%

Relevanzscore der Zusammenfassungen: 4,93/5 auf Basis von über 4.000 Bewertungen. Entwickelt mit Psychiatern und Psychologen, die auf Suizidprävention und forensische Psychologie spezialisiert sind. Keine Verschlechterung in normalen Gesprächen festgestellt.

🔗 Safety summaries ChatGPT

OpenAI — Reaktion auf den npm-TanStack-Supply-Chain-Angriff

13. Mai — OpenAI war von dem Angriff “Mini Shai-Hulud” betroffen, der die Open-Source-Bibliothek TanStack npm ins Visier nahm und am 11. Mai identifiziert wurde. Zwei Geräte von Mitarbeitern wurden kompromittiert, mit eingeschränktem Zugriff auf interne Quellcode-Repositories. Keine Nutzerdaten kompromittiert, kein geistiges Eigentum betroffen.

MacOS-Nutzer müssen ihre Anwendungen vor dem 12. Juni 2026 aktualisieren — nach diesem Datum funktionieren mit den alten Zertifikaten signierte Versionen nicht mehr:

MacOS-Anwendung	Letzte Version mit altem Zertifikat
ChatGPT Desktop	1.2026.125
Codex App	26.506.31421
Codex CLI	0.130.0
Atlas	1.2026.119.1

Für Windows und iOS ist keine Aktion erforderlich.

🔗 OpenAI-Reaktion — TanStack

Gemini CLI v0.42.0

13. Mai — Gemini CLI veröffentlicht Version v0.42.0 mit drei Hauptfunktionen:

Neuheit	Beschreibung
Auto Memory Inbox	Kanonische Verwaltung von Skills über den “canonical-patch”-Vertrag; Überprüfung und Validierung der in der Sitzung extrahierten Memories
Gemma 4 standardmäßig	Für alle Nutzer über die Gemini-API aktiviert, ohne zusätzliche Konfiguration
Verbesserungen im Sprachmodus	Visuelle Wellenanimationen, Datenschutz- und Compliance-Warnungen für Gemini Live

Weitere Änderungen: Flag --delete für den Befehl /exit, neuer Befehl /commands list, LaTeX-Rendering in Unicode im Terminal.

🔗 Gemini CLI v0.42.0

Cohere Project Pursue — Compass auf deklassifizierten UFO-Archiven

14. Mai — Cohere startet Project Pursue, ein fiktives deklassifiziertes UFO/UAP-Archiv (Stil der 90er, Ästhetik “Netscape Navigator 4.7”), basierend auf echten deklassifizierten US-Regierungsdokumenten, die am 8. Mai 2026 veröffentlicht wurden (FBI, CIA, State Department). Die Demo ist ein Schaufenster für Cohere Compass, ihr Produkt für intelligente Suche in unstrukturierten Daten — Scans handschriftlicher und maschinenschriftlicher Dokumente. Kreative Kampagne mit 35.320 Aufrufen und 126 Lesezeichen.

🔗 Project Pursue

Kurzmeldungen

Grok Code Fast 1 auf Copilot veraltet — Veraltung wirksam ab dem 15. Mai für alle GitHub-Copilot-Erfahrungen (Chat, inline edits, ask/agent, completion). Vorgeschlagene Alternativen: GPT-5 mini oder Claude Haiku 4.5. 🔗 Ankündigung
Timestamp-Felder in GitHub Projects — drei neue native Felder (Created, Updated, Closed), die zu jeder Ansicht hinzugefügt werden können, um nach Erstellungs-, Änderungs- oder Abschlussdaten zu sortieren und zu filtern. 🔗 Ankündigung
Enterprise Installation API — public preview — Eine GitHub App kann jetzt ihre Installation auf einer Enterprise entdecken und ihre Installation ID über die neue API abrufen und damit eine Lücke im Vergleich zu den bestehenden Org-/Repo-/User-APIs schließen. 🔗 Ankündigung
Runway AI Festival 4. Ausgabe — 10 Finalistenfilme — 10 Filme wurden für das 4. internationale KI-Festival von Runway ausgewählt. Veranstaltungen in NY (11. Juni) und LA (18. Juni 2026). 🔗 Ankündigung
Suno — erweiterte Benutzerprofile — Upload eines Titelbilds, Bearbeitung der Bio, Hinzufügen sozialer Links, Anheften von 5 Songs mit Captions, Anzeige von Playlists. 🔗 Suno auf X
Codex auf Windows — Engineering-Artikel — David Wiesen (OpenAI) erläutert die Windows-Sandbox-Architektur von Codex: synthetische SIDs, eingeschränkt beschreibbare Tokens, dedizierte Benutzer (CodexSandboxOffline, CodexSandboxOnline), Windows-Firewall-Regeln. Fazit: Windows bietet keine einzelne Primitive; die Lösung ist eine Zusammensetzung mehrerer Mechanismen. 🔗 Artikel

Was das bedeutet

Die Agentic-Coding-CLI wird zum Dreikampf. Innerhalb weniger Wochen treten Claude Code (Anthropic), Gemini CLI (Google) und Grok Build (xAI) direkt im selben Segment gegeneinander an: den vom Terminal aus gesteuerten Entwicklungsagenten. Grok Build bringt 2M Tokens Kontext und eine Architektur paralleler Multi-Agenten mit; Claude Code antwortet mit +50% wöchentlichen Limits und Fast mode auf Opus 4.7; GitHub Copilot vereint die Erfahrung in einer dedizierten Desktop-Anwendung und einem verstärkten JetBrains-Plugin. Die Frage lautet nicht mehr „Kann ein Agent programmieren?“, sondern „Welcher Agent lässt sich am besten in meinen bestehenden Workflow integrieren?“

KI etabliert sich in Finanz- und Enterprise-Workflows in großem Maßstab. ChatGPT Personal Finance mit Plaid markiert den Einstieg von OpenAI in einen hochsensiblen Bereich — 12.000 Finanzinstitute, GPT-5.5 Thinking standardmäßig, Partnerschaft mit Intuit bis hin zur Kreditanfrage. Parallel dazu verbindet Perplexity Computer Snowflake (60.761 Aufrufe der Ankündigung) und verweist auf PayPal mit 74.000 wöchentlichen Aufgaben. PwC und Anthropic kündigen 30.000 Zertifizierungen und 70% Produktivitätsgewinne an. KI „steuert“ nicht mehr nur Experimente — sie integriert sich in Finanzsysteme und Produktions-Datenpipelines.

Die Produktion kreativer Inhalte verlagert sich hin zur konversationellen Orchestrierung. Runway Agent erzeugt nicht einfach Clips — er produziert vollständige Videos (Ton + Schnitt) aus einem Gespräch heraus. FLUX Outpainting löst Randkohärenzprobleme auf Modellebene. ElevenCreative fügt standardisierte Templates hinzu, um die Produktion von Werbung zu industrialisieren. Der gemeinsame Trend: Kreative KI geht vom punktuellen Werkzeug zur kompletten Produktionskette über, mit weniger manuellen Eingriffen zwischen den Schritten.

Die Geopolitik der KI betritt das institutionelle Register. Das Anthropic-Papier zu den Szenarien 2028 (3,8 Mio. Aufrufe) und die Gates-Foundation-Partnerschaft (200M USD) signalisieren, dass Frontier-Labore sich nicht mehr nur als Technologieunternehmen positionieren, sondern als Akteure globaler Politik. Der USA/China-Wettbewerb um Halbleiter und Frontier-Modelle wird ebenso zu einem kommerziellen Argument wie zu einer Frage nationaler Sicherheit. Die PwC-Partnerschaft, die Zertifizierungen für 30.000 Fachkräfte und die Runway-Expansion in Japan (40M USD) zeigen, dass große Organisationen KI in ihre dauerhaften Strukturen integrieren — nicht nur zu Experimentierzwecken.