Der 25. April 2026 bündelt wichtige Ankündigungen zu Frontier-Modellen und Entwickler-Tools. DeepSeek-V4 wird als Open-Source veröffentlicht und ist kostenlos auf NVIDIA Blackwell verfügbar. GPT-5.5 geht in die allgemeine Verfügbarkeit in GitHub Copilot und der OpenAI API. Die Fusion von Cohere + Aleph Alpha, unterstützt durch 600 Millionen Dollar von der Schwarz Group, legt die Grundlage für transatlantische souveräne KI. Auf der Tool-Seite erweitern Claude Code v2.1.119 und der Auto-review-Modus von Codex die Autonomie von Entwicklungsagenten.
DeepSeek-V4 überall verfügbar
Launch und Open-Source
24. April — DeepSeek kündigt gleichzeitig DeepSeek-V4-Pro und DeepSeek-V4-Flash an. V4-Pro ist ein Mixture-of-Experts-Modell mit 1,6 Billionen Parametern (49 Milliarden aktiv), mit einem Kontextfenster von einer Million tokens und angekündigten Leistungen, die mit den besten geschlossenen Modellen vergleichbar sind. V4-Flash, kompakter (284B/13B aktiv), zielt auf Anwendungsfälle mit geringer Latenz. Beide Modelle sind ab dem ersten Tag Open-Source, mit API und Demo sofort verfügbar, und der technische Bericht wurde auf Hugging Face veröffentlicht.
API-Aktion und Integrationen
25. April — DeepSeek kündigt bis zum 5. Mai 2026 (15:59 UTC) eine Aktion von -75 % auf die V4-Pro API an. Die Integrationen Claude Code, OpenCode und OpenClaw wurden aktualisiert, um das neue Modell zu unterstützen.
DeepSeek-V4-Pro kostenlos auf NVIDIA Blackwell
24. April — NVIDIA macht DeepSeek-V4-Pro kostenlos über die NVIDIA NIM API-Oberfläche auf Blackwell unter build.nvidia.com zugänglich. Die Ankündigung erzielte 160.000 Aufrufe. NVIDIA veröffentlicht außerdem die ersten Leistungskurven (Pareto frontier) von DeepSeek-V4-Pro auf Blackwell Ultra mit vLLM — ein früher Referenzpunkt für High-Performance-Deployments.
25. April — NVIDIA betont parallel die Grenzen klassischer Inferenz für Entwicklungsagenten: “Traditional inference wasn’t built for agentic coding”, in Bezug auf die hunderten API-Aufrufe, die moderne agentische Tools erzeugen.
🔗 DeepSeek-V4-Pro auf NVIDIA NIM 🔗 Blackwell Ultra Day 0
GPT-5.5 verlässt die Vorschauphase
Allgemeine Verfügbarkeit in GitHub Copilot
24. April — GPT-5.5 wird schrittweise in GitHub Copilot für die Tarife Pro+, Business und Enterprise ausgerollt. Die Verfügbarkeit umfasst VS Code, Visual Studio, die Copilot CLI, den Cloud-Agenten, github.com, die mobile App (iOS und Android), JetBrains-IDEs, Xcode und Eclipse. Der Promotions-Multiplikator ist auf 7,5× festgelegt. Enterprise- und Business-Administratoren müssen die Richtlinie in den Einstellungen aktivieren, um davon zu profitieren.
🔗 GitHub Copilot Changelog — GPT-5.5 GA
API-Zugang für Entwickler
24. April — Einen Tag nach dem öffentlichen Launch öffnet OpenAI den Zugang zu GPT-5.5 in der API. Das Modell ist über die Responses API und die Chat Completions API verfügbar, mit einem Kontextfenster von einer Million tokens. Die Variante GPT-5.5-Pro für Arbeiten mit hoher Präzision ist nur über die Responses API zugänglich.
“GPT-5.5 is available in the Responses and Chat Completions APIs with a 1M context window. GPT-5.5-pro is also available in the Responses API for higher-accuracy work.”
🇩🇪 “GPT-5.5 ist in den Responses- und Chat Completions-APIs mit einem Kontextfenster von einer Million tokens verfügbar. GPT-5.5-Pro ist ebenfalls in der Responses API für Arbeiten mit hoher Präzision verfügbar.” — @OpenAIDevs
GPT-5.5 auf Perplexity Max und Personal Computer
24. April — GPT-5.5 ist für Max-Abonnenten auf Perplexity zugänglich und wird als Standard-Orchestrierungsmodell in Personal Computer für die Tarife Pro und Max ausgerollt.
Bio Bug Bounty — Sicherheitsprogramm zur Biosicherheit
23. April — OpenAI startet ein Bug-Bounty-Programm, das der Biosicherheit von GPT-5.5 gewidmet ist. Forscher, die auf KI-Sicherheit oder Biosicherheit spezialisiert sind, werden eingeladen, einen universellen Jailbreak zu finden, der die biologischen Schutzmechanismen des Modells umgeht. Die Hauptprämie beträgt 25.000 USD für den ersten Erfolg. Bewerbungen sind bis zum 22. Juni 2026 geöffnet; die Tests finden vom 28. April bis 27. Juli 2026 statt, ausschließlich auf GPT-5.5 in Codex Desktop, nur auf Einladung und mit Vertraulichkeitsvereinbarung.
Entwickler-Tools: wachsende Autonomie
Claude Code v2.1.119
25. April — Anthropic veröffentlicht Claude Code v2.1.119, ein substanzielles Update des CLI mit mehr als vierzig Änderungen.
| Bereich | Änderung |
|---|---|
| Konfiguration | /config persistent in ~/.claude/settings.json |
| PR | --from-pr unterstützt GitLab, Bitbucket, GitHub Enterprise |
| Hooks | PostToolUse + Feld duration_ms |
| PowerShell | Automatische Genehmigung im Berechtigungsmodus |
| MCP | Verbindung von Subagent-Servern parallel |
| Fehler behoben | 40+ |
Die Persistenz der Einstellungen /config ist die sichtbarste Änderung: Präferenzen für Theme, Editor-Modus oder Verbose-Stufe überstehen Neustarts. Die Einstellung --from-pr akzeptiert nun GitLab-Merge-Request-URLs, Bitbucket-Pull-Request-URLs und GitHub Enterprise, was den Workflow auf Teams ausweitet, die GitHub.com nicht nutzen. Die Hooks PostToolUse und PostToolUseFailure erhalten jetzt das Feld duration_ms, nützlich für das Monitoring in CI/CD. Die Verbindung der MCP-Server erfolgt nun parallel, wodurch die Startzeiten von Multi-Server-Workflows reduziert werden.
Codex Auto-review — verlängerte Autonomie mit Sicherheitsnetz
24. April — OpenAI kündigt Auto-review an, einen neuen Ausführungsmodus für Codex. Dieser Modus erlaubt es Codex, bei langen Aufgaben voranzukommen, ohne bei jedem Schritt eine Genehmigung anzufordern. Ein separater Agent bewertet Schritte mit hohem Risiko vor ihrer Ausführung, was es ermöglicht, Workflows für Tests, Kompilierungen und lange Automatisierungen flüssiger zu gestalten, ohne die Sicherheit zu opfern.
Copilot für JetBrains: Inline Agent Mode in der Vorschau
24. April — Das Update des Copilot-plugin für JetBrains IDE bringt mehrere Funktionen: den Inline-Agent-Modus in der öffentlichen Vorschau (Shortcut Shift+Ctrl+I oder Shift+Cmd+I), verbesserte Next Edit Suggestions (NES) mit Wasserzeichen-Vorschauen und Remote-Änderungen sowie globale Auto-Genehmigung für Aufrufe von Agent-Tools.
NVIDIA Dynamo — Inferenz neu gedacht für Agenten
25. April — NVIDIA stellt Dynamo vor, eine Neugestaltung des Inferenz-Stacks, um den Lastprofilen agentischer Tools gerecht zu werden. Agenten wie Claude Code, Codex oder Copilot reihen pro Sitzung hunderte API-Aufrufe aneinander, mit bei jedem Schritt neu zusammengesetztem Kontext, wodurch Engpässe entstehen, die die Kosten pro token erhöhen. Dynamo kombiniert vier Komponenten: Cache-KV-sensitives Routing, für Agenten ausgelegtes Scheduling, Multi-Level-Caching und einheitliche Orchestrierung. NVIDIA kündigt bis zu 7× mehr Durchsatz mit höheren Cache-Raten und reduzierter Latenz an.
🔗 NVIDIA Dynamo — agentische Inferenz
Souveränität und Enterprise-Partnerschaften
Cohere + Aleph Alpha: transatlantische Fusion mit 600 Millionen USD von der Schwarz Group
24. April — Cohere (Kanada) und Aleph Alpha (Deutschland) kündigen ihr Fusionsprojekt an. Die Schwarz Group — die Eigentümergruppe von Lidl und Kaufland — investiert 600 Millionen USD (etwa 500 Millionen Euro) in strukturierter Finanzierung für die Series E von Cohere. Die kombinierte Plattform wird auf STACKIT, der souveränen Cloud von Schwarz Digits, gehostet.
“Sovereign AI for the world. Cohere & Aleph Alpha form transatlantic AI powerhouse anchored in Canada & Germany!”
🇩🇪 “Souveräne KI für die Welt. Cohere und Aleph Alpha bilden eine transatlantische KI-Macht mit Verankerung in Kanada und Deutschland!” — @cohere auf X
Die Vereinbarung zielt auf regulierte Sektoren, Regierungen und einen Markt für souveräne KI, der auf rund 600 Milliarden USD geschätzt wird. Sie bleibt von der Zustimmung der Aktionäre von Aleph Alpha abhängig.
Anthropic und NEC: erste globale japanische Partnerschaft
24. April — Anthropic kündigt eine strategische Partnerschaft mit der NEC Corporation an, die zum ersten globalen japanischen Partner von Anthropic wird. NEC wird Claude bei rund 30.000 Mitarbeitern der Gruppe weltweit einsetzen.
| Aspekt | Detail |
|---|---|
| Betroffene Mitarbeiter | ~30.000 (weltweite NEC Group) |
| Eingesetzte Produkte | Claude, Claude Opus 4.7, Claude Code, Claude Cowork |
| Zielsektoren | Finanzen, manufacturing, Cybersicherheit, lokale Verwaltung |
| Programm | NEC BluStellar Scenario |
Intern richtet NEC ein Center of Excellence ein, um im Rahmen der Initiative “Client Zero” ein KI-Engineering-Team im großen Maßstab aufzubauen. Für seine Kunden werden NEC und Anthropic gemeinsam Lösungen für die Bereiche Finanzen, manufacturing und japanische Kommunalverwaltungen entwickeln.
Meta arbeitet mit AWS für agentische KI für Milliarden Nutzer zusammen
24. April — Meta kündigt eine Vereinbarung mit AWS an, um zig Millionen Graviton5-Kerne in seine Infrastruktur zu integrieren. Ziel ist es, die CPU-intensiven Workloads agentischer KI für Milliarden Nutzer zu unterstützen.
Gemini: Produkt- und Forschungsupdates
Gemini Drops April 2026 — Lyria 3 Pro, Gemini Live v3.1
24. April — Google veröffentlicht die 10. Ausgabe der Gemini Drops. Lyria 3 Pro ermöglicht es, direkt in Gemini Musikstücke von bis zu 3 Minuten zu erstellen, zugänglich für Plus-, Pro- und Ultra-Abonnenten. Gemini Live v3.1 ist 20 % schneller und bietet doppelt so viel gespeicherten Kontext. Personal Intelligence wird international erweitert (außerhalb des Europäischen Wirtschaftsraums, der Schweiz, des Vereinigten Königreichs, Südkoreas, Australiens und Nigerias). Die Funktion für verzweigte Konversationen (branching) wird für 20 % der Nutzer ausgerollt.
Gemini Embedding 2 in allgemeiner Verfügbarkeit
22. April — Gemini Embedding 2 geht in die allgemeine Verfügbarkeit (GA) in der Gemini API und Vertex AI über. Das Vektorrepräsentationsmodell zielt auf semantische Suche, Retrieval-Augmented Generation (RAG) und Klassifikation.
Decoupled DiLoCo — verteiltes Multi-Regionen-Training
23. April — Google DeepMind veröffentlicht Decoupled DiLoCo, eine Methode für verteiltes Training über Netzwerke mit geringer Bandbreite. Gemma 12B wurde über 4 US-Regionen mit einem Mix aus TPU6e und TPUv5p trainiert. Die Methode ebnet den Weg für ein weltweit dezentralisiertes Modelltraining, ohne die üblicherweise erforderlichen Hochgeschwindigkeitsverbindungen zu benötigen.
🔗 Decoupled DiLoCo — Google DeepMind
Alternative Modelle: Qwen und Grok
Qwen3.6-27B — dichtes Flaggschiff-Modell für agentic coding
22. April — Alibaba veröffentlicht Qwen3.6-27B, ein dichtes Modell mit 27 Milliarden Parametern als Open Source unter Apache-2.0-Lizenz. Trotz seiner kompakten Größe übertrifft es Qwen3.5-397B-A17B — ein MoE-Modell mit 397 Milliarden Parametern, von denen 17 Milliarden aktiviert sind — bei den wichtigsten benchmarks für agentic coding, mit einem SWE-Bench Verified Score von 77,2 % gegenüber 76,2 % für seinen Vorgänger. In der Ankündigung werden drei Schwerpunkte hervorgehoben: agentic coding, das die vorherige Generation in allen großen benchmarks übertrifft, solides Text- und multimodales Reasoning und dichtes Deployment ohne MoE-Komplexität.
Das Modell unterstützt Thinking- und Non-Thinking-Modi innerhalb desselben Checkpoints. Es ist auf Hugging Face (Qwen/Qwen3.6-27B, Variante FP8 inklusive) und ModelScope verfügbar, mit einem technischen Blog und einem dedizierten Github. Die Ankündigung erzielte 3,5 Millionen Aufrufe auf X.
Qwen-Image-2.0-Pro — weltweit Platz 9 bei Text-to-Image
25. April — Alibaba Qwen veröffentlicht Qwen-Image-2.0-Pro, das im Text-to-Image-Arena-Ranking weltweit den 9. Platz und bei Porträts den 6. Platz erreicht. Das Modell ist über die Alibaba Cloud API und ModelScope verfügbar.
Grok Voice Think Fast 1.0 — #1 Tau Voice Bench
23. April — xAI startet das Modell grok-voice-think-fast-1.0 über die xAI Console API. Das Modell beansprucht den ersten Platz im Tau Voice Bench, mit integriertem Reasoning ohne zusätzliche Latenz. Es ist bereits bei Starlink für den Kundensupport in Produktion ausgerollt. Die Architektur ist vereinheitlicht und unterscheidet sich von den im April angekündigten Grok-STT/TTS-APIs.
Grok Imagine — verbesserter Lip Sync
25. April — Grok Imagine kündigt eine Verbesserung der Lippensynchronisation (lip sync) und der Audioqualität für alle Image-to-Video-Generierungen an.
Mediengenerierung und Sprachagenten
Kling AI 4K — natives Upscaling aus niedriger Auflösung
24. April — Kling AI startet Kling 4K, eine Funktion zur Bildvergrößerung in nativem 4K aus Quellen mit niedriger Auflösung. Die in “Blurry in. 4K out.” zusammengefasste Ankündigung erzielte 5,82 Millionen Aufrufe. Diese Funktion unterscheidet sich von Kling Video 3.0.
Runway integriert GPT Image 2
24. April — Runway integriert GPT Image 2 von OpenAI in seine Plattform zur Videoerstellung.
ElevenLabs × Customers Bank — Sprachagenten für Banken
24. April — ElevenLabs kündigt ein Deployment von ElevenAgents bei Customers Bank an (25 Milliarden USD an Vermögenswerten). Drei Agenten sind im Einsatz: 24/7-Kundensupport, Onboarding neuer Kunden und Echtzeit-Coaching für Berater.
ElevenLabs — Ambassador-Programm
23. April — ElevenLabs eröffnet die Bewerbungen für sein Ambassador-Programm, das zwei Stufen umfasst: Community Builders und Ambassadors, mit Credits, Goodies und frühem Zugang zu neuen Funktionen. Die Ankündigung erzielte 116.000 Aufrufe.
🔗 ElevenLabs Ambassador-Programm
Anthropic-Forschung: Sicherheit und Agenten
Wahlschutzmaßnahmen — Ergebnisse der Evaluierungen
24. April — Im Vorfeld der US-Midterms 2026 veröffentlicht Anthropic eine Bilanz seiner Wahlschutzmaßnahmen. Claude Opus 4.7 und Sonnet 4.6 erreichen in Evaluierungen, die die Ausgewogenheit politischer Antworten messen, jeweils 95 % und 96 %.
| Modell | Politische Konformität | Ablehnung von Einflussoperationen | Websuche aktiviert |
|---|---|---|---|
| Opus 4.7 | 100 % | 94 % | 92 % |
| Sonnet 4.6 | 99,8 % | 90 % | 95 % |
Ein TurboVote-Banner (eine unparteiische Ressource von Democracy Works) wird auf Claude.ai angezeigt, um Nutzer zu verlässlichen Informationen über die Abstimmung bei den Midterms 2026 zu leiten.
🔗 Update zum Wahlschutz — Anthropic
Project Deal — Claude-Agenten als Verhandler
24. April — Anthropic veröffentlicht die Ergebnisse von Project Deal, einem internen Experiment zu KI-Agenten in einem Craigslist-ähnlichen Marktplatz. Eine Woche lang vertraten Claude-Agenten die Mitarbeitenden des Büros in San Francisco beim Kauf und Verkauf von Gegenständen unter Kollegen. Insgesamt wurden 186 Deals mit vier Modellkonfigurationen parallel abgeschlossen.
| Metrik | Wert |
|---|---|
| Dauer | 1 Woche |
| Konfigurationen | 4 (nur Opus 4.7, nur Haiku, 2 Mischungen) |
| Abgeschlossene Deals | 186 |
| Vorteil Opus gegenüber Haiku | +2 Deals im Durchschnitt, höhere Preise |
| Effekt aggressiver Anweisungen | Statistisch nicht signifikant |
“New Anthropic research: Project Deal. We created a marketplace for employees in our San Francisco office—like Craigslist—where Claude agents negotiated deals on their behalf.”
🇩🇪 “Neue Anthropic-Forschung: Project Deal. Wir haben einen Marktplatz für die Mitarbeitenden unseres Büros in San Francisco geschaffen — ähnlich wie Craigslist — auf dem Claude-Agenten in ihrem Namen Deals verhandelten.” — @AnthropicAI auf X
Die bemerkenswerteste Erkenntnis: Aggressive Anweisungen („verhandle hart“) hatten keinen statistisch signifikanten Effekt auf die Ergebnisse — nicht wegen einer schlechten Befolgung der Anweisungen, sondern wegen der markteigenen Zwänge.
Was das bedeutet
Der Tag des 25. April veranschaulicht eine schnelle Konsolidierung rund um einige grundlegende Trends. Bei Frontier-Modellen setzen DeepSeek-V4 und GPT-5.5 eine neue Untergrenze für frei zugängliche Fähigkeiten: Eine Million tokens Kontext ist kein Premium-Differenzierungsmerkmal mehr. Die kostenlose Verfügbarkeit von DeepSeek-V4-Pro auf NVIDIA Blackwell, kombiniert mit der API-Aktion von -75 %, signalisiert einen direkten Preiswettbewerb mit geschlossenen Modellen.
Auf der Seite der Entwickler-Tools konkretisiert sich die Ausweitung agentischer Autonomie gleichzeitig an mehreren Fronten — Claude Code v2.1.119, Codex Auto-review, Inline Agent Mode in JetBrains. Diese Updates laufen auf dasselbe Ziel hinaus: menschliche Unterbrechungen in langen Pipelines zu verringern und zugleich Kontrollpunkte für risikobehaftete Operationen beizubehalten. Die Frage nach dem rechtlichen Rahmen für Agenten, die in unserem Namen handeln, die durch Project Deal aufgeworfen wird, erhält in diesem Kontext besondere Bedeutung.
Die Fusion von Cohere + Aleph Alpha mit 600 Millionen USD von der Schwarz Group ist das prägendste Signal für souveräne europäische KI. Sie schafft einen transatlantischen Akteur, der auf Regierungen und regulierte Sektoren ausgerichtet ist, mit einer dedizierten Cloud-Infrastruktur (STACKIT), in einem auf 600 Milliarden USD geschätzten Markt. Die parallele Partnerschaft von Anthropic + NEC zeigt, dass sich dieselbe Souveränitätslogik auf Asien ausdehnt.
Quellen
- CHANGELOG Claude Code v2.1.119
- Anthropic und NEC
- Wahlschutz — Anthropic
- Project Deal — Anthropic
- GPT-5.5 API OpenAI
- Codex Auto-review
- GPT-5.5 Bio Bug Bounty
- Gemini Drops April 2026
- Gemini Embedding 2 GA
- Decoupled DiLoCo — Google DeepMind
- DeepSeek-V4 Start
- API-Aktion DeepSeek-V4-Pro
- Meta × AWS Graviton5
- Qwen-Image-2.0-Pro
- Grok Voice Think Fast 1.0
- Grok Imagine Lippensynchronisation
- Qwen3.6-27B
- GPT-5.5 GA GitHub Copilot
- Copilot JetBrains Inline Agent Mode
- GPT-5.5 auf Perplexity Max
- Cohere × Aleph Alpha
- DeepSeek-V4-Pro auf NVIDIA NIM
- NVIDIA Blackwell Ultra Day 0
- NVIDIA Dynamo — agentische Inferenz
- Runway × GPT Image 2
- Kling AI 4K
- ElevenLabs × Customers Bank
- ElevenLabs Ambassador-Programm
Dieses Dokument wurde aus der Version fr in die Sprache de unter Verwendung des Modells gpt-5.4 übersetzt. Für weitere Informationen über den Übersetzungsprozess siehe https://gitlab.com/jls42/ai-powered-markdown-translator