ai-powered-markdown-translatorVom Fr ins Deutsche mit gpt-5.4-mini übersetzter Artikel.
Am 20. Mai 2026 bricht die KI in die fundamentale Mathematik ein: Ein OpenAI-Modell widerlegt eine 1946 von Paul Erdős aufgestellte Vermutung, gestützt auf einen 125-seitigen Beweis, der von Mathematikern einschließlich des Fields-Medaillengewinners Tim Gowers validiert wurde. Bei den Modellen veröffentlicht Cohere Command A+ als Open Source unter Apache 2.0 (MoE-Architektur mit 218B/25B aktiven Parametern), NVIDIA bringt Nemotron-Labs-Diffusion mit paralleler Token-Generierung heraus, und Stability AI präsentiert Stable Audio 3.0 (4 Open-Weights-Modelle). Bei den Werkzeugen entwickelt sich GitHub Copilot gleichzeitig an vier Fronten weiter, und Claude Code veröffentlicht innerhalb von 24 Stunden zwei Versionen.
OpenAI widerlegt eine 80 Jahre alte Erdős-Vermutung
20. Mai — OpenAI hat ein neuartiges Ergebnis veröffentlicht: Ein internes Modell für allgemeines Reasoning hat das Problem der einheitslangen planaren Abstände (planar unit distance problem) gelöst, eine offene Frage, seit Paul Erdős sie 1946 formulierte. Das Problem fragt nach der maximalen Anzahl von Punktpaaren mit exakt Abstand 1 unter n Punkten in der Ebene. Seit den 1940er-Jahren war die mathematische Gemeinschaft der Ansicht, dass Erdős’ Gitterkonstruktionen im Wesentlichen optimal seien.
Das Modell lieferte einen Beweis, der die Existenz einer unendlichen Familie von Konfigurationen zeigt, die die vermutete Schranke übertrifft, mit einem von Will Sawin (Princeton) festgelegten Exponenten δ = 0,014. Der Durchbruch beruht auf einem unerwarteten mathematischen Werkzeug: unendlichen Klassenkörpertürmen und der Golod-Shafarevich-Theorie aus der algebraischen Zahlentheorie, angewandt auf ein elementares Problem der euklidischen Geometrie. Diese Verbindung zwischen zwei a priori weit entfernten Gebieten ist nach Aussage der beteiligten Mathematiker der Kern der Originalität des Ergebnisses.
| Aspekt | Detail |
|---|---|
| Problem | Einheitslange planare Abstände (Erdős, 1946) |
| Frühere Schranke | Wachstum in n^(1+C/loglog(n)) (Spencer-Szemerédi-Trotter, 1984) |
| Neues Ergebnis | n^(1+δ), δ = 0,014 |
| Mathematisches Werkzeug | Algebraische Zahlentheorie (Golod-Shafarevich) |
| Modell | Internes allgemeines Reasoning-Modell (nicht benannt) |
| Länge der Gedankenkette | 125 Seiten |
| Validierung | Gruppe externer Mathematiker + Begleitartikel |
Was das Ergebnis besonders bemerkenswert macht: Es wurde nicht von einem System erzeugt, das speziell für Mathematik trainiert oder auf dieses Problem ausgerichtet war. Es ist ein Modell für allgemeine Zwecke, das im Rahmen einer breiteren Untersuchung der Fähigkeiten autonomer Forschung an einer Sammlung von Erdős-Problemen bewertet wurde.
Tim Gowers (Fields-Medaille) bezeichnet das Ergebnis als “milestone in AI mathematics”. Arul Shankar (Princeton) geht noch weiter:
“In my opinion this paper demonstrates that current AI models go beyond just helpers to human mathematicians – they are capable of having original ingenious ideas, and then carrying them out to fruition.”
🇩🇪 Meiner Ansicht nach zeigt dieser Artikel, dass die heutigen KI-Modelle über die bloße Rolle von Assistenten für Mathematiker hinausgehen — sie sind in der Lage, originelle und einfallsreiche Ideen zu entwickeln und sie zu Ende zu führen. — [Arul Shankar, Zahlentheoretiker, Princeton]
OpenAI sieht in diesem Ergebnis ein Signal für die Grundlagenforschung: Wenn ein Modell komplexes Reasoning über 125 Seiten aufrechterhalten und weit entfernte mathematische Gebiete verbinden kann, dann sind diese Fähigkeiten auf Biologie, Physik, Materialien und Medizin übertragbar.
Cohere Command A+ — open-source MoE-Flaggschiff
20. Mai — Cohere bringt Command A+ heraus, sein bislang leistungsstärkstes Modell, als Open Source unter der Apache-2.0-Lizenz. Die Mixture-of-Experts-Architektur (sparse MoE) umfasst 218B Gesamtparameter, aber nur 25B aktive Parameter pro Inferenz, was den Betrieb auf zwei NVIDIA-H100-GPUs oder einer einzelnen Blackwell-GPU (B200) in W4A4-Quantisierung ermöglicht.
Command A+ vereint unter einem einzigen Modell die zuvor auf Command A Reasoning, Command A Vision und Command A Translate verteilten Fähigkeiten. Es unterstützt 48 Sprachen (gegenüber 23 bei den vorherigen Versionen) und verfügt über einen verbesserten Tokenizer für nicht-europäische Sprachen (+20% für Arabisch, +16% für Koreanisch, +18% für Japanisch).
| Benchmark | Command A+ | Command A Reasoning |
|---|---|---|
| τ²-Bench Telecom | 85% | 37% |
| Terminal-Bench Hard | 25% | 3% |
| MMMU | 75,1% | N/A |
| MathVista | 80,6% | 73,5% |
| North Agentic QA | +20% Verbesserung | Referenz |
| North Data Analysis | +32% Verbesserung | Referenz |
Das Modell ist bis zu 2× schneller und 30% latenzärmer als Command A Reasoning, wobei speculative decoding einen zusätzlichen Gewinn von 1,5–1,6× bietet. Verfügbar auf Hugging Face und über vLLM. Der Score von 37 auf dem Artificial Analysis Intelligence Index macht es zum besten unter den Open-Source-Modellen.
“Introducing: Cohere Command A+ — We’ve created our most powerful LLM yet, optimized it to run on as little hardware as possible, and released it open-source for all.”
🇩🇪 Hier ist Cohere Command A+ — wir haben unser bisher leistungsstärkstes LLM entwickelt, optimiert dafür, mit so wenig Hardware wie möglich zu laufen, und veröffentlichen es als Open Source für alle. — @cohere auf X
Gemini for Science — KI als Partner wissenschaftlicher Entdeckung
20. Mai — Angekündigt auf der Google I/O 2026 und am 20. Mai getwittert, ist Gemini for Science eine Suite experimenteller Werkzeuge für die wissenschaftliche Forschung. Angesichts der Explosion der Daten besteht das Ziel darin, Forschenden zu ermöglichen, Informationen zu verbinden, die kein einzelner Mensch allein verarbeiten kann.
Drei experimentelle Werkzeuge werden vorgestellt:
| Werkzeug | Grundlage | Funktion |
|---|---|---|
| Hypothesis Generation | Co-Scientist | Entdeckung und Verfeinerung neuer Hypothesen |
| Computational Discovery | AlphaEvolve + ERA | Tests Tausender Code-Variationen parallel |
| Science Skills | 30+ Bio-Modelle | Integriertes Bundle für agentische Plattformen (Antigravity) |
Computational Discovery ist das technisch anspruchsvollste Werkzeug: Es erzeugt und bewertet Tausende von Code-Variationen parallel und ermöglicht es, neue Modellierungsansätze in Epidemiologie, Chemie oder der computationalen Biologie in einem Bruchteil der üblichen Zeit zu testen.
Science Skills integriert Daten von mehr als 30 großen Modellen aus den Lebenswissenschaften und Datenbanken und verbindet sich mit agentischen Plattformen, um komplexe manuelle Workflows in wenigen Minuten zu automatisieren.
Das Projekt wurde gemeinsam mit über 100 Partnerinstitutionen entwickelt, von Doktorandinnen und Doktoranden bis hin zu Nobelpreisträgern.
NVIDIA Nemotron-Labs-Diffusion — Token-Diffusionsarchitektur
20. Mai — NVIDIA kündigt Nemotron-Labs-Diffusion an, ein Sprachmodell, das Tokens parallel mittels Diffusion erzeugt, im Gegensatz zu klassischen autoregressiven LLMs, die jeweils nur ein Token auf einmal produzieren. Diese Architektur — inspiriert von Diffusionsmodellen für die Bildgenerierung — soll die Inferenz beschleunigen und gleichzeitig die Qualität der Ausgaben erhalten.
Der Ansatz unterscheidet sich grundlegend vom Standard-Transformer-Paradigma: Anstatt jedes Token sequentiell und unter Bedingung auf die vorherigen zu prognostizieren, iteriert das Modell parallel über eine gesamte Sequenz verrauschter Tokens, bis zur Konvergenz. Zu den theoretischen Vorteilen gehören geringere Latenz bei langen Ausgaben und bessere Parallelisierung auf GPUs.
| Aspekt | Klassisch (autoregressiv) | Nemotron-Labs-Diffusion |
|---|---|---|
| Generierung | Token für Token, sequenziell | Parallel über die gesamte Sequenz |
| Latenz bei langen Ausgaben | Steigt linear | Potenziell reduziert |
| Paradigma | GPT-style | Diffusion-style |
Der vollständige technische Bericht begleitet die Veröffentlichung. Es handelt sich um einen Forschungsbeitrag von NVIDIA Labs, positioniert als architektonische Alternative zum dominierenden autoregressiven Transformer-Modell — ein aktives Forschungsfeld seit dem Aufkommen von Text-Diffusionsmodellen wie MDLM und Plaid.
Stability AI — Stable Audio 3.0 (Open-Weights-Familie)
20. Mai — Stability AI veröffentlicht Stable Audio 3.0, eine Familie von 4 Open-Weights-Audiomodellen unter kommerzieller Lizenz. Die Produktreihe deckt das gesamte Spektrum der Bereitstellung ab, von eingebetteten Geräten bis zur Enterprise-API.
| Modell | Maximale Länge | Bereitstellung | Open weights |
|---|---|---|---|
| Small SFX | kurz | on-device | Ja |
| Small | 2 min | on-device | Ja |
| Medium | 6:20 | cloud/local | Ja |
| Large | 6:20+ | API/Unternehmen | Nein |
Die Modelle Small SFX, Small und Medium sind auf Hugging Face verfügbar. Alle Trainingsdaten sind vollständig lizenziert, mit angekündigten Partnerschaften mit Universal Music Group und Warner Music Group. Zu den erweiterten Funktionen gehören Unterstützung für LoRA-Training für individuelles Fine-Tuning sowie ein Audio-Inpainting-Modus (Bearbeitung von Einzel- und Mehrfachsegmenten, kausale Fortsetzung).
“We want to foster the same kind of community-driven innovation in audio that we sparked in image generation with the launch of Stable Diffusion.”
🇩🇪 Wir wollen dieselbe Art von von der Community getragener Innovation im Audio-Bereich fördern, die wir mit der Einführung von Stable Diffusion bei der Bildgenerierung ausgelöst haben. — Stability AI
GitHub Copilot entwickelt sich an vier Fronten weiter
Adaptive Auto-Modelauswahl in VS Code
20. Mai — Die Option “Auto” von Copilot VS Code wählt nun das optimale Modell je nach Art der Aufgabe aus: komplexes Reasoning, einfache Codegenerierung, Debugging oder Tool-Orchestrierung. Die Auswahl stützt sich auf Echtzeitmetriken zu Verfügbarkeit und Zuverlässigkeit. Praktischer Vorteil: 10% weniger Premium-Request-Multiplikator bei der Nutzung von Auto, ohne erforderliche Konfiguration.
Semantische Suche nach Issues in natürlicher Sprache
20. Mai — Copilot Chat im Web integriert einen semantischen Issue-Index: Ein Entwickler kann nach “den im letzten Monat gemeldeten Mobile-Rendering-Bugs” suchen, ohne den exakten Titel zu kennen, und erhält nach Kontext gruppierte Ergebnisse. Allgemein verfügbar für alle Copilot-Pläne.
Entfernen der Gemini-Modelle aus Copilot Chat im Web
20. Mai — Alle Gemini-Modelle werden aus Copilot Chat auf github.com entfernt, ebenso wie GPT-5.2 Codex und GPT-5.4 nano. Im Web bleiben nur OpenAI und Claude verfügbar. GitHub begründet die Entscheidung mit der Konsistenz der Antwortqualität. Gemini bleibt in IDEs und in der API verfügbar.
Fix with Copilot — gebündelte Anwendung von Code-Review-Feedback
19. Mai — Die Schaltfläche “Implement suggestion” wird in “Fix with Copilot” umbenannt, mit einem neuen Dialogfenster (Modellwahl, Ziel-Branch, benutzerdefinierte Anweisungen). Eine neue Schaltfläche “Fix batch with Copilot” ermöglicht es, mehrere Code-Review-Kommentare zu bündeln und sie gleichzeitig dem Copilot Cloud Agent zu übergeben, wodurch die Reibung bei PRs mit vielen Kommentaren reduziert wird.
Claude Code v2.1.144 und v2.1.145
19. Mai — Claude Code veröffentlicht zwei Versionen innerhalb von 24 Stunden mit einer beträchtlichen Reihe neuer Funktionen und Fehlerbehebungen.
Die Version 2.1.144 verbessert das Management von Hintergrundsitzungen: Der Befehl /resume zeigt nun die --bg-Sitzungen an, und Benachrichtigungen über das Ende von Subagenten enthalten die Dauer (z. B. “Agent completed · 3h 2m 5s”). Der Befehl /model gilt nur für die aktuelle Sitzung (für das dauerhafte Standardverhalten d drücken). Die Umbenennung von “extra usage” in “usage credits” schafft Klarheit in der Terminologie, und die Behebung eines Start-Hangs von bis zu 75 Sekunden, wenn api.anthropic.com nicht erreichbar ist (VPN, Firewall), verbessert die Erfahrung im Unternehmensumfeld.
Die Version 2.1.145 zeichnet sich durch die Einführung von claude agents --json aus, einem Befehl für die Integration in Shell-Skripte (tmux-resurrect, Statusleisten, Sitzungsselektoren). Das OpenTelemetry-Tracking wird mit agent_id und parent_agent_id in den Spans angereichert, wodurch eine korrekte Hierarchie der Subagenten möglich wird. Der /plugin-Bildschirm zeigt nun vor der Installation den vollständigen Inhalt an (Befehle, Agenten, Skills, Hooks, MCP-/LSP-Server). Die Stop/SubagentStop-Hooks erhalten zwei neue Felder: background_tasks und session_crons.
Anthropic eröffnet die Reflexion über die Charakterbildung von KI
19. Mai — Anthropic hat einen Artikel veröffentlicht, der eine Initiative regelmäßiger Dialoge mit Philosophen, Geistlichen und Ethikern aus mehr als 15 religiösen und kulturellen Traditionen beschreibt. Ziel ist es, die Reflexion darüber zu vertiefen, was es bedeutet, den Charakter eines KI-Systems zu formen — gestützt auf Jahrhunderte gesammelten Denkens über Tugend und das gute Leben, ohne Claude auf eine bestimmte Tradition auszurichten.
Ein experimentelles Ergebnis verdient Beachtung: ein Werkzeug, das Claude während einer Aufgabe aufrufen kann, um seine eigenen ethischen Verpflichtungen erneut zu überprüfen. Spontan vor Aktionen mit hoher Auswirkung eingesetzt, zeigte es “eine deutliche Verringerung nicht ausgerichteten Verhaltens” in internen Bewertungen. Zu den nächsten Schritten gehören Gespräche mit Juristen, Psychologen und zivilgesellschaftlichen Institutionen.
Cohere — MOUs mit Indra Group und Multiverse Computing
20. Mai — Cohere unterzeichnet zwei Absichtserklärungen (MOU) während des Staatsbesuchs von König Felipe VI. von Spanien in Kanada. Die erste verbindet Cohere mit IndraMind (der KI-Sparte der spanischen Indra-Gruppe für Verteidigung und Digitalisierung), um ein Ökosystem souveräner KI aufzubauen, einschließlich sprachlicher Anpassungen für die fünf Amtssprachen Spaniens. Ein Verteidigungsbereich sieht Analyse- und Planungsfähigkeiten für multinationale Übungen vor. Die zweite bezieht Multiverse Computing ein (KI-gestützte Optimierung mit quanteninspirierter Methode, Spanien/Kanada), um kommerzielle Chancen in Europa und Kanada zu erkunden.
“Enterprises no longer want to rent AI — they want to own it.”
🇩🇪 Unternehmen wollen KI nicht mehr mieten — sie wollen sie besitzen. — Aidan Gomez, Mitgründer und CEO von Cohere
Perplexity — Kontextkomprimierung, die auf die Anfrage zugeschnitten ist, in der Produktion
20. Mai — Perplexity rollt in der Produktion ein System zur Kontextkomprimierung (query-aware context compression) aus, das die Anzahl der Kontext-Tokens um bis zu 70 % reduziert und gleichzeitig die Antwortgenauigkeit verbessert. Das Prinzip: Ein leichtgewichtiges Modell extrahiert chirurgisch die für die Anfrage relevanten Passagen, bevor sie an das Haupt-LLM weitergegeben werden, und entfernt Werbung, Metadaten und themenfremde Inhalte.
| Metrik | Wert |
|---|---|
| Reduktion der Kontext-Tokens | bis zu 70 % |
| Gewinn an vitalem Inhalt pro Auszug | +63% |
| Reduktion der Inferenzlatenz | 35–40% |
| Reduktion der aggregierten GPU-Berechnung | 40–45% |
| Produktionslatenz (p99) | < 20 ms |
Das Backbone pplx-diffusion (17 Schichten, von 28 Schichten destilliert) sagt parallel voraus, welche Segmente ohne Texterzeugung beibehalten werden sollen — ein extraktiver Ansatz, der die Treue der Zitate garantiert. Auf SimpleQA erreicht das Preset “medium” mit Kompression 95 % Genauigkeit bei durchschnittlich nur 200 Tokens pro Dokument.
ElevenLabs — Speech Engine, ein Sprachagent in einem Prompt
20. Mai — ElevenLabs führt Speech Engine ein, eine vereinheitlichte Sprach-Pipeline (Sprachsynthese + Transkription + Orchestrierung), mit der Entwickler einen textbasierten Konversationsagenten mit nur einem Prompt in einen vollständigen Sprachagenten verwandeln können. Verfügbar in ElevenAPI, beträgt die Preisgestaltung 8 Cent pro Minute mit Volumenrabatten. Migration zu ElevenAgents ist für zusätzliche Bereitstellungskanäle mit Monitoring und Analytics möglich.
Luma Agents integriert Seedance 2.0
19. Mai — Luma Agents integriert Seedance 2.0, das Videogenerierungsmodell von ByteDance, in seine Plattform für kreative Agenten. Dasselbe Workflow wie bei den anderen bereits integrierten Modellen. Diese Integration erweitert die Auswahl an Modellen, die über Luma Agents zugänglich sind, und positioniert die Plattform als Multi-Modell-Orchestrierungs-Hub für KI-Videos.
Kling AI in Cannes — House of David, der erste Hollywood-Film mit KI im industriellen Maßstab
20. Mai — Beim Festival von Cannes 2026 bestätigt Kling AI den industriellen Einsatz seiner Technologie in House of David (Prime Video): 44 Millionen weltweite Zuschauer, Top 10 der neuen Serien in den USA, Nummer 1 auf Prime Video US. Es ist die erste Hollywood-Produktion, die öffentlich die Integration von KI-Videogenerierung in ihre groß angelegte Produktionspipeline anerkennt, mit kohärenten Plänen, die strengen industriellen Standards entsprechen.
Kurzmeldungen
-
Running Guide Agent — Google DeepMind — Persönlicher KI-Agent für das Lauftraining, vorgestellt als „ein Schritt in Richtung eines grenzenlosen Laufs“. 🔗 DeepMind-Blog
-
Midjourney V8.1 — Flag
--nowieder eingeführt — Der Anti-Prompting-Flag ist in V8.1 zurück, um Elemente aus generierten Bildern auszuschließen (z. B.--no people). 🔗 Ankündigung @midjourney -
Anthropic
/usagein Claude Code überarbeitet — Boris Cherny bestätigt eine Überarbeitung der/usage-UI, um den Tokenverbrauch als Antwort auf einen Nutzer besser zu visualisieren. 🔗 Quelle -
MiniMax Speech 2.8 Turbo — 600+ Stimmen auf Together AI — Mehr als 600 neue Speech-2.8-Turbo-Stimmen sind jetzt auf der Together-AI-Plattform verfügbar. 🔗 Ankündigung @MiniMax_AI
Was das bedeutet
Grundlagenforschung und autonome KI. Der Beweis der Erdős-Vermutung durch ein allgemeines OpenAI-Modell ist nicht anekdotisch. Was die beteiligten Mathematiker beeindruckt, ist die Natur des Ergebnisses: eine unerwartete Verbindung zwischen zwei Zweigen der Mathematik (algebraische Zahlentheorie und diskrete Geometrie), über 125 Seiten kohärenten Schlussfolgerns hinweg aufrechterhalten. Zusammen mit Gemini for Science (entwickelt mit mehr als 100 Institutionen) ist der Trend klar: KI beginnt sich nicht mehr nur als Werkzeug zur Verarbeitung wissenschaftlicher Daten zu integrieren, sondern als Entdeckungspartner, der in der Lage ist, originelle Hypothesen zu generieren.
Alternative Architekturen zum autoregressiven Paradigma. Zwei heutige Ankündigungen stellen das dominante GPT-artige Modell infrage. NVIDIA Nemotron-Labs-Diffusion erzeugt Tokens parallel mittels Diffusion statt sequenziell. Stable Audio 3.0 von Stability AI zeigt, dass Diffusion hochwertige musikalische Ergebnisse mit Open-Weights-Modellen auf vier Bereitstellungsstufen liefert. Die Konvergenz dieser Ansätze legt nahe, dass Diffusion nicht mehr auf die Bildgenerierung beschränkt ist — sie wird zu einer ernstzunehmenden konkurrierenden Architektur für Text und Audio.
Souveränität und Unternehmens-KI. Command A+ (MoE 218B Open-Source, Apache 2.0, 2× H100) und die MOUs von Cohere mit Indra Group und Multiverse Computing veranschaulichen einen grundlegenden Trend: Große Organisationen — Regierungen, Verteidigung, regulierte Branchen — wollen ihre Modelle in ihrer eigenen Infrastruktur betreiben. Die Kombination aus einer effizienten MoE-Architektur (25B aktiv bei 218B insgesamt) und einer Apache-2.0-Lizenz macht Command A+ zum am besten positionierten Open-Source-Modell für souveräne Bereitstellungen Ende Mai 2026.
Wachsende Belastung für Developer-Tooling. Claude Code 2.1.144 und 2.1.145, die vier gleichzeitigen GitHub-Copilot-Updates und die Kontextkomprimierung von Perplexity (-70% Tokens, -40% GPU) sind konsistente Signale: Der Wettbewerb verlagert sich von der reinen Modellqualität hin zur Ergonomie der Werkzeuge, zur Skriptbarkeit (claude agents —json), zu den Inferenzkosten (Auto model selection -10%, pplx-diffusion) und zur Robustheit in der Produktion (Behebung des VPN-Blockierens in Claude Code).
Quellen
- OpenAI — Modell widerlegt Vermutung der diskreten Geometrie
- OpenAI auf X
- Cohere — Command A+ Blog
- Cohere Command A+ auf X
- Google AI — Gemini for Science auf X
- NVIDIA AI — Nemotron-Labs-Diffusion auf X
- Stability AI — Stable Audio 3.0
- GitHub Changelog — Auto model selection VS Code
- GitHub Changelog — Semantische Issuesuche
- GitHub Changelog — Verfügbare Modelle im Web
- GitHub Changelog — Mit Copilot beheben
- Claude Code CHANGELOG
- Anthropic — Den Dialog über Frontier AI erweitern
- Cohere — MOUs Indra und Multiverse Computing
- Perplexity — Query-aware context compression auf X
- Perplexity — Forschungsartikel
- ElevenLabs — Speech Engine auf X
- Luma Labs — Seedance 2.0 auf X
- Kling AI — Cannes auf X
- Google DeepMind — Running Guide Agent
- Midjourney — Flag —no auf X
- Boris Cherny — /usage überarbeitet auf X
- MiniMax — Speech 2.8 Turbo auf X