Suchen

Claude Opus 4.5: Das fortschrittlichste KI-Modell der Welt

Claude Opus 4.5: Das fortschrittlichste KI-Modell der Welt

Die Ankündigung, die KI neu definiert

24. November 2025 — Anthropic enthüllt Claude Opus 4.5, sein bisher fortschrittlichstes Modell. Vorgestellt als “das beste Modell der Welt für Coding, Agenten und Computer Use”, markiert Opus 4.5 einen bedeutenden Meilenstein in der Entwicklung von KI-Systemen.

Introducing Claude Opus 4.5: the best model in the world for coding, agents, and computer use. Opus 4.5 is a step forward in what AI systems can do, and a preview of larger changes to how work gets done.

🇩🇪 Wir stellen Claude Opus 4.5 vor: das beste Modell der Welt für Coding, Agenten und Computernutzung. Opus 4.5 ist ein Schritt nach vorn in dem, was KI-Systeme leisten können, und ein Vorgeschmack auf größere Veränderungen in der Art und Weise, wie Arbeit erledigt wird.@claudeai auf X

🔗 Offizielle Ankündigung auf anthropic.com


Warum Opus 4.5 alles verändert

Claude Opus 4.5 ist kein einfaches inkrementelles Update. Dieses Modell stellt einen qualitativen Sprung in mehreren Schlüsselbereichen dar:

Intelligentes logisches Denken

Opus 4.5 zeichnet sich durch den Umgang mit Mehrdeutigkeit und Kompromissen aus. Das Modell zeigt eine erhöhte Fähigkeit, sich in komplexen Situationen zurechtzufinden, in denen mehrere gültige Ansätze existieren, und wählt den für den Kontext am besten geeigneten aus.

Erweitertes Kontextmanagement

Dank automatischer Summarization eliminiert Opus 4.5 die Grenzen der Gesprächslänge. Das Modell kann den Kontext über längere Arbeitssitzungen ohne Leistungsabfall aufrechterhalten.

Multi-Agenten-Koordination

Einer der größten Fortschritte betrifft die Fähigkeit, Multi-Agenten-Systeme zu orchestrieren. Opus 4.5 kann mehrere autonome Prozesse koordinieren, die parallel an komplexen Aufgaben arbeiten.

Erweitertes Computer Use

Das Modell kann nun direkt manipulieren:

  • Tabellenkalkulationen — Analyse und Änderung von Excel/Sheets-Daten
  • Präsentationen — Erstellung und Bearbeitung von Folien
  • Browser — Automatisierung komplexer Webaufgaben
  • Desktop-Anwendungen — Interaktion mit nativer Software

Benchmarks: Die Zahlen sprechen

Leistung im Software Engineering

BenchmarkOpus 4.5Verbesserung
SWE-bench VerifiedState-of-the-artAbsoluter Marktführer
SWE-bench Multilingual7/8 SprachenBester in 7 Sprachen
Aider Polyglot+10.6%vs Sonnet 4.5
Vending-Bench+29%vs Sonnet 4.5
Terminal Bench+15%vs Sonnet 4.5
BrowseComp-PlusSignifikante GewinneAgentische Recherche

Ein bemerkenswerter Fakt

Bei einer internen Ingenieursprüfung von Anthropic mit einem Zeitlimit von 2 Stunden erzielte Opus 4.5 eine höhere Punktzahl als alle menschlichen Kandidaten. Eine Premiere, die das von diesem Modell erreichte Niveau verdeutlicht.


Revolutionäre Token-Effizienz

Einer der beeindruckendsten Aspekte von Opus 4.5 ist seine Token-Effizienz. Das Modell liefert gleichwertige oder bessere Ergebnisse mit deutlich weniger Token:

AufwandsniveauLeistungToken-Reduktion
Mittlerer AufwandGleich wie Sonnet 4.5-76% Token
Maximaler Aufwand+4.3% vs Sonnet 4.5-48% Token
Lange AufgabenBeibehalten-65% Token

Was das konkret bedeutet

  • Reduzierte Kosten — Weniger Token = niedrigere API-Rechnung
  • Schnellere Antworten — Weniger Generierung = reduzierte Latenz
  • Effizienteres Denken — Weniger Backtracking und redundante Erkundung

Preisgestaltung und Verfügbarkeit

API-Zugriff

ParameterWert
Model IDclaude-opus-4-5-20251101
Input Preis$5 / Million Token
Output Preis$25 / Million Token
Context Window200K Token
Thinking Budget64K Token

Verfügbare Plattformen

  • Anthropic API — Direkter Zugriff
  • AWS Bedrock — Amazon Cloud-Integration
  • Google Vertex AI — Google Cloud-Integration
  • Claude Anwendungen — claude.ai, Desktop, Mobile

Was Unternehmen sagen

Das Feedback der ersten Nutzer ist einstimmig:

GitHub Copilot

Das Modell übertrifft unsere internen Coding-Benchmarks und halbiert dabei den Token-Verbrauch. — Mario Rodriguez, Chief Product Officer

Windsurf AI

Clear winner… best frontier task planning and tool calling.

🇩🇪 Klarer Gewinner… beste Planung von Frontier-Aufgaben und Tool-Aufrufen.Jeff Wang, CEO

Replit

Using fewer tokens to solve the same problems.

🇩🇪 Verwendet weniger Token, um dieselben Probleme zu lösen.Michele Catasta, President

Warp

15% improvement over Sonnet 4.5 auf Terminal Bench für autonome Aufgaben. — Zach Lloyd, Founder

Cursor

Notable improvement with improved pricing and intelligence.

🇩🇪 Bemerkenswerte Verbesserung mit besserer Preisgestaltung und Intelligenz.Michael Truell, CEO


Produktverbesserungen

Opus 4.5 bringt mehrere Neuheiten im Claude-Ökosystem mit sich:

Claude Code — Verbesserter Plan Mode

  • Klärungsfragen vor der Ausführung
  • Vom Benutzer bearbeitbare plan.md-Dateien
  • Bessere Koordination von Änderungen über mehrere Dateien hinweg

Claude Desktop

  • Parallele lokale und Remote-Sitzungen
  • Integrierte Bildschirmaufnahme
  • Kontextfreigabe durch Klick auf Fenster
  • Sprachbefehl (Feststelltaste zum Sprechen)

Claude for Chrome (Verfügbar für alle kostenpflichtigen Pläne)

Ursprünglich in der Beta, ist Claude for Chrome seit dem 18. Dezember 2025 für alle kostenpflichtigen Pläne (Pro, Team, Enterprise) verfügbar. Die Erweiterung ermöglicht es Claude, direkt im Browser zu interagieren:

  • Autonome Navigation — Webseiten durchsuchen, klicken, Formulare ausfüllen
  • Multi-Tabs — Gleichzeitiges Arbeiten an mehreren Tabs
  • Automatisierung — Metriken extrahieren, Cloud-Dateien verwalten, Kalender vorbereiten
  • Integrationen — Google Drive, Salesforce, Gmail, CRM
  • Geplante Workflows — Tägliche oder wöchentliche Automatisierungen
  • Sicherheit — Überprüfung sensibler Aktionen vor der Ausführung

🔗 Mehr über Claude for Chrome erfahren

Weitere Integrationen

  • Claude for Excel — Beta erweitert auf Max, Team und Enterprise
  • Erweiterte Konversationen — Keine Längenbeschränkungen mehr dank Auto-Summarization

Sicherheit und Ausrichtung

Anthropic präsentiert Opus 4.5 als sein “bisher am robustesten ausgerichtetes Modell”:

Widerstand gegen Angriffe

  • Prompt Injection — Schwerer zu täuschen als jedes Konkurrenzmodell
  • Misuse Categories — Reduzierte Werte für “besorgniserregendes Verhalten”

System Card

Das Sicherheitsdokument beschreibt die Maßnahmen, die ergriffen wurden, um ein zuverlässiges und vorhersagbares Verhalten auch in komplexen Randfällen zu gewährleisten.


Technische Spezifikationen

SpezifikationWert
Context Window200K Token (Standard)
Thinking Budget64K Token (verschachtelt)
BewertungsmethodikDurchschnitt von 5 unabhängigen Versuchen
AufwandsparameterKonfigurierbar (Geschwindigkeit vs. Fähigkeit)
SamplingStandardtemperatur und Top-p

Architekturvorteile

  • Effizientes mehrstufiges Denken reduziert Backtracking
  • Optimierte Kontextkomprimierung
  • Speicherwerkzeuge für nachhaltiges Denken in langen Sitzungen

Fazit

Claude Opus 4.5 ist mehr als ein Modell-Update — es ist eine Demonstration dessen, was KI erreichen kann, wenn Effizienz und Fähigkeit gemeinsam voranschreiten.

Für Entwickler sind die Implikationen klar:

  1. Bessere Leistung bei Coding- und Automatisierungsaufgaben
  2. Reduzierte Kosten dank Token-Effizienz
  3. Neue Möglichkeiten mit Computer Use und Multi-Agenten-Koordination

Quellen