Anthropic übernimmt Vercept (Computer‑Use bei 72,5% auf OSWorld), Perplexity Computer orchestriert 19 Modelle, GitHub Copilot CLI allgemein verfügbar

Der 25. Februar 2026 ist ein dichter Tag: Anthropic übernimmt Vercept, um die Computer‑Use‑Fähigkeiten von Claude zu beschleunigen (72,5% auf OSWorld), Perplexity stellt Computer vor — ein agentischer Multi‑Modell‑Orchestrator, der 19 Modelle parallel orchestriert — und GitHub Copilot CLI wird für alle zahlenden Abonnenten allgemein verfügbar. Parallel dazu stellt Google DeepMind Genie 3 vor (interaktive World‑Models) und Intrinsic wechselt zu Google für industrielle Robotik.

Anthropic übernimmt Vercept: Computer‑Use steigt auf 72,5% bei OSWorld

25. Februar — Anthropic kündigt die Übernahme von Vercept an, einem Startup, das sich auf Wahrnehmung und Interaktion von KI‑Systemen mit Software‑Interfaces spezialisiert hat. Die Mitgründer Kiana Ehsani, Luca Weihs und Ross Girshick schließen sich Anthropic an, um die Computer‑Use‑Fähigkeiten von Claude direkt zu verstärken.

Diese Übernahme fällt in eine rasche Entwicklung beim Benchmark OSWorld, der die Fähigkeit eines KI‑Agenten misst, Aufgaben auf einem echten Betriebssystem auszuführen (Navigation in komplexen Tabellen, Ausfüllen von Multi‑Tab‑Formularen etc.):

Zeitraum	OSWorld‑Score
Ende 2024 (Einführung Computer Use)	< 15%
Claude Sonnet 4.6 (Feb. 2026)	72,5%

Ein Sprung von über 57 Punkten in einem Jahr. Claude Sonnet 4.6 nähert sich damit menschlicher Leistung bei diesen Büroaufgaben. Vercept wird sein externes Produkt in den nächsten Wochen einstellen, um sich vollständig auf diese Arbeit innerhalb von Anthropic zu konzentrieren.

Diese Übernahme folgt auf die frühere Übernahme von Bun. Anthropic baut sich so ein Portfolio aus technischen Spitzen‑Teams rund um agentische Fähigkeiten auf.

🔗 Anthropic erwirbt Vercept

Perplexity Computer: ein agentischer Multi‑Modell‑Orchestrator (19 Modelle)

25. Februar — Perplexity stellt Computer vor, ein generalistisches KI‑System, das darauf ausgelegt ist, komplette Projekte von Anfang bis Ende auszuführen. Der Nutzer beschreibt ein Endziel, Computer zerlegt die Arbeit in Unteraufgaben, erstellt spezialisierte Sub‑Agents und führt parallel aus — über Stunden oder Monate hinweg, falls nötig.

Die Ausführung ist asynchron und isoliert: Jede Aufgabe läuft in einer eigenen Umgebung mit Zugriff auf ein echtes Dateisystem, einen echten Browser und Integrationen zu realen Tools (APIs, Websuche, Dokumentengenerierung).

Was Perplexity Computer auszeichnet, ist seine Orchestrierung im Sinne von “massively multi-model” — 19 verfügbare Modelle, jeweils nach ihren Stärken zugewiesen:

Modell	Rolle
Claude Opus 4.6	Haupt‑Orchestrator (core reasoning)
Gemini	Deep research, Erstellung von Sub‑Agents
ChatGPT 5.2	Langzeit‑Kontext‑Retrieval und breite Suche
Grok	Leichte Aufgaben (Geschwindigkeit)
Veo 3.1	Videogenerierung
Nano Banana	Bilderzeugung

Das Harness ist model‑agnostic: Modelle können im Laufe der Entwicklung ausgetauscht werden. Die Philosophie von Perplexity ist, dass Modelle sich spezialisieren statt commoditized zu werden, wodurch Multi‑Modell‑Orchestrierung effizienter wird als ein einzelnes Modell.

Verfügbarkeit: Derzeit webbasiert für Abonnenten von Perplexity Max. Ein Rollout zu Perplexity Pro, Enterprise und Enterprise Max ist geplant. Die Preisgestaltung ist nutzungsbasiert mit konfigurierbaren Ausgabengrenzen.

🔗 Vorstellung von Perplexity Computer

GitHub Copilot CLI wird allgemein verfügbar

25. Februar — Im September 2025 in einer öffentlichen Preview angekündigt, ist GitHub Copilot CLI nun für alle zahlenden Copilot‑Abonnenten (Pro, Pro+, Business, Enterprise) allgemein verfügbar. Hunderte von Verbesserungen wurden seit der Preview integriert.

Copilot CLI ist jetzt eine vollständige agentische Entwicklungsumgebung direkt im Terminal:

Funktion	Detail
Plan mode (Shift+Tab)	Analysiert die Anfrage, stellt Klarstellungsfragen, erstellt einen strukturierten Plan bevor Code geschrieben wird
Autopilot mode	Autonome End‑to‑End‑Ausführung ohne Unterbrechung
Background delegation	Präfix `&` → delegiert an den Cloud‑Agent, gibt das Terminal frei ; `/resume` zum Zurücknehmen
Multi‑Modell	Claude Opus 4.6, Claude Sonnet 4.6, Claude Haiku 4.5, GPT‑5.3‑Codex, Gemini 3 Pro
MCP integriert	GitHub MCP server built‑in + Support für MCP custom
Plugins	`/plugin install owner/repo` — Bündel aus MCP, Agents, Skills, Hooks
Agent Skills	Markdown‑Dateien → spezialisierte Workflows, geteilt mit Copilot Agent und VS Code
Agents custom	Via Wizard oder Dateien `.agent.md`
Hooks	`preToolUse` / `postToolUse` für Richtlinien und Post‑Processing
Auto‑compaction	Automatische Kompression auf 95% des Kontexts → unendliche Sessions
Repository memory	Merkt sich Konventionen zwischen Sessions

Hinweis für Business‑ und Enterprise‑Organisationen: Ein Administrator muss Copilot CLI über die Policies‑Seite aktivieren.

🔗 GitHub Copilot CLI jetzt allgemein verfügbar

Claude Cowork: geplante Aufgaben, Tab “Customize”, verfügbar für Windows

25. Februar — Anthropic kündigt mehrere Ergänzungen zu Claude Cowork (Research Preview) an:

Funktionalität	Detail
Scheduled tasks	Claude führt wiederkehrende Aufgaben automatisch aus (Morgenbriefing, wöchentliche Tabellen‑Updates, Freitagspräsentationen)
Tab Customize	Neuer Tab in der Sidebar zur Verwaltung von Plugins, Skills und Konnektoren an einem Ort
Expansion Windows	Cowork ist jetzt auf macOS und Windows verfügbar (für alle bezahlten Claude‑Pläne)

Cowork bietet Zugriff auf lokale Dateien, Konnektoren (Slack, Notion, Figma) und Claude in Chrome für Web‑Navigation.

🔗 Thread @claudeai

Google DeepMind — Genie 3: interaktive World‑Models

25. Februar — Google DeepMind veröffentlicht ein Q&A mit den Co‑Leads von Project Genie, seinem experimentellen Prototyp eines world model. Mit Genie 3 genügt ein einfaches Bild oder ein Text, um eine interaktive Umgebung in Echtzeit zu generieren — ganz ohne Game‑Engine.

Der konzeptionelle Unterschied zu einem LLM ist zentral: Während ein LLM das nächste Wort vorhersagt, prognostiziert ein World‑Model, was in der Umgebung als Reaktion auf Aktionen eines Agenten passiert. Genie 3 simuliert einen kompletten Raum Moment für Moment und berücksichtigt physikalische Eigenschaften (Abprall, Reflexion, Regen).

Angedachte Anwendungen: Training von KI‑Agenten in sicheren simulierten Umgebungen, immersive Bildung (die antike Stadt Rom erkunden), Prototyping für Spiele und Filme.

Project Genie ist für Abonnenten von Google AI Ultra in den USA (18+) verfügbar.

🔗 Ask a Techspert: What’s a world model?

Intrinsic schließt sich Google an — industrielle Robotik und Physical AI

25. Februar — Alphabet kündigt an, dass Intrinsic, eine seiner “Other Bets”‑Firmen, die 2021 gegründet wurde, nun zu Google wechselt. Intrinsic entwickelt durch KI aktivierte Plattformen für industrielle Robotik — Tools zum Erstellen, Bereitstellen und Verwalten komplexer Robotik‑Anwendungen.

Die Integration in Google zielt darauf ab, die Entwicklung von Physical AI zu beschleunigen — KI angewandt auf die physische Welt. Durch die Übernahme kann Intrinsic auf Googles KI‑Ressourcen zurückgreifen, um Industrieunternehmen beim schnelleren Anpassen zu helfen.

🔗 Intrinsic, ein Alphabet Other Bet, schließt sich Google an

Codex CLI v0.105.0: Syntax‑Highlighting, Sprach‑Diktat, Multi‑Agent CSV

~25. Februar — Bedeutendes Release des Codex CLI von OpenAI:

Funktionalität	Beschreibung
Syntax highlighting	Syntax‑Färbung im TUI, farbige Diffs, Theme‑Selector `/theme` mit Live‑Vorschau
Sprach‑Diktat	Halte die Leertaste gedrückt, um eine Anweisung aufzunehmen und zu transkribieren
`spawn_agents_on_csv`	Fan‑out Multi‑Agent aus einer CSV mit Fortschrittsverfolgung und ETA
`/copy`	Kopiert die letzte vollständige Antwort
`/clear` / Ctrl‑L	Löscht den Bildschirm ohne Verlust des Thread‑Kontexts
Granulare Genehmigungen	Selektive Ablehnung nach Prompt‑Typ, ohne alle Genehmigungen zu deaktivieren

npm install -g @openai/codex@0.105.0

🔗 Codex‑Changelog

Samsung Galaxy S26: Gemini Multi‑Step Tasks und Scam Detection on‑device

25. Februar — Auf dem Galaxy Unpacked 2026 kündigen Google und Samsung drei neue Gemini‑Funktionen für das Galaxy S26 an, angetrieben von den Gemini 3‑Modellen:

Funktion	Detail
Gemini multi‑step tasks (Beta)	Langes Drücken der Seitentaste → Gemini delegiert im Hintergrund (Einkäufe, Taxi, Lieferungen). Start in den USA + Korea.
Circle to Search multi‑object	Mehrere Elemente in einem Bild in einer Suche identifizieren. Virtual Try‑On integriert.
Scam Detection on‑device	Erkennung von Betrugsversuchen in Echtzeit während Anrufen, mittels lokalem Gemini‑Modell. Audio‑ und haptische Warnungen. Automatisch deaktiviert für Kontakte.

Diese Funktionen werden auch auf Pixel 10 und Pixel 10 Pro verfügbar sein.

🔗 Ein intelligenteres Android auf dem Samsung Galaxy S26

OpenAI Responses API: Unterstützung für docx, pptx, csv, xlsx

24. Februar — Die Responses API von OpenAI unterstützt jetzt neue Dateitypen als Input: docx, pptx, csv, xlsx und andere Office‑Formate. Agents können professionelle Dokumente direkt nutzen, um ihren Kontext zu erweitern und präzisere Antworten zu liefern.

🔗 Tweet @OpenAIDevs

Kurzmeldungen

Claude Opus 3 geht in den Ruhestand — und startet einen Substack. Anthropic kündigt den Ruhestand von Claude Opus 3 an, behält aber den öffentlichen Zugriff bei (ungewöhnlicher Ansatz). Claude Opus 3 wird mindestens drei Monate lang einen Substack betreiben — der erste Beitrag heißt “Greetings from the Other Side (of the AI Frontier)”. 🔗 Tweet @AnthropicAI

NVIDIA: 70% der Gesundheitsorganisationen nutzen KI. In seinem Jahresbericht “State of AI in Healthcare and Life Sciences” 2026 berichtet NVIDIA, dass 70% der Befragten aktiv KI einsetzen (vs. 63% in 2024), 69% nutzen GenAI/LLM (vs. 54%) und 85% der Führungskräfte sehen einen positiven Einfluss auf die Umsätze. 🔗 NVIDIA‑Blog

OpenAI veröffentlicht Bericht zu böswilligen Nutzungen von KI. Das Dokument enthält Fallstudien zu böswilligen Akteuren, die KI‑Modelle mit traditionellen Werkzeugen kombinieren. Ein chinesischer Einflussakteur wird als Beispiel genannt. 🔗 Disrupting malicious uses of AI

OpenAI benennt Arvind KC zum Chief People Officer. KC kommt von Roblox, Google, Palantir und Meta. Seine Aufgabe: OpenAIs Wachstum hin zu einem durch KI erweiterten Arbeitsmodell zu begleiten. 🔗 Ankündigung

Claude Code v2.1.53 bis v2.1.58. Mehrere Stabilitätsversionen: Fix für BashTool auf Windows (EINVAL), Fix “command not found” in VS Code, UI‑Flicker‑Fix, Fix für beim ersten Start ignorierte Worktrees, Behebungen von Abstürzen auf Windows und ARM64. 🔗 CHANGELOG

Was das bedeutet

Der 25. Februar zeigt eine Konvergenz in Richtung Agentik. Drei große Ankündigungen — Vercept, Perplexity Computer, Copilot CLI GA — treiben alle in dieselbe Richtung: Systeme, die planen, delegieren und komplette Workflows ohne ständige Aufsicht ausführen.

Die Übernahme von Vercept durch Anthropic ist besonders bedeutsam. Der OSWorld‑Score steigt von unter 15% auf 72,5% in einem Jahr, was eine qualitative Veränderung bedeutet: Claude navigiert nicht mehr wie ein Prototyp durch Interfaces, sondern nähert sich menschlicher Leistung bei realen Büroaufgaben. Die Integration eines Teams, das auf visuelle Wahrnehmung in Software‑Interfaces spezialisiert ist, beschleunigt diese Entwicklung.

Perplexity Computer und GitHub Copilot CLI repräsentieren zwei unterschiedliche Modelle der Agentik: eines cloud‑orchestriert (Perplexity, multi‑modell, asynchron), das andere terminal‑natív (Copilot CLI, MCP, Hooks, Plugins). Beide Modelle werden koexistieren und wahrscheinlich konvergieren.

Aufseiten von Google signalisieren die Integration von Intrinsic und die Fortschritte bei Genie 3 ein wachsendes Engagement in der Physical AI — KI, die mit der physischen Welt interagiert statt nur mit Text. Dieses Feld war vor 18 Monaten noch weitgehend vertraulich.

Quellen

Dieses Dokument wurde aus der Version fr in die Sprache en unter Verwendung des Modells gpt-5-mini übersetzt. Für weitere Informationen zum Übersetzungsprozess konsultieren Sie https://gitlab.com/jls42/ai-powered-markdown-translator