Der 25. Februar 2026 ist ein dichter Tag: Anthropic übernimmt Vercept, um die Computer‑Use‑Fähigkeiten von Claude zu beschleunigen (72,5% auf OSWorld), Perplexity stellt Computer vor — ein agentischer Multi‑Modell‑Orchestrator, der 19 Modelle parallel orchestriert — und GitHub Copilot CLI wird für alle zahlenden Abonnenten allgemein verfügbar. Parallel dazu stellt Google DeepMind Genie 3 vor (interaktive World‑Models) und Intrinsic wechselt zu Google für industrielle Robotik.
Anthropic übernimmt Vercept: Computer‑Use steigt auf 72,5% bei OSWorld
25. Februar — Anthropic kündigt die Übernahme von Vercept an, einem Startup, das sich auf Wahrnehmung und Interaktion von KI‑Systemen mit Software‑Interfaces spezialisiert hat. Die Mitgründer Kiana Ehsani, Luca Weihs und Ross Girshick schließen sich Anthropic an, um die Computer‑Use‑Fähigkeiten von Claude direkt zu verstärken.
Diese Übernahme fällt in eine rasche Entwicklung beim Benchmark OSWorld, der die Fähigkeit eines KI‑Agenten misst, Aufgaben auf einem echten Betriebssystem auszuführen (Navigation in komplexen Tabellen, Ausfüllen von Multi‑Tab‑Formularen etc.):
| Zeitraum | OSWorld‑Score |
|---|---|
| Ende 2024 (Einführung Computer Use) | < 15% |
| Claude Sonnet 4.6 (Feb. 2026) | 72,5% |
Ein Sprung von über 57 Punkten in einem Jahr. Claude Sonnet 4.6 nähert sich damit menschlicher Leistung bei diesen Büroaufgaben. Vercept wird sein externes Produkt in den nächsten Wochen einstellen, um sich vollständig auf diese Arbeit innerhalb von Anthropic zu konzentrieren.
Diese Übernahme folgt auf die frühere Übernahme von Bun. Anthropic baut sich so ein Portfolio aus technischen Spitzen‑Teams rund um agentische Fähigkeiten auf.
Perplexity Computer: ein agentischer Multi‑Modell‑Orchestrator (19 Modelle)
25. Februar — Perplexity stellt Computer vor, ein generalistisches KI‑System, das darauf ausgelegt ist, komplette Projekte von Anfang bis Ende auszuführen. Der Nutzer beschreibt ein Endziel, Computer zerlegt die Arbeit in Unteraufgaben, erstellt spezialisierte Sub‑Agents und führt parallel aus — über Stunden oder Monate hinweg, falls nötig.
Die Ausführung ist asynchron und isoliert: Jede Aufgabe läuft in einer eigenen Umgebung mit Zugriff auf ein echtes Dateisystem, einen echten Browser und Integrationen zu realen Tools (APIs, Websuche, Dokumentengenerierung).
Was Perplexity Computer auszeichnet, ist seine Orchestrierung im Sinne von “massively multi-model” — 19 verfügbare Modelle, jeweils nach ihren Stärken zugewiesen:
| Modell | Rolle |
|---|---|
| Claude Opus 4.6 | Haupt‑Orchestrator (core reasoning) |
| Gemini | Deep research, Erstellung von Sub‑Agents |
| ChatGPT 5.2 | Langzeit‑Kontext‑Retrieval und breite Suche |
| Grok | Leichte Aufgaben (Geschwindigkeit) |
| Veo 3.1 | Videogenerierung |
| Nano Banana | Bilderzeugung |
Das Harness ist model‑agnostic: Modelle können im Laufe der Entwicklung ausgetauscht werden. Die Philosophie von Perplexity ist, dass Modelle sich spezialisieren statt commoditized zu werden, wodurch Multi‑Modell‑Orchestrierung effizienter wird als ein einzelnes Modell.
Verfügbarkeit: Derzeit webbasiert für Abonnenten von Perplexity Max. Ein Rollout zu Perplexity Pro, Enterprise und Enterprise Max ist geplant. Die Preisgestaltung ist nutzungsbasiert mit konfigurierbaren Ausgabengrenzen.
🔗 Vorstellung von Perplexity Computer
GitHub Copilot CLI wird allgemein verfügbar
25. Februar — Im September 2025 in einer öffentlichen Preview angekündigt, ist GitHub Copilot CLI nun für alle zahlenden Copilot‑Abonnenten (Pro, Pro+, Business, Enterprise) allgemein verfügbar. Hunderte von Verbesserungen wurden seit der Preview integriert.
Copilot CLI ist jetzt eine vollständige agentische Entwicklungsumgebung direkt im Terminal:
| Funktion | Detail |
|---|---|
| Plan mode (Shift+Tab) | Analysiert die Anfrage, stellt Klarstellungsfragen, erstellt einen strukturierten Plan bevor Code geschrieben wird |
| Autopilot mode | Autonome End‑to‑End‑Ausführung ohne Unterbrechung |
| Background delegation | Präfix & → delegiert an den Cloud‑Agent, gibt das Terminal frei ; /resume zum Zurücknehmen |
| Multi‑Modell | Claude Opus 4.6, Claude Sonnet 4.6, Claude Haiku 4.5, GPT‑5.3‑Codex, Gemini 3 Pro |
| MCP integriert | GitHub MCP server built‑in + Support für MCP custom |
| Plugins | /plugin install owner/repo — Bündel aus MCP, Agents, Skills, Hooks |
| Agent Skills | Markdown‑Dateien → spezialisierte Workflows, geteilt mit Copilot Agent und VS Code |
| Agents custom | Via Wizard oder Dateien .agent.md |
| Hooks | preToolUse / postToolUse für Richtlinien und Post‑Processing |
| Auto‑compaction | Automatische Kompression auf 95% des Kontexts → unendliche Sessions |
| Repository memory | Merkt sich Konventionen zwischen Sessions |
Hinweis für Business‑ und Enterprise‑Organisationen: Ein Administrator muss Copilot CLI über die Policies‑Seite aktivieren.
🔗 GitHub Copilot CLI jetzt allgemein verfügbar
Claude Cowork: geplante Aufgaben, Tab “Customize”, verfügbar für Windows
25. Februar — Anthropic kündigt mehrere Ergänzungen zu Claude Cowork (Research Preview) an:
| Funktionalität | Detail |
|---|---|
| Scheduled tasks | Claude führt wiederkehrende Aufgaben automatisch aus (Morgenbriefing, wöchentliche Tabellen‑Updates, Freitagspräsentationen) |
| Tab Customize | Neuer Tab in der Sidebar zur Verwaltung von Plugins, Skills und Konnektoren an einem Ort |
| Expansion Windows | Cowork ist jetzt auf macOS und Windows verfügbar (für alle bezahlten Claude‑Pläne) |
Cowork bietet Zugriff auf lokale Dateien, Konnektoren (Slack, Notion, Figma) und Claude in Chrome für Web‑Navigation.
Google DeepMind — Genie 3: interaktive World‑Models
25. Februar — Google DeepMind veröffentlicht ein Q&A mit den Co‑Leads von Project Genie, seinem experimentellen Prototyp eines world model. Mit Genie 3 genügt ein einfaches Bild oder ein Text, um eine interaktive Umgebung in Echtzeit zu generieren — ganz ohne Game‑Engine.
Der konzeptionelle Unterschied zu einem LLM ist zentral: Während ein LLM das nächste Wort vorhersagt, prognostiziert ein World‑Model, was in der Umgebung als Reaktion auf Aktionen eines Agenten passiert. Genie 3 simuliert einen kompletten Raum Moment für Moment und berücksichtigt physikalische Eigenschaften (Abprall, Reflexion, Regen).
Angedachte Anwendungen: Training von KI‑Agenten in sicheren simulierten Umgebungen, immersive Bildung (die antike Stadt Rom erkunden), Prototyping für Spiele und Filme.
Project Genie ist für Abonnenten von Google AI Ultra in den USA (18+) verfügbar.
🔗 Ask a Techspert: What’s a world model?
Intrinsic schließt sich Google an — industrielle Robotik und Physical AI
25. Februar — Alphabet kündigt an, dass Intrinsic, eine seiner “Other Bets”‑Firmen, die 2021 gegründet wurde, nun zu Google wechselt. Intrinsic entwickelt durch KI aktivierte Plattformen für industrielle Robotik — Tools zum Erstellen, Bereitstellen und Verwalten komplexer Robotik‑Anwendungen.
Die Integration in Google zielt darauf ab, die Entwicklung von Physical AI zu beschleunigen — KI angewandt auf die physische Welt. Durch die Übernahme kann Intrinsic auf Googles KI‑Ressourcen zurückgreifen, um Industrieunternehmen beim schnelleren Anpassen zu helfen.
🔗 Intrinsic, ein Alphabet Other Bet, schließt sich Google an
Codex CLI v0.105.0: Syntax‑Highlighting, Sprach‑Diktat, Multi‑Agent CSV
~25. Februar — Bedeutendes Release des Codex CLI von OpenAI:
| Funktionalität | Beschreibung |
|---|---|
| Syntax highlighting | Syntax‑Färbung im TUI, farbige Diffs, Theme‑Selector /theme mit Live‑Vorschau |
| Sprach‑Diktat | Halte die Leertaste gedrückt, um eine Anweisung aufzunehmen und zu transkribieren |
spawn_agents_on_csv | Fan‑out Multi‑Agent aus einer CSV mit Fortschrittsverfolgung und ETA |
/copy | Kopiert die letzte vollständige Antwort |
/clear / Ctrl‑L | Löscht den Bildschirm ohne Verlust des Thread‑Kontexts |
| Granulare Genehmigungen | Selektive Ablehnung nach Prompt‑Typ, ohne alle Genehmigungen zu deaktivieren |
npm install -g @openai/codex@0.105.0
Samsung Galaxy S26: Gemini Multi‑Step Tasks und Scam Detection on‑device
25. Februar — Auf dem Galaxy Unpacked 2026 kündigen Google und Samsung drei neue Gemini‑Funktionen für das Galaxy S26 an, angetrieben von den Gemini 3‑Modellen:
| Funktion | Detail |
|---|---|
| Gemini multi‑step tasks (Beta) | Langes Drücken der Seitentaste → Gemini delegiert im Hintergrund (Einkäufe, Taxi, Lieferungen). Start in den USA + Korea. |
| Circle to Search multi‑object | Mehrere Elemente in einem Bild in einer Suche identifizieren. Virtual Try‑On integriert. |
| Scam Detection on‑device | Erkennung von Betrugsversuchen in Echtzeit während Anrufen, mittels lokalem Gemini‑Modell. Audio‑ und haptische Warnungen. Automatisch deaktiviert für Kontakte. |
Diese Funktionen werden auch auf Pixel 10 und Pixel 10 Pro verfügbar sein.
🔗 Ein intelligenteres Android auf dem Samsung Galaxy S26
OpenAI Responses API: Unterstützung für docx, pptx, csv, xlsx
24. Februar — Die Responses API von OpenAI unterstützt jetzt neue Dateitypen als Input: docx, pptx, csv, xlsx und andere Office‑Formate. Agents können professionelle Dokumente direkt nutzen, um ihren Kontext zu erweitern und präzisere Antworten zu liefern.
Kurzmeldungen
Claude Opus 3 geht in den Ruhestand — und startet einen Substack. Anthropic kündigt den Ruhestand von Claude Opus 3 an, behält aber den öffentlichen Zugriff bei (ungewöhnlicher Ansatz). Claude Opus 3 wird mindestens drei Monate lang einen Substack betreiben — der erste Beitrag heißt “Greetings from the Other Side (of the AI Frontier)”. 🔗 Tweet @AnthropicAI
NVIDIA: 70% der Gesundheitsorganisationen nutzen KI. In seinem Jahresbericht “State of AI in Healthcare and Life Sciences” 2026 berichtet NVIDIA, dass 70% der Befragten aktiv KI einsetzen (vs. 63% in 2024), 69% nutzen GenAI/LLM (vs. 54%) und 85% der Führungskräfte sehen einen positiven Einfluss auf die Umsätze. 🔗 NVIDIA‑Blog
OpenAI veröffentlicht Bericht zu böswilligen Nutzungen von KI. Das Dokument enthält Fallstudien zu böswilligen Akteuren, die KI‑Modelle mit traditionellen Werkzeugen kombinieren. Ein chinesischer Einflussakteur wird als Beispiel genannt. 🔗 Disrupting malicious uses of AI
OpenAI benennt Arvind KC zum Chief People Officer. KC kommt von Roblox, Google, Palantir und Meta. Seine Aufgabe: OpenAIs Wachstum hin zu einem durch KI erweiterten Arbeitsmodell zu begleiten. 🔗 Ankündigung
Claude Code v2.1.53 bis v2.1.58. Mehrere Stabilitätsversionen: Fix für BashTool auf Windows (EINVAL), Fix “command not found” in VS Code, UI‑Flicker‑Fix, Fix für beim ersten Start ignorierte Worktrees, Behebungen von Abstürzen auf Windows und ARM64. 🔗 CHANGELOG
Was das bedeutet
Der 25. Februar zeigt eine Konvergenz in Richtung Agentik. Drei große Ankündigungen — Vercept, Perplexity Computer, Copilot CLI GA — treiben alle in dieselbe Richtung: Systeme, die planen, delegieren und komplette Workflows ohne ständige Aufsicht ausführen.
Die Übernahme von Vercept durch Anthropic ist besonders bedeutsam. Der OSWorld‑Score steigt von unter 15% auf 72,5% in einem Jahr, was eine qualitative Veränderung bedeutet: Claude navigiert nicht mehr wie ein Prototyp durch Interfaces, sondern nähert sich menschlicher Leistung bei realen Büroaufgaben. Die Integration eines Teams, das auf visuelle Wahrnehmung in Software‑Interfaces spezialisiert ist, beschleunigt diese Entwicklung.
Perplexity Computer und GitHub Copilot CLI repräsentieren zwei unterschiedliche Modelle der Agentik: eines cloud‑orchestriert (Perplexity, multi‑modell, asynchron), das andere terminal‑natív (Copilot CLI, MCP, Hooks, Plugins). Beide Modelle werden koexistieren und wahrscheinlich konvergieren.
Aufseiten von Google signalisieren die Integration von Intrinsic und die Fortschritte bei Genie 3 ein wachsendes Engagement in der Physical AI — KI, die mit der physischen Welt interagiert statt nur mit Text. Dieses Feld war vor 18 Monaten noch weitgehend vertraulich.
Quellen
- Anthropic erwirbt Vercept
- Vorstellung von Perplexity Computer
- Tweet Perplexity Computer
- GitHub Copilot CLI jetzt allgemein verfügbar
- Thread @claudeai — Scheduled tasks Cowork
- Claude Cowork Produktseite
- Ask a Techspert: What’s a world model? (Genie 3)
- Intrinsic schließt sich Google an
- Codex‑Changelog
- Samsung Galaxy S26 + Gemini
- OpenAI Responses API neue Dateitypen
- Claude Opus 3 Ruhestand — Tweet @AnthropicAI
- NVIDIA State of AI in Healthcare 2026
- OpenAI — Disrupting malicious uses of AI
- OpenAI — Arvind KC Chief People Officer
- Claude Code CHANGELOG
Dieses Dokument wurde aus der Version fr in die Sprache en unter Verwendung des Modells gpt-5-mini übersetzt. Für weitere Informationen zum Übersetzungsprozess konsultieren Sie https://gitlab.com/jls42/ai-powered-markdown-translator