ai-powered-markdown-translatorMit gpt-5.4-mini vom Fr ins De übersetzter Artikel.
Das Wochenende des 21. Juni 2026 bündelt zwei unterschiedliche Dynamiken: Einerseits gewinnt Perplexity Computer mit der Integration von Deep Research und neuen Navigationswerkzeugen in den Arbeitsverläufen an Tiefe; andererseits stellt Together AI GLM-5.2 kostenlos bereit und positioniert sich gleichzeitig als der schnellste Inferenzanbieter für dieses Modell auf OpenRouter. Bei den Code-Tools verbessert Amp seinen Unteragenten Librarian deutlich und führt Custom Agents ein, während v0 das Nutzer-Feedback mit seinem Annotations-Modus vereinfacht.
Perplexity Computer — Deep Research integriert, Command Panel und Forking
19. Juni — Perplexity veröffentlicht ein umfangreiches Update für Computer, seine Plattform für Forschungsagenten. Die wichtigste Neuerung: Deep Research ist nun direkt in den Computer-Arbeitsverläufen verfügbar. Die Ergebnisse einer tiefgehenden Recherche können in einen Bericht, eine Tabelle, eine Präsentation, ein Dashboard, eine Website oder einen Workflow umgewandelt werden — ohne die Umgebung zu verlassen. Perplexity kündigt an, dass Deep Research in Computer dank einer Infrastruktur mit dem Namen “Search as Code” besser abschneidet als die Konkurrenz in den neuesten Benchmarks.
| Funktionalität | Beschreibung |
|---|---|
| Deep Research in Computer | Tiefgehende Recherche, die in denselben Arbeitsverlauf in einen Bericht, eine Tabelle, ein Dashboard oder einen Workflow umgewandelt werden kann |
| Command panel | Schneller Zugriff auf alle Modi und Fähigkeiten über / in der Suchbox |
| Forking | Abzweigung eines Arbeitsverlaufs zu einer neuen Frage unter Beibehaltung des vollständigen Kontexts |
| Inline actions | Bestätigungen, Klarstellungen und Verbindungen, die direkt in der Suchbox angezeigt werden |
| Computer Analytics API | Abruf von Nutzungsdaten (Credits, Artefakte, Workflows, Laufzeiten) als Zeitreihe — Enterprise |
| Custom credit limits | Von Admins definierbare Credit-Limits pro Mitglied oder Team — Enterprise |
Das über / zugängliche Command Panel bündelt alle verfügbaren Modi und Fähigkeiten (Deep Research, Plan Mode, benutzerdefinierte Skills, Organisations-Skills) an einem Ort. Forking ermöglicht es, eine Folgefrage in einem separaten Thread zu erkunden und gleichzeitig den Zugriff auf den Kontext und die Artefakte des ursprünglichen Threads zu behalten — ein nützliches Nicht-Rückfall-Verfahren bei Iterationen an komplexen Projekten.
Die Funktionen Analytics API und Custom Credit Limits richten sich an Organisationen: Admins können Computer-Nutzung nun per API überwachen (kompatibel mit Snowflake, Hex, Metabase oder Tabellenkalkulationen) und Credit-Quoten pro Rolle oder Team festlegen.
🔗 Perplexity-Changelog — Deep Research, Command Panel, Forking
Together AI stellt GLM-5.2 kostenlos bereit und setzt sich auf OpenRouter durch
21. Juni — Together AI kündigt die Bereitstellung von GLM-5.2 an (ein Open-Source-Modell, das von Z.ai / Zhipu unter MIT-Lizenz veröffentlicht wurde) auf seiner Plattform, kostenlos zugänglich über Together Chat ohne API-Konfiguration. Das Modell läuft auf einer sicheren nordamerikanischen Infrastruktur.
| Modell | Anbieter | Lizenz | Together-AI-Zugang |
|---|---|---|---|
| GLM-5.2 | Z.ai (Zhipu) | MIT (Open Source) | Kostenlos — Together Chat, ohne API-Setup |
Parallel dazu behauptet Together AI, der schnellste Inferenzanbieter für GLM-5.2 auf OpenRouter zu sein, mit gezielter Arbeit an Workloads mit langem Kontext (Coding, Agents), um die Tokens pro GPU zu maximieren und gleichzeitig die Latenz niedrig zu halten.
“Everyone’s trying to find where to test GLM-5.2. You can try it free on Together Chat (link below). No API setup. Just pick GLM-5.2 and start prompting. Served by Together AI on secure North American infrastructure.”
🇩🇪 “Alle suchen gerade nach einem Ort, um GLM-5.2 zu testen. Sie können es kostenlos in Together Chat ausprobieren (Link unten). Keine API-Konfiguration. Wählen Sie einfach GLM-5.2 aus und legen Sie los. Bereitgestellt von Together AI auf einer sicheren nordamerikanischen Infrastruktur.” — @togethercompute
🔗 Together AI — schnellster GLM-5.2-Server auf OpenRouter
KI-Code-Tools — Amp beschleunigt seinen Librarian und startet Custom Agents, v0 führt Annotations ein
Amp — Librarian 3× schneller und 43 % günstiger
18. Juni — Amp verbessert seinen Unteragenten Librarian, der auf die Codesuche auf GitHub spezialisiert ist. Die neue Version ist ungefähr 3× schneller und 43 % günstiger als die vorherige Version.
| Metrik | Entwicklung |
|---|---|
| Geschwindigkeit | ~3× schneller |
| Kosten | −43% |
Der Librarian ist der interne Agent von Amp, der große Codebasen durchsucht, um Symbole, Funktionen oder Patterns zu lokalisieren. Diese Leistungsverbesserung kommt direkt den Workflows zugute, in denen Codesuche ein häufiger Schritt ist.
🔗 Amp — Ein schnellerer Librarian
Amp — Custom Agents: Plugins erstellen und steuern Agenten
19. Juni — Amp erweitert sein Plugin-System um Custom Agents: Plugins können nun Agenten erstellen, sie ausführen und weiterhin mit ihren Konversations-Threads interagieren. Diese Funktion ermöglicht es, spezialisierte Agenten direkt aus einem Plugin heraus zu komponieren, ohne zusätzliche Infrastruktur.
Der praktische Nutzen liegt in der Komposition agentischer Pipelines: Ein Plugin kann einen Agenten für eine bestimmte Aufgabe auslösen (Code-Review, Testgenerierung, Abhängigkeitsanalyse) und die Ergebnisse im selben Thread zurückholen. Die Trennung zwischen orchestrierendem Plugin und ausführendem Agenten bleibt dabei explizit.
v0 — Annotations-Modus, Fragen im Formular, Apple/Google Pay
19. Juni — v0 (eine von Vercel betriebene Plattform zur Generierung von Benutzeroberflächen) veröffentlicht mehrere neue Funktionen.
| Funktionalität | Beschreibung |
|---|---|
| Annotations mode | Auf Elemente in der Vorschau klicken, um nummerierte Kommentare zu hinterlassen, die gesammelt an den Agenten gesendet werden |
| In-form questions | Die Klärungsfragen von v0 erscheinen im Prompt-Formular (Einzelauswahl, Mehrfachauswahl oder skip) |
| Apple Pay / Google Pay | Im v0-Checkout verfügbar |
| Unbegrenzte Favoriten | Aufhebung der Begrenzung auf 5 Favoriten |
| ZIP download | Mitglieder mit Leserechten können den Code eines Chats als ZIP herunterladen |
Der Annotations-Modus ist die bemerkenswerteste Neuerung: Statt ein visuelles Problem in Prosa zu beschreiben, klickt der Nutzer direkt auf das Element in der Vorschau und hinterlässt einen nummerierten Kommentar — alle Kommentare werden gesammelt an den Agenten gesendet. Dieser Ansatz reduziert die Unschärfe zwischen textlicher Beschreibung und tatsächlicher Absicht.
Kurzmeldungen
- Claude Code v2.1.185 (20. Juni) — Die Warte-Meldung, die bei einer Verlangsamung des Netzwerks angezeigt wird, wird umformuliert: “Waiting for API response · will retry in …” ersetzt “No response from API · Retrying in …”. Die Auslöseverzögerung steigt von 10 auf 20 Sekunden. 🔗 CHANGELOG
Was das bedeutet
Das agentische Tooling für Entwickler wird immer kompositionsfähiger. Die Custom Agents von Amp veranschaulichen einen grundlegenden Trend: KI-Entwicklungsumgebungen begnügen sich nicht mehr damit, ein LLM in einen Editor zu integrieren, sondern stellen Primitive bereit, mit denen Plugins spezialisierte Agenten orchestrieren können. Die von Custom Agents angebotene Trennung zwischen Orchestrator und Ausführendem entspricht der Multi-Agenten-Architektur, die sich in Produktions-Pipelines durchsetzt — allerdings auf Plugin-Ebene zugänglich, ohne Infrastruktur, die bereitgestellt werden muss. Das Update für den Librarian (3×, −43 %) zeigt, dass diese Schicht spezialisierter Agenten unabhängig vom Hauptmodell optimiert werden kann.
Der Inferenzwettlauf bei Open-Source-Modellen verschärft sich. Die Tatsache, dass Together AI aktiv seine Position als schnellster Server für GLM-5.2 auf OpenRouter kommuniziert, zeigt, dass Inferenzleistung zu einem differenzierenden kommerziellen Argument für ML-Cloud-Anbieter wird. GLM-5.2 kostenlos über Together Chat ohne Konfiguration zugänglich zu machen, ist eine Akquisitionsstrategie: Sobald Entwickler das Modell über den Chat kennengelernt haben, ist der Wechsel zur kostenpflichtigen API direkter. Ein Modell, das HuggingFace und Replicate bereits erfolgreich bei früheren Open-Source-Modellen verwendet haben.
Plattformen für Forschungsagenten fügen Enterprise-Kontrollschichten hinzu. Die neuen Funktionen von Perplexity Computer (Analytics API, Credit-Limits pro Mitglied, Forking) zeigen eine Reife bei der organisatorischen Einführung dieser Werkzeuge: Unternehmen brauchen Kostenkontrolle, Nachverfolgbarkeit der Nutzung und Schutz vor Rückschritten bei Iterationen. Forking ist besonders interessant — es handelt sich um eine Kontextverwaltungs-Primitive, die in den ersten KI-Recherchewerkzeugen nicht existierte und diese Plattformen näher an kollaborative Arbeitsumgebungen heranführt (Git-Branches, separate Gesprächsthreads).