Perplexity Computer passe en vitesse de croisière, GLM-5.2 gratuit sur Together AI, outils de code agentiques

Le week-end du 21 juin 2026 concentre deux dynamiques distinctes : d’un côté, Perplexity Computer gagne en profondeur avec l’intégration de Deep Research et de nouveaux outils de navigation dans les fils de travail ; de l’autre, Together AI rend GLM-5.2 accessible gratuitement tout en s’affirmant comme le fournisseur d’inférence le plus rapide pour ce modèle sur OpenRouter. Côté outils de code, Amp améliore significativement son sous-agent Librarian et introduit les Custom Agents, pendant que v0 simplifie les retours utilisateurs avec son mode Annotations.

Perplexity Computer — Deep Research intégré, command panel et forking

19 juin — Perplexity publie une mise à jour substantielle de Computer, sa plateforme d’agents de recherche. La principale nouveauté : Deep Research est désormais disponible directement dans les fils de travail Computer. Les résultats d’une recherche approfondie peuvent être convertis en rapport, tableur, présentation, tableau de bord, site web ou workflow — sans quitter l’environnement. Perplexity annonce que Deep Research in Computer surpasse les concurrents sur les derniers benchmarks grâce à une infrastructure baptisée “Search as Code”.

Fonctionnalité	Description
Deep Research in Computer	Recherche approfondie convertible en rapport, tableur, dashboard ou workflow dans le même fil
Command panel	Accès rapide à tous les modes et compétences via `/` dans la boîte de recherche
Forking	Ramification d’un fil vers une nouvelle question tout en conservant le contexte complet
Inline actions	Confirmations, clarifications et connexions remontées directement dans la boîte de recherche
Computer Analytics API	Récupération des usages (crédits, artefacts, workflows, durées) en série temporelle — Enterprise
Custom credit limits	Limites de crédits par membre ou équipe définissables par les admins — Enterprise

Le command panel accessible par / rassemble tous les modes et compétences disponibles (Deep Research, Plan Mode, skills personnalisés, skills d’organisation) en un seul endroit. Le forking permet d’explorer une question de suivi dans un fil séparé tout en conservant l’accès au contexte et aux artefacts du fil d’origine — un mécanisme de non-régression utile lors d’itérations sur des projets complexes.

Les fonctionnalités Analytics API et custom credit limits s’adressent aux organisations : les admins peuvent désormais surveiller les usages Computer par API (compatible Snowflake, Hex, Metabase ou tableurs) et définir des quotas de crédits par rôle ou équipe.

🔗 Changelog Perplexity — Deep Research, command panel, forking

Together AI déploie GLM-5.2 gratuitement et s’impose sur OpenRouter

21 juin — Together AI annonce le déploiement de GLM-5.2 (modèle open-source publié sous licence MIT par Z.ai / Zhipu) sur sa plateforme, accessible gratuitement via Together Chat sans configuration d’API. Le modèle fonctionne sur une infrastructure nord-américaine sécurisée.

Modèle	Éditeur	Licence	Accès Together AI
GLM-5.2	Z.ai (Zhipu)	MIT (open-source)	Gratuit — Together Chat, sans API setup

En parallèle, Together AI affirme être le fournisseur d’inférence le plus rapide pour GLM-5.2 sur OpenRouter, avec un travail ciblé sur les workloads long-contexte (codage, agents) pour maximiser les tokens par GPU tout en maintenant la latence.

“Everyone’s trying to find where to test GLM-5.2. You can try it free on Together Chat (link below). No API setup. Just pick GLM-5.2 and start prompting. Served by Together AI on secure North American infrastructure.”

🇫🇷 “Tout le monde cherche où tester GLM-5.2. Vous pouvez l’essayer gratuitement sur Together Chat (lien ci-dessous). Pas de configuration d’API. Il suffit de choisir GLM-5.2 et de commencer à l’utiliser. Servi par Together AI sur une infrastructure nord-américaine sécurisée.” — @togethercompute

🔗 Together AI — serveur GLM-5.2 le plus rapide sur OpenRouter

Outils de code IA — Amp accélère son Librarian et lance les Custom Agents, v0 introduit les Annotations

Amp — Librarian 3× plus rapide et 43% moins cher

18 juin — Amp améliore son sous-agent Librarian, spécialisé dans la recherche de code sur GitHub. La nouvelle version est environ 3× plus rapide et 43% moins chère que la version précédente.

Métrique	Évolution
Vitesse	~3× plus rapide
Coût	−43%

Le Librarian est l’agent interne d’Amp chargé de parcourir les grandes bases de code pour localiser des symboles, fonctions ou patterns. Cette amélioration de performance bénéficie directement aux workflows où la recherche de code est une étape fréquente.

🔗 Amp — A Faster Librarian

Amp — Custom Agents : les plugins créent et pilotent des agents

19 juin — Amp étend son système de plugins avec les Custom Agents : les plugins peuvent désormais créer des agents, les exécuter, et continuer à interagir avec leurs fils de conversation. Cette fonctionnalité permet de composer des agents spécialisés directement depuis un plugin, sans infrastructure supplémentaire.

L’intérêt pratique est la composition de pipelines agentiques : un plugin peut déclencher un agent dédié à une tâche (review de code, génération de tests, analyse de dépendances) et récupérer les résultats dans le même fil. La séparation entre le plugin orchestrateur et l’agent exécutant reste explicite.

🔗 Amp — Custom Agents

v0 — Mode Annotations, questions dans le formulaire, Apple/Google Pay

19 juin — v0 (plateforme de génération d’interface utilisateur par Vercel) publie plusieurs nouvelles fonctionnalités.

Fonctionnalité	Description
Annotations mode	Cliquer sur des éléments dans la preview pour déposer des commentaires numérotés, envoyés en lot à l’agent
In-form questions	Les questions de clarification de v0 apparaissent dans le formulaire de prompt (sélection simple, multiple, ou skip)
Apple Pay / Google Pay	Disponibles dans le checkout v0
Favoris illimités	Suppression de la limite à 5 favoris
ZIP download	Membres en lecture seule peuvent télécharger le code d’un chat en ZIP

Le mode Annotations est la nouveauté la plus notable : plutôt que de décrire un problème visuel en prose, l’utilisateur clique directement sur l’élément dans la preview et laisse un commentaire numéroté — tous les commentaires sont envoyés en lot à l’agent. Cette approche réduit l’ambiguïté entre description textuelle et intention réelle.

🔗 v0 changelog

Brèves

Claude Code v2.1.185 (20 juin) — Le message d’attente affiché lors d’un ralentissement réseau est reformulé : “Waiting for API response · will retry in …” remplace “No response from API · Retrying in …”. Le délai de déclenchement passe de 10 à 20 secondes. 🔗 CHANGELOG

Ce que ça signifie

L’outillage agentique des développeurs gagne en composabilité. Les Custom Agents d’Amp illustrent une tendance de fond : les environnements de développement IA ne se contentent plus d’intégrer un LLM dans un éditeur, ils exposent des primitives permettant aux plugins d’orchestrer des agents spécialisés. La séparation orchestrateur/exécutant que proposent les Custom Agents correspond à l’architecture multi-agents qui s’impose dans les pipelines de production — mais rendue accessible au niveau du plugin, sans infrastructure à déployer. La mise à jour du Librarian (3×, −43%) montre que cette couche d’agents spécialisés peut être optimisée indépendamment du modèle principal.

La course à l’inférence pour les modèles open-source s’intensifie. Le fait que Together AI communique activement sur sa position de serveur le plus rapide pour GLM-5.2 sur OpenRouter signale que la performance d’inférence devient un argument commercial différenciant pour les fournisseurs de cloud ML. Rendre GLM-5.2 accessible gratuitement via Together Chat sans configuration est une stratégie d’acquisition : une fois les développeurs familiarisés avec le modèle via le chat, la conversion vers l’API payante est plus directe. C’est un modèle que HuggingFace et Replicate ont utilisé avec succès sur les modèles open-source précédents.

Les plateformes d’agents de recherche ajoutent des couches de contrôle enterprise. Les nouvelles fonctionnalités de Perplexity Computer (Analytics API, credit limits par membre, forking) révèlent une maturité dans l’adoption organisationnelle de ces outils : les entreprises ont besoin de contrôle des coûts, de traçabilité des usages et de non-régression lors des itérations. Le forking est particulièrement intéressant — c’est une primitive de gestion de contexte qui n’existait pas dans les premiers outils de recherche IA, et qui rapproche ces plateformes des environnements de travail collaboratif (branches Git, fils de discussion séparés).