Le week-end du 21 juin 2026 concentre deux dynamiques distinctes : d’un côté, Perplexity Computer gagne en profondeur avec l’intégration de Deep Research et de nouveaux outils de navigation dans les fils de travail ; de l’autre, Together AI rend GLM-5.2 accessible gratuitement tout en s’affirmant comme le fournisseur d’inférence le plus rapide pour ce modèle sur OpenRouter. Côté outils de code, Amp améliore significativement son sous-agent Librarian et introduit les Custom Agents, pendant que v0 simplifie les retours utilisateurs avec son mode Annotations.
Perplexity Computer — Deep Research intégré, command panel et forking
19 juin — Perplexity publie une mise à jour substantielle de Computer, sa plateforme d’agents de recherche. La principale nouveauté : Deep Research est désormais disponible directement dans les fils de travail Computer. Les résultats d’une recherche approfondie peuvent être convertis en rapport, tableur, présentation, tableau de bord, site web ou workflow — sans quitter l’environnement. Perplexity annonce que Deep Research in Computer surpasse les concurrents sur les derniers benchmarks grâce à une infrastructure baptisée “Search as Code”.
| Fonctionnalité | Description |
|---|---|
| Deep Research in Computer | Recherche approfondie convertible en rapport, tableur, dashboard ou workflow dans le même fil |
| Command panel | Accès rapide à tous les modes et compétences via / dans la boîte de recherche |
| Forking | Ramification d’un fil vers une nouvelle question tout en conservant le contexte complet |
| Inline actions | Confirmations, clarifications et connexions remontées directement dans la boîte de recherche |
| Computer Analytics API | Récupération des usages (crédits, artefacts, workflows, durées) en série temporelle — Enterprise |
| Custom credit limits | Limites de crédits par membre ou équipe définissables par les admins — Enterprise |
Le command panel accessible par / rassemble tous les modes et compétences disponibles (Deep Research, Plan Mode, skills personnalisés, skills d’organisation) en un seul endroit. Le forking permet d’explorer une question de suivi dans un fil séparé tout en conservant l’accès au contexte et aux artefacts du fil d’origine — un mécanisme de non-régression utile lors d’itérations sur des projets complexes.
Les fonctionnalités Analytics API et custom credit limits s’adressent aux organisations : les admins peuvent désormais surveiller les usages Computer par API (compatible Snowflake, Hex, Metabase ou tableurs) et définir des quotas de crédits par rôle ou équipe.
🔗 Changelog Perplexity — Deep Research, command panel, forking
Together AI déploie GLM-5.2 gratuitement et s’impose sur OpenRouter
21 juin — Together AI annonce le déploiement de GLM-5.2 (modèle open-source publié sous licence MIT par Z.ai / Zhipu) sur sa plateforme, accessible gratuitement via Together Chat sans configuration d’API. Le modèle fonctionne sur une infrastructure nord-américaine sécurisée.
| Modèle | Éditeur | Licence | Accès Together AI |
|---|---|---|---|
| GLM-5.2 | Z.ai (Zhipu) | MIT (open-source) | Gratuit — Together Chat, sans API setup |
En parallèle, Together AI affirme être le fournisseur d’inférence le plus rapide pour GLM-5.2 sur OpenRouter, avec un travail ciblé sur les workloads long-contexte (codage, agents) pour maximiser les tokens par GPU tout en maintenant la latence.
“Everyone’s trying to find where to test GLM-5.2. You can try it free on Together Chat (link below). No API setup. Just pick GLM-5.2 and start prompting. Served by Together AI on secure North American infrastructure.”
🇫🇷 “Tout le monde cherche où tester GLM-5.2. Vous pouvez l’essayer gratuitement sur Together Chat (lien ci-dessous). Pas de configuration d’API. Il suffit de choisir GLM-5.2 et de commencer à l’utiliser. Servi par Together AI sur une infrastructure nord-américaine sécurisée.” — @togethercompute
🔗 Together AI — serveur GLM-5.2 le plus rapide sur OpenRouter
Outils de code IA — Amp accélère son Librarian et lance les Custom Agents, v0 introduit les Annotations
Amp — Librarian 3× plus rapide et 43% moins cher
18 juin — Amp améliore son sous-agent Librarian, spécialisé dans la recherche de code sur GitHub. La nouvelle version est environ 3× plus rapide et 43% moins chère que la version précédente.
| Métrique | Évolution |
|---|---|
| Vitesse | ~3× plus rapide |
| Coût | −43% |
Le Librarian est l’agent interne d’Amp chargé de parcourir les grandes bases de code pour localiser des symboles, fonctions ou patterns. Cette amélioration de performance bénéficie directement aux workflows où la recherche de code est une étape fréquente.
Amp — Custom Agents : les plugins créent et pilotent des agents
19 juin — Amp étend son système de plugins avec les Custom Agents : les plugins peuvent désormais créer des agents, les exécuter, et continuer à interagir avec leurs fils de conversation. Cette fonctionnalité permet de composer des agents spécialisés directement depuis un plugin, sans infrastructure supplémentaire.
L’intérêt pratique est la composition de pipelines agentiques : un plugin peut déclencher un agent dédié à une tâche (review de code, génération de tests, analyse de dépendances) et récupérer les résultats dans le même fil. La séparation entre le plugin orchestrateur et l’agent exécutant reste explicite.
v0 — Mode Annotations, questions dans le formulaire, Apple/Google Pay
19 juin — v0 (plateforme de génération d’interface utilisateur par Vercel) publie plusieurs nouvelles fonctionnalités.
| Fonctionnalité | Description |
|---|---|
| Annotations mode | Cliquer sur des éléments dans la preview pour déposer des commentaires numérotés, envoyés en lot à l’agent |
| In-form questions | Les questions de clarification de v0 apparaissent dans le formulaire de prompt (sélection simple, multiple, ou skip) |
| Apple Pay / Google Pay | Disponibles dans le checkout v0 |
| Favoris illimités | Suppression de la limite à 5 favoris |
| ZIP download | Membres en lecture seule peuvent télécharger le code d’un chat en ZIP |
Le mode Annotations est la nouveauté la plus notable : plutôt que de décrire un problème visuel en prose, l’utilisateur clique directement sur l’élément dans la preview et laisse un commentaire numéroté — tous les commentaires sont envoyés en lot à l’agent. Cette approche réduit l’ambiguïté entre description textuelle et intention réelle.
Brèves
- Claude Code v2.1.185 (20 juin) — Le message d’attente affiché lors d’un ralentissement réseau est reformulé : “Waiting for API response · will retry in …” remplace “No response from API · Retrying in …”. Le délai de déclenchement passe de 10 à 20 secondes. 🔗 CHANGELOG
Ce que ça signifie
L’outillage agentique des développeurs gagne en composabilité. Les Custom Agents d’Amp illustrent une tendance de fond : les environnements de développement IA ne se contentent plus d’intégrer un LLM dans un éditeur, ils exposent des primitives permettant aux plugins d’orchestrer des agents spécialisés. La séparation orchestrateur/exécutant que proposent les Custom Agents correspond à l’architecture multi-agents qui s’impose dans les pipelines de production — mais rendue accessible au niveau du plugin, sans infrastructure à déployer. La mise à jour du Librarian (3×, −43%) montre que cette couche d’agents spécialisés peut être optimisée indépendamment du modèle principal.
La course à l’inférence pour les modèles open-source s’intensifie. Le fait que Together AI communique activement sur sa position de serveur le plus rapide pour GLM-5.2 sur OpenRouter signale que la performance d’inférence devient un argument commercial différenciant pour les fournisseurs de cloud ML. Rendre GLM-5.2 accessible gratuitement via Together Chat sans configuration est une stratégie d’acquisition : une fois les développeurs familiarisés avec le modèle via le chat, la conversion vers l’API payante est plus directe. C’est un modèle que HuggingFace et Replicate ont utilisé avec succès sur les modèles open-source précédents.
Les plateformes d’agents de recherche ajoutent des couches de contrôle enterprise. Les nouvelles fonctionnalités de Perplexity Computer (Analytics API, credit limits par membre, forking) révèlent une maturité dans l’adoption organisationnelle de ces outils : les entreprises ont besoin de contrôle des coûts, de traçabilité des usages et de non-régression lors des itérations. Le forking est particulièrement intéressant — c’est une primitive de gestion de contexte qui n’existait pas dans les premiers outils de recherche IA, et qui rapproche ces plateformes des environnements de travail collaboratif (branches Git, fils de discussion séparés).