Perplexity Computer passa alla velocità di crociera, GLM-5.2 gratuito su Together AI, strumenti di code agentici

Il fine settimana del 21 giugno 2026 concentra due dinamiche distinte: da un lato, Perplexity Computer guadagna in profondità con l’integrazione di Deep Research e nuovi strumenti di navigazione nei filoni di lavoro; dall’altro, Together AI rende GLM-5.2 accessibile gratuitamente, affermandosi al tempo stesso come il fornitore di inferenza più veloce per questo modello su OpenRouter. Sul fronte degli strumenti di code, Amp migliora in modo significativo il suo sotto-agente Librarian e introduce i Custom Agents, mentre v0 semplifica il feedback degli utenti con la sua modalità Annotations.

Perplexity Computer — Deep Research integrato, command panel e forking

19 giugno — Perplexity pubblica un aggiornamento sostanziale di Computer, la sua piattaforma di agenti di ricerca. La principale novità: Deep Research è ora disponibile direttamente nei filoni di lavoro Computer. I risultati di una ricerca approfondita possono essere convertiti in report, foglio di calcolo, presentazione, dashboard, sito web o workflow — senza lasciare l’ambiente. Perplexity annuncia che Deep Research in Computer supera i concorrenti negli ultimi benchmark grazie a un’infrastruttura battezzata “Search as Code”.

Funzionalità	Descrizione
Deep Research in Computer	Ricerca approfondita convertibile in report, foglio di calcolo, dashboard o workflow nello stesso filone
Command panel	Accesso rapido a tutte le modalità e competenze tramite `/` nella casella di ricerca
Forking	Ramificazione di un filone verso una nuova domanda mantenendo il contesto completo
Inline actions	Conferme, chiarimenti e connessioni riportate direttamente nella casella di ricerca
Computer Analytics API	Recupero degli utilizzi (crediti, artefatti, workflow, durate) in serie temporale — Enterprise
Custom credit limits	Limiti di crediti per membro o team definibili dagli admin — Enterprise

Il command panel accessibile tramite / riunisce in un unico punto tutte le modalità e competenze disponibili (Deep Research, Plan Mode, skill personalizzati, skill organizzativi). Il forking consente di esplorare una domanda di follow-up in un filone separato, mantenendo però l’accesso al contesto e agli artefatti del filone originale — un meccanismo di non regressione utile durante le iterazioni su progetti complessi.

Le funzionalità Analytics API e custom credit limits sono rivolte alle organizzazioni: gli admin possono ora monitorare gli utilizzi di Computer via API (compatibile con Snowflake, Hex, Metabase o fogli di calcolo) e definire quote di crediti per ruolo o team.

🔗 Changelog Perplexity — Deep Research, command panel, forking

Together AI distribuisce gratuitamente GLM-5.2 e si impone su OpenRouter

21 giugno — Together AI annuncia il deployment di GLM-5.2 (modello open-source pubblicato con licenza MIT da Z.ai / Zhipu) sulla sua piattaforma, accessibile gratuitamente tramite Together Chat senza configurazione di API. Il modello funziona su un’infrastruttura nordamericana sicura.

Modello	Editore	Licenza	Accesso Together AI
GLM-5.2	Z.ai (Zhipu)	MIT (open-source)	Gratis — Together Chat, senza configurazione API

In parallelo, Together AI afferma di essere il fornitore di inferenza più veloce per GLM-5.2 su OpenRouter, con un lavoro mirato sui workload a contesto lungo (coding, agenti) per massimizzare i token per GPU mantenendo la latenza.

“Everyone’s trying to find where to test GLM-5.2. You can try it free on Together Chat (link below). No API setup. Just pick GLM-5.2 and start prompting. Served by Together AI on secure North American infrastructure.”

🇮🇹 “Tutti stanno cercando dove testare GLM-5.2. Potete provarlo gratuitamente su Together Chat (link qui sotto). Nessuna configurazione API. Basta scegliere GLM-5.2 e iniziare a usarlo. Servito da Together AI su un’infrastruttura nordamericana sicura.” — @togethercompute

🔗 Together AI — server GLM-5.2 più veloce su OpenRouter

Strumenti di code IA — Amp accelera il suo Librarian e lancia i Custom Agents, v0 introduce le Annotations

Amp — Librarian 3× più veloce e 43% meno costoso

18 giugno — Amp migliora il suo sotto-agente Librarian, specializzato nella ricerca di codice su GitHub. La nuova versione è circa 3× più veloce e 43% meno costosa della versione precedente.

Metrica	Evoluzione
Velocità	~3× più veloce
Costo	−43%

Il Librarian è l’agente interno di Amp incaricato di scandagliare le grandi basi di codice per localizzare simboli, funzioni o pattern. Questo miglioramento delle prestazioni va a beneficio diretto dei workflow in cui la ricerca di codice è una fase frequente.

🔗 Amp — Un Librarian più veloce

Amp — Custom Agents: i plugin creano e pilotano agenti

19 giugno — Amp estende il suo sistema di plugin con i Custom Agents: i plugin possono ora creare agenti, eseguirli e continuare a interagire con i loro filoni di conversazione. Questa funzionalità consente di comporre agenti specializzati direttamente da un plugin, senza infrastruttura aggiuntiva.

L’interesse pratico è la composizione di pipeline agentiche: un plugin può attivare un agente dedicato a un compito (review di codice, generazione di test, analisi delle dipendenze) e recuperare i risultati nello stesso filone. La separazione tra plugin orchestratore e agente esecutore resta esplicita.

🔗 Amp — Custom Agents

v0 — Modalità Annotations, domande nel modulo, Apple/Google Pay

19 giugno — v0 (piattaforma di generazione di interfacce utente di Vercel) pubblica diverse nuove funzionalità.

Funzionalità	Descrizione
Annotations mode	Cliccare sugli elementi nella preview per lasciare commenti numerati, inviati in batch all’agente
In-form questions	Le domande di chiarimento di v0 compaiono nel modulo del prompt (selezione singola, multipla, o skip)
Apple Pay / Google Pay	Disponibili nel checkout v0
Favoriti illimitati	Rimozione del limite a 5 preferiti
ZIP download	I membri in sola lettura possono scaricare il codice di una chat in ZIP

La modalità Annotations è la novità più notevole: invece di descrivere un problema visivo in prosa, l’utente clicca direttamente sull’elemento nella preview e lascia un commento numerato — tutti i commenti vengono inviati in batch all’agente. Questo approccio riduce l’ambiguità tra descrizione testuale e intenzione reale.

🔗 v0 changelog

Brevi

Claude Code v2.1.185 (20 giugno) — Il messaggio di attesa mostrato durante un rallentamento della rete viene riformulato: “Waiting for API response · will retry in …” sostituisce “No response from API · Retrying in …”. Il ritardo di attivazione passa da 10 a 20 secondi. 🔗 CHANGELOG

Cosa significa

Gli strumenti agentici per sviluppatori stanno guadagnando in componibilità. I Custom Agents di Amp illustrano una tendenza di fondo: gli ambienti di sviluppo IA non si limitano più a integrare un LLM in un editor, ma espongono primitive che permettono ai plugin di orchestrare agenti specializzati. La separazione orchestratore/esecutore proposta dai Custom Agents corrisponde all’architettura multi-agente che si sta imponendo nelle pipeline di produzione — ma resa accessibile a livello di plugin, senza infrastruttura da distribuire. L’aggiornamento del Librarian (3×, −43%) mostra che questo livello di agenti specializzati può essere ottimizzato in modo indipendente dal modello principale.

La corsa all’inferenza per i modelli open-source si intensifica. Il fatto che Together AI comunichi attivamente la propria posizione di server più veloce per GLM-5.2 su OpenRouter segnala che le prestazioni di inferenza stanno diventando un argomento commerciale differenziante per i fornitori di cloud ML. Rendere GLM-5.2 accessibile gratuitamente tramite Together Chat senza configurazione è una strategia di acquisizione: una volta che gli sviluppatori prendono confidenza con il modello tramite la chat, la conversione verso l’API a pagamento è più diretta. È un modello che HuggingFace e Replicate hanno utilizzato con successo sui precedenti modelli open-source.

Le piattaforme di agenti di ricerca aggiungono livelli di controllo enterprise. Le nuove funzionalità di Perplexity Computer (Analytics API, credit limits per membro, forking) rivelano una maturità nell’adozione organizzativa di questi strumenti: le aziende hanno bisogno di controllo dei costi, tracciabilità degli usi e non regressione durante le iterazioni. Il forking è particolarmente interessante — è una primitiva di gestione del contesto che non esisteva nei primi strumenti di ricerca IA, e che avvicina queste piattaforme agli ambienti di lavoro collaborativi (branch Git, filoni di discussione separati).