ai-powered-markdown-translatorArticolo tradotto dal francese all’italiano con gpt-5.4-mini.
Il fine settimana del 21 giugno 2026 concentra due dinamiche distinte: da un lato, Perplexity Computer guadagna in profondità con l’integrazione di Deep Research e nuovi strumenti di navigazione nei filoni di lavoro; dall’altro, Together AI rende GLM-5.2 accessibile gratuitamente, affermandosi al tempo stesso come il fornitore di inferenza più veloce per questo modello su OpenRouter. Sul fronte degli strumenti di code, Amp migliora in modo significativo il suo sotto-agente Librarian e introduce i Custom Agents, mentre v0 semplifica il feedback degli utenti con la sua modalità Annotations.
Perplexity Computer — Deep Research integrato, command panel e forking
19 giugno — Perplexity pubblica un aggiornamento sostanziale di Computer, la sua piattaforma di agenti di ricerca. La principale novità: Deep Research è ora disponibile direttamente nei filoni di lavoro Computer. I risultati di una ricerca approfondita possono essere convertiti in report, foglio di calcolo, presentazione, dashboard, sito web o workflow — senza lasciare l’ambiente. Perplexity annuncia che Deep Research in Computer supera i concorrenti negli ultimi benchmark grazie a un’infrastruttura battezzata “Search as Code”.
| Funzionalità | Descrizione |
|---|---|
| Deep Research in Computer | Ricerca approfondita convertibile in report, foglio di calcolo, dashboard o workflow nello stesso filone |
| Command panel | Accesso rapido a tutte le modalità e competenze tramite / nella casella di ricerca |
| Forking | Ramificazione di un filone verso una nuova domanda mantenendo il contesto completo |
| Inline actions | Conferme, chiarimenti e connessioni riportate direttamente nella casella di ricerca |
| Computer Analytics API | Recupero degli utilizzi (crediti, artefatti, workflow, durate) in serie temporale — Enterprise |
| Custom credit limits | Limiti di crediti per membro o team definibili dagli admin — Enterprise |
Il command panel accessibile tramite / riunisce in un unico punto tutte le modalità e competenze disponibili (Deep Research, Plan Mode, skill personalizzati, skill organizzativi). Il forking consente di esplorare una domanda di follow-up in un filone separato, mantenendo però l’accesso al contesto e agli artefatti del filone originale — un meccanismo di non regressione utile durante le iterazioni su progetti complessi.
Le funzionalità Analytics API e custom credit limits sono rivolte alle organizzazioni: gli admin possono ora monitorare gli utilizzi di Computer via API (compatibile con Snowflake, Hex, Metabase o fogli di calcolo) e definire quote di crediti per ruolo o team.
🔗 Changelog Perplexity — Deep Research, command panel, forking
Together AI distribuisce gratuitamente GLM-5.2 e si impone su OpenRouter
21 giugno — Together AI annuncia il deployment di GLM-5.2 (modello open-source pubblicato con licenza MIT da Z.ai / Zhipu) sulla sua piattaforma, accessibile gratuitamente tramite Together Chat senza configurazione di API. Il modello funziona su un’infrastruttura nordamericana sicura.
| Modello | Editore | Licenza | Accesso Together AI |
|---|---|---|---|
| GLM-5.2 | Z.ai (Zhipu) | MIT (open-source) | Gratis — Together Chat, senza configurazione API |
In parallelo, Together AI afferma di essere il fornitore di inferenza più veloce per GLM-5.2 su OpenRouter, con un lavoro mirato sui workload a contesto lungo (coding, agenti) per massimizzare i token per GPU mantenendo la latenza.
“Everyone’s trying to find where to test GLM-5.2. You can try it free on Together Chat (link below). No API setup. Just pick GLM-5.2 and start prompting. Served by Together AI on secure North American infrastructure.”
🇮🇹 “Tutti stanno cercando dove testare GLM-5.2. Potete provarlo gratuitamente su Together Chat (link qui sotto). Nessuna configurazione API. Basta scegliere GLM-5.2 e iniziare a usarlo. Servito da Together AI su un’infrastruttura nordamericana sicura.” — @togethercompute
🔗 Together AI — server GLM-5.2 più veloce su OpenRouter
Strumenti di code IA — Amp accelera il suo Librarian e lancia i Custom Agents, v0 introduce le Annotations
Amp — Librarian 3× più veloce e 43% meno costoso
18 giugno — Amp migliora il suo sotto-agente Librarian, specializzato nella ricerca di codice su GitHub. La nuova versione è circa 3× più veloce e 43% meno costosa della versione precedente.
| Metrica | Evoluzione |
|---|---|
| Velocità | ~3× più veloce |
| Costo | −43% |
Il Librarian è l’agente interno di Amp incaricato di scandagliare le grandi basi di codice per localizzare simboli, funzioni o pattern. Questo miglioramento delle prestazioni va a beneficio diretto dei workflow in cui la ricerca di codice è una fase frequente.
🔗 Amp — Un Librarian più veloce
Amp — Custom Agents: i plugin creano e pilotano agenti
19 giugno — Amp estende il suo sistema di plugin con i Custom Agents: i plugin possono ora creare agenti, eseguirli e continuare a interagire con i loro filoni di conversazione. Questa funzionalità consente di comporre agenti specializzati direttamente da un plugin, senza infrastruttura aggiuntiva.
L’interesse pratico è la composizione di pipeline agentiche: un plugin può attivare un agente dedicato a un compito (review di codice, generazione di test, analisi delle dipendenze) e recuperare i risultati nello stesso filone. La separazione tra plugin orchestratore e agente esecutore resta esplicita.
v0 — Modalità Annotations, domande nel modulo, Apple/Google Pay
19 giugno — v0 (piattaforma di generazione di interfacce utente di Vercel) pubblica diverse nuove funzionalità.
| Funzionalità | Descrizione |
|---|---|
| Annotations mode | Cliccare sugli elementi nella preview per lasciare commenti numerati, inviati in batch all’agente |
| In-form questions | Le domande di chiarimento di v0 compaiono nel modulo del prompt (selezione singola, multipla, o skip) |
| Apple Pay / Google Pay | Disponibili nel checkout v0 |
| Favoriti illimitati | Rimozione del limite a 5 preferiti |
| ZIP download | I membri in sola lettura possono scaricare il codice di una chat in ZIP |
La modalità Annotations è la novità più notevole: invece di descrivere un problema visivo in prosa, l’utente clicca direttamente sull’elemento nella preview e lascia un commento numerato — tutti i commenti vengono inviati in batch all’agente. Questo approccio riduce l’ambiguità tra descrizione testuale e intenzione reale.
Brevi
- Claude Code v2.1.185 (20 giugno) — Il messaggio di attesa mostrato durante un rallentamento della rete viene riformulato: “Waiting for API response · will retry in …” sostituisce “No response from API · Retrying in …”. Il ritardo di attivazione passa da 10 a 20 secondi. 🔗 CHANGELOG
Cosa significa
Gli strumenti agentici per sviluppatori stanno guadagnando in componibilità. I Custom Agents di Amp illustrano una tendenza di fondo: gli ambienti di sviluppo IA non si limitano più a integrare un LLM in un editor, ma espongono primitive che permettono ai plugin di orchestrare agenti specializzati. La separazione orchestratore/esecutore proposta dai Custom Agents corrisponde all’architettura multi-agente che si sta imponendo nelle pipeline di produzione — ma resa accessibile a livello di plugin, senza infrastruttura da distribuire. L’aggiornamento del Librarian (3×, −43%) mostra che questo livello di agenti specializzati può essere ottimizzato in modo indipendente dal modello principale.
La corsa all’inferenza per i modelli open-source si intensifica. Il fatto che Together AI comunichi attivamente la propria posizione di server più veloce per GLM-5.2 su OpenRouter segnala che le prestazioni di inferenza stanno diventando un argomento commerciale differenziante per i fornitori di cloud ML. Rendere GLM-5.2 accessibile gratuitamente tramite Together Chat senza configurazione è una strategia di acquisizione: una volta che gli sviluppatori prendono confidenza con il modello tramite la chat, la conversione verso l’API a pagamento è più diretta. È un modello che HuggingFace e Replicate hanno utilizzato con successo sui precedenti modelli open-source.
Le piattaforme di agenti di ricerca aggiungono livelli di controllo enterprise. Le nuove funzionalità di Perplexity Computer (Analytics API, credit limits per membro, forking) rivelano una maturità nell’adozione organizzativa di questi strumenti: le aziende hanno bisogno di controllo dei costi, tracciabilità degli usi e non regressione durante le iterazioni. Il forking è particolarmente interessante — è una primitiva di gestione del contesto che non esisteva nei primi strumenti di ricerca IA, e che avvicina queste piattaforme agli ambienti di lavoro collaborativi (branch Git, filoni di discussione separati).