Anthropic Institute, Perplexity Everything is Computer, OpenAI Responses API: 11 marzo 2026

Il 11 marzo 2026 è una giornata intensa: Anthropic crea un istituto interdisciplinare per il dibattito pubblico sull’IA, Perplexity distribuisce la sua visione “Computer” con quattro API simultanee, OpenAI pubblica le nuove primitive agentiche della Responses API, e Meta descrive nel dettaglio quattro generazioni di chip IA custom sviluppati in due anni.

Anthropic Institute: Jack Clark alla guida del beneficio pubblico

11 marzo 2026 — Anthropic lancia The Anthropic Institute, un nuovo impegno per far avanzare il dibattito pubblico sulle sfide poste dall’IA potente. L’iniziativa è guidata dal cofondatore Jack Clark, che assume un nuovo ruolo di “Head of Public Benefit” (responsabile del beneficio pubblico) presso Anthropic.

L’Istituto riunirà un team interdisciplinare — ricercatori, economisti, giuristi, specialisti di politiche pubbliche — con un accesso unico ai modelli di punta di Anthropic. La sua missione: analizzare e comunicare gli impatti sociali, economici e di sicurezza dell’IA man mano che si sviluppano.

Sono state annunciate tre prime assunzioni:

Assunzione	Percorso
Matt Botvinick	Resident Fellow, Yale Law School; ex-Senior Director of Research, Google DeepMind
Anton Korinek	Professore di economia (in congedo sabbatico), team Economic Research
Zoë Hitzig	Ex-OpenAI, specializzata negli impatti sociali ed economici dell’IA

L’Istituto si appoggia ai team esistenti di Anthropic: Frontier Red Team, Societal Impacts, Economic Research. In parallelo, Anthropic annuncia l’espansione del suo team Public Policy, focalizzato sulla trasparenza dei modelli, sulla protezione dei consumatori di energia, sui controlli all’export e sulla governance mondiale dell’IA.

La creazione di questo Istituto segna una tappa notevole: Anthropic struttura formalmente il proprio impegno pubblico e gli dà un volto con uno dei suoi cofondatori.

🔗 Presentazione di The Anthropic Institute

Perplexity: lancio coordinato della visione “Everything is Computer”

11 marzo 2026 — Perplexity pubblica simultaneamente quattro annunci che formano un lancio coordinato attorno alla sua visione “Computer”: l’IA come computer personale e professionale.

Personal Computer ed Enterprise

Il Personal Computer è un Mac mini dedicato che funziona 24 ore su 24, connesso alle applicazioni locali e ai server Perplexity. Agisce come un proxy digitale dell’utente — le azioni sensibili richiedono un’approvazione esplicita. Lista d’attesa aperta.

Il Computer for Enterprise si connette a Snowflake, Salesforce, HubSpot e centinaia di piattaforme. Le competenze (skills) sono personalizzabili, e l’integrazione Slack permette di lavorare nei DM o nei canali condivisi. Si basa su SOC 2 Type II, SAML SSO e registri di audit (audit logs). Perplexity presenta un dato tratto da uno studio interno su 16.000 richieste: un risparmio di 1,6 milioni di dollari in costi di manodopera e 3,25 anni di lavoro completati in 4 settimane.

Comet Enterprise è un browser IA nativo con controlli amministratore (permessi per dominio, registri delle azioni, MDM) e una partnership con CrowdStrike per protezioni a livello del browser.

Perplexity Finance riceve oltre 40 strumenti finanziari in tempo reale (SEC filings, FactSet, S&P Global, Coinbase, LSEG, Quartr, Polymarket), con connessione al broker tramite Plaid per l’analisi di un portafoglio reale.

Premium Sources offre l’accesso a Statista, CB Insights e PitchBook direttamente nei flussi di ricerca — le fonti a pagamento sono citate automaticamente.

🔗 Everything is Computer

Agent API: runtime di orchestrazione completo

L’Agent API è un runtime gestito per costruire workflow agentici con ricerca integrata, esecuzione di strumenti e orchestrazione multi-modello. Sostituisce in un unico punto di integrazione un router di modelli, un livello di ricerca, un provider di embeddings, un servizio sandbox e uno stack di monitoraggio (monitoring stack).

Strumento integrato	Capacità
`web_search`	Filtraggio per dominio, recenza, intervallo di date, lingua, budget di contenuto
`fetch_url`	Recupero diretto di URL
Funzioni personalizzate	Supporto completo

Quattro profili ottimizzati (presets) coprono i casi d’uso: ricerca fattuale rapida, ricerca bilanciata, analisi multi-fonte approfondita e ricerca istituzionale. Deep Research 2.0 è disponibile tramite il profilo advanced-deep-research — lancia decine di ricerche per richiesta e tratta centinaia di documenti.

L’Agent API è agnostica rispetto ai modelli, supporta catene di fallback (fallback chains) multi-modello per una disponibilità vicina al 100%, ed è disponibile da oggi su docs.perplexity.ai.

🔗 Agent API

Search API: snippet migliorati e benchmark SEAL

L’aggiornamento della Search API riguarda la qualità degli estratti (snippets) e l’infrastruttura di valutazione.

La nuova pipeline di etichettatura a livello di frammenti (span-level labeling) identifica quali segmenti di un documento sorgente sono pertinenti per una richiesta. Risultato: estratti più piccoli e più precisi, il che riduce i costi in token e migliora la gestione del contesto per i modelli a valle.

Il benchmark SEAL testa se un sistema di recupero può rispondere a domande la cui risposta cambia nel tempo. Perplexity progredisce su SEAL-Hard mentre altri fornitori arretrano. Il framework search_evals è aggiornato in open source su GitHub.

Altri miglioramenti: supporto multi-query (fino a 5 in una singola richiesta API), filtraggio per lingua (codice ISO 639-1) e per paese, e SDK Python (pip install perplexityai) con supporto nativo delle tre API.

🔗 Aggiornamento della Search API

Sandbox API: esecuzione di codice isolata per agenti

Perplexity apre il suo ambiente interno di esecuzione del codice come servizio autonomo. Ogni sessione viene eseguita in un pod Kubernetes isolato, con un file system persistente montato. Linguaggi supportati: Python, JavaScript, SQL. È possibile installare pacchetti al momento dell’esecuzione (at runtime).

Le sessioni hanno uno stato persistente (stateful): i file creati in una fase sono disponibili nelle fasi successive, e i workflow lunghi possono mettersi in pausa e poi riprendere ore dopo. La sicurezza si basa su un modello zero trust (zero-trust): nessun accesso diretto alla rete, traffico in uscita tramite proxy, il codice non ha mai accesso alle chiavi API grezze.

La Sandbox API sarà integrabile nell’Agent API con la stessa chiave API e gli stessi crediti. Stato: beta privata prossimamente.

🔗 Sandbox API

OpenAI: la Responses API riceve un ambiente informatico per agenti

11 marzo 2026 — OpenAI pubblica un articolo di ingegneria che dettaglia le nuove primitive della Responses API per costruire agenti autonomi affidabili: shell tool Unix, container ospitati, compattazione nativa del contesto e agent skills riutilizzabili.

Il shell tool

Il shell tool permette al modello di interagire con un computer tramite la riga di comando, con accesso alle utility Unix classiche (grep, curl, awk). A differenza dell’interprete di codice esistente, che eseguiva solo Python, il shell tool supporta Go, Java, Node.js e altri ambienti. I modelli GPT-5.2 e successivi sono addestrati a proporre comandi shell.

La Responses API può eseguire più comandi shell in parallelo tramite sessioni di container separate, e applica un limite di output per comando per evitare di saturare la finestra di contesto.

Container ospitati

Il container costituisce lo spazio di lavoro del modello:

Componente	Descrizione
File system	Upload, organizzazione e gestione delle risorse tramite APIs container e file
Database	Archiviazione strutturata (SQLite) — il modello interroga le tabelle invece di caricare tutto il contenuto
Accesso rete	Proxy egress centralizzato con lista di autorizzazioni, iniezione di secret per dominio

Compattazione nativa del contesto

Per le attività di lunga durata, la Responses API integra un meccanismo di compattazione nativa: i modelli sono addestrati a produrre una rappresentazione compatta e cifrata dello stato conversazionale. Disponibile lato server (soglia configurabile) o tramite un endpoint /compact. Codex utilizza questo meccanismo per mantenere sessioni di coding di lunga durata senza degrado.

Agent skills

Le skills (competenze di agente) condizionano modelli di flussi di lavoro ripetitivi (workflow patterns) in bundle riutilizzabili: una cartella con un file SKILL.md e le risorse associate. La Responses API carica automaticamente la skill nel contesto prima di inviare il prompt al modello. Le skills sono gestite tramite API e versionate.

In parallelo, un post del blog per sviluppatori celebra un anno della Responses API con cinque casi di studio clienti. Le due pubblicazioni formano un quadro coerente dell’evoluzione della piattaforma verso l’agentico.

🔗 Responses API + ambiente informatico 🔗 1 anno della Responses API

OpenAI: strategia di difesa contro la prompt injection

11 marzo 2026 — OpenAI pubblica un articolo di sicurezza sulla resistenza degli agenti IA agli attacchi tramite prompt injection (prompt injection).

I primi attacchi consistevano nell’inserire istruzioni dirette in contenuti esterni (pagine Wikipedia, email). Con il miglioramento dei modelli, questi attacchi si sono evoluti verso l’ingegneria sociale (social engineering): contesto professionale convincente, urgenza simulata, autorizzazione presunta. Un esempio del 2025 descritto nell’articolo mostrava un attacco riuscito nel 50% dei casi su una vecchia versione di ChatGPT.

OpenAI affronta il problema attraverso il prisma del sistema tripartito (datore di lavoro / agente / terza parte malevola), analogo a un agente di servizio clienti umano esposto a tentativi di manipolazione. L’obiettivo non è identificare perfettamente ogni attacco, ma limitare l’impatto di una manipolazione riuscita.

Contromisura	Descrizione
Analisi source-sink	Rilevamento delle combinazioni contenuto non affidabile + azione pericolosa
Safe Url	Rileva se informazioni della conversazione verrebbero trasmesse a una terza parte — richiede conferma o blocca
Sandbox applicativa	Canvas e ChatGPT Apps rilevano comunicazioni inattese e richiedono il consenso

Safe Url si applica anche alle navigazioni in Atlas, nonché alle ricerche e navigazioni in Deep Research.

🔗 Progettare agenti IA resistenti alla prompt injection

Meta MTIA: quattro generazioni di chip IA in due anni

11 marzo 2026 — Meta pubblica un articolo tecnico dettagliato sulla sua famiglia di chip IA custom MTIA (Meta Training and Inference Accelerator). In due anni, Meta ha sviluppato quattro generazioni successive per servire miliardi di utenti a costi inferiori.

“AI models are evolving faster than traditional chip development cycles.”

🇮🇹 I modelli IA si evolvono più velocemente dei cicli di sviluppo dei chip tradizionali.

Generazione	Innovazione principale
MTIA 300	Primo chip ottimizzato per i modelli di classificazione e raccomandazione (Ranking & Recommendation), base modulare riutilizzabile
MTIA 400	Evoluzione verso i workloads GenAI, rack da 72 chip in un unico dominio scale-up
MTIA 450	Raddoppio della larghezza di banda HBM, +75% di FLOPS MX4, accelerazione hardware di attention e FFN
MTIA 500	+50% di larghezza di banda HBM vs MTIA 450, focus inference GenAI

La progressione tra MTIA 300 e MTIA 500: larghezza di banda HBM moltiplicata per 4,5 e FLOPS moltiplicati per 25. La strategia di Meta si basa su uno sviluppo ad alta velocità (un nuovo chip all’anno), un focus inference piuttosto che pre-training, e un’integrazione nativa PyTorch.

“Mainstream GPUs are typically built for the most demanding workload — large-scale GenAI pre-training — while Meta’s primary need is inference.”

🇮🇹 Le GPU mainstream sono tipicamente progettate per il carico di lavoro più esigente — il pre-training GenAI su larga scala — mentre il bisogno principale di Meta è l’inference.

L’architettura del processore elementare (Processing Element) combina due core RISC-V vettoriali, un motore di prodotto scalare (Dot Product Engine), un’unità di funzioni speciali (Special Function Unit), un motore di riduzione e un DMA. Lo stack software si basa su PyTorch, vLLM, Triton e compilatori MTIA dedicati, con un’integrazione vLLM tramite architettura di plugin.

🔗 Meta MTIA: scalare i chip IA per miliardi di utenti

Gemini CLI v0.33.0: Plan Mode arricchito e autenticazione A2A

11 marzo 2026 — Gemini CLI pubblica la versione v0.33.0, due settimane dopo la v0.32.0 che aveva introdotto il Plan Mode.

Categoria	Novità
Architettura agent	Autenticazione HTTP per agent A2A remoti, scoperta di schede di agent A2A autenticati
Plan Mode	Sotto-agent di ricerca integrati, supporto delle annotazioni per feedback degli utenti, nuovo sottocomando `copy`
Interfaccia CLI	Header compatto con icona ASCII, visualizzazione invertita della finestra di contesto, conservazione 30 giorni di default per la cronologia chat

L’aggiunta dell’autenticazione HTTP per il protocollo A2A (Agent-to-Agent) è la principale novità tecnica: Gemini CLI può ora scoprire e autenticarsi presso agent remoti, ponendo le basi per un’orchestrazione multi-agent sicura.

🔗 Changelog Gemini CLI

Gemini in Chrome: espansione verso India, Nuova Zelanda e Canada

11 marzo 2026 — Google estende le funzionalità IA di Chrome a tre nuovi mercati: India, Nuova Zelanda e Canada.

Gemini in Chrome — l’assistente IA nel pannello laterale, basato su Gemini 3.1 — è ora disponibile su Mac, Windows e Chromebook Plus in queste regioni. Tra le funzionalità distribuite: accesso a Gmail, Maps, Calendar e YouTube da Chrome, analisi incrociata di più schede aperte, e trasformazione di immagini direttamente nel browser tramite Nano Banana 2. L’aggiornamento aggiunge oltre 50 lingue supplementari, tra cui hindi, francese e spagnolo.

🔗 Chrome si espande in India, Nuova Zelanda e Canada

AlphaEvolve: nuovi limiti per 5 numeri di Ramsey

11 marzo 2026 — Pushmeet Kohli (Google DeepMind) annuncia che AlphaEvolve ha stabilito nuovi limiti inferiori per 5 numeri di Ramsey classici in combinatoria estremale — problemi così difficili che lo stesso Erdős ne aveva commentato la complessità, e i cui migliori risultati precedenti risalivano ad almeno un decennio fa.

AlphaEvolve agisce come un meta-algoritmo che scopre automaticamente le procedure di ricerca necessarie, laddove storicamente bisognava progettare manualmente algoritmi specifici. Questo risultato illustra le capacità di AlphaEvolve al di là delle ottimizzazioni dei kernel Google per cui era già noto.

🔗 Tweet di Pushmeet Kohli

Gemini Embedding 2: primo embedding multimodale Google

10 marzo 2026 — Google annuncia Gemini Embedding 2, descritto come “our most capable and first fully multimodal embedding model”. È il primo modello di embedding nativamente multimodale di Google, disponibile per gli sviluppatori tramite Gemini API e AI Studio.

🔗 Tweet @googleaidevs

GitHub Copilot: revisione del codice dal terminale e progressi JetBrains

11 marzo 2026 — Due aggiornamenti notevoli per GitHub Copilot.

Code Review da GitHub CLI v2.88.0

È ora possibile richiedere una revisione del codice Copilot direttamente dal terminale. I comandi gh pr edit --add-reviewer @copilot (modalità non interattiva) e gh pr create (modalità interattiva) integrano Copilot insieme ai compagni di squadra. La selezione dei revisori beneficia di una ricerca dinamica, migliorando le prestazioni nelle grandi organizzazioni e correggendo problemi di accessibilità. Disponibile su tutti i piani che includono Copilot code review — aggiornamento a GitHub CLI v2.88.0 richiesto.

🔗 Code Review da GitHub CLI

Miglioramenti agentici per JetBrains IDEs

L’aggiornamento del plugin JetBrains porta in disponibilità generale (GA): agent personalizzati (custom agents), sotto-agent e agent di pianificazione (plan agent), oltre alla selezione automatica del modello per tutti i piani. In anteprima pubblica (public preview): gli hooks d’agent (userPromptSubmitted, preToolUse, postToolUse, errorOccurred) tramite un file hooks.json in .github/hooks/, e il supporto dei file AGENTS.md e CLAUDE.md.

Altri miglioramenti completano l’aggiornamento: auto-approve configurabile per MCP, pannello di pensiero per i modelli a ragionamento esteso, indicatore d’uso della finestra di contesto e deprecazione della modalità Edit nel menu.

🔗 Miglioramenti JetBrains

Esplorare un repository in Copilot sul web

In anteprima pubblica: è possibile esplorare l’albero di un repository GitHub direttamente dall’interfaccia web di Copilot. I file selezionati vengono aggiunti automaticamente come riferimenti temporanei alla chat e possono essere resi permanenti.

🔗 Esplorazione di repository in Copilot

Anthropic Sydney e Claude for Office

Sydney, 4º ufficio Asia-Pacifico

10 marzo 2026 — Anthropic annuncia la prossima apertura di un ufficio a Sydney, il suo quarto in Asia-Pacifico (dopo Tokyo, Seul e Singapore). L’Australia è 4ª al mondo per l’utilizzo di Claude.ai per abitante; la Nuova Zelanda è 8ª secondo lo stesso indicatore (Anthropic Economic Index). L’ufficio si concentrerà inizialmente su clienti enterprise, startup e ricerca.

🔗 Sydney, 4º ufficio Asia-Pacifico

Claude for Excel e PowerPoint: contesto condiviso e Skills Office

11 marzo 2026 — Gli add-in Claude for Excel e Claude for PowerPoint ricevono due aggiornamenti importanti: la condivisione del contesto tra le due applicazioni (un analista può estrarre dati da una cartella di lavoro Excel e usarli in una presentazione PowerPoint in un’unica conversazione), e l’arrivo delle Skills (workflow riutilizzabili con un clic) in entrambi gli add-in.

Le Skills precaricate coprono i casi d’uso più frequenti: audit di formule, costruzione di modelli LBO/DCF, deck di panorama competitivo, aggiornamento di presentazioni con nuovi dati, e revisione di deck di investment banking. Gli add-in sono ora disponibili tramite Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry per distribuzioni conformi. Disponibilità: Mac e Windows su piani a pagamento (Pro, Max, Team, Enterprise).

🔗 Claude for Excel e PowerPoint

NVIDIA Nemotron 3 Super, ComfyUI e GTC 2026

11 marzo 2026 — NVIDIA è molto attiva intorno al GTC 2026.

Nemotron 3 Super offre un throughput 5 volte superiore per l’IA agentica rispetto alla generazione precedente. Si tratta di un modello MoE (Mixture of Experts) da 120 miliardi di parametri in open source, ottimizzato per carichi di inferenza ad alta frequenza.

NVIDIA e ComfyUI hanno annunciato durante la GDC 2026 (Game Developers Conference) un’integrazione che semplifica la generazione video IA locale per sviluppatori di giochi e creator, con supporto dei modelli FLUX e LTX-Video.

Il blog NVIDIA GTC 2026 Live Updates raggruppa gli annunci in diretta dalla conferenza a San Jose — anche Mistral AI vi presenta i suoi modelli frontier in questo contesto.

🔗 Nemotron 3 Super 🔗 ComfyUI GDC 🔗 GTC 2026 Live

In breve

Runway Labs — Runway lancia un incubatore interno diretto da Alejandro Matamala Ortiz (cofondatore, direttore dell’innovazione). Runway Labs prototiperà applicazioni radicalmente nuove per il video generativo e i modelli di simulazione del mondo (General World Models) in settori diversi: cinema, sanità, istruzione, videogiochi, pubblicità, immobiliare. Reclutamento aperto.

🔗 Introducing Runway Labs

Claude Code /btw — Un nuovo comando /btw permette di avere conversazioni laterali (side chain conversations) mentre un’attività è in esecuzione, senza interrompere il lavoro in corso.

🔗 Tweet @bcherny

NotebookLM Flashcards — Aggiornamento di quiz e flashcards: ripresa da dove ci si era fermati, monitoraggio delle flashcards riuscite o fallite, possibilità di eliminare o mescolare le flashcards.

🔗 Tweet NotebookLM

Meta Canopy Height Maps v2 — Meta e il World Resources Institute pubblicano CHMv2, una nuova versione delle mappe dell’altezza della chioma forestale mondiale. Il modello DINOv3 (visione auto-supervisionata di Meta) migliora precisione e copertura mondiale. Applicazioni: migrazione climatica, ripristino forestale, pianificazione urbana. Modelli disponibili in open source.

🔗 Canopy Height Maps v2

Z.ai GLM-5 — GLM-5 è ora accessibile agli utenti Lite (livello gratuito), dopo essere stato riservato agli utenti Pro dal suo lancio nel febbraio 2026.

🔗 Tweet @ZixuanLi_

Cosa significa

L’11 marzo 2026 illustra due tendenze di fondo che convergono.

La prima è la piattaformizzazione dell’agentico: OpenAI, Perplexity e GitHub pubblicano lo stesso giorno primitive complementari (strumenti shell, sandbox, agent hooks, code review). L’ecosistema si struttura attorno a blocchi riutilizzabili — skills, container, sotto-agent — che permettono agli sviluppatori di costruire agent affidabili senza reinventare l’infrastruttura.

La seconda è la corsa al silicio custom: il dettaglio che Meta pubblica sulle sue quattro generazioni MTIA in due anni rivela una chiara strategia di indipendenza rispetto alle GPU consumer, calibrata per l’inferenza su larga scala. La stessa logica spinge NVIDIA a pubblicare Nemotron 3 Super proprio il giorno del GTC, dove gli annunci si accumulano.

La creazione dell’Anthropic Institute si inserisce in un movimento più discreto ma duraturo: mentre le capacità progrediscono, le grandi aziende IA strutturano i loro team di impatto pubblico — non più come una comunicazione di facciata, ma come uno sforzo di ricerca a pieno titolo.

Fonti

Questo documento è stato tradotto dalla versione fr alla lingua it utilizzando il modello gpt-5.5. Per maggiori informazioni sul processo di traduzione, consultare https://gitlab.com/jls42/ai-powered-markdown-translator