Anthropic Institute, Perplexity Everything is Computer, OpenAI Responses API: 11 martie 2026

11 martie 2026 este o zi densă: Anthropic creează un institut interdisciplinar pentru dezbaterea publică despre IA, Perplexity își desfășoară viziunea „Computer” cu patru API simultane, OpenAI publică noile primitive agentice ale Responses API, iar Meta detaliază patru generații de cipuri IA custom dezvoltate în doi ani.

Anthropic Institute: Jack Clark la conducerea beneficiului public

11 martie 2026 — Anthropic lansează The Anthropic Institute, un nou efort pentru a avansa dezbaterea publică privind provocările puse de IA puternică. Inițiativa este condusă de cofondatorul Jack Clark, care preia un nou rol de „Head of Public Benefit” (responsabil pentru beneficiul public) la Anthropic.

Institutul va reuni o echipă interdisciplinară — cercetători, economiști, juriști, specialiști în politici publice — cu acces unic la modelele de vârf ale Anthropic. Misiunea sa: să analizeze și să comunice impacturile societale, economice și de securitate ale IA pe măsură ce acestea se dezvoltă.

Au fost anunțate trei prime recrutări:

Recrutare	Parcurs
Matt Botvinick	Resident Fellow, Yale Law School; fost Senior Director of Research, Google DeepMind
Anton Korinek	Profesor de economie (în concediu sabatic), echipa Economic Research
Zoë Hitzig	Fostă OpenAI, specializată în impacturile sociale și economice ale IA

Institutul se sprijină pe echipele existente ale Anthropic: Frontier Red Team, Societal Impacts, Economic Research. În paralel, Anthropic anunță extinderea echipei sale Public Policy, axată pe transparența modelelor, protecția consumatorilor de energie, controalele la export și guvernanța mondială a IA.

Crearea acestui Institut marchează o etapă notabilă: Anthropic își structurează formal angajamentul public și îi dă un chip prin unul dintre cofondatorii săi.

🔗 Prezentarea The Anthropic Institute

Perplexity: lansarea coordonată a viziunii „Everything is Computer”

11 martie 2026 — Perplexity publică simultan patru anunțuri care formează o lansare coordonată în jurul viziunii sale „Computer”: IA ca computer personal și profesional.

Personal Computer și Enterprise

Personal Computer este un Mac mini dedicat care rulează 24/7, conectat la aplicațiile locale și la serverele Perplexity. Acționează ca un proxy digital al utilizatorului — acțiunile sensibile necesită o aprobare explicită. Lista de așteptare este deschisă.

Computer for Enterprise se conectează la Snowflake, Salesforce, HubSpot și sute de platforme. Competențele (skills) sunt personalizabile, iar integrarea Slack permite lucrul în DM sau în canale partajate. Se bazează pe SOC 2 Type II, SAML SSO și jurnale de audit (audit logs). Perplexity avansează o cifră provenită dintr-un studiu intern de 16.000 de interogări: economie de 1,6 milioane de dolari în costuri cu forța de muncă și 3,25 ani de muncă realizați în 4 săptămâni.

Comet Enterprise este un browser IA nativ cu controale de administrator (permisiuni pe domeniu, jurnale de acțiuni, MDM) și un parteneriat CrowdStrike pentru protecții la nivel de browser.

Perplexity Finance primește peste 40 de instrumente finance live (SEC filings, FactSet, S&P Global, Coinbase, LSEG, Quartr, Polymarket), cu conectare la broker prin Plaid pentru analiza unui portofoliu real.

Premium Sources oferă acces la Statista, CB Insights și PitchBook direct în fluxurile de căutare — sursele plătite sunt citate automat.

🔗 Everything is Computer

Agent API: runtime complet de orchestrare

Agent API este un runtime gestionat pentru construirea de fluxuri de lucru agentice cu căutare integrată, execuție de instrumente și orchestrare multi-model. Înlocuiește, printr-un singur punct de integrare, un router de modele, un strat de căutare, un furnizor de embeddings, un serviciu sandbox și o stivă de monitorizare (monitoring stack).

Instrument integrat	Capacități
`web_search`	Filtrare după domeniu, recență, interval de date, limbă, buget de conținut
`fetch_url`	Recuperare directă de URL
Funcții personalizate	Suport complet

Patru profiluri optimizate (presets) acoperă cazurile de utilizare: căutare factuală rapidă, căutare echilibrată, analiză aprofundată multi-sursă și căutare instituțională. Deep Research 2.0 este disponibil prin profilul advanced-deep-research — lansează zeci de căutări per interogare și procesează sute de documente.

Agent API este agnostică față de modele, suportă lanțuri de fallback (fallback chains) multi-model pentru o disponibilitate apropiată de 100% și este disponibilă astăzi pe docs.perplexity.ai.

🔗 Agent API

Search API: snippets îmbunătățite și benchmark SEAL

Actualizarea Search API vizează calitatea extraselor (snippets) și infrastructura de evaluare.

Noul pipeline de etichetare la nivel de fragmente (span-level labeling) identifică ce segmente ale unui document sursă sunt relevante pentru o interogare. Rezultatul: extrase mai mici și mai precise, ceea ce reduce costurile în token și îmbunătățește gestionarea contextului pentru modelele din aval.

Benchmark SEAL testează dacă un sistem de recuperare poate răspunde la întrebări al căror răspuns se schimbă în timp. Perplexity progresează pe SEAL-Hard în timp ce alți furnizori scad. Framework-ul search_evals este actualizat în open source pe GitHub.

Alte îmbunătățiri: suport multi-interogare (până la 5 într-o singură interogare API), filtrare după limbă (cod ISO 639-1) și după țară, precum și SDK Python (pip install perplexityai) cu suport nativ pentru cele trei API.

🔗 Actualizare Search API

Sandbox API: execuție de cod izolată pentru agenți

Perplexity își deschide mediul intern de execuție de cod ca serviciu autonom. Fiecare sesiune rulează într-un pod Kubernetes izolat, cu un sistem de fișiere persistent montat. Limbaje suportate: Python, JavaScript, SQL. Instalarea de pachete în momentul execuției (at runtime) este posibilă.

Sesiunile au stare persistentă (stateful): fișierele create într-o etapă sunt disponibile în etapele următoare, iar fluxurile de lucru lungi pot face pauză și apoi relua câteva ore mai târziu. Securitatea se bazează pe un model zero trust (zero-trust): fără acces direct la rețea, trafic de ieșire prin proxy, codul nu are niciodată acces la cheile API brute.

Sandbox API va putea fi integrată în Agent API cu aceeași cheie API și aceleași credite. Statut: beta privată în curând.

🔗 Sandbox API

OpenAI: Responses API primește un mediu informatic pentru agenți

11 martie 2026 — OpenAI publică un articol de inginerie care detaliază noile primitive ale Responses API pentru construirea de agenți autonomi fiabili: shell tool Unix, containere găzduite, compactare nativă a contextului și agent skills reutilizabile.

Shell tool

Shell tool permite modelului să interacționeze cu un computer prin linia de comandă, cu acces la utilitarele Unix clasice (grep, curl, awk). Spre deosebire de interpretorul de cod existent, care executa doar Python, shell tool suportă Go, Java, Node.js și alte medii. Modelele GPT-5.2 și ulterioare sunt antrenate să propună comenzi shell.

Responses API poate executa mai multe comenzi shell în paralel prin sesiuni de container separate și aplică un plafon de ieșire per comandă pentru a evita saturarea ferestrei de context.

Containere găzduite

Containerul constituie spațiul de lucru al modelului:

Componentă	Descriere
Sistem de fișiere	Upload, organizarea și gestionarea resurselor prin API container și file
Baze de date	Stocare structurată (SQLite) — modelul interoghează tabelele în loc să încarce tot conținutul
Acces la rețea	Proxy egress centralizat cu listă de permisiuni, injectare de secrete pe domeniu

Compactare nativă a contextului

Pentru sarcinile de lungă durată, Responses API integrează un mecanism de compactare nativă: modelele sunt antrenate să producă o reprezentare compactă și criptată a stării conversaționale. Disponibil pe partea de server (prag configurabil) sau printr-un endpoint /compact. Codex folosește acest mecanism pentru a menține sesiuni de codare de lungă durată fără degradare.

Agent skills

Skills (competențe de agent) condiționează modele de fluxuri de lucru repetitive (workflow patterns) în bundle-uri reutilizabile: un dosar cu un fișier SKILL.md și resursele asociate. Responses API încarcă automat skill-ul în context înainte de a trimite promptul către model. Skills sunt gestionate prin API și versionate.

În paralel, o postare de blog pentru dezvoltatori celebrează un an de Responses API cu cinci studii de caz ale clienților. Cele două publicații formează un tablou coerent al evoluției platformei către agentic.

🔗 Responses API + mediu informatic 🔗 1 an de Responses API

OpenAI: strategie de apărare împotriva prompt injection

11 martie 2026 — OpenAI publică un articol de securitate despre rezistența agenților IA la atacurile prin prompt injection (prompt injection).

Primele atacuri constau în inserarea unor instrucțiuni directe în conținuturi externe (pagini Wikipedia, emailuri). Odată cu îmbunătățirea modelelor, aceste atacuri au evoluat spre inginerie socială (social engineering): context profesional convingător, urgență simulată, autorizare pretinsă. Un exemplu din 2025 descris în articol arăta un atac reușit în 50% dintre cazuri pe o versiune mai veche de ChatGPT.

OpenAI abordează problema prin prisma sistemului tripartit (angajator / agent / terț rău intenționat), analog unui agent uman de servicii clienți expus la tentative de manipulare. Obiectivul nu este identificarea perfectă a fiecărui atac, ci limitarea impactului unei manipulări reușite.

Contramăsură	Descriere
Analiză source-sink	Detectarea combinațiilor conținut nefiabil + acțiune periculoasă
Safe Url	Detectează dacă informații din conversație ar fi transmise unui terț — cere confirmare sau blochează
Sandbox aplicativ	Canvas și ChatGPT Apps detectează comunicațiile neașteptate și cer consimțământul

Safe Url se aplică și navigărilor în Atlas, precum și căutărilor și navigărilor în Deep Research.

🔗 Proiectarea agenților IA pentru a rezista la prompt injection

Meta MTIA: patru generații de cipuri IA în doi ani

11 martie 2026 — Meta publică un articol tehnic detaliat despre familia sa de cipuri IA custom MTIA (Meta Training and Inference Accelerator). În doi ani, Meta a dezvoltat patru generații succesive pentru a deservi miliarde de utilizatori la costuri mai mici.

“AI models are evolving faster than traditional chip development cycles.”

🇷🇴 Modelele IA evoluează mai rapid decât ciclurile tradiționale de dezvoltare a cipurilor.

Generație	Inovație principală
MTIA 300	Primul cip optimizat pentru modelele de clasificare și recomandare (Ranking & Recommendation), bază modulară reutilizabilă
MTIA 400	Evoluție către workload-uri GenAI, rack de 72 de cipuri într-un domeniu scale-up unic
MTIA 450	Dublarea lățimii de bandă HBM, +75% FLOPS MX4, accelerare hardware pentru attention și FFN
MTIA 500	+50% lățime de bandă HBM vs MTIA 450, focus pe inference GenAI

Progresia între MTIA 300 și MTIA 500: lățime de bandă HBM multiplicată de 4,5 ori și FLOPS multiplicați de 25 de ori. Strategia Meta se bazează pe dezvoltare de mare viteză (un cip nou pe an), un focus pe inference mai degrabă decât pe pre-antrenare și o integrare nativă PyTorch.

“Mainstream GPUs are typically built for the most demanding workload — large-scale GenAI pre-training — while Meta’s primary need is inference.”

🇷🇴 GPU-urile obișnuite sunt concepute, de regulă, pentru cea mai solicitantă sarcină de lucru — pre-antrenarea GenAI la scară largă — în timp ce nevoia principală a Meta este inference.

Arhitectura procesorului elementar (Processing Element) combină două nuclee RISC-V vectoriale, un motor de produs scalar (Dot Product Engine), o unitate de funcții speciale (Special Function Unit), un motor de reducere și un DMA. Stiva software se bazează pe PyTorch, vLLM, Triton și compilatoare MTIA dedicate, cu o integrare vLLM prin arhitectură de plugin.

🔗 Meta MTIA: cipuri IA la scară pentru miliarde de utilizatori

Gemini CLI v0.33.0: Plan Mode îmbogățit și autentificare A2A

11 martie 2026 — Gemini CLI publică versiunea v0.33.0, la două săptămâni după v0.32.0, care introdusese Plan Mode.

Categorie	Noutăți
Arhitectură agent	Autentificare HTTP pentru agenți A2A la distanță, descoperirea cardurilor de agenți A2A autentificați
Plan Mode	Sub-agenți de cercetare integrați, suport pentru adnotări pentru feedback de la utilizatori, noua subcomandă `copy`
Interfață CLI	Header compact cu pictogramă ASCII, afișare inversată a ferestrei de context, retenție implicită de 30 de zile pentru istoricul chat

Adăugarea autentificării HTTP pentru protocolul A2A (Agent-to-Agent) este principala noutate tehnică: Gemini CLI poate acum să descopere și să se autentifice la agenți la distanță, punând bazele unei orchestrări multi-agenți securizate.

🔗 Changelog Gemini CLI

Gemini în Chrome: extindere către India, Noua Zeelandă și Canada

11 martie 2026 — Google extinde funcționalitățile IA din Chrome pe trei piețe noi: India, Noua Zeelandă și Canada.

Gemini in Chrome — asistentul IA din panoul lateral, bazat pe Gemini 3.1 — este acum disponibil pe Mac, Windows și Chromebook Plus în aceste regiuni. Printre funcționalitățile lansate: acces la Gmail, Maps, Calendar și YouTube din Chrome, analiză încrucișată a mai multor taburi deschise și transformarea imaginilor direct în browser prin Nano Banana 2. Actualizarea adaugă peste 50 de limbi suplimentare, inclusiv hindi, franceză și spaniolă.

🔗 Chrome se extinde în India, Noua Zeelandă și Canada

AlphaEvolve: noi limite pentru 5 numere Ramsey

11 martie 2026 — Pushmeet Kohli (Google DeepMind) anunță că AlphaEvolve a stabilit noi limite inferioare pentru 5 numere Ramsey clasice în combinatorică extremală — probleme atât de dificile încât Erdős însuși comentase complexitatea lor, iar cele mai bune rezultate anterioare datau de cel puțin un deceniu.

AlphaEvolve acționează ca un meta-algoritm care descoperă automat procedurile de căutare necesare, acolo unde, istoric, trebuiau concepuți manual algoritmi specifici. Acest rezultat ilustrează capacitățile AlphaEvolve dincolo de optimizările de kernels Google pentru care era deja cunoscut.

🔗 Tweet Pushmeet Kohli

Gemini Embedding 2: primul embedding multimodal Google

10 martie 2026 — Google anunță Gemini Embedding 2, descris drept „our most capable and first fully multimodal embedding model”. Este primul model de embedding multimodal nativ al Google, disponibil pentru dezvoltatori prin Gemini API și AI Studio.

🔗 Tweet @googleaidevs

GitHub Copilot: revizuire de cod din terminal și progrese JetBrains

11 martie 2026 — Două actualizări notabile pentru GitHub Copilot.

Code Review din GitHub CLI v2.88.0

Acum este posibil să soliciți o revizuire de cod Copilot direct din terminal. Comenzile gh pr edit --add-reviewer @copilot (mod neinteractiv) și gh pr create (mod interactiv) integrează Copilot alături de coechipieri. Selectarea recenzenților beneficiază de o căutare dinamică, ceea ce îmbunătățește performanța în organizațiile mari și corectează probleme de accesibilitate. Disponibil pe toate planurile care includ Copilot code review — este necesară actualizarea la GitHub CLI v2.88.0.

🔗 Code Review din GitHub CLI

Îmbunătățiri agentice pentru JetBrains IDEs

Actualizarea plugin JetBrains aduce în disponibilitate generală (GA): agenți personalizați (custom agents), sub-agenți și agent de planificare (plan agent), precum și selectarea automată a modelului pentru toate planurile. În previzualizare publică (public preview): hooks de agent (userPromptSubmitted, preToolUse, postToolUse, errorOccurred) printr-un fișier hooks.json în .github/hooks/, și suport pentru fișierele AGENTS.md și CLAUDE.md.

Alte îmbunătățiri completează actualizarea: auto-approve configurabil prin MCP, panou de gândire pentru modelele cu raționament extins, indicator de utilizare a ferestrei de context și deprecierea modului Edit din meniu.

🔗 Îmbunătățiri JetBrains

Explorarea unui depozit în Copilot pe web

În previzualizare publică: este posibil să explorezi arborele unui depozit GitHub direct din interfața web a Copilot. Fișierele selectate sunt adăugate automat ca referințe temporare în chat și pot fi făcute permanente.

🔗 Explorare de depozit în Copilot

Anthropic Sydney și Claude for Office

Sydney, al 4-lea birou Asia-Pacific

10 martie 2026 — Anthropic anunță deschiderea iminentă a unui birou la Sydney, al patrulea din Asia-Pacific (după Tokyo, Seul și Singapore). Australia este pe locul 4 la nivel mondial pentru utilizarea Claude.ai pe cap de locuitor; Noua Zeelandă este pe locul 8 după același indicator (Anthropic Economic Index). Biroul se va concentra inițial pe clienți enterprise, startupuri și cercetare.

🔗 Sydney, al 4-lea birou Asia-Pacific

Claude for Excel și PowerPoint: context partajat și Skills Office

11 martie 2026 — Add-ins Claude for Excel și Claude for PowerPoint primesc două actualizări importante: partajarea contextului între cele două aplicații (un analist poate extrage date dintr-un registru Excel și le poate utiliza într-o prezentare PowerPoint într-o singură conversație) și sosirea Skills (workflows reutilizabile cu un singur clic) în ambele add-ins.

Skills preîncărcate acoperă cele mai frecvente cazuri de utilizare: auditarea formulelor, construirea de modele LBO/DCF, deck-uri de peisaj concurențial, actualizarea prezentărilor cu date noi și revizuirea deck-urilor de investment banking. Add-ins sunt acum disponibile prin Amazon Bedrock, Google Cloud Vertex AI și Microsoft Foundry pentru implementări conforme. Disponibilitate: Mac și Windows pe planuri plătite (Pro, Max, Team, Enterprise).

🔗 Claude for Excel și PowerPoint

NVIDIA Nemotron 3 Super, ComfyUI și GTC 2026

11 martie 2026 — NVIDIA este foarte activă în jurul GTC 2026.

Nemotron 3 Super oferă un debit de 5 ori mai mare pentru IA agentică față de generația anterioară. Este un model MoE (Mixture of Experts) cu 120 de miliarde de parametri, open source, optimizat pentru sarcini de inferență de înaltă frecvență.

NVIDIA și ComfyUI au anunțat la GDC 2026 (Game Developers Conference) o integrare care simplifică generarea video IA locală pentru dezvoltatorii de jocuri și creatori, cu suport pentru modelele FLUX și LTX-Video.

Blogul NVIDIA GTC 2026 Live Updates reunește anunțurile live ale conferinței de la San Jose — Mistral AI își prezintă de asemenea modelele frontier în acest cadru.

🔗 Nemotron 3 Super 🔗 ComfyUI GDC 🔗 GTC 2026 Live

Pe scurt

Runway Labs — Runway lansează un incubator intern condus de Alejandro Matamala Ortiz (cofondator, director de inovație). Runway Labs va prototipa aplicații radical noi pentru video generativ și modele de simulare a lumii (General World Models) în sectoare variate: cinema, sănătate, educație, jocuri video, publicitate, imobiliare. Recrutări deschise.

🔗 Introducing Runway Labs

Claude Code /btw — O nouă comandă /btw permite conversații laterale (side chain conversations) în timp ce o sarcină este în execuție, fără a întrerupe lucrul în curs.

🔗 Tweet @bcherny

NotebookLM Flashcards — Actualizare pentru quizuri și flashcards: reluare de unde ai rămas, urmărirea flashcards reușite sau ratate, posibilitatea de a șterge sau amesteca flashcards.

🔗 Tweet NotebookLM

Meta Canopy Height Maps v2 — Meta și World Resources Institute publică CHMv2, o nouă versiune a hărților globale ale înălțimii coronamentului forestier. Modelul DINOv3 (viziune auto-supervizată de la Meta) îmbunătățește precizia și acoperirea globală. Aplicații: migrație climatică, restaurare forestieră, planificare urbană. Modele disponibile open source.

🔗 Canopy Height Maps v2

Z.ai GLM-5 — GLM-5 este acum accesibil utilizatorilor Lite (nivel gratuit), după ce fusese rezervat utilizatorilor Pro de la lansarea sa în februarie 2026.

🔗 Tweet @ZixuanLi_

Ce înseamnă asta

11 martie 2026 ilustrează două tendințe de fond care converg.

Prima este platformizarea agenticii: OpenAI, Perplexity și GitHub publică în aceeași zi primitive complementare (shell tools, sandboxes, agent hooks, code review). Ecosistemul se structurează în jurul unor blocuri reutilizabile — skills, containere, sub-agenți — care le permit dezvoltatorilor să construiască agenți fiabili fără să reinventeze infrastructura.

A doua este cursa pentru siliciu custom: detaliile publicate de Meta despre cele patru generații MTIA în doi ani dezvăluie o strategie clară de independență față de GPU-urile de larg consum, calibrată pentru inferență la scară mare. Aceeași logică împinge NVIDIA să publice Nemotron 3 Super chiar în ziua GTC, unde anunțurile se acumulează.

Crearea Anthropic Institute se înscrie într-o mișcare mai discretă, dar durabilă: pe măsură ce capacitățile progresează, marile companii IA își structurează echipele de impact public — nu ca o comunicare de fațadă, ci ca un efort de cercetare în sine.

Surse

Acest document a fost tradus din versiunea fr în limba ro folosind modelul gpt-5.5. Pentru mai multe informații despre procesul de traducere, consultați https://gitlab.com/jls42/ai-powered-markdown-translator