Ziua de 11 martie 2026 este încărcată: Anthropic înființează un institut interdisciplinar pentru dezbaterea publică despre IA, Perplexity lansează viziunea sa “Computer” prin patru API-uri simultane, OpenAI publică noile primitive agentice ale Responses API, iar Meta detaliază patru generații de cipuri IA personalizate.
Anthropic Institute: Jack Clark la conducerea beneficiului public
11 martie 2026 — Anthropic lansează The Anthropic Institute, un nou demers pentru a avansa dezbaterea publică privind provocările generate de IA puternică. Inițiativa este condusă de co-fondatorul Jack Clark, care preia un nou rol de “Head of Public Benefit” (responsabil cu beneficiul public) la Anthropic.
Institutul va reuni o echipă interdisciplinară — cercetători, economiști, juriști, specialiști în politici publice — cu acces unic la modelele de vârf ale Anthropic. Misiunea sa: analiza și comunicarea impacturilor sociale, economice și de securitate pe măsură ce IA evoluează.
Primele trei recrutări anunțate:
| Recrutare | Parcurs |
|---|---|
| Matt Botvinick | Resident Fellow, Yale Law School; fost Senior Director of Research, Google DeepMind |
| Anton Korinek | Profesor de economie (concediu sabatic), echipa Economic Research |
| Zoë Hitzig | Fostă OpenAI, specializată în impacturi sociale și economice ale IA |
Institutul se bazează pe echipele existente ale Anthropic: Frontier Red Team, Societal Impacts, Economic Research. În paralel, Anthropic anunță extinderea echipei Public Policy, axată pe transparența modelelor, protecția consumatorilor de energie, controalele la export și guvernanța globală a IA.
Crearea acestui Institut marchează o etapă notabilă: Anthropic structurează formal angajamentul său public și îi oferă o vizibilitate prin unul dintre co-fondatorii săi.
🔗 Prezentarea The Anthropic Institute
Perplexity: lansare coordonată a viziunii “Everything is Computer”
11 martie 2026 — Perplexity publică simultan patru anunțuri care constituie o lansare coordonată în jurul viziunii sale “Computer”: IA ca calculator personal și profesional.
Personal Computer și Enterprise
Personal Computer este un Mac mini dedicat care funcționează 24/7, conectat la aplicațiile locale și la serverele Perplexity. Acesta acționează ca un proxy digital al utilizatorului — acțiunile sensibile necesită o aprobare explicită. Listă de așteptare deschisă.
Computer for Enterprise se conectează la Snowflake, Salesforce, HubSpot și sute de platforme. Competențele (skills) sunt personalizabile, iar integrarea Slack permite lucrul în DM-uri sau în canale partajate. Se bazează pe SOC 2 Type II, SAML SSO și jurnale de audit (audit logs). Perplexity citează un rezultat dintr-un studiu intern pe 16.000 de cereri: economii de 1,6 milioane de dolari în costuri de muncă și 3,25 ani de muncă realizată în 4 săptămâni.
Comet Enterprise este un browser IA nativ cu controale administrative (permisiuni pe domeniu, jurnale de acțiuni, MDM) și un parteneriat cu CrowdStrike pentru protecții la nivel de browser.
Perplexity Finance primește 40+ instrumente financiare în direct (SEC filings, FactSet, S&P Global, Coinbase, LSEG, Quartr, Polymarket), cu conectare broker via Plaid pentru analiza unui portofoliu real.
Premium Sources oferă acces la Statista, CB Insights și PitchBook direct în fluxurile de căutare — sursele plătite sunt citate automat.
Agent API: orchestrare runtime completă
Agent API este un runtime gestionat pentru a construi fluxuri de lucru agentice cu căutare integrată, execuție de instrumente și orchestrare multi-model. Înlocuiește într-un singur punct de integrare un router de modele, un strat de căutare, un furnizor de embeddings, un serviciu sandbox și un stack de monitorizare (monitoring stack).
| Outil intégré | Capacités |
|---|---|
web_search | Filtrare pe domeniu, recență, interval de date, limbă, buget de conținut |
fetch_url | Recuperare directă de URL |
| Fonctions personnalisées | Suport complet |
Patru profile optimizate (presets) acoperă cazurile de utilizare: căutare factuală rapidă, căutare echilibrată, analiză multi-surse aprofundată și cercetare instituțională. Deep Research 2.0 este disponibil prin profilul advanced-deep-research — lansează zeci de căutări per interogare și procesează sute de documente.
Agent API este agnostic față de modele, suportă lanțuri de repliere (fallback chains) multi-model pentru o disponibilitate aproape de 100% și este disponibil astăzi pe docs.perplexity.ai.
Search API: extrase îmbunătățite și benchmark SEAL
Actualizarea Search API se axează pe calitatea fragmentelor (snippets) și pe infrastructura de evaluare.
Noul pipeline de etichetare la nivel de fragment (span-level labeling) identifică care segmente dintr-un document sursă sunt relevante pentru o interogare. Rezultat: extrase mai mici și mai precise, ceea ce reduce costurile în tokens și îmbunătățește gestionarea contextului pentru modelele downstream.
Benchmark-ul SEAL testează dacă un sistem de recuperare poate răspunde la întrebări al căror răspuns se schimbă în timp. Perplexity avansează pe SEAL-Hard în timp ce alți furnizori scad. Framework-ul search_evals este actualizat open source pe GitHub.
Alte îmbunătățiri: suport multi-interogare (până la 5 într-o singură cerere API), filtrare după limbă (cod ISO 639-1) și după țară, și SDK Python (pip install perplexityai) cu suport nativ pentru cele trei API-uri.
Sandbox API: execuție de cod izolată pentru agenți
Perplexity oferă mediul său intern de execuție a codului ca serviciu independent. Fiecare sesiune rulează într-un pod Kubernetes izolat, cu un sistem de fișiere persistent montat. Limbaje suportate: Python, JavaScript, SQL. Instalarea de pachete la momentul execuției (at runtime) este posibilă.
Sesiunile au stare persistentă (stateful): fișierele create într-o etapă sunt disponibile pentru etapele următoare, iar fluxurile de lucru lungi pot face pauză și relua ore mai târziu. Securitatea se bazează pe un model zero trust (zero-trust): fără acces direct la rețea, trafic extern prin proxy, codul nu are niciodată acces la cheile API brute.
Sandbox API va fi integrabilă în Agent API cu aceeași cheie API și aceleași credite. Stare: beta privată în curând.
OpenAI: Responses API primește un mediu de calcul pentru agenți
11 martie 2026 — OpenAI publică un articol de inginerie detaliat despre noile primitive ale Responses API pentru a construi agenți autonomi fiabili: instrument shell Unix, containere găzduite, compactare nativă a contextului și agent skills reutilizabile.
Instrumentul shell
Shell tool permite modelului să interacționeze cu un calculator prin linia de comandă, cu acces la utilitățile Unix clasice (grep, curl, awk). Spre deosebire de interpretatorul de cod existent care executa doar Python, shell tool acceptă Go, Java, Node.js și alte medii. Modelele GPT-5.2 și ulterioare sunt antrenate să propună comenzi shell.
Responses API poate executa mai multe comenzi shell în paralel prin sesiuni de container separate și aplică un plafon de ieșire per comandă pentru a evita saturarea ferestrei de context.
Containere găzduite
Containerul constituie spațiul de lucru al modelului:
| Componant | Descriere |
|---|---|
| Sistem de fișiere | Upload, organizare și gestionare a resurselor via APIs container și file |
| Baze de date | Stocare structurat (SQLite) — modelul interoghează tabelele în loc să încarce tot conținutul |
| Acces rețea | Proxy egress centralizat cu listă de permisiuni, injectare de secrete pe domeniu |
Compactare nativă a contextului
Pentru sarcini de durată lungă, Responses API integrează un mecanism de compactare nativă: modelele sunt antrenate să producă o reprezentare compactă și criptată a stării conversaționale. Disponibil pe partea de server (prag configurabil) sau printr-un endpoint /compact. Codex folosește acest mecanism pentru a menține sesiuni de codare pe termen lung fără degradare.
Agent skills
Skills-urile (competențele agentului) codifică modele repetitive de flux de lucru (workflow patterns) în bundle-uri reutilizabile: un folder cu un fișier SKILL.md și resursele asociate. Responses API încarcă automat skill-ul în context înainte de a trimite promptul modelului. Skills-urile sunt gestionate via API și versionate.
În paralel, un articol pe blog pentru dezvoltatori celebrează un an de Responses API cu cinci studii de caz clienți. Cele două publicații formează un tablou coerent al evoluției platformei către agenticitate.
🔗 Responses API + mediu de calcul 🔗 Un an de Responses API
OpenAI: strategie de apărare împotriva prompt injection
11 martie 2026 — OpenAI publică un articol de securitate despre rezistența agenților IA la atacurile prin injecție de prompt (prompt injection).
Primele atacuri constau în inserarea de instrucțiuni directe în conținut extern (pagini Wikipedia, emailuri). Odată cu îmbunătățirea modelelor, aceste atacuri au evoluat către inginerie socială (social engineering): context profesional convingător, urgență simulată, autorizație pretinsă. Un exemplu din 2025 descris în articol arăta un atac reușit în 50% din cazuri pe o versiune mai veche de ChatGPT.
OpenAI abordează problema prin prisma unui sistem tripartit (angajator / agent / terț malițios), analog cu un agent uman de servicii clienți expus tentativelor de manipulare. Obiectivul nu este să identifice perfect fiecare atac, ci să limiteze impactul unei manipulări reușite.
| Contre-mesure | Description |
|---|---|
| Analyse source-sink | Detectarea combinațiilor conținut neîncredere + acțiune periculoasă |
| Safe Url | Detectează dacă informații din conversație ar fi transmise către un terț — solicită confirmare sau blochează |
| Sandbox applicatif | Canvas și ChatGPT Apps detectează comunicațiile neașteptate și cer consimțământul |
Safe Url se aplică, de asemenea, la navigările în Atlas precum și la căutările și navigările din Deep Research.
🔗 Proiectarea agenților AI pentru a rezista prompt injection
Meta MTIA: patru generații de cipuri IA în doi ani
11 martie 2026 — Meta publică un articol tehnic detaliat despre familia sa de cipuri IA personalizate MTIA (Meta Training and Inference Accelerator). În doi ani, Meta a dezvoltat patru generații succesive pentru a deservi miliarde de utilizatori la costuri reduse.
“AI models are evolving faster than traditional chip development cycles.”
🇷🇴 Modelele IA evoluează mai repede decât ciclurile tradiționale de dezvoltare ale cipurilor.
| Generație | Inovația principală |
|---|---|
| MTIA 300 | Primul cip optimizat pentru modelele de clasificare și recomandare (Ranking & Recommendation), bază modulară reutilizabilă |
| MTIA 400 | Evoluție către workload-uri GenAI, rack de 72 de cipuri într-un domeniu scale-up unic |
| MTIA 450 | Dublarea lățimii de bandă HBM, +75% FLOPS MX4, accelerare hardware pentru attention și FFN |
| MTIA 500 | +50% lățime de bandă HBM față de MTIA 450, focus pe inferență GenAI |
Progresul între MTIA 300 și MTIA 500: lățimea de bandă HBM multiplicată de 4,5 și FLOPS multiplicat de 25. Strategia Meta se bazează pe un ciclu de dezvoltare de mare viteză (un cip nou pe an), un focus pe inferență mai degrabă decât pe pre-antrenare și o integrare nativă PyTorch.
“Mainstream GPUs are typically built for the most demanding workload — large-scale GenAI pre-training — while Meta’s primary need is inference.”
🇷🇴 GPU-urile mainstream sunt, de obicei, construite pentru cel mai solicitant tip de workload — pre-antrenarea GenAI la scară largă — în timp ce necesitatea principală a Meta este inferența.
Arhitectura elementului de procesare (Processing Element) combină două nuclee RISC-V vectoriale, un motor produs scalar (Dot Product Engine), o unitate de funcții speciale (Special Function Unit), un motor de reducere și un DMA. Pilele software se bazează pe PyTorch, vLLM, Triton și compilatoare dedicate MTIA, cu o integrare vLLM printr-o arhitectură de plugin.
🔗 Meta MTIA : scalarea cipurilor AI pentru miliarde
Gemini CLI v0.33.0: Plan Mode îmbogățit și autentificare A2A
11 martie 2026 — Gemini CLI publică versiunea v0.33.0, la două săptămâni după v0.32.0 care a introdus Plan Mode.
| Categorie | Noutăți |
|---|---|
| Arhitectură agent | Autentificare HTTP pentru agenți A2A la distanță, descoperire a hărților de agenți A2A autentificați |
| Plan Mode | Sub-agenti de căutare integrați, suport pentru adnotări pentru feedback utilizator, noua sub-comandă copy |
| Interfață CLI | Header compact cu icoană ASCII, afișare inversată a ferestrei de context, retenție 30 zile implicit pentru istoricul de chat |
Adăugarea autentificării HTTP pentru protocolul A2A (Agent-to-Agent) este principalul element tehnic nou: Gemini CLI poate acum să descopere și să se autentifice la agenți de la distanță, punând bazele unei orchestrări multi-agenti securizate.
🔗 Jurnalul de modificări Gemini CLI
Gemini în Chrome: extindere către India, Noua Zeelandă și Canada
11 martie 2026 — Google extinde funcționalitățile IA din Chrome către trei piețe noi: India, Noua Zeelandă și Canada.
Gemini in Chrome — asistentul IA din panoul lateral, bazat pe Gemini 3.1 — este acum disponibil pe Mac, Windows și Chromebook Plus în aceste regiuni. Printre funcționalitățile lansate: acces la Gmail, Maps, Calendar și YouTube din Chrome, analiză transversală a mai multor file deschise și transformarea imaginilor direct în browser prin Nano Banana 2. Actualizarea adaugă 50+ limbi suplimentare, inclusiv hindi, franceză și spaniolă.
🔗 Chrome se extinde în India, Noua Zeelandă și Canada
--- ## AlphaEvolve: noi limite inferioare pentru 5 numere Ramsey
11 martie 2026 — Pushmeet Kohli (Google DeepMind) anunță că AlphaEvolve a stabilit noi limite inferioare pentru 5 numere Ramsey clasice din combinatorica extremală — probleme atât de dificile încât chiar Erdős comentase complexitatea lor, iar cele mai bune rezultate anterioare datează de cel puțin un deceniu.
AlphaEvolve acționează ca un meta-algoritm care descoperă automat procedurile de căutare necesare, acolo unde anterior trebuiau concepute manual algoritmi specifici. Acest rezultat ilustrează capabilitățile AlphaEvolve dincolo de optimizările de kernel Google pentru care era deja cunoscut.
Gemini Embedding 2: primul embedding multimodal al Google
10 martie 2026 — Google anunță Gemini Embedding 2, descris ca „cel mai capabil și primul model de embedding complet multimodal”. Este primul model de embedding nativ multimodal de la Google, disponibil pentru dezvoltatori prin Gemini API și AI Studio.
GitHub Copilot: revizuire de cod din terminal și progrese pentru JetBrains
11 martie 2026 — Două actualizări notabile pentru GitHub Copilot.
Code Review din GitHub CLI v2.88.0
Este acum posibil să soliciți o revizuire de cod Copilot direct din terminal. Comenzile gh pr edit --add-reviewer @copilot (mod neinteractiv) și gh pr create (mod interactiv) integrează Copilot alături de colegii de echipă. Selecția recenzorilor beneficiază de o căutare dinamică, ceea ce îmbunătățește performanța în organizații mari și corectează probleme de accesibilitate. Disponibil pe toate planurile care includ Copilot code review — este necesară actualizarea la GitHub CLI v2.88.0.
🔗 Revizuire de cod din GitHub CLI
Îmbunătățiri agentice pentru JetBrains IDEs
Actualizarea pluginului JetBrains aduce în disponibilitate generală (GA): agenți personalizați (custom agents), sub-agenți și agent de planificare (plan agent), precum și selecția automată de model pentru toate planurile. În preview public (public preview): hooks d’agent (userPromptSubmitted, preToolUse, postToolUse, errorOccurred) printr-un fișier hooks.json în .github/hooks/, și suport pentru fișierele AGENTS.md și CLAUDE.md.
Alte îmbunătățiri completează actualizarea: auto-approve configurabil prin MCP, panou de gândire pentru modelele cu raționament extins, indicator de utilizare a ferestrei de context și deprecarea modului Edit din meniu.
Explorarea unui depozit în Copilot pe web
În preview public: este posibil să explorezi structura unui depozit GitHub direct din interfața web a Copilot. Fișierele selectate sunt adăugate automat ca referințe temporare în chat și pot fi făcute permanente.
🔗 Explorare depozit în Copilot
Anthropic Sydney și Claude for Office
Sydney, al patrulea birou din Asia-Pacific
10 martie 2026 — Anthropic anunță deschiderea iminentă a unui birou la Sydney, al patrulea în Asia-Pacific (după Tokyo, Seul și Singapore). Australia este pe locul 4 la nivel mondial pentru utilizarea Claude.ai per cap de locuitor; Noua Zeelandă este pe locul 8 conform aceluiași indicator (Anthropic Economic Index). Biroul se va concentra inițial pe clienți enterprise, startup-uri și cercetare.
🔗 Sydney, al patrulea birou Asia-Pacific
Claude for Excel și PowerPoint: context partajat și Skills Office
11 martie 2026 — Add-in-urile Claude for Excel și Claude for PowerPoint primesc două actualizări importante: partajarea contextului între cele două aplicații (un analist poate extrage date dintr-un registru Excel și să le folosească într-o prezentare PowerPoint într-o singură conversație) și introducerea Skills (fluxuri de lucru reutilizabile cu un clic) în ambele add-in-uri.
Skills preîncărcate acoperă cazurile de utilizare cele mai comune: audit de formule, construire de modele LBO/DCF, prezentări despre peisajul concurențial, actualizare a prezentărilor cu date noi și revizuirea deck-urilor pentru bănci de investiții. Add-in-urile sunt acum disponibile prin Amazon Bedrock, Google Cloud Vertex AI și Microsoft Foundry pentru implementări conforme. Disponibilitate: Mac și Windows pe planurile plătite (Pro, Max, Team, Enterprise).
🔗 Claude for Excel și PowerPoint
NVIDIA Nemotron 3 Super, ComfyUI și GTC 2026
11 martie 2026 — NVIDIA este foarte activă în jurul GTC 2026.
Nemotron 3 Super oferă un debit de 5 ori mai mare pentru IA agentică comparativ cu generația precedentă. Este un model MoE (Mixture of Experts) de 120 de miliarde de parametri open source, optimizat pentru sarcini de inferență cu frecvență înaltă.
NVIDIA și ComfyUI au anunțat la GDC 2026 (Game Developers Conference) o integrare care simplifică generarea video IA locală pentru dezvoltatorii de jocuri și creatori, cu suport pentru modelele FLUX și LTX-Video.
Blogul NVIDIA GTC 2026 Live Updates reunește anunțurile în direct de la conferința din San Jose — Mistral AI prezintă de asemenea modelele frontier în acest cadru.
🔗 Nemotron 3 Super 🔗 ComfyUI GDC 🔗 GTC 2026 Live
Pe scurt
Runway Labs — Runway lansează un incubator intern condus de Alejandro Matamala Ortiz (co-fondator, director de inovație). Runway Labs va prototipa aplicații radical noi pentru video generativ și modele de simulare a lumii (General World Models) în sectoare variate: cinema, sănătate, educație, jocuri video, publicitate, imobiliare. Recrutare deschisă.
Claude Code /btw — O nouă comandă /btw permite conversații laterale (side chain conversations) în timp ce o sarcină este în curs de execuție, fără a întrerupe munca curentă.
NotebookLM Flashcards — Actualizare pentru quiz-uri și flashcards: reluare de unde ai rămas, urmărire a flashcard-urilor reușite sau eșuate, posibilitatea de a șterge sau amesteca flashcards.
Meta Canopy Height Maps v2 — Meta și World Resources Institute publică CHMv2, o nouă versiune a hărților globale ale înălțimii coronamentelor forestiere. Modelul DINOv3 (viziune auto-supervizată de la Meta) îmbunătățește acuratețea și acoperirea globală. Aplicații: migrație climatică, restaurare forestieră, planificare urbană. Modelele disponibile open source.
🔗 Hărți ale înălțimii coroanei v2
Z.ai GLM-5 — GLM-5 este acum accesibil utilizatorilor Lite (nivel gratuit), după ce fusese rezervat utilizatorilor Pro de la lansarea sa în februarie 2026.
Ce înseamnă
11 martie 2026 ilustrează două tendințe de fond care converg.
Prima este platformizarea agenticii: OpenAI, Perplexity și GitHub publică în aceeași zi primitive complementare (shell tools, sandboxes, agent hooks, code review). Ecosistemul se structurează în jurul blocurilor reutilizabile — skills, containere, sub-agenți — care permit dezvoltatorilor să construiască agenți fiabili fără a re-inventa infrastructura.
A doua este cursa pentru siliciu personalizat: detaliul că Meta publică despre cele patru generații MTIA în doi ani relevă o strategie clară de independență față de GPU-urile de uz general, calibrată pentru inferență la scară largă. Aceeași logică împinge NVIDIA să publice Nemotron 3 Super în ziua GTC, unde anunțurile se acumulează.
Crearea Anthropic Institute se înscrie într-un demers mai discret dar durabil: pe măsură ce capacitățile progresează, marile companii de AI își structurează echipele de impact public — nu doar ca PR, ci ca un efort de cercetare de sine stătător.
Surse
- Institutul Anthropic
- Sydney, al patrulea birou Asia-Pacific
- Claude for Excel și PowerPoint
- Tweet @bcherny (/btw)
- Everything is Computer — Perplexity
- Agent API — Perplexity
- Search API — Perplexity
- Sandbox API — Perplexity
- Responses API + mediu de calcul — OpenAI
- 1 an de Responses API — OpenAI
- Apărarea împotriva prompt injection — OpenAI
- Meta MTIA chips
- Hărți ale înălțimii coroanei v2
- Gemini CLI v0.33.0
- Gemini în Chrome — extindere
- AlphaEvolve — numere Ramsey
- Gemini Embedding 2
- Copilot Code Review din CLI
- Copilot JetBrains — îmbunătățiri agentice
- Copilot — explorare depozit pe web
- Nemotron 3 Super — NVIDIA
- ComfyUI + NVIDIA la GDC
- GTC 2026 Live Updates — NVIDIA
- Introducing Runway Labs
- NotebookLM Flashcards update
- Z.ai GLM-5 Lite rollout
Acest document a fost tradus din versiunea fr în limba ro folosind modelul gpt-5-mini. Pentru mai multe informații despre procesul de traducere, consultați https://gitlab.com/jls42/ai-powered-markdown-translator