Zile intense pe 23 și 24 martie: Anthropic implementează auto mode în Claude Code — un classifier de acțiuni care ia deciziile de aprobare în locul utilizatorului — și publică un articol de inginerie despre arhitectura sa multi-agents inspirată de GAN. OpenAI lansează cumpărăturile vizuale în ChatGPT cu Agentic Commerce Protocol, în timp ce xAI deschide Grok Imagine pentru video multi-images pe API. GitHub Copilot, Google DeepMind și Anthropic Science Blog completează această trecere în revistă.
Claude Code : auto mode, un classifier între voi și comenzi
24 martie — Claude Code adaugă un al treilea nivel de permisiuni: auto mode. Până acum, instrumentul oferea fie aprobarea manuală a fiecărei scrieri de fișier și comenzi bash, fie dezactivarea completă a verificărilor. Auto mode introduce o cale intermediară: Claude ia singur deciziile, ghidat de un classifier (classifier) care analizează fiecare acțiune înainte de execuție.
Mecanismul este simplu — înainte de fiecare apel de tool, classifier-ul evaluează dacă acțiunea este potențial distructivă. Acțiunile considerate sigure se execută automat. Acțiunile riscante sunt blocate, iar Claude caută o abordare alternativă fără a întrerupe utilizatorul.
Anthropic precizează că acest mod reduce riscurile fără a le elimina și recomandă utilizarea lui în medii izolate. Pentru a-l activa: claude --enable-auto-mode, apoi navigați către acest mod cu Shift+Tab.
Funcționalitatea este disponibilă în preversion (research preview) pe planul Team. Lansarea pentru Enterprise și API era anunțată pentru zilele următoare.
New in Claude Code: auto mode. Instead of approving every file write and bash command, or skipping permissions entirely, auto mode lets Claude make permission decisions on your behalf. Safeguards check each action before it runs.
🇷🇴 Nou în Claude Code: auto mode. În loc să aprobi fiecare scriere de fișier și fiecare comandă bash, sau să ignori complet permisiunile, auto mode îl lasă pe Claude să ia deciziile de aprobare în locul tău. Măsuri de protecție verifică fiecare acțiune înainte să ruleze. — @claudeai pe X
Architecture multi-agents : abordarea GAN a Anthropic Engineering
24 martie — Într-un articol publicat pe Anthropic Engineering Blog, Prithvi Rajasekaran (echipa Labs) descrie o arhitectură multi-agents pentru a împinge limitele lui Claude pe două domenii: designul de interfață și dezvoltarea aplicațiilor autonome pe termen lung.
Abordarea se inspiră din rețelele antagoniste generative (Generative Adversarial Networks, GAN): un agent generator produce codul sau designul, în timp ce un agent evaluator distinct notează rezultatul și oferă feedback critic. Această decuplare rezolvă o problemă cunoscută — Claude tinde să se autoevalueze cu indulgență. Un evaluator dedicat, calibrat progresiv cu exemple, devine o pârghie eficientă de îmbunătățire.
Pentru design frontend, evaluatorul primește acces la MCP Playwright pentru a naviga paginile în direct. Sunt folosiți patru criterii: calitatea și coerența designului, originalitatea (penalizând pattern-urile generice numite „AI slop”), craft-ul tehnic și funcționalitatea. În 10 până la 15 iterații, generatorul produce interfețe semnificativ mai distinctive.
Pentru dezvoltarea aplicațiilor, arhitectura adaugă un planificator: el transformă un prompt de o singură frază într-o specificație completă de produs. Generatorul și evaluatorul negociază „contracte de sprint” înainte de fiecare implementare, definind criteriile de succes. Evaluatorul testează aplicația prin Playwright și poate face ca un sprint să eșueze, forțând o revizuire.
| Approche | Durée | Coût | Résultat |
|---|---|---|---|
| Agent solo Opus 4.5 | 20 min | 9 $ | Application cassée |
| Harness complet | 6 h | 200 $ | Application fonctionnelle |
| Harness avec Opus 4.6 | 4 h | 124,70 $ | Application fonctionnelle + agent Claude intégré |
Cu Opus 4.6 — care nu mai suferă de „anxietate de context” — autorul a putut simplifica arhitectura, elimina resetările de sesiune și reduce costurile. Principiul director rămâne: auditați regulat harness-ul pentru a elimina ceea ce modelul știe acum să facă singur.
🔗 Articol complet 🔗 Anunț pe X
Computer Use în Cowork și Claude Code (macOS, Pro/Max)
23 martie — Claude poate acum să folosească computerul vostru pentru a îndeplini sarcini direct. În preversion, această funcționalitate este disponibilă în Claude Cowork și Claude Code, doar pe macOS.
Claude poate deschide aplicații, naviga în browser, completa foi de calcul. Ideea: să încredințezi o sarcină de pe telefon, să te ocupi de altceva și să revii la un lucru terminat. Este de asemenea posibil să definiți sarcini recurente — să scaneze e-mailurile în fiecare dimineață, să genereze un raport în fiecare vineri.
Funcționalitatea Computer Use este disponibilă pe planurile Pro și Max, prin actualizarea aplicației de desktop și conectarea ei cu aplicația mobilă.
🔗 Anunț pe X 🔗 Pagina de produs Cowork
Anthropic Economic Index : “Learning curves” (al 5-lea raport)
24 martie — Anthropic publică al cincilea raport al Anthropic Economic Index, intitulat “Learning curves”, bazat pe datele de utilizare a Claude din februarie 2026 (aproximativ 1 milion de conversații, din 5 până în 12 februarie).
Raportul documentează două evoluții majore de la noiembrie 2025. Mai întâi, o diversificare a utilizărilor: cele mai frecvente zece sarcini pe Claude.ai nu mai reprezintă decât 19% din trafic, față de 24% cu trei luni mai devreme. Această tendință se explică în parte prin migrarea sarcinilor de codare către API, susținută de creșterea Claude Code.
Apoi, efectul „curbă de învățare”: utilizatorii de lungă durată (mai mult de șase luni) prezintă o rată de succes cu 4 până la 5 puncte procentuale mai mare. Ei lucrează la probleme mai complexe, colaborează mai mult și deleagă mai puțin în modul automat. Autorii văd aici un semnal de învățare prin practică (learning-by-doing), deși un bias de supraviețuire rămâne posibil.
În privința alegerii modelului, datele confirmă că utilizatorii preferă Opus pentru sarcinile cu valoare mare: fiecare tranșă de 10 $/h suplimentari în valoarea estimată a unei sarcini este însoțită de o creștere de 1,5 puncte în proporția de utilizare a lui Opus pe Claude.ai și de 2,8 puncte pe API.
Anthropic Science Blog : un nou blog pentru IA în cercetarea științifică
23 martie — Anthropic lansează Anthropic Science Blog, dedicat intersecției dintre IA și cercetarea științifică. Obiectivul este de a documenta modul în care IA accelerează munca cercetătorilor și de a explora întrebările pe care această transformare le ridică.
Blogul va publica trei tipuri de conținut: articole de fond despre rezultate precise cu rolul IA detaliat (Features), ghiduri practice pe domenii științifice (Workflows), și recenzii ale noutăților din domeniu (Field notes).
Două articole inaugurale însoțesc această lansare: „Vibe physics: The AI grad student” de Matthew Schwartz (un fizician supravegheat de Claude la un calcul real), și un tutorial despre orchestration-ul lui Claude Code pentru sarcini științifice pe mai multe zile.
Acest blog se ancorează în inițiativele existente ale Anthropic: programul AI for Science (credite API pentru cercetători), Claude for Life Sciences (parteneriate cu pharma și biotech), și Genesis Mission.
🔗 Articol de lansare 🔗 Anunț pe X
Shopping vizual în ChatGPT și Agentic Commerce Protocol
24 martie — OpenAI lansează o experiență de cumpărături vizuale și imersive direct în ChatGPT. Utilizatorii pot răsfoi produse vizual, le pot compara alături cu detalii (preț, recenzii, caracteristici) și își pot rafina căutarea în conversație — fără a părăsi ChatGPT. Este de asemenea posibil să încărcați o fotografie de inspirație pentru a găsi articole similare.
Pentru a alimenta această funcționalitate, OpenAI extinde Agentic Commerce Protocol (ACP) la descoperirea de produse. Acest protocol devine stratul de conectare dintre comercianți și utilizatori: comercianții își partajează cataloagele prin ACP, iar datele ajung direct în ChatGPT. Salesforce și Stripe sunt deja integrate ca furnizori terți.
| Détail | Info |
|---|---|
| Disponibilitate | Toți utilizatorii Free, Go, Plus, Pro — lansare săptămâna aceasta |
| Upload imagini | Fotografie de inspirație pentru a găsi articole similare |
| Comercianți integrați | Target, Sephora, Nordstrom, Lowe’s, Best Buy, The Home Depot, Wayfair |
| Shopify | Cataloage deja integrate fără acțiunea comercianților |
Walmart este primul comerciant care propune o aplicație ChatGPT nativă: de la descoperirea în ChatGPT la un mediu Walmart cu conectare de cont, program de fidelitate și plăți. Disponibil în browser web, iOS și Android în curând. Notă: OpenAI renunță la funcționalitatea sa inițială „Instant Checkout”, considerată insuficient de flexibilă pentru comercianți, și se concentrează pe descoperire.
OpenAI : politici de siguranță pentru adolescenți în open source
24 martie — OpenAI publică un set de politici de siguranță în open source pentru a ajuta dezvoltatorii să creeze experiențe adaptate adolescenților. Aceste politici sunt prezentate sub formă de prompturi utilizabile direct cu gpt-oss-safeguard, modelul de siguranță open-weight al OpenAI.
Obiectivul: să permită dezvoltatorilor să traducă obiective de siguranță abstracte în reguli operaționale precise. Sunt acoperite șase domenii:
| Domeniu | Descriere |
|---|---|
| Conținut violent grafic | Filtrarea violenței explicite |
| Conținut sexual grafic | Filtrarea sexualității explicite |
| Ideale corporale periculoase | Tulburări alimentare, comportamente de risc |
| Activități și provocări periculoase | Provocări virale cu risc |
| Jocuri de rol romantice sau violente | Interacțiuni neadecvate |
| Bunuri și servicii rezervate adulților | Alcool, tutun, jocuri de noroc |
Aceste politici au fost dezvoltate cu Common Sense Media și everyone.ai. Publicate prin ROOST Model Community (RMC GitHub), ele sunt prezentate explicit ca punct de plecare, nu ca soluție completă.
OpenAI Foundation : cel puțin 1 miliard de dolari alocați
24 martie — Bret Taylor, președintele consiliului de administrație al OpenAI Foundation, anunță că Fundația începe să aloce resursele rezultate din recapitalizarea din toamna 2025. Cel puțin 1 miliard de dolari va fi investit în cursul anului în patru domenii: științele vieții (Alzheimer, boli cu mortalitate ridicată), ocupare și impact economic, reziliență IA (siguranța copiilor, biosecuritate) și programe comunitare.
OpenAI : Library tab pentru gestionarea fișierelor în ChatGPT
23 martie — OpenAI adaugă noi funcționalități de gestionare a fișierelor în ChatGPT: fișiere recente accesibile direct din bara de instrumente, posibilitatea de a interoga un document deja încărcat și un tab Library în bara laterală web pentru a regăsi toate fișierele. Disponibil pentru abonații Plus, Pro și Business, cu o lansare viitoare pentru Spațiul Economic European, Elveția și Regatul Unit.
Gemini 3.1 Flash-Lite : un browser care generează paginile în timp real
24 martie — Google DeepMind publică o demonstrație a Gemini 3.1 Flash-Lite: un browser experimental care generează fiecare pagină web din mers, pe măsură ce dai clic, cauți și navighezi. Nicio pagină HTML preexistentă — fiecare conținut este creat în timp real de model. Demo-ul este accesibil direct din Google AI Studio și a generat un engagement puternic (85 000 de vizualizări în câteva ore).
Google DeepMind × Agile Robots : parteneriat robotic
24 martie — Google DeepMind anunță un parteneriat de cercetare cu Agile Robots, specialist în robotica umanoidă. Acordul prevede integrarea modelelor fundamentale Gemini în hardware-ul robotic al Agile Robots, în cadrul strategiei Gemini Robotics a Google DeepMind.
Grok Imagine : video multi-images pe API (#1 Arena Elo 1342)
24 martie — xAI anunță două capabilități noi pentru API-ul Grok Imagine: generarea de video din mai multe imagini (multi-image to video) și extinderea unui video existent (video extension).
Dezvoltatorii pot trimite până la 7 imagini ca intrare pentru a genera un video coerent prin modelul grok-imagine-video. API-ul funcționează asincron: se trimite cererea, apoi se interoghează până la statutul done. Ieșirile suportă raportul 16:9 în 720p.
Potrivit Design Arena, Grok Imagine a preluat imediat primul loc în clasamentul Multi Image to Video Arena cu un scor Elo de 1342.
🔗 Anunț @grok 🔗 Documentație API Imagine
GitHub Copilot : @copilot pentru a modifica direct o PR
24 martie — GitHub Copilot poate acum modifica direct orice pull request, la cerere. Menționând @copilot într-un comentariu cu o instrucțiune în limbaj natural — corectarea testelor eșuate, rezolvarea unui comentariu de review, adăugarea unui test unitar — agentul lucrează în mediul său cloud, își validează munca cu testele și linterele, apoi împinge modificările pe branch. Comportamentul anterior (deschiderea unei noi PR) rămâne disponibil dacă este cerut explicit. Disponibil pe toate planurile Copilot plătite.
GitHub Copilot : Gemini 3.1 Pro în JetBrains, Xcode și Eclipse
23 martie — GitHub Copilot extinde disponibilitatea Gemini 3.1 Pro la IDE-urile JetBrains, Xcode și Eclipse. Le modèle este acum accesibil prin selectorul de modele Copilot în toate modurile (agent, ask, edit) pe aceste medii, pe lângă platformele deja acceptate. În preview public pentru planurile Enterprise, Business, Pro și Pro+.
GitHub Copilot : gestionarea accesului agentului per depozit prin API
24 martie — GitHub publică în preview public o API REST pentru a gestiona accesul Copilot coding agent la nivelul depozitelor organizației. Administratorii pot autoriza agentul pentru niciunul, toate sau anumite depozite specifice în mod programatic — util pentru implementări la scară largă în întreprinderi.
GitHub Copilot : loguri în direct în Raycast
20 martie — Extensia GitHub Copilot pentru Raycast (launcherul macOS/Windows) permite acum monitorizarea în direct a logurilor coding agent fără a părăsi launcherul. Prin comanda “View Tasks”, apoi selectarea sesiunii, dezvoltatorii urmăresc progresul agentului în timp real. Disponibil pentru toți abonații Copilot plătitori.
Ce înseamnă asta
Modul auto al Claude Code este schimbarea cea mai structurată a acestei perioade. Mută încărcarea cognitivă de pe utilizator — nu mai este nevoie să aprobi fiecare comandă — menținând în același timp o plasă de siguranță prin classifier. Este un pas către agenți de dezvoltare mai autonomi, dar într-un cadru recomandat explicit pentru medii izolate. Articolul de inginerie despre harness multi-agents completează acest tablou: traiectoria Anthropic este clar către agenți care lucrează mult timp și în mod autonom, cu structuri interne de supraveghere (evaluator dedicat, contracte de sprint) mai degrabă decât o supraveghere umană la fiecare pas.
Din partea OpenAI, shoppingul vizual în ChatGPT marchează un pivot către cazurile de utilizare comerciale pentru publicul larg. Agentic Commerce Protocol poziționează ChatGPT ca un strat de intermediere între comercianți și consumatori — o strategie diferită de API-ul pur, care vizează direct valoarea tranzacțională.
Grok Imagine, care ajunge pe primul loc în clasamentul Arena chiar de la lansare pe multi-image to video, ilustrează viteza cu care xAI iterează pe generarea video. GitHub Copilot, la rândul său, consolidează sistematic autonomia coding agentului său: capacitatea de a modifica direct un PR existent reduce și mai mult schimburile dus-întors între agent și dezvoltator.
Surse
- Claude Code auto mode — @claudeai pe X
- Computer Use în Cowork — @claudeai pe X
- Anthropic Engineering Blog — Harness multi-agents
- Anthropic Economic Index — Curbe de învățare
- Anthropic Science Blog — Lansare
- Shopping vizual ChatGPT — OpenAI
- Politici de siguranță pentru adolescenți — OpenAI
- OpenAI Foundation — Investiție
- Library tab ChatGPT — @OpenAI pe X
- Flash-Lite Browser — @GoogleDeepMind pe X
- Parteneriat Google DeepMind × Agile Robots
- Grok Imagine video — @grok pe X
- Documentația API Grok Imagine
- Copilot @copilot în PR-uri — GitHub Changelog
- Gemini 3.1 Pro în JetBrains/Xcode/Eclipse — GitHub Changelog
- API acces agent per depozit — GitHub Changelog
- Copilot loguri în Raycast — GitHub Changelog
Acest document a fost tradus din versiunea fr în limba ro folosind modelul gpt-5.4-mini. Pentru mai multe informații despre procesul de traducere, consultați https://gitlab.com/jls42/ai-powered-markdown-translator