Pe 17 martie 2026, totul se află sub semnul GTC NVIDIA și al mai multor lansări majore. OpenAI publică GPT-5.4 mini și nano, cele mai capabile modele compacte ale sale de până acum, care se apropie de modelul complet pe mai multe benchmark-uri. NVIDIA Nemotron Coalition ia amploare prin aderarea Mistral AI și Perplexity. Perplexity lansează simultan Comet Enterprise cu o guvernanță MDM completă, Claude Code v2.1.77 dublează limita de generare pentru Opus 4.6, iar GitHub, Anthropic, Google și OpenAI se unesc pentru a finanța securitatea open source cu 12,5 milioane de dolari.
GPT-5.4 mini și nano: modelele compacte ale OpenAI
17 martie — OpenAI lansează GPT-5.4 mini și GPT-5.4 nano, cele mai performante modele compacte ale sale de până acum. Aceste două variante aduc capabilitățile GPT-5.4 în formate optimizate pentru sarcini cu volum mare, cu latență redusă și cost mai mic.
GPT-5.4 mini îmbunătățește semnificativ GPT-5 mini la cod, raționament, înțelegere multimodală și utilizarea de tool-uri, funcționând totodată de peste două ori mai rapid. Se apropie de performanțele modelului complet GPT-5.4 pe mai multe evaluări cheie, inclusiv SWE-Bench Pro și OSWorld-Verified.
GPT-5.4 nano este cea mai mică și mai puțin costisitoare versiune din familia GPT-5.4, concepută pentru sarcinile în care contează mai mult viteza și costul: clasificare, extragere de date, ranking și subagenți simpli de cod.
| Evaluare | GPT-5.4 | GPT-5.4 mini | GPT-5.4 nano | GPT-5 mini |
|---|---|---|---|---|
| SWE-Bench Pro (public) | 57,7 % | 54,4 % | 52,4 % | 45,7 % |
| Terminal-Bench 2.0 | 75,1 % | 60,0 % | 46,3 % | 38,2 % |
| Toolathlon | 54,6 % | 42,9 % | 35,5 % | 26,9 % |
| GPQA Diamond | 93,0 % | 88,0 % | 82,8 % | 81,6 % |
| OSWorld-Verified | 75,0 % | 72,1 % | 39,0 % | 42,0 % |
Cazurile de utilizare se împart în trei registre: asistenții de cod (GPT-5.4 mini excelează în workflow-uri de codare rapidă, bucle de depanare, generare frontend), subagenții (în Codex, GPT-5.4 poate delega sub-sarcini către GPT-5.4 mini folosind doar 30 % din cota GPT-5.4) și controlul interfeței (computer use), unde GPT-5.4 mini interpretează rapid capturile de ecran ale interfețelor dense.
| Model | Disponibilitate | Preț intrare | Preț ieșire | Context |
|---|---|---|---|---|
| GPT-5.4 mini | API, Codex, ChatGPT Free/Go | 0,75 $/million tokens | 4,50 $/million tokens | 400 000 tokens |
| GPT-5.4 nano | doar API | 0,20 $/million tokens | 1,25 $/million tokens | — |
În ChatGPT, GPT-5.4 mini este accesibil utilizatorilor Free și Go prin funcționalitatea “Thinking” din meniul +. Pentru planurile plătite, servește drept model de rezervă în caz de limită de debit pentru GPT-5.4 Thinking.
🔗 Introducere GPT-5.4 mini și nano
NVIDIA GTC 2026: Nemotron Coalition și Dynamo 1.0
Conferința GTC a NVIDIA, care a început pe 16 martie, a fost catalizatorul mai multor anunțuri majore ale industriei: formarea unei coaliții deschise în jurul modelelor frontier open source, lansarea în producție a unui sistem de operare pentru inferență și anunțarea unui blueprint de date pentru IA fizică.
Mistral se alătură NVIDIA Nemotron Coalition
16 martie — Mistral AI anunță un parteneriat strategic cu NVIDIA pentru a co-dezvolta modele de IA frontier open source. Mistral devine membru fondator al NVIDIA Nemotron Coalition, combinând arhitectura sa frontier cu infrastructura de calcul NVIDIA și tool-urile sale de dezvoltare.
| Aspect | Detaliu |
|---|---|
| Rol Mistral | Membru fondator, arhitectură frontier + ofertă full-stack IA |
| Aport NVIDIA | Infrastructură GPU + tool-uri de dezvoltare |
| Obiectiv | Co-dezvoltarea de modele deschise de nivel frontier |
Perplexity se alătură de asemenea coaliției
16 martie — Perplexity anunță aderarea la aceeași NVIDIA Nemotron Coalition. Puncte-cheie: Perplexity rafinează modele deschise diferite pentru fiecare etapă a pipeline-ului său de răspuns (analiza interogării, raționament, răspuns final). Modelul Nemotron 3 Super (120 de miliarde de parametri, arhitectură MoE) este acum disponibil în bara de căutare Perplexity, Agent API și Perplexity Computer.
🔗 Blog Perplexity – Nemotron Coalition 🔗 Anunț NVIDIA
Dynamo 1.0: sistemul de operare pentru inferență intră în producție
16 martie — NVIDIA anunță la GTC punerea în producție a Dynamo 1.0, prezentat drept „sistemul de operare pentru inferență” (inference operating system) pentru fabricile de IA (AI factories). Dynamo crește performanțele de inferență pe GPU-urile Blackwell până la 7x față de implementările neoptimizate. Trecerea la v1.0 marchează intrarea sa din faza experimentală în producția industrială.
Physical AI Data Factory Blueprint
16 martie — NVIDIA dezvăluie Physical AI Data Factory Blueprint: o arhitectură de referință pentru a transforma calculul accelerat în date de antrenare de înaltă calitate destinate roboticii, agenților de viziune IA și vehiculelor autonome. Acest blueprint permite companiilor să genereze sintetic date de antrenare pentru IA fizică la scară largă.
Cohere + NVIDIA: IA suverană pe DGX Spark
16 martie — Cohere și NVIDIA se asociază pentru a dezvolta o IA suverană, securizată și eficientă, anunțată de asemenea la GTC. Două direcții principale: modele NVIDIA ecosystem-native (modele personalizate optimizate pentru cea mai recentă arhitectură NVIDIA, axate pe workloads enterprise specializate) și North pe DGX Spark (platforma agentică North a Cohere va fi disponibilă pe NVIDIA DGX Spark, local și cu latență mică pentru date sensibile). Sectoarele țintă sunt finanțele, sănătatea și sectorul public.
🔗 Blog Cohere – IA suverană NVIDIA
Perplexity Comet Enterprise: guvernanță MDM și integrare CrowdStrike
17 martie — Perplexity lansează Comet Enterprise pentru toți abonații Enterprise. Browserul IA trece în versiune enterprise cu o guvernanță completă de deployment.
| Funcționalitate | Descriere |
|---|---|
| Deployment MDM | installer silențios, deployment pe mii de mașini, log-uri de audit |
| Telemetrie granulară | urmărire per utilizator |
| CrowdStrike Falcon | protecție anti-phishing, detectarea exfiltrării (capturi de ecran, descărcări) |
| Intervenție în timp real | posibilă prin integrarea CrowdStrike |
| Confidențialitate | Perplexity nu își antrenează niciodată modelele pe datele enterprise |
Printre primii utilizatori: companii din clasamentul Fortune, AWS, AlixPartners, Gunderson Dettmer și Bessemer Venture Partners. Cazurile de utilizare documentate acoperă pregătirea întâlnirilor cu clienții (știri în timp real), analiza contractelor SOW, calculele financiare și cercetarea sectorială.
🔗 Blog Perplexity – Comet Enterprise
Claude Code v2.1.77: 64k tokens implicit pentru Opus 4.6
17 martie — Claude Code v2.1.77 apare cu o creștere semnificativă a limitelor de generare și mai multe corecții de bug-uri critice.
| Model | Limită implicită | Limită maximă |
|---|---|---|
| Claude Opus 4.6 | 64 000 tokens | 128 000 tokens |
| Claude Sonnet 4.6 | — | 128 000 tokens |
Limita implicită pentru Opus 4.6 se dublează (de la 32k la 64k tokens), permițând răspunsuri mult mai lungi fără configurare suplimentară.
Funcționalități noi:
allowReadîn sandbox-uri: nou parametru de configurare filesystem care permite reautorizarea citirii în zone acoperite de o regulădenyRead. Util pentru configurații de securitate granulare./copy N: comanda/copyacceptă acum un index opțional —/copy 2copiază a doua răspuns anterior al asistentului fără a naviga prin istoric.
Corecții notabile:
- „Always Allow” pe comenzile bash compuse: regula era salvată pentru șirul complet (
cd src && npm test), nu per subcomandă. Corectat. - Auto-updater: pornea descărcări paralele la deschideri și închideri repetate ale ferestrei, putând acumula zeci de gigaocteți în memorie. Corectat.
--resumecare trunchia istoricul: o condiție de cursă (race condition) între scrierile de extragere a memoriei și transcriptul principal putea duce la o trunchiere silențioasă. Corectat.- Hooks
PreToolUsecare ocoleau reguliledeny: un hook care returna"allow"ocolea regulile de permisiunedeny, inclusiv setările gestionate de companie. Corecție de securitate importantă.
Articol tehnic: cum folosește echipa Claude Code Skills
17 martie — Thariq (@trq212), inginer în echipa Claude Code de la Anthropic, publică “Lessons from Building Claude Code: How We Use Skills”, al doilea articol din serie după “Seeing like an Agent” (27 februarie, 3,6 milioane de vizualizări).
Articolul documentează cum Skills au devenit unul dintre cele mai folosite puncte de extensie ale Claude Code — flexibile, ușor de întreținut și permițând echipelor să definească workflow-uri reutilizabile direct în mediul lor de dezvoltare. Boris Cherny (@bcherny), responsabilul Claude Code, a redistribuit articolul descriindu-l drept „Really great writeup”. Autorul anunță, de asemenea, publicarea în curând, open source, a unui skill iMessage ca exemplu concret.
“Using Skills well is a skill issue. I didn’t quite realize how much until I wrote this.”
🇷🇴 A folosi bine Skills ține de competență. Nu mi-am dat seama cât de mult până nu am scris acest articol. — @trq212 pe X
Codex Security: de ce nu există raport SAST
16 martie — OpenAI publică un articol tehnic care explică alegerea de design din spatele Codex Security: de ce sistemul nu se bazează pe analiza statică (SAST) ca punct de pornire.
Abordarea se sprijină pe patru piloni: citirea contextuală (analizarea întregii căi de cod cu contextul depozitului), micro-fuzzing-ul țintit (reducerea la cel mai mic fragment testabil pentru a scrie micro-fuzzers), raționamentul asupra constrângerilor (utilizarea unui mediu Python cu z3-solver pentru a formaliza problemele complexe) și validarea în sandbox (distincția dintre „aceasta ar putea fi o problemă” și „aceasta este o problemă” cu un PoC compilat). Articolul ilustrează aceste principii cu CVE-2024-29041 (Express), o redirecționare deschisă în care URL-urile formatate greșit ocoleau implementările de allowlist.
🔗 De ce Codex Security nu include un raport SAST
Gemini Personal Intelligence: extindere gratuită în Statele Unite
17 martie — Google extinde Personal Intelligence la mai mulți utilizatori gratuit, în Statele Unite. Această funcționalitate, până acum rezervată abonaților plătiți, este acum accesibilă conturilor gratuite (free-tier) prin trei suprafețe: AI Mode în Google Search, aplicația Gemini (iOS/Android) și extensia Gemini in Chrome.
Personal Intelligence conectează în mod securizat aplicațiile Google ale utilizatorului (Gmail, Google Photos, YouTube, Search) pentru a oferi răspunsuri personalizate. Exemple: recomandări de shopping adaptate cumpărăturilor anterioare, asistență tehnică țintind exact dispozitivul cumpărat (extras din chitanțele Gmail), itinerarii de călătorie personalizate bazate pe confirmările de hotel. Utilizatorul alege ce aplicații conectează și le poate dezactiva oricând. Disponibil doar pentru conturile Google personale (nu Workspace enterprise/educație).
🔗 Blog Google – Personal Intelligence
AlphaFold Database: milioane de structuri noi de complexe proteice
17 martie — Google DeepMind anunță extinderea bazei de date AlphaFold Database (AFDB) cu milioane de structuri noi de complexe proteice prezise de IA, în colaborare cu EMBL-EBI (Institutul European de Bioinformatică), NVIDIA și Universitatea Națională din Seul. Noile structuri acoperă, printre altele, patogenii bacterieni prioritari ai OMS — cele mai periculoase bacterii și cele rezistente la antibiotice. Această extindere trece de la nivelul proteinelor individuale la complexe proteice (interacțiuni între mai multe proteine), un salt calitativ pentru cercetarea medicală și farmaceutică.
xAI: API Text-to-Speech pentru Grok și primul loc la editare video
API Text-to-Speech
16 martie — xAI anunță disponibilitatea API Text-to-Speech pentru Grok, oferind voci naturale și expresive pentru dezvoltatori. LiveKit a integrat acest TTS în LiveKit Inference încă de la lansare.
Grok Imagine #1 la editare video
15 martie — Grok Imagine ajunge pe primul loc la editare video în clasamentul Design Arena, cu un Elo de 1290. API-ul Imagine este acum disponibil dezvoltatorilor. Funcționalitatea acoperă adăugarea, ștergerea și schimbarea obiectelor în scene video.
Perplexity Computer: control total asupra lui Comet și Android
Computer controlează Comet fără MCP
16 martie — Computer poate prelua acum controlul total al browserului Comet pentru a executa sarcini autonome: agentul de browser poate accesa orice site sau aplicație conectată, fără conectori sau MCP. Disponibil pentru toți utilizatorii Computer pe Comet.
Computer pe Android
16 martie — Perplexity Computer este acum disponibil pe Android, extinzând lansarea iOS din 13 martie la toate platformele mobile.
Manus: desktop local și Google Workspace la nivel de dezvoltator
Manus „My Computer” pe macOS și Windows
16 martie — Manus anunță “My Computer”, funcționalitate centrală a noii aplicații Manus Desktop (macOS și Windows). Până acum limitat la un sandbox cloud, Manus poate acum să ruleze direct pe mașina locală prin instrucțiuni în linie de comandă într-un terminal local — cu aprobare explicită a utilizatorului la fiecare pas.
Cazurile de utilizare acoperă un spectru larg: sortarea și redenumirea a mii de fișiere, crearea de aplicații desktop native (exemplu citat: o aplicație Mac de traducere și subtitrare în timp real creată în 20 de minute, fără a deschide Xcode), sau utilizarea GPU-ului local pentru antrenarea modelelor de machine learning. My Computer completează conectorii cloud existenți (Google Calendar, Gmail) mai degrabă decât să îi înlocuiască.
🔗 Tweet Manus · 🔗 Blog Manus
Manus stăpânește Google Workspace cu precizie
17 martie — Manus lansează o actualizare majoră a conectorului său Google Workspace, bazată pe Google Workspace CLI (instrument open source al echipei Google). Versiunea veche trata fișierele Google ca blocuri monolitice; noua versiune permite acțiuni granulare:
| Domeniu | Capabilități noi |
|---|---|
| Google Docs | Înlocuiri chirurgicale de text, răspunsuri la comentarii specifice |
| Google Sheets | Citire multi-sheet încrucișată, actualizarea unei celule precise, duplicarea filelor |
| Google Slides | Editarea prezentărilor existente (titlul unei diapozitive, actualizarea cronologiei) |
| Google Drive | Reorganizarea dosarelor |
Actualizarea este gratuită și retrocompatibilă.
🔗 Tweet Manus · 🔗 Blog Manus
GitHub: /fleet pentru mentenanță în masă și 12,5 M$ pentru open source
Copilot /fleet: mentenanță pe întreaga flotă de depozite
15 martie — GitHub demonstrează comanda /fleet în GitHub Copilot. Într-o singură instrucțiune, dezvoltatorii care gestionează mai multe depozite pot delega sarcinile repetitive de mentenanță (actualizări de configurație, corectări de dependențe) agentului pe întreaga lor flotă, în loc de depozit cu depozit.
12,5 M$ pentru securitatea open source
17 martie — GitHub, Anthropic, AWS, Google și OpenAI se unesc într-un angajament colectiv de 12,5 milioane de dolari în favoarea Alpha-Omega, programul Linux Foundation dedicat securizării ecosistemului open source.
Puncte-cheie din partea GitHub: 280 000+ de mentenanți de pe sute de milioane de depozite publice vor fi eligibili pentru acces gratuit la GitHub Copilot Pro. GitHub injectează, de asemenea, 5,5 M$ în credite Azure pentru formare. GitHub Secure Open Source Fund, care a sprijinit deja 138 de proiecte, își deschide a patra sesiune la sfârșitul lui aprilie 2026.
Contextul este semnificativ: IA a accelerat considerabil descoperirea vulnerabilităților, ceea ce apasă mai mult asupra mentenanților. Obiectivul declarat este ca IA să reducă această povară, nu să o crească.
🔗 Articol GitHub Blog 🔗 Anunț Linux Foundation
Z.ai GLM-5-Turbo: viteză mare pentru medii cu agenți
15 martie — Z.ai lansează GLM-5-Turbo, o variantă de mare viteză a GLM-5 optimizată pentru medii cu agenți (în special OpenClaw). În aceeași zi, limitele de utilizare sunt triplate pentru abonații GLM Coding Plan. Disponibil pe OpenRouter și prin API-ul direct.
Kimi publică un paper despre Attention Residuals
16-17 martie — Moonshot AI publică un paper de cercetare despre Attention Residuals pe arXiv: o nouă abordare de agregare în profunzime care înlocuiește conexiunile reziduale standard cu o recurență inspirată de dualitatea timp/profunzime (depth-wise aggregation). Analiza arată că această abordare atenuează în mod natural problemele de creștere a magnitudinii stărilor ascunse. Elon Musk a răspuns „Impressive work from Kimi” la tweetul de anunț (4,5 milioane de vizualizări).
🔗 Tweet Kimi · 🔗 arXiv 2603.15031
ElevenLabs × Deloitte: agenți omnicanal pentru întreprinderi
14 martie — ElevenLabs și Deloitte anunță un parteneriat strategic care combină platforma ElevenLabs Agents cu expertiza sectorială a Deloitte, pentru a ajuta marile întreprinderi să implementeze agenți conversaționali omnicanal. Parteneriatul vizează companiile reglementate (finanțe, sănătate, servicii publice). Deloitte aduce integrarea de business, ElevenLabs furnizează infrastructura audio IA (voce, transcriere, agenți).
Scurte
Tongyi Fun-CineForge (Alibaba, 16 martie) — Tongyi Lab open-source Fun-CineForge, un sistem de dublaj cinematografic IA care se apropie de calitatea cinematografiei profesionale. Disponibil pe GitHub, HuggingFace și ModelScope. 🔗 Anunț pe X
Ce înseamnă asta
NVIDIA GTC 2026 cristalizează o dinamică importantă: mai multe laboratoare IA de prim-plan (Mistral, Perplexity, Cohere) se aliniază în jurul infrastructurii NVIDIA pentru a co-dezvolta modele frontier deschise sau implementări suverane. Această convergență în jurul unei coaliții deschise contrastează cu perioada recentă de fragmentare — și semnalează că pre-antrenarea la scară largă a devenit prea costisitoare pentru a fi tratată în siloz.
GPT-5.4 mini confirmă o tendință puternică: modelele de „format mic” nu mai sunt versiuni degradate, ci alternative competitive. Cu 54,4 % pe SWE-Bench Pro față de 57,7 % pentru modelul complet și un cost de 19 ori mai mic, GPT-5.4 mini redefinește raportul performanță/preț pentru fluxurile de lucru de codare.
Ziua de 17 martie ilustrează și ascensiunea agenților locali și desktop: Manus „My Computer” iese din cloud pentru a accesa mașina locală, Perplexity Computer preia controlul lui Comet fără MCP, iar Claude Code își dublează fereastra implicită de generare pentru Opus 4.6. Era agentului care doar sugerează face loc erei agentului care execută.
Surse
- Introducerea GPT-5.4 mini și nano – OpenAI
- De ce Codex Security nu include un raport SAST – OpenAI
- Mistral × NVIDIA – anunț X
- Perplexity se alătură coaliției NVIDIA Nemotron
- NVIDIA Nemotron Coalition
- NVIDIA Dynamo 1.0 – X
- NVIDIA Physical AI Data Factory Blueprint – X
- IA suverană Cohere + NVIDIA
- Perplexity Comet Enterprise
- CHANGELOG Claude Code v2.1.77
- Thariq – articol Skills
- Extinderea Google Personal Intelligence
- Extinderea bazei de date AlphaFold – X
- API-ul xAI TTS – X
- Grok Imagine #1 Design Arena – X
- Perplexity Computer controlează Comet – X
- Perplexity Computer Android – X
- Manus My Computer
- Manus Google Workspace CLI
- GitHub Copilot /fleet – X
- GitHub + Alpha-Omega 12,5 M$
- Linux Foundation – fond de securitate open source
- Z.ai GLM-5-Turbo – X
- Kimi Attention Residuals – X
- Kimi Attention Residuals – arXiv
- ElevenLabs × Deloitte
- Tongyi Fun-CineForge – X
Acest document a fost tradus din versiunea fr în limba ro folosind modelul gpt-5.4-mini. Pentru mai multe informații despre procesul de traducere, consultați https://gitlab.com/jls42/ai-powered-markdown-translator