GPT-5.4 mini și nano lansate de OpenAI, Mistral se alătură NVIDIA Nemotron Coalition, Perplexity Comet Enterprise disponibil

Pe 17 martie 2026, totul se află sub semnul GTC NVIDIA și al mai multor lansări majore. OpenAI publică GPT-5.4 mini și nano, cele mai capabile modele compacte ale sale de până acum, care se apropie de modelul complet pe mai multe benchmark-uri. NVIDIA Nemotron Coalition ia amploare prin aderarea Mistral AI și Perplexity. Perplexity lansează simultan Comet Enterprise cu o guvernanță MDM completă, Claude Code v2.1.77 dublează limita de generare pentru Opus 4.6, iar GitHub, Anthropic, Google și OpenAI se unesc pentru a finanța securitatea open source cu 12,5 milioane de dolari.

GPT-5.4 mini și nano: modelele compacte ale OpenAI

17 martie — OpenAI lansează GPT-5.4 mini și GPT-5.4 nano, cele mai performante modele compacte ale sale de până acum. Aceste două variante aduc capabilitățile GPT-5.4 în formate optimizate pentru sarcini cu volum mare, cu latență redusă și cost mai mic.

GPT-5.4 mini îmbunătățește semnificativ GPT-5 mini la cod, raționament, înțelegere multimodală și utilizarea de tool-uri, funcționând totodată de peste două ori mai rapid. Se apropie de performanțele modelului complet GPT-5.4 pe mai multe evaluări cheie, inclusiv SWE-Bench Pro și OSWorld-Verified.

GPT-5.4 nano este cea mai mică și mai puțin costisitoare versiune din familia GPT-5.4, concepută pentru sarcinile în care contează mai mult viteza și costul: clasificare, extragere de date, ranking și subagenți simpli de cod.

Evaluare	GPT-5.4	GPT-5.4 mini	GPT-5.4 nano	GPT-5 mini
SWE-Bench Pro (public)	57,7 %	54,4 %	52,4 %	45,7 %
Terminal-Bench 2.0	75,1 %	60,0 %	46,3 %	38,2 %
Toolathlon	54,6 %	42,9 %	35,5 %	26,9 %
GPQA Diamond	93,0 %	88,0 %	82,8 %	81,6 %
OSWorld-Verified	75,0 %	72,1 %	39,0 %	42,0 %

Cazurile de utilizare se împart în trei registre: asistenții de cod (GPT-5.4 mini excelează în workflow-uri de codare rapidă, bucle de depanare, generare frontend), subagenții (în Codex, GPT-5.4 poate delega sub-sarcini către GPT-5.4 mini folosind doar 30 % din cota GPT-5.4) și controlul interfeței (computer use), unde GPT-5.4 mini interpretează rapid capturile de ecran ale interfețelor dense.

Model	Disponibilitate	Preț intrare	Preț ieșire	Context
GPT-5.4 mini	API, Codex, ChatGPT Free/Go	0,75 $/million tokens	4,50 $/million tokens	400 000 tokens
GPT-5.4 nano	doar API	0,20 $/million tokens	1,25 $/million tokens	—

În ChatGPT, GPT-5.4 mini este accesibil utilizatorilor Free și Go prin funcționalitatea “Thinking” din meniul +. Pentru planurile plătite, servește drept model de rezervă în caz de limită de debit pentru GPT-5.4 Thinking.

🔗 Introducere GPT-5.4 mini și nano

NVIDIA GTC 2026: Nemotron Coalition și Dynamo 1.0

Conferința GTC a NVIDIA, care a început pe 16 martie, a fost catalizatorul mai multor anunțuri majore ale industriei: formarea unei coaliții deschise în jurul modelelor frontier open source, lansarea în producție a unui sistem de operare pentru inferență și anunțarea unui blueprint de date pentru IA fizică.

Mistral se alătură NVIDIA Nemotron Coalition

16 martie — Mistral AI anunță un parteneriat strategic cu NVIDIA pentru a co-dezvolta modele de IA frontier open source. Mistral devine membru fondator al NVIDIA Nemotron Coalition, combinând arhitectura sa frontier cu infrastructura de calcul NVIDIA și tool-urile sale de dezvoltare.

Aspect	Detaliu
Rol Mistral	Membru fondator, arhitectură frontier + ofertă full-stack IA
Aport NVIDIA	Infrastructură GPU + tool-uri de dezvoltare
Obiectiv	Co-dezvoltarea de modele deschise de nivel frontier

🔗 Anunț Mistral pe X

Perplexity se alătură de asemenea coaliției

16 martie — Perplexity anunță aderarea la aceeași NVIDIA Nemotron Coalition. Puncte-cheie: Perplexity rafinează modele deschise diferite pentru fiecare etapă a pipeline-ului său de răspuns (analiza interogării, raționament, răspuns final). Modelul Nemotron 3 Super (120 de miliarde de parametri, arhitectură MoE) este acum disponibil în bara de căutare Perplexity, Agent API și Perplexity Computer.

🔗 Blog Perplexity – Nemotron Coalition 🔗 Anunț NVIDIA

Dynamo 1.0: sistemul de operare pentru inferență intră în producție

16 martie — NVIDIA anunță la GTC punerea în producție a Dynamo 1.0, prezentat drept „sistemul de operare pentru inferență” (inference operating system) pentru fabricile de IA (AI factories). Dynamo crește performanțele de inferență pe GPU-urile Blackwell până la 7x față de implementările neoptimizate. Trecerea la v1.0 marchează intrarea sa din faza experimentală în producția industrială.

🔗 Anunț NVIDIA Dynamo 1.0

Physical AI Data Factory Blueprint

16 martie — NVIDIA dezvăluie Physical AI Data Factory Blueprint: o arhitectură de referință pentru a transforma calculul accelerat în date de antrenare de înaltă calitate destinate roboticii, agenților de viziune IA și vehiculelor autonome. Acest blueprint permite companiilor să genereze sintetic date de antrenare pentru IA fizică la scară largă.

🔗 Anunț NVIDIA Physical AI

Cohere + NVIDIA: IA suverană pe DGX Spark

16 martie — Cohere și NVIDIA se asociază pentru a dezvolta o IA suverană, securizată și eficientă, anunțată de asemenea la GTC. Două direcții principale: modele NVIDIA ecosystem-native (modele personalizate optimizate pentru cea mai recentă arhitectură NVIDIA, axate pe workloads enterprise specializate) și North pe DGX Spark (platforma agentică North a Cohere va fi disponibilă pe NVIDIA DGX Spark, local și cu latență mică pentru date sensibile). Sectoarele țintă sunt finanțele, sănătatea și sectorul public.

🔗 Blog Cohere – IA suverană NVIDIA

Perplexity Comet Enterprise: guvernanță MDM și integrare CrowdStrike

17 martie — Perplexity lansează Comet Enterprise pentru toți abonații Enterprise. Browserul IA trece în versiune enterprise cu o guvernanță completă de deployment.

Funcționalitate	Descriere
Deployment MDM	installer silențios, deployment pe mii de mașini, log-uri de audit
Telemetrie granulară	urmărire per utilizator
CrowdStrike Falcon	protecție anti-phishing, detectarea exfiltrării (capturi de ecran, descărcări)
Intervenție în timp real	posibilă prin integrarea CrowdStrike
Confidențialitate	Perplexity nu își antrenează niciodată modelele pe datele enterprise

Printre primii utilizatori: companii din clasamentul Fortune, AWS, AlixPartners, Gunderson Dettmer și Bessemer Venture Partners. Cazurile de utilizare documentate acoperă pregătirea întâlnirilor cu clienții (știri în timp real), analiza contractelor SOW, calculele financiare și cercetarea sectorială.

🔗 Blog Perplexity – Comet Enterprise

Claude Code v2.1.77: 64k tokens implicit pentru Opus 4.6

17 martie — Claude Code v2.1.77 apare cu o creștere semnificativă a limitelor de generare și mai multe corecții de bug-uri critice.

Model	Limită implicită	Limită maximă
Claude Opus 4.6	64 000 tokens	128 000 tokens
Claude Sonnet 4.6	—	128 000 tokens

Limita implicită pentru Opus 4.6 se dublează (de la 32k la 64k tokens), permițând răspunsuri mult mai lungi fără configurare suplimentară.

Funcționalități noi:

allowRead în sandbox-uri: nou parametru de configurare filesystem care permite reautorizarea citirii în zone acoperite de o regulă denyRead. Util pentru configurații de securitate granulare.
/copy N: comanda /copy acceptă acum un index opțional — /copy 2 copiază a doua răspuns anterior al asistentului fără a naviga prin istoric.

Corecții notabile:

„Always Allow” pe comenzile bash compuse: regula era salvată pentru șirul complet (cd src && npm test), nu per subcomandă. Corectat.
Auto-updater: pornea descărcări paralele la deschideri și închideri repetate ale ferestrei, putând acumula zeci de gigaocteți în memorie. Corectat.
--resume care trunchia istoricul: o condiție de cursă (race condition) între scrierile de extragere a memoriei și transcriptul principal putea duce la o trunchiere silențioasă. Corectat.
Hooks PreToolUse care ocoleau regulile deny: un hook care returna "allow" ocolea regulile de permisiune deny, inclusiv setările gestionate de companie. Corecție de securitate importantă.

🔗 CHANGELOG Claude Code

Articol tehnic: cum folosește echipa Claude Code Skills

17 martie — Thariq (@trq212), inginer în echipa Claude Code de la Anthropic, publică “Lessons from Building Claude Code: How We Use Skills”, al doilea articol din serie după “Seeing like an Agent” (27 februarie, 3,6 milioane de vizualizări).

Articolul documentează cum Skills au devenit unul dintre cele mai folosite puncte de extensie ale Claude Code — flexibile, ușor de întreținut și permițând echipelor să definească workflow-uri reutilizabile direct în mediul lor de dezvoltare. Boris Cherny (@bcherny), responsabilul Claude Code, a redistribuit articolul descriindu-l drept „Really great writeup”. Autorul anunță, de asemenea, publicarea în curând, open source, a unui skill iMessage ca exemplu concret.

“Using Skills well is a skill issue. I didn’t quite realize how much until I wrote this.”

🇷🇴 A folosi bine Skills ține de competență. Nu mi-am dat seama cât de mult până nu am scris acest articol. — @trq212 pe X

🔗 Tweet de publicare

Codex Security: de ce nu există raport SAST

16 martie — OpenAI publică un articol tehnic care explică alegerea de design din spatele Codex Security: de ce sistemul nu se bazează pe analiza statică (SAST) ca punct de pornire.

Abordarea se sprijină pe patru piloni: citirea contextuală (analizarea întregii căi de cod cu contextul depozitului), micro-fuzzing-ul țintit (reducerea la cel mai mic fragment testabil pentru a scrie micro-fuzzers), raționamentul asupra constrângerilor (utilizarea unui mediu Python cu z3-solver pentru a formaliza problemele complexe) și validarea în sandbox (distincția dintre „aceasta ar putea fi o problemă” și „aceasta este o problemă” cu un PoC compilat). Articolul ilustrează aceste principii cu CVE-2024-29041 (Express), o redirecționare deschisă în care URL-urile formatate greșit ocoleau implementările de allowlist.

🔗 De ce Codex Security nu include un raport SAST

Gemini Personal Intelligence: extindere gratuită în Statele Unite

17 martie — Google extinde Personal Intelligence la mai mulți utilizatori gratuit, în Statele Unite. Această funcționalitate, până acum rezervată abonaților plătiți, este acum accesibilă conturilor gratuite (free-tier) prin trei suprafețe: AI Mode în Google Search, aplicația Gemini (iOS/Android) și extensia Gemini in Chrome.

Personal Intelligence conectează în mod securizat aplicațiile Google ale utilizatorului (Gmail, Google Photos, YouTube, Search) pentru a oferi răspunsuri personalizate. Exemple: recomandări de shopping adaptate cumpărăturilor anterioare, asistență tehnică țintind exact dispozitivul cumpărat (extras din chitanțele Gmail), itinerarii de călătorie personalizate bazate pe confirmările de hotel. Utilizatorul alege ce aplicații conectează și le poate dezactiva oricând. Disponibil doar pentru conturile Google personale (nu Workspace enterprise/educație).

🔗 Blog Google – Personal Intelligence

AlphaFold Database: milioane de structuri noi de complexe proteice

17 martie — Google DeepMind anunță extinderea bazei de date AlphaFold Database (AFDB) cu milioane de structuri noi de complexe proteice prezise de IA, în colaborare cu EMBL-EBI (Institutul European de Bioinformatică), NVIDIA și Universitatea Națională din Seul. Noile structuri acoperă, printre altele, patogenii bacterieni prioritari ai OMS — cele mai periculoase bacterii și cele rezistente la antibiotice. Această extindere trece de la nivelul proteinelor individuale la complexe proteice (interacțiuni între mai multe proteine), un salt calitativ pentru cercetarea medicală și farmaceutică.

🔗 Anunț Pushmeet Kohli pe X

xAI: API Text-to-Speech pentru Grok și primul loc la editare video

API Text-to-Speech

16 martie — xAI anunță disponibilitatea API Text-to-Speech pentru Grok, oferind voci naturale și expresive pentru dezvoltatori. LiveKit a integrat acest TTS în LiveKit Inference încă de la lansare.

🔗 Anunț xAI pe X

Grok Imagine #1 la editare video

15 martie — Grok Imagine ajunge pe primul loc la editare video în clasamentul Design Arena, cu un Elo de 1290. API-ul Imagine este acum disponibil dezvoltatorilor. Funcționalitatea acoperă adăugarea, ștergerea și schimbarea obiectelor în scene video.

🔗 Anunț Grok pe X

Perplexity Computer: control total asupra lui Comet și Android

Computer controlează Comet fără MCP

16 martie — Computer poate prelua acum controlul total al browserului Comet pentru a executa sarcini autonome: agentul de browser poate accesa orice site sau aplicație conectată, fără conectori sau MCP. Disponibil pentru toți utilizatorii Computer pe Comet.

🔗 Tweet Perplexity

Computer pe Android

16 martie — Perplexity Computer este acum disponibil pe Android, extinzând lansarea iOS din 13 martie la toate platformele mobile.

🔗 Tweet Perplexity Android

Manus: desktop local și Google Workspace la nivel de dezvoltator

Manus „My Computer” pe macOS și Windows

16 martie — Manus anunță “My Computer”, funcționalitate centrală a noii aplicații Manus Desktop (macOS și Windows). Până acum limitat la un sandbox cloud, Manus poate acum să ruleze direct pe mașina locală prin instrucțiuni în linie de comandă într-un terminal local — cu aprobare explicită a utilizatorului la fiecare pas.

Cazurile de utilizare acoperă un spectru larg: sortarea și redenumirea a mii de fișiere, crearea de aplicații desktop native (exemplu citat: o aplicație Mac de traducere și subtitrare în timp real creată în 20 de minute, fără a deschide Xcode), sau utilizarea GPU-ului local pentru antrenarea modelelor de machine learning. My Computer completează conectorii cloud existenți (Google Calendar, Gmail) mai degrabă decât să îi înlocuiască.

🔗 Tweet Manus · 🔗 Blog Manus

Manus stăpânește Google Workspace cu precizie

17 martie — Manus lansează o actualizare majoră a conectorului său Google Workspace, bazată pe Google Workspace CLI (instrument open source al echipei Google). Versiunea veche trata fișierele Google ca blocuri monolitice; noua versiune permite acțiuni granulare:

Domeniu	Capabilități noi
Google Docs	Înlocuiri chirurgicale de text, răspunsuri la comentarii specifice
Google Sheets	Citire multi-sheet încrucișată, actualizarea unei celule precise, duplicarea filelor
Google Slides	Editarea prezentărilor existente (titlul unei diapozitive, actualizarea cronologiei)
Google Drive	Reorganizarea dosarelor

Actualizarea este gratuită și retrocompatibilă.

🔗 Tweet Manus · 🔗 Blog Manus

GitHub: `/fleet` pentru mentenanță în masă și 12,5 M$ pentru open source

Copilot `/fleet`: mentenanță pe întreaga flotă de depozite

15 martie — GitHub demonstrează comanda /fleet în GitHub Copilot. Într-o singură instrucțiune, dezvoltatorii care gestionează mai multe depozite pot delega sarcinile repetitive de mentenanță (actualizări de configurație, corectări de dependențe) agentului pe întreaga lor flotă, în loc de depozit cu depozit.

🔗 Tweet GitHub

12,5 M$ pentru securitatea open source

17 martie — GitHub, Anthropic, AWS, Google și OpenAI se unesc într-un angajament colectiv de 12,5 milioane de dolari în favoarea Alpha-Omega, programul Linux Foundation dedicat securizării ecosistemului open source.

Puncte-cheie din partea GitHub: 280 000+ de mentenanți de pe sute de milioane de depozite publice vor fi eligibili pentru acces gratuit la GitHub Copilot Pro. GitHub injectează, de asemenea, 5,5 M$ în credite Azure pentru formare. GitHub Secure Open Source Fund, care a sprijinit deja 138 de proiecte, își deschide a patra sesiune la sfârșitul lui aprilie 2026.

Contextul este semnificativ: IA a accelerat considerabil descoperirea vulnerabilităților, ceea ce apasă mai mult asupra mentenanților. Obiectivul declarat este ca IA să reducă această povară, nu să o crească.

🔗 Articol GitHub Blog 🔗 Anunț Linux Foundation

Z.ai GLM-5-Turbo: viteză mare pentru medii cu agenți

15 martie — Z.ai lansează GLM-5-Turbo, o variantă de mare viteză a GLM-5 optimizată pentru medii cu agenți (în special OpenClaw). În aceeași zi, limitele de utilizare sunt triplate pentru abonații GLM Coding Plan. Disponibil pe OpenRouter și prin API-ul direct.

🔗 Anunț Z.ai pe X

Kimi publică un paper despre Attention Residuals

16-17 martie — Moonshot AI publică un paper de cercetare despre Attention Residuals pe arXiv: o nouă abordare de agregare în profunzime care înlocuiește conexiunile reziduale standard cu o recurență inspirată de dualitatea timp/profunzime (depth-wise aggregation). Analiza arată că această abordare atenuează în mod natural problemele de creștere a magnitudinii stărilor ascunse. Elon Musk a răspuns „Impressive work from Kimi” la tweetul de anunț (4,5 milioane de vizualizări).

🔗 Tweet Kimi · 🔗 arXiv 2603.15031

ElevenLabs × Deloitte: agenți omnicanal pentru întreprinderi

14 martie — ElevenLabs și Deloitte anunță un parteneriat strategic care combină platforma ElevenLabs Agents cu expertiza sectorială a Deloitte, pentru a ajuta marile întreprinderi să implementeze agenți conversaționali omnicanal. Parteneriatul vizează companiile reglementate (finanțe, sănătate, servicii publice). Deloitte aduce integrarea de business, ElevenLabs furnizează infrastructura audio IA (voce, transcriere, agenți).

🔗 Blog ElevenLabs

Scurte

Tongyi Fun-CineForge (Alibaba, 16 martie) — Tongyi Lab open-source Fun-CineForge, un sistem de dublaj cinematografic IA care se apropie de calitatea cinematografiei profesionale. Disponibil pe GitHub, HuggingFace și ModelScope. 🔗 Anunț pe X

Ce înseamnă asta

NVIDIA GTC 2026 cristalizează o dinamică importantă: mai multe laboratoare IA de prim-plan (Mistral, Perplexity, Cohere) se aliniază în jurul infrastructurii NVIDIA pentru a co-dezvolta modele frontier deschise sau implementări suverane. Această convergență în jurul unei coaliții deschise contrastează cu perioada recentă de fragmentare — și semnalează că pre-antrenarea la scară largă a devenit prea costisitoare pentru a fi tratată în siloz.

GPT-5.4 mini confirmă o tendință puternică: modelele de „format mic” nu mai sunt versiuni degradate, ci alternative competitive. Cu 54,4 % pe SWE-Bench Pro față de 57,7 % pentru modelul complet și un cost de 19 ori mai mic, GPT-5.4 mini redefinește raportul performanță/preț pentru fluxurile de lucru de codare.

Ziua de 17 martie ilustrează și ascensiunea agenților locali și desktop: Manus „My Computer” iese din cloud pentru a accesa mașina locală, Perplexity Computer preia controlul lui Comet fără MCP, iar Claude Code își dublează fereastra implicită de generare pentru Opus 4.6. Era agentului care doar sugerează face loc erei agentului care execută.

Surse

Acest document a fost tradus din versiunea fr în limba ro folosind modelul gpt-5.4-mini. Pentru mai multe informații despre procesul de traducere, consultați https://gitlab.com/jls42/ai-powered-markdown-translator