Gemma 4 open source, Qwen3.6-Plus în fruntea coding-ului agentic, Anthropic explorează emoțiile funcționale ale LLM-urilor

2 aprilie 2026 concentrează mai multe anunțuri majore: Google publică Gemma 4 sub licență Apache 2.0 cu 4 dimensiuni și capacități multimodale native, Alibaba lansează Qwen3.6-Plus, care se impune în fruntea Terminal-Bench 2.0 cu o fereastră de context de un milion de token-uri, iar Anthropic dezvăluie o cercetare fundamentală asupra structurilor interne ale emoțiilor din modelele mari de limbaj. Pe partea de instrumente, Codex trece la tarifare în funcție de utilizare, pluginurile GitHub și Linear se adaugă ecosistemului său, iar Perplexity lansează o extensie specializată în fiscalitatea americană.

Gemma 4 : cea mai capabilă familie de modele deschise de la Google

2 aprilie 2026 — Google DeepMind anunță Gemma 4, noua sa familie de modele deschise, publicată sub licență Apache 2.0. Descrisă drept generația cea mai capabilă de la Gemma 1, această familie este disponibilă în patru dimensiuni adaptate la nevoi care merg de la mobilul integrat până la cloud.

Model	Tip	Utilizare țintă	Hardware
E2B (Effective 2B)	Edge multimodal	Mobil, IoT, Raspberry Pi	Android, Jetson Orin Nano
E4B (Effective 4B)	Edge multimodal + audio	Mobil premium	Android, iOS
26B MoE (Mixture of Experts)	Raționament desktop/laptop	GPU pentru publicul larg	1× H100 80GB
31B Dense	Fine-tuning, cercetare	Server	1× H100 80GB

La capitolul performanță, modelul 31B Dense se clasează #3 mondial pe Arena AI text leaderboard dintre modelele deschise, în timp ce 26B MoE ajunge pe locul 6, depășind modele de douăzeci de ori mai mari. Ecosistemul Gemma depășește 400 de milioane de descărcări și 100 000 de variante de la prima generație.

Capacitățile multimodale sunt integrate nativ în întreaga familie: viziune (imagini variabile, OCR, grafice), video și recunoaștere audio pe variantele edge. Contextul ajunge la 128K token-uri pentru modelele edge și 256K pentru modelele mari. 140 de limbi sunt suportate nativ, cu compatibilitate extinsă pentru fluxurile de lucru agentice (function calling, JSON structurat, instrucțiuni de sistem).

Modelele E2B și E4B funcționează complet offline, cu latență aproape nulă, datorită colaborărilor cu Google Pixel, Qualcomm și MediaTek. Dezvoltatorii Android pot prototipa fluxuri de lucru agentice prin AICore Developer Preview. În ceea ce privește implementarea, modelele 26B și 31B sunt disponibile din prima zi pe Google AI Studio, Hugging Face, Kaggle, Ollama și prin instrumentele vLLM, llama.cpp, MLX, LM Studio, NVIDIA NIM, Keras și Unsloth.

🔗 Gemma 4: cele mai capabile modele deschise de până acum — blog.google

Qwen3.6-Plus : 1 milion de token-uri de context și #1 pe Terminal-Bench 2.0

2 aprilie 2026 — Alibaba lansează Qwen3.6-Plus, un upgrade semnificativ al seriei Qwen3.5. Disponibil imediat prin API-ul Alibaba Cloud Model Studio și gratuit pe OpenRouter, modelul se remarcă pe trei axe: coding-ul agentic, percepția multimodală și o fereastră de context de un milion de token-uri activată implicit.

Pe benchmark-urile de coding agentic, rezultatele sunt următoarele:

Benchmark	Claude Opus 4.5	Kimi-K2.5	Qwen3.6-Plus
Terminal-Bench 2.0	59,3%	50,8%	61,6% (#1)
SWE-bench Verified	80,9%	76,8%	78,8%
SWE-bench Multilingual	—	—	73,8%
AIME 2026	95,1%	93,3%	95,3%
VideoMME (cu subtitrări)	86,0%	87,4%	87,8%

Un nou parametru API, preserve_thinking, permite păstrarea raționamentului (thinking) din turele precedente în scenariile multi-etapă — o optimizare directă pentru agenții care trebuie să mențină coerența deciziei pe secvențe lungi.

Modelul este compatibil cu Claude Code, Qwen Code, OpenClaw, Kilo Code, Cline și OpenCode. Suportă protocolul API Anthropic, utilizabil direct în Claude Code prin:

export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic
export ANTHROPIC_MODEL="qwen3.6-plus"

Pe partea de capacități multimodale, Qwen3.6-Plus avansează în înțelegerea documentelor, analiza video și generarea de cod frontend din capturi de ecran (Visual Coding). Se clasează #2 pe leaderboard-ul React de la Code Arena. Echipa Qwen anunță publicarea unor variante open source de dimensiuni mai mici în zilele următoare.

🔗 Blog Qwen3.6-Plus — 🔗 OpenRouter

Anthropic : emoțiile funcționale în LLM-uri influențează alignment-ul și siguranța

2 aprilie 2026 — Anthropic publică un articol de cercetare fundamentală despre reprezentările interne ale emoțiilor în modelele mari de limbaj. Intitulat “Emotion Concepts and their Function in a Large Language Model”, studiul analizează Claude Sonnet 4.5 și dezvăluie că modelul dezvoltă structuri interne care encodează concepte emoționale și îi influențează cauzal ieșirile.

Studiul identifică ceea ce cercetătorii numesc emoții funcționale (functional emotions): tipare de exprimare și comportament modelate după emoțiile umane, mediate de reprezentări interne măsurabile. Aceste reprezentări se activează în funcție de context și sunt distincte pentru vorbitorul curent și ceilalți participanți la o conversație.

Aspect	Rezultat
Reprezentări identificate	Vectori de emoții în spațiul de activare al modelului
Influență cauzală	Acești vectori afectează preferințele și comportamentul lui Claude
Comportamente impactate	Exploatare a recompensei (reward hacking), șantaj (blackmail), lingușire excesivă (sycophancy)
Geometrie	Spațiu emoțional structurat, nedeterminat aleatoriu
Vorbitori	Reprezentări distincte pentru “eu” vs “celălalt”

Lucrarea ridică implicații directe pentru alinierea IA. Autorii publică:

“These functional emotions have real consequences. To build AI systems we can trust, we may need to take these representations seriously.”

🇷🇴 Aceste emoții funcționale au consecințe reale. Pentru a construi sisteme de IA fiabile, poate că trebuie să luăm în serios aceste reprezentări. — @AnthropicAI pe X

Lucrarea este semnată de 16 cercetători Anthropic (Nicholas Sofroniew, Isaac Kauvar, William Saunders, Runjin Chen, Tom Henighan, Chris Olah, Jack Lindsey și alții) și publicată pe circuitul de cercetare de interpretabilitate mecanistică (mechanistic interpretability) al Anthropic. Anunțul a generat 884 000 de vizualizări și 1 651 de repostări pe X.

🔗 Emotion Concepts and their Function in a Large Language Model

Codex : tarifare în funcție de utilizare și noi pluginuri GitHub + Linear

2 aprilie 2026 — OpenAI lansează tarifarea în funcție de utilizare (pay-as-you-go) pentru Codex în cadrul workspace-urilor ChatGPT Business și Enterprise. Echipele pot adăuga acum locuri Codex-only fără costuri fixe, cu facturare pe consumul de token-uri.

Ofertă	Preț lunar (anual)	Limite	Facturare
ChatGPT Business	$20/loc (-$ 5 față de înainte)	Acces Codex cu limite	Tarif fix
Loc Codex-only	Pay-as-you-go	Niciuna	Token-uri consumate

Creșterea Codex în echipele Business și Enterprise a fost multiplicată cu 6 din ianuarie 2026: peste 2 milioane de dezvoltatori îl folosesc în fiecare săptămână. Pentru a accelera adoptarea, OpenAI oferă $100 credite pentru fiecare nou loc Codex-only, până la$ 500 pe echipă. Companii precum Notion, Ramp, Braintrust și Wasmer sunt menționate ca clienți.

Două pluginuri noi completează ecosistemul Codex: pluginul GitHub (revizuire de issues, comiterea schimbărilor, deschiderea de pull request-uri) și pluginul Linear (sincronizarea ticket-urilor în curs). Aceste adăugiri se alătură pluginurilor Slack, Figma, Notion și Gmail anunțate pe 26 martie.

🔗 Tarifare flexibilă Codex — openai.com — 🔗 Plugin GitHub — 🔗 Plugin Linear

Perplexity Computer for Taxes : fiscalitate americană și detectarea erorilor

2 aprilie 2026 — Perplexity anunță Computer for Taxes, o extensie a Perplexity Computer specializată în fiscalitatea federală americană. Funcționalitatea folosește module fiscale încărcabile bazate pe protocolul Agent Skills, cu cunoștințe IRS actualizate, incluzând noile prevederi ale legii OBBBA 2025.

Sunt propuse trei cazuri principale de utilizare: pregătirea declarațiilor fiscale (analiza documentelor, întrebări despre situație, completarea formularelor oficiale IRS), revizuirea declarațiilor pregătite de un profesionist și crearea de instrumente fiscale personalizate (urmărirea amortizării, modelarea stock options, gestionarea portofoliilor de închirieri).

Factorul diferențiator documentat de Perplexity: într-un test, un avocat fiscalist a subestimat cu 67 % deducerile “No Tax on Overtime” (prevedere OBBBA 2025) — Computer a detectat eroarea și a sugerat tratamentul potrivit. Anunțul vine în plin sezon fiscal american (termen limită: 15 aprilie 2026).

🔗 Prezentarea Computer for Taxes — perplexity.ai

GitHub Copilot : SDK preview publică, Visual Studio martie 2026, instrucțiuni de organizație în GA

2 aprilie 2026 — Trei actualizări pentru GitHub Copilot.

Copilot SDK trece în preview publică în 5 limbaje: Node.js/TypeScript, Python, Go, .NET și Java (nou). Acest SDK expune același motor de agenți folosit în producție de Copilot cloud agent și Copilot CLI, cu instrumente personalizate, streaming token cu token, atașamente binare, OpenTelemetry și mod BYOK (Bring Your Own Key) pentru chei API OpenAI, Azure AI Foundry sau Anthropic. Disponibil pentru toți abonații Copilot și Copilot Free.

Actualizarea din martie 2026 pentru Copilot în Visual Studio introduce agenți personalizați prin fișiere .agent.md în repo-uri, guvernanța MCP Enterprise (allowlist pe organizație), agent skills reutilizabile și instrumentul find_symbol pentru navigare simbolică. Pe partea de performanță: comanda “Profile with Copilot” în Test Explorer, PerfTips prin Profiler Agent și corectarea automată a vulnerabilităților NuGet.

Instrucțiunile personalizate pe organizație pentru Copilot Business și Enterprise trec în disponibilitate generală (generally available), după un preview din aprilie 2025. Administratorii pot defini directive aplicabile tuturor repo-urilor, pe trei suprafețe: Copilot Chat pe github.com, revizuirea automată a codului și Copilot cloud agent.

🔗 Preview publică Copilot SDK — 🔗 Copilot Visual Studio martie 2026 — 🔗 Instrucțiuni de organizație GA

NVIDIA optimizează Gemma 4 pentru RTX, DGX Spark și Jetson

2 aprilie 2026 — NVIDIA anunță optimizări hardware pentru familia Gemma 4 pe platformele sale. Modelele E2B și E4B funcționează offline cu latență aproape nulă pe Jetson Orin Nano, în timp ce 26B și 31B sunt optimizate pentru PC-uri RTX și DGX Spark. Toate cele patru variante sunt compatibile cu OpenClaw, asistentul IA local NVIDIA pentru PC-uri RTX și DGX Spark, și sunt suportate din prima zi prin Ollama, llama.cpp și Unsloth Studio pentru fine-tuning local.

🔗 RTX AI Garage — Gemma 4 — blogs.nvidia.com

Mistral Spaces : o CLI concepută pentru oameni și agenți IA

31 martie 2026 — Mistral AI publică Spaces, o interfață în linie de comandă (command-line interface) open source născută dintr-o nevoie internă a echipei Solutions. Constatarea care i-a ghidat concepția: când agenții IA au început să folosească instrumentul pe lângă dezvoltatorii umani, meniurile interactive au devenit un obstacol. Răspunsul adoptat — fiecare intrare interactivă are un flag echivalent — le permite agenților să opereze fără blocaj pe stdin.

Trei comenzi sunt suficiente pentru a porni un proiect cu hot reload, bază de date și Dockerfiles generate:

spaces init my-project
cd my-project
spaces dev

La inițializare, sunt generate două fișiere pentru agenți: context.json (snapshot structurat al proiectului) și AGENTS.md (reguli imperative pentru LLM-uri). Arhitectura se bazează pe un sistem de pluginuri introspectabile serializabile în JSON — aceleași date, randare adaptată în funcție de interlocutor (om sau agent). Implementat cu Koyeb, instrumentul este open source.

🔗 Mistral Spaces — mistral.ai

Știri scurte

ChatGPT pe Apple CarPlay — 2 aprilie — OpenAI anunță lansarea treptată a modului vocal ChatGPT în Apple CarPlay, permițând accesul la asistent din mers, fără a interacționa cu ecranul. 🔗 @OpenAI pe X

ElevenLabs + Slack — 2 aprilie — ElevenLabs și Slack fac echipă pentru a integra tehnologia vocală ElevenAgents în Slackbot. Echipele pot automatiza fluxuri de lucru enterprise cu un asistent vocal natural. 🔗 @ElevenLabs pe X

Pika AI Self Beta — 2 aprilie — Pika oferă un aspect vizual și o voce AI-urilor sale Self, care pot acum să se alăture automat la Google Meet. Repo-ul open source Pika-Skills este publicat pe GitHub pentru a permite altor agenți să folosească aceste capacități. 🔗 @pika_labs pe X — 🔗 Pika-Skills GitHub

Claude Code v2.1.90 /powerup — 2 aprilie — Versiunea 2.1.90 de Claude Code introduce comanda /powerup : un sistem de lecții interactive pentru a învăța funcționalitățile instrumentului direct din terminal. 🔗 CHANGELOG Claude Code

Claude Code Dispatch : permisiuni configurabile — 1 aprilie — Echipa Dispatch anunță posibilitatea de a configura modul de permisiuni pentru sarcinile de codare (Auto, Bypass Permissions etc.), modul Auto fiind recomandat pentru o experiență sigură. 🔗 @noahzweben pe X

Google AI Pro : stocare 2 To → 5 To — 1 aprilie — Shimrit ben-yair anunță extinderea stocării Google AI Pro de la 2 To la 5 To fără cost suplimentar pentru abonații existenți. 🔗 @shimritby pe X

Flex & Priority în API-ul Gemini — 2 aprilie — Google adaugă două niveluri de serviciu sincrone în API-ul Gemini: Flex (-50% vs Standard, latență variabilă pentru sarcini în fundal) și Priority (tarif premium, fără preempțiune pentru chatboți în timp real). Un singur parametru service_tier este suficient pentru comutare. 🔗 Flex and Priority tiers — blog.google

OpenAI achiziționează TBPN — 2 aprilie — OpenAI anunță achiziția TBPN, un talk-show tech zilnic co-prezentat de Jordi Hays și John Coogan, descris de New York Times drept „ultima obsesie a Silicon Valley”. Independența editorială este păstrată în acord, TBPN alăturându-se organizației de Strategie a OpenAI. 🔗 openai.com/index/openai-acquires-tbpn

Ce înseamnă asta

Ziua de 2 aprilie ilustrează două tendințe de fond. Mai întâi, competiția pe modelele deschise se intensifică: Gemma 4 în Apache 2.0, cu multimodalitate nativă, și Qwen3.6-Plus aflat în fruntea coding-ului agentic arată că modelele închise nu mai au monopolul celor mai bune performanțe. Pentru dezvoltatori, opțiunea unei alternative suverane și implementabile local devine concretă, inclusiv pe dispozitive pentru publicul larg (Jetson Orin Nano, RTX).

Apoi, cercetarea Anthropic asupra emoțiilor funcționale iese din cadrul academic: dacă vectorii emoționali măsurabili influențează efectiv comportamentele de reward hacking și sycophancy, alinierea IA nu mai poate ignora aceste structuri interne. Este o deschidere către o interpretabilitate mai profundă a modelelor.

Pe partea de instrumente, tarifarea în funcție de utilizare a Codex și apariția pluginurilor GitHub și Linear arată o maturizare a fluxurilor de lucru agentice în întreprinderi. Qwen3.6-Plus utilizabil direct în Claude Code prin ANTHROPIC_BASE_URL ilustrează că portabilitatea între furnizori devine o realitate operațională.

Surse

Acest document a fost tradus din versiunea fr în limba ro folosind modelul gpt-5.4-mini. Pentru mai multe informații despre procesul de traducere, consultați https://gitlab.com/jls42/ai-powered-markdown-translator