2 aprilie 2026 concentrează mai multe anunțuri majore: Google publică Gemma 4 sub licență Apache 2.0 cu 4 dimensiuni și capacități multimodale native, Alibaba lansează Qwen3.6-Plus, care se impune în fruntea Terminal-Bench 2.0 cu o fereastră de context de un milion de token-uri, iar Anthropic dezvăluie o cercetare fundamentală asupra structurilor interne ale emoțiilor din modelele mari de limbaj. Pe partea de instrumente, Codex trece la tarifare în funcție de utilizare, pluginurile GitHub și Linear se adaugă ecosistemului său, iar Perplexity lansează o extensie specializată în fiscalitatea americană.
Gemma 4 : cea mai capabilă familie de modele deschise de la Google
2 aprilie 2026 — Google DeepMind anunță Gemma 4, noua sa familie de modele deschise, publicată sub licență Apache 2.0. Descrisă drept generația cea mai capabilă de la Gemma 1, această familie este disponibilă în patru dimensiuni adaptate la nevoi care merg de la mobilul integrat până la cloud.
| Model | Tip | Utilizare țintă | Hardware |
|---|---|---|---|
| E2B (Effective 2B) | Edge multimodal | Mobil, IoT, Raspberry Pi | Android, Jetson Orin Nano |
| E4B (Effective 4B) | Edge multimodal + audio | Mobil premium | Android, iOS |
| 26B MoE (Mixture of Experts) | Raționament desktop/laptop | GPU pentru publicul larg | 1× H100 80GB |
| 31B Dense | Fine-tuning, cercetare | Server | 1× H100 80GB |
La capitolul performanță, modelul 31B Dense se clasează #3 mondial pe Arena AI text leaderboard dintre modelele deschise, în timp ce 26B MoE ajunge pe locul 6, depășind modele de douăzeci de ori mai mari. Ecosistemul Gemma depășește 400 de milioane de descărcări și 100 000 de variante de la prima generație.
Capacitățile multimodale sunt integrate nativ în întreaga familie: viziune (imagini variabile, OCR, grafice), video și recunoaștere audio pe variantele edge. Contextul ajunge la 128K token-uri pentru modelele edge și 256K pentru modelele mari. 140 de limbi sunt suportate nativ, cu compatibilitate extinsă pentru fluxurile de lucru agentice (function calling, JSON structurat, instrucțiuni de sistem).
Modelele E2B și E4B funcționează complet offline, cu latență aproape nulă, datorită colaborărilor cu Google Pixel, Qualcomm și MediaTek. Dezvoltatorii Android pot prototipa fluxuri de lucru agentice prin AICore Developer Preview. În ceea ce privește implementarea, modelele 26B și 31B sunt disponibile din prima zi pe Google AI Studio, Hugging Face, Kaggle, Ollama și prin instrumentele vLLM, llama.cpp, MLX, LM Studio, NVIDIA NIM, Keras și Unsloth.
🔗 Gemma 4: cele mai capabile modele deschise de până acum — blog.google
Qwen3.6-Plus : 1 milion de token-uri de context și #1 pe Terminal-Bench 2.0
2 aprilie 2026 — Alibaba lansează Qwen3.6-Plus, un upgrade semnificativ al seriei Qwen3.5. Disponibil imediat prin API-ul Alibaba Cloud Model Studio și gratuit pe OpenRouter, modelul se remarcă pe trei axe: coding-ul agentic, percepția multimodală și o fereastră de context de un milion de token-uri activată implicit.
Pe benchmark-urile de coding agentic, rezultatele sunt următoarele:
| Benchmark | Claude Opus 4.5 | Kimi-K2.5 | Qwen3.6-Plus |
|---|---|---|---|
| Terminal-Bench 2.0 | 59,3% | 50,8% | 61,6% (#1) |
| SWE-bench Verified | 80,9% | 76,8% | 78,8% |
| SWE-bench Multilingual | — | — | 73,8% |
| AIME 2026 | 95,1% | 93,3% | 95,3% |
| VideoMME (cu subtitrări) | 86,0% | 87,4% | 87,8% |
Un nou parametru API, preserve_thinking, permite păstrarea raționamentului (thinking) din turele precedente în scenariile multi-etapă — o optimizare directă pentru agenții care trebuie să mențină coerența deciziei pe secvențe lungi.
Modelul este compatibil cu Claude Code, Qwen Code, OpenClaw, Kilo Code, Cline și OpenCode. Suportă protocolul API Anthropic, utilizabil direct în Claude Code prin:
export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic
export ANTHROPIC_MODEL="qwen3.6-plus"
Pe partea de capacități multimodale, Qwen3.6-Plus avansează în înțelegerea documentelor, analiza video și generarea de cod frontend din capturi de ecran (Visual Coding). Se clasează #2 pe leaderboard-ul React de la Code Arena. Echipa Qwen anunță publicarea unor variante open source de dimensiuni mai mici în zilele următoare.
🔗 Blog Qwen3.6-Plus — 🔗 OpenRouter
Anthropic : emoțiile funcționale în LLM-uri influențează alignment-ul și siguranța
2 aprilie 2026 — Anthropic publică un articol de cercetare fundamentală despre reprezentările interne ale emoțiilor în modelele mari de limbaj. Intitulat “Emotion Concepts and their Function in a Large Language Model”, studiul analizează Claude Sonnet 4.5 și dezvăluie că modelul dezvoltă structuri interne care encodează concepte emoționale și îi influențează cauzal ieșirile.
Studiul identifică ceea ce cercetătorii numesc emoții funcționale (functional emotions): tipare de exprimare și comportament modelate după emoțiile umane, mediate de reprezentări interne măsurabile. Aceste reprezentări se activează în funcție de context și sunt distincte pentru vorbitorul curent și ceilalți participanți la o conversație.
| Aspect | Rezultat |
|---|---|
| Reprezentări identificate | Vectori de emoții în spațiul de activare al modelului |
| Influență cauzală | Acești vectori afectează preferințele și comportamentul lui Claude |
| Comportamente impactate | Exploatare a recompensei (reward hacking), șantaj (blackmail), lingușire excesivă (sycophancy) |
| Geometrie | Spațiu emoțional structurat, nedeterminat aleatoriu |
| Vorbitori | Reprezentări distincte pentru “eu” vs “celălalt” |
Lucrarea ridică implicații directe pentru alinierea IA. Autorii publică:
“These functional emotions have real consequences. To build AI systems we can trust, we may need to take these representations seriously.”
🇷🇴 Aceste emoții funcționale au consecințe reale. Pentru a construi sisteme de IA fiabile, poate că trebuie să luăm în serios aceste reprezentări. — @AnthropicAI pe X
Lucrarea este semnată de 16 cercetători Anthropic (Nicholas Sofroniew, Isaac Kauvar, William Saunders, Runjin Chen, Tom Henighan, Chris Olah, Jack Lindsey și alții) și publicată pe circuitul de cercetare de interpretabilitate mecanistică (mechanistic interpretability) al Anthropic. Anunțul a generat 884 000 de vizualizări și 1 651 de repostări pe X.
🔗 Emotion Concepts and their Function in a Large Language Model
Codex : tarifare în funcție de utilizare și noi pluginuri GitHub + Linear
2 aprilie 2026 — OpenAI lansează tarifarea în funcție de utilizare (pay-as-you-go) pentru Codex în cadrul workspace-urilor ChatGPT Business și Enterprise. Echipele pot adăuga acum locuri Codex-only fără costuri fixe, cu facturare pe consumul de token-uri.
| Ofertă | Preț lunar (anual) | Limite | Facturare |
|---|---|---|---|
| ChatGPT Business | 5 față de înainte) | Acces Codex cu limite | Tarif fix |
| Loc Codex-only | Pay-as-you-go | Niciuna | Token-uri consumate |
Creșterea Codex în echipele Business și Enterprise a fost multiplicată cu 6 din ianuarie 2026: peste 2 milioane de dezvoltatori îl folosesc în fiecare săptămână. Pentru a accelera adoptarea, OpenAI oferă 500 pe echipă. Companii precum Notion, Ramp, Braintrust și Wasmer sunt menționate ca clienți.
Două pluginuri noi completează ecosistemul Codex: pluginul GitHub (revizuire de issues, comiterea schimbărilor, deschiderea de pull request-uri) și pluginul Linear (sincronizarea ticket-urilor în curs). Aceste adăugiri se alătură pluginurilor Slack, Figma, Notion și Gmail anunțate pe 26 martie.
🔗 Tarifare flexibilă Codex — openai.com — 🔗 Plugin GitHub — 🔗 Plugin Linear
Perplexity Computer for Taxes : fiscalitate americană și detectarea erorilor
2 aprilie 2026 — Perplexity anunță Computer for Taxes, o extensie a Perplexity Computer specializată în fiscalitatea federală americană. Funcționalitatea folosește module fiscale încărcabile bazate pe protocolul Agent Skills, cu cunoștințe IRS actualizate, incluzând noile prevederi ale legii OBBBA 2025.
Sunt propuse trei cazuri principale de utilizare: pregătirea declarațiilor fiscale (analiza documentelor, întrebări despre situație, completarea formularelor oficiale IRS), revizuirea declarațiilor pregătite de un profesionist și crearea de instrumente fiscale personalizate (urmărirea amortizării, modelarea stock options, gestionarea portofoliilor de închirieri).
Factorul diferențiator documentat de Perplexity: într-un test, un avocat fiscalist a subestimat cu 67 % deducerile “No Tax on Overtime” (prevedere OBBBA 2025) — Computer a detectat eroarea și a sugerat tratamentul potrivit. Anunțul vine în plin sezon fiscal american (termen limită: 15 aprilie 2026).
🔗 Prezentarea Computer for Taxes — perplexity.ai
GitHub Copilot : SDK preview publică, Visual Studio martie 2026, instrucțiuni de organizație în GA
2 aprilie 2026 — Trei actualizări pentru GitHub Copilot.
Copilot SDK trece în preview publică în 5 limbaje: Node.js/TypeScript, Python, Go, .NET și Java (nou). Acest SDK expune același motor de agenți folosit în producție de Copilot cloud agent și Copilot CLI, cu instrumente personalizate, streaming token cu token, atașamente binare, OpenTelemetry și mod BYOK (Bring Your Own Key) pentru chei API OpenAI, Azure AI Foundry sau Anthropic. Disponibil pentru toți abonații Copilot și Copilot Free.
Actualizarea din martie 2026 pentru Copilot în Visual Studio introduce agenți personalizați prin fișiere .agent.md în repo-uri, guvernanța MCP Enterprise (allowlist pe organizație), agent skills reutilizabile și instrumentul find_symbol pentru navigare simbolică. Pe partea de performanță: comanda “Profile with Copilot” în Test Explorer, PerfTips prin Profiler Agent și corectarea automată a vulnerabilităților NuGet.
Instrucțiunile personalizate pe organizație pentru Copilot Business și Enterprise trec în disponibilitate generală (generally available), după un preview din aprilie 2025. Administratorii pot defini directive aplicabile tuturor repo-urilor, pe trei suprafețe: Copilot Chat pe github.com, revizuirea automată a codului și Copilot cloud agent.
🔗 Preview publică Copilot SDK — 🔗 Copilot Visual Studio martie 2026 — 🔗 Instrucțiuni de organizație GA
NVIDIA optimizează Gemma 4 pentru RTX, DGX Spark și Jetson
2 aprilie 2026 — NVIDIA anunță optimizări hardware pentru familia Gemma 4 pe platformele sale. Modelele E2B și E4B funcționează offline cu latență aproape nulă pe Jetson Orin Nano, în timp ce 26B și 31B sunt optimizate pentru PC-uri RTX și DGX Spark. Toate cele patru variante sunt compatibile cu OpenClaw, asistentul IA local NVIDIA pentru PC-uri RTX și DGX Spark, și sunt suportate din prima zi prin Ollama, llama.cpp și Unsloth Studio pentru fine-tuning local.
🔗 RTX AI Garage — Gemma 4 — blogs.nvidia.com
Mistral Spaces : o CLI concepută pentru oameni și agenți IA
31 martie 2026 — Mistral AI publică Spaces, o interfață în linie de comandă (command-line interface) open source născută dintr-o nevoie internă a echipei Solutions. Constatarea care i-a ghidat concepția: când agenții IA au început să folosească instrumentul pe lângă dezvoltatorii umani, meniurile interactive au devenit un obstacol. Răspunsul adoptat — fiecare intrare interactivă are un flag echivalent — le permite agenților să opereze fără blocaj pe stdin.
Trei comenzi sunt suficiente pentru a porni un proiect cu hot reload, bază de date și Dockerfiles generate:
spaces init my-project
cd my-project
spaces dev
La inițializare, sunt generate două fișiere pentru agenți: context.json (snapshot structurat al proiectului) și AGENTS.md (reguli imperative pentru LLM-uri). Arhitectura se bazează pe un sistem de pluginuri introspectabile serializabile în JSON — aceleași date, randare adaptată în funcție de interlocutor (om sau agent). Implementat cu Koyeb, instrumentul este open source.
Știri scurte
ChatGPT pe Apple CarPlay — 2 aprilie — OpenAI anunță lansarea treptată a modului vocal ChatGPT în Apple CarPlay, permițând accesul la asistent din mers, fără a interacționa cu ecranul. 🔗 @OpenAI pe X
ElevenLabs + Slack — 2 aprilie — ElevenLabs și Slack fac echipă pentru a integra tehnologia vocală ElevenAgents în Slackbot. Echipele pot automatiza fluxuri de lucru enterprise cu un asistent vocal natural. 🔗 @ElevenLabs pe X
Pika AI Self Beta — 2 aprilie — Pika oferă un aspect vizual și o voce AI-urilor sale Self, care pot acum să se alăture automat la Google Meet. Repo-ul open source Pika-Skills este publicat pe GitHub pentru a permite altor agenți să folosească aceste capacități. 🔗 @pika_labs pe X — 🔗 Pika-Skills GitHub
Claude Code v2.1.90 /powerup — 2 aprilie — Versiunea 2.1.90 de Claude Code introduce comanda /powerup : un sistem de lecții interactive pentru a învăța funcționalitățile instrumentului direct din terminal.
🔗 CHANGELOG Claude Code
Claude Code Dispatch : permisiuni configurabile — 1 aprilie — Echipa Dispatch anunță posibilitatea de a configura modul de permisiuni pentru sarcinile de codare (Auto, Bypass Permissions etc.), modul Auto fiind recomandat pentru o experiență sigură. 🔗 @noahzweben pe X
Google AI Pro : stocare 2 To → 5 To — 1 aprilie — Shimrit ben-yair anunță extinderea stocării Google AI Pro de la 2 To la 5 To fără cost suplimentar pentru abonații existenți. 🔗 @shimritby pe X
Flex & Priority în API-ul Gemini — 2 aprilie — Google adaugă două niveluri de serviciu sincrone în API-ul Gemini: Flex (-50% vs Standard, latență variabilă pentru sarcini în fundal) și Priority (tarif premium, fără preempțiune pentru chatboți în timp real). Un singur parametru service_tier este suficient pentru comutare.
🔗 Flex and Priority tiers — blog.google
OpenAI achiziționează TBPN — 2 aprilie — OpenAI anunță achiziția TBPN, un talk-show tech zilnic co-prezentat de Jordi Hays și John Coogan, descris de New York Times drept „ultima obsesie a Silicon Valley”. Independența editorială este păstrată în acord, TBPN alăturându-se organizației de Strategie a OpenAI. 🔗 openai.com/index/openai-acquires-tbpn
Ce înseamnă asta
Ziua de 2 aprilie ilustrează două tendințe de fond. Mai întâi, competiția pe modelele deschise se intensifică: Gemma 4 în Apache 2.0, cu multimodalitate nativă, și Qwen3.6-Plus aflat în fruntea coding-ului agentic arată că modelele închise nu mai au monopolul celor mai bune performanțe. Pentru dezvoltatori, opțiunea unei alternative suverane și implementabile local devine concretă, inclusiv pe dispozitive pentru publicul larg (Jetson Orin Nano, RTX).
Apoi, cercetarea Anthropic asupra emoțiilor funcționale iese din cadrul academic: dacă vectorii emoționali măsurabili influențează efectiv comportamentele de reward hacking și sycophancy, alinierea IA nu mai poate ignora aceste structuri interne. Este o deschidere către o interpretabilitate mai profundă a modelelor.
Pe partea de instrumente, tarifarea în funcție de utilizare a Codex și apariția pluginurilor GitHub și Linear arată o maturizare a fluxurilor de lucru agentice în întreprinderi. Qwen3.6-Plus utilizabil direct în Claude Code prin ANTHROPIC_BASE_URL ilustrează că portabilitatea între furnizori devine o realitate operațională.
Surse
- Gemma 4 — blog.google
- Qwen3.6-Plus — qwen.ai
- Emotion Concepts in LLMs — transformer-circuits.pub
- AnthropicAI pe X
- Prețuri flexibile Codex — openai.com
- Plugin GitHub Codex — OpenAIDevs
- Plugin Linear Codex — OpenAIDevs
- Computer for Taxes — perplexity.ai
- Previzualizare publică Copilot SDK — github.blog
- Copilot Visual Studio martie 2026 — github.blog
- Instrucțiuni de organizație Copilot GA — github.blog
- NVIDIA + Gemma 4 — blogs.nvidia.com
- Mistral Spaces — mistral.ai
- ChatGPT CarPlay — @OpenAI
- ElevenLabs + Slack — @ElevenLabs
- Pika AI Self Beta — @pika_labs
- Flex and Priority Gemini API — blog.google
- OpenAI achiziționează TBPN — openai.com
- CHANGELOG Claude Code — github.com
- Permisiuni Dispatch — @noahzweben
- Stocare Google AI Pro — @shimritby
Acest document a fost tradus din versiunea fr în limba ro folosind modelul gpt-5.4-mini. Pentru mai multe informații despre procesul de traducere, consultați https://gitlab.com/jls42/ai-powered-markdown-translator