Căutare

Știri AI 23 Ian 2026: Claude în Excel, Tasks Claude Code, Codex Agent Loop

Știri AI 23 Ian 2026: Claude în Excel, Tasks Claude Code, Codex Agent Loop

Săptămână încărcată pentru agenții AI

Din 21 până în 23 ianuarie 2026, mai multe anunțuri majore privind coding agents și infrastructura. Anthropic lansează Claude în Excel și publică trei articole despre sistemele multi-agent, OpenAI detaliază arhitectura internă a Codex și infrastructura sa PostgreSQL, Qwen lansează modelul său text-to-speech ca open-source, iar Runway adaugă Image to Video la Gen-4.5.


Anthropic: Claude în Excel și Claude Code

Claude în Excel

23 ianuarie — Claude este acum disponibil în Microsoft Excel în beta. Integrarea permite analizarea registrelor de lucru Excel complete, cu formulele lor imbricate și dependențele dintre file.

Funcționalități:

  • Înțelegerea întregului registru de lucru (formule, dependențe multi-filă)
  • Explicații cu citate la nivel de celulă
  • Actualizarea ipotezelor păstrând formulele

Disponibil pentru abonații Claude Pro, Max, Team și Enterprise.

🔗 Claude în Excel


Claude Code v2.1.19: sistemul Tasks

23 ianuarie — Versiunea 2.1.19 introduce Tasks, un nou sistem de gestionare a sarcinilor pentru proiecte complexe multi-sesiune.

We’re turning Todos into Tasks in Claude Code. Tasks are a new primitive that help Claude Code track and complete more complicated projects and collaborate on them across multiple sessions or subagents.

🇷🇴 Transformăm Todos în Tasks în Claude Code. Tasks sunt o nouă primitivă care ajută Claude Code să urmărească și să finalizeze proiecte mai complicate și să colaboreze la acestea prin mai multe sesiuni sau sub-agenți.Thariq (@trq212), echipa Claude Code Anthropic

Funcționalități Tasks:

AspectDetaliu
Stocare~/.claude/tasks (fișiere, permite construirea de instrumente deasupra)
ColaborareCLAUDE_CODE_TASK_LIST_ID=nume claude pentru a partaja între sesiuni
DependențeTasks cu dependențe și blocaje stocate în metadate
BroadcastActualizarea unui Task difuzată către toate sesiunile de pe aceeași Task List
CompatibilitateFuncționează cu claude -p și AgentSDK

La ce servește: Pe un proiect complex (refactorizare multi-fișier, migrare, funcționalitate lungă), Claude poate împărți munca în tasks, urmări ce este făcut și ce rămâne. Sarcinile sunt persistente pe disc — supraviețuiesc compactării contextului, închiderii sesiunii și repornirii. Mai multe sesiuni sau sub-agenți pot colabora la aceeași listă de sarcini în timp real.

În practică: Claude creează tasks (TaskCreate), le listează (TaskList) și actualizează starea lor (TaskUpdate: pending → in_progress → completed). Exemplu la o refactorizare de autentificare:

#1 [completed] Migrare stocare sesiune către Redis
#2 [in_progress] Implementare rotire refresh token
#3 [pending] Adăugare teste de integrare OAuth
#4 [pending] Actualizare documentație API

Sarcinile sunt stocate în ~/.claude/tasks/ și pot fi partajate între sesiuni via CLAUDE_CODE_TASK_LIST_ID.

Alte noutăți v2.1.19:

  • Prescurtare $0, $1 pentru argumente în comenzi personalizate
  • VSCode session forking și derulare înapoi pentru toți
  • Skills fără permisiuni se execută fără aprobare
  • CLAUDE_CODE_ENABLE_TASKS=false pentru a dezactiva temporar

🔗 CHANGELOG Claude Code | Thread @trq212


Claude Code v2.1.18: scurtături de tastatură personalizabile

Versiune anterioară care adaugă posibilitatea de a configura scurtături de tastatură per context și de a crea secvențe chord.

Comandă: /keybindings

⚠️ Notă: Această funcționalitate este momentan în preview și nu este disponibilă pentru toți utilizatorii.

🔗 Documentație Keybindings


Petri 2.0: audituri de aliniere automatizate

22 ianuarie — Anthropic publică Petri 2.0, o actualizare a instrumentului său de audit comportamental automatizat pentru modele lingvistice.

La ce servește: Petri testează dacă un LLM s-ar putea comporta problematic — manipulare, înșelăciune, eludarea regulilor. Instrumentul generează scenarii realiste și observă răspunsurile modelului pentru a detecta comportamente nedorite înainte ca acestea să apară în producție.

ÎmbunătățireDescriere
70 scenarii noiBibliotecă de seeds extinsă pentru a acoperi mai multe cazuri limită
Mitigări eval-awarenessModelul nu trebuie să știe că este testat — altfel își adaptează comportamentul. Petri 2.0 îmbunătățește realismul scenariilor pentru a evita această detecție.
Comparații frontierRezultate de evaluare pentru modele recente (Claude, GPT, Gemini)

🔗 Petri 2.0 | GitHub


Blog: când să folosești (sau nu) sisteme multi-agent

23 ianuarie — Anthropic publică un ghid pragmatic despre arhitecturile multi-agent. Mesajul principal: nu folosiți multi-agent în mod implicit.

We’ve seen teams invest months building elaborate multi-agent architectures only to discover that improved prompting on a single agent achieved equivalent results.

🇷🇴 Am văzut echipe investind luni de zile construind arhitecturi multi-agent elaborate doar pentru a descoperi că un prompting îmbunătățit pe un singur agent a obținut rezultate echivalente.

Articolul identifică 3 cazuri în care multi-agent aduce cu adevărat valoare:

CazProblemăSoluție multi-agent
Poluarea contextuluiUn agent generează date voluminoase din care doar un rezumat este util ulteriorUn sub-agent recuperează 2000 token-uri de istoric, returnează doar “comandă livrată” agentului principal
ParalelizareMai multe căutări independente de făcutLansați 5 agenți în paralel pe 5 surse diferite în loc să le procesați secvențial
SpecializarePrea multe instrumente (20+) într-un singur agent degradează capacitatea sa de a-l alege pe cel corectSeparare în agenți specializați: unul pentru CRM, unul pentru marketing, unul pentru mesagerie

Capcana de evitat: Divizarea după tipul de muncă (un agent planifică, altul implementează, altul testează). Fiecare predare pierde context și degradează calitatea. Este mai bine ca un singur agent să gestioneze o funcționalitate de la capăt la coadă.

Cost real: 3-10x mai multe token-uri decât un singur agent pentru aceeași sarcină.

Alte articole din serie:

Building agents with Skills (22 ian)

În loc să construiască agenți specializați pe domeniu, Anthropic propune construirea de skills: colecții de fișiere (fluxuri de lucru, scripturi, bune practici) pe care un agent generalist le încarcă la cerere.

Dezvăluire progresivă în 3 niveluri:

NivelConținutDimensiune
1Metadate (nume, descriere)~50 token-uri
2Fișier SKILL.md complet~500 token-uri
3Documentație de referință2000+ token-uri

Fiecare nivel este încărcat doar dacă este necesar. Rezultat: un agent poate avea sute de skills fără a-și satura contextul.

🔗 Building agents with Skills


Anthropic identifică 8 tendințe pentru dezvoltarea software în 2026.

Mesaj cheie: Inginerii trec de la scrierea codului la coordonarea agenților care scriu cod.

Nuuanță importantă: AI este folosită în ~60% din muncă, dar doar 0-20% poate fi complet delegată — supravegherea umană rămâne esențială.

CompanieRezultat
RakutenClaude Code pe bază de cod vLLM (12.5M linii), 7h de muncă autonomă
TELUS30% mai rapid, 500k ore economisite
Zapier89% adopție AI, 800+ agenți interni

🔗 Eight trends 2026


OpenAI: arhitectura Codex și infrastructura

Unrolling the Codex agent loop

23 ianuarie — OpenAI deschide culisele Codex CLI. Primul articol dintr-o serie despre funcționarea internă a agentului lor software.

Ce învățăm:

Bucla agentului este simplă în teorie: utilizatorul trimite o cerere → modelul generează un răspuns sau solicită un instrument → agentul execută instrumentul → modelul reia cu rezultatul → până la un răspuns final. În practică, subtilitățile sunt în gestionarea contextului.

Prompt caching — cheia performanței:

Fiecare tur de conversație adaugă conținut la prompt. Fără optimizare, este pătratic în token-uri trimise. Prompt caching permite reutilizarea calculelor din tururile anterioare. Condiție: noul prompt trebuie să fie un prefix exact al celui vechi. OpenAI detaliază capcanele care strică cache-ul (schimbarea ordinii instrumentelor MCP, modificarea configurației la mijlocul conversației).

Compactare automată:

Când contextul depășește un prag, Codex apelează /responses/compact care returnează o versiune comprimată a conversației. Modelul păstrează o înțelegere latentă via un encrypted_content opac.

Zero Data Retention (ZDR):

Pentru clienții care nu doresc ca datele lor să fie stocate, encrypted_content permite păstrarea raționamentului modelului între tururi fără a stoca date pe partea serverului.

Primul articol dintr-o serie — următoarele vor acoperi arhitectura CLI, implementarea instrumentelor și sandboxing-ul.

🔗 Unrolling the Codex agent loop | Codex GitHub


Scaling PostgreSQL: 800 milioane de utilizatori ChatGPT

22 ianuarie — OpenAI detaliază modul în care PostgreSQL alimentează ChatGPT și API-ul pentru 800 de milioane de utilizatori cu milioane de cereri pe secundă.

MetricăValoare
Utilizatori800 milioane
ThroughputMilioane de QPS
Replici~50 read replicas multi-regiune
p99 LatencyCifre duble ms partea client
DisponibilitateFive-nines (99.999%)

Arhitectură:

  • Single primary Azure PostgreSQL flexible server
  • PgBouncer pentru connection pooling (latență conexiune: 50ms → 5ms)
  • Sarcini de lucru write-heavy migrate către Azure Cosmos DB
  • Cache locking pentru a proteja împotriva furtunilor de cache miss
  • Replicare în cascadă în testare pentru a depăși 100 de replici

Singurul SEV-0 PostgreSQL în ultimele 12 luni: în timpul lansării virale a ChatGPT ImageGen (100M utilizatori noi într-o săptămână, trafic scriere x10).

🔗 Scaling PostgreSQL


Qwen: Qwen3-TTS open-source

22-23 ianuarie — Alibaba lansează Qwen3-TTS în open-source sub licență Apache 2.0.

CaracteristicăDetaliu
LicențăApache 2.0
Voice cloningDa
Suport MLX-AudioDisponibil

Instalare:

uv pip install -U mlx-audio --prerelease=allow

🔗 Qwen3-TTS pe X


Runway: Gen-4.5 Image to Video

21 ianuarie — Runway adaugă funcționalitatea Image to Video la Gen-4.5.

FuncționalitateDescriere
Image to VideoTransformarea unei imagini în video cinematic
Camera controlControl precis al camerei
Coherent narrativesNarațiuni coerente în timp
Character consistencyPersonaje care rămân consistente

Disponibil pentru toate planurile plătite Runway. Promoție temporară: 15% reducere.

🔗 Runway pe X


Ce înseamnă asta

Această săptămână marchează o maturizare a instrumentelor coding agents. Cei doi giganți (Anthropic și OpenAI) publică documentații tehnice detaliate despre arhitectura agenților lor — semn că piața trece de la faza “demo” la faza “producție”.

Pe partea de infrastructură, articolul PostgreSQL de la OpenAI arată că o arhitectură single-primary poate rezista la scara a sute de milioane de utilizatori cu optimizările potrivite.

Sosirea lui Claude în Excel deschide un nou front: AI integrată direct în instrumentele de productivitate zilnice.


Surse