Zoeken

AI Nieuws 23 jan 2026: Claude in Excel, Tasks Claude Code, Codex Agent Loop

AI Nieuws 23 jan 2026: Claude in Excel, Tasks Claude Code, Codex Agent Loop

Drukke week voor AI-agenten

Van 21 tot 23 januari 2026, diverse grote aankondigingen op het gebied van coding agents en infrastructuur. Anthropic lanceert Claude in Excel en publiceert drie artikelen over multi-agent systemen, OpenAI detailleert de interne architectuur van Codex en zijn PostgreSQL-infrastructuur, Qwen maakt zijn text-to-speech model open-source, en Runway voegt Image to Video toe aan Gen-4.5.


Anthropic: Claude in Excel en Claude Code

Claude in Excel

23 januari — Claude is nu beschikbaar in Microsoft Excel in bèta. De integratie maakt het mogelijk om complete Excel-werkmappen te analyseren met hun geneste formules en afhankelijkheden tussen tabbladen.

Functionaliteiten:

  • Begrip van de volledige werkmap (formules, multi-tab afhankelijkheden)
  • Uitleg met citaten op celniveau
  • Bijwerken van aannames met behoud van formules

Beschikbaar voor abonnees van Claude Pro, Max, Team en Enterprise.

🔗 Claude in Excel


Claude Code v2.1.19: Tasks systeem

23 januari — Versie 2.1.19 introduceert Tasks, een nieuw taakbeheersysteem voor complexe multi-sessie projecten.

We’re turning Todos into Tasks in Claude Code. Tasks are a new primitive that help Claude Code track and complete more complicated projects and collaborate on them across multiple sessions or subagents.

🇳🇱 We veranderen Todos in Tasks in Claude Code. Tasks zijn een nieuwe primitieve die Claude Code helpen complexere projecten te volgen en te voltooien en eraan samen te werken over meerdere sessies of subagenten heen.Thariq (@trq212), Claude Code team Anthropic

Tasks functionaliteiten:

AspectDetail
Opslag~/.claude/tasks (bestanden, maakt het mogelijk tools erop te bouwen)
SamenwerkingCLAUDE_CODE_TASK_LIST_ID=naam claude om te delen tussen sessies
AfhankelijkhedenTasks met afhankelijkheden en blokkades opgeslagen in metadata
BroadcastUpdate van een Task uitgezonden naar alle sessies op dezelfde Task List
CompatibiliteitWerkt met claude -p en AgentSDK

Waar het voor dient: Bij een complex project (multi-file refactoring, migratie, lange feature), kan Claude het werk opsplitsen in tasks, bijhouden wat gedaan is en wat resteert. De tasks worden opgeslagen op schijf — ze overleven context compaction, sessie afsluiten en herstarten. Meerdere sessies of subagenten kunnen in real-time samenwerken aan dezelfde takenlijst.

In de praktijk: Claude maakt tasks (TaskCreate), lijst ze op (TaskList), en update hun status (TaskUpdate: pending → in_progress → completed). Voorbeeld bij een authenticatie refactoring:

#1 [completed] Sessieopslag migreren naar Redis
#2 [in_progress] Refresh token rotatie implementeren
#3 [pending] OAuth integratietests toevoegen
#4 [pending] API-documentatie bijwerken

De tasks worden opgeslagen in ~/.claude/tasks/ en kunnen gedeeld worden tussen sessies via CLAUDE_CODE_TASK_LIST_ID.

Andere nieuwigheden v2.1.19:

  • Afkorting $0, $1 voor argumenten in custom commands
  • VSCode session forking en terugspoelen voor iedereen
  • Skills zonder permissies worden uitgevoerd zonder goedkeuring
  • CLAUDE_CODE_ENABLE_TASKS=false om tijdelijk uit te schakelen

🔗 CHANGELOG Claude Code | Thread @trq212


Claude Code v2.1.18: aanpasbare sneltoetsen

Vorige versie die de mogelijkheid toevoegt om sneltoetsen per context te configureren en chord sequenties te maken.

Commando: /keybindings

⚠️ Let op: Deze functie is momenteel in preview en is niet beschikbaar voor alle gebruikers.

🔗 Keybindings Documentatie


Petri 2.0: geautomatiseerde alignment audits

22 januari — Anthropic publiceert Petri 2.0, een update van zijn geautomatiseerde gedragsauditingtool voor taalmodellen.

Waar het voor dient: Petri test of een LLM zich problematisch zou kunnen gedragen — manipulatie, misleiding, omzeiling van regels. De tool genereert realistische scenario’s en observeert de reacties van het model om ongewenst gedrag te detecteren voordat het zich voordoet in productie.

VerbeteringBeschrijving
70 nieuwe scenario’sUitgebreide seed-bibliotheek om meer randgevallen te dekken
Eval-awareness mitigatiesHet model mag niet weten dat het getest wordt — anders past het zijn gedrag aan. Petri 2.0 verbetert het realisme van de scenario’s om deze detectie te vermijden.
Frontier vergelijkingenEvaluatieresultaten voor recente modellen (Claude, GPT, Gemini)

🔗 Petri 2.0 | GitHub


Blog: wanneer multi-agent systemen te gebruiken (of niet)

23 januari — Anthropic publiceert een pragmatische gids over multi-agent architecturen. De belangrijkste boodschap: gebruik geen multi-agent als standaard.

We’ve seen teams invest months building elaborate multi-agent architectures only to discover that improved prompting on a single agent achieved equivalent results.

🇳🇱 We hebben teams maanden zien investeren in het bouwen van uitgebreide multi-agent architecturen, alleen om te ontdekken dat verbeterde prompting op een enkele agent gelijkwaardige resultaten behaalde.

Het artikel identificeert 3 gevallen waarin multi-agent echt waarde toevoegt:

GevalProbleemMulti-agent Oplossing
ContextvervuilingEen agent genereert omvangrijke data waarvan alleen een samenvatting nuttig is achterafEen sub-agent haalt 2000 tokens aan geschiedenis op, stuurt alleen “bestelling geleverd” terug naar de hoofdagent
ParallellisatieMeerdere onafhankelijke zoekopdrachten te doenStart 5 agenten parallel op 5 verschillende bronnen in plaats van ze sequentieel te verwerken
SpecialisatieTe veel tools (20+) in een enkele agent degraderen zijn vermogen om de juiste te kiezenOpsplitsen in gespecialiseerde agenten: een voor CRM, een voor marketing, een voor berichtenverkeer

De valkuil om te vermijden: Verdelen per type werk (één agent plant, een andere implementeert, een andere test). Elke overdracht verliest context en degradeert de kwaliteit. Het is beter dat een enkele agent een feature van begin tot eind afhandelt.

Reële kosten: 3-10x meer tokens dan een enkele agent voor dezelfde taak.

Andere artikelen in de serie:

Building agents with Skills (22 jan)

In plaats van agenten te bouwen die gespecialiseerd zijn per domein, stelt Anthropic voor om skills te bouwen: verzamelingen van bestanden (workflows, scripts, best practices) die een generalistische agent op aanvraag laadt.

Progressieve openbaarmaking in 3 niveaus:

NiveauInhoudGrootte
1Metadata (naam, beschrijving)~50 tokens
2Volledig SKILL.md bestand~500 tokens
3Referentiedocumentatie2000+ tokens

Elk niveau wordt alleen geladen indien nodig. Resultaat: een agent kan honderden skills hebben zonder zijn context te verzadigen.

🔗 Building agents with Skills


Anthropic identificeert 8 trends voor softwareontwikkeling in 2026.

Kernboodschap: Ingenieurs gaan van het schrijven van code naar het coördineren van agenten die code schrijven.

Belangrijke nuance: AI wordt gebruikt in ~60% van het werk, maar slechts 0-20% kan volledig gedelegeerd worden — menselijk toezicht blijft essentieel.

BedrijfResultaat
RakutenClaude Code op vLLM codebase (12.5M regels), 7u autonoom werk
TELUS30% sneller, 500k uren bespaard
Zapier89% AI-adoptie, 800+ interne agenten

🔗 Eight trends 2026


OpenAI: Codex architectuur en infrastructuur

Unrolling the Codex agent loop

23 januari — OpenAI opent de coulissen van Codex CLI. Eerste artikel van een reeks over de interne werking van hun software-agent.

Wat we leren:

De agent loop is in theorie eenvoudig: gebruiker stuurt een verzoek → model genereert een antwoord of vraagt om een tool → agent voert de tool uit → model hervat met het resultaat → tot een definitief antwoord. In de praktijk zitten de subtiliteiten in het contextbeheer.

Prompt caching — de sleutel tot prestaties:

Elke gespreksbeurt voegt inhoud toe aan de prompt. Zonder optimalisatie is dit kwadratisch in verzonden tokens. Prompt caching maakt het mogelijk berekeningen van vorige beurten te hergebruiken. Voorwaarde: de nieuwe prompt moet een exact voorvoegsel zijn van de oude. OpenAI detailleert de valkuilen die de cache breken (volgorde van MCP-tools wijzigen, configuratie wijzigen midden in gesprek).

Automatische compactie:

Wanneer de context een drempel overschrijdt, roept Codex /responses/compact aan wat een gecomprimeerde versie van het gesprek retourneert. Het model behoudt een latent begrip via een ondoorzichtige encrypted_content.

Zero Data Retention (ZDR):

Voor klanten die niet willen dat hun gegevens worden opgeslagen, maakt encrypted_content het mogelijk de redenering van het model tussen beurten te behouden zonder gegevens aan de serverzijde op te slaan.

Eerste artikel van een reeks — de volgende zullen CLI-architectuur, tool-implementatie en sandboxing behandelen.

🔗 Unrolling the Codex agent loop | Codex GitHub


Scaling PostgreSQL: 800 miljoen ChatGPT-gebruikers

22 januari — OpenAI detailleert hoe PostgreSQL ChatGPT en de API aandrijft voor 800 miljoen gebruikers met miljoenen verzoeken per seconde.

MetriekWaarde
Gebruikers800 miljoen
DoorvoerMiljoenen QPS
Replica’s~50 multi-regio read replica’s
p99 LatencyDubbele cijfers ms klantzijde
BeschikbaarheidFive-nines (99.999%)

Architectuur:

  • Single primary Azure PostgreSQL flexible server
  • PgBouncer voor connection pooling (verbindingslatency: 50ms → 5ms)
  • Schrijfintensieve workloads gemigreerd naar Azure Cosmos DB
  • Cache locking om te beschermen tegen cache miss stormen
  • Cascading replication in test om 100 replica’s te overschrijden

Enige SEV-0 PostgreSQL in de laatste 12 maanden: tijdens de virale lancering van ChatGPT ImageGen (100M nieuwe gebruikers in één week, schrijfverkeer x10).

🔗 Scaling PostgreSQL


Qwen: Qwen3-TTS open-source

22-23 januari — Alibaba brengt Qwen3-TTS uit als open-source onder Apache 2.0 licentie.

KenmerkDetail
LicentieApache 2.0
Voice cloningJa
MLX-Audio ondersteuningBeschikbaar

Installatie:

uv pip install -U mlx-audio --prerelease=allow

🔗 Qwen3-TTS op X


Runway: Gen-4.5 Image to Video

21 januari — Runway voegt Image to Video functionaliteit toe aan Gen-4.5.

FunctionaliteitBeschrijving
Image to VideoTransformatie van een afbeelding naar filmische video
Camera controlPrecieze camerabediening
Coherent narrativesCoherente verhalen in de tijd
Character consistencyPersonages die consistent blijven

Beschikbaar voor alle betaalde Runway plannen. Tijdelijke promo: 15% korting.

🔗 Runway op X


Wat dit betekent

Deze week markeert een rijping van coding agents tools. De twee giganten (Anthropic en OpenAI) publiceren gedetailleerde technische documentatie over de architectuur van hun agenten — een teken dat de markt overgaat van de “demo”-fase naar de “productie”-fase.

Aan de infrastructuurkant toont het PostgreSQL-artikel van OpenAI dat een single-primary architectuur stand kan houden op de schaal van honderden miljoenen gebruikers met de juiste optimalisaties.

De komst van Claude in Excel opent een nieuw front: AI direct geïntegreerd in dagelijkse productiviteitstools.


Bronnen