Zoeken

OpenAI lance GPT-5.5, Anthropic opent het geheugen voor Managed Agents, Kimi K2.6 Agent Swarm

OpenAI lance GPT-5.5, Anthropic opent het geheugen voor Managed Agents, Kimi K2.6 Agent Swarm

Op 23 april 2026 was het een drukke dag: OpenAI lanceert GPT-5.5 met 85% op ARC-AGI-2 en een API-tarief van $5/M tokens voor input, terwijl Anthropic persistente geheugen in bèta opent voor zijn Managed Agents en een post-mortem over Claude Code publiceert. Tegelijkertijd levert GitHub Copilot zeven updates in drie dagen, zet Kimi K2.6 een zwerm (swarm) van 300 subagents uit, en bekrachtigt SpaceX een codeerpartnerschap met Cursor.


GPT-5.5 : het frontier-model van OpenAI

23 april — OpenAI lanceert GPT-5.5, zijn krachtigste model tot nu toe, ontworpen voor echt werk en agents. Het verbetert agentisch coderen aanzienlijk, computergebruik (computer use), kenniswerk en wetenschappelijk onderzoek, terwijl het de latentie van GPT-5.4 behoudt.

Beschikbaarheid en tarieven

GPT-5.5 is onmiddellijk beschikbaar voor abonnees van ChatGPT Plus, Pro, Business en Enterprise, evenals in Codex. API-toegang komt “zeer binnenkort”.

AanbodAPI-toegangInputOutput
GPT-5.5 standaardBinnenkort$5 / M tokens$30 / M tokens
GPT-5.5 ProBinnenkort$30 / M tokens$180 / M tokens

Het contextvenster in Codex bereikt 400K tokens. Een Fast-modus — 1,5× sneller, 2,5× de kostprijs — is beschikbaar.

Benchmarks

EvaluatieGPT-5.5GPT-5.4Claude Opus 4.7Gemini 3.1 Pro
Terminal-Bench 2.082.7%75.1%69.4%68.5%
Expert-SWE (intern)73.1%68.5%
SWE-Bench Pro58.6%57.7%64.3%54.2%
GDPval84.9%83.0%80.3%67.3%
OSWorld-Verified78.7%75.0%78.0%
ARC-AGI-285.0%73.3%75.8%77.1%
FrontierMath Tier 435.4%27.1%22.9%16.7%
CyberGym81.8%79.0%73.1%
BixBench (bio-informatica)80.5%74.0%

GPT-5.5 staat aan de leiding op de meeste benchmarks, met één opmerkelijke uitzondering: SWE-Bench Pro waar Claude Opus 4.7 de voorsprong behoudt (64.3% versus 58.6%).

Infrastructuur en beveiliging

Het model is mede ontworpen met NVIDIA GB200/GB300 NVL72. Codex gebruikte GPT-5.5 om zijn eigen infrastructuur te optimaliseren en won daarmee +20% aan tokens-generatiesnelheid. Op het gebied van cybersecurity wordt GPT-5.5 geclassificeerd als High in OpenAI’s Preparedness Framework (niet Critical); het Trusted Access Cyber-programma wordt daarop uitgebreid.

Wetenschappelijk onderzoek

Naast code heeft GPT-5.5 geholpen bij het bewijzen van een nieuwe stelling over Ramseytallen (combinatoriek), formeel geverifieerd in Lean. Het analyseerde ook een genomische dataset van 62 monsters en 28.000 genen in enkele minuten — een taak die maanden zou hebben gekost aan een onderzoeksteam.

« GPT-5.5 is noticeably smarter and more persistent than GPT-5.4, with stronger coding performance and more reliable tool use. »

🇳🇱 GPT-5.5 is duidelijk intelligenter en volhardender dan GPT-5.4, met betere prestaties in coderen en betrouwbaarder gebruik van tools. — Michael Truell, medeoprichter en CEO van Cursor

🔗 Aankondiging GPT-5.5


De golf van persistente agents

Drie grote aankondigingen komen op deze 23 april samen rond de persistente agent, die autonoom kan handelen over lange perioden en de context van de ene sessie naar de andere kan onthouden.

OpenAI Workspace Agents in ChatGPT

22 april — OpenAI presenteert de werkruimte-agents (Workspace Agents): gedeelde agents die een team één keer aanmaakt, samen gebruikt in ChatGPT of Slack, en geleidelijk verbetert. Aangedreven door Codex in de cloud kunnen ze complexe taken uitvoeren, zelfs wanneer de gebruiker offline is. De Workspace Agents vervangen geleidelijk de GPT’s, die tijdens de overgang beschikbaar blijven.

Type agentFunctionaliteit
SoftwareverificateurBekijkt verzoeken, vergelijkt beleid, maakt IT-tickets aan
Productfeedback-routerMonitort Slack/support/forums → geprioriteerde tickets
RapportgeneratorHaalt vrijdag gegevens op, maakt grafieken, samenvatting
Prospectie-agentZoekt leads, beoordeelt, schrijft e-mails, werkt CRM bij
Verantwoordelijke voor derdepartijrisico’sBeoordeelt leveranciers, produceert gestructureerd rapport

Beschikbaar in research preview voor Business, Enterprise, Edu en Teachers; gratis tot 6 mei 2026, daarna facturering in credits.

Volgens Ankur Bhatt (AI Engineering, Rippling) wordt werk dat voorheen 5 tot 6 uur per week van verkopers vergde, nu automatisch op de achtergrond uitgevoerd voor elke kans.

🔗 Workspace Agents


Anthropic — Geheugen voor de Claude Managed Agents

23 april — Geheugen voor de Claude Managed Agents is beschikbaar in publieke bèta op het Claude Platform. Agents kunnen nu leren van de ene sessie naar de andere dankzij een geheugenslaag die rechtstreeks op een bestandssysteem is gebouwd: de agents gebruiken dezelfde bash- en code-executiecapaciteiten die ze al inzetten voor agentische taken.

FunctionaliteitDetail
Deelbare storesMeerdere agents, verschillende toegangsrechten (alleen-lezen / lezen-schrijven)
Gelijktijdige toegangZonder overschrijven tussen parallelle sessies
AuditlogWelke sessie, welke agent, welk geheugen
TerugdraaienNaar elke eerdere versie
ExporteerbaarheidGeheugens beheerbaar via de API

De resultaten bij klanten illustreren de concrete impact:

KlantResultaat
Rakuten-97% fouten bij eerste poging, -27% kosten, -34% latentie
Wisedocs+30% snelheid van documentverificatie
NetflixContextcontinuïteit tussen sessies zonder handmatige update
AndoPlatformgeheugen zonder toegewijde infrastructuur

Memory in Claude Managed Agents lets us put continuous learning into production at scale. Our agents distill lessons from every session, delivering 97% fewer first-pass errors at 27% lower cost and 34% lower latency.

🇳🇱 Geheugen in de Managed Agents stelt ons in staat continu leren op grote schaal in productie te brengen. Onze agents distilleren de lessen uit elke sessie en produceren 97% minder fouten bij de eerste poging, met 27% minder kosten en 34% minder latentie. — Yusuke Kaji, General Manager AI for Business, Rakuten

🔗 Geheugen Managed Agents


Claude Code : kwaliteits-post-mortem en twee nieuwe versies

Post-mortem en reset van de limieten

23 april — Het Claude Code-team heeft een post-mortem gepubliceerd over drie kwaliteitsproblemen die in de afgelopen maand zijn gemeld. Ze zijn allemaal opgelost in v2.1.116+. De gebruikslimieten zijn voor alle abonnees opnieuw ingesteld.

Over the past month, some of you reported Claude Code’s quality had slipped. We investigated, and published a post-mortem on the three issues we found. All are fixed in v2.1.116+ and we’ve reset usage limits for all subscribers.

🇳🇱 In de afgelopen maand hebben sommigen van jullie een kwaliteitsdaling van Claude Code gemeld. We hebben dit onderzocht en een post-mortem gepubliceerd over de drie geïdentificeerde problemen. Ze zijn allemaal opgelost in v2.1.116+ en we hebben de gebruikslimieten voor alle abonnees opnieuw ingesteld.@ClaudeDevs

v2.1.117 en v2.1.118

VersieBelangrijkste functies
v2.1.118Visuele Vim-modus (v/V) met selectie en operators; /usage verenigd (voegt /cost en /stats samen); aangepaste thema’s in /theme; hooks die MCP-tools aanroepen via type: "mcp_tool"; DISABLE_UPDATES strikt; overerving van managed settings op Windows via WSL
v2.1.117Standaardinspanning verhoogd naar high voor Pro/Max op Opus 4.6 en Sonnet 4.6 (was medium); subagent-fork inschakelbaar op externe builds; glob/Grep vervangen door ingebouwde bfs/ugrep voor sneller zoeken; fix voor Opus 4.7-sessies (1M context correct berekend); fix voor Bedrock+Opus 4.7 met uitgeschakelde thinking

🔗 CHANGELOG Claude Code


Nieuwe Claude-connectors voor het dagelijks leven

23 april — Anthropic breidt zijn repertoire aan connectors uit naar consumentenapps. Sinds juli 2025 waren meer dan 200 connectors voor professionele tools beschikbaar; deze update voegt 15 dagelijkse diensten toe.

ApplicatieCategorie
AllTrailsWandelen
AudibleAudioboeken
Booking.comReizen
InstacartBoodschappen online
Intuit Credit KarmaFinanciën
Intuit TurboTaxFiscaliteit
ResyRestaurantreserveringen
SpotifyMuziek
StubHubTicketverkoop
TaskrabbitDiensten aan huis
ThumbtackLokale professionals
TripAdvisorReizen
UberVervoer
Uber EatsMaaltijdbezorging
ViatorToeristische activiteiten

Claude stelt nu automatisch relevante connectors voor op basis van de context van het gesprek. Beschikbaar op alle abonnementen (inclusief gratis), web, desktop en mobiel (mobiel in bèta). Geen betaalde plaatsing of gesponsorde antwoorden; gegevens van een app worden niet gebruikt om modellen te trainen.

🔗 Connectors dagelijks leven


GitHub Copilot — Zeven updates in drie dagen

GitHub Copilot publiceerde zeven items in zijn changelog tussen 22 en 23 april.

Chat voor pull requests (3 nieuwe mogelijkheden)

23 april — Copilot Chat integreert nu drie mogelijkheden voor pull requests, toegankelijk via github.com/copilot of de Copilot-knop op diffs (publieke preview):

  • Begrip van PR (pull request understanding) : opmerkingen, wijzigingen, commits en reviews geïntegreerd als context
  • PR-review : gestructureerde review op aanvraag
  • PR-samenvatting : beknopte samenvatting van de wijzigingen

🔗 Copilot Chat PR-verbeteringen

Agent-sessies bestuurbaar vanuit issues en projecten

23 april — De cloud agent is nu rechtstreeks bestuurbaar vanuit GitHub-issues en projectboards: sessie-indicator in de issue-header, voortgangspaneel aan de zijkant, sessies standaard geactiveerd in alle projectweergaven.

🔗 Agentsessies vanuit issues

Gestructureerd debuggen van stack traces op het web

23 april — Copilot Chat op github.com leidt nu de analyse van stack traces in zes gestructureerde stappen: wat is mislukt, waarom, de hoofdoorzaak, bewijs uit de code, het vertrouwensniveau en de volgende controles.

🔗 Stack traces debuggen

BYOK VS Code beschikbaar (GA)

22 april — Bring Your Own Key (breng je eigen API-sleutel mee) is algemeen beschikbaar voor Copilot Business- en Enterprise-gebruikers in VS Code. Anthropic, Gemini, OpenAI, OpenRouter en Azure worden ondersteund, evenals lokale modellen via Ollama en Foundry Local. De facturering verloopt rechtstreeks via de gekozen leverancier, buiten de Copilot-quota.

🔗 BYOK VS Code GA

C++ Language Server in publieke preview voor Copilot CLI

22 april — De Microsoft C++ Language Server (IntelliSense-engine van Visual Studio/VS Code) is beschikbaar in publieke preview voor Copilot CLI. Het levert nauwkeurige semantische data (symbooldefinities, referenties, aanroep-hiërarchieën, types) ter vervanging van iteratief grep-zoeken. Voorwaarden: authenticatie bij Copilot CLI + compile_commands.json.

🔗 C++ Language Server

Nieuwe self-serve Business-inschrijvingen opgeschort

22 april — GitHub schorst nieuwe self-serve-inschrijvingen voor Copilot Business op de GitHub Free- en GitHub Team-plannen. Bestaande klanten worden niet beïnvloed.

🔗 Pauze voor self-serve Business

Veld used_copilot_cloud_agent in API-metrics

23 april — Naar aanleiding van de rebranding “coding agent” → “cloud agent” voegt de metrics-API het veld used_copilot_cloud_agent toe in gebruikersrapporten (rollende vensters van 1 dag en 28 dagen). Het oude veld used_copilot_coding_agent blijft behouden tot 1 augustus 2026.

🔗 Metrics cloud agent


Gemini CLI v0.39.0 en Deep Think voor alle Ultra ### Gemini CLI v0.39.0

23 april — Google brengt Gemini CLI v0.39.0 uit, een stabiele versie met de markering “Latest”. Het hoogtepunt is de nieuwe opdracht /memory inbox om automatisch door de CLI tijdens werksessies geëxtraheerde skills te beoordelen en te valideren.

FunctionaliteitBeschrijving
/memory inboxBeoordeling van automatisch geëxtraheerde skills
invoke_subagent unifiéGerefactoriseerd onderagenthulpmiddel in één interface
Compacte opmaakBetere leesbaarheid in compacte modus
Plan Mode — bevestigingenValidatie vereist vóór activering van skills
Lichtgewicht startLicht parentproces voor snellere opstart
JSONL-streamingmigratieOpslaan van chatsessies in JSONL

Toegevoegde sneltoetsen: Ctrl+Backspace voor verwijderen woord per woord (Windows Terminal), Ctrl+Shift+G.

🔗 Gemini CLI v0.39.0

Deep Think open voor alle Ultra-abonnees

22 april — Google opent de Deep Think-modus (extended thinking, diepgaand redeneren) voor alle Gemini Ultra-abonnees. Deze modus was eerder beperkt toegankelijk; hij is nu rechtstreeks beschikbaar via het menu tools van de Gemini-app (web en mobiel).

🔗 Tweet @GeminiApp


Kimi K2.6: zwerm van 300 onderagenten en open-weights-benchmarks

Agent Swarm — 300 parallelle onderagenten

23 april — Moonshot AI lanceert Kimi K2.6 Agent Swarm: een systeem dat 300 onderagenten parallel kan inzetten over 4.000 stappen per uitvoering, tegenover 100 agents en 1.500 stappen voor K2.5.

CapaciteitK2.5K2.6
Parallelle onderagenten100300
Stappen per uitvoering1.5004.000
Soorten outputsChattekst100+ echte bestanden, reviews van 100.000 woorden, datasets van 20.000 regels

De onderagenten combineren heterogene vaardigheden: webonderzoek, data-analyse, coderen, langvormige tekstproductie en visuele generatie. Beschikbaar op kimi.com/agent-swarm.

🔗 Tweet @Kimi_Moonshot

Benchmarks: nummer 1 open-weights

23 april — Kimi K2.6 bereikt de eerste plaats onder open-weightsmodellen op twee benchmarks:

  • Design Arena: dezelfde prestatielijn als Claude Opus 4.7
  • MathArena open (Think-modus): vóór GLM 5.1

🔗 Design Arena


SpaceXAI × Cursor en Grok Imagine

Partnerschap SpaceXAI × Cursor

22 april — SpaceXAI (entiteit ontstaan uit de samensmelting van xAI/SpaceX) en Cursor kondigen een partnerschap aan om “de krachtigste AI voor coderen en kenniswerk ter wereld” te creëren. SpaceX levert de supercomputer Colossus (gelijk aan een miljoen H100’s); Cursor geeft het recht om het bedrijf later in 2026 voor $60 miljard over te nemen, of om $10 miljard te betalen voor alleen de samenwerking.

🔗 Tweet @SpaceX

Grok Imagine — Deelbare gepersonaliseerde templates

22 april — SuperGrok- en Premium+-abonnees kunnen nu gepersonaliseerde templates maken in Grok Imagine en deze openbaar delen.

🔗 Tweet @imagine


NVIDIA × Google Cloud Next

22 april — Op Google Cloud Next (Las Vegas) kondigen NVIDIA en Google Cloud verschillende belangrijke vooruitgangen aan rond de agentische AI-infrastructuur.

AankondigingDetail
A5X-instances (Vera Rubin NVL72)Tot 960.000 Rubin-GPU’s in een multisite-cluster, 10× goedkoper per token, 10× meer throughput per megawatt
Gemini op Google Distributed CloudPreview met Blackwell- en Blackwell Ultra-GPU’s — datasoevereiniteit
Confidential VMs BlackwellEerste Blackwell-confidential-computingaanbod in de publieke cloud
Nemotron 3 SuperBeschikbaar op het Gemini Enterprise Agent Platform
NeMo RL APIBeheerde reinforcement learning (Reinforcement Learning) op grote schaal

🔗 Blog NVIDIA × Google Cloud


Kling AI Video 3.0 — Native 4K-modus

23 april — Kling AI lanceert de native 4K-modus in zijn Video 3.0-serie. 4K-generatie gebeurt met één klik, zonder extra upscalingstap. Visuele consistentie (personages, teksten, stijlen, belichting) wordt gegarandeerd in native resolutie voor hoogwaardige productie. Ook beschikbaar via fal.ai voor bedrijven.

Kling AI organiseert tegelijk een 4K Short Film Creative Contest, een wereldwijde wedstrijd die makers uitnodigt om korte films in te sturen die met de nieuwe modus zijn gemaakt.

🔗 Tweet @Kling_ai


ChatGPT for Clinicians en OpenAI Privacy Filter

ChatGPT for Clinicians + HealthBench Professional

22 april — OpenAI lanceert ChatGPT for Clinicians, een gratis versie voor geverifieerde zorgprofessionals in de Verenigde Staten (artsen, nurse practitioners, physician assistants, apothekers). De dienst omvat toegang tot frontiermodellen voor complexe klinische vragen, skills voor repetitieve workflows (verwijsbrieven, voorafgaande machtigingen), real-time geciteerde klinische zoekopdrachten en automatische generatie van credits voor permanente educatie (CME). HIPAA-verwerking is optioneel beschikbaar via overeenkomst.

OpenAI publiceert ook HealthBench Professional, een open benchmark die AI beoordeelt op echte klinische taken (700.000+ antwoorden beoordeeld door artsen). GPT-5.4 in ChatGPT for Clinicians overtreft menselijke artsen op deze benchmark onder tijdsongelimiteerde omstandigheden met webtoegang.

🔗 ChatGPT for Clinicians

OpenAI Privacy Filter

22 april — OpenAI publiceert Privacy Filter, een open-weightmodel (Apache 2.0) om persoonlijk identificeerbare informatie (Personally Identifiable Information, PII) in tekst te detecteren en te maskeren. Het model draait lokaal (geen gegevens worden naar een server gestuurd), ondersteunt een context van 128K tokens en behaalt een F1-score van 97.43% op de benchmark PII-Masking-300k.

EigenschapWaarde
ArchitectuurBidirectionele tokenclassificator (beperkte Viterbi-decodering)
Grootte1.5B totale parameters, 50M actief
Context128.000 tokens
LicentieApache 2.0 (Hugging Face + GitHub)
F197.43% op gecorrigeerde PII-Masking-300k

Gedekte categorieën PII: private_person, private_address, private_email, private_phone, private_url, private_date, account_number, secret (wachtwoorden en API-sleutels).

🔗 OpenAI Privacy Filter


Perplexity en Cohere

Perplexity integreert Kimi K2.6

23 april — Kimi K2.6 van Moonshot AI is nu beschikbaar voor alle Pro- en Max-abonnees van Perplexity.

🔗 Tweet @perplexity_ai

Cohere — W4A8 production-ready in vLLM

22 april — Cohere kondigt de integratie aan van zijn W4A8-inferentie (4-bit kwantisatie voor gewichten, 8-bit voor activaties) in vLLM. Resultaten op Hopper-GPU versus W4A16: +58% op de tijd tot het eerste token (Time To First Token) en +45% op de tijd per uitvoertoken (Time Per Output Token). De integratie richt zich prioritair op grootschalige productie-MoE-modellen Command A.

🔗 Blog Cohere W4A8


Kort nieuws

Suno nummer 1 in de muziek-App Store

21 april — Suno, het platform voor AI-muziekgeneratie, bereikt de eerste plaats in de App Store in de categorie muziek. CEO Mikey Shulman kondigt aan: « The future of music is one where everyone enjoys creating. »

🔗 Tweet @suno

Anthropic Economic Index Survey

22 april — Anthropic lanceert de Anthropic Economic Index Survey, een maandelijkse enquête uitgevoerd via Anthropic Interviewer onder een willekeurige steekproef van Claude-gebruikers. Het doel is kwalitatieve gegevens te verzamelen over de economische impact van AI: uitbestede taken, productiviteitswinst, veranderingen in rollen. De resultaten zullen bijdragen aan toekomstige Anthropic Economic Index-rapporten.

🔗 Enquête-aankondiging

Anthropic — MCP-agents in productie: de cijfers

22 april — Een technisch artikel van Anthropic documenteert de voordelen van MCP voor productieagents: MCP SDK’s overschrijden 300 miljoen downloads per maand, tool search vermindert de tokens voor tooldefinities met 85%, en programmatic tool calling vermindert het tokengebruik met 37% in complexe meerstaps-workflows.

🔗 Blog MCP productie-agents

OpenAI — WebSockets in de Responses API: 40% lagere latency

22 april — Terugblikartikel van OpenAI waarin wordt uitgelegd hoe de WebSocket-modus in de Responses API de latency van agentlussen met 40% vermindert. De persistente verbinding houdt een geheugen-cache van de toestand van eerdere antwoorden bij, waardoor het hele historiek niet bij elke call opnieuw hoeft te worden verwerkt. Al in productie: Codex, Vercel AI SDK, Cline (+39%), Cursor (+30%).

🔗 Artikel WebSockets

Perplexity Research — Training van search-augmented modellen

22 april — Perplexity publiceert onderzoek naar zijn SFT + RL-pijplijn (Supervised Fine-Tuning + Reinforcement Learning) om de kwaliteit van zoekantwoorden te verbeteren. Belangrijk resultaat: na verder trainen bereiken Qwen-modellen de factualiteit van GPT-modellen tegen lagere kosten.

🔗 Perplexity Research


Wat dit betekent

23 april 2026 schetst twee samenkomende trends. Enerzijds bevestigt GPT-5.5 dat OpenAI opnieuw de leiding heeft genomen op agentische benchmarks (Terminal-Bench, ARC-AGI-2, OSWorld) na meerdere maanden waarin Claude Opus 4.7 domineerde. De kloof blijft klein op SWE-Bench Pro, waar Anthropic het voordeel behoudt — een teken dat beide labs zich op dezelfde prioritaire use-cases richten.

Anderzijds markeert de dag de intrede in het tijdperk van persistente agents met geheugen: OpenAI Workspace Agents, Anthropic Managed Agents Memory en Kimi K2.6 Agent Swarm verschijnen gelijktijdig met verschillende benaderingen (Slack-integratie, filesystem-based, zwerm van onderagenten), maar met hetzelfde doel — dat de agent zich herinnert, leert en handelt zonder constante supervisie. De Rakuten-cijfers (-97% fouten, -27% kosten) geven een eerste industriële maat voor de impact.

GitHub Copilot zet zijn strategie van diepe integratie in GitHub.com voort (PR-chat, agentsessies vanuit issues, gestructureerde stack traces) en opent zich tegelijk naar buiten via BYOK. De BYOK VS Code GA geeft aan dat Copilot zich zowel als interface als als model positioneert.


Bronnen

Dit document is vertaald van de fr-versie naar de taal nl met behulp van het model gpt-5.4-mini. Voor meer informatie over het vertaalproces, raadpleeg https://github.com/jls42/ai-powered-markdown-translator