GPT-5.5 Instant nieuwe standaard in ChatGPT, Grok 4.3 op xAI API, Anthropic x Blackstone enterprise

Een drukke week: OpenAI zet GPT-5.5 Instant in als directe vervanger van GPT-5.3 voor alle ChatGPT-gebruikers, xAI lanceert Grok 4.3 op zijn API met een context van één miljoen tokens, en Anthropic kondigt een nieuw enterprise AI-dienstverleningsbedrijf aan dat mede is opgericht met Blackstone, Hellman & Friedman en Goldman Sachs. Op het gebied van tooling verdriedubbelt GitHub de security GA/previews via zijn MCP-server, lanceert Perplexity een product voor financiële teams, en presenteert Runway realtime videoagents die worden gegenereerd vanuit één enkele afbeelding.

GPT-5.5 Instant — nieuw standaardmodel van ChatGPT

5 mei — OpenAI vervangt GPT-5.3 Instant door GPT-5.5 Instant als het standaardmodel van ChatGPT voor alle gebruikers. De uitrol spreidt zich uit over twee dagen.

Dimensie	Verbetering vs GPT-5.3 Instant
Hallucinaties (geneeskunde, recht, financiën)	-52,5 %
Onjuiste claims (gemeld door gebruikers)	-37,3 %
Uitvoerigheid van de antwoorden	-30,2 % woorden gemiddeld

Het model verbetert ook beeldanalyse, STEM-antwoorden en de beslissing om webzoekopdrachten te gebruiken. De antwoorden zijn beknopter zonder inhoudsverlies, met minder overbodige opmaak en minder onnodige vervolgvraagstellingen.

Geheugenbronnen — OpenAI introduceert “memory sources” op alle ChatGPT-modellen: wanneer een antwoord wordt gepersonaliseerd op basis van opgeslagen herinneringen, eerdere gesprekken of verbonden Gmail, ziet de gebruiker precies welke bronnen zijn gebruikt en kan hij ze corrigeren of verwijderen. Personalisatie op basis van eerdere gesprekken en bestanden is eerst alleen beschikbaar voor Plus- en Pro-abonnees (web); de andere abonnementen volgen later.

Beschikbaarheid:

Gefaseerde uitrol over 2 dagen voor alle ChatGPT-gebruikers
Beschikbaar via API onder de alias chat-latest
GPT-5.3 Instant blijft 3 maanden beschikbaar voor betalende abonnees

🔗 Officiële aankondiging GPT-5.5 Instant

Grok 4.3 gelanceerd op de xAI API — context van 1M tokens, #1 agentic tool calling

5 mei — xAI kondigt via X de lancering aan van Grok 4.3 op de xAI API (console.x.ai). Het model wordt gepresenteerd als het snelste en slimste model van de reeks tot nu toe.

Eigenschap	Waarde
Contextvenster	1 miljoen tokens
Benchmark agentic tool calling	#1 (@ArtificialAnlys leaderboard)
Benchmark instruction following	#1 (@ArtificialAnlys leaderboard)
Enterprise-domeinen	#1 case law en corporate finance (@ValsAI)
Beschikbaarheid	xAI API (console.x.ai) — nog niet op grok.com

Grok 4.3 is now live on the xAI API. It’s our fastest, most intelligent model to date. It tops the @ArtificialAnlys leaderboards in agentic tool calling and instruction following, and ranks #1 in @ValsAI enterprise domains like case law and corporate finance. Grok 4.3 supports a 1 million token context.

🇳🇱 Grok 4.3 is nu beschikbaar op de xAI API. Dit is ons snelste en slimste model tot nu toe. Het staat bovenaan de @ArtificialAnlys-ranglijsten voor agentic tool calling en instruction following, en staat op #1 bij @ValsAI in enterprise-domeinen zoals ondernemingsrecht en corporate finance. Grok 4.3 ondersteunt een context van één miljoen tokens. — @xai op X

De tweet genereerde 25,7 miljoen weergaven en 6 029 likes. Opmerking: op het moment van de aankondiging was er geen aparte pagina op x.ai/news — de lancering liep uitsluitend via X.

Anthropic en Blackstone, Hellman & Friedman, Goldman Sachs — nieuw enterprise AI-dienstverleningsbedrijf

4 mei — Anthropic, Blackstone, Hellman & Friedman en Goldman Sachs kondigen de oprichting aan van een nieuw enterprise AI-dienstverleningsbedrijf, gesteund door een consortium van extra alternatieve partijen.

Doel: Claude inzetten in de kernactiviteiten van grote ondernemingen voor taken die intensieve engineering en diepgaande sectorspecifieke kennis vereisen. Volgens Anthropic overstijgt de enterprise-vraag naar Claude wat één distributiemodel aankan.

Het typische operationele model begint met een klein team dat nauw met de klant samenwerkt om frictiepunten te identificeren, en vervolgens Claude-agents bouwt die op het bedrijf zijn afgestemd. Het concrete voorbeeld: een netwerk van medische praktijken op meerdere locaties waar Claude klinische documentatie, repetitieve administratieve taken en coördinatie tussen specialismen afhandelt, zodat clinici zich kunnen richten op patiëntenzorg.

Het nieuwe bedrijf treedt toe tot het Claude Partner Network, naast Accenture, Deloitte en PwC. Het vertegenwoordigt een structurele stap in Anthropic’s enterprise-distributiestrategie: in plaats van uitsluitend API-licenties te verkopen, zet het bedrijf nu in op complexe operationele uitrols met eersteklas financiële partners.

🔗 Officiële aankondiging

Claude-agents voor financiële diensten en verzekeringen

5 mei — Anthropic lanceert tien kant-en-klare (ready-to-run) agenttemplates voor financiële diensten en verzekeringen. Beschikbaar als plugins in Claude Cowork of Claude Code, of als autonome Claude Managed Agents op het Claude-platform.

Onderzoek en klantdekking:

Agent	Rol
Pitch builder	Doellijsten, vergelijkbare bedrijven, pitchbooks
Meeting preparer	Klant- en tegenpartijdbriefings
Earnings reviewer	Lezen van transcripts en modelupdates
Model builder	Maken van financiële modellen op basis van filings en data
Market researcher	Sectorwatch en samenvatting van nieuws

Financiën en operaties:

Agent	Rol
Valuation reviewer	Controle van waarderingen
General ledger reconciler	Grootboekreconciliatie en NAV-berekeningen
Month-end closer	Maandafsluiting en boekingsjournalen
Statement auditor	Controle van financiële overzichten
KYC screener	Samenstellen van entiteitsdossiers en compliance-screening

Claude integreert nu in Microsoft Excel, PowerPoint, Word en Outlook (in ontwikkeling) via add-ins. De Dispatch-functie van Claude Cowork maakt het mogelijk taken toe te wijzen via tekst of spraak vanaf elke locatie.

Nieuwe databronconnectors: Dun & Bradstreet, Fiscal AI, Financial Modeling Prep, Guidepoint, IBISWorld, SS&C IntraLinks, Third Bridge, Verisk, en een MCP van Moody’s (ratings en data voor meer dan 6 000 entiteiten).

Onder de genoemde klanten: Citadel, FIS, BNY, Carlyle, Mizuho, Travelers, Walleye Capital (100 % van de medewerkers gebruikt Claude Code), Hg, Morningstar, FactSet. Deze agents zijn geoptimaliseerd voor Claude Opus 4.7, dat op #1 staat in de Vals AI Finance Agent-benchmark.

🔗 Officiële aankondiging

Perplexity Computer for Professional Finance

5 mei — Perplexity lanceert Computer voor professionele financiën, een versie van Computer die specifiek is ontworpen voor analyse- en investeringsteams: buy-side- en sell-side-analisten, hedgefondsen, private equity.

Dimensie	Waarde
Inbegrepen workflows	35 (10 segmenten)
Geïntegreerde dataproviders	14 (waaronder Quartr, Fiscal)
Premium MCP-connectors	Morningstar, PitchBook, Daloopa, Carbon Arc
Beschikbare platforms	Microsoft Teams, Agent API
Komt eraan	Excel add-in
FinSearchComp T1-benchmark	1e (nauwkeurigheid, kosten, latentie)

Teams met gelicentieerde abonnementen kunnen hun eigen inloggegevens koppelen via MCP-connectors om toegang te krijgen tot Morningstar, PitchBook, Daloopa en Carbon Arc. Anderen krijgen toegang tot de geïntegreerde financiële tools, ondersteund door 14 dataproviders.

Elke numerieke waarde verwijst naar de bron: voor waarden uit SEC-documenten toont Computer de berekening en wijst het naar de specifieke pagina’s van het document. In de FinSearchComp T1-benchmark (tijdkritische data-extractie) staat Perplexity op de eerste plaats qua nauwkeurigheid, kosten per correct antwoord en latentie — inclusief realtime koersen, cryptoprijzen en wisselkoersen.

🔗 Perplexity-blog — Computer for Professional Finance

Runway Characters — realtime videoagent vanuit één enkele afbeelding

4 mei — Runway kondigt Characters aan, een technologie die het mogelijk maakt om één enkele afbeelding om te zetten in een conversationele realtime videoagent.

Metriek	Waarde
End-to-end latentie	1,75 seconde
Videokwaliteit	24 fps HD
Vereiste bronafbeelding	1 enkele afbeelding
Koude starts	60× sneller (GPU peer-to-peer)

De vertraging van 1,75 seconde wordt gemeten vanaf het moment dat de gebruiker ophoudt met spreken tot het eerste antwoord van het personage. Runway publiceerde tegelijk twee engineeringartikelen: het eerste beschrijft de architectuur van de realtime videoagent, het tweede legt uit hoe de peer-to-peer GPU-infrastructuur de koude-starttijden met 60 vermenigvuldigt.

Beoogde use-cases zijn conversational agents, interactieve personages in realtime en video-interfaces voor applicaties. De technologie markeert een verschuiving van offline videorendering naar synchrone interactie.

🔗 Aankondigingstweet Runway Characters

GitHub MCP Server — drievoudige beveiligingsupgrade

5 mei — GitHub publiceert tegelijk drie beveiligingsupdates voor zijn MCP-server, allemaal op dezelfde dag uitgevoerd.

Secret scanning GA

Secret scanning via GitHub MCP Server gaat naar algemene beschikbaarheid (sinds maart 2026 uit preview). In GitHub Copilot CLI gebeurt de installatie met /plugin install advanced-security@copilot-plugins; in VS Code stelt de plugin advanced-security de opdracht /secret-scanning beschikbaar.

Aspect	Detail
Status	GA (algemene beschikbaarheid)
Beschikbaarheid	Repository’s met GitHub Secret Protection ingeschakeld
Integraties	Copilot CLI, VS Code, elke MCP-compatibele IDE

De MCP-tools respecteren nu bestaande push-protection-aanpassingen — het bypass-gedrag is consistent met de configuratie van de repository of organisatie.

🔗 Changelog — Secret scanning GA

Dependency scanning in openbare preview

Detectie van kwetsbaarheden in dependencies via MCP Server gaat naar openbare preview. Het systeem raadpleegt de GitHub Advisory Database en geeft gestructureerde resultaten terug met getroffen pakketten, ernst en aanbevolen gecorrigeerde versies.

Aspect	Detail
Status	Openbare preview
Beschikbaarheid	Repository’s met Dependabot alerts ingeschakeld
CLI-activering	`copilot --add-github-mcp-toolset dependabot`

🔗 Changelog — Dependency scanning

GitHub Advanced Security × Microsoft Defender for Cloud GA

De integratie GitHub Advanced Security × Microsoft Defender for Cloud gaat eveneens naar GA. Ze koppelt uitgerolde containerimages in de cloudomgeving aan de GitHub-broncode en brengt runtime-context naar de beveiligingsweergaven.

Nieuwe filters beschikbaar in de organisatieweergave: has:deployment, runtime-risk:internet-exposed, runtime-risk:sensitive-data. Beveiligingscampagnes kunnen rechtstreeks worden toegewezen aan de GitHub Copilot-codeagent.

🔗 Changelog — Code-to-cloud GA

Model Spec Midtraining (MSM) — agentische afstemming daalt van 68 % naar 5 %

5 mei — Onderzoekers van Anthropic publiceren “Model Spec Midtraining” (MSM), een afstemmingsmethode die wordt ingevoegd tussen pretraining en alignment fine-tuning (alignment fine-tuning, AFT).

Het principe: modellen worden getraind op een synthetisch corpus van documenten die de inhoud van hun Model Spec bespreken voordat ze leren de regels ervan te volgen. Het idee is dat begrijpen waarom een regel bestaat de robuustheid van de toepassing ervan verbetert.

Model	Slechte afstemming (alleen AFT)	Met MSM + AFT
Qwen2.5-32B	68 %	5 %
Qwen3-32B	54 %	7 %

MSM maakt AFT ook veel efficiënter in data: 40 tot 60 keer minder AFT-data nodig om vergelijkbare prestaties te halen. De auteurs tonen ook aan dat het uitleggen van de motieven achter de regels (in plaats van het toevoegen van meer subregels) de generalisatie buiten de distributie verbetert.

🔗 MSM-artikel — alignment.anthropic.com

NotebookLM Mind Maps — personalisatie, organisatie, navigatie

5 mei — NotebookLM verbetert zijn mind maps (Mind Maps) met drie functies die gelijktijdig worden uitgerold.

Functie	Beschrijving
Personalisatie	De kaart sturen met specifieke gebruikersinstructies
Organisatie	Mind Map-kaarten direct hernoemen en delen
Navigatie	Vlotte overgangen tussen knooppunten

De uitrol verloopt geleidelijk voor alle gebruikers. De update vult de reeks snelle verbeteringen van NotebookLM sinds begin april aan: automatische organisatie van bronnen (24 april, 100 % van de uitrol bereikt op 5 mei), integratie in de Gemini mobiele app (30 april).

🔗 NotebookLM-tweet

Genspark sb-git — Git-server vanaf nul herschreven voor AI-agents

5 mei — Genspark lanceert sb-git, een Git-server die vanaf nul is herschreven voor AI-agents. Volledige Git-semantiek: versiebeheer, branches, diff, blame, rollback en push.

Aspect	Detail
CLI	`gsk` (init, clone-url, cat, commit)
Compatibiliteit	Claude Code, OpenClaw, elke Git-agent
Opslag	1 GB (gratis), 10 GB (Plus/Pro)
Account vereist	Nee — geen GitHub-account nodig
Beschikbaarheid	Direct (web + mobiel)

Geen GitHub-account vereist, geen voorafgaande repositoryconfiguratie. De focus ligt op compatibiliteit met gangbare AI-agents (Claude Code, OpenClaw) zonder installatiefrictie.

🔗 Genspark sb-git tweet

NVIDIA + ServiceNow — Project Arc, autonome long-running desktopagent

5 mei — Tijdens de ServiceNow Knowledge 2026-conferentie kondigden Jensen Huang en Bill McDermott de uitbreiding aan van hun partnerschap rond autonome AI-agents in ondernemingen.

ServiceNow lanceert Project Arc, een autonome long-running desktopagent ontworpen voor kenniswerkers: ontwikkelaars, IT-teams, beheerders. De agent gebruikt NVIDIA OpenShell (open-source sandbox) voor governance en beveiliging, en koppelt native aan het ServiceNow-platform via ServiceNow Action Fabric.

Metriek	Waarde
Blackwell-efficiëntie vs Hopper	50× tokens/watt
Verlaging kosten per miljoen tokens	~35×
Nemotron 3 Super (open source)	#1 EnterpriseOps-Gym (NOWAI-Bench)
Autonoom opgeloste tickets	90 % (ServiceNow + Apriel/Nemotron)

🔗 NVIDIA Blog — ServiceNow

NVIDIA NemoClaw + OpenClaw — persistente open-source-agent die React op GitHub overtreft

30 april — OpenClaw (gemaakt door Peter Steinberger) heeft in 60 dagen 250.000+ GitHub-sterren bereikt en daarmee React overtroffen om het meest gestarred project op het platform te worden. NVIDIA werkt samen met de community om dit persistente self-hosted AI-agentproject te beveiligen.

NVIDIA lanceert NemoClaw, een referentie-implementatie die met één commando kan worden geïnstalleerd, en die OpenClaw + NVIDIA OpenShell + Nemotron combineert met standaard versterkte beveiligingsconfiguraties.

Metriek	Waarde
GitHub-sterren OpenClaw	250 000+ (maart 2026)
Groei	#1 GitHub-project in 60 dagen (voorbij React)
Inferenzemultiplicator agents vs reasoning AI	1 000×
Installatie NemoClaw	1 commando

🔗 NVIDIA-blog — OpenClaw/NemoClaw

Luma AI Uni-1.1 API — beeldgeneratie die redeneert op creatieve briefs

5 mei — Luma AI lanceert de Uni-1.1 API, een model voor beeldgeneratie dat is ontworpen om te redeneren over creatieve briefs in plaats van over tokens. In tegenstelling tot traditionele API’s die prompt engineering vereisen, begrijpt Uni-1.1 de esthetische context van elke visuele traditie en levert het vanaf de eerste poging bruikbare resultaten.

Genoemde use-cases: modetools, architecturale renders, manga-pipelines, filmische content. Geen middleware vereist. De API is beschikbaar op lumalabs.ai/api.

🔗 Tweet Luma AI Uni-1.1

ChatGPT Ads Manager self-serve en CPC-bieden

5 mei — OpenAI breidt zijn reclameprogramma uit met twee nieuwigheden: een self-serve tool (Ads Manager, in bèta in de Verenigde Staten) en de lancering van de CPC-biedingsmodus (cost per click).

Modus	Status	Beschrijving
CPM (kosten per duizend vertoningen)	Bestaand	Beschikbaar sinds de lancering van het programma
CPC (kosten per klik)	Nieuw	De adverteerder betaalt alleen bij een effectieve klik
Ads Manager self-serve (bèta)	Nieuw	Beschikbaar voor Amerikaanse adverteerders

Agentuurpartners: Dentsu, Omnicom, Publicis, WPP. Technologiepartners: Adobe, Criteo, Kargo, Pacvue, StackAdapt. OpenAI heeft ook een Conversions API en pixeltracking gelanceerd om post-click-acties te meten zonder individuele gesprekken aan adverteerders bloot te stellen.

🔗 OpenAI-advertentieaankondiging

Perplexity Premium Health Sources

5 mei — Perplexity lanceert premium gezondheidsbronnen. Meer dan één op de tien zoekopdrachten op het platform gaat over gezondheid. De bronnen die bij de lancering beschikbaar zijn, zijn NEJM, BMJ Journals en BMJ Best Practice — medische referenties die normaal gesproken zijn voorbehouden aan institutionele abonnementen.

In Computer worden deze bronnen automatisch geactiveerd voor gezondheidsvragen zonder handmatige selectie. Elk antwoord bevat traceerbare citaties. Komende bronnen: Micromedex, EBSCOhost, Health Affairs, VisualDx, American Academy of Orthopaedic Surgeons, American Diabetes Association, Springer Publishing.

🔗 Perplexity-blog — Premium Health Sources

Kort nieuws

Manus — Automatische aanbeveling van connectors — Manus detecteert nu welke connector (Slack, Notion, Gmail, Google Drive) nodig is om een taak uit te voeren en beveelt die aan in het gesprek, zonder de discussie te verlaten. Activering blijft onderhevig aan bevestiging door de gebruiker. 🔗 bron
Black Forest Labs — FLUX Creator Program — BFL opent een selectief programma voor makers voor vroege toegang tot de komende FLUX-modellen, met versterking van hun werk via de BFL-kanalen. 🔗 bron
GPT-5.5 Instant System Card — Eerste System Card van de Instant-lijn geclassificeerd als “High capability” in de categorieën Cyberbeveiliging en Biologie & Chemie van OpenAI’s Preparedness Framework. Er zijn overeenkomstig versterkte beschermingsmaatregelen geïmplementeerd. 🔗 bron
OpenAI — WebRTC relay+transceiver-architectuur — OpenAI publiceert een technisch artikel waarin de herontwerp van zijn WebRTC-infrastructuur voor realtime-spraak (ChatGPT Voice, Realtime API) wordt beschreven, die meer dan 900 miljoen wekelijkse gebruikers bedient. De architectuur scheidt packetrouting (lichte, stateless relay) van protocolbeëindiging (stateful transceiver), waardoor standaard Kubernetes-implementatie mogelijk wordt met een kleinere publieke UDP-voetafdruk. 🔗 bron

Wat dit betekent

Finance als prioritaire speeltuin voor enterprise-AI. Binnen 24 uur publiceerden Anthropic, Perplexity en xAI elk aankondigingen die expliciet gericht waren op financiële teams: tien Claude-agenttemplates (waardering, KYC, maandafsluiting), Computer for Professional Finance met 35 workflows en 14 databronnen, en Grok 4.3 op #1 in de Vals AI-benchmark voor corporate finance en case law. De convergentie is geen toeval — finance combineert een volume aan gestructureerde documenten, precisievereisten en tolerantie voor premium toolkosten, wat het de ideale omgeving maakt voor de eerste uitrol van autonome agents met hoge bedrijfswaarde.

De race om standaardmodellen. GPT-5.5 Instant vermindert hallucinaties met 52,5 % ten opzichte van zijn directe voorganger, en Grok 4.3 haalt een context van één miljoen tokens met gemeten en gepubliceerde agentische prestaties. Beide modellen worden op dezelfde dag gelanceerd. De inzet is niet langer alleen het publiceren van de beste academische benchmarks, maar het standaardmodel zijn dat geladen wordt in publieke interfaces (ChatGPT) of als eerste geactiveerd wordt in ontwikkelaarspijplijnen (xAI-API).

MCP als standaard voor ontwikkelaarsbeveiliging. GitHub publiceerde gelijktijdig drie beveiligingsupdates via zijn MCP-server (secret scanning GA, dependency scanning in preview, code-to-cloud GA). Deze gecoördineerde uitrol maakt van GitHub’s MCP-server een native integratiekanaal voor codeeragents — Copilot CLI, VS Code en elke MCP-compatibele IDE kunnen nu secrets en kwetsbare afhankelijkheden scannen vóór elke commit, direct in de agentische workflow.

Persistente agents en realtime-infrastructuur. Runway Characters (video-agent met 1,75 s latentie vanaf een afbeelding), Project Arc van ServiceNow (langlopende desktopagent), OpenClaw/NemoClaw (250.000 GitHub-sterren, 1.000× meer inferentievraag dan reasoning-AI) en Genspark sb-git (Git herschreven voor agents) signaleren allemaal dezelfde verschuiving: AI-agents verlaten het tijdperk van eenmalige verzoeken en gaan het tijdperk van persistente processen binnen, met radicaal andere infrastructuurbehoeften — statusopslag, realtime latentie, native versiebeheer.