GPT-5.4 mini en nano gelanceerd door OpenAI, Mistral sluit zich aan bij de NVIDIA Nemotron Coalition, Perplexity Comet Enterprise beschikbaar

17 maart 2026 staat in het teken van GTC NVIDIA en verschillende belangrijke lanceringen. OpenAI brengt GPT-5.4 mini en nano uit, zijn tot nu toe meest capabele compacte modellen, die op verschillende benchmarks dicht in de buurt komen van het volledige model. De NVIDIA Nemotron Coalition wordt groter met de toetreding van Mistral AI en Perplexity. Perplexity opent tegelijk Comet Enterprise met volledige MDM-governance, Claude Code v2.1.77 verdubbelt de generatielimiet voor Opus 4.6, en GitHub, Anthropic, Google en OpenAI bundelen hun krachten om open source-beveiliging te financieren voor 12,5 miljoen dollar.

GPT-5.4 mini en nano: de compacte modellen van OpenAI

17 maart — OpenAI lanceert GPT-5.4 mini en GPT-5.4 nano, zijn best presterende compacte modellen tot nu toe. Deze twee varianten brengen de mogelijkheden van GPT-5.4 in formaten die geoptimaliseerd zijn voor workloads met groot volume, met lagere latentie en lagere kosten.

GPT-5.4 mini verbetert GPT-5 mini aanzienlijk op code, redeneren, multimodaal begrip en toolgebruik, terwijl het meer dan twee keer zo snel draait. Het benadert de prestaties van het volledige GPT-5.4-model op verschillende belangrijke evaluaties, waaronder SWE-Bench Pro en OSWorld-Verified.

GPT-5.4 nano is de kleinste en goedkoopste versie van de GPT-5.4-familie, ontworpen voor taken waar snelheid en kosten voorop staan: classificatie, data-extractie, rangschikking en eenvoudige code-subagents.

Evaluatie	GPT-5.4	GPT-5.4 mini	GPT-5.4 nano	GPT-5 mini
SWE-Bench Pro (public)	57,7 %	54,4 %	52,4 %	45,7 %
Terminal-Bench 2.0	75,1 %	60,0 %	46,3 %	38,2 %
Toolathlon	54,6 %	42,9 %	35,5 %	26,9 %
GPQA Diamond	93,0 %	88,0 %	82,8 %	81,6 %
OSWorld-Verified	75,0 %	72,1 %	39,0 %	42,0 %

De use-cases zijn onder te verdelen in drie categorieën: code-assistenten (GPT-5.4 mini blinkt uit in snelle coding-workflows, debugloops, frontendgeneratie), subagents (in Codex kan GPT-5.4 subtaken delegeren aan GPT-5.4 mini met slechts 30 % van het GPT-5.4-quota), en interfacebesturing (computer use), waarbij GPT-5.4 mini snel dense UI-screenshots interpreteert.

Model	Beschikbaarheid	Invoerprijs	Uitvoerprijs	Context
GPT-5.4 mini	API, Codex, ChatGPT Free/Go	0,75 $/miljoen tokens	4,50 $/miljoen tokens	400 000 tokens
GPT-5.4 nano	Alleen API	0,20 $/miljoen tokens	1,25 $/miljoen tokens	—

In ChatGPT is GPT-5.4 mini toegankelijk voor Free- en Go-gebruikers via de “Thinking”-functie in het + menu. Voor betaalde abonnementen dient het als fallbackmodel wanneer GPT-5.4 Thinking zijn rate limit bereikt.

🔗 Introducing GPT-5.4 mini and nano

NVIDIA GTC 2026: de Nemotron Coalition en Dynamo 1.0

De NVIDIA GTC-conferentie, die op 16 maart van start ging, was de katalysator voor verschillende belangrijke aankondigingen in de sector: de vorming van een open coalitie rond frontier open source-modellen, de productie-release van een inference operating system, en de aankondiging van een data-blueprint voor physical AI.

Mistral sluit zich aan bij de NVIDIA Nemotron Coalition

16 maart — Mistral AI kondigt een strategisch partnerschap met NVIDIA aan om frontier open source-AI-modellen mee te ontwikkelen. Mistral wordt oprichtend lid van de NVIDIA Nemotron Coalition, en combineert zijn frontier-architectuur met NVIDIA-rekeninfrastructuur en ontwikkeltools.

Aspect	Detail
Rol van Mistral	Oprichend lid, frontier-architectuur + full-stack AI-aanbod
Bijdrage van NVIDIA	GPU-infrastructuur + ontwikkeltools
Doel	Open frontier-modellen van topniveau mee ontwikkelen

🔗 Mistral-aankondiging op X

Perplexity sluit zich ook aan bij de coalitie

16 maart — Perplexity kondigt zijn toetreding tot dezelfde NVIDIA Nemotron Coalition aan. Belangrijkste punten: Perplexity verfijnt verschillende open modellen voor elke stap van zijn antwoordpipeline (queryanalyse, redeneren, eindantwoord). Het model Nemotron 3 Super (120 miljard parameters, MoE-architectuur) is nu beschikbaar in de zoekbalk van Perplexity, de Agent API en Perplexity Computer.

🔗 Perplexity-blog – Nemotron Coalition 🔗 NVIDIA-aankondiging

Dynamo 1.0: het inference operating system gaat in productie

16 maart — NVIDIA kondigt op GTC de productie-invoering aan van Dynamo 1.0, gepresenteerd als het “inference operating system” voor AI factories. Dynamo verhoogt de inferenceprestaties op Blackwell GPU’s tot 7x ten opzichte van niet-geoptimaliseerde deployments. De overstap naar v1.0 markeert de overgang van experimentele fase naar industriële productie.

🔗 NVIDIA-aankondiging Dynamo 1.0

Physical AI Data Factory Blueprint

16 maart — NVIDIA onthult de Physical AI Data Factory Blueprint: een referentiearchitectuur om accelerated computing om te zetten in hoogwaardige trainingsdata voor robotica, AI vision agents en autonome voertuigen. Deze blueprint stelt bedrijven in staat om synthetisch trainingsdata voor physical AI op grote schaal te genereren.

🔗 NVIDIA Physical AI-aankondiging

Cohere + NVIDIA: soevereine AI op DGX Spark

16 maart — Cohere en NVIDIA werken samen aan een soevereine, veilige en efficiënte AI, eveneens aangekondigd op GTC. Twee hoofdsporen: NVIDIA ecosystem-native modellen (aangepaste modellen geoptimaliseerd voor de nieuwste NVIDIA-architectuur, gericht op gespecialiseerde enterprise-workloads) en North op DGX Spark (het agentische North-platform van Cohere komt beschikbaar op NVIDIA DGX Spark, lokaal en met lage latentie voor gevoelige data). Doelsectoren zijn financiën, gezondheidszorg en de publieke sector.

🔗 Cohere-blog – soevereine NVIDIA-AI

Perplexity Comet Enterprise: MDM-governance en CrowdStrike-integratie

17 maart — Perplexity lanceert Comet Enterprise voor alle Enterprise-abonnees. De AI-browser gaat over naar een enterprise-versie met volledige governance voor uitrol.

Functionaliteit	Beschrijving
MDM-uitrol	Stille installateur, uitrol op duizenden machines, auditlogs
Granulaire telemetrie	Tracking per gebruiker
CrowdStrike Falcon	Bescherming tegen phishing, detectie van exfiltratie (screenshots, downloads)
Realtime-interventie	Mogelijk via de CrowdStrike-integratie
Privacy	Perplexity traint zijn modellen nooit op enterprise-data

Onder de eerste gebruikers bevinden zich bedrijven uit de Fortune-ranglijst, AWS, AlixPartners, Gunderson Dettmer en Bessemer Venture Partners. De gedocumenteerde use-cases omvatten voorbereiding van klantvergaderingen (real-time nieuws), analyse van SOW-contracten, financiële berekeningen en sectorspecifiek onderzoek.

🔗 Perplexity-blog – Comet Enterprise

Claude Code v2.1.77: standaard 64k tokens voor Opus 4.6

17 maart — Claude Code v2.1.77 verschijnt met een aanzienlijke verhoging van de generatielimieten en verschillende kritieke bugfixes.

Model	Standaardlimiet	Maximale limiet
Claude Opus 4.6	64 000 tokens	128 000 tokens
Claude Sonnet 4.6	—	128 000 tokens

De standaardlimiet voor Opus 4.6 verdubbelt (van 32k naar 64k tokens), waardoor veel langere antwoorden mogelijk zijn zonder extra configuratie.

Nieuwe functies:

allowRead in sandboxen: nieuwe filesystem-configuratieparameter waarmee lezen opnieuw kan worden toegestaan in zones die onder een denyRead-regel vallen. Handig voor fijnmazige beveiligingsconfiguraties.
/copy N: de opdracht /copy accepteert voortaan een optionele index — /copy 2 kopieert het tweede vorige antwoord van de assistent zonder door de geschiedenis te navigeren.

Opvallende correcties:

“Always Allow” op samengestelde bash-commando’s: de regel werd opgeslagen voor de volledige keten (cd src && npm test) in plaats van per subcommando. Opgelost.
Auto-updater: startte parallelle downloads bij herhaald openen en sluiten van het venster, waardoor tientallen gigabytes aan geheugen konden worden opgehoopt. Opgelost.
--resume die de geschiedenis afkapt: een race condition tussen geheugen-extractieschrijvingen en het hoofdtranscript kon leiden tot stille truncatie. Opgelost.
Hooks PreToolUse die de regels deny omzeilen: een hook die "allow" teruggaf, omzeilde de permissieregels deny, inclusief bedrijfsbeheerde instellingen. Belangrijke beveiligingscorrectie.

🔗 CHANGELOG Claude Code

Technisch artikel: hoe het Claude Code-team Skills gebruikt

17 maart — Thariq (@trq212), ingenieur in het Claude Code-team bij Anthropic, publiceert “Lessons from Building Claude Code: How We Use Skills”, het tweede artikel in de reeks na “Seeing like an Agent” (27 februari, 3,6 miljoen views).

Het artikel documenteert hoe Skills een van de meest gebruikte uitbreidingspunten van Claude Code zijn geworden — flexibel, eenvoudig te onderhouden, en waarmee teams herbruikbare workflows rechtstreeks in hun ontwikkelomgeving kunnen definiëren. Boris Cherny (@bcherny), verantwoordelijke voor Claude Code, deelde het artikel en noemde het “Really great writeup”. De auteur kondigt ook de komende publicatie aan van een iMessage-skill als open source, als concreet voorbeeld.

“Using Skills well is a skill issue. I didn’t quite realize how much until I wrote this.”

🇳🇱 Goed gebruik van Skills is een kwestie van vaardigheid. Ik had niet beseft hoezeer totdat ik dit artikel schreef. — @trq212 op X

🔗 Publicatietweet

Codex Security: waarom geen SAST-rapport

16 maart — OpenAI publiceert een technisch artikel dat de ontwerpkeuze achter Codex Security uitlegt: waarom het systeem niet op statische analyse (SAST) steunt als vertrekpunt.

De aanpak rust op vier pijlers: contextuele lezing (het volledige codepad analyseren met de context van de repository), gerichte micro-fuzzing (het testbare fragment zo klein mogelijk maken om micro-fuzzers te schrijven), redeneren over constraints (een Python-omgeving gebruiken met z3-solver om complexe problemen te formaliseren), en sandbox-validatie (onderscheid maken tussen “dit zou een probleem kunnen zijn” en “dit is een probleem” met een gecompileerde PoC). Het artikel illustreert deze principes met CVE-2024-29041 (Express), een open redirect waarbij verkeerd gevormde URL’s allowlist-implementaties omzeilden.

🔗 Waarom Codex Security geen SAST-rapport bevat

Gemini Personal Intelligence: gratis uitbreiding in de Verenigde Staten

17 maart — Google breidt Personal Intelligence gratis uit naar meer gebruikers in de Verenigde Staten. Deze functie, tot nu toe voorbehouden aan betalende abonnees, is nu toegankelijk voor gratis accounts (free-tier) via drie oppervlakken: AI Mode in Google Search, de Gemini-app (iOS/Android) en de Gemini in Chrome-extensie.

Personal Intelligence verbindt op veilige wijze de Google-apps van de gebruiker (Gmail, Google Photos, YouTube, Search) om gepersonaliseerde antwoorden te geven. Voorbeelden: shoppingaanbevelingen afgestemd op eerdere aankopen, technische ondersteuning gericht op het exacte gekochte apparaat (gehaald uit Gmail-bonnen), gepersonaliseerde reisroutes op basis van hotelbevestigingen. De gebruiker kiest welke apps hij verbindt en kan op elk moment uitschakelen. Alleen beschikbaar voor persoonlijke Google-accounts (niet voor Workspace enterprise/onderwijs).

🔗 Google-blog – Personal Intelligence

AlphaFold Database: miljoenen nieuwe structuren van proteïnecomplexen

17 maart — Google DeepMind kondigt de uitbreiding aan van de AlphaFold Database (AFDB) met miljoenen nieuwe structuren van proteïnecomplexen, voorspeld door AI, in samenwerking met EMBL-EBI (Europees Bio-informatica Instituut), NVIDIA en de Seoul National University. De nieuwe structuren omvatten onder meer de prioritaire bacteriële pathogenen van de WHO — de gevaarlijkste en antibioticumresistente bacteriën. Deze uitbreiding gaat van het niveau van individuele eiwitten naar proteïnecomplexen (interacties tussen meerdere eiwitten), een kwalitatieve sprong voor medisch en farmaceutisch onderzoek.

🔗 Aankondiging van Pushmeet Kohli op X

xAI: Grok Text-to-Speech API en eerste plaats in video-editing

Text-to-Speech API

16 maart — xAI kondigt de beschikbaarheid aan van de Grok Text-to-Speech API, met natuurlijke en expressieve stemmen voor ontwikkelaars. LiveKit heeft deze TTS vanaf de lancering geïntegreerd in LiveKit Inference.

🔗 xAI-aankondiging op X

Grok Imagine #1 in video-editing

15 maart — Grok Imagine behaalt de eerste plaats in video-editing op de Design Arena-ranglijst, met een Elo van 1290. L’API Imagine est nu toegankelijk voor ontwikkelaars. De functie dekt het toevoegen, verwijderen en verwisselen van objecten in videoscènes.

🔗 Grok-aankondiging op X

Perplexity Computer: volledige controle over Comet en Android

Computer bestuurt Comet zonder MCP

16 maart — Computer kan nu de volledige controle over de Comet-browser overnemen om autonome taken uit te voeren: de browseragent kan elke gekoppelde site of applicatie openen, zonder connectors of MCP. Beschikbaar voor alle Computer-gebruikers op Comet.

🔗 Perplexity-tweet

Computer op Android

16 maart — Perplexity Computer is nu beschikbaar op Android, waarmee de iOS-lancering van 13 maart wordt uitgebreid naar alle mobiele platforms.

🔗 Perplexity Android-tweet

Manus: lokale desktop en Google Workspace op ontwikkelaarsniveau

Manus “My Computer” op macOS en Windows

16 maart — Manus kondigt “My Computer” aan, de kernfunctie van de nieuwe Manus Desktop-app (macOS en Windows). Tot nu toe beperkt tot een cloud-sandbox, kan Manus nu rechtstreeks op de lokale machine draaien via opdrachtregelinstructies in een lokale terminal — met expliciete goedkeuring van de gebruiker bij elke stap.

De gebruiksscenario’s bestrijken een breed spectrum: het sorteren en hernoemen van duizenden bestanden, het maken van native desktop-apps (het genoemde voorbeeld: een Mac-app voor vertaling en realtime ondertiteling, gemaakt in 20 minuten zonder Xcode te openen), of het gebruiken van de lokale GPU om machinelearningmodellen te trainen. My Computer vult de bestaande cloudconnectors (Google Calendar, Gmail) aan in plaats van ze te vervangen.

🔗 Manus-tweet · 🔗 Manus-blog

Manus beheerst Google Workspace nauwkeurig

17 maart — Manus rolt een grote update uit van zijn Google Workspace-connector, gebaseerd op de Google Workspace CLI (open-source tool van het Google-team). De vorige versie behandelde Google-bestanden als monolithische blokken; de nieuwe versie maakt granulaire acties mogelijk:

Domein	Nieuwe mogelijkheden
Google Docs	Chirurgische tekstvervangingen, antwoorden op specifieke opmerkingen
Google Sheets	Lezen over meerdere bladen heen, een specifieke cel bijwerken, tabbladen dupliceren
Google Slides	Bestaande presentaties bewerken (titel van een dia, tijdlijn bijwerken)
Google Drive	Mappen reorganiseren

De update is gratis en achterwaarts compatibel.

🔗 Manus-tweet · 🔗 Manus-blog

GitHub: `/fleet` voor bulkonderhoud en 12,5 M$ voor open source

Copilot `/fleet`: onderhoud over de volledige repositoryvloot

15 maart — GitHub demonstreert de opdracht /fleet in GitHub Copilot. Met één instructie kunnen ontwikkelaars die meerdere repositories beheren repetitieve onderhoudstaken delegeren (configuratie-updates, afhankelijkheidsfixes) aan de agent over hun volledige vloot, in plaats van repository per repository.

🔗 GitHub-tweet

12,5 M$ voor open-sourcebeveiliging

17 maart — GitHub, Anthropic, AWS, Google en OpenAI bundelen hun krachten in een collectieve toezegging van 12,5 miljoen dollar ten gunste van Alpha-Omega, het programma van de Linux Foundation dat zich richt op het beveiligen van het open-source-ecosysteem.

Belangrijkste punten aan GitHub-kant: 280.000+ maintainers op honderden miljoenen publieke repositories komen in aanmerking voor gratis toegang tot GitHub Copilot Pro. GitHub steekt ook 5,5 M$ aan Azure-credits in training. Het GitHub Secure Open Source Fund, dat al 138 projecten heeft ondersteund, opent zijn vierde ronde eind april 2026.

De context is betekenisvol: AI heeft het ontdekken van kwetsbaarheden aanzienlijk versneld, wat de werkdruk voor maintainers verhoogt. Het uitgesproken doel is dat AI die last vermindert in plaats van vergroot.

🔗 GitHub-blogartikel 🔗 Linux Foundation-aankondiging

Z.ai GLM-5-Turbo: hoge snelheid voor agentomgevingen

15 maart — Z.ai lanceert GLM-5-Turbo, een snelle variant van GLM-5 die is geoptimaliseerd voor agentomgevingen (met name OpenClaw). Diezelfde dag worden de gebruikslimieten verdrievoudigd voor abonnees van het GLM Coding Plan. Beschikbaar op OpenRouter en via de directe API.

🔗 Z.ai-aankondiging op X

Kimi publiceert paper over Attention Residuals

16-17 maart — Moonshot AI publiceert een onderzoeks-paper over Attention Residuals op arXiv: een nieuwe aanpak voor diepe aggregatie die standaard residuale verbindingen vervangt door een recursie geïnspireerd door de tijd/diepte-dualiteit (depth-wise aggregation). De analyse toont aan dat deze aanpak op natuurlijke wijze problemen met de groei van de magnitude van hidden states dempt. Elon Musk reageerde met “Impressive work from Kimi” op de aankondigingstweet (4,5 miljoen weergaven).

🔗 Kimi-tweet · 🔗 arXiv 2603.15031

ElevenLabs × Deloitte: omnichannel agents voor bedrijven

14 maart — ElevenLabs en Deloitte kondigen een strategisch partnerschap aan dat het ElevenLabs Agents-platform combineert met de sectorspecifieke expertise van Deloitte, om grote ondernemingen te helpen bij het inzetten van omnichannel conversationele agents. Het partnerschap richt zich op gereguleerde bedrijven (financiën, gezondheidszorg, overheidsdiensten). Deloitte levert de businessintegratie, ElevenLabs de AI-audio-infrastructuur (stem, transcriptie, agents).

🔗 ElevenLabs-blog

Kort nieuws

Tongyi Fun-CineForge (Alibaba, 16 maart) — Tongyi Lab maakt Fun-CineForge open source, een AI-cinematisch nasynchronisatiesysteem dat de kwaliteit van professionele cinema benadert. Beschikbaar op GitHub, HuggingFace en ModelScope. 🔗 Aankondiging op X

Wat dit betekent

De NVIDIA GTC 2026 kristalliseert een belangrijke dynamiek: meerdere toonaangevende AI-labs (Mistral, Perplexity, Cohere) stemmen hun infrastructuur af op NVIDIA om samen open frontier-modellen of soevereine deployments te ontwikkelen. Deze convergentie rond een open coalitie contrasteert met de recente fragmentatieperiode — en geeft aan dat grootschalige pretraining te kostbaar is geworden om geïsoleerd aan te pakken.

GPT-5.4 mini bevestigt een sterke trend: modellen in klein formaat zijn niet langer uitgeklede versies maar competitieve alternatieven. Met 54,4% op SWE-Bench Pro tegenover 57,7% voor het volledige model, en een 19x lagere kostprijs, herdefinieert GPT-5.4 mini de verhouding tussen prestaties en prijs voor codering-workflows.

De dag van 17 maart illustreert ook de opmars van lokale en desktopagents: Manus “My Computer” verlaat de cloud om toegang te krijgen tot de lokale machine, Perplexity Computer neemt Comet over zonder MCP, en Claude Code verdubbelt zijn standaard generatievenster voor Opus 4.6. Het tijdperk van de agent die alleen suggesties doet, maakt plaats voor dat van de agent die uitvoert.

Bronnen

Dit document is vertaald van de fr-versie naar de taal nl met behulp van het model gpt-5.4-mini. Voor meer informatie over het vertaalproces, raadpleeg https://gitlab.com/jls42/ai-powered-markdown-translator