17 maart 2026 staat in het teken van GTC NVIDIA en verschillende belangrijke lanceringen. OpenAI brengt GPT-5.4 mini en nano uit, zijn tot nu toe meest capabele compacte modellen, die op verschillende benchmarks dicht in de buurt komen van het volledige model. De NVIDIA Nemotron Coalition wordt groter met de toetreding van Mistral AI en Perplexity. Perplexity opent tegelijk Comet Enterprise met volledige MDM-governance, Claude Code v2.1.77 verdubbelt de generatielimiet voor Opus 4.6, en GitHub, Anthropic, Google en OpenAI bundelen hun krachten om open source-beveiliging te financieren voor 12,5 miljoen dollar.
GPT-5.4 mini en nano: de compacte modellen van OpenAI
17 maart — OpenAI lanceert GPT-5.4 mini en GPT-5.4 nano, zijn best presterende compacte modellen tot nu toe. Deze twee varianten brengen de mogelijkheden van GPT-5.4 in formaten die geoptimaliseerd zijn voor workloads met groot volume, met lagere latentie en lagere kosten.
GPT-5.4 mini verbetert GPT-5 mini aanzienlijk op code, redeneren, multimodaal begrip en toolgebruik, terwijl het meer dan twee keer zo snel draait. Het benadert de prestaties van het volledige GPT-5.4-model op verschillende belangrijke evaluaties, waaronder SWE-Bench Pro en OSWorld-Verified.
GPT-5.4 nano is de kleinste en goedkoopste versie van de GPT-5.4-familie, ontworpen voor taken waar snelheid en kosten voorop staan: classificatie, data-extractie, rangschikking en eenvoudige code-subagents.
| Evaluatie | GPT-5.4 | GPT-5.4 mini | GPT-5.4 nano | GPT-5 mini |
|---|---|---|---|---|
| SWE-Bench Pro (public) | 57,7 % | 54,4 % | 52,4 % | 45,7 % |
| Terminal-Bench 2.0 | 75,1 % | 60,0 % | 46,3 % | 38,2 % |
| Toolathlon | 54,6 % | 42,9 % | 35,5 % | 26,9 % |
| GPQA Diamond | 93,0 % | 88,0 % | 82,8 % | 81,6 % |
| OSWorld-Verified | 75,0 % | 72,1 % | 39,0 % | 42,0 % |
De use-cases zijn onder te verdelen in drie categorieën: code-assistenten (GPT-5.4 mini blinkt uit in snelle coding-workflows, debugloops, frontendgeneratie), subagents (in Codex kan GPT-5.4 subtaken delegeren aan GPT-5.4 mini met slechts 30 % van het GPT-5.4-quota), en interfacebesturing (computer use), waarbij GPT-5.4 mini snel dense UI-screenshots interpreteert.
| Model | Beschikbaarheid | Invoerprijs | Uitvoerprijs | Context |
|---|---|---|---|---|
| GPT-5.4 mini | API, Codex, ChatGPT Free/Go | 0,75 $/miljoen tokens | 4,50 $/miljoen tokens | 400 000 tokens |
| GPT-5.4 nano | Alleen API | 0,20 $/miljoen tokens | 1,25 $/miljoen tokens | — |
In ChatGPT is GPT-5.4 mini toegankelijk voor Free- en Go-gebruikers via de “Thinking”-functie in het + menu. Voor betaalde abonnementen dient het als fallbackmodel wanneer GPT-5.4 Thinking zijn rate limit bereikt.
🔗 Introducing GPT-5.4 mini and nano
NVIDIA GTC 2026: de Nemotron Coalition en Dynamo 1.0
De NVIDIA GTC-conferentie, die op 16 maart van start ging, was de katalysator voor verschillende belangrijke aankondigingen in de sector: de vorming van een open coalitie rond frontier open source-modellen, de productie-release van een inference operating system, en de aankondiging van een data-blueprint voor physical AI.
Mistral sluit zich aan bij de NVIDIA Nemotron Coalition
16 maart — Mistral AI kondigt een strategisch partnerschap met NVIDIA aan om frontier open source-AI-modellen mee te ontwikkelen. Mistral wordt oprichtend lid van de NVIDIA Nemotron Coalition, en combineert zijn frontier-architectuur met NVIDIA-rekeninfrastructuur en ontwikkeltools.
| Aspect | Detail |
|---|---|
| Rol van Mistral | Oprichend lid, frontier-architectuur + full-stack AI-aanbod |
| Bijdrage van NVIDIA | GPU-infrastructuur + ontwikkeltools |
| Doel | Open frontier-modellen van topniveau mee ontwikkelen |
Perplexity sluit zich ook aan bij de coalitie
16 maart — Perplexity kondigt zijn toetreding tot dezelfde NVIDIA Nemotron Coalition aan. Belangrijkste punten: Perplexity verfijnt verschillende open modellen voor elke stap van zijn antwoordpipeline (queryanalyse, redeneren, eindantwoord). Het model Nemotron 3 Super (120 miljard parameters, MoE-architectuur) is nu beschikbaar in de zoekbalk van Perplexity, de Agent API en Perplexity Computer.
🔗 Perplexity-blog – Nemotron Coalition 🔗 NVIDIA-aankondiging
Dynamo 1.0: het inference operating system gaat in productie
16 maart — NVIDIA kondigt op GTC de productie-invoering aan van Dynamo 1.0, gepresenteerd als het “inference operating system” voor AI factories. Dynamo verhoogt de inferenceprestaties op Blackwell GPU’s tot 7x ten opzichte van niet-geoptimaliseerde deployments. De overstap naar v1.0 markeert de overgang van experimentele fase naar industriële productie.
🔗 NVIDIA-aankondiging Dynamo 1.0
Physical AI Data Factory Blueprint
16 maart — NVIDIA onthult de Physical AI Data Factory Blueprint: een referentiearchitectuur om accelerated computing om te zetten in hoogwaardige trainingsdata voor robotica, AI vision agents en autonome voertuigen. Deze blueprint stelt bedrijven in staat om synthetisch trainingsdata voor physical AI op grote schaal te genereren.
🔗 NVIDIA Physical AI-aankondiging
Cohere + NVIDIA: soevereine AI op DGX Spark
16 maart — Cohere en NVIDIA werken samen aan een soevereine, veilige en efficiënte AI, eveneens aangekondigd op GTC. Twee hoofdsporen: NVIDIA ecosystem-native modellen (aangepaste modellen geoptimaliseerd voor de nieuwste NVIDIA-architectuur, gericht op gespecialiseerde enterprise-workloads) en North op DGX Spark (het agentische North-platform van Cohere komt beschikbaar op NVIDIA DGX Spark, lokaal en met lage latentie voor gevoelige data). Doelsectoren zijn financiën, gezondheidszorg en de publieke sector.
🔗 Cohere-blog – soevereine NVIDIA-AI
Perplexity Comet Enterprise: MDM-governance en CrowdStrike-integratie
17 maart — Perplexity lanceert Comet Enterprise voor alle Enterprise-abonnees. De AI-browser gaat over naar een enterprise-versie met volledige governance voor uitrol.
| Functionaliteit | Beschrijving |
|---|---|
| MDM-uitrol | Stille installateur, uitrol op duizenden machines, auditlogs |
| Granulaire telemetrie | Tracking per gebruiker |
| CrowdStrike Falcon | Bescherming tegen phishing, detectie van exfiltratie (screenshots, downloads) |
| Realtime-interventie | Mogelijk via de CrowdStrike-integratie |
| Privacy | Perplexity traint zijn modellen nooit op enterprise-data |
Onder de eerste gebruikers bevinden zich bedrijven uit de Fortune-ranglijst, AWS, AlixPartners, Gunderson Dettmer en Bessemer Venture Partners. De gedocumenteerde use-cases omvatten voorbereiding van klantvergaderingen (real-time nieuws), analyse van SOW-contracten, financiële berekeningen en sectorspecifiek onderzoek.
🔗 Perplexity-blog – Comet Enterprise
Claude Code v2.1.77: standaard 64k tokens voor Opus 4.6
17 maart — Claude Code v2.1.77 verschijnt met een aanzienlijke verhoging van de generatielimieten en verschillende kritieke bugfixes.
| Model | Standaardlimiet | Maximale limiet |
|---|---|---|
| Claude Opus 4.6 | 64 000 tokens | 128 000 tokens |
| Claude Sonnet 4.6 | — | 128 000 tokens |
De standaardlimiet voor Opus 4.6 verdubbelt (van 32k naar 64k tokens), waardoor veel langere antwoorden mogelijk zijn zonder extra configuratie.
Nieuwe functies:
allowReadin sandboxen: nieuwe filesystem-configuratieparameter waarmee lezen opnieuw kan worden toegestaan in zones die onder eendenyRead-regel vallen. Handig voor fijnmazige beveiligingsconfiguraties./copy N: de opdracht/copyaccepteert voortaan een optionele index —/copy 2kopieert het tweede vorige antwoord van de assistent zonder door de geschiedenis te navigeren.
Opvallende correcties:
- “Always Allow” op samengestelde bash-commando’s: de regel werd opgeslagen voor de volledige keten (
cd src && npm test) in plaats van per subcommando. Opgelost. - Auto-updater: startte parallelle downloads bij herhaald openen en sluiten van het venster, waardoor tientallen gigabytes aan geheugen konden worden opgehoopt. Opgelost.
--resumedie de geschiedenis afkapt: een race condition tussen geheugen-extractieschrijvingen en het hoofdtranscript kon leiden tot stille truncatie. Opgelost.- Hooks
PreToolUsedie de regelsdenyomzeilen: een hook die"allow"teruggaf, omzeilde de permissieregelsdeny, inclusief bedrijfsbeheerde instellingen. Belangrijke beveiligingscorrectie.
Technisch artikel: hoe het Claude Code-team Skills gebruikt
17 maart — Thariq (@trq212), ingenieur in het Claude Code-team bij Anthropic, publiceert “Lessons from Building Claude Code: How We Use Skills”, het tweede artikel in de reeks na “Seeing like an Agent” (27 februari, 3,6 miljoen views).
Het artikel documenteert hoe Skills een van de meest gebruikte uitbreidingspunten van Claude Code zijn geworden — flexibel, eenvoudig te onderhouden, en waarmee teams herbruikbare workflows rechtstreeks in hun ontwikkelomgeving kunnen definiëren. Boris Cherny (@bcherny), verantwoordelijke voor Claude Code, deelde het artikel en noemde het “Really great writeup”. De auteur kondigt ook de komende publicatie aan van een iMessage-skill als open source, als concreet voorbeeld.
“Using Skills well is a skill issue. I didn’t quite realize how much until I wrote this.”
🇳🇱 Goed gebruik van Skills is een kwestie van vaardigheid. Ik had niet beseft hoezeer totdat ik dit artikel schreef. — @trq212 op X
Codex Security: waarom geen SAST-rapport
16 maart — OpenAI publiceert een technisch artikel dat de ontwerpkeuze achter Codex Security uitlegt: waarom het systeem niet op statische analyse (SAST) steunt als vertrekpunt.
De aanpak rust op vier pijlers: contextuele lezing (het volledige codepad analyseren met de context van de repository), gerichte micro-fuzzing (het testbare fragment zo klein mogelijk maken om micro-fuzzers te schrijven), redeneren over constraints (een Python-omgeving gebruiken met z3-solver om complexe problemen te formaliseren), en sandbox-validatie (onderscheid maken tussen “dit zou een probleem kunnen zijn” en “dit is een probleem” met een gecompileerde PoC). Het artikel illustreert deze principes met CVE-2024-29041 (Express), een open redirect waarbij verkeerd gevormde URL’s allowlist-implementaties omzeilden.
🔗 Waarom Codex Security geen SAST-rapport bevat
Gemini Personal Intelligence: gratis uitbreiding in de Verenigde Staten
17 maart — Google breidt Personal Intelligence gratis uit naar meer gebruikers in de Verenigde Staten. Deze functie, tot nu toe voorbehouden aan betalende abonnees, is nu toegankelijk voor gratis accounts (free-tier) via drie oppervlakken: AI Mode in Google Search, de Gemini-app (iOS/Android) en de Gemini in Chrome-extensie.
Personal Intelligence verbindt op veilige wijze de Google-apps van de gebruiker (Gmail, Google Photos, YouTube, Search) om gepersonaliseerde antwoorden te geven. Voorbeelden: shoppingaanbevelingen afgestemd op eerdere aankopen, technische ondersteuning gericht op het exacte gekochte apparaat (gehaald uit Gmail-bonnen), gepersonaliseerde reisroutes op basis van hotelbevestigingen. De gebruiker kiest welke apps hij verbindt en kan op elk moment uitschakelen. Alleen beschikbaar voor persoonlijke Google-accounts (niet voor Workspace enterprise/onderwijs).
🔗 Google-blog – Personal Intelligence
AlphaFold Database: miljoenen nieuwe structuren van proteïnecomplexen
17 maart — Google DeepMind kondigt de uitbreiding aan van de AlphaFold Database (AFDB) met miljoenen nieuwe structuren van proteïnecomplexen, voorspeld door AI, in samenwerking met EMBL-EBI (Europees Bio-informatica Instituut), NVIDIA en de Seoul National University. De nieuwe structuren omvatten onder meer de prioritaire bacteriële pathogenen van de WHO — de gevaarlijkste en antibioticumresistente bacteriën. Deze uitbreiding gaat van het niveau van individuele eiwitten naar proteïnecomplexen (interacties tussen meerdere eiwitten), een kwalitatieve sprong voor medisch en farmaceutisch onderzoek.
🔗 Aankondiging van Pushmeet Kohli op X
xAI: Grok Text-to-Speech API en eerste plaats in video-editing
Text-to-Speech API
16 maart — xAI kondigt de beschikbaarheid aan van de Grok Text-to-Speech API, met natuurlijke en expressieve stemmen voor ontwikkelaars. LiveKit heeft deze TTS vanaf de lancering geïntegreerd in LiveKit Inference.
Grok Imagine #1 in video-editing
15 maart — Grok Imagine behaalt de eerste plaats in video-editing op de Design Arena-ranglijst, met een Elo van 1290. L’API Imagine est nu toegankelijk voor ontwikkelaars. De functie dekt het toevoegen, verwijderen en verwisselen van objecten in videoscènes.
Perplexity Computer: volledige controle over Comet en Android
Computer bestuurt Comet zonder MCP
16 maart — Computer kan nu de volledige controle over de Comet-browser overnemen om autonome taken uit te voeren: de browseragent kan elke gekoppelde site of applicatie openen, zonder connectors of MCP. Beschikbaar voor alle Computer-gebruikers op Comet.
Computer op Android
16 maart — Perplexity Computer is nu beschikbaar op Android, waarmee de iOS-lancering van 13 maart wordt uitgebreid naar alle mobiele platforms.
Manus: lokale desktop en Google Workspace op ontwikkelaarsniveau
Manus “My Computer” op macOS en Windows
16 maart — Manus kondigt “My Computer” aan, de kernfunctie van de nieuwe Manus Desktop-app (macOS en Windows). Tot nu toe beperkt tot een cloud-sandbox, kan Manus nu rechtstreeks op de lokale machine draaien via opdrachtregelinstructies in een lokale terminal — met expliciete goedkeuring van de gebruiker bij elke stap.
De gebruiksscenario’s bestrijken een breed spectrum: het sorteren en hernoemen van duizenden bestanden, het maken van native desktop-apps (het genoemde voorbeeld: een Mac-app voor vertaling en realtime ondertiteling, gemaakt in 20 minuten zonder Xcode te openen), of het gebruiken van de lokale GPU om machinelearningmodellen te trainen. My Computer vult de bestaande cloudconnectors (Google Calendar, Gmail) aan in plaats van ze te vervangen.
🔗 Manus-tweet · 🔗 Manus-blog
Manus beheerst Google Workspace nauwkeurig
17 maart — Manus rolt een grote update uit van zijn Google Workspace-connector, gebaseerd op de Google Workspace CLI (open-source tool van het Google-team). De vorige versie behandelde Google-bestanden als monolithische blokken; de nieuwe versie maakt granulaire acties mogelijk:
| Domein | Nieuwe mogelijkheden |
|---|---|
| Google Docs | Chirurgische tekstvervangingen, antwoorden op specifieke opmerkingen |
| Google Sheets | Lezen over meerdere bladen heen, een specifieke cel bijwerken, tabbladen dupliceren |
| Google Slides | Bestaande presentaties bewerken (titel van een dia, tijdlijn bijwerken) |
| Google Drive | Mappen reorganiseren |
De update is gratis en achterwaarts compatibel.
🔗 Manus-tweet · 🔗 Manus-blog
GitHub: /fleet voor bulkonderhoud en 12,5 M$ voor open source
Copilot /fleet: onderhoud over de volledige repositoryvloot
15 maart — GitHub demonstreert de opdracht /fleet in GitHub Copilot. Met één instructie kunnen ontwikkelaars die meerdere repositories beheren repetitieve onderhoudstaken delegeren (configuratie-updates, afhankelijkheidsfixes) aan de agent over hun volledige vloot, in plaats van repository per repository.
12,5 M$ voor open-sourcebeveiliging
17 maart — GitHub, Anthropic, AWS, Google en OpenAI bundelen hun krachten in een collectieve toezegging van 12,5 miljoen dollar ten gunste van Alpha-Omega, het programma van de Linux Foundation dat zich richt op het beveiligen van het open-source-ecosysteem.
Belangrijkste punten aan GitHub-kant: 280.000+ maintainers op honderden miljoenen publieke repositories komen in aanmerking voor gratis toegang tot GitHub Copilot Pro. GitHub steekt ook 5,5 M$ aan Azure-credits in training. Het GitHub Secure Open Source Fund, dat al 138 projecten heeft ondersteund, opent zijn vierde ronde eind april 2026.
De context is betekenisvol: AI heeft het ontdekken van kwetsbaarheden aanzienlijk versneld, wat de werkdruk voor maintainers verhoogt. Het uitgesproken doel is dat AI die last vermindert in plaats van vergroot.
🔗 GitHub-blogartikel 🔗 Linux Foundation-aankondiging
Z.ai GLM-5-Turbo: hoge snelheid voor agentomgevingen
15 maart — Z.ai lanceert GLM-5-Turbo, een snelle variant van GLM-5 die is geoptimaliseerd voor agentomgevingen (met name OpenClaw). Diezelfde dag worden de gebruikslimieten verdrievoudigd voor abonnees van het GLM Coding Plan. Beschikbaar op OpenRouter en via de directe API.
Kimi publiceert paper over Attention Residuals
16-17 maart — Moonshot AI publiceert een onderzoeks-paper over Attention Residuals op arXiv: een nieuwe aanpak voor diepe aggregatie die standaard residuale verbindingen vervangt door een recursie geïnspireerd door de tijd/diepte-dualiteit (depth-wise aggregation). De analyse toont aan dat deze aanpak op natuurlijke wijze problemen met de groei van de magnitude van hidden states dempt. Elon Musk reageerde met “Impressive work from Kimi” op de aankondigingstweet (4,5 miljoen weergaven).
🔗 Kimi-tweet · 🔗 arXiv 2603.15031
ElevenLabs × Deloitte: omnichannel agents voor bedrijven
14 maart — ElevenLabs en Deloitte kondigen een strategisch partnerschap aan dat het ElevenLabs Agents-platform combineert met de sectorspecifieke expertise van Deloitte, om grote ondernemingen te helpen bij het inzetten van omnichannel conversationele agents. Het partnerschap richt zich op gereguleerde bedrijven (financiën, gezondheidszorg, overheidsdiensten). Deloitte levert de businessintegratie, ElevenLabs de AI-audio-infrastructuur (stem, transcriptie, agents).
Kort nieuws
Tongyi Fun-CineForge (Alibaba, 16 maart) — Tongyi Lab maakt Fun-CineForge open source, een AI-cinematisch nasynchronisatiesysteem dat de kwaliteit van professionele cinema benadert. Beschikbaar op GitHub, HuggingFace en ModelScope. 🔗 Aankondiging op X
Wat dit betekent
De NVIDIA GTC 2026 kristalliseert een belangrijke dynamiek: meerdere toonaangevende AI-labs (Mistral, Perplexity, Cohere) stemmen hun infrastructuur af op NVIDIA om samen open frontier-modellen of soevereine deployments te ontwikkelen. Deze convergentie rond een open coalitie contrasteert met de recente fragmentatieperiode — en geeft aan dat grootschalige pretraining te kostbaar is geworden om geïsoleerd aan te pakken.
GPT-5.4 mini bevestigt een sterke trend: modellen in klein formaat zijn niet langer uitgeklede versies maar competitieve alternatieven. Met 54,4% op SWE-Bench Pro tegenover 57,7% voor het volledige model, en een 19x lagere kostprijs, herdefinieert GPT-5.4 mini de verhouding tussen prestaties en prijs voor codering-workflows.
De dag van 17 maart illustreert ook de opmars van lokale en desktopagents: Manus “My Computer” verlaat de cloud om toegang te krijgen tot de lokale machine, Perplexity Computer neemt Comet over zonder MCP, en Claude Code verdubbelt zijn standaard generatievenster voor Opus 4.6. Het tijdperk van de agent die alleen suggesties doet, maakt plaats voor dat van de agent die uitvoert.
Bronnen
- GPT-5.4 mini en nano introduceren – OpenAI
- Waarom Codex Security geen SAST-rapport bevat – OpenAI
- Mistral × NVIDIA – X-aankondiging
- Perplexity sluit zich aan bij de NVIDIA Nemotron Coalition
- NVIDIA Nemotron Coalition
- NVIDIA Dynamo 1.0 – X
- NVIDIA Physical AI Data Factory Blueprint – X
- Cohere + NVIDIA soevereine AI
- Perplexity Comet Enterprise
- CHANGELOG Claude Code v2.1.77
- Thariq – Skills-artikel
- Google Personal Intelligence-uitbreiding
- Uitbreiding van AlphaFold Database – X
- xAI TTS API – X
- Grok Imagine #1 Design Arena – X
- Perplexity Computer bestuurt Comet – X
- Perplexity Computer Android – X
- Manus My Computer
- Manus Google Workspace CLI
- GitHub Copilot /fleet – X
- GitHub + Alpha-Omega 12,5 M$
- Linux Foundation – open-sourceveiligheidsfonds
- Z.ai GLM-5-Turbo – X
- Kimi Attention Residuals – X
- Kimi Attention Residuals – arXiv
- ElevenLabs × Deloitte
- Tongyi Fun-CineForge – X
Dit document is vertaald van de fr-versie naar de taal nl met behulp van het model gpt-5.4-mini. Voor meer informatie over het vertaalproces, raadpleeg https://gitlab.com/jls42/ai-powered-markdown-translator