Claude Code auto mode, visueel shoppen in ChatGPT, Grok Imagine multi-images naar video

Een drukke periode op 23 en 24 maart: Anthropic rolt auto mode uit in Claude Code — een actiesclassifier die de goedkeuringsbeslissingen namens de gebruiker neemt — en publiceert een engineeringartikel over zijn multi-agentarchitectuur, geïnspireerd door GAN’s. OpenAI lanceert visueel shoppen in ChatGPT met het Agentic Commerce Protocol, terwijl xAI Grok Imagine openstelt voor multi-image-video op API. GitHub Copilot, Google DeepMind en de Anthropic Science Blog maken dit overzicht compleet.

Claude Code: auto mode, een classifier tussen jou en de opdrachten

24 maart — Claude Code voegt een derde rechtenniveau toe: auto mode. Tot nu toe bood de tool ofwel handmatige goedkeuring voor elke bestandswijziging en bash-opdracht, ofwel het volledig uitschakelen van controles. Auto mode introduceert een middenweg: Claude neemt zelf de beslissingen, afgeschermd door een classifier die elke actie vóór uitvoering analyseert.

Het mechanisme is eenvoudig — vóór elke toolaanroep beoordeelt de classifier of de actie mogelijk destructief is. Acties die als veilig worden beschouwd, worden automatisch uitgevoerd. Risicovolle acties worden geblokkeerd, en Claude zoekt een alternatief zonder de gebruiker te onderbreken.

Anthropic geeft aan dat deze modus de risico’s verkleint zonder ze volledig uit te bannen, en raadt aan deze te gebruiken in geïsoleerde omgevingen. Om het te activeren: claude --enable-auto-mode, en vervolgens naar deze modus navigeren met Shift+Tab.

De functie is beschikbaar als research preview op het Team-plan. De uitrol voor Enterprise en API werd voor de daaropvolgende dagen aangekondigd.

New in Claude Code: auto mode. Instead of approving every file write and bash command, or skipping permissions entirely, auto mode lets Claude make permission decisions on your behalf. Safeguards check each action before it runs.

🇳🇱 Nieuw in Claude Code: auto mode. In plaats van elke bestandswijziging en elke bash-opdracht goed te keuren, of permissies volledig over te slaan, laat auto mode Claude de goedkeuringsbeslissingen namens jou nemen. Waarborgen controleren elke actie voordat die wordt uitgevoerd. — @claudeai op X

🔗 Aankondiging op X

Multi-agentarchitectuur: de GAN-aanpak van Anthropic Engineering

24 maart — In een artikel op de Anthropic Engineering Blog beschrijft Prithvi Rajasekaran (Labs-team) een multi-agentarchitectuur om de grenzen van Claude te verleggen op twee domeinen: interfaceontwerp en autonome applicatieontwikkeling op lange termijn.

De aanpak is geïnspireerd op generatieve adversariële netwerken (Generative Adversarial Networks, GAN): een genererende agent produceert de code of het ontwerp, terwijl een afzonderlijke beoordelende agent het resultaat evalueert en kritische feedback geeft. Deze scheiding pakt een bekend probleem aan — Claude heeft de neiging zichzelf te toegeeflijk te beoordelen. Een toegewijde beoordelaar, die geleidelijk met voorbeelden wordt gekalibreerd, wordt zo een effectieve hefboom voor verbetering.

Voor frontendontwerp krijgt de beoordelaar toegang tot MCP Playwright om live door pagina’s te navigeren. Er worden vier criteria gebruikt: kwaliteit en coherentie van het ontwerp, originaliteit (met straf voor generieke patronen, de zogenaamde “AI slop”), technische afwerking en functionaliteit. In 10 tot 15 iteraties produceert de generator duidelijk onderscheidendere interfaces.

Voor applicatieontwikkeling voegt de architectuur een planner toe: die zet een prompt van één zin om in een volledige productspecificatie. Generator en beoordelaar onderhandelen vóór elke implementatie over “sprintcontracten”, waarin succescriteria worden vastgelegd. De beoordelaar test de applicatie via Playwright en kan een sprint laten mislukken, waardoor een herziening wordt afgedwongen.

Aanpak	Duur	Kosten	Resultaat
Solo-agent Opus 4.5	20 min	9 $	Kapotte applicatie
Volledige harness	6 uur	200 $	Functionele applicatie
Harness met Opus 4.6	4 uur	124,70 $	Functionele applicatie + geïntegreerde Claude-agent

Met Opus 4.6 — dat niet langer last heeft van “contextangst” — kon de auteur de architectuur vereenvoudigen, sessieresets verwijderen en de kosten verlagen. Het leidende principe blijft: audit de harness regelmatig om weg te halen wat het model inmiddels zelf kan doen.

🔗 Volledig artikel 🔗 Aankondiging op X

Computer Use in Cowork en Claude Code (macOS, Pro/Max)

23 maart — Claude kan nu je computer gebruiken om taken direct uit te voeren. In preview is deze functie beschikbaar in Claude Cowork en Claude Code, alleen op macOS.

Claude kan apps openen, door de browser navigeren en spreadsheets invullen. Het idee: een taak vanaf je telefoon toevertrouwen, iets anders gaan doen en terugkomen bij een afgeronde taak. Het is ook mogelijk om terugkerende taken in te stellen — elke ochtend e-mails scannen, elke vrijdag een rapport genereren.

De functie Computer Use is beschikbaar op de Pro- en Max-plannen, door de desktopapp bij te werken en te koppelen aan de mobiele app.

🔗 Aankondiging op X 🔗 Productpagina Cowork

Anthropic Economic Index: “Learning curves” (5e rapport)

24 maart — Anthropic publiceert zijn vijfde rapport van de Anthropic Economic Index, met als titel “Learning curves”, gebaseerd op gebruiksgegevens van Claude in februari 2026 (ongeveer 1 miljoen gesprekken, van 5 tot 12 februari).

Het rapport documenteert twee belangrijke evoluties sinds november 2025. Eerst een diversificatie van het gebruik: de tien meest voorkomende taken op Claude.ai vertegenwoordigen nog maar 19% van het verkeer, tegenover 24% drie maanden eerder. Deze trend wordt deels verklaard door de migratie van coderingstaken naar de API, aangedreven door de groei van Claude Code.

Daarna het effect van de “leercurve”: gebruikers op lange termijn (meer dan zes maanden) hebben een 4 tot 5 procentpunten hoger succespercentage. Ze werken aan complexere problemen, werken meer samen en delegeren minder in automatische modus. De auteurs zien hierin een signaal van leren door te doen (learning-by-doing), al blijft een survivorship-bias mogelijk.

Wat de modelkeuze betreft, bevestigen de gegevens dat gebruikers Opus verkiezen voor taken met hoge waarde: elke extra schijf van $10/uur in de geschatte waarde van een taak gaat gepaard met een stijging van 1,5 punt in het aandeel van Opus-gebruik op Claude.ai, en van 2,8 punten op de API.

🔗 Volledig rapport 🔗 Aankondiging op X

Anthropic Science Blog: een nieuwe blog voor AI in wetenschappelijk onderzoek

23 maart — Anthropic lanceert de Anthropic Science Blog, gewijd aan de kruising tussen AI en wetenschappelijk onderzoek. Het doel is te documenteren hoe AI het werk van onderzoekers versnelt en de vragen te verkennen die deze transformatie oproept.

De blog publiceert drie soorten content: achtergrondartikelen over specifieke resultaten met een gedetailleerde rol van AI (Features), praktische gidsen per wetenschappelijk domein (Workflows), en actualiteitsoverzichten van het vakgebied (Field notes).

Twee inaugurale artikelen begeleiden deze lancering: “Vibe physics: The AI grad student” van Matthew Schwartz (een natuurkundige die wordt begeleid door Claude bij een echte berekening), en een tutorial over de orchestratie van Claude Code voor wetenschappelijke taken van meerdere dagen.

Deze blog is verankerd in de bestaande initiatieven van Anthropic: het AI for Science-programma (API-credits voor onderzoekers), Claude for Life Sciences (samenwerkingen met farmaceutica en biotech), en de Genesis Mission.

🔗 Lanceringartikel 🔗 Aankondiging op X

Visueel shoppen in ChatGPT en Agentic Commerce Protocol

24 maart — OpenAI lanceert een visuele en meeslepende winkelervaring rechtstreeks in ChatGPT. Gebruikers kunnen producten visueel bekijken, ze naast elkaar vergelijken met details (prijs, reviews, kenmerken), en hun zoekopdracht verder verfijnen in gesprek — zonder ChatGPT te verlaten. Het is ook mogelijk een inspiratiefoto te uploaden om vergelijkbare artikelen te vinden.

Om deze functie mogelijk te maken, breidt OpenAI het Agentic Commerce Protocol (ACP) uit naar productontdekking. Dit protocol wordt de verbindingslaag tussen verkopers en gebruikers: verkopers delen hun catalogi via ACP, en de gegevens komen rechtstreeks in ChatGPT terecht. Salesforce en Stripe zijn al geïntegreerd als externe providers.

Detail	Info
Beschikbaarheid	Alle Free-, Go-, Plus- en Pro-gebruikers — uitrol deze week
Afbeeldingen uploaden	Inspiratiefoto om vergelijkbare artikelen te vinden
Geïntegreerde verkopers	Target, Sephora, Nordstrom, Lowe’s, Best Buy, The Home Depot, Wayfair
Shopify	Catalogi al geïntegreerd zonder actie van verkopers

Walmart is de eerste verkoper die een native ChatGPT-app aanbiedt: van ontdekking in ChatGPT tot een Walmart-omgeving met accountkoppeling, loyaliteitsprogramma en betalingen. Beschikbaar in de webbrowser, iOS en binnenkort Android. Let op: OpenAI laat zijn oorspronkelijke functie “Instant Checkout” varen, omdat die onvoldoende flexibel werd geacht voor verkopers, en richt zich op ontdekking.

🔗 Officiële aankondiging

OpenAI: veiligheidsbeleid voor tieners open source

24 maart — OpenAI publiceert een reeks open-source veiligheidsbeleiden om ontwikkelaars te helpen ervaringen te bouwen die geschikt zijn voor tieners. Deze beleidsregels worden geleverd als prompts die rechtstreeks bruikbaar zijn met gpt-oss-safeguard, het open-weight veiligheidsmodel van OpenAI.

Doel: ontwikkelaars in staat stellen om abstracte veiligheidsdoelen te vertalen naar precieze operationele regels. Zes domeinen worden behandeld:

Domein	Beschrijving
Grafische gewelddadige content	Filtering van expliciet geweld
Grafische seksuele content	Filtering van expliciete seksualiteit
Gevaarlijke lichaamsidealen	Eetstoornissen, risicogedrag
Gevaarlijke activiteiten en uitdagingen	Risicovolle virale challenges
Romantische of gewelddadige rollenspellen	Ongepaste interacties
Goederen en diensten voor volwassenen	Alcohol, tabak, gokken

Deze beleidsregels zijn ontwikkeld met Common Sense Media en everyone.ai. Gepubliceerd via de ROOST Model Community (RMC GitHub), worden ze expliciet gepresenteerd als startpunt, niet als een complete oplossing.

🔗 Officiële aankondiging

OpenAI Foundation: minstens 1 miljard dollar uitgezet

24 maart — Bret Taylor, voorzitter van de raad van bestuur van de OpenAI Foundation, kondigt aan dat de stichting begint met het uitzetten van de middelen uit de herkapitalisatie van de herfst van 2025. Minstens 1 miljard dollar zal dit jaar worden geïnvesteerd in vier domeinen: levenswetenschappen (Alzheimer, ziekten met hoge mortaliteit), werkgelegenheid en economische impact, AI-resistentie (kindveiligheid, bioveiligheid), en gemeenschapsprogramma’s.

🔗 Officiële aankondiging

OpenAI: Library-tab om bestanden in ChatGPT te beheren

23 maart — OpenAI voegt nieuwe bestandsbeheerfuncties toe in ChatGPT: recente bestanden direct toegankelijk vanuit de werkbalk, de mogelijkheid om een al geüpload document te bevragen, en een Library-tab in de webzijbalk om alle bestanden terug te vinden. Beschikbaar voor Plus-, Pro- en Business-abonnees, met een uitrol op komst voor de Europese Economische Ruimte, Zwitserland en het Verenigd Koninkrijk.

🔗 Aankondiging op X

Gemini 3.1 Flash-Lite: een browser die pagina’s in realtime genereert

24 maart — Google DeepMind publiceert een demo van Gemini 3.1 Flash-Lite: een experimentele browser die elke webpagina on the fly genereert, terwijl je klikt, zoekt en navigeert. Er is geen vooraf bestaande HTML-pagina — elke inhoud wordt in realtime door het model gecreëerd. De demo is rechtstreeks toegankelijk via Google AI Studio en zorgde voor sterke betrokkenheid (85.000 weergaven in enkele uren).

🔗 AI Studio-demo 🔗 Aankondiging op X

Google DeepMind × Agile Robots: robotica-partnerschap

24 maart — Google DeepMind kondigt een onderzoeks साझेदारी aan met Agile Robots, specialist in humanoïde robotica. De overeenkomst voorziet in de integratie van Gemini foundation models in de robotica-hardware van Agile Robots, als onderdeel van de Gemini Robotics-strategie van Google DeepMind.

🔗 Aankondiging op X

Grok Imagine: multi-image-video op API (#1 Arena Elo 1342)

24 maart — xAI kondigt twee nieuwe mogelijkheden aan voor zijn Grok Imagine-API: videogeneratie op basis van meerdere afbeeldingen (multi-image to video) en uitbreiding van bestaande video (video extension).

Ontwikkelaars kunnen tot 7 afbeeldingen als invoer aanleveren om een coherente video te genereren via het model grok-imagine-video. De API werkt asynchroon: je dient de aanvraag in en vraagt vervolgens tot de status done is bereikt. De uitvoer ondersteunt de 16:9-verhouding in 720p.

Volgens Design Arena nam Grok Imagine meteen de eerste plaats in op de ranglijst Multi Image to Video Arena met een Elo-score van 1342.

🔗 Aankondiging @grok 🔗 API-documentatie Imagine

GitHub Copilot: @copilot om een PR direct te wijzigen

24 maart — GitHub Copilot kan nu op verzoek rechtstreeks elke pull request wijzigen. Door @copilot te vermelden in een commentaar met een instructie in natuurlijke taal — mislukte tests fixen, een reviewcommentaar afhandelen, een unittest toevoegen — werkt de agent in zijn cloudomgeving, valideert zijn werk met tests en linters, en pusht vervolgens de wijzigingen naar de branch. Het vorige gedrag (een nieuwe PR openen) blijft beschikbaar wanneer je dit expliciet vraagt. Beschikbaar op alle betaalde Copilot-plannen.

🔗 GitHub changelog

GitHub Copilot: Gemini 3.1 Pro in JetBrains, Xcode en Eclipse

23 maart — GitHub Copilot breidt de beschikbaarheid van Gemini 3.1 Pro uit naar de JetBrains-, Xcode- en Eclipse-IDE’s. Le modèle est désormais accessible via le sélecteur de modèles Copilot dans tous les modes (agent, ask, edit) sur ces environnements, en plus des plateformes déjà prises en charge. En preview publique pour les plans Enterprise, Business, Pro et Pro+.

🔗 Journal des modifications GitHub

GitHub Copilot : gestion de l’accès de l’agent par dépôt via API

24 mars — GitHub publie en preview publique une API REST pour gérer l’accès du Copilot coding agent au niveau des dépôts d’organisation. Les administrateurs peuvent autoriser l’agent sur aucun, tous, ou certains dépôts spécifiques de manière programmatique — utile pour les déploiements à grande échelle en entreprise.

🔗 Journal des modifications GitHub

GitHub Copilot : logs en direct dans Raycast

20 mars — L’extension GitHub Copilot pour Raycast (le launcher macOS/Windows) permet désormais de surveiller en direct les logs du coding agent sans quitter le launcher. Via la commande “View Tasks”, puis sélection de la session, les développeurs suivent l’avancement de l’agent en temps réel. Disponible pour tous les abonnés Copilot payants.

🔗 Journal des modifications GitHub

Ce que ça signifie

L’auto mode de Claude Code est le changement le plus structurant de cette période. Il déplace la charge cognitive de l’utilisateur — plus besoin d’approuver chaque commande — tout en maintenant un filet de sécurité via le classifieur. C’est une étape vers des agents de développement plus autonomes, mais dans un cadre explicitement recommandé pour les environnements isolés. L’article d’ingénierie sur le harness multi-agents complète ce tableau : la trajectoire d’Anthropic est clairement vers des agents qui travaillent longtemps et de manière autonome, avec des structures de supervision internes (évaluateur dédié, contrats de sprint) plutôt qu’une supervision humaine à chaque étape.

Du côté d’OpenAI, le shopping visuel dans ChatGPT marque un pivot vers les cas d’usage commerciaux grand public. L’Agentic Commerce Protocol positionne ChatGPT comme une couche d’intermédiation entre marchands et consommateurs — une stratégie différente de l’API pure, qui cible directement la valeur transactionnelle.

Grok Imagine qui atteint la première place du classement Arena dès son lancement sur le multi-image to video illustre la vitesse à laquelle xAI itère sur la génération vidéo. GitHub Copilot, de son côté, renforce systématiquement l’autonomie de son coding agent : la capacité à modifier directement une PR existante réduit encore les allers-retours entre l’agent et le développeur.

Sources

Dit document is vertaald van de fr-versie naar de taal nl met behulp van het gpt-5.4-mini-model. Voor meer informatie over het vertaalproces, raadpleeg https://gitlab.com/jls42/ai-powered-markdown-translator