ai-powered-markdown-translatorArtikel vertaald van fr naar nl met gpt-5.4-mini.
10 juni 2026 markeert een volle dag: Google DeepMind lanceert DiffusionGemma, een nieuwe tekstgeneratiearchitectuur op basis van diffusie die 1.000 tokens per seconde haalt op H100, en die onmiddellijk door NVIDIA is geoptimaliseerd voor lokale hardware. Aan de ontwikkelaarstoolkant brengt Anthropic de dynamische workflows van Claude Code naar algemene beschikbaarheid met een agentrecursie tot 5 niveaus, en positioneert xAI Grok Voice Think Fast 1.0 als nummer één in de EVA-Bench-benchmark. GitHub, OpenAI, Perplexity en Cohere maken de dag compleet met een reeks aankondigingen.
DiffusionGemma: parallelle generatie van blokken van 256 tokens, 4x sneller op GPU
10 juni — Google DeepMind lanceert DiffusionGemma, een experimenteel open model met 26 miljard parameters (Mélange d’Experts-architectuur, Mixture of Experts) dat onder Apache 2.0 is uitgebracht. Het bijzondere: in plaats van token voor token te genereren zoals elk klassiek autoregressief model, genereert het volledige blokken van 256 tokens tegelijkertijd door hetzelfde iteratieve denoising-principe toe te passen als diffusiemodellen voor beelden.
Resultaat: tot 4x sneller op een dedicated GPU. Het model activeert slechts 3,8 miljard parameters tijdens inferentie, waardoor het, eenmaal gequantiseerd, in 18 GB VRAM past — toegankelijk op high-end consumenten-GPU’s. De bidirectionele aandacht opent toepassingen die lastig zijn voor autoregressieve modellen: inline bewerking, codecompletion, aminozuursequenties, wiskundige grafen.
NVIDIA heeft DiffusionGemma meteen geoptimaliseerd voor zijn GPU’s door gebruik te maken van tensor cores (Tensor Cores), terwijl autoregressieve architecturen worden begrensd door geheugenbandbreedte. De gemeten prestaties op verschillende hardware:
| Hardware | Prestatie |
|---|---|
| NVIDIA H100 (server) | 1.000 tokens/s |
| NVIDIA DGX Station | tot 800 tokens/s |
| NVIDIA DGX Spark (lokaal) | 150 tokens/s |
| GeForce RTX 5090 (gequantiseerd) | 700+ tokens/s |
| GeForce RTX 4090 (gequantiseerd) | ondersteuning voor llama.cpp binnenkort |
De weights zijn beschikbaar op Hugging Face met onmiddellijke ondersteuning in HF Transformers, vLLM en Unsloth. Het model is ook gratis te testen op build.nvidia.com.
Belangrijk: Google geeft expliciet aan dat de uitvoerkwaliteit nog onder die van standaard Gemma 4-modellen ligt. DiffusionGemma is gericht op ontwikkelaars die lokale interactieve workflows verkennen — snelle iteratie, inline bewerking — en niet op productie.
“DiffusionGemma is our new experimental open model with up to 4x faster output on dedicated GPUs. Instead of predicting word-by-word, it generates entire blocks of text simultaneously.”
🇳🇱 DiffusionGemma is ons nieuwe experimentele open model dat tot 4 keer snellere uitvoer biedt op een dedicated GPU. In plaats van woorden woord voor woord te voorspellen, genereert het volledige tekstblokken tegelijk. — @GoogleDeepMind op X
🔗 Aankondiging Google DeepMind · 🔗 NVIDIA-optimalisatie
Claude Code v2.1.172: dynamische workflows in algemene beschikbaarheid, recursieve subagents tot 5 niveaus
10 juni — Anthropic kondigt aan dat de dynamische workflows (dynamic workflows) van Claude Code naar algemene beschikbaarheid gaan. Ze werden op 28 mei in research preview gepresenteerd en stellen Claude in staat om zijn eigen orkestratie te ontwerpen en tientallen tot honderden subagents parallel te starten om complexe end-to-end taken uit te voeren.
De versie v2.1.172 van de CLI, dezelfde dag uitgebracht, introduceert de sleutelcapaciteit die daarbij hoort: subagents kunnen nu hun eigen subagents aanmaken, tot 5 niveaus nesting. Dat is de technische basis die dynamische workflows op grote schaal operationeel maakt.
Belangrijkste use cases:
- Bugjacht op de schaal van een volledige repository, beveiligingsaudits
- Codemigraties die duizenden bestanden raken (bijv. Zig→Rust-port van Bun in 11 dagen)
- Adversariële verificatie van een resultaat vóór levering
Beschikbaarheid en voorwaarden:
| Onderdeel | Detail |
|---|---|
| Abonnementen | Max, Team, Enterprise (indien door admin ingeschakeld), Claude API |
| Cloudplatforms | Amazon Bedrock, Vertex AI, Microsoft Foundry |
| Activering | Commando Create a workflow of parameter ultracode (effort xhigh) |
| Diepte subagents | Tot 5 niveaus |
| CLI-versie | v2.1.172 |
Ter info: dynamische workflows verbruiken aanzienlijk meer tokens dan een standaard Claude Code-sessie. Claude Code toont een bevestiging vóór de eerste uitvoering. Enterprise-admins kunnen de functie uitschakelen via beheerde instellingen.
Overige wijzigingen in v2.1.172: bugfix voor sessies die definitief vastliepen met 1M-context zonder credits, zoekbalk in de browser /plugin, Amazon Bedrock leest nu de AWS-regio uit ~/.aws als AWS_REGION niet is ingesteld, talrijke stabiliteitsfixes voor achtergrondagents.
🔗 Aankondiging @claudeai · 🔗 Dynamic Workflows-blog · 🔗 CHANGELOG
Grok Voice Think Fast 1.0 — nummer één op EVA-Bench
10 juni — xAI kondigt Grok Voice Think Fast 1.0 aan, zijn spraakmodel dat zich positioneert op de Pareto-grens van de EVA-Bench-ranglijst van ServiceNow AI Research. De Pareto-grens betekent dat geen enkel ander systeem in de evaluatie tegelijkertijd beter scoort op zowel nauwkeurigheid als de kwaliteit van de gebruikerservaring.
xAI benadrukt drie kenmerken: natuurlijke timing, contextuele intonatie en een menselijke warmtebeleving. Het model is beschikbaar via de xAI-spraak-API op x.ai/api/voice, tegen een prijs die volgens de aankondiging aanzienlijk lager ligt dan die van de concurrentie.
| Metriek | Waarde |
|---|---|
| EVA-Bench-ranglijst | Pareto-grens (nummer 1) |
| Beschikbaarheid | API x.ai/api/voice |
| Prijspositionering | Fractie van de prijs van concurrenten (volgens xAI) |
“Grok Voice offers state-of-the-art performance with human-like timing, tone, and warmth. And it’s a fraction the price of competitors.”
🇳🇱 Grok Voice levert toonaangevende prestaties met een timing, toon en warmte die op die van een mens lijken. En de prijs is een fractie van die van de concurrentie. — @xai op X
NVIDIA Confidential Computing in Apple Private Cloud Compute (WWDC 2026)
9 juni — Aangekondigd tijdens de WWDC 2026 markeert deze drietalige Apple–NVIDIA–Google-integratie een structurele stap voorwaarts voor de privacy van AI in de cloud. De NVIDIA Blackwell GPU’s met Confidential Computing zijn nu geïntegreerd in Apple’s Private Cloud Compute (PCC)-infrastructuur, die verder reikt dan Apple-datacenters naar Google Cloud.
Doel: Apple Intelligence-verzoeken server-side verwerken met een absolute cryptografische privacygarantie — niemand, zelfs de makers van het systeem niet, kan toegang krijgen tot de gegevens, gesprekken of chats van gebruikers.
Beschermingsmechanismen:
- Hardware-rooted trust: verificatie dat de infrastructuur niet is gemanipuleerd
- Versleutelde communicatieroutes tussen de componenten
- Remote attestation: de software controleert de beveiligingsstatus van het platform vóór elke overdracht van gevoelige gegevens
- Ondersteuning voor versnelde inferentie zonder compromis op GPU-prestaties
Deze architectuur stelt Apple in staat om Apple Intelligence uit te breiden naar Google Cloud terwijl het zijn privacybeloftes behoudt — een zeldzame combinatie in de sector. Voor NVIDIA is dit een grootschalige adoptie van Blackwell Confidential Computing in een consumentenuitrol.
Anthropic: geplande agents, geheime kluizen en een regelgevend kader
Claude Managed Agents — geplande uitrol en variabelenkluizen
9 juni — Twee nieuwe functies komen in open bèta in Claude Managed Agents, aangekondigd tijdens Code with Claude Tokyo:
Geplande uitrol (scheduled deployments): agents kunnen nu automatisch volgens een schema draaien, zonder handmatige tussenkomst — dagelijkse rapporten, periodieke controles, regelmatige datapijplijnen.
Variabelen in kluizen (vaults): agents krijgen toegang tot hun geheimen en configuraties via een beheerde kluis, zonder sleutels bloot te stellen in de code of sessieconfiguraties.
| Functie | Status |
|---|---|
| Geplande uitrol | Open bèta |
| Variabelen in kluizen | Open bèta |
| Platform | Claude Managed Agents |
🔗 Wat is er nieuw in Claude Managed Agents
Policy on the AI Exponential — regelgevend kader van Anthropic
10 juni — Anthropic publiceert Policy on the AI Exponential, een kader voor openbaar beleid vergezeld van een essay van Dario Amodei. De vaststelling: AI-capaciteiten ontwikkelen zich in een exponentieel tempo waar het wetgevingsproces niet voor is ontworpen om bij te houden.
Het document richt zich op modellen die zijn getraind met meer dan 10²⁵ floating-point operaties (FLOP), ontwikkeld door bedrijven die meer dan USD 500 miljoen aan AI-gerelateerde omzet genereren of meer dan USD 1 miljard aan AI-R&D uitgeven. Het identificeert vier categorieën catastrofale risico’s: biologisch risico, cyberrisico, verlies van controle over AI-systemen en automatisering van AI-R&D zelf.
| Voorgeschreven verplichting | Beschrijving |
|---|---|
| Transparantie | Verplichte tests, publicatie van resultaten |
| Onafhankelijke evaluatie | Minstens één gekwalificeerde externe evaluator |
| Beveiliging | Bescherming van weights tegen staatsactoren |
| Overheidsbevoegdheid | Macht om gevaarlijke modellen te blokkeren of uit te stellen |
“AI is advancing at a pace our policymaking institutions were never built for—and the gap between the two is becoming the central challenge of the technology.”
🇳🇱 AI ontwikkelt zich in een tempo waarvoor onze wetgevende instellingen niet zijn ontworpen — en de kloof daartussen wordt de centrale uitdaging van deze technologie. — @AnthropicAI op X
🔗 Policy on the AI Exponential
GitHub Copilot: app open voor iedereen, zichtbare agentsessies en beveiligingsreview in CLI
Copilot App — open technical preview zonder wachtlijst
10 juni — De technical preview van de GitHub Copilot-app is nu beschikbaar voor alle Copilot Pro-, Pro+-, Max-, Business- en Enterprise-abonnees, zonder wachtlijst. Deze desktopapp, ontworpen voor agents, centraliseert het beheer van agentsessies, het aanmaken van pull requests en het aansturen van ontwikkeltaken vanaf de desktop — van ticket tot PR op één plek.
Copilot Chat ziet nu agentsessies
10 juni — GitHub verbetert de overgang tussen Copilot Chat en de cloudagent. Er zijn twee nieuwe tools beschikbaar in Copilot Chat: Get agent logs (logs van een agentsessie op een pull request, rechtstreeks in het gesprek opvraagbaar) en Session search (zoeken en samenvatten van eerdere sessies op onderwerp, titel of datum). De status van een lopende sessie wordt nu real-time in de chat weergegeven.
Copilot CLI — commando /security-review (experimentele public preview)
10 juni — Een nieuw slash-commando /security-review is beschikbaar in experimentele public preview in GitHub Copilot CLI. Het analyseert lokale codewijzigingen rechtstreeks vanuit de terminal: injecties (SQL, commando’s), XSS, onveilig databeheer, path traversal, zwakke cryptografie. De resultaten worden gescoord op ernst en vertrouwen, met suggesties die kunnen worden toegepast zonder de terminal te verlaten. Het commando staat los van GitHub code scanning en Dependabot — het vult die aan met lichte on-demand analyse.
Manus — Zoom Connector
9 juni — Manus lanceert de Zoom-connector, waarmee de agent automatisch de inhoud kan analyseren van vergaderingen die toegankelijk zijn vanaf het verbonden account: samenvattingen, transcripties, opnames, notities, agenda’s, whiteboards, deelnemersinformatie. Drie belangrijkste use cases: on-demand analyse van een vergadering, terugkerende automatische review met rapport in Slack of e-mail, en trendanalyse over meerdere vergaderingen. Beperking: Manus heeft alleen toegang tot de resources die het verbonden Zoom-account mag bekijken.
xAI en Kimi: partnerschappen en swarm-agents
Grok + eToro — Agent Tori aangedreven door realtime X-data
10 juni — xAI en eToro kondigen aan dat Tori, de AI-agent van eToro (40 miljoen gebruikers in 75 landen), nu de xAI-modellen en de realtimegegevens van het X-platform integreert om marktsentiment (market sentiment) te analyseren. Tori kan de evolutie van het sentiment in real time lezen, live signalen volgen en informatie analyseren. Dezelfde realtime-intelligentie is via de xAI API-console beschikbaar voor alle ontwikkelaars.
🔗 xAI News
Kimi Agent Swarm — Voorspelling van de 104 wedstrijden van het WK 2026
9 juni — Kimi (Moonshot AI) zet 300 subagents parallel in om de 104 wedstrijden van het FIFA Wereldkampioenschap 2026 te voorspellen. Elke agent heeft zijn eigen analytische invalshoek: tactiek, spelersvorm, historische data, publiek sentiment, weer, psychologie, quotawijzigingen. Het systeem gebruikt Elo/FIFA-modellen, Poisson/Dixon-Coles, Monte-Carlo-simulaties en dynamische Bayesiaanse update. Geïdentificeerd signaal: de kans op de titel van Duitsland wordt geschat op ~11,3 % tegenover ~7,4 % op de gokmarkten.
OpenAI Codex: migratie vanaf Claude Code en Ableton-showcase
Codex app 26.608 — Migratie vanaf Claude Code en herontwerp van plugins
9 juni — De update Codex app 26.608 introduceert een migratiestroom (Migrate to Codex) waarmee configuratie automatisch kan worden geïmporteerd vanuit Claude Code en Claude Cowork, inclusief bij de eerste start van de app. De plugininterface is volledig herontworpen met aparte tabbladen, een marketplace met filters per categorie en verbeterde toetsenbordnavigatie. Het zoeken in instellingen is uitgebreid naar Git en visuele aanpassingen.
| Functie | Detail |
|---|---|
| Migratie Claude Code/Cowork | Automatische import, ook bij onboarding |
| Pluginscherm | Tabbladen, marketplace, categoriefilters |
| Instellingen zoeken | Uitgebreid naar Git, visuele aanpassingen |
Perplexity en Cohere: multi-model orkestratie en spraakbenchmark
Perplexity Computer integreert Claude Fable 5 als orchestrator
10 juni — Perplexity kondigt de integratie van Claude Fable 5 aan als orkestermodel in Perplexity Computer, zijn meerstaps agentische interface. Deze integratie is voorbehouden aan Pro- en Max-abonnees.
Cohere Transcribe nummer 1 op de Far-Field ASR-benchmark van Hugging Face
10 juni — Cohere Transcribe, het open-source spraakherkenningsmodel van Cohere, staat op de eerste plaats in de nieuwe Far-Field ASR-benchmark van Hugging Face, ontworpen om robuustheid te testen in echte audio-omgevingen (vergaderruimtes, contactcentra, telefoongesprekken).
| Model | WER Far-Field ASR |
|---|---|
| Cohere Transcribe | 17,9 |
| IBM Granite Speech | ~19,8 |
| NVIDIA Parakeet | ~21,5 |
Het model blijft onder Apache 2.0-licentie en kan lokaal draaien. Het stond in maart 2026 al op de eerste plaats in de algemene OpenASR-leaderboard.
Gemini App: nieuwe functies voor kleine bedrijven
10 juni — Tijdens het Google for Brazil-evenement in São Paulo kondigt Google twee Gemini App-functies aan voor kleine bedrijven, met een wereldwijde uitrol gepland voor juni 2026.
Google Business Profile-koppeling: gebruikers koppelen hun profiel rechtstreeks in de Gemini-app. Zodra het profiel is gekoppeld, krijgt Gemini toegang tot klantbeoordelingen, vragen en prestatiegegevens om gepersonaliseerde aanbevelingen te doen: maandelijkse analyse van prestaties, het opstellen van antwoorden op reviews in de toon van het merk, en het bijwerken van openingstijden en profiel.
Business notebooks: een gecentraliseerde ruimte waarin het bedrijf zijn gesprekken, bronnen en Google Business-profiel organiseert. Gemini gebruikt dit als kennisbasis om de continuïteit van gesprekken te behouden en proactieve waarschuwingen voor te stellen (onbeantwoorde klantvraag, niet-ingevulde feestdaguren).
Kort nieuws
- Gemini-storing op 10 juni — Productdirecteur Josh Woodward meldt een service-storing om 19:31, met al gedeeltelijk uitgerolde fixes. 🔗 @joshwoodward
- GitHub Enterprise — 500 kostencentra — De limiet voor kostencentra per bedrijf gaat van 250 naar 500, automatisch en zonder configuratie vereist. 🔗 Changelog
- Dependabot ondersteunt Deno — Deno-versie-updates worden ondersteund via een
deno-vermelding in.github/dependabot.yml(beveiligingsupdates voorlopig niet gedekt). 🔗 Changelog - npm v12 — incompatibele wijzigingen in juli 2026 — Installatiescripts, Git-afhankelijkheden en externe URL’s worden standaard geblokkeerd. Aanbevolen update naar npm 11.16.0+ om vooruit te lopen. 🔗 Changelog
- Alibaba Wan — Fisheye Lens — Nieuw hulpmiddel dat standaardafbeeldingen omzet in circulaire ultra-groothoekbeelden in fish-eye-stijl, toegevoegd aan de visuele vaardighedengalerij van Wan. 🔗 @Alibaba_Wan
- Z-Image-Engineer-V6 — Verwisselbare tekst-encoder voor Z-Image-Turbo (Tongyi Lab / Alibaba), die eenvoudige prompts omzet in filmische beschrijvingen. Beschikbaar op Hugging Face. 🔗 @Ali_TongyiLab
- Qwen-Image-Edit-2511 + LoRA — Nieuwe community-Hugging Face-ruimte voor Qwen-Image-Edit-2511 met een veelzijdige LoRA-matrix (face swap, poses, virtuele paskamer, meerhoekige weergave). 🔗 @Ali_TongyiLab
- ChatGPT voor iOS 1.2026.153 — Nieuwe Codex Mobile-functies — worktrees,
/goal. - Codex in Ableton Live — @OpenAIDevs zet de musicus @sound4movement in de kijker, die Codex gebruikt om Ableton Live automatisch te configureren op basis van een trackbeschrijving. 🔗 @OpenAIDevs
- Cohere Labs — AI en de toekomst van werk — Publicatie van een rapport over bewijsleemtes in het debat over de impact van AI op werkgelegenheid, waarmee een nieuwe onderzoeksrichting wordt ingeluid. 🔗 @cohere
Wat dit betekent
Nieuwe inferentie-architecturen: het einde van token-voor-token? DiffusionGemma is de eerste grootschalige publieke demonstratie van een open tekst-diffusiearchitectuur, en de onmiddellijke interesse van NVIDIA — dat het model op de dag van lancering al optimaliseerde — bevestigt dat deze richting op industrieel niveau serieus wordt genomen. De 4x-winst op een dedicated GPU is niet anekdotisch: ze verschuift de bottleneck van geheugenbandbreedte (de achilleshiel van autoregressieve modellen) naar tensor-rekenkernen. De huidige beperking (lagere kwaliteit dan Gemma 4) en de expliciete focus op ontwikkelaars in plaats van productie geven aan dat dit een onderzoekspiste is, geen onmiddellijke vervanging — maar de Pareto-benchmark van Grok Voice op EVA-Bench, in een ander domein (spraak), laat zien dat de race naar efficiëntie nu op meerdere architecturale fronten tegelijk wordt gespeeld.
Agentische autonomie: van belofte naar infrastructuur. De GA van de dynamische workflows van Claude Code met recursie tot 5 niveaus, gecombineerd met geplande implementaties en secrets-vaults van Claude Managed Agents, concretiseert een paradigmawissel: agents zijn niet langer eenmalige tools maar persistente, planbare processen met veilige toegang tot secrets. Het Kimi Agent Swarm-initiatief (300 subagents over 104 wedstrijden) illustreert dezelfde beweging aan de kant van Moonshot AI. En Perplexity Computer dat Claude Fable 5 integreert als orchestrator signaleert dat de concurrentie op agents net zozeer op het niveau van tooling speelt als op dat van de modellen zelf.
Privacy en vertrouwen: de as Apple–NVIDIA–Google. De integratie van NVIDIA Confidential Computing in Apple PCC op Google Cloud is structureel betekenisvol: ze laat zien dat een grootschalige consumentenuitrol GPU-versnelling, cryptografische privacygaranties en infrastructuur van een derde partij kan combineren. Dit is geen niche — Apple Intelligence bereikt honderden miljoenen apparaten. Als deze architectuur zich normaliseert, kan ze een de-facto standaard worden voor AI-diensten die gevoelige persoonlijke gegevens verwerken.
Ontwikkelaarsecosysteem: consolidatie en concurrentie op tooling. Dat Codex 26.608 een migratiepad vanaf Claude Code biedt, is niet onbelangrijk: het erkent dat ontwikkelaars hun configuratie in concurrerende tools hebben geïnvesteerd en dat de overstapkosten omlaag moeten. GitHub Copilot versnelt intussen op de “agent-native”-aanpak (app zonder wachtlijst, zichtbare agentsessies in de chat, beveiligingsreview in CLI). De dag van 10 juni schetst een ecosysteem waarin differentiatie minder draait om de ruwe capaciteiten van de modellen dan om de diepte van integratie in dagelijkse developer-workflows.
Bronnen
- DiffusionGemma — Google DeepMind-blog
- DiffusionGemma — NVIDIA-optimalisatie
- @GoogleDeepMind op X
- Claude Code — Dynamic Workflows GA
- @claudeai op X
- Claude Code CHANGELOG
- Claude Managed Agents — What’s new
- Anthropic — Policy on the AI Exponential
- @AnthropicAI op X
- Grok Voice Think Fast 1.0 — @xai op X
- EVA-Bench-resultaten
- xAI Voice API
- NVIDIA Confidential Computing × Apple PCC
- GitHub Copilot App — @github op X
- Copilot Chat agent sessions — Changelog
- Copilot CLI /security-review — Changelog
- Manus Zoom Connector
- Grok + eToro — xAI News
- Kimi Agent Swarm — @Kimi_Moonshot op X
- Codex app 26.608 — Changelog
- Perplexity Computer × Claude Fable 5 — @perplexity_ai
- Cohere Transcribe #1 Far-Field ASR — @cohere
- Gemini App — functies voor mkb
- Gemini-storing — @joshwoodward
- GitHub Enterprise kostencentra
- Dependabot Deno
- npm v12 breaking changes
- Alibaba Wan Fisheye Lens — @Alibaba_Wan
- Z-Image-Engineer-V6 — @Ali_TongyiLab
- Qwen-Image-Edit-2511 — @Ali_TongyiLab
- @OpenAIDevs — Codex Ableton
- Cohere Labs — toekomst van werk — @cohere