Deze week in AI
Drukke dag met grote aankondigingen: Anthropic publiceert een onderzoeksrapport over de veiligheid van LLM’s na 1700 uur intensief red-teaming. OpenAI lanceert een enterprise-aanbod speciaal voor ziekenhuizen met HIPAA-ondersteuning. ElevenLabs onthult Scribe v2, zijn nieuwe speech-to-text transcriptiemodel.
Constitutional Classifiers++: Anthropic versterkt veiligheid
9 januari 2026 — Anthropic publiceert een belangrijk nieuw onderzoeksrapport over de robuustheid van zijn verdediging tegen jailbreaks.
De context
Vorig jaar introduceerde Anthropic de Constitutional Classifiers, een systeem dat classifiers traint op basis van een “grondwet” die specificeert welke vragen Claude wel of niet moet beantwoorden. Dit systeem had het succespercentage van jailbreaks teruggebracht van 86% naar 4,4%, maar kende twee problemen: rekenintensief en de neiging om legitieme vragen te weigeren.
Drie belangrijke innovaties
Het nieuwe Constitutional Classifiers++ systeem brengt drie grote verbeteringen:
| Innovatie | Beschrijving |
|---|---|
| Exchange Classifiers | Evalueren antwoorden in hun volledige gesprekscontext, wat de kwetsbaarheid van eerdere systemen corrigeert die outputs geïsoleerd bekeken |
| Two-Stage Cascade | Lichtgewicht classifiers filteren al het verkeer en escaleren alleen verdachte uitwisselingen naar krachtigere classifiers |
| Linear Probes | Praktische toepassing van interpreteerbaarheid: sondes observeren Claude’s interne activaties (“gut instincts”) om verdachte vragen te detecteren |
Resultaten
| Metriek | Prestatie |
|---|---|
| Kostenbesparing | 40x vergeleken met baseline |
| Compute overhead | Slechts ~1% |
| Weigeringspercentage productie | 0,05% |
| Daling valse weigeringen | 87% |
| Red-teaming | 1700u zonder universele jailbreak |
After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.
🇳🇱 Na 1700 gecumuleerde uren red-teaming hebben we nog geen universele jailbreak (een consistente aanvalsstrategie die op veel vragen werkt) geïdentificeerd die op ons nieuwe systeem werkt. — @AnthropicAI
Waarom dit belangrijk is
Het systeem gebruikt de interne activaties van Claude als een “instinct” dat moeilijk te misleiden is. Wanneer de sonde een verdachte vraag detecteert, stuurt deze die naar een krachtigere “exchange” classifier die beide kanten van het gesprek analyseert. Deze cascade-architectuur maakt robuuste bescherming mogelijk zonder de prohibitieve rekenkosten van eerdere generaties.
OpenAI for Healthcare: AI doet intrede in ziekenhuizen
8 januari 2026 — OpenAI lanceert een enterprise-aanbod speciaal voor de gezondheidszorg, los van het de dag ervoor aangekondigde ChatGPT Health.
Verschil met ChatGPT Health
| Product | Doelgroep | Focus |
|---|---|---|
| ChatGPT Health | Breed publiek | Persoonlijk welzijn, verbinding gezondheids-apps |
| OpenAI for Healthcare | Bedrijven | Ziekenhuizen, klinieken, klinische workflows |
ChatGPT for Healthcare
Een enterprise-versie van ChatGPT ontworpen voor zorgorganisaties:
- Gezondheidsgeoptimaliseerde modellen: GPT-5.2 met evaluaties door 260+ artsen in 60 landen op HealthBench
- Transparante medische citaties: Antwoorden met bronvermelding uit peer-reviewed studies, klinische richtlijnen, met titels, tijdschriften en data
- Institutionele afstemming: SharePoint-integratie om de protocollen en trajecten van de instelling te respecteren
- Herbruikbare sjablonen: Ontslagbrieven, patiëntinstructies, klinische brieven, ondersteuning bij voorafgaande toestemming
Lanceringspartners
| Instelling | Specialisme |
|---|---|
| Boston Children’s Hospital | Kindergeneeskunde |
| Stanford Medicine Children’s Health | Kindergeneeskunde |
| Memorial Sloan Kettering | Oncologie |
| Cedars-Sinai Medical Center | Algemeen Ziekenhuis |
| HCA Healthcare | Ziekenhuisnetwerk |
| UCSF | Academisch Medisch Centrum |
| AdventHealth | Ziekenhuisnetwerk |
| Baylor Scott & White Health | Ziekenhuisnetwerk |
HIPAA-naleving
| Aspect | Ondersteuning |
|---|---|
| BAA | Business Associate Agreement met OpenAI |
| Data residency | Opties voor data residency |
| Audit logs | Uitgebreide audit logs |
| Encryption | Door de klant beheerde encryptiesleutels |
| Training | Data niet gebruikt om modellen te trainen |
Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.
🇳🇱 De gezondheidszorg is een van de snelst groeiende zakelijke markten die AI adopteren, en ziekenhuizen en academische medische centra rollen ChatGPT for Healthcare al uit over hun teams. — OpenAI
ElevenLabs Scribe v2: transcriptie van de volgende generatie
9 januari 2026 — ElevenLabs kondigt de beschikbaarheid aan van de Scribe v2 API voor ontwikkelaars en bedrijven.
🔗 Documentatie Scribe v2 | X Thread
Belangrijkste capaciteiten
| Functie | Details |
|---|---|
| Talen | 90+ ondersteunde talen |
| Keyterm prompting | Tot 100 termen om het model te sturen naar specifieke woorden |
| Entity detection | 56 entiteitstypes (namen, kaartnummers, medische aandoeningen, BSN) |
| Speaker diarization | Tot 48 verschillende sprekers |
| Timestamps | Precisie op woordniveau |
| Audio tagging | Automatische detectie van audiogebeurtenissen (lachen, applaus) |
Realtime-versie
Scribe v2 bestaat ook in een realtime-versie:
| Metriek | Prestatie |
|---|---|
| Latentie | ~150ms |
| Talen | 90+ |
| Transcriptie | Realtime via WebSockets |
Enterprise-naleving
ElevenLabs biedt een Business Associate Agreement (BAA) voor klanten die HIPAA-naleving vereisen, waardoor Scribe v2 inzetbaar is in medische contexten.
With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.
🇳🇱 Met Scribe v2 kunnen ontwikkelaars en bedrijven complexe audiopijplijnen automatiseren, een hogere nauwkeurigheid bereiken in wereldwijde contentworkflows en schalen met volledige naleving en controles op data residency. — @elevenlabsio
Wat dit betekent
Anthropic blijft leiden op het gebied van LLM-veiligheid. De combinatie van interpreteerbaarheid + cascade van classifiers is elegant: het gebruik van de “gut instincts” van Claude om aanvallen te detecteren is moeilijker te omzeilen dan expliciete regels. De 87% vermindering van valse weigeringen is cruciaal voor zakelijke adoptie.
OpenAI valt frontaal de B2B-gezondheidszorgmarkt aan, een van de meest gereguleerde sectoren. Het complete aanbod met HIPAA, BAA en prestigieuze ziekenhuispartnerschappen positioneert OpenAI for Healthcare als een serieus alternatief voor legacy-oplossingen. Het onderscheid met ChatGPT Health (B2C) toont een volwassen productstrategie.
ElevenLabs completeert zijn audiostack met een state-of-the-art STT. De combinatie TTS (stem) + STT (transcriptie) + HIPAA-naleving maakt het een full-stack oplossing voor zakelijke spraaktoepassingen. Keyterm prompting is bijzonder nuttig voor technische termen of eigennamen.