AI Nieuws 9 januari 2026: Constitutional Classifiers++, OpenAI for Healthcare, Scribe v2

Deze week in AI

Drukke dag met grote aankondigingen: Anthropic publiceert een onderzoeksrapport over de veiligheid van LLM’s na 1700 uur intensief red-teaming. OpenAI lanceert een enterprise-aanbod speciaal voor ziekenhuizen met HIPAA-ondersteuning. ElevenLabs onthult Scribe v2, zijn nieuwe speech-to-text transcriptiemodel.

Constitutional Classifiers++: Anthropic versterkt veiligheid

9 januari 2026 — Anthropic publiceert een belangrijk nieuw onderzoeksrapport over de robuustheid van zijn verdediging tegen jailbreaks.

🔗 Paper op arXiv | X Thread

De context

Vorig jaar introduceerde Anthropic de Constitutional Classifiers, een systeem dat classifiers traint op basis van een “grondwet” die specificeert welke vragen Claude wel of niet moet beantwoorden. Dit systeem had het succespercentage van jailbreaks teruggebracht van 86% naar 4,4%, maar kende twee problemen: rekenintensief en de neiging om legitieme vragen te weigeren.

Drie belangrijke innovaties

Het nieuwe Constitutional Classifiers++ systeem brengt drie grote verbeteringen:

Innovatie	Beschrijving
Exchange Classifiers	Evalueren antwoorden in hun volledige gesprekscontext, wat de kwetsbaarheid van eerdere systemen corrigeert die outputs geïsoleerd bekeken
Two-Stage Cascade	Lichtgewicht classifiers filteren al het verkeer en escaleren alleen verdachte uitwisselingen naar krachtigere classifiers
Linear Probes	Praktische toepassing van interpreteerbaarheid: sondes observeren Claude’s interne activaties (“gut instincts”) om verdachte vragen te detecteren

Resultaten

Metriek	Prestatie
Kostenbesparing	40x vergeleken met baseline
Compute overhead	Slechts ~1%
Weigeringspercentage productie	0,05%
Daling valse weigeringen	87%
Red-teaming	1700u zonder universele jailbreak

After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.

🇳🇱 Na 1700 gecumuleerde uren red-teaming hebben we nog geen universele jailbreak (een consistente aanvalsstrategie die op veel vragen werkt) geïdentificeerd die op ons nieuwe systeem werkt. — @AnthropicAI

Waarom dit belangrijk is

Het systeem gebruikt de interne activaties van Claude als een “instinct” dat moeilijk te misleiden is. Wanneer de sonde een verdachte vraag detecteert, stuurt deze die naar een krachtigere “exchange” classifier die beide kanten van het gesprek analyseert. Deze cascade-architectuur maakt robuuste bescherming mogelijk zonder de prohibitieve rekenkosten van eerdere generaties.

OpenAI for Healthcare: AI doet intrede in ziekenhuizen

8 januari 2026 — OpenAI lanceert een enterprise-aanbod speciaal voor de gezondheidszorg, los van het de dag ervoor aangekondigde ChatGPT Health.

🔗 Officiële aankondiging

Verschil met ChatGPT Health

Product	Doelgroep	Focus
ChatGPT Health	Breed publiek	Persoonlijk welzijn, verbinding gezondheids-apps
OpenAI for Healthcare	Bedrijven	Ziekenhuizen, klinieken, klinische workflows

ChatGPT for Healthcare

Een enterprise-versie van ChatGPT ontworpen voor zorgorganisaties:

Gezondheidsgeoptimaliseerde modellen: GPT-5.2 met evaluaties door 260+ artsen in 60 landen op HealthBench
Transparante medische citaties: Antwoorden met bronvermelding uit peer-reviewed studies, klinische richtlijnen, met titels, tijdschriften en data
Institutionele afstemming: SharePoint-integratie om de protocollen en trajecten van de instelling te respecteren
Herbruikbare sjablonen: Ontslagbrieven, patiëntinstructies, klinische brieven, ondersteuning bij voorafgaande toestemming

Lanceringspartners

Instelling	Specialisme
Boston Children’s Hospital	Kindergeneeskunde
Stanford Medicine Children’s Health	Kindergeneeskunde
Memorial Sloan Kettering	Oncologie
Cedars-Sinai Medical Center	Algemeen Ziekenhuis
HCA Healthcare	Ziekenhuisnetwerk
UCSF	Academisch Medisch Centrum
AdventHealth	Ziekenhuisnetwerk
Baylor Scott & White Health	Ziekenhuisnetwerk

HIPAA-naleving

Aspect	Ondersteuning
BAA	Business Associate Agreement met OpenAI
Data residency	Opties voor data residency
Audit logs	Uitgebreide audit logs
Encryption	Door de klant beheerde encryptiesleutels
Training	Data niet gebruikt om modellen te trainen

Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.

🇳🇱 De gezondheidszorg is een van de snelst groeiende zakelijke markten die AI adopteren, en ziekenhuizen en academische medische centra rollen ChatGPT for Healthcare al uit over hun teams. — OpenAI

ElevenLabs Scribe v2: transcriptie van de volgende generatie

9 januari 2026 — ElevenLabs kondigt de beschikbaarheid aan van de Scribe v2 API voor ontwikkelaars en bedrijven.

🔗 Documentatie Scribe v2 | X Thread

Belangrijkste capaciteiten

Functie	Details
Talen	90+ ondersteunde talen
Keyterm prompting	Tot 100 termen om het model te sturen naar specifieke woorden
Entity detection	56 entiteitstypes (namen, kaartnummers, medische aandoeningen, BSN)
Speaker diarization	Tot 48 verschillende sprekers
Timestamps	Precisie op woordniveau
Audio tagging	Automatische detectie van audiogebeurtenissen (lachen, applaus)

Realtime-versie

Scribe v2 bestaat ook in een realtime-versie:

Metriek	Prestatie
Latentie	~150ms
Talen	90+
Transcriptie	Realtime via WebSockets

Enterprise-naleving

ElevenLabs biedt een Business Associate Agreement (BAA) voor klanten die HIPAA-naleving vereisen, waardoor Scribe v2 inzetbaar is in medische contexten.

With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.

🇳🇱 Met Scribe v2 kunnen ontwikkelaars en bedrijven complexe audiopijplijnen automatiseren, een hogere nauwkeurigheid bereiken in wereldwijde contentworkflows en schalen met volledige naleving en controles op data residency. — @elevenlabsio

Wat dit betekent

Anthropic blijft leiden op het gebied van LLM-veiligheid. De combinatie van interpreteerbaarheid + cascade van classifiers is elegant: het gebruik van de “gut instincts” van Claude om aanvallen te detecteren is moeilijker te omzeilen dan expliciete regels. De 87% vermindering van valse weigeringen is cruciaal voor zakelijke adoptie.

OpenAI valt frontaal de B2B-gezondheidszorgmarkt aan, een van de meest gereguleerde sectoren. Het complete aanbod met HIPAA, BAA en prestigieuze ziekenhuispartnerschappen positioneert OpenAI for Healthcare als een serieus alternatief voor legacy-oplossingen. Het onderscheid met ChatGPT Health (B2C) toont een volwassen productstrategie.

ElevenLabs completeert zijn audiostack met een state-of-the-art STT. De combinatie TTS (stem) + STT (transcriptie) + HIPAA-naleving maakt het een full-stack oplossing voor zakelijke spraaktoepassingen. Keyterm prompting is bijzonder nuttig voor technische termen of eigennamen.