Zoeken

AI Nieuws 9 januari 2026: Constitutional Classifiers++, OpenAI for Healthcare, Scribe v2

AI Nieuws 9 januari 2026: Constitutional Classifiers++, OpenAI for Healthcare, Scribe v2

Deze week in AI

Drukke dag met grote aankondigingen: Anthropic publiceert een onderzoeksrapport over de veiligheid van LLM’s na 1700 uur intensief red-teaming. OpenAI lanceert een enterprise-aanbod speciaal voor ziekenhuizen met HIPAA-ondersteuning. ElevenLabs onthult Scribe v2, zijn nieuwe speech-to-text transcriptiemodel.


Constitutional Classifiers++: Anthropic versterkt veiligheid

9 januari 2026 — Anthropic publiceert een belangrijk nieuw onderzoeksrapport over de robuustheid van zijn verdediging tegen jailbreaks.

🔗 Paper op arXiv | X Thread

De context

Vorig jaar introduceerde Anthropic de Constitutional Classifiers, een systeem dat classifiers traint op basis van een “grondwet” die specificeert welke vragen Claude wel of niet moet beantwoorden. Dit systeem had het succespercentage van jailbreaks teruggebracht van 86% naar 4,4%, maar kende twee problemen: rekenintensief en de neiging om legitieme vragen te weigeren.

Drie belangrijke innovaties

Het nieuwe Constitutional Classifiers++ systeem brengt drie grote verbeteringen:

InnovatieBeschrijving
Exchange ClassifiersEvalueren antwoorden in hun volledige gesprekscontext, wat de kwetsbaarheid van eerdere systemen corrigeert die outputs geïsoleerd bekeken
Two-Stage CascadeLichtgewicht classifiers filteren al het verkeer en escaleren alleen verdachte uitwisselingen naar krachtigere classifiers
Linear ProbesPraktische toepassing van interpreteerbaarheid: sondes observeren Claude’s interne activaties (“gut instincts”) om verdachte vragen te detecteren

Resultaten

MetriekPrestatie
Kostenbesparing40x vergeleken met baseline
Compute overheadSlechts ~1%
Weigeringspercentage productie0,05%
Daling valse weigeringen87%
Red-teaming1700u zonder universele jailbreak

After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.

🇳🇱 Na 1700 gecumuleerde uren red-teaming hebben we nog geen universele jailbreak (een consistente aanvalsstrategie die op veel vragen werkt) geïdentificeerd die op ons nieuwe systeem werkt.@AnthropicAI

Waarom dit belangrijk is

Het systeem gebruikt de interne activaties van Claude als een “instinct” dat moeilijk te misleiden is. Wanneer de sonde een verdachte vraag detecteert, stuurt deze die naar een krachtigere “exchange” classifier die beide kanten van het gesprek analyseert. Deze cascade-architectuur maakt robuuste bescherming mogelijk zonder de prohibitieve rekenkosten van eerdere generaties.


OpenAI for Healthcare: AI doet intrede in ziekenhuizen

8 januari 2026 — OpenAI lanceert een enterprise-aanbod speciaal voor de gezondheidszorg, los van het de dag ervoor aangekondigde ChatGPT Health.

🔗 Officiële aankondiging

Verschil met ChatGPT Health

ProductDoelgroepFocus
ChatGPT HealthBreed publiekPersoonlijk welzijn, verbinding gezondheids-apps
OpenAI for HealthcareBedrijvenZiekenhuizen, klinieken, klinische workflows

ChatGPT for Healthcare

Een enterprise-versie van ChatGPT ontworpen voor zorgorganisaties:

  • Gezondheidsgeoptimaliseerde modellen: GPT-5.2 met evaluaties door 260+ artsen in 60 landen op HealthBench
  • Transparante medische citaties: Antwoorden met bronvermelding uit peer-reviewed studies, klinische richtlijnen, met titels, tijdschriften en data
  • Institutionele afstemming: SharePoint-integratie om de protocollen en trajecten van de instelling te respecteren
  • Herbruikbare sjablonen: Ontslagbrieven, patiëntinstructies, klinische brieven, ondersteuning bij voorafgaande toestemming

Lanceringspartners

InstellingSpecialisme
Boston Children’s HospitalKindergeneeskunde
Stanford Medicine Children’s HealthKindergeneeskunde
Memorial Sloan KetteringOncologie
Cedars-Sinai Medical CenterAlgemeen Ziekenhuis
HCA HealthcareZiekenhuisnetwerk
UCSFAcademisch Medisch Centrum
AdventHealthZiekenhuisnetwerk
Baylor Scott & White HealthZiekenhuisnetwerk

HIPAA-naleving

AspectOndersteuning
BAABusiness Associate Agreement met OpenAI
Data residencyOpties voor data residency
Audit logsUitgebreide audit logs
EncryptionDoor de klant beheerde encryptiesleutels
TrainingData niet gebruikt om modellen te trainen

Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.

🇳🇱 De gezondheidszorg is een van de snelst groeiende zakelijke markten die AI adopteren, en ziekenhuizen en academische medische centra rollen ChatGPT for Healthcare al uit over hun teams.OpenAI


ElevenLabs Scribe v2: transcriptie van de volgende generatie

9 januari 2026 — ElevenLabs kondigt de beschikbaarheid aan van de Scribe v2 API voor ontwikkelaars en bedrijven.

🔗 Documentatie Scribe v2 | X Thread

Belangrijkste capaciteiten

FunctieDetails
Talen90+ ondersteunde talen
Keyterm promptingTot 100 termen om het model te sturen naar specifieke woorden
Entity detection56 entiteitstypes (namen, kaartnummers, medische aandoeningen, BSN)
Speaker diarizationTot 48 verschillende sprekers
TimestampsPrecisie op woordniveau
Audio taggingAutomatische detectie van audiogebeurtenissen (lachen, applaus)

Realtime-versie

Scribe v2 bestaat ook in een realtime-versie:

MetriekPrestatie
Latentie~150ms
Talen90+
TranscriptieRealtime via WebSockets

Enterprise-naleving

ElevenLabs biedt een Business Associate Agreement (BAA) voor klanten die HIPAA-naleving vereisen, waardoor Scribe v2 inzetbaar is in medische contexten.

With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.

🇳🇱 Met Scribe v2 kunnen ontwikkelaars en bedrijven complexe audiopijplijnen automatiseren, een hogere nauwkeurigheid bereiken in wereldwijde contentworkflows en schalen met volledige naleving en controles op data residency.@elevenlabsio


Wat dit betekent

Anthropic blijft leiden op het gebied van LLM-veiligheid. De combinatie van interpreteerbaarheid + cascade van classifiers is elegant: het gebruik van de “gut instincts” van Claude om aanvallen te detecteren is moeilijker te omzeilen dan expliciete regels. De 87% vermindering van valse weigeringen is cruciaal voor zakelijke adoptie.

OpenAI valt frontaal de B2B-gezondheidszorgmarkt aan, een van de meest gereguleerde sectoren. Het complete aanbod met HIPAA, BAA en prestigieuze ziekenhuispartnerschappen positioneert OpenAI for Healthcare als een serieus alternatief voor legacy-oplossingen. Het onderscheid met ChatGPT Health (B2C) toont een volwassen productstrategie.

ElevenLabs completeert zijn audiostack met een state-of-the-art STT. De combinatie TTS (stem) + STT (transcriptie) + HIPAA-naleving maakt het een full-stack oplossing voor zakelijke spraaktoepassingen. Keyterm prompting is bijzonder nuttig voor technische termen of eigennamen.


Bronnen