AI Nyheter 9 januari 2026: Constitutional Classifiers++, OpenAI for Healthcare, Scribe v2

Denna vecka inom AI

En hektisk dag med stora tillkännagivanden: Anthropic publicerar en forskningsrapport om LLM-säkerhet efter 1700 timmars intensiv red-teaming. OpenAI lanserar ett företagserbjudande dedikerat till sjukhus med HIPAA-stöd. ElevenLabs avslöjar Scribe v2, sin nya speech-to-text transkriberingsmodell.

Constitutional Classifiers++: Anthropic stärker säkerheten

9 januari 2026 — Anthropic publicerar en ny stor forskningsrapport om robustheten i sitt försvar mot jailbreaks.

🔗 Paper på arXiv | X-tråd

Kontexten

Förra året introducerade Anthropic Constitutional Classifiers, ett system som tränar klassificerare baserat på en “konstitution” som specificerar vilka frågor Claude ska eller inte ska svara på. Detta system hade minskat framgångsgraden för jailbreaks från 86% till 4,4%, men hade två problem: beräkningsmässigt dyrt och en tendens att neka legitima förfrågningar.

Tre nyckelinnovationer

Det nya systemet Constitutional Classifiers++ medför tre stora förbättringar:

Innovation	Beskrivning
Exchange Classifiers	Utvärderar svar i sin fulla konversationskontext, vilket korrigerar sårbarheten hos tidigare system som granskade outputs isolerat
Two-Stage Cascade	Lättviktsklassificerare filtrerar all trafik och eskalerar endast misstänkta utbyten till kraftfullare klassificerare
Linear Probes	Praktisk tillämpning av tolkningsbarhet: sonder observerar Claudes interna aktiveringar (“gut instincts”) för att upptäcka misstänkta förfrågningar

Resultat

Mätvärde	Prestanda
Kostnadsminskning	40x jämfört med baseline
Compute overhead	Endast ~1%
Avvisningsfrekvens produktion	0.05%
Minskning av falska avvisningar	87%
Red-teaming	1700h utan universell jailbreak

After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.

🇸🇪 Efter 1700 ackumulerade timmar av red-teaming har vi ännu inte identifierat en universell jailbreak (en konsekvent attackstrategi som fungerar över många förfrågningar) som fungerar på vårt nya system. — @AnthropicAI

Varför det är viktigt

Systemet använder Claudes interna aktiveringar som en “instinkt” som är svår att lura. När sonden upptäcker en misstänkt förfrågan skickar den den till en kraftfullare “exchange”-klassificerare som analyserar båda sidor av konversationen. Denna kaskadarkitektur möjliggör ett robust skydd utan den oöverkomliga beräkningskostnaden från tidigare generationer.

OpenAI for Healthcare: AI gör entré på sjukhus

8 januari 2026 — OpenAI lanserar ett företagserbjudande dedikerat till hälso- och sjukvårdssektorn, skilt från ChatGPT Health som tillkännagavs dagen innan.

🔗 Officiellt tillkännagivande

Skillnad mot ChatGPT Health

Produkt	Målgrupp	Fokus
ChatGPT Health	Allmänheten	Personligt välbefinnande, koppling till hälsoappar
OpenAI for Healthcare	Företag	Sjukhus, kliniker, kliniska arbetsflöden

ChatGPT for Healthcare

En företagsversion av ChatGPT utformad för vårdorganisationer:

Hälsooptimerade modeller: GPT-5.2 med utvärderingar av 260+ läkare i 60 länder på HealthBench
Transparenta medicinska citeringar: Svar med källor från peer-reviewed studier, kliniska riktlinjer, med titlar, tidskrifter och datum
Institutionell anpassning: SharePoint-integration för att respektera anläggningens protokoll och vägar
Återanvändbara mallar: Utskrivningssammanfattningar, patientinstruktioner, kliniska brev, stöd för förhandsgodkännande

Lanseringspartners

Institution	Specialitet
Boston Children’s Hospital	Pediatrik
Stanford Medicine Children’s Health	Pediatrik
Memorial Sloan Kettering	Onkologi
Cedars-Sinai Medical Center	Allmänt sjukhus
HCA Healthcare	Sjukhusnätverk
UCSF	Akademiskt medicinskt center
AdventHealth	Sjukhusnätverk
Baylor Scott & White Health	Sjukhusnätverk

HIPAA-efterlevnad

Aspekt	Stöd
BAA	Business Associate Agreement med OpenAI
Data residency	Alternativ för datalagringsplats
Audit logs	Omfattande granskningsloggar
Encryption	Kundhanterade krypteringsnycklar
Träning	Data används inte för att träna modellerna

Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.

🇸🇪 Hälso- och sjukvård är bland de snabbast växande företagsmarknaderna som antar AI, och sjukhus och akademiska medicinska centra rullar redan ut ChatGPT for Healthcare över sina team. — OpenAI

ElevenLabs Scribe v2: nästa generations transkribering

9 januari 2026 — ElevenLabs tillkännager tillgängligheten av Scribe v2 API för utvecklare och företag.

🔗 Dokumentation Scribe v2 | X-tråd

Huvudfunktioner

Funktion	Detaljer
Språk	90+ språk som stöds
Keyterm prompting	Upp till 100 termer för att styra modellen mot specifika ord
Entity detection	56 entitetstyper (namn, kortnummer, medicinska tillstånd, SSN)
Speaker diarization	Upp till 48 olika talare
Timestamps	Precision på ordnivå
Audio tagging	Automatisk detektering av ljudhändelser (skratt, applåder)

Realtime-version

Scribe v2 finns också i en realtidsversion:

Mätvärde	Prestanda
Latens	~150ms
Språk	90+
Transkribering	Realtid via WebSockets

Företagsefterlevnad

ElevenLabs erbjuder ett Business Associate Agreement (BAA) för kunder som kräver HIPAA-efterlevnad, vilket gör Scribe v2 användbar i medicinska sammanhang.

With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.

🇸🇪 Med Scribe v2 kan utvecklare och företag automatisera komplexa ljudpipelines, uppnå högre noggrannhet i globala innehållsarbetsflöden och skala med full efterlevnad och kontroller för datalagringsplats. — @elevenlabsio

Vad detta innebär

Anthropic fortsätter att leda inom LLM-säkerhet. Kombinationen av tolkningsbarhet + klassificerarkaskad är elegant: att använda Claudes “gut instincts” för att upptäcka attacker är svårare att kringgå än explicita regler. 87% minskning av falska avvisningar är avgörande för företagsadoption.

OpenAI attackerar frontalt B2B-hälsovårdsmarknaden, en av de mest reglerade sektorerna. Det kompletta erbjudandet med HIPAA, BAA och prestigefyllda sjukhuspartnerskap positionerar OpenAI for Healthcare som ett seriöst alternativ till äldre lösningar. Differentieringen med ChatGPT Health (B2C) visar en mogen produktstrategi.

ElevenLabs kompletterar sin ljudstack med en toppmodern STT. Kombinationen TTS (röst) + STT (transkribering) + HIPAA-efterlevnad gör det till en full-stack-lösning för företags röstapplikationer. Keyterm prompting är särskilt användbart för tekniska termer eller egennamn.