Sök

AI Nyheter 9 januari 2026: Constitutional Classifiers++, OpenAI for Healthcare, Scribe v2

AI Nyheter 9 januari 2026: Constitutional Classifiers++, OpenAI for Healthcare, Scribe v2

Denna vecka inom AI

En hektisk dag med stora tillkännagivanden: Anthropic publicerar en forskningsrapport om LLM-säkerhet efter 1700 timmars intensiv red-teaming. OpenAI lanserar ett företagserbjudande dedikerat till sjukhus med HIPAA-stöd. ElevenLabs avslöjar Scribe v2, sin nya speech-to-text transkriberingsmodell.


Constitutional Classifiers++: Anthropic stärker säkerheten

9 januari 2026 — Anthropic publicerar en ny stor forskningsrapport om robustheten i sitt försvar mot jailbreaks.

🔗 Paper på arXiv | X-tråd

Kontexten

Förra året introducerade Anthropic Constitutional Classifiers, ett system som tränar klassificerare baserat på en “konstitution” som specificerar vilka frågor Claude ska eller inte ska svara på. Detta system hade minskat framgångsgraden för jailbreaks från 86% till 4,4%, men hade två problem: beräkningsmässigt dyrt och en tendens att neka legitima förfrågningar.

Tre nyckelinnovationer

Det nya systemet Constitutional Classifiers++ medför tre stora förbättringar:

InnovationBeskrivning
Exchange ClassifiersUtvärderar svar i sin fulla konversationskontext, vilket korrigerar sårbarheten hos tidigare system som granskade outputs isolerat
Two-Stage CascadeLättviktsklassificerare filtrerar all trafik och eskalerar endast misstänkta utbyten till kraftfullare klassificerare
Linear ProbesPraktisk tillämpning av tolkningsbarhet: sonder observerar Claudes interna aktiveringar (“gut instincts”) för att upptäcka misstänkta förfrågningar

Resultat

MätvärdePrestanda
Kostnadsminskning40x jämfört med baseline
Compute overheadEndast ~1%
Avvisningsfrekvens produktion0.05%
Minskning av falska avvisningar87%
Red-teaming1700h utan universell jailbreak

After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.

🇸🇪 Efter 1700 ackumulerade timmar av red-teaming har vi ännu inte identifierat en universell jailbreak (en konsekvent attackstrategi som fungerar över många förfrågningar) som fungerar på vårt nya system.@AnthropicAI

Varför det är viktigt

Systemet använder Claudes interna aktiveringar som en “instinkt” som är svår att lura. När sonden upptäcker en misstänkt förfrågan skickar den den till en kraftfullare “exchange”-klassificerare som analyserar båda sidor av konversationen. Denna kaskadarkitektur möjliggör ett robust skydd utan den oöverkomliga beräkningskostnaden från tidigare generationer.


OpenAI for Healthcare: AI gör entré på sjukhus

8 januari 2026 — OpenAI lanserar ett företagserbjudande dedikerat till hälso- och sjukvårdssektorn, skilt från ChatGPT Health som tillkännagavs dagen innan.

🔗 Officiellt tillkännagivande

Skillnad mot ChatGPT Health

ProduktMålgruppFokus
ChatGPT HealthAllmänhetenPersonligt välbefinnande, koppling till hälsoappar
OpenAI for HealthcareFöretagSjukhus, kliniker, kliniska arbetsflöden

ChatGPT for Healthcare

En företagsversion av ChatGPT utformad för vårdorganisationer:

  • Hälsooptimerade modeller: GPT-5.2 med utvärderingar av 260+ läkare i 60 länder på HealthBench
  • Transparenta medicinska citeringar: Svar med källor från peer-reviewed studier, kliniska riktlinjer, med titlar, tidskrifter och datum
  • Institutionell anpassning: SharePoint-integration för att respektera anläggningens protokoll och vägar
  • Återanvändbara mallar: Utskrivningssammanfattningar, patientinstruktioner, kliniska brev, stöd för förhandsgodkännande

Lanseringspartners

InstitutionSpecialitet
Boston Children’s HospitalPediatrik
Stanford Medicine Children’s HealthPediatrik
Memorial Sloan KetteringOnkologi
Cedars-Sinai Medical CenterAllmänt sjukhus
HCA HealthcareSjukhusnätverk
UCSFAkademiskt medicinskt center
AdventHealthSjukhusnätverk
Baylor Scott & White HealthSjukhusnätverk

HIPAA-efterlevnad

AspektStöd
BAABusiness Associate Agreement med OpenAI
Data residencyAlternativ för datalagringsplats
Audit logsOmfattande granskningsloggar
EncryptionKundhanterade krypteringsnycklar
TräningData används inte för att träna modellerna

Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.

🇸🇪 Hälso- och sjukvård är bland de snabbast växande företagsmarknaderna som antar AI, och sjukhus och akademiska medicinska centra rullar redan ut ChatGPT for Healthcare över sina team.OpenAI


ElevenLabs Scribe v2: nästa generations transkribering

9 januari 2026 — ElevenLabs tillkännager tillgängligheten av Scribe v2 API för utvecklare och företag.

🔗 Dokumentation Scribe v2 | X-tråd

Huvudfunktioner

FunktionDetaljer
Språk90+ språk som stöds
Keyterm promptingUpp till 100 termer för att styra modellen mot specifika ord
Entity detection56 entitetstyper (namn, kortnummer, medicinska tillstånd, SSN)
Speaker diarizationUpp till 48 olika talare
TimestampsPrecision på ordnivå
Audio taggingAutomatisk detektering av ljudhändelser (skratt, applåder)

Realtime-version

Scribe v2 finns också i en realtidsversion:

MätvärdePrestanda
Latens~150ms
Språk90+
TranskriberingRealtid via WebSockets

Företagsefterlevnad

ElevenLabs erbjuder ett Business Associate Agreement (BAA) för kunder som kräver HIPAA-efterlevnad, vilket gör Scribe v2 användbar i medicinska sammanhang.

With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.

🇸🇪 Med Scribe v2 kan utvecklare och företag automatisera komplexa ljudpipelines, uppnå högre noggrannhet i globala innehållsarbetsflöden och skala med full efterlevnad och kontroller för datalagringsplats.@elevenlabsio


Vad detta innebär

Anthropic fortsätter att leda inom LLM-säkerhet. Kombinationen av tolkningsbarhet + klassificerarkaskad är elegant: att använda Claudes “gut instincts” för att upptäcka attacker är svårare att kringgå än explicita regler. 87% minskning av falska avvisningar är avgörande för företagsadoption.

OpenAI attackerar frontalt B2B-hälsovårdsmarknaden, en av de mest reglerade sektorerna. Det kompletta erbjudandet med HIPAA, BAA och prestigefyllda sjukhuspartnerskap positionerar OpenAI for Healthcare som ett seriöst alternativ till äldre lösningar. Differentieringen med ChatGPT Health (B2C) visar en mogen produktstrategi.

ElevenLabs kompletterar sin ljudstack med en toppmodern STT. Kombinationen TTS (röst) + STT (transkribering) + HIPAA-efterlevnad gör det till en full-stack-lösning för företags röstapplikationer. Keyterm prompting är särskilt användbart för tekniska termer eller egennamn.


Källor