Denna vecka inom AI
En hektisk dag med stora tillkännagivanden: Anthropic publicerar en forskningsrapport om LLM-säkerhet efter 1700 timmars intensiv red-teaming. OpenAI lanserar ett företagserbjudande dedikerat till sjukhus med HIPAA-stöd. ElevenLabs avslöjar Scribe v2, sin nya speech-to-text transkriberingsmodell.
Constitutional Classifiers++: Anthropic stärker säkerheten
9 januari 2026 — Anthropic publicerar en ny stor forskningsrapport om robustheten i sitt försvar mot jailbreaks.
🔗 Paper på arXiv | X-tråd
Kontexten
Förra året introducerade Anthropic Constitutional Classifiers, ett system som tränar klassificerare baserat på en “konstitution” som specificerar vilka frågor Claude ska eller inte ska svara på. Detta system hade minskat framgångsgraden för jailbreaks från 86% till 4,4%, men hade två problem: beräkningsmässigt dyrt och en tendens att neka legitima förfrågningar.
Tre nyckelinnovationer
Det nya systemet Constitutional Classifiers++ medför tre stora förbättringar:
| Innovation | Beskrivning |
|---|---|
| Exchange Classifiers | Utvärderar svar i sin fulla konversationskontext, vilket korrigerar sårbarheten hos tidigare system som granskade outputs isolerat |
| Two-Stage Cascade | Lättviktsklassificerare filtrerar all trafik och eskalerar endast misstänkta utbyten till kraftfullare klassificerare |
| Linear Probes | Praktisk tillämpning av tolkningsbarhet: sonder observerar Claudes interna aktiveringar (“gut instincts”) för att upptäcka misstänkta förfrågningar |
Resultat
| Mätvärde | Prestanda |
|---|---|
| Kostnadsminskning | 40x jämfört med baseline |
| Compute overhead | Endast ~1% |
| Avvisningsfrekvens produktion | 0.05% |
| Minskning av falska avvisningar | 87% |
| Red-teaming | 1700h utan universell jailbreak |
After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.
🇸🇪 Efter 1700 ackumulerade timmar av red-teaming har vi ännu inte identifierat en universell jailbreak (en konsekvent attackstrategi som fungerar över många förfrågningar) som fungerar på vårt nya system. — @AnthropicAI
Varför det är viktigt
Systemet använder Claudes interna aktiveringar som en “instinkt” som är svår att lura. När sonden upptäcker en misstänkt förfrågan skickar den den till en kraftfullare “exchange”-klassificerare som analyserar båda sidor av konversationen. Denna kaskadarkitektur möjliggör ett robust skydd utan den oöverkomliga beräkningskostnaden från tidigare generationer.
OpenAI for Healthcare: AI gör entré på sjukhus
8 januari 2026 — OpenAI lanserar ett företagserbjudande dedikerat till hälso- och sjukvårdssektorn, skilt från ChatGPT Health som tillkännagavs dagen innan.
Skillnad mot ChatGPT Health
| Produkt | Målgrupp | Fokus |
|---|---|---|
| ChatGPT Health | Allmänheten | Personligt välbefinnande, koppling till hälsoappar |
| OpenAI for Healthcare | Företag | Sjukhus, kliniker, kliniska arbetsflöden |
ChatGPT for Healthcare
En företagsversion av ChatGPT utformad för vårdorganisationer:
- Hälsooptimerade modeller: GPT-5.2 med utvärderingar av 260+ läkare i 60 länder på HealthBench
- Transparenta medicinska citeringar: Svar med källor från peer-reviewed studier, kliniska riktlinjer, med titlar, tidskrifter och datum
- Institutionell anpassning: SharePoint-integration för att respektera anläggningens protokoll och vägar
- Återanvändbara mallar: Utskrivningssammanfattningar, patientinstruktioner, kliniska brev, stöd för förhandsgodkännande
Lanseringspartners
| Institution | Specialitet |
|---|---|
| Boston Children’s Hospital | Pediatrik |
| Stanford Medicine Children’s Health | Pediatrik |
| Memorial Sloan Kettering | Onkologi |
| Cedars-Sinai Medical Center | Allmänt sjukhus |
| HCA Healthcare | Sjukhusnätverk |
| UCSF | Akademiskt medicinskt center |
| AdventHealth | Sjukhusnätverk |
| Baylor Scott & White Health | Sjukhusnätverk |
HIPAA-efterlevnad
| Aspekt | Stöd |
|---|---|
| BAA | Business Associate Agreement med OpenAI |
| Data residency | Alternativ för datalagringsplats |
| Audit logs | Omfattande granskningsloggar |
| Encryption | Kundhanterade krypteringsnycklar |
| Träning | Data används inte för att träna modellerna |
Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.
🇸🇪 Hälso- och sjukvård är bland de snabbast växande företagsmarknaderna som antar AI, och sjukhus och akademiska medicinska centra rullar redan ut ChatGPT for Healthcare över sina team. — OpenAI
ElevenLabs Scribe v2: nästa generations transkribering
9 januari 2026 — ElevenLabs tillkännager tillgängligheten av Scribe v2 API för utvecklare och företag.
🔗 Dokumentation Scribe v2 | X-tråd
Huvudfunktioner
| Funktion | Detaljer |
|---|---|
| Språk | 90+ språk som stöds |
| Keyterm prompting | Upp till 100 termer för att styra modellen mot specifika ord |
| Entity detection | 56 entitetstyper (namn, kortnummer, medicinska tillstånd, SSN) |
| Speaker diarization | Upp till 48 olika talare |
| Timestamps | Precision på ordnivå |
| Audio tagging | Automatisk detektering av ljudhändelser (skratt, applåder) |
Realtime-version
Scribe v2 finns också i en realtidsversion:
| Mätvärde | Prestanda |
|---|---|
| Latens | ~150ms |
| Språk | 90+ |
| Transkribering | Realtid via WebSockets |
Företagsefterlevnad
ElevenLabs erbjuder ett Business Associate Agreement (BAA) för kunder som kräver HIPAA-efterlevnad, vilket gör Scribe v2 användbar i medicinska sammanhang.
With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.
🇸🇪 Med Scribe v2 kan utvecklare och företag automatisera komplexa ljudpipelines, uppnå högre noggrannhet i globala innehållsarbetsflöden och skala med full efterlevnad och kontroller för datalagringsplats. — @elevenlabsio
Vad detta innebär
Anthropic fortsätter att leda inom LLM-säkerhet. Kombinationen av tolkningsbarhet + klassificerarkaskad är elegant: att använda Claudes “gut instincts” för att upptäcka attacker är svårare att kringgå än explicita regler. 87% minskning av falska avvisningar är avgörande för företagsadoption.
OpenAI attackerar frontalt B2B-hälsovårdsmarknaden, en av de mest reglerade sektorerna. Det kompletta erbjudandet med HIPAA, BAA och prestigefyllda sjukhuspartnerskap positionerar OpenAI for Healthcare som ett seriöst alternativ till äldre lösningar. Differentieringen med ChatGPT Health (B2C) visar en mogen produktstrategi.
ElevenLabs kompletterar sin ljudstack med en toppmodern STT. Kombinationen TTS (röst) + STT (transkribering) + HIPAA-efterlevnad gör det till en full-stack-lösning för företags röstapplikationer. Keyterm prompting är särskilt användbart för tekniska termer eller egennamn.