Novità AI 9 gennaio 2026: Constitutional Classifiers++, OpenAI for Healthcare, Scribe v2

Questa settimana nell’IA

Giornata intensa di annunci importanti: Anthropic pubblica un paper di ricerca sulla sicurezza degli LLM dopo 1700 ore di red-teaming intensivo. OpenAI lancia un’offerta enterprise dedicata agli ospedali con supporto HIPAA. ElevenLabs svela Scribe v2, il suo nuovo modello di trascrizione speech-to-text.

Constitutional Classifiers++: Anthropic rafforza la sicurezza

9 gennaio 2026 — Anthropic pubblica un nuovo importante paper di ricerca sulla robustezza delle sue difese contro i jailbreak.

🔗 Paper su arXiv | Thread X

Il contesto

L’anno scorso, Anthropic aveva introdotto i Constitutional Classifiers, un sistema che addestra classificatori basandosi su una “costituzione” che specifica a quali richieste Claude deve o non deve rispondere. Questo sistema aveva ridotto il tasso di successo dei jailbreak dall’86% al 4,4%, ma presentava due problemi: costoso in termini di calcolo e tendenza a rifiutare richieste legittime.

Tre innovazioni chiave

Il nuovo sistema Constitutional Classifiers++ apporta tre miglioramenti principali:

Innovazione	Descrizione
Exchange Classifiers	Valutano le risposte nel loro contesto conversazionale completo, correggendo la vulnerabilità dei sistemi precedenti che esaminavano gli output in isolamento
Two-Stage Cascade	Classificatori leggeri filtrano tutto il traffico, scalando solo gli scambi sospetti verso classificatori più potenti
Linear Probes	Applicazione pratica dell’interpretabilità: sonde osservano le attivazioni interne di Claude (“gut instincts”) per rilevare richieste sospette

Risultati

Metrica	Performance
Riduzione dei costi	40x rispetto alla baseline
Compute overhead	Solo ~1%
Tasso di rifiuto produzione	0,05%
Calo falsi rifiuti	87%
Red-teaming	1700h senza jailbreak universale

After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.

🇮🇹 Dopo 1700 ore accumulate di red-teaming, non abbiamo ancora identificato un jailbreak universale (una strategia di attacco coerente che funzioni su molte query) che funzioni sul nostro nuovo sistema. — @AnthropicAI

Perché è importante

Il sistema utilizza le attivazioni interne di Claude come un “istinto” difficile da ingannare. Quando la sonda rileva una richiesta sospetta, la invia a un classificatore “exchange” più potente che analizza entrambi i lati della conversazione. Questa architettura a cascata permette di avere una protezione robusta senza il costo computazionale proibitivo delle generazioni precedenti.

OpenAI for Healthcare: l’IA entra negli ospedali

8 gennaio 2026 — OpenAI lancia un’offerta enterprise dedicata al settore sanitario, distinta da ChatGPT Health annunciato il giorno prima.

🔗 Annuncio ufficiale

Differenza con ChatGPT Health

Prodotto	Target	Focus
ChatGPT Health	Grande pubblico	Benessere personale, connessione app salute
OpenAI for Healthcare	Aziende	Ospedali, cliniche, workflow clinici

ChatGPT for Healthcare

Una versione enterprise di ChatGPT progettata per le organizzazioni sanitarie:

Modelli ottimizzati salute: GPT-5.2 con valutazioni da parte di 260+ medici in 60 paesi su HealthBench
Citazioni mediche trasparenti: Risposte con fonti da studi peer-reviewed, linee guida cliniche, con titoli, riviste e date
Allineamento istituzionale: Integrazione SharePoint per rispettare i protocolli e i percorsi della struttura
Template riutilizzabili: Riassunti di dimissione, istruzioni per i pazienti, lettere cliniche, supporto autorizzazione preventiva

Partner di lancio

Istituzione	Specialità
Boston Children’s Hospital	Pediatria
Stanford Medicine Children’s Health	Pediatria
Memorial Sloan Kettering	Oncologia
Cedars-Sinai Medical Center	Ospedale generale
HCA Healthcare	Rete ospedaliera
UCSF	Centro medico accademico
AdventHealth	Rete ospedaliera
Baylor Scott & White Health	Rete ospedaliera

Conformità HIPAA

Aspetto	Supporto
BAA	Business Associate Agreement con OpenAI
Data residency	Opzioni di residenza dei dati
Audit logs	Log di audit completi
Encryption	Chiavi di cifratura gestite dal cliente
Training	Dati non utilizzati per addestrare i modelli

Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.

🇮🇹 Il settore sanitario è tra i mercati enterprise a più rapida crescita nell’adozione dell’IA, e gli ospedali e i centri medici accademici stanno già distribuendo ChatGPT for Healthcare tra i loro team. — OpenAI

ElevenLabs Scribe v2: trascrizione di nuova generazione

9 gennaio 2026 — ElevenLabs annuncia la disponibilità dell’API Scribe v2 per sviluppatori e aziende.

🔗 Documentazione Scribe v2 | Thread X

Capacità principali

Feature	Dettagli
Lingue	90+ lingue supportate
Keyterm prompting	Fino a 100 termini per indirizzare il modello verso parole specifiche
Entity detection	56 tipi di entità (nomi, numeri di carta, condizioni mediche, SSN)
Speaker diarization	Fino a 48 interlocutori distinti
Timestamps	Precisione a livello di parola
Audio tagging	Rilevamento automatico di eventi audio (risate, applausi)

Versione Realtime

Scribe v2 esiste anche in versione tempo reale:

Metrica	Performance
Latenza	~150ms
Lingue	90+
Trascrizione	Tempo reale via WebSockets

Conformità enterprise

ElevenLabs offre un Business Associate Agreement (BAA) per i clienti che richiedono conformità HIPAA, rendendo Scribe v2 utilizzabile in contesti medici.

With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.

🇮🇹 Con Scribe v2, sviluppatori e aziende possono automatizzare pipeline audio complesse, ottenere una maggiore precisione nei workflow di contenuti globali e scalare con piena conformità e controlli sulla residenza dei dati. — @elevenlabsio

Cosa significa

Anthropic continua a guidare sulla sicurezza degli LLM. La combinazione interpretabilità + cascata di classificatori è elegante: usare gli “istinti” di Claude per rilevare attacchi è più difficile da aggirare rispetto a regole esplicite. L’87% di riduzione dei falsi rifiuti è cruciale per l’adozione enterprise.

OpenAI attacca frontalmente il mercato healthcare B2B, uno dei settori più regolamentati. L’offerta completa con HIPAA, BAA e partnership ospedaliere prestigiose posiziona OpenAI for Healthcare come una seria alternativa alle soluzioni legacy. La differenziazione con ChatGPT Health (B2C) mostra una strategia di prodotto matura.

ElevenLabs completa il suo stack audio con un STT all’avanguardia. La combinazione TTS (voce) + STT (trascrizione) + conformità HIPAA lo rende una soluzione full-stack per le applicazioni vocali enterprise. Il keyterm prompting è particolarmente utile per termini tecnici o nomi propri.