Cerca

Novità AI 9 gennaio 2026: Constitutional Classifiers++, OpenAI for Healthcare, Scribe v2

Novità AI 9 gennaio 2026: Constitutional Classifiers++, OpenAI for Healthcare, Scribe v2

Questa settimana nell’IA

Giornata intensa di annunci importanti: Anthropic pubblica un paper di ricerca sulla sicurezza degli LLM dopo 1700 ore di red-teaming intensivo. OpenAI lancia un’offerta enterprise dedicata agli ospedali con supporto HIPAA. ElevenLabs svela Scribe v2, il suo nuovo modello di trascrizione speech-to-text.


Constitutional Classifiers++: Anthropic rafforza la sicurezza

9 gennaio 2026 — Anthropic pubblica un nuovo importante paper di ricerca sulla robustezza delle sue difese contro i jailbreak.

🔗 Paper su arXiv | Thread X

Il contesto

L’anno scorso, Anthropic aveva introdotto i Constitutional Classifiers, un sistema che addestra classificatori basandosi su una “costituzione” che specifica a quali richieste Claude deve o non deve rispondere. Questo sistema aveva ridotto il tasso di successo dei jailbreak dall’86% al 4,4%, ma presentava due problemi: costoso in termini di calcolo e tendenza a rifiutare richieste legittime.

Tre innovazioni chiave

Il nuovo sistema Constitutional Classifiers++ apporta tre miglioramenti principali:

InnovazioneDescrizione
Exchange ClassifiersValutano le risposte nel loro contesto conversazionale completo, correggendo la vulnerabilità dei sistemi precedenti che esaminavano gli output in isolamento
Two-Stage CascadeClassificatori leggeri filtrano tutto il traffico, scalando solo gli scambi sospetti verso classificatori più potenti
Linear ProbesApplicazione pratica dell’interpretabilità: sonde osservano le attivazioni interne di Claude (“gut instincts”) per rilevare richieste sospette

Risultati

MetricaPerformance
Riduzione dei costi40x rispetto alla baseline
Compute overheadSolo ~1%
Tasso di rifiuto produzione0,05%
Calo falsi rifiuti87%
Red-teaming1700h senza jailbreak universale

After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.

🇮🇹 Dopo 1700 ore accumulate di red-teaming, non abbiamo ancora identificato un jailbreak universale (una strategia di attacco coerente che funzioni su molte query) che funzioni sul nostro nuovo sistema.@AnthropicAI

Perché è importante

Il sistema utilizza le attivazioni interne di Claude come un “istinto” difficile da ingannare. Quando la sonda rileva una richiesta sospetta, la invia a un classificatore “exchange” più potente che analizza entrambi i lati della conversazione. Questa architettura a cascata permette di avere una protezione robusta senza il costo computazionale proibitivo delle generazioni precedenti.


OpenAI for Healthcare: l’IA entra negli ospedali

8 gennaio 2026 — OpenAI lancia un’offerta enterprise dedicata al settore sanitario, distinta da ChatGPT Health annunciato il giorno prima.

🔗 Annuncio ufficiale

Differenza con ChatGPT Health

ProdottoTargetFocus
ChatGPT HealthGrande pubblicoBenessere personale, connessione app salute
OpenAI for HealthcareAziendeOspedali, cliniche, workflow clinici

ChatGPT for Healthcare

Una versione enterprise di ChatGPT progettata per le organizzazioni sanitarie:

  • Modelli ottimizzati salute: GPT-5.2 con valutazioni da parte di 260+ medici in 60 paesi su HealthBench
  • Citazioni mediche trasparenti: Risposte con fonti da studi peer-reviewed, linee guida cliniche, con titoli, riviste e date
  • Allineamento istituzionale: Integrazione SharePoint per rispettare i protocolli e i percorsi della struttura
  • Template riutilizzabili: Riassunti di dimissione, istruzioni per i pazienti, lettere cliniche, supporto autorizzazione preventiva

Partner di lancio

IstituzioneSpecialità
Boston Children’s HospitalPediatria
Stanford Medicine Children’s HealthPediatria
Memorial Sloan KetteringOncologia
Cedars-Sinai Medical CenterOspedale generale
HCA HealthcareRete ospedaliera
UCSFCentro medico accademico
AdventHealthRete ospedaliera
Baylor Scott & White HealthRete ospedaliera

Conformità HIPAA

AspettoSupporto
BAABusiness Associate Agreement con OpenAI
Data residencyOpzioni di residenza dei dati
Audit logsLog di audit completi
EncryptionChiavi di cifratura gestite dal cliente
TrainingDati non utilizzati per addestrare i modelli

Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.

🇮🇹 Il settore sanitario è tra i mercati enterprise a più rapida crescita nell’adozione dell’IA, e gli ospedali e i centri medici accademici stanno già distribuendo ChatGPT for Healthcare tra i loro team.OpenAI


ElevenLabs Scribe v2: trascrizione di nuova generazione

9 gennaio 2026 — ElevenLabs annuncia la disponibilità dell’API Scribe v2 per sviluppatori e aziende.

🔗 Documentazione Scribe v2 | Thread X

Capacità principali

FeatureDettagli
Lingue90+ lingue supportate
Keyterm promptingFino a 100 termini per indirizzare il modello verso parole specifiche
Entity detection56 tipi di entità (nomi, numeri di carta, condizioni mediche, SSN)
Speaker diarizationFino a 48 interlocutori distinti
TimestampsPrecisione a livello di parola
Audio taggingRilevamento automatico di eventi audio (risate, applausi)

Versione Realtime

Scribe v2 esiste anche in versione tempo reale:

MetricaPerformance
Latenza~150ms
Lingue90+
TrascrizioneTempo reale via WebSockets

Conformità enterprise

ElevenLabs offre un Business Associate Agreement (BAA) per i clienti che richiedono conformità HIPAA, rendendo Scribe v2 utilizzabile in contesti medici.

With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.

🇮🇹 Con Scribe v2, sviluppatori e aziende possono automatizzare pipeline audio complesse, ottenere una maggiore precisione nei workflow di contenuti globali e scalare con piena conformità e controlli sulla residenza dei dati.@elevenlabsio


Cosa significa

Anthropic continua a guidare sulla sicurezza degli LLM. La combinazione interpretabilità + cascata di classificatori è elegante: usare gli “istinti” di Claude per rilevare attacchi è più difficile da aggirare rispetto a regole esplicite. L’87% di riduzione dei falsi rifiuti è cruciale per l’adozione enterprise.

OpenAI attacca frontalmente il mercato healthcare B2B, uno dei settori più regolamentati. L’offerta completa con HIPAA, BAA e partnership ospedaliere prestigiose posiziona OpenAI for Healthcare come una seria alternativa alle soluzioni legacy. La differenziazione con ChatGPT Health (B2C) mostra una strategia di prodotto matura.

ElevenLabs completa il suo stack audio con un STT all’avanguardia. La combinazione TTS (voce) + STT (trascrizione) + conformità HIPAA lo rende una soluzione full-stack per le applicazioni vocali enterprise. Il keyterm prompting è particolarmente utile per termini tecnici o nomi propri.


Fonti