Questa settimana nell’IA
Giornata intensa di annunci importanti: Anthropic pubblica un paper di ricerca sulla sicurezza degli LLM dopo 1700 ore di red-teaming intensivo. OpenAI lancia un’offerta enterprise dedicata agli ospedali con supporto HIPAA. ElevenLabs svela Scribe v2, il suo nuovo modello di trascrizione speech-to-text.
Constitutional Classifiers++: Anthropic rafforza la sicurezza
9 gennaio 2026 — Anthropic pubblica un nuovo importante paper di ricerca sulla robustezza delle sue difese contro i jailbreak.
Il contesto
L’anno scorso, Anthropic aveva introdotto i Constitutional Classifiers, un sistema che addestra classificatori basandosi su una “costituzione” che specifica a quali richieste Claude deve o non deve rispondere. Questo sistema aveva ridotto il tasso di successo dei jailbreak dall’86% al 4,4%, ma presentava due problemi: costoso in termini di calcolo e tendenza a rifiutare richieste legittime.
Tre innovazioni chiave
Il nuovo sistema Constitutional Classifiers++ apporta tre miglioramenti principali:
| Innovazione | Descrizione |
|---|---|
| Exchange Classifiers | Valutano le risposte nel loro contesto conversazionale completo, correggendo la vulnerabilità dei sistemi precedenti che esaminavano gli output in isolamento |
| Two-Stage Cascade | Classificatori leggeri filtrano tutto il traffico, scalando solo gli scambi sospetti verso classificatori più potenti |
| Linear Probes | Applicazione pratica dell’interpretabilità: sonde osservano le attivazioni interne di Claude (“gut instincts”) per rilevare richieste sospette |
Risultati
| Metrica | Performance |
|---|---|
| Riduzione dei costi | 40x rispetto alla baseline |
| Compute overhead | Solo ~1% |
| Tasso di rifiuto produzione | 0,05% |
| Calo falsi rifiuti | 87% |
| Red-teaming | 1700h senza jailbreak universale |
After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.
🇮🇹 Dopo 1700 ore accumulate di red-teaming, non abbiamo ancora identificato un jailbreak universale (una strategia di attacco coerente che funzioni su molte query) che funzioni sul nostro nuovo sistema. — @AnthropicAI
Perché è importante
Il sistema utilizza le attivazioni interne di Claude come un “istinto” difficile da ingannare. Quando la sonda rileva una richiesta sospetta, la invia a un classificatore “exchange” più potente che analizza entrambi i lati della conversazione. Questa architettura a cascata permette di avere una protezione robusta senza il costo computazionale proibitivo delle generazioni precedenti.
OpenAI for Healthcare: l’IA entra negli ospedali
8 gennaio 2026 — OpenAI lancia un’offerta enterprise dedicata al settore sanitario, distinta da ChatGPT Health annunciato il giorno prima.
Differenza con ChatGPT Health
| Prodotto | Target | Focus |
|---|---|---|
| ChatGPT Health | Grande pubblico | Benessere personale, connessione app salute |
| OpenAI for Healthcare | Aziende | Ospedali, cliniche, workflow clinici |
ChatGPT for Healthcare
Una versione enterprise di ChatGPT progettata per le organizzazioni sanitarie:
- Modelli ottimizzati salute: GPT-5.2 con valutazioni da parte di 260+ medici in 60 paesi su HealthBench
- Citazioni mediche trasparenti: Risposte con fonti da studi peer-reviewed, linee guida cliniche, con titoli, riviste e date
- Allineamento istituzionale: Integrazione SharePoint per rispettare i protocolli e i percorsi della struttura
- Template riutilizzabili: Riassunti di dimissione, istruzioni per i pazienti, lettere cliniche, supporto autorizzazione preventiva
Partner di lancio
| Istituzione | Specialità |
|---|---|
| Boston Children’s Hospital | Pediatria |
| Stanford Medicine Children’s Health | Pediatria |
| Memorial Sloan Kettering | Oncologia |
| Cedars-Sinai Medical Center | Ospedale generale |
| HCA Healthcare | Rete ospedaliera |
| UCSF | Centro medico accademico |
| AdventHealth | Rete ospedaliera |
| Baylor Scott & White Health | Rete ospedaliera |
Conformità HIPAA
| Aspetto | Supporto |
|---|---|
| BAA | Business Associate Agreement con OpenAI |
| Data residency | Opzioni di residenza dei dati |
| Audit logs | Log di audit completi |
| Encryption | Chiavi di cifratura gestite dal cliente |
| Training | Dati non utilizzati per addestrare i modelli |
Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.
🇮🇹 Il settore sanitario è tra i mercati enterprise a più rapida crescita nell’adozione dell’IA, e gli ospedali e i centri medici accademici stanno già distribuendo ChatGPT for Healthcare tra i loro team. — OpenAI
ElevenLabs Scribe v2: trascrizione di nuova generazione
9 gennaio 2026 — ElevenLabs annuncia la disponibilità dell’API Scribe v2 per sviluppatori e aziende.
🔗 Documentazione Scribe v2 | Thread X
Capacità principali
| Feature | Dettagli |
|---|---|
| Lingue | 90+ lingue supportate |
| Keyterm prompting | Fino a 100 termini per indirizzare il modello verso parole specifiche |
| Entity detection | 56 tipi di entità (nomi, numeri di carta, condizioni mediche, SSN) |
| Speaker diarization | Fino a 48 interlocutori distinti |
| Timestamps | Precisione a livello di parola |
| Audio tagging | Rilevamento automatico di eventi audio (risate, applausi) |
Versione Realtime
Scribe v2 esiste anche in versione tempo reale:
| Metrica | Performance |
|---|---|
| Latenza | ~150ms |
| Lingue | 90+ |
| Trascrizione | Tempo reale via WebSockets |
Conformità enterprise
ElevenLabs offre un Business Associate Agreement (BAA) per i clienti che richiedono conformità HIPAA, rendendo Scribe v2 utilizzabile in contesti medici.
With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.
🇮🇹 Con Scribe v2, sviluppatori e aziende possono automatizzare pipeline audio complesse, ottenere una maggiore precisione nei workflow di contenuti globali e scalare con piena conformità e controlli sulla residenza dei dati. — @elevenlabsio
Cosa significa
Anthropic continua a guidare sulla sicurezza degli LLM. La combinazione interpretabilità + cascata di classificatori è elegante: usare gli “istinti” di Claude per rilevare attacchi è più difficile da aggirare rispetto a regole esplicite. L’87% di riduzione dei falsi rifiuti è cruciale per l’adozione enterprise.
OpenAI attacca frontalmente il mercato healthcare B2B, uno dei settori più regolamentati. L’offerta completa con HIPAA, BAA e partnership ospedaliere prestigiose posiziona OpenAI for Healthcare come una seria alternativa alle soluzioni legacy. La differenziazione con ChatGPT Health (B2C) mostra una strategia di prodotto matura.
ElevenLabs completa il suo stack audio con un STT all’avanguardia. La combinazione TTS (voce) + STT (trascrizione) + conformità HIPAA lo rende una soluzione full-stack per le applicazioni vocali enterprise. Il keyterm prompting è particolarmente utile per termini tecnici o nomi propri.