IA Actualités du 9 janvier 2026 : Constitutional Classifiers++, OpenAI for Healthcare, Scribe v2

Cette semaine dans l’IA

Journée chargée en annonces majeures : Anthropic publie un papier de recherche sur la sécurité des LLMs après 1700 heures de red-teaming intensif. OpenAI lance une offre enterprise dédiée aux hôpitaux avec support HIPAA. ElevenLabs dévoile Scribe v2, son nouveau modèle de transcription speech-to-text.

Constitutional Classifiers++ : Anthropic renforce la sécurité

9 janvier 2026 — Anthropic publie un nouveau papier de recherche majeur sur la robustesse de ses défenses contre les jailbreaks.

🔗 Papier sur arXiv | Thread X

Le contexte

L’année dernière, Anthropic avait introduit les Constitutional Classifiers, un système qui entraîne des classifiers à partir d’une “constitution” spécifiant les requêtes auxquelles Claude doit ou ne doit pas répondre. Ce système avait réduit le taux de succès des jailbreaks de 86% à 4.4%, mais présentait deux problèmes : coûteux en calcul et tendance à refuser des requêtes légitimes.

Trois innovations clés

Le nouveau système Constitutional Classifiers++ apporte trois améliorations majeures :

Innovation	Description
Exchange Classifiers	Évaluent les réponses dans leur contexte conversationnel complet, corrigeant la vulnérabilité des systèmes précédents qui examinaient les outputs isolément
Cascade Two-Stage	Classifiers légers filtrent tout le trafic, escaladent seulement les échanges suspects vers des classifiers plus puissants
Linear Probes	Application pratique de l’interprétabilité : des sondes observent les activations internes de Claude (“gut instincts”) pour détecter les requêtes suspectes

Résultats

Métrique	Performance
Réduction des coûts	40x par rapport au baseline
Compute overhead	~1% seulement
Taux de refus production	0.05%
Baisse faux refus	87%
Red-teaming	1700h sans jailbreak universel

After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.

🇫🇷 Après 1700 heures cumulées de red-teaming, nous n’avons pas encore identifié de jailbreak universel (une stratégie d’attaque consistante qui fonctionne sur de nombreuses requêtes) qui fonctionne sur notre nouveau système. — @AnthropicAI

Pourquoi c’est important

Le système utilise les activations internes de Claude comme un “instinct” difficile à tromper. Quand la sonde détecte une requête suspecte, elle l’envoie vers un classifier “exchange” plus puissant qui analyse les deux côtés de la conversation. Cette architecture en cascade permet d’avoir une protection robuste sans le coût computationnel prohibitif des générations précédentes.

OpenAI for Healthcare : l’IA entre dans les hôpitaux

8 janvier 2026 — OpenAI lance une offre enterprise dédiée au secteur de la santé, distincte de ChatGPT Health annoncé la veille.

🔗 Annonce officielle

Différence avec ChatGPT Health

Produit	Cible	Focus
ChatGPT Health	Grand public	Bien-être personnel, connexion apps santé
OpenAI for Healthcare	Entreprises	Hôpitaux, cliniques, workflows cliniques

ChatGPT for Healthcare

Une version enterprise de ChatGPT conçue pour les organisations de santé :

Modèles optimisés santé : GPT-5.2 avec évaluations par 260+ médecins dans 60 pays sur HealthBench
Citations médicales transparentes : Réponses sourcées depuis des études peer-reviewed, guidelines cliniques, avec titres, journaux et dates
Alignement institutionnel : Intégration SharePoint pour respecter les protocoles et pathways de l’établissement
Templates réutilisables : Résumés de sortie, instructions patient, lettres cliniques, support autorisation préalable

Partenaires de lancement

Institution	Spécialité
Boston Children’s Hospital	Pédiatrie
Stanford Medicine Children’s Health	Pédiatrie
Memorial Sloan Kettering	Oncologie
Cedars-Sinai Medical Center	Hôpital général
HCA Healthcare	Réseau hospitalier
UCSF	Centre médical académique
AdventHealth	Réseau hospitalier
Baylor Scott & White Health	Réseau hospitalier

Conformité HIPAA

Aspect	Support
BAA	Business Associate Agreement avec OpenAI
Data residency	Options de résidence des données
Audit logs	Journaux d’audit complets
Encryption	Clés de chiffrement gérées par le client
Entraînement	Données non utilisées pour entraîner les modèles

Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.

🇫🇷 Le secteur de la santé est l’un des marchés enterprise à la croissance la plus rapide pour l’adoption de l’IA, et les hôpitaux et centres médicaux académiques déploient déjà ChatGPT for Healthcare au sein de leurs équipes. — OpenAI

ElevenLabs Scribe v2 : transcription nouvelle génération

9 janvier 2026 — ElevenLabs annonce la disponibilité de l’API Scribe v2 pour les développeurs et entreprises.

🔗 Documentation Scribe v2 | Thread X

Capacités principales

Feature	Détails
Langues	90+ langues supportées
Keyterm prompting	Jusqu’à 100 termes pour biaiser le modèle vers des mots spécifiques
Entity detection	56 types d’entités (noms, numéros de carte, conditions médicales, SSN)
Speaker diarization	Jusqu’à 48 speakers distincts
Timestamps	Précision au niveau du mot
Audio tagging	Détection automatique des événements audio (rires, applaudissements)

Version Realtime

Scribe v2 existe aussi en version temps réel :

Métrique	Performance
Latence	~150ms
Langues	90+
Transcription	Temps réel via WebSockets

Conformité enterprise

ElevenLabs propose un Business Associate Agreement (BAA) pour les clients nécessitant une conformité HIPAA, rendant Scribe v2 utilisable dans des contextes médicaux.

With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.

🇫🇷 Avec Scribe v2, les développeurs et entreprises peuvent automatiser des pipelines audio complexes, atteindre une précision accrue dans les workflows de contenu global, et scaler avec un contrôle total sur la conformité et la résidence des données. — @elevenlabsio

Ce que ça signifie

Anthropic continue de mener sur la sécurité des LLMs. La combinaison interprétabilité + cascade de classifiers est élégante : utiliser les “gut instincts” de Claude pour détecter les attaques est plus difficile à contourner que des règles explicites. Le 87% de réduction des faux refus est crucial pour l’adoption enterprise.

OpenAI attaque frontalement le marché healthcare B2B, l’un des secteurs les plus réglementés. L’offre complète avec HIPAA, BAA et partenariats hospitaliers prestigieux positionne OpenAI for Healthcare comme une alternative sérieuse aux solutions legacy. La différenciation avec ChatGPT Health (B2C) montre une stratégie produit mature.

ElevenLabs complète sa stack audio avec un STT de pointe. La combinaison TTS (voix) + STT (transcription) + conformité HIPAA en fait une solution full-stack pour les applications vocales enterprise. Le keyterm prompting est particulièrement utile pour les termes techniques ou noms propres.