Cette semaine dans l’IA
Journée chargée en annonces majeures : Anthropic publie un papier de recherche sur la sécurité des LLMs après 1700 heures de red-teaming intensif. OpenAI lance une offre enterprise dédiée aux hôpitaux avec support HIPAA. ElevenLabs dévoile Scribe v2, son nouveau modèle de transcription speech-to-text.
Constitutional Classifiers++ : Anthropic renforce la sécurité
9 janvier 2026 — Anthropic publie un nouveau papier de recherche majeur sur la robustesse de ses défenses contre les jailbreaks.
Le contexte
L’année dernière, Anthropic avait introduit les Constitutional Classifiers, un système qui entraîne des classifiers à partir d’une “constitution” spécifiant les requêtes auxquelles Claude doit ou ne doit pas répondre. Ce système avait réduit le taux de succès des jailbreaks de 86% à 4.4%, mais présentait deux problèmes : coûteux en calcul et tendance à refuser des requêtes légitimes.
Trois innovations clés
Le nouveau système Constitutional Classifiers++ apporte trois améliorations majeures :
| Innovation | Description |
|---|---|
| Exchange Classifiers | Évaluent les réponses dans leur contexte conversationnel complet, corrigeant la vulnérabilité des systèmes précédents qui examinaient les outputs isolément |
| Cascade Two-Stage | Classifiers légers filtrent tout le trafic, escaladent seulement les échanges suspects vers des classifiers plus puissants |
| Linear Probes | Application pratique de l’interprétabilité : des sondes observent les activations internes de Claude (“gut instincts”) pour détecter les requêtes suspectes |
Résultats
| Métrique | Performance |
|---|---|
| Réduction des coûts | 40x par rapport au baseline |
| Compute overhead | ~1% seulement |
| Taux de refus production | 0.05% |
| Baisse faux refus | 87% |
| Red-teaming | 1700h sans jailbreak universel |
After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.
🇫🇷 Après 1700 heures cumulées de red-teaming, nous n’avons pas encore identifié de jailbreak universel (une stratégie d’attaque consistante qui fonctionne sur de nombreuses requêtes) qui fonctionne sur notre nouveau système. — @AnthropicAI
Pourquoi c’est important
Le système utilise les activations internes de Claude comme un “instinct” difficile à tromper. Quand la sonde détecte une requête suspecte, elle l’envoie vers un classifier “exchange” plus puissant qui analyse les deux côtés de la conversation. Cette architecture en cascade permet d’avoir une protection robuste sans le coût computationnel prohibitif des générations précédentes.
OpenAI for Healthcare : l’IA entre dans les hôpitaux
8 janvier 2026 — OpenAI lance une offre enterprise dédiée au secteur de la santé, distincte de ChatGPT Health annoncé la veille.
Différence avec ChatGPT Health
| Produit | Cible | Focus |
|---|---|---|
| ChatGPT Health | Grand public | Bien-être personnel, connexion apps santé |
| OpenAI for Healthcare | Entreprises | Hôpitaux, cliniques, workflows cliniques |
ChatGPT for Healthcare
Une version enterprise de ChatGPT conçue pour les organisations de santé :
- Modèles optimisés santé : GPT-5.2 avec évaluations par 260+ médecins dans 60 pays sur HealthBench
- Citations médicales transparentes : Réponses sourcées depuis des études peer-reviewed, guidelines cliniques, avec titres, journaux et dates
- Alignement institutionnel : Intégration SharePoint pour respecter les protocoles et pathways de l’établissement
- Templates réutilisables : Résumés de sortie, instructions patient, lettres cliniques, support autorisation préalable
Partenaires de lancement
| Institution | Spécialité |
|---|---|
| Boston Children’s Hospital | Pédiatrie |
| Stanford Medicine Children’s Health | Pédiatrie |
| Memorial Sloan Kettering | Oncologie |
| Cedars-Sinai Medical Center | Hôpital général |
| HCA Healthcare | Réseau hospitalier |
| UCSF | Centre médical académique |
| AdventHealth | Réseau hospitalier |
| Baylor Scott & White Health | Réseau hospitalier |
Conformité HIPAA
| Aspect | Support |
|---|---|
| BAA | Business Associate Agreement avec OpenAI |
| Data residency | Options de résidence des données |
| Audit logs | Journaux d’audit complets |
| Encryption | Clés de chiffrement gérées par le client |
| Entraînement | Données non utilisées pour entraîner les modèles |
Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.
🇫🇷 Le secteur de la santé est l’un des marchés enterprise à la croissance la plus rapide pour l’adoption de l’IA, et les hôpitaux et centres médicaux académiques déploient déjà ChatGPT for Healthcare au sein de leurs équipes. — OpenAI
ElevenLabs Scribe v2 : transcription nouvelle génération
9 janvier 2026 — ElevenLabs annonce la disponibilité de l’API Scribe v2 pour les développeurs et entreprises.
🔗 Documentation Scribe v2 | Thread X
Capacités principales
| Feature | Détails |
|---|---|
| Langues | 90+ langues supportées |
| Keyterm prompting | Jusqu’à 100 termes pour biaiser le modèle vers des mots spécifiques |
| Entity detection | 56 types d’entités (noms, numéros de carte, conditions médicales, SSN) |
| Speaker diarization | Jusqu’à 48 speakers distincts |
| Timestamps | Précision au niveau du mot |
| Audio tagging | Détection automatique des événements audio (rires, applaudissements) |
Version Realtime
Scribe v2 existe aussi en version temps réel :
| Métrique | Performance |
|---|---|
| Latence | ~150ms |
| Langues | 90+ |
| Transcription | Temps réel via WebSockets |
Conformité enterprise
ElevenLabs propose un Business Associate Agreement (BAA) pour les clients nécessitant une conformité HIPAA, rendant Scribe v2 utilisable dans des contextes médicaux.
With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.
🇫🇷 Avec Scribe v2, les développeurs et entreprises peuvent automatiser des pipelines audio complexes, atteindre une précision accrue dans les workflows de contenu global, et scaler avec un contrôle total sur la conformité et la résidence des données. — @elevenlabsio
Ce que ça signifie
Anthropic continue de mener sur la sécurité des LLMs. La combinaison interprétabilité + cascade de classifiers est élégante : utiliser les “gut instincts” de Claude pour détecter les attaques est plus difficile à contourner que des règles explicites. Le 87% de réduction des faux refus est crucial pour l’adoption enterprise.
OpenAI attaque frontalement le marché healthcare B2B, l’un des secteurs les plus réglementés. L’offre complète avec HIPAA, BAA et partenariats hospitaliers prestigieux positionne OpenAI for Healthcare comme une alternative sérieuse aux solutions legacy. La différenciation avec ChatGPT Health (B2C) montre une stratégie produit mature.
ElevenLabs complète sa stack audio avec un STT de pointe. La combinaison TTS (voix) + STT (transcription) + conformité HIPAA en fait une solution full-stack pour les applications vocales enterprise. Le keyterm prompting est particulièrement utile pour les termes techniques ou noms propres.