Le 25 avril 2026 concentre des annonces majeures sur les modèles de frontière et les outils développeurs. DeepSeek-V4 est lancé open-source et disponible gratuitement sur NVIDIA Blackwell. GPT-5.5 entre en disponibilité générale dans GitHub Copilot et l’API OpenAI. La fusion Cohere + Aleph Alpha, soutenue par 600 millions de dollars de Schwarz Group, repose les bases de l’IA souveraine transatlantique. Du côté des outils, Claude Code v2.1.119 et le mode Auto-review de Codex étendent l’autonomie des agents de développement.
DeepSeek-V4 disponible partout
Lancement et open-source
24 avril — DeepSeek annonce simultanément DeepSeek-V4-Pro et DeepSeek-V4-Flash. V4-Pro est un modèle mixture-of-experts de 1,6 trillion de paramètres (49 milliards actifs), avec une fenêtre de contexte d’un million de tokens et des performances annoncées comparables aux meilleurs modèles fermés. V4-Flash, plus compact (284B/13B actifs), cible les cas d’usage à faible latence. Les deux modèles sont open-source dès le premier jour, avec API et démo disponibles immédiatement, et le rapport technique publié sur Hugging Face.
Promotion API et intégrations
25 avril — DeepSeek annonce une promotion de -75 % sur l’API V4-Pro jusqu’au 5 mai 2026 (15h59 UTC). Les intégrations Claude Code, OpenCode et OpenClaw ont été mises à jour pour supporter le nouveau modèle.
🔗 Promotion API DeepSeek-V4-Pro
DeepSeek-V4-Pro sur NVIDIA Blackwell, gratuitement
24 avril — NVIDIA rend DeepSeek-V4-Pro accessible gratuitement via l’interface NVIDIA NIM API sur Blackwell, sur build.nvidia.com. L’annonce a généré 160 000 vues. NVIDIA publie également les premières courbes de performance (Pareto frontier) de DeepSeek-V4-Pro sur Blackwell Ultra avec vLLM — un point de référence précoce pour les déploiements haute performance.
25 avril — NVIDIA souligne en parallèle les limites de l’inférence classique pour les agents de développement : “Traditional inference wasn’t built for agentic coding”, en référence aux centaines d’appels API que génèrent les outils agentiques modernes.
🔗 DeepSeek-V4-Pro sur NVIDIA NIM 🔗 Blackwell Ultra Day 0
GPT-5.5 sort de l’avant-première
Disponibilité générale dans GitHub Copilot
24 avril — GPT-5.5 est déployé progressivement dans GitHub Copilot pour les plans Pro+, Business et Enterprise. La disponibilité couvre VS Code, Visual Studio, la CLI Copilot, l’agent cloud, github.com, l’application mobile (iOS et Android), les IDE JetBrains, Xcode et Eclipse. Le multiplicateur promotionnel est fixé à 7,5×. Les administrateurs Enterprise et Business doivent activer la politique dans les paramètres pour en bénéficier.
🔗 Changelog GitHub Copilot — GPT-5.5 GA
Accès API développeurs
24 avril — Le lendemain du lancement grand public, OpenAI ouvre l’accès à GPT-5.5 dans l’API. Le modèle est disponible via l’API Responses et l’API Chat Completions, avec une fenêtre de contexte d’un million de tokens. La variante GPT-5.5-Pro, pour les travaux à haute précision, est accessible uniquement via l’API Responses.
“GPT-5.5 is available in the Responses and Chat Completions APIs with a 1M context window. GPT-5.5-pro is also available in the Responses API for higher-accuracy work.”
🇫🇷 “GPT-5.5 est disponible dans les API Responses et Chat Completions avec une fenêtre de contexte d’un million de tokens. GPT-5.5-Pro est également disponible dans l’API Responses pour les travaux à haute précision.” — @OpenAIDevs
GPT-5.5 sur Perplexity Max et Personal Computer
24 avril — GPT-5.5 est accessible aux abonnés Max sur Perplexity et déployé comme modèle d’orchestration par défaut dans Personal Computer pour les plans Pro et Max.
Bio Bug Bounty — programme de sécurité biosécurité
23 avril — OpenAI ouvre un programme de prime aux bugs dédié à la biosécurité de GPT-5.5. Des chercheurs spécialisés en sécurité IA ou biosécurité sont invités à trouver un jailbreak universel contournant les garde-fous biologiques du modèle. La récompense principale est de 25 000 USD pour le premier succès. Les candidatures sont ouvertes jusqu’au 22 juin 2026 ; les tests se dérouleront du 28 avril au 27 juillet 2026, exclusivement sur GPT-5.5 dans Codex Desktop, sur invitation avec accord de confidentialité.
Outils développeurs : autonomie en extension
Claude Code v2.1.119
25 avril — Anthropic publie Claude Code v2.1.119, une mise à jour substantielle du CLI avec plus de quarante changements.
| Domaine | Changement |
|---|---|
| Config | /config persistant dans ~/.claude/settings.json |
| PR | --from-pr supporte GitLab, Bitbucket, GitHub Enterprise |
| Hooks | PostToolUse + champ duration_ms |
| PowerShell | Auto-approbation en mode permission |
| MCP | Connexion serveurs subagent en parallèle |
| Bugs corrigés | 40+ |
La persistance des paramètres /config est le changement le plus visible : les préférences de thème, mode éditeur ou niveau verbose survivent aux redémarrages. Le paramètre --from-pr accepte désormais les URLs GitLab merge-request, Bitbucket pull-request et GitHub Enterprise, ce qui étend le workflow aux équipes qui n’utilisent pas GitHub.com. Les hooks PostToolUse et PostToolUseFailure reçoivent maintenant le champ duration_ms, utile pour le monitoring en CI/CD. La connexion des serveurs MCP se fait maintenant en parallèle, réduisant les temps de démarrage des workflows multi-serveurs.
Codex Auto-review — autonomie prolongée avec filet de sécurité
24 avril — OpenAI annonce Auto-review, un nouveau mode d’exécution pour Codex. Ce mode permet à Codex de progresser sur des tâches longues sans demander d’approbation à chaque étape. Un agent distinct évalue les étapes à risque élevé avant leur exécution, ce qui permet de fluidifier les workflows de tests, compilations et automations longues sans sacrifier la sécurité.
Copilot pour JetBrains : Inline Agent Mode en préversion
24 avril — La mise à jour du plugin Copilot pour JetBrains IDE apporte plusieurs fonctionnalités : le mode agent inline en préversion publique (raccourci Shift+Ctrl+I ou Shift+Cmd+I), les Next Edit Suggestions (NES) améliorées avec aperçus en filigrane et modifications distantes, et l’auto-approbation globale pour les appels d’outils agent.
NVIDIA Dynamo — l’inférence repensée pour les agents
25 avril — NVIDIA présente Dynamo, une refonte de la stack d’inférence pour répondre aux profils de charge des outils agentiques. Les agents comme Claude Code, Codex ou Copilot enchaînent des centaines d’appels API par session avec du contexte recomposé à chaque étape, créant des goulots qui font monter le coût par token. Dynamo combine quatre composants : routing sensible au cache KV, scheduling pensé pour les agents, mise en cache multi-niveaux et orchestration unifiée. NVIDIA annonce jusqu’à 7× de débit supplémentaire avec des taux de cache plus élevés et une latence réduite.
🔗 NVIDIA Dynamo — inférence agentique
Souveraineté et partenariats enterprise
Cohere + Aleph Alpha : fusion transatlantique avec 600 millions USD de Schwarz Group
24 avril — Cohere (Canada) et Aleph Alpha (Allemagne) annoncent leur projet de fusion. Schwarz Group — le groupe propriétaire de Lidl et Kaufland — investit 600 millions USD (environ 500 millions d’euros) en financement structuré pour la Series E de Cohere. La plateforme combinée sera hébergée sur STACKIT, le cloud souverain de Schwarz Digits.
“Sovereign AI for the world. Cohere & Aleph Alpha form transatlantic AI powerhouse anchored in Canada & Germany!”
🇫🇷 “L’IA souveraine pour le monde. Cohere et Aleph Alpha forment une puissance transatlantique de l’IA ancrée au Canada et en Allemagne !” — @cohere sur X
L’accord cible les secteurs régulés, les gouvernements et un marché de l’IA souveraine estimé à environ 600 milliards USD. Il reste conditionnel à l’approbation des actionnaires d’Aleph Alpha.
Anthropic et NEC : premier partenariat global japonais
24 avril — Anthropic annonce un partenariat stratégique avec NEC Corporation, qui devient le premier partenaire global japonais d’Anthropic. NEC déploiera Claude auprès d’environ 30 000 employés du groupe dans le monde.
| Aspect | Détail |
|---|---|
| Employés concernés | ~30 000 (NEC Group mondial) |
| Produits déployés | Claude, Claude Opus 4.7, Claude Code, Claude Cowork |
| Secteurs cibles | Finance, manufacturing, cybersécurité, gouvernement local |
| Programme | NEC BluStellar Scenario |
En interne, NEC met en place un Centre d’excellence pour former une équipe d’ingénierie IA à grande échelle, dans le cadre de l’initiative “Client Zero”. Pour ses clients, NEC et Anthropic développeront conjointement des solutions pour les secteurs de la finance, du manufacturing et des collectivités locales japonaises.
Meta s’associe à AWS pour l’IA agentique à milliards d’utilisateurs
24 avril — Meta annonce un accord avec AWS pour intégrer des dizaines de millions de cœurs Graviton5 dans son infrastructure. L’objectif est de supporter les workloads CPU intensifs de l’IA agentique destinée à des milliards d’utilisateurs.
Gemini : mises à jour produit et recherche
Gemini Drops avril 2026 — Lyria 3 Pro, Gemini Live v3.1
24 avril — Google publie la 10ème édition des Gemini Drops. Lyria 3 Pro permet de créer des morceaux musicaux jusqu’à 3 minutes directement dans Gemini, accessible aux abonnés Plus, Pro et Ultra. Gemini Live v3.1 est 20 % plus rapide et offre deux fois plus de contexte mémorisé. Personal Intelligence s’étend à l’international (hors Espace économique européen, Suisse, Royaume-Uni, Corée du Sud, Australie et Nigeria). La fonctionnalité de conversation à branches (branching) est déployée à 20 % des utilisateurs.
Gemini Embedding 2 en disponibilité générale
22 avril — Gemini Embedding 2 passe en disponibilité générale (GA) dans l’API Gemini et Vertex AI. Le modèle de représentation vectorielle cible la recherche sémantique, la génération augmentée par récupération (RAG) et la classification.
Decoupled DiLoCo — entraînement distribué multi-régions
23 avril — Google DeepMind publie Decoupled DiLoCo, une méthode d’entraînement distribué sur réseaux à faible bande passante. Gemma 12B a été entraîné sur 4 régions américaines avec un mix de TPU6e et TPUv5p. La méthode ouvre la voie à un entraînement de modèles décentralisé à l’échelle mondiale, sans nécessiter les interconnexions haut débit habituellement requis.
🔗 Decoupled DiLoCo — Google DeepMind
Modèles alternatifs : Qwen et Grok
Qwen3.6-27B — modèle dense flagship pour le coding agentique
22 avril — Alibaba publie Qwen3.6-27B, un modèle dense de 27 milliards de paramètres en open source sous licence Apache 2.0. Malgré sa taille compacte, il surpasse Qwen3.5-397B-A17B — un modèle MoE de 397 milliards de paramètres dont 17 milliards activés — sur les principaux benchmarks de coding agentique, avec un score SWE-Bench Verified à 77,2 % contre 76,2 % pour son prédécesseur. Trois axes sont mis en avant dans l’annonce : agentic coding qui surpasse l’ancienne génération sur tous les benchmarks majeurs, raisonnement solide en texte et multimodal, et déploiement dense sans complexité MoE.
Le modèle supporte les modes thinking et non-thinking dans un même checkpoint. Il est disponible sur Hugging Face (Qwen/Qwen3.6-27B, variante FP8 incluse) et ModelScope, avec un blog technique et un Github dédiés. L’annonce a généré 3,5 millions de vues sur X.
Qwen-Image-2.0-Pro — #9 mondial Text-to-Image
25 avril — Alibaba Qwen publie Qwen-Image-2.0-Pro, qui atteint la 9ème place mondiale sur le classement Text-to-Image Arena et la 6ème place en portrait. Le modèle est disponible via l’API Alibaba Cloud et ModelScope.
Grok Voice Think Fast 1.0 — #1 Tau Voice Bench
23 avril — xAI lance le modèle grok-voice-think-fast-1.0 via l’API xAI Console. Le modèle prétend la première place sur le Tau Voice Bench, avec raisonnement intégré sans latence ajoutée. Il est déjà déployé en production chez Starlink pour le support client. L’architecture est unifiée, distincte des API Grok STT/TTS annoncées en avril.
Grok Imagine — amélioration lip sync
25 avril — Grok Imagine annonce une amélioration du synchronisme labial (lip sync) et de la qualité audio pour toutes les générations image-to-video.
Génération média et agents vocaux
Kling AI 4K — upscaling natif depuis basse résolution
24 avril — Kling AI lance Kling 4K, une fonctionnalité d’agrandissement d’image en 4K natif depuis des sources basse résolution. L’annonce résumée en “Blurry in. 4K out.” a généré 5,82 millions de vues. Cette fonctionnalité est distincte de Kling Video 3.0.
Runway intègre GPT Image 2
24 avril — Runway intègre GPT Image 2 d’OpenAI dans sa plateforme de création vidéo.
ElevenLabs × Customers Bank — agents vocaux bancaires
24 avril — ElevenLabs annonce un déploiement d’ElevenAgents chez Customers Bank (25 milliards USD d’actifs). Trois agents sont déployés : support client 24h/24, accueil des nouveaux clients et coaching en temps réel pour les conseillers.
ElevenLabs — Programme Ambassadeur
23 avril — ElevenLabs ouvre les candidatures pour son programme ambassadeur, qui regroupe deux niveaux : Community Builders et Ambassadeurs, avec crédits, goodies et accès anticipé aux nouvelles fonctionnalités. L’annonce a généré 116 000 vues.
🔗 ElevenLabs Programme Ambassadeur
Recherche Anthropic : sécurité et agents
Mesures de protection électorale — résultats des évaluations
24 avril — À l’approche des midterms américains 2026, Anthropic publie un bilan de ses mesures de protection électorale. Claude Opus 4.7 et Sonnet 4.6 obtiennent respectivement 95 % et 96 % dans les évaluations mesurant l’équilibre des réponses politiques.
| Modèle | Conformité politique | Refus opérations d’influence | Recherche web activée |
|---|---|---|---|
| Opus 4.7 | 100 % | 94 % | 92 % |
| Sonnet 4.6 | 99,8 % | 90 % | 95 % |
Un banner TurboVote (ressource non-partisane de Democracy Works) sera affiché sur Claude.ai pour orienter les utilisateurs vers des informations fiables sur le vote aux midterms 2026.
🔗 Mise à jour protection électorale — Anthropic
Project Deal — agents Claude comme négociateurs
24 avril — Anthropic publie les résultats de Project Deal, une expérimentation interne sur les agents IA dans un marché de type Craigslist. Pendant une semaine, des agents Claude représentaient les employés du bureau de San Francisco pour acheter et vendre des objets entre collègues. Au total, 186 deals ont été conclus avec quatre configurations de modèles en parallèle.
| Métrique | Valeur |
|---|---|
| Durée | 1 semaine |
| Configurations | 4 (tout-Opus 4.7, tout-Haiku, 2 mixes) |
| Deals conclus | 186 |
| Avantage Opus vs Haiku | +2 deals en moyenne, prix supérieurs |
| Effet instructions agressives | Non significatif statistiquement |
“New Anthropic research: Project Deal. We created a marketplace for employees in our San Francisco office—like Craigslist—where Claude agents negotiated deals on their behalf.”
🇫🇷 “Nouvelle recherche Anthropic : Project Deal. Nous avons créé une marketplace pour les employés de notre bureau de San Francisco — comme Craigslist — où des agents Claude négociaient des deals en leur nom.” — @AnthropicAI sur X
La découverte la plus notable : les instructions agressives (“négocie durement”) n’ont eu aucun effet statistiquement significatif sur les résultats — pas à cause d’un mauvais suivi des instructions, mais à cause des contraintes propres au marché.
Ce que ça signifie
La journée du 25 avril illustre une consolidation rapide autour de quelques tendances lourdes. Sur les modèles de frontière, DeepSeek-V4 et GPT-5.5 établissent un nouveau plancher pour les capacités accessibles librement : un million de tokens de contexte n’est plus un différenciateur premium. L’arrivée de DeepSeek-V4-Pro gratuitement sur NVIDIA Blackwell, conjuguée à la promotion API de -75 %, signale une compétition tarifaire directe avec les modèles fermés.
Du côté des outils développeurs, l’extension de l’autonomie agentique se concrétise sur plusieurs fronts simultanément — Claude Code v2.1.119, Codex Auto-review, Inline Agent Mode dans JetBrains. Ces mises à jour convergent vers un même objectif : réduire les interruptions humaines dans les pipelines longs, tout en maintenant des points de contrôle pour les opérations à risque. La question du cadre légal pour les agents qui agissent en notre nom, soulevée par Project Deal, prend une résonance particulière dans ce contexte.
La fusion Cohere + Aleph Alpha avec 600 millions USD de Schwarz Group est le signal le plus structurant pour l’IA souveraine européenne. Elle crée un acteur transatlantique positionné sur les gouvernements et secteurs régulés, avec une infrastructure cloud dédiée (STACKIT), sur un marché estimé à 600 milliards USD. Le partenariat Anthropic + NEC en parallèle montre que la même logique de souveraineté s’étend à l’Asie.
Sources
- CHANGELOG Claude Code v2.1.119
- Anthropic et NEC
- Protection électorale — Anthropic
- Project Deal — Anthropic
- GPT-5.5 API OpenAI
- Codex Auto-review
- GPT-5.5 Bio Bug Bounty
- Gemini Drops avril 2026
- Gemini Embedding 2 GA
- Decoupled DiLoCo — Google DeepMind
- DeepSeek-V4 lancement
- Promotion API DeepSeek-V4-Pro
- Meta × AWS Graviton5
- Qwen-Image-2.0-Pro
- Grok Voice Think Fast 1.0
- Grok Imagine lip sync
- Qwen3.6-27B
- GPT-5.5 GA GitHub Copilot
- Copilot JetBrains Inline Agent Mode
- GPT-5.5 sur Perplexity Max
- Cohere × Aleph Alpha
- DeepSeek-V4-Pro sur NVIDIA NIM
- NVIDIA Blackwell Ultra Day 0
- NVIDIA Dynamo — inférence agentique
- Runway × GPT Image 2
- Kling AI 4K
- ElevenLabs × Customers Bank
- ElevenLabs Programme Ambassadeur