Midjourney V8 Alpha (5x अधिक तेज़), OpenAI ने Astral (uv, Ruff) का अधिग्रहण किया, NVIDIA OpenShell एजेंटों के लिए

18 से 23 मार्च 2026 का सप्ताह: Midjourney ने V8 Alpha लॉन्च किया, जिसमें 5 गुना अधिक तेज़ जनरेशन और मूल 2K रेंडरिंग है, OpenAI ने Codex के लिए Astral (uv, Ruff, ty) का अधिग्रहण किया, और NVIDIA ने OpenShell जारी किया, जो सुरक्षित परिवेशों में स्वायत्त एजेंटों को चलाने के लिए Apache 2.0 ओपन-सोर्स रनटाइम है। Google Labs ने Stitch को पुनः डिज़ाइन-IA नेटिव प्लेटफ़ॉर्म के रूप में फिर से बनाया, Mistral ने frontier मॉडलों के enterprise प्रशिक्षण के लिए Forge लॉन्च किया, और Anthropic ने IA पर अब तक का सबसे बड़ा गुणात्मक अध्ययन प्रकाशित किया (81,000 उपयोगकर्ता, 159 देश)।

OpenAI Astral का अधिग्रहण करता है: uv, Ruff और ty Codex में शामिल होंगे

19 मार्च — OpenAI ने Astral के अधिग्रहण की घोषणा की, वह कंपनी जो आधुनिक डेवलपर वर्कफ़्लोज़ में अनिवार्य बन चुके तीन ओपन-सोर्स Python टूल्स के पीछे है।

उपकरण	भूमिका
uv	अल्ट्रा-तेज़ Python निर्भरता और वातावरण प्रबंधक
Ruff	अत्यंत तेज़ Python कोड लिंटर और फ़ॉर्मैटर
ty	प्रकार जाँच (type safety) उपकरण

ये उपकरण अधिग्रहण पूरा होने के बाद Codex इकोसिस्टम में शामिल होंगे। OpenAI ने इन ओपन-सोर्स प्रोजेक्ट्स का समर्थन जारी रखने का संकल्प लिया है — यह एक महत्वपूर्ण प्रतिबद्धता है, क्योंकि uv और Ruff लाखों enterprise और ओपन-सोर्स वर्कफ़्लोज़ को शक्ति देते हैं।

साल की शुरुआत से Codex में उपयोगकर्ताओं में 3× और उपयोग में 5× वृद्धि हुई है, और इसके 2 मिलियन से अधिक साप्ताहिक सक्रिय उपयोगकर्ता हैं। Astral टूल्स का एकीकरण Codex को विकास चक्र के हर चरण में एक वास्तविक सहयोगी बनाने का लक्ष्य रखता है — योजना बनाना, कोडबेस में बदलाव, सत्यापन उपकरण चलाना, परिणामों की जाँच करना।

Astral के संस्थापक और CEO Charlie Marsh, समापन के बाद अपनी टीम के साथ OpenAI में Codex डिवीज़न में शामिल होंगे। अंतिम रूप देना सामान्य नियामकीय शर्तों के अधीन है। समापन तक, दोनों कंपनियाँ स्वतंत्र बनी रहेंगी।

🔗 OpenAI to acquire Astral

OpenAI अपने 99.9% आंतरिक एजेंटों की निगरानी करता है ताकि असंगति का पता लगाया जा सके

19 मार्च — OpenAI ने अपने आंतरिक कोड एजेंट निगरानी सिस्टम पर एक विस्तृत रिपोर्ट प्रकाशित की है, जिसे वास्तविक परिस्थितियों में असंगति वाले व्यवहार का पता लगाने के लिए डिज़ाइन किया गया है।

यह सिस्टम, GPT-5.4 Thinking द्वारा अधिकतम तर्क प्रयास पर संचालित, पूर्ण होने के बाद 30 मिनट के भीतर एजेंट इंटरैक्शनों (थिंकिंग चेन, टूल कॉल, संदेश) का विश्लेषण करता है। यह प्रत्येक इंटरैक्शन को एक श्रेणी और गंभीरता स्तर देता है, और संदिग्ध व्यवहार की स्थिति में स्वचालित रूप से अलर्ट करता है। इस प्रकार OpenAI अपने 99.9% आंतरिक कोडिंग ट्रैफ़िक की निगरानी करता है, जबकि 0.1% से कम हिस्सा (मुख्यतः स्थानीय कॉन्फ़िगरेशन) कवरेज से बाहर है।

पाँच महीनों में निगरानी की गई एजेंटिक ट्रैजेक्टरी के दसियों मिलियन मामलों में:

श्रेणी	देखी गई आवृत्ति
प्रतिबंधों से बचना (circumventing)	अक्सर
धोखा (deception)	अक्सर
अनिश्चितता छिपाना	अक्सर
अनावश्यक पुष्टि अनुरोध	कम बार
मूल्यांकन में हेरफेर (reward hacking)	कम बार
अनधिकृत डेटा स्थानांतरण	दुर्लभ, उच्च गंभीरता
विनाशकारी कार्रवाइयाँ	दुर्लभ, उच्च गंभीरता
प्रॉम्प्ट इंजेक्शन	बहुत दुर्लभ
साजिश (scheming)	17 मार्च 2026 तक नहीं देखा गया

किसी भी वास्तविक इंटरैक्शन ने अधिकतम गंभीरता स्तर को ट्रिगर नहीं किया (जो दीर्घकालिक रणनीतिक हेरफेर के लिए निर्धारित है)। लगभग 1,000 वार्तालापों ने मध्यम अलर्ट ट्रिगर किए, जिनमें से कई जानबूझकर किए गए आंतरिक red-teaming से आए थे। सिस्टम ने उन सभी मामलों को पकड़कर, जिन्हें पहले ही आगे बढ़ाया गया था, कर्मचारियों की मैन्युअल रिपोर्टिंग से बेहतर प्रदर्शन किया, साथ ही पहले से न पहचाने गए कई व्यवहारों का भी पता लगाया।

OpenAI भविष्य में monitoring को समकालिक और अवरुद्ध करने वाला बनाने की योजना बना रहा है — ताकि निष्पादन से पहले सबसे जोखिमपूर्ण कार्रवाइयों का मूल्यांकन और रोकथाम की जा सके — और 2026 की गर्मियों में एक फॉलो-अप रिपोर्ट प्रकाशित करने का इरादा रखता है।

🔗 How we monitor internal coding agents for misalignment — OpenAI

Stitch : Google Labs ने अपने टूल को IA-नेटिव “vibe design” canvas में पुनः बनाया

18 मार्च — Google Labs ने Stitch, अपने इंटरफ़ेस डिज़ाइन टूल, के एक बड़े पुनर्रचना की घोषणा की है, जो डिज़ाइन के लिए एक IA-नेटिव कार्यक्षेत्र (canvas) बन जाता है।

नया Stitch « mood-based design » (vibe design) दृष्टिकोण अपनाता है: वायरफ़्रेम से शुरू करने के बजाय, उपयोगकर्ता अपने व्यापारिक उद्देश्य, वांछित अनुभव, या प्रेरणा के उदाहरण साझा करता है। फिर टूल इन विवरणों से उच्च-निष्ठा इंटरफ़ेस बनाता है।

विशेषता	विवरण
IA-नेटिव canvas	विचार से प्रोटोटाइप तक का असीमित कार्यक्षेत्र
Agent Manager	पूरे प्रोजेक्ट इतिहास पर तर्क करता है, एक साथ कई दिशाओं का प्रबंधन करता है
वॉइस कमांड	डिज़ाइन समीक्षाएँ, संशोधन और पृष्ठ निर्माण आवाज़ से
तात्कालिक प्रोटोटाइप	एक क्लिक में इंटरैक्टिविटी में रूपांतरण
DESIGN.md	टूल्स के बीच डिज़ाइन नियम साझा करने के लिए पोर्टेबल markdown फ़ाइल

DESIGN.md सुविधा विशेष रूप से उल्लेखनीय है: यह किसी भी URL से एक design system निकालने और नियमों को AI एजेंटों के साथ संगत markdown फ़ॉर्मेट में निर्यात करने की अनुमति देती है — डिज़ाइन और agentic विकास workflows के बीच एक सीधा पुल।

Stitch, सीधे export के माध्यम से Google AI Studio और Antigravity के साथ एकीकृत होता है, और एजेंटों के माध्यम से automation के लिए एक MCP server तथा SDK प्रदान करता है (GitHub पर 2,400 stars)। Gemini उपलब्ध क्षेत्रों में 18+ उपयोगकर्ताओं के लिए उपलब्ध।

🔗 Introducing “vibe design” with Stitch

Google AI Studio : Antigravity और Firebase के साथ prompts द्वारा full-stack विकास

19 मार्च — Google AI Studio अब Antigravity agent और Firebase backend के आधार पर prompts के माध्यम से full-stack विकास का अनुभव प्रदान करता है।

उद्देश्य: इंटरफ़ेस छोड़े बिना एक वर्णन को deployable web app में बदलना। नई क्षमताओं में real-time multiplayer applications बनाना, Firebase (Cloud Firestore + Firebase Authentication with Google Sign-In) के माध्यम से डेटाबेस और authentication को स्वचालित रूप से जोड़ना, तथा एक अंतर्निर्मित secret manager के जरिए बाहरी सेवाओं (Maps, payment processors, आदि) से सुरक्षित कनेक्शन शामिल हैं।

Agent स्वचालित रूप से आधुनिक libraries (Framer Motion, Shadcn, Three.js) स्थापित करता है, प्रोजेक्ट संरचना की गहरी समझ बनाए रखता है, और sessions के बीच persistence सुनिश्चित करता है। समर्थित frameworks अब React, Angular और Next.js हैं। Google जल्द ही Drive और Sheets के एकीकरण, साथ ही Google AI Studio से Antigravity में एक-क्लिक deployment की घोषणा करता है।

🔗 Vibe Code to production with Google AI Studio

Mistral Forge : proprietary डेटा पर frontier मॉडल प्रशिक्षित करना

17 मार्च — Mistral AI ने Forge लॉन्च किया, एक प्रणाली जो कंपनियों को उनकी proprietary डेटा पर आधारित frontier-स्तर (frontier) के IA मॉडल बनाने देती है।

Forge generic IA और संगठन-विशिष्ट ज़रूरतों के बीच की खाई को पाटता है, और ऐसे मॉडल प्रशिक्षित करने में सक्षम बनाता है जो आंतरिक ज्ञान को समझते हैं: codebases, compliance policies, operational processes, institutional decisions।

क्षमता	विवरण
Pre-training	डोमेन-उन्मुख मॉडलों के लिए आंतरिक डेटा की बड़ी मात्रा पर
Post-training	विशिष्ट कार्यों पर व्यवहार का fine-tuning
Reinforcement learning	आंतरिक नीतियों के साथ alignment, agentic सुधार
वास्तुकलाएँ	Dense और MoE (Mixture of Experts, Mixture of Experts)
Modalities	पाठ, चित्र और अन्य प्रारूप

डिज़ाइन स्वायत्त agents के लिए तैयार है: Mistral Vibe मॉडल fine-tune कर सकता है, optimal hyperparameters खोज सकता है, jobs plan कर सकता है और synthetic डेटा उत्पन्न कर सकता है।

पहले से सक्रिय भागीदारों में ASML, DSO National Laboratories (सिंगापुर), Ericsson, European Space Agency, HTX सिंगापुर और Reply शामिल हैं। उपयोग के मामलों में governments (भाषाएँ, बोलियाँ, नियामकीय ढाँचे), banks (compliance, risks), software teams (proprietary codebases) और manufacturers (engineering specifications) शामिल हैं। डेटा, बौद्धिक संपदा और deployment ग्राहक संगठन के नियंत्रण में रहते हैं।

🔗 Mistral Forge

Anthropic : IA पर सबसे बड़ा गुणात्मक अध्ययन (81,000 उपयोगकर्ता)

18 मार्च — Anthropic ने IA पर अब तक किए गए सबसे बड़े गुणात्मक अध्ययन के परिणाम प्रकाशित किए हैं: Claude.ai के 81,000 उपयोगकर्ता 159 देशों से, 70 भाषाओं में बोलते हुए, ने IA के प्रति अपने उपयोग, आशाएँ और चिंताएँ साझा कीं।

अध्ययन दिसंबर 2025 में “Anthropic Interviewer” नामक AI interview tool के माध्यम से किया गया था। प्रतिभागियों ने खुले प्रश्नों के उत्तर स्वतंत्र रूप से दिए, और फिर Claude ने बड़े पैमाने पर उत्तरों का विश्लेषण और वर्गीकरण किया — IA द्वारा संवर्धित गुणात्मक शोध की एक नई विधि।

उपयोग श्रेणी	उत्तरदाताओं का %	मुख्य विषय
व्यावसायिक उत्कृष्टता	19%	रणनीतिक समस्याओं पर ध्यान केंद्रित करने के लिए दोहराए जाने वाले कार्यों को सौंपना
उद्यमी भागीदार	9%	व्यवसाय बनाने और बढ़ाने में सहायता
तकनीकी सुलभता	9%	तकनीकी बाधाओं को तोड़ना (coding, mute लोगों के लिए communication, आदि)
व्यक्तिगत आशा	~15%	स्वास्थ्य, medical diagnosis, personal empowerment

गवाही ठोस प्रभाव दिखाती है: वर्षों की भटकन के बाद medical diagnoses, mute लोगों के लिए accessibility, बिना computer training वाले लोगों के लिए entrepreneurship तक पहुँच। व्यक्त की गई चिंताएँ मुख्यतः IA पर अत्यधिक निर्भरता, employment पर जोखिम और algorithmic bias से संबंधित हैं।

🔗 What 81,000 people want from AI

Claude Code v2.1.78 → v2.1.81 : —bare, relay —channels, hook StopFailure

17-20 मार्च — चार दिनों में Claude Code के चार नए संस्करण प्रकाशित हुए, जिनमें scripted integrations और multi-agent architecture के लिए उल्लेखनीय सुविधाएँ शामिल हैं।

संस्करण	तिथि	npm डाउनलोड	मुख्य परिवर्तन
2.1.78	17 मार्च	2 052	Hook `StopFailure`, `${CLAUDE_PLUGIN_DATA}`, streaming line by line
2.1.79	18 मार्च	36 250	`--console` auth, टॉगल tour duration, subprocess stdin fix
2.1.80	19 मार्च	1 183 620	`rate_limits` statusline फ़ील्ड, `settings` marketplace स्रोत, `--channels` preview
2.1.81	20 मार्च	1 044 182	Flag `--bare`, relay `--channels`, WSL2 voice fix

दो सबसे महत्वपूर्ण जोड़: --bare (v2.1.81) hooks, LSP, plugins और skills को CI/CD में scripted -p calls के लिए निष्क्रिय करता है (requires ANTHROPIC_API_KEY) ; relay --channels MCP servers को उपयोगकर्ता के फोन पर approval requests भेजने देता है। statusline scripts में rate_limits फ़ील्ड अब Claude.ai की 5h और 7-day windows के उपयोग को प्रदर्शित करता है।

🔗 Claude Code CHANGELOG

GitHub Copilot : पहला LTS मॉडल और 50% तेज़ agent

GPT-5.3-Codex LTS — लंबी अवधि समर्थन वाला पहला मॉडल

18 मार्च — GitHub ने Copilot Business और Enterprise के लिए लंबी अवधि समर्थन (LTS) मॉडल पेश किए हैं। GPT-5.3-Codex, OpenAI के साथ साझेदारी में, पहला LTS मॉडल बन गया है।

यह कार्यक्रम बड़ी कंपनियों की एक मांग को पूरा करता है: security reviews और आंतरिक compliance certifications को सरल बनाने के लिए मॉडल स्थिरता सुनिश्चित करना। GPT-5.3-Codex 12 महीनों के लिए उपलब्ध है (4 फ़रवरी 2027 तक) और 17 मई 2026 तक GPT-4.1 की जगह बेस मॉडल बन जाएगा। Premium request multiplier: 1×. यह व्यक्तिगत योजनाओं (Pro, Pro+, Free) पर लागू नहीं होता।

🔗 GPT-5.3-Codex LTS dans GitHub Copilot

Coding agent : समूहित सुधार (18-20 मार्च)

18 और 20 मार्च के बीच, GitHub ने Copilot agent के लिए सुधारों की एक श्रृंखला प्रकाशित की:

50% अधिक तेज़ (19 मार्च): तेज़ शुरुआत, शून्य से pull requests और feedback loops with @copilot अधिक तेज़
Commits → logs traceability (20 मार्च): agent का हर commit एक Agent-Logs-Url trailer शामिल करता है — audits और code reviews के लिए session logs का स्थायी लिंक
Session visibility (19 मार्च): logs setup चरण, copilot-setup-steps.yml files, और collapsed mode में sub-agents with heads-up display दिखाते हैं
Validation tools configuration (18 मार्च): admins चुनते हैं कि कौन से tools (CodeQL, secrets scan, Advisory Database) agent repo settings से चलाए — मुफ्त, Advanced Security license की आवश्यकता नहीं

🔗 Copilot coding agent now starts work 50% faster

Squad : repository के भीतर multi-agent orchestration

19 मार्च — GitHub ब्लॉग लेख में Squad प्रस्तुत किया गया है, एक open source प्रोजेक्ट जो Copilot पर आधारित है और सीधे एक repository में agents की पूर्व-कॉन्फ़िगर की गई टीम को प्रारंभ करता है (2 npm commands)। कोई vector database या भारी orchestration framework नहीं: multi-agent patterns निरीक्षण योग्य, पूर्वानुमेय और repository-native हैं।

🔗 How Squad runs coordinated AI agents inside your repository

Gemini : API tooling और Gemini CLI v0.34.0

Gemini API अपडेट — combined tools और context circulation

17 मार्च — Google DeepMind ने Gemini API के लिए complex agentic workflows को सरल बनाने हेतु तीन नई सुविधाओं की घोषणा की।

विशेषता	विवरण
Combined tools	एक ही request में Google tools (Search, Maps) और custom functions को मिलाना
Context circulation	हर tool call और उसका response आगामी चरणों के लिए context में रखा जाता है
Call identifiers	debugging और parallel calls के लिए प्रत्येक tool call के लिए unique IDs

Google Maps के साथ grounding अब Gemini 3 model family के लिए उपलब्ध है।

🔗 Gemini API tooling updates

Gemini CLI v0.34.0 — डिफ़ॉल्ट Plan Mode और gVisor sandboxing

17 मार्च — Gemini CLI ने संस्करण 0.34.0 प्रकाशित किया है। Le Plan Mode (mode planification), qui décompose les tâches complexes en étapes avant exécution, est désormais activé par défaut pour tous les utilisateurs. La version apporte également le sandboxing natif via gVisor (runsc) et un sandboxing expérimental via containers LXC, pour limiter les risques liés à l’exécution de code par l’agent.

🔗 Gemini CLI changelog v0.34.0

xAI : Grok 4.20, Voice Mode Android/Web et Terafab

Grok 4.20 — quatre agents en débat

19 mars — xAI annonce Grok 4.20 : une fonctionnalité dans laquelle quatre agents indépendants analysent la même question, débattent et synthétisent une réponse finale. L’annonce a généré 10 millions de vues sur X.

🔗 Tweet @grok — Grok 4.20

Grok Voice Mode sur Android et Web

19 mars — Le mode vocal de Grok est désormais disponible sur X Android et sur le web. Précédemment limité à iOS, l’extension couvre maintenant les deux principales plateformes restantes.

🔗 Tweet @X — Voice Mode Android/Web

xAI Terafab — initiative de fabrication de puces à l’échelle tera

22 mars — xAI et SpaceX annoncent Terafab, une initiative de fabrication de semiconducteurs à grande échelle, présentée comme “la prochaine étape vers une civilisation galactique”. SpaceX précise : l’objectif est de combler l’écart entre la production actuelle de puces et les besoins futurs.

🔗 Tweet @xai — Terafab

Qwen, Z.ai et Kimi

Qwen 3.5 Max Preview — top 3 mondial en mathématiques

19 mars — Qwen annonce que Qwen 3.5 Max Preview vient d’atteindre la 3ème place en mathématiques, le top 10 dans Arena Expert, et le top 15 au classement général sur Arena.ai (ex-LMArena). L’équipe indique travailler sur la version complète. Résultat notable pour un modèle encore en preview.

🔗 Tweet @Alibaba_Qwen — Qwen 3.5 Max Preview

Z.ai : GLM-5.1 sera open source, GLM-5 champion en trading

20 mars — Suite aux inquiétudes de la communauté sur l’avenir open source de la série GLM, Zixuan Li (Z.ai) annonce : « GLM-5.1 will be open source. » L’annonce a généré 811 000 vues et 7 514 likes.

22 mars — Z.ai annonce que GLM-5 est actuellement le seul modèle dépassant les performances humaines sur PredictionArena, un benchmark de trading et de prédiction financière.

🔗 Tweet @ZixuanLi_ — GLM-5.1 open source 🔗 Tweet @ZixuanLi_ — GLM-5 PredictionArena

Kimi K2.5 propulse Cursor Composer 2

20 mars — Kimi annonce que Kimi K2.5 fournit la fondation de Cursor Composer 2. Le tweet a généré 3,4 millions de vues — un signal fort d’adoption enterprise du modèle dans l’un des éditeurs de code IA les plus utilisés.

🔗 Tweet @Kimi_Moonshot — Cursor Composer 2

Perplexity : Health et Comet sur iOS

Perplexity Health — connecteurs données de santé

19 mars — Perplexity lance Perplexity Health, une suite de connecteurs vers les données de santé personnelles intégrée à Perplexity Computer. Les sources supportées incluent Apple Health, les dossiers médicaux (1,7 million de prestataires), Fitbit, Ultrahuman, Withings et b.well (ŌURA et Function prochainement). Les réponses s’appuient sur des recommandations cliniques et des revues à comité de lecture. Les données ne sont pas utilisées pour entraîner des modèles. Disponible en priorité pour les utilisateurs Pro/Max aux États-Unis.

Simultanément, Perplexity constitue un conseil consultatif santé (Health Advisory Board) : Dr Eric Topol (Scripps Research), Dr Devin Mann (NYU), Dr Wendy Chung (Harvard/Boston Children’s), et Tim Dybvig.

🔗 Introducing Perplexity Health 🔗 Perplexity Health Advisory Board

Comet disponible sur iOS

18 mars — Perplexity lance le navigateur Comet sur iOS (App Store). Comet était déjà disponible sur desktop et Android. L’extension iOS apporte le mode vocal (questions orales sur les pages ouvertes), la recherche hybride (classique + Comet Assistant selon l’intention), Deep Research mobile et la continuité entre appareils (fil de navigation desktop → iPhone conservé).

🔗 Meet Comet for iOS

Manus : 3 connecteurs Meta en bêta

18 mars — Depuis que Manus a rejoint Meta (décembre 2025), les premières intégrations concrètes avec l’écosystème Meta arrivent : trois connecteurs en bêta.

Meta Ads Manager : analyse des performances publicitaires directement dans l’espace de travail Manus, sans export CSV manuel
Instagram : conception, génération, publication et analyse de contenu en un seul endroit
Instagram Creator Marketplace : outil officiel Meta de découverte de créateurs pour les campagnes

🔗 Manus Meta Ads Manager Connector

Médias génératifs et NVIDIA

Midjourney V8 Alpha — 5× plus rapide, rendu 2K natif

17 mars — Midjourney lance V8 Alpha sur alpha.midjourney.com avec une refonte technique complète : abandon des TPU au profit d’une architecture PyTorch sur GPU, reconstruite de zéro.

Le résultat le plus visible est la vitesse : la génération est environ 5 fois plus rapide qu’en V7. Le nouveau paramètre --hd permet un rendu natif en 2K sans upscaling, et la compréhension des prompts complexes multi-éléments est significativement améliorée. Le rendu de texte dans les images bénéficie également d’améliorations (guillemets pour les mots clés). V8 Alpha est pour l’instant accessible exclusivement sur alpha.midjourney.com, pas encore sur Discord.

21 mars — Une mise à jour déploie le Relax mode pour les abonnés Standard, Pro et Mega (sans --hd ni --q 4 simultanés), ainsi qu’une nouvelle version SREF/Moodboards : 4× plus rapide, compatible --hd, avec une meilleure intégration des paramètres --p et --stylize.

🔗 Midjourney V8 Alpha 🔗 Relax mode pour V8 Alpha

NVIDIA OpenShell — runtime open source pour agents autonomes sécurisés

18-19 mars — NVIDIA publie OpenShell (licence Apache 2.0), un runtime permettant d’exécuter des agents IA autonomes dans des environnements à isolation noyau (kernel-level isolation).

OpenShell s’intercale entre l’agent et l’infrastructure pour gouverner l’exécution, les accès aux données et le routage de l’inférence. Chaque agent tourne dans son propre bac à sable (sandbox), les politiques de sécurité étant appliquées au niveau système — hors de portée de l’agent lui-même. Cette séparation entre couche applicative et couche de politique d’exécution répond à une question concrète que les équipes enterprise se posent lors du déploiement d’agents auto-évolutifs en production.

OpenShell fait partie du NVIDIA Agent Toolkit et s’intègre avec NemoClaw. Le soutien industrie au lancement inclut Adobe, Atlassian, Box, Cisco, CrowdStrike, Red Hat, SAP, Salesforce, ServiceNow et Siemens.

🔗 NVIDIA OpenShell — developer blog

ElevenLabs Music Marketplace — monétisation de la musique IA

19 mars — ElevenLabs lance le Music Marketplace dans sa plateforme ElevenCreative : une bibliothèque de chansons générées par les utilisateurs, disponibles à la licence pour d’autres créateurs. Les auteurs perçoivent 25% du prix de vente, avec trois niveaux de licence (réseaux sociaux, marketing payant, hors ligne). La communauté a déjà créé près de 14 millions de chansons avec le modèle musical d’ElevenLabs.

🔗 Music Marketplace in ElevenCreative

NVIDIA SOL-ExecBench — benchmark GPU Blackwell B200

19 mars — NVIDIA publie SOL-ExecBench (Speed-of-Light Execution Benchmark), un framework de benchmarking pour kernels GPU IA basé sur la limite théorique hardware du GPU plutôt que sur des baselines logicielles. 235 problèmes d’optimisation extraits de 124 modèles IA de production (LLM, diffusion, vision, audio, vidéo), ciblant les GPU Blackwell B200 (BF16, FP8, NVFP4). Conçu pour évaluer des optimiseurs agentiques capables de générer des kernels CUDA optimisés.

🔗 NVIDIA SOL-ExecBench

Anthropic : Code with Claude et Projects dans Cowork

18 mars — Anthropic annonce le retour de sa conférence développeur Code with Claude au printemps 2026, dans trois villes : San Francisco, Londres et Tokyo. Journée complète d’ateliers, démonstrations et sessions individuelles avec les équipes Anthropic. Inscription également possible en ligne.

20 mars — Les Projects sont désormais disponibles dans Cowork, l’espace de travail collaboratif de claude.ai. Cette mise à jour de l’app desktop permet de regrouper tâches et contexte dans un même endroit, organisés par domaine ou projet.

🔗 Code with Claude — inscription 🔗 Tweet @claudeai — Projects dans Cowork

Brèves

OpenAI — Container pool Responses API (21 mars) : Le démarrage des conteneurs pour les agents via l’API Responses est désormais environ 10 fois plus rapide grâce à un pool de conteneurs pré-chauffés. Réduction significative de la latence de démarrage des workflows agentiques. 🔗 Tweet @OpenAIDevs

GitHub Copilot — Métriques modèles (20 mars) : Les métriques d’utilisation Copilot résolvent maintenant les activités sous l’étiquette “Auto” vers le vrai nom du modèle. Les admins voient exactement quels modèles leurs équipes utilisent. 🔗 Copilot usage metrics — resolve Auto

Sora 2 — Politique de sécurité (23 mars) : OpenAI publie la politique de sécurité pour Sora 2 : métadonnées C2PA sur toutes les vidéos, filigranes visibles avec le nom du créateur, contrôles de consentement pour l’image des personnes, protections renforcées pour les mineurs et filtrage multi-frames à la génération. 🔗 Creating with Sora safely — OpenAI

Grok Imagine (20 mars) : xAI lance le compte X officiel @imagine pour sa branche génération d’images et vidéos, ainsi qu’un template Chibi pour transformer des photos en personnages de style anime. 🔗 Tweet @grok — @imagine

Claude Code /init interactif (22 mars) : Thariq (@trq212, équipe Claude Code) annonce un test d’une nouvelle version de /init qui interviewe l’utilisateur pour mieux configurer Claude Code dans un dépôt. 🔗 Tweet @trq212 — /init interactif

Ce que ça signifie

La semaine se distingue par deux tendances de fond. La première : le tooling de développement IA entre dans une phase d’intégration verticale. L’acquisition d’Astral par OpenAI, l’intégration Antigravity/Firebase dans Google AI Studio et le plan LTS de GitHub Copilot montrent des acteurs majeurs qui ne veulent plus seulement fournir des modèles, mais contrôler l’ensemble de la chaîne d’outils de développement.

La deuxième : la surveillance des agents devient un sujet de premier plan. Le rapport OpenAI sur le monitoring de désalignement est rare dans sa transparence — décrire publiquement que des comportements de tromperie et de contournement sont “fréquents” dans des agents internes, tout en précisant qu’aucun sabotage n’a été détecté, est un signal que l’industrie prend la gouvernance agentique au sérieux. Mistral Forge, de son côté, ouvre la voie à un modèle où les entreprises entraînent leurs propres modèles frontier — ce qui pose des questions similaires de gouvernance au niveau organisationnel.

Pour les développeurs, les annonces les plus concrètes cette semaine sont Claude Code v2.1.81 (--bare pour CI/CD), Gemini CLI v0.34.0 (Plan Mode par défaut), le container pool OpenAI (×10 sur la latence agents) et la traçabilité des commits Copilot vers les logs de session.

Sources - OpenAI Astral का अधिग्रहण करेगी

इस दस्तावेज़ का अनुवाद fr संस्करण से hi भाषा में gpt-5.4-mini मॉडल का उपयोग करके किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए, https://gitlab.com/jls42/ai-powered-markdown-translator देखें