17 मार्च 2026 GTC NVIDIA और कई प्रमुख लॉन्चों के नाम रहा। OpenAI GPT-5.4 mini और nano जारी करता है, जो उसके अब तक के सबसे सक्षम कॉम्पैक्ट मॉडल हैं और कई benchmarks पर पूर्ण मॉडल के करीब पहुँचते हैं। NVIDIA Nemotron Coalition में Mistral AI और Perplexity के शामिल होने से इसका दायरा बढ़ता है। Perplexity साथ ही Comet Enterprise को पूर्ण MDM governance के साथ खोलता है, Claude Code v2.1.77 Opus 4.6 के लिए generation limit दोगुनी करता है, और GitHub, Anthropic, Google तथा OpenAI open source सुरक्षा के लिए 12.5 million dollars जुटाने के लिए एकजुट होते हैं।
GPT-5.4 mini और nano: OpenAI के कॉम्पैक्ट मॉडल
17 मार्च — OpenAI GPT-5.4 mini और GPT-5.4 nano लॉन्च करता है, जो उसके अब तक के सबसे performant कॉम्पैक्ट मॉडल हैं। ये दोनों variants GPT-5.4 की क्षमताएँ high-volume workloads के लिए optimized formats में लाते हैं, कम latency और कम लागत के साथ।
GPT-5.4 mini code, reasoning, multimodal understanding और tool use में GPT-5 mini को काफी बेहतर बनाता है, और साथ ही दो गुना से अधिक तेज़ चलता है। यह कई key evaluations पर पूर्ण GPT-5.4 मॉडल के प्रदर्शन के करीब पहुँचता है, जिनमें SWE-Bench Pro और OSWorld-Verified शामिल हैं।
GPT-5.4 nano GPT-5.4 family का सबसे छोटा और सबसे कम लागत वाला version है, जिसे उन tasks के लिए बनाया गया है जहाँ speed और cost प्राथमिकता हैं: classification, data extraction, ranking, और simple code sub-agents।
| Évaluation | GPT-5.4 | GPT-5.4 mini | GPT-5.4 nano | GPT-5 mini |
|---|---|---|---|---|
| SWE-Bench Pro (public) | 57,7 % | 54,4 % | 52,4 % | 45,7 % |
| Terminal-Bench 2.0 | 75,1 % | 60,0 % | 46,3 % | 38,2 % |
| Toolathlon | 54,6 % | 42,9 % | 35,5 % | 26,9 % |
| GPQA Diamond | 93,0 % | 88,0 % | 82,8 % | 81,6 % |
| OSWorld-Verified | 75,0 % | 72,1 % | 39,0 % | 42,0 % |
Use cases तीन रूपों में सामने आते हैं: code assistants (GPT-5.4 mini तेज़ coding workflows, debugging loops, frontend generation में उत्कृष्ट है), sub-agents (Codex में, GPT-5.4 केवल GPT-5.4 mini quota का 30 % उपयोग करके sub-tasks delegate कर सकता है), और interface control (computer use), जहाँ GPT-5.4 mini dense interface screenshots को तेज़ी से interpret करता है।
| Modèle | Disponibilité | Prix entrée | Prix sortie | Contexte |
|---|---|---|---|---|
| GPT-5.4 mini | API, Codex, ChatGPT Free/Go | 0,75 $/million tokens | 4,50 $/million tokens | 400 000 tokens |
| GPT-5.4 nano | API uniquement | 0,20 $/million tokens | 1,25 $/million tokens | — |
ChatGPT में, GPT-5.4 mini Free और Go उपयोगकर्ताओं के लिए ”+” menu में “Thinking” सुविधा के माध्यम से उपलब्ध है। paid plans के लिए, यह GPT-5.4 Thinking rate limit होने पर fallback model के रूप में काम करता है।
🔗 Introducing GPT-5.4 mini and nano
NVIDIA GTC 2026 : Nemotron Coalition और Dynamo 1.0
NVIDIA की GTC conference, जो 16 मार्च से शुरू हुई, sector की कई बड़ी घोषणाओं का catalyst बनी: frontier open source models के इर्द-गिर्द एक open coalition का गठन, inference operating system का production launch, और physical AI के लिए data blueprint की घोषणा।
Mistral NVIDIA Nemotron Coalition में शामिल होता है
16 मार्च — Mistral AI, frontier open source AI models को co-develop करने के लिए NVIDIA के साथ strategic partnership की घोषणा करता है। Mistral NVIDIA Nemotron Coalition का founding member बनता है, जो अपनी frontier architecture को NVIDIA computing infrastructure और development tools के साथ जोड़ता है।
| Aspect | Détail |
|---|---|
| Rôle Mistral | Founding member, frontier architecture + full-stack AI offering |
| Apport NVIDIA | GPU infrastructure + development tools |
| Objectif | Frontier-level open models को co-develop करना |
Perplexity भी coalition में शामिल होता है
16 मार्च — Perplexity भी उसी NVIDIA Nemotron Coalition में अपनी सदस्यता की घोषणा करता है। मुख्य बिंदु: Perplexity अपने response pipeline के हर चरण (query analysis, reasoning, final answer) के लिए अलग-अलग open models को refine करता है। Nemotron 3 Super model (120 billion parameters, MoE architecture) अब Perplexity search bar, Agent API और Perplexity Computer में उपलब्ध है।
🔗 Blog Perplexity – Nemotron Coalition 🔗 Annonce NVIDIA
Dynamo 1.0 : inference operating system production में जाता है
16 मार्च — NVIDIA GTC में Dynamo 1.0 के production launch की घोषणा करता है, जिसे AI factories के लिए “inference operating system” (inference operating system) के रूप में प्रस्तुत किया गया है। Dynamo Blackwell GPUs पर inference performance को unoptimized deployments की तुलना में 7x तक बढ़ाता है। v1.0 पर जाना इसे experimental phase से industrial production में प्रवेश कराता है।
Physical AI Data Factory Blueprint
16 मार्च — NVIDIA Physical AI Data Factory Blueprint का खुलासा करता है: accelerated computing को robotics, AI vision agents और autonomous vehicles के लिए high-quality training data में बदलने की एक reference architecture। यह blueprint enterprises को physical AI के लिए large scale पर synthetic training data generate करने देता है।
Cohere + NVIDIA : DGX Spark पर sovereign AI
16 मार्च — Cohere और NVIDIA GTC में घोषित sovereign, secure और efficient AI विकसित करने के लिए साझेदारी करते हैं। दो मुख्य पहलू: NVIDIA ecosystem-native models (latest NVIDIA architecture के लिए optimized custom models, specialized enterprise workloads को target करते हुए) और DGX Spark पर North (Cohere का agentic platform North NVIDIA DGX Spark पर उपलब्ध होगा, संवेदनशील data के लिए local और low latency के साथ)। Target sectors हैं finance, health और public sector।
🔗 Blog Cohere – IA souveraine NVIDIA
Perplexity Comet Enterprise : MDM governance और CrowdStrike integration
17 मार्च — Perplexity सभी Enterprise subscribers के लिए Comet Enterprise लॉन्च करता है। AI browser enterprise version में complete deployment governance के साथ आता है।
| Fonctionnalité | Description |
|---|---|
| Déploiement MDM | Silent installer, हजारों machines पर deployment, audit logs |
| Télémétrie granulaire | User-wise tracking |
| CrowdStrike Falcon | Anti-phishing protection, exfiltration detection (screenshots, downloads) |
| Intervention temps réel | CrowdStrike integration के माध्यम से संभव |
| Confidentialité | Perplexity अपने models को कभी भी enterprise data पर train नहीं करता |
पहले उपयोगकर्ताओं में Fortune-ranked companies, AWS, AlixPartners, Gunderson Dettmer और Bessemer Venture Partners शामिल हैं। documented use cases में client meetings preparation (real-time news), SOW contract analysis, financial calculations और sector research शामिल हैं।
🔗 Blog Perplexity – Comet Enterprise
Claude Code v2.1.77 : Opus 4.6 के लिए default 64k tokens
17 मार्च — Claude Code v2.1.77 generation limits में महत्वपूर्ण वृद्धि और कई critical bug fixes के साथ जारी होता है।
| Modèle | Limite par défaut | Limite maximale |
|---|---|---|
| Claude Opus 4.6 | 64 000 tokens | 128 000 tokens |
| Claude Sonnet 4.6 | — | 128 000 tokens |
Opus 4.6 के लिए default limit दोगुनी होकर 32k से 64k tokens हो जाती है, जिससे अतिरिक्त configuration के बिना कहीं लंबे responses संभव होते हैं।
नई विशेषताएँ:
allowReadin sandboxes : filesystem configuration का नया parameter, जोdenyReadrule द्वारा covered क्षेत्रों में reading को फिर से अनुमति देता है। granular security configurations के लिए उपयोगी।/copy N: command/copyअब optional index स्वीकार करती है —/copy 2history में navigate किए बिना assistant की दूसरी पिछली response copy करता है।
उल्लेखनीय सुधार:
- संयुक्त bash commands पर “Always Allow” : rule पूरी chain (
cd src && npm test) के लिए save होता था, sub-command के अनुसार नहीं। ठीक किया गया। - Auto-updater : window को बार-बार खोलने और बंद करने पर parallel downloads शुरू करता था, जिससे memory में दर्जनों gigabytes जमा हो सकते थे। ठीक किया गया।
--resumeद्वारा history truncation : memory extraction writes और मुख्य transcript के बीच एक race condition silent truncation का कारण बन सकती थी। ठीक किया गया।PreToolUsehooks द्वाराdenyrules bypass :"allow"लौटाने वाला hook permission rulesdenyको bypass कर देता था, enterprise-managed settings सहित। महत्वपूर्ण security fix।
तकनीकी लेख : Claude Code टीम Skills का उपयोग कैसे करती है
17 मार्च — Anthropic में Claude Code टीम के engineer Thariq (@trq212) “Lessons from Building Claude Code: How We Use Skills” प्रकाशित करते हैं, जो “Seeing like an Agent” (27 फरवरी, 3.6 million views) के बाद श्रृंखला का दूसरा लेख है।
लेख बताता है कि Skills Claude Code के सबसे अधिक उपयोग किए जाने वाले extension points में से एक कैसे बन गए हैं — flexible, maintain करने में आसान, और teams को अपने development environment में सीधे reusable workflows परिभाषित करने की सुविधा देते हैं। Claude Code के प्रमुख Boris Cherny (@bcherny) ने लेख को “Really great writeup” कहकर साझा किया। लेखक यह भी घोषणा करते हैं कि एक concrete example के रूप में जल्द ही open source में एक iMessage skill प्रकाशित की जाएगी।
“Using Skills well is a skill issue. I didn’t quite realize how much until I wrote this.”
🇮🇳 Skills का सही उपयोग करना दक्षता का मामला है। यह लेख लिखने से पहले मुझे इसका एहसास नहीं था कि यह कितना अधिक है। — @trq212 on X
Codex Security : SAST report क्यों नहीं
16 मार्च — OpenAI एक तकनीकी लेख प्रकाशित करता है जो Codex Security के पीछे के design choice को समझाता है: सिस्टम क्यों starting point के रूप में static analysis (SAST) पर निर्भर नहीं करता।
यह approach चार pillars पर आधारित है: contextual reading (repository context के साथ पूरे code path का विश्लेषण), targeted micro-fuzzing (micro-fuzzers लिखने के लिए testable fragment तक घटाना), constraint reasoning (z3-solver वाले Python environment का उपयोग करके complex problems को formalize करना), और sandbox validation (“यह समस्या हो सकती है” को compiled PoC के साथ “यह समस्या है” से अलग करना)। लेख इन सिद्धांतों को CVE-2024-29041 (Express) के साथ दिखाता है, एक open redirect जहाँ malformed URLs ने allowlist implementations को बायपास कर दिया था।
🔗 Why Codex Security Doesn’t Include a SAST Report
Gemini Personal Intelligence : अमेरिका में मुफ्त विस्तार
17 मार्च — Google अमेरिका में अधिक उपयोगकर्ताओं के लिए Personal Intelligence को मुफ्त में विस्तारित करता है। यह सुविधा, जो अब तक paid subscribers तक सीमित थी, अब free-tier accounts के लिए तीन surfaces के माध्यम से उपलब्ध है: Google Search में AI Mode, Gemini application (iOS/Android), और Chrome में Gemini extension।
Personal Intelligence उपयोगकर्ता के Google applications (Gmail, Google Photos, YouTube, Search) को सुरक्षित रूप से जोड़कर personalized responses प्रदान करता है। उदाहरण: पिछले purchases के अनुरूप shopping recommendations, Gmail receipts से निकले exact purchased device को target करने वाली technical सहायता, hotel confirmations पर आधारित personalized travel itineraries। उपयोगकर्ता चुनता है कि कौन-से applications connect करने हैं और किसी भी समय disable कर सकता है। केवल व्यक्तिगत Google accounts के लिए उपलब्ध (Workspace enterprise/education नहीं)।
🔗 Blog Google – Personal Intelligence
AlphaFold Database : protein complexes की लाखों नई संरचनाएँ
17 मार्च — Google DeepMind AlphaFold Database (AFDB) के विस्तार की घोषणा करता है, जिसमें EMBL-EBI (European Bioinformatics Institute), NVIDIA और Seoul National University के सहयोग से AI द्वारा अनुमानित protein complexes की लाखों नई structures शामिल हैं। नई structures विशेष रूप से WHO के priority bacterial pathogens को कवर करती हैं — सबसे खतरनाक और antibiotic-resistant bacteria। यह विस्तार individual proteins के स्तर से आगे बढ़कर protein complexes (कई proteins के बीच interactions) तक जाता है, जो medical और pharmaceutical research के लिए एक गुणात्मक छलांग है।
🔗 Annonce Pushmeet Kohli sur X
xAI : Grok की Text-to-Speech API और video editing में पहला स्थान
Text-to-Speech API
16 मार्च — xAI Grok Text-to-Speech API की उपलब्धता की घोषणा करता है, जो developers के लिए natural और expressive voices प्रदान करता है। LiveKit ने लॉन्च के समय ही इसे LiveKit Inference में integrate कर लिया।
वीडियो editing में Grok Imagine #1
15 मार्च — Grok Imagine Design Arena ranking में video editing में first place हासिल करता है, 1290 Elo के साथ। L’API Imagine est désormais accessible aux développeurs. La fonctionnalité couvre l’ajout, la suppression et l’échange d’objets dans des scènes vidéo.
Perplexity Computer : contrôle total de Comet et Android
Computer contrôle Comet sans MCP
16 mars — Computer peut désormais prendre le contrôle total du navigateur Comet pour exécuter des tâches autonomes : l’agent navigateur peut accéder à n’importe quel site ou application connectée, sans connecteurs ni MCP. Disponible pour tous les utilisateurs Computer sur Comet.
Computer sur Android
16 mars — Perplexity Computer est désormais disponible sur Android, étendant le lancement iOS du 13 mars à l’ensemble des plateformes mobiles.
Manus : bureau local et Google Workspace au niveau développeur
Manus “My Computer” sur macOS et Windows
16 mars — Manus annonce “My Computer”, fonctionnalité centrale de la nouvelle application Manus Desktop (macOS et Windows). Jusqu’ici limité à un bac à sable cloud, Manus peut désormais s’exécuter directement sur la machine locale via des instructions en ligne de commande dans un terminal local — avec approbation explicite de l’utilisateur à chaque étape.
Les cas d’usage couvrent un spectre large : trier et renommer des milliers de fichiers, créer des applications de bureau natives (exemple cité : une application Mac de traduction et sous-titrage en temps réel créée en 20 minutes, sans ouvrir Xcode), ou utiliser le GPU local pour entraîner des modèles de machine learning. My Computer complète les Connecteurs cloud existants (Google Calendar, Gmail) plutôt que de les remplacer.
🔗 Tweet Manus · 🔗 Blog Manus
Manus maîtrise Google Workspace avec précision
17 mars — Manus déploie une mise à jour majeure de son connecteur Google Workspace, basée sur le Google Workspace CLI (outil open source de l’équipe Google). L’ancienne version traitait les fichiers Google comme des blocs monolithiques ; la nouvelle version permet des actions granulaires :
| Domaine | Nouvelles capacités |
|---|---|
| Google Docs | Remplacements de texte chirurgicaux, réponses à des commentaires spécifiques |
| Google Sheets | Lecture multi-feuilles croisées, mise à jour d’une cellule précise, duplication d’onglets |
| Google Slides | Édition de présentations existantes (titre d’une diapositive, mise à jour de chronologie) |
| Google Drive | Réorganisation de dossiers |
La mise à jour est gratuite et rétrocompatible.
🔗 Tweet Manus · 🔗 Blog Manus
GitHub : /fleet pour la maintenance en masse et 12,5 M$ pour l’open source
Copilot /fleet : maintenance sur toute la flotte de dépôts
15 mars — GitHub fait la démonstration de la commande /fleet dans GitHub Copilot. En une instruction, les développeurs qui gèrent plusieurs dépôts peuvent déléguer les tâches de maintenance répétitives (mises à jour de configuration, corrections de dépendances) à l’agent sur l’ensemble de leur flotte, plutôt que dépôt par dépôt.
12,5 M$ pour la sécurité open source
17 mars — GitHub, Anthropic, AWS, Google et OpenAI s’unissent dans un engagement collectif de 12,5 millions de dollars en faveur d’Alpha-Omega, le programme de la Linux Foundation dédié à la sécurisation de l’écosystème open source.
Points clés côté GitHub : 280 000+ mainteneurs sur des centaines de millions de dépôts publics seront éligibles à un accès gratuit à GitHub Copilot Pro. GitHub injecte également 5,5 M$ en crédits Azure pour la formation. Le GitHub Secure Open Source Fund, qui a déjà soutenu 138 projets, ouvre sa quatrième session fin avril 2026.
Le contexte est significatif : l’IA a considérablement accéléré la découverte de vulnérabilités, ce qui alourdit la charge des mainteneurs. L’objectif affiché est que l’IA réduise cette charge plutôt que de l’augmenter.
🔗 Article GitHub Blog 🔗 Annonce Linux Foundation
Z.ai GLM-5-Turbo : haute-vitesse pour les environnements agents
15 mars — Z.ai lance GLM-5-Turbo, une variante haute-vitesse de GLM-5 optimisée pour les environnements agents (notamment OpenClaw). Le même jour, les limites d’utilisation sont triplées pour les abonnés GLM Coding Plan. Disponible sur OpenRouter et via l’API directe.
Kimi publie un paper sur les Attention Residuals
16-17 mars — Moonshot AI publie un paper de recherche sur les Attention Residuals sur arXiv : une nouvelle approche d’agrégation en profondeur qui remplace les connexions résiduelles standard par une récurrence inspirée de la dualité temps/profondeur (depth-wise aggregation). L’analyse montre que cette approche atténue naturellement les problèmes de croissance de magnitude des états cachés. Elon Musk a répondu “Impressive work from Kimi” sur le tweet d’annonce (4,5 millions de vues).
🔗 Tweet Kimi · 🔗 arXiv 2603.15031
ElevenLabs × Deloitte : agents omnicanaux pour l’entreprise
14 mars — ElevenLabs et Deloitte annoncent un partenariat stratégique combinant la plateforme ElevenLabs Agents avec l’expertise sectorielle de Deloitte, pour aider les grandes entreprises à déployer des agents conversationnels omnicanaux. Le partenariat cible les entreprises régulées (finance, santé, service public). Deloitte apporte l’intégration métier, ElevenLabs fournit l’infrastructure audio IA (voix, transcription, agents).
Brèves
Tongyi Fun-CineForge (Alibaba, 16 mars) — Tongyi Lab open-source Fun-CineForge, un système de doublage cinématographique IA approchant la qualité du cinéma professionnel. Disponible sur GitHub, HuggingFace et ModelScope. 🔗 Annonce sur X
Ce que ça signifie
La NVIDIA GTC 2026 cristallise une dynamique importante : plusieurs labs IA de premier plan (Mistral, Perplexity, Cohere) s’alignent autour de l’infrastructure NVIDIA pour co-développer des modèles frontier ouverts ou des déploiements souverains. Cette convergence autour d’une coalition ouverte tranche avec la période récente de fragmentation — et signale que le pré-entraînement à grande échelle est devenu trop coûteux pour être traité en silo.
GPT-5.4 mini confirme une tendance lourde : les modèles “petit format” ne sont plus des versions dégradées mais des alternatives compétitives. Avec 54,4 % sur SWE-Bench Pro contre 57,7 % pour le modèle complet, et un coût 19x inférieur, GPT-5.4 mini redéfinit le rapport performance/prix pour les workflows de codage.
La journée du 17 mars illustre aussi la montée en puissance des agents locaux et bureau : Manus “My Computer” sort du cloud pour accéder à la machine locale, Perplexity Computer prend le contrôle de Comet sans MCP, et Claude Code double sa fenêtre de génération par défaut pour Opus 4.6. L’ère de l’agent qui se contente de suggérer laisse place à celle de l’agent qui exécute.
Sources
- Introducing GPT-5.4 mini and nano – OpenAI
- Why Codex Security Doesn’t Include a SAST Report – OpenAI
- Mistral × NVIDIA – annonce X
- Perplexity rejoint la NVIDIA Nemotron Coalition
- NVIDIA Nemotron Coalition
- NVIDIA Dynamo 1.0 – X
- NVIDIA Physical AI Data Factory Blueprint – X
- Cohere + NVIDIA IA souveraine
- Perplexity Comet Enterprise
- CHANGELOG Claude Code v2.1.77
- Thariq – Skills article
- Google Personal Intelligence expansion
- AlphaFold Database expansion – X
- xAI TTS API – X
- Grok Imagine #1 Design Arena – X
- Perplexity Computer contrôle Comet – X
- Perplexity Computer Android – X
- Manus My Computer
- Manus Google Workspace CLI
- GitHub Copilot /fleet – X
- GitHub + Alpha-Omega 12,5 M$
- Linux Foundation – fonds sécurité open source
- Z.ai GLM-5-Turbo – X
- Kimi Attention Residuals – X
- Kimi Attention Residuals – arXiv
- ElevenLabs × Deloitte
- Tongyi Fun-CineForge – X
इस दस्तावेज़ का अनुवाद fr संस्करण से hi भाषा में gpt-5.4-mini मॉडल का उपयोग करके किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए, https://gitlab.com/jls42/ai-powered-markdown-translator देखें