Claude बातचीत में इंटरैक्टिव विज़ुअल बनाता है, OpenAI Sora 2 Video API लॉन्च करता है, Google Maps Gemini के साथ फिर से आकार लेता है

12 मार्च 2026 तीन प्रमुख उत्पाद घोषणाओं से चिह्नित है: Claude बातचीत में सीधे इंटरैक्टिव विज़ुअल जनरेट करने में एक मील का पत्थर पार करता है, OpenAI डेवलपर्स के लिए Sora 2 से संचालित Video API खोलता है, और Google Maps को Gemini के साथ दस साल में सबसे गहरे रीफैक्टरिंग के साथ फिर से डिज़ाइन किया गया है। साथ ही, Claude Code को दो अपडेट (v2.1.73 और v2.1.74) मिले, Perplexity ने Computer को Pro सब्सक्राइबर्स के लिए खोल दिया, और ElevenLabs ने अपनी क्रिएटिव प्लेटफ़ॉर्म में Flows और Music Finetunes लॉन्च किए।

Claude बातचीत में इंटरैक्टिव विज़ुअल बनाता है

12 मार्च — Claude अब बातचीत के भीतर सीधे इंटरैक्टिव चार्ट, डायग्राम और विजुअलाइज़ेशन बना सकता है, बिना कोड लिखे। यह फ़ीचर सभी सब्सक्रिप्शन पर बीटा में उपलब्ध है, जिसमें फ्री प्लान भी शामिल है।

पिछली गिरावट में घोषित “Imagine with Claude” प्रीव्यू का विस्तार, यह फीचर असिस्टेंट के साथ इंटरैक्शन के तरीके को बदल देता है: विज़ुअल प्रतिक्रियाओं के अंदर इनलाइन दिखते हैं, अलग साइडपैनल में नहीं। ये अस्थायी होते हैं — बातचीत के साथ विकसित होते हैं या गायब हो जाते हैं — जिनके विपरीत Artifacts स्थायी दस्तावेज़ होते हैं जिन्हें साझा या डाउनलोड किया जा सकता है।

व्यावहारिक उपयोग के उदाहरण: संयुक्त ब्याज कैसे काम करता है पूछने पर एक इंटरैक्टिव कर्व मिलता है जिसे मैनिपुलेट किया जा सकता है, पीरियॉडिक टेबल माँगने पर प्रत्येक तत्व का विवरण दिखाने वाला क्लिकेबल विजुअल मिलता है। “draw this as a diagram” या “visualize how this might change over time” जैसे फॉर्मुलों से विज़ुअल ट्रिगर किया जा सकता है। Claude स्वयं तय करता है कि कब विज़ुअल बनाना है, या यूज़र स्पष्ट अनुरोध कर सकता है।

यह फ़ीचर हाल की Claude प्रतिक्रियाओं में सुधारों की एक श्रृंखला में जुड़ता है: रेसिपीज़ के लिए समर्पित फॉर्मैट, विज़ुअल मौसम, और Figma, Canva और Slack के साथ डायरेक्ट इंटीग्रेशंस।

“Claude can now build interactive charts and diagrams, directly in the chat. Available today in beta on all plans, including free.”

🇮🇳 Claude अब बातचीत के भीतर सीधे इंटरैक्टिव चार्ट और डायग्राम बना सकता है। आज से सभी सब्सक्रिप्शनों पर बीटा में उपलब्ध, जिसमें मुफ्त प्लान भी शामिल है। — @claudeai पर X

🔗 Claude अब इंटरैक्टिव चार्ट, डायग्राम और विजुअलाइज़ेशन बनाता है

Claude Code v2.1.74 : संदर्भ प्रबंधन और मल्टी-प्लेटफ़ॉर्म फिक्सेस

12 मार्च — Claude Code का v2.1.74 संदर्भ प्रबंधन में सुधार लाता है और Windows तथा macOS पर कई बग्स को ठीक करता है।

नए फीचर्स :

फ़ीचर	विवरण
`/context` बेहतर हुआ	क्रियाशील सुझाव: संदर्भ में भारी टूल्स, मेमोरी फूलिंग और कैपेसिटी चेतावनियों की पहचान करता है तथा ऑप्टिमाइज़ेशन सुझाव देता है
`autoMemoryDirectory`	ऑटो-मेमोरी स्टोरेज के लिए कस्टम डायरेक्टरी कॉन्फ़िगर करने का नया पैरामीटर
`CLAUDE_CODE_SESSIONEND_HOOKS_TIMEOUT_MS`	`SessionEnd` hooks के timeout को कॉन्फ़िगर करने का नया पैरामीटर (पहले 1.5 स था)

नोटेबल फिक्सेस में शामिल हैं: स्ट्रीमिंग मोड में API रिस्पॉन्स बफर्स में मेमोरी लीक जो Node.js पर अनबाउंडेड RSS वृद्धि कर रहा था; managed ask नीतियाँ अब उपयोगकर्ता allow नियमों द्वारा बाईपास नहीं की जा सकती थीं; एजेंट्स के frontmatter model: में पूर्ण मॉडल IDs (जैसे claude-opus-4-5) चुपचाप अनदेखा किए जा रहे थे, अब सही तरीके से स्वीकार किए जाते हैं। MCP OAuth सुधारों में callback पोर्ट पहले से उपयोग में होने पर ब्लॉकेज और refresh token के एक्सपायर होने के बाद री-ऑथेंटिकेशन की कमी शामिल है, जैसे Slack जैसे कनेक्टर्स के लिए। macOS पर, नेटिव बायनरी अब audio-input entitlement शामिल करता है ताकि macOS वोकल मोड में माइक्रोफोन अनुमति के अनुरोध को सही रूप से दिखाए।

🔗 CHANGELOG Claude Code

Claude Code v2.1.73 : स्थिरता, Bedrock ARNs और OAuth SSL

11 मार्च — v2.1.73 कई महत्वपूर्ण स्थिरता समस्याओं को ठीक करता है, जिनमें CPU हॉग और skills से जुड़े deadlocks शामिल हैं।

नए फीचर्स :

फ़ीचर	विवरण
`modelOverrides`	मॉडल सेलेक्टर की एंट्रीज़ को कस्टम प्रोवाइडर मॉडल IDs से मैप करने के लिए नया पैरामीटर (उदा.: Bedrock inference profile ARNs)
Guidance OAuth SSL	OAuth कनेक्शन या कनेक्टिविटी चेक फ़ेल होने पर actionable guidance (एंटरप्राइज़ प्रॉक्सी, `NODE_EXTRA_CA_CERTS`)

मुख्य फिक्सेस: जटिल bash कमांड्स पर permission prompts से ट्रिगर होने वाले deadlocks और 100% CPU लूप्स; कई skill फ़ाइलों के एक साथ बदलने पर Claude Code को फ्रीज़ कर सकने वाला एक ब्लॉक (उदा.: एक बड़े .claude/skills/ फ़ोल्डर वाले रिपॉ में git pull); Bedrock, Vertex और Microsoft Foundry पर model: opus / sonnet / haiku वाले सब-एजेंट्स चुपचाप पुराने वर्ज़न में डाउनग्रेड हो रहे थे।

🔗 CHANGELOG Claude Code

Ramp AI Index : Anthropic अब कंपनियों की पहली पसंद

11 मार्च — नवीनतम Ramp AI Index रिपोर्ट के अनुसार, Anthropic उन कंपनियों के बीच उनकी पहली खरीद पर पसंदीदा AI प्रोवाइडर बन गया है। Ramp Economics Lab के प्रमुख अर्थशास्त्री Ara Kharazian द्वारा साझा किए गए ग्राफ़ में दिखाया गया है कि 2026 की शुरुआत में Anthropic की नया क्लाइंट कंपनीज़ से मार्केट शेयर ~70% तक पहुँची है, जबकि OpenAI ~25% पर है — 2025 की तुलना में एक उल्लेखनीय उलटफेर।

डेटा Ramp प्लेटफ़ॉर्म का उपयोग करने वाली 50,000+ कंपनियों से आता है (कॉर्पोरेट क्रेडिट कार्ड और पेमेंट्स), जो इसे एंटरप्राइज़ AI खर्च का विश्वसनीय बारोमीटर बनाता है। Anthropic की वृद्धि विशेष रूप से क्लॉड के एंटरप्राइज़ प्रयोग (API, Claude for Work, एंटरप्राइज़ इंटीग्रेशन) द्वारा चालक है।

🔗 Ramp AI Index पर X

OpenAI Video API : डेवलपर्स के लिए Sora 2 उपलब्ध

12 मार्च — OpenAI ने डेवलपर्स के लिए Video API लॉन्च किया, एक प्रोग्रामेटिक इंटरफ़ेस जो वीडियो बनाने, बढ़ाने, संपादित करने और प्रबंधित करने की क्षमता देता है। यह क्षमता OpenAI के δεύτερης पीढ़ी के वीडियो जनरेशन मॉडल Sora 2 द्वारा समर्थित है।

Video API दो वेरिएंट एक्सपोज़ करता है: sora-2, जो गति और एक्सप्लोरेशन के लिए डिज़ाइन किया गया है (तेज़ इटरेशन, सोशल सामग्री, प्रोटोटाइप), और sora-2-pro, जो प्रोडक्शन क्वालिटी के लिए है (सिनेमैटिक आउटपुट, मार्केटिंग एसेट्स, 1920×1080 तक रेज़ोल्यूशन)। दोनों वेरिएंट 16 से 20 सेकंड तक की जनरेशन अवधि सपोर्ट करते हैं, कुल मिलाकर 120 सेकंड तक विस्तार संभव है।

मुख्य फ़ीचर्स जो POST /videos endpoint के माध्यम से उपलब्ध हैं: टेक्स्ट प्रॉम्प्ट से जनरेशन, रेफ़रेंस इमेज द्वारा मार्गदर्शन (जो पहली फ़्रेम को कंडीशन करता है), गैर-मानव पात्रों की कोहेरेंस जिन्हें कई जनरेशनों में पुन: उपयोग किया जा सकता है (POST /v1/videos/characters), और लक्षित एडिटिंग via POST /v1/videos/edits. प्रोसेसिंग असिंक्रोनस है, रेंडर पूरा होने पर वेबहुक नॉटिफिकेशन सपोर्ट है। बैच API के माध्यम से ऑफ़लाइन रेंडर कतारों के लिए बैच प्रोसेसिंग भी उपलब्ध है।

कुछ कंटेंट प्रतिबंध लागू होते हैं: वास्तविक लोगों का प्रतिनिधित्व नहीं, कॉपीराइट कटे हुए पात्रों का उपयोग नहीं, वयस्क सामग्री नहीं (यह प्रतिबंध भविष्य में बदल सकता है)।

🔗 Video API डॉक्स

12 मार्च — Google Maps को Gemini द्वारा संचालित कर के एक दशक से भी अधिक समय में इसका सबसे बड़ा नेविगेशन अपडेट मिला है। दो नई एक्सपीरियंस एक साथ घोषित की गईं।

Ask Maps एक नई बातचीत-आधारित एक्सपीरियंस है जो वास्तविक स्थानों के बारे में जटिल सवाल पूछने देती है। उदाहरण के लिए आप पूछ सकते हैं “मेरा फोन खत्म हो रहा है — मैं कहाँ बिना लाइन लगाए चार्ज कर सकता/सकती हूँ, जैसे कि किसी कैफ़े के लिए लाइन न लगानी पड़े?” या “क्या आज रात रोशनी वाला टेनिस कोर्ट उपलब्ध है?” यह फ़ीचर 300 मिलियन+ स्थानों और 500 मिलियन+ योगदानकर्ताओं की समीक्षाओं के डेटा पर आधारित है। उत्तर उन स्थानों के अनुसार व्यक्तिगत बनाए जाते हैं जिन्हें आपने पहले सेव किया या खोजा है। Ask Maps Android और iOS पर यूएस और भारत में रोलआउट शुरू कर रहा है, और डेस्कटॉप जल्द आएगा।

Immersive Navigation ड्राइविंग अनुभव को 3D व्यू के साथ रूपांतरित करता है जो आसपास की इमारतों, पुलों और भू-आकृति को दर्शाता है। Gemini Street View और एरियल फ़ोटो का विश्लेषण करके महत्वपूर्ण विवरण दिखाता है: लेन, फुटपाथ, ट्रैफ़िक सिग्नल, स्टॉप साइन। फ़ीचर नेचुरल वॉइस नेविगेशन भी प्रदान करता है (जैसे “इस एक्ज़िट को छोड़ दें और अगली लें इल्लिनॉयस 43 साउथ के लिए”), वैकल्पिक रूट्स के ट्रेडऑफ़ (टोल बनाम ट्रैफ़िक) की जानकारी, और वास्तविक समय में व्यवधानों पर अलर्ट। Immersive Navigation आज से पात्र iOS और Android उपकरणों, CarPlay, Android Auto और Google-इंटिग्रेटेड कार्स पर उपलब्ध हो रहा है।

🔗 Ask Maps और Immersive Navigation: Google Maps में नई AI सुविधाएँ

GitHub Copilot : JetBrains में GA के लिए ऑटो मॉडल चयन

12 मार्च — GitHub ने GitHub Copilot के लिए JetBrains डेवलपमेंट वातावरणों (IntelliJ IDEA, PyCharm, WebStorm, आदि) में ऑटोमैटिक मॉडल चयन को Generally Available घोषित किया, सभी Copilot सब्सक्रिप्शन्स के लिए।

“Auto” मोड टास्क के लिए सबसे उपयुक्त मॉडल को गतिशील रूप से चुनता है, थ्रॉटलिंग सीमाओं को ध्यान में रखते हुए। डेवलपर्स के पास पूरी पारदर्शिता बनी रहती है: उत्तर पर होवर करने पर वे देख सकते हैं कि कौन सा मॉडल इस्तेमाल हुआ, और कभी भी किसी विशेष मॉडल पर स्विच कर सकते हैं। बिलिंग असल में चुने गए मॉडल के अनुसार होती है, वर्तमान में मल्टीप्लायर्स लगभग 0x से 1x के बीच हैं।

GitHub का कहना है कि ऑटो मॉडल चयन समय के साथ और बुद्धिमान होगा, और टास्क के सटीक संदर्भ के आधार पर मॉडल चुनने में सक्षम होगा (कोड जनरेशन, समीक्षा, चैट, आदि)। यह फ़ीचर पहले JetBrains में प्रीव्यू में और VS Code में GA के रूप में उपलब्ध था।

🔗 Copilot auto model selection GA in JetBrains IDEs

GitHub Copilot CLI : SQLite में सत्र इतिहास

11 मार्च — GitHub Copilot CLI अब स्थानीय SQLite डेटाबेस समेकित करता है ताकि आपके टर्मिनल सत्रों का इतिहास याद रखा जा सके। इसका मतलब है कि अगर आपने कुछ दिन पहले कमांड लाइन में कोई समस्या हल की थी, तो Copilot CLI आपको समाधान याद दिला सकता है — बिना शेल इतिहास या नोट्स खंगाले। यह फ़ीचर GitHub Copilot CLI की GA उपलब्धि के चरण 2 का हिस्सा है, जो gh copilot के माध्यम से एक्सेस किया जा सकता है।

🔗 GitHub Copilot CLI

Perplexity Computer अब Pro सब्सक्राइबर्स के लिए खुला

12 मार्च — Perplexity Computer, वह एजेंट जो वेब, फ़ाइलों और कनेक्टेड टूल्स पर बहु-स्टेप जटिल वर्कफ़्लोज़ चला सकता है, अब Pro सब्सक्राइबर्स के लिए उपलब्ध है।

पहले यह केवल Max सब्सक्राइबर्स और Enterprise ग्राहकों के लिए आरक्षित था; Perplexity Computer 20+ उन्नत मॉडलों, पूर्वनिर्धारित और कस्टमाइजेबल skills, और सैकड़ों कनेक्टर्स तक पहुँच देता है। Max सब्सक्राइबर्स मासिक क्रेडिट और उच्च खर्च सीमाओं के मामले में एक फायदा बनाए रखते हैं।

🔗 Perplexity Computer

Perplexity Computer for Enterprise : चार हफ्तों में $1.6M की बचत

12 मार्च — Perplexity ने एक डेडिकेटेड पोस्ट प्रकाशित किया जो Perplexity Computer for Enterprise के डिप्लॉयमेंट का विवरण देता है, जो अब Enterprise ग्राहकों के लिए उपलब्ध है।

Computer for Enterprise उन टूल्स में इंटीग्रेट होता है जो कंपनियाँ पहले से इस्तेमाल करती हैं: Salesforce, Microsoft Teams, HubSpot, MySQL, GitHub, और 400+ अन्य कनेक्टर्स के माध्यम से। यह हर टास्क को सबसे उपयुक्त मॉडल पर रूट करता है (करीब बीस में से), और टीमों को अपने इंटरनल प्रोसेसेज़ के अनुरूप skills परिभाषित करने देता है।

टीम	उपयोग का मामला
Finance	M&A के लिए ड्यू डिलिजेंस ट्रैकिंग, दस्तावेज़ विश्लेषण और रिस्क रिपोर्टिंग
Legal	सप्लायर एग्रीमेंट की समीक्षा, वर्ज़न तुलना, कॉन्ट्रैक्ट एनोटेशन (redlining)
Marketing	कैंपेन क्रिएशन (क्रिएटिव्स, सोशल पोस्ट्स, लैंडिंग पेज) + परफ़ॉर्मेंस डैशबोर्ड

Perplexity ने 16,000+ अनुरोधों पर आधारित एक आंतरिक अध्ययन के आंकड़े साझा किए: Computer ने चार हफ्तों में $1.6M (1.6 मिलियन डॉलर) लेबर कॉस्ट बचाई और 3.25 वर्षों के काम के बराबर कार्य पूरा किया। सॉल्यूशन SOC 2 Type II प्रमाणित है, SAML SSO सपोर्ट करता है और प्रत्येक टास्क के लिए आइसोलेटेड निष्पादन प्रदान करता है।

🔗 Perplexity Computer for Enterprise

ElevenLabs Flows : इमेज, वीडियो, ऑडियो को यूनिफ़ाइ करने का कैनवस

11 मार्च — ElevenLabs ने ElevenCreative में Flows पेश किया, एक node-based एडिटर। एक ही कैनवस में क्रिएटर्स इमेज जनरेशन, वीडियो, Text to Speech, lip-sync, संगीत और साउंड इफेक्ट्स को चेन और संयोजित कर सकते हैं।

यह दृष्टिकोण ComfyUI के वर्कफ़्लोज़ की याद दिलाता है, लेकिन ElevenLabs के मल्टीमॉडल इकोसिस्टम पर लागू, जहाँ स्टूडियो के सभी ऑडियो और वीडियो मॉडलों तक एक ही जगह से पहुँच संभव है।

🔗 ElevenCreative में Flows पेश कर रहे हैं

ElevenLabs Music Finetunes : संगीत जनरेशन के लिए स्टाइलिस्टिक कोहेरेंस

12 मार्च — ElevenLabs ने ElevenCreative में Music Finetunes लॉन्च किए। यह फ़ीचर क्रिएटर्स को इंडिविजुअल वॉइस, इंस्ट्रूमेंट्स या पूरा ट्रैक जनरेट करने देता है जबकि स्टाइलिस्टिक कोहेरेंस बनाए रखता है, ElevenLabs के म्यूज़िकल मॉडल के fine-tuned वर्ज़न के माध्यम से।

🔗 ElevenCreative में Music Finetunes पेश कर रहे हैं

BFL FLUX.2 [klein] 9B : इमेज एडिटिंग 2× तेज़

12 मार्च — Black Forest Labs (BFL) ने अपने FLUX.2 [klein] 9B मॉडल का एक महत्वपूर्ण अपडेट घोषित किया: इमेज एडिटिंग अब 2× तेज़ है, खासकर जब कई रेफ़रेंस इमेजेस उपयोग में हों।

विवरण	मान
मॉडल	FLUX.2 [klein] 9B
सुधार	एडिटिंग में 2× तेज़
मजबूत उपयोग मामला	मल्टीपल रेफ़रेंस
मूल्य	अपरिवर्तित
वज़न	HuggingFace (`black-forest-labs/FLUX.2-klein-9b-kv`)

अपग्रेड अपने आप लागू होगा और API के माध्यम से मौजूदा FLUX.2 [klein] 9B उपयोगकर्ताओं के लिए मुफ्त है। [Les utilisateurs du modèle [klein] 4B peuvent accéder à la version 9B améliorée via un nouvel endpoint en préversion.] Les उपयोगकर्ता मॉडल [klein] 4B के उपयोगकर्ता एक नए प्रीव्यू एंडपॉइंट के माध्यम से उन्नत 9B संस्करण तक पहुँच सकते हैं।

🔗 X पर BFL की घोषणा

Mistral AI Now Summit : पेरिस, 28 मई 2026

12 मार्च — Mistral AI अपने पहले प्रमुख कार्यक्रम की घोषणा कर रहा है: “AI Now Summit”, एक दिन जो उद्यमों में एआई परिवर्तन को समर्पित है, जो 28 मई 2026 को पेरिस में आयोजित होगा।

थीम	विवरण
एंटरप्राइज़ ओपन सोर्स	अंत से अंत तक एआई रूपांतरणों के लिए ओपन सोर्स को आधार के रूप में अपनाना
प्रोडक्शन में तैनाती	पायलट से बड़े पैमाने पर तैनाती तक जाना
एआई इंफ्रास्ट्रक्चर	एंटरप्राइज़-स्तरीय इंफ्रास्ट्रक्चर बनाना
2026 में नवाचार	रोबोटिक्स, विज़न-भाषा मॉडल (VLMs), मल्टीमॉडल एआई

यह कार्यक्रम दुनिया भर के नेताओं को एकत्र करेगा। पंजीकरण अभी खुला नहीं है; एक प्रतीक्षा सूची ainowsummit.com पर उपलब्ध है।

🔗 X पर AI Now Summit

इसका क्या मतलब है

12 मार्च का दिन दो संगमशील प्रवृत्तियों को दर्शाता है। एक ओर, सामान्य-उद्देश्य वाले एआई असिस्टेंट — Claude, Perplexity, Google Maps — ऐसी क्षमताओं से समृद्ध हो रहे हैं जो प्रश्न और उपयोगी उत्तर के बीच की घर्षण को कम करती हैं: ग्राफ़ देखने के लिए कोड लिखने की ज़रूरत नहीं, रेस्तरां खोजने के लिए फिर से वाक्यांश बदलने की ज़रूरत नहीं। दूसरी ओर, डेवलपर्स को नई प्रोग्रामेटिक ईकाइयाँ मिल रही हैं: OpenAI की Video API वीडियो जनरेशन को स्वचालित वर्कफ़्लो तक खोलती है, और Claude Code उद्यम वातावरण (Bedrock, proxies SSL, मल्टी-प्लेटफ़ॉर्म Windows/macOS) के लिए लगातार परिष्कृत होता जा रहा है।

Ramp AI Index रिपोर्ट पुष्टि करती है कि यह प्रवृत्ति वास्तविक खरीद में बदल रही है: नई कंपनियों के बीच ~70% हिस्सेदारी के साथ, Anthropic अब केवल OpenAI का विकल्प नहीं रहा — यह डिफ़ॉल्ट प्रवेश बिंदु बन गया है। प्रतिस्पर्धा अब एकमात्र मॉडल शक्ति पर नहीं, बल्कि एकीकरणों की गुणवत्ता और प्रोडक्शन में विश्वसनीयता पर आधारित होती है।

स्रोत

यह दस्तावेज़ fr संस्करण से hi भाषा में gpt-5-mini मॉडल का उपयोग करके अनुवादित किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए देखें https://gitlab.com/jls42/ai-powered-markdown-translator