Claude Code ऑटो मोड, ChatGPT में विज़ुअल शॉपिंग, Grok Imagine मल्टी-इमेज से वीडियो

23 और 24 मार्च की ये दो दिन बेहद व्यस्त रहीं: Anthropic Claude Code में ऑटो मोड तैनात करता है — एक एक्शन क्लासिफ़ायर जो उपयोगकर्ता की जगह अनुमोदन के फैसले लेता है — और अपने GAN-प्रेरित मल्टी-एजेंट आर्किटेक्चर पर एक इंजीनियरिंग लेख प्रकाशित करता है। OpenAI Agentic Commerce Protocol के साथ ChatGPT में विज़ुअल शॉपिंग लॉन्च करता है, जबकि xAI Grok Imagine को API पर मल्टी-इमेज वीडियो के लिए खोलता है। GitHub Copilot, Google DeepMind और Anthropic Science Blog इस अवलोकन को पूरा करते हैं।

Claude Code : ऑटो मोड, आपके और कमांड्स के बीच एक क्लासिफ़ायर

24 मार्च — Claude Code अब अनुमतियों का एक तीसरा स्तर जोड़ता है: ऑटो मोड। अब तक, यह उपकरण या तो हर फ़ाइल लिखने और bash कमांड को मैन्युअल रूप से अनुमोदित करने का विकल्प देता था, या जाँचों को पूरी तरह बंद करने का। ऑटो मोड एक मध्य मार्ग लाता है: Claude स्वयं निर्णय लेता है, एक क्लासिफ़ायर (classifier) की निगरानी में जो निष्पादन से पहले हर कार्रवाई का विश्लेषण करता है।

तंत्र सरल है — हर टूल कॉल से पहले, क्लासिफ़ायर मूल्यांकन करता है कि क्या कार्रवाई संभावित रूप से विनाशकारी है। सुरक्षित मानी गई कार्रवाइयाँ स्वतः चलती हैं। जोखिमपूर्ण कार्रवाइयाँ रोक दी जाती हैं, और Claude उपयोगकर्ता को बाधित किए बिना कोई वैकल्पिक तरीका खोजता है।

Anthropic स्पष्ट करता है कि यह मोड जोखिमों को कम करता है, लेकिन समाप्त नहीं करता, और इसे पृथक वातावरणों में उपयोग करने की सिफ़ारिश करता है। इसे सक्रिय करने के लिए: claude --enable-auto-mode, फिर Shift+Tab के साथ इस मोड में जाएँ।

यह सुविधा Team योजना पर पूर्वावलोकन (research preview) में उपलब्ध है। Enterprise और API के लिए रोलआउट आने वाले दिनों के लिए घोषित किया गया था।

Claude Code में नया: ऑटो मोड। हर फ़ाइल लिखने और bash कमांड को अनुमोदित करने, या अनुमतियों को पूरी तरह छोड़ देने के बजाय, ऑटो मोड Claude को आपकी ओर से अनुमोदन निर्णय लेने देता है। सुरक्षा उपाय इसे चलने से पहले हर कार्रवाई की जाँच करते हैं।

🇮🇳 Claude Code में नया: ऑटो मोड। हर फ़ाइल लिखने और bash कमांड को अनुमोदित करने, या अनुमतियों को पूरी तरह छोड़ देने के बजाय, ऑटो मोड Claude को आपकी ओर से अनुमोदन निर्णय लेने देता है। सुरक्षा उपाय इसे चलने से पहले हर कार्रवाई की जाँच करते हैं। — @claudeai on X

🔗 X पर घोषणा

मल्टी-एजेंट आर्किटेक्चर : Anthropic Engineering का GAN-आधारित दृष्टिकोण

24 मार्च — Anthropic Engineering Blog पर प्रकाशित एक लेख में, Prithvi Rajasekaran (Labs टीम) Claude की सीमाएँ दो क्षेत्रों में आगे बढ़ाने के लिए एक मल्टी-एजेंट आर्किटेक्चर का वर्णन करते हैं: इंटरफ़ेस डिज़ाइन और लंबे समय तक चलने वाला स्वायत्त एप्लिकेशन विकास।

यह दृष्टिकोण जनरेटिव एडवर्सेरियल नेटवर्क्स (Generative Adversarial Networks, GAN) से प्रेरित है: एक जनरेटर एजेंट कोड या डिज़ाइन बनाता है, जबकि एक अलग मूल्यांकनकर्ता एजेंट परिणाम को स्कोर करता है और आलोचनात्मक प्रतिक्रिया देता है। यह विभाजन एक ज्ञात समस्या हल करता है — Claude स्वयं का मूल्यांकन करते समय अक्सर अत्यधिक उदार होता है। एक समर्पित मूल्यांकनकर्ता, उदाहरणों के साथ धीरे-धीरे कैलिब्रेट किया गया, सुधार का एक प्रभावी साधन बन जाता है।

फ्रंटएंड डिज़ाइन के लिए, मूल्यांकनकर्ता को MCP Playwright तक पहुँच मिलती है ताकि वह लाइव पेजों पर नेविगेट कर सके। चार मानदंड उपयोग किए जाते हैं: डिज़ाइन की गुणवत्ता और सामंजस्य, मौलिकता (सामान्य “AI slop” पैटर्न को दंडित करते हुए), तकनीकी craft, और कार्यक्षमता। 10 से 15 iterations में, जनरेटर उल्लेखनीय रूप से अधिक विशिष्ट इंटरफ़ेस बनाता है।

एप्लिकेशन विकास के लिए, आर्किटेक्चर एक planner जोड़ता है: यह एक-पंक्ति prompt को पूर्ण product specification में बदल देता है। जनरेटर और मूल्यांकनकर्ता हर implementation से पहले “sprint contracts” पर बातचीत करते हैं, जो सफलता के मानदंड तय करते हैं। मूल्यांकनकर्ता Playwright के माध्यम से एप्लिकेशन का परीक्षण करता है और एक sprint को असफल कर सकता है, जिससे पुनरीक्षण करना पड़ता है।

दृष्टिकोण	अवधि	लागत	परिणाम
Agent solo Opus 4.5	20 मिनट	9 $	टूटा हुआ एप्लिकेशन
पूर्ण harness	6 घंटे	200 $	कार्यात्मक एप्लिकेशन
Opus 4.6 के साथ harness	4 घंटे	124,70 $	कार्यात्मक एप्लिकेशन + एकीकृत Claude agent

Opus 4.6 के साथ — जिसे अब “context anxiety” नहीं रहती — लेखक आर्किटेक्चर को सरल कर पाए, session resets हटा पाए और लागत कम कर पाए। मार्गदर्शक सिद्धांत अब भी यही है: harness की नियमित audit करें ताकि वह हिस्सा हटाया जा सके जो model अब स्वयं कर सकता है।

🔗 पूरा लेख 🔗 X पर घोषणा

Cowork और Claude Code में Computer Use (macOS, Pro/Max)

23 मार्च — Claude अब सीधे कार्य पूरे करने के लिए आपका कंप्यूटर उपयोग कर सकता है। पूर्वावलोकन में, यह सुविधा Claude Cowork और Claude Code में, केवल macOS पर उपलब्ध है।

Claude एप्लिकेशन खोल सकता है, ब्राउज़र में नेविगेट कर सकता है, स्प्रेडशीट भर सकता है। विचार यह है: अपने फ़ोन से एक कार्य सौंपें, कुछ और करें, और एक पूरा काम वापस पाएँ। आवर्ती कार्य भी परिभाषित किए जा सकते हैं — हर सुबह ईमेल स्कैन करना, हर शुक्रवार रिपोर्ट तैयार करना।

Computer Use सुविधा Pro और Max योजनाओं पर उपलब्ध है, इसके लिए डेस्कटॉप एप्लिकेशन को अपडेट करना और उसे मोबाइल एप्लिकेशन के साथ जोड़ना होता है।

🔗 X पर घोषणा 🔗 Cowork उत्पाद पृष्ठ

Anthropic Economic Index : “Learning curves” (5वीं रिपोर्ट)

24 मार्च — Anthropic, Anthropic Economic Index की अपनी पाँचवीं रिपोर्ट प्रकाशित करता है, जिसका शीर्षक “Learning curves” है, जो फ़रवरी 2026 में Claude उपयोग के डेटा पर आधारित है (लगभग 1 मिलियन conversations, 5 से 12 फ़रवरी तक)।

रिपोर्ट नवंबर 2025 से अब तक दो प्रमुख बदलाव दर्ज करती है। पहले, उपयोगों का विविधीकरण: Claude.ai पर शीर्ष दस सबसे आम tasks अब ट्रैफ़िक का केवल 19% हैं, जो तीन महीने पहले 24% था। यह प्रवृत्ति आंशिक रूप से coding tasks के API की ओर migration से समझाई जाती है, जिसे Claude Code की वृद्धि ने प्रेरित किया है।

इसके बाद, “learning curve” प्रभाव: लंबे समय के उपयोगकर्ता (छह महीने से अधिक) 4 से 5 percentage points अधिक success rate दिखाते हैं। वे अधिक जटिल समस्याओं पर काम करते हैं, अधिक सहयोग करते हैं और automatic mode में कम delegating करते हैं। लेखक इसे practice के माध्यम से सीखने (learning-by-doing) का संकेत मानते हैं, हालांकि survival bias की संभावना बनी रहती है।

model चयन के बारे में, डेटा पुष्टि करता है कि उपयोगकर्ता उच्च-मूल्य वाले tasks के लिए Opus को प्राथमिकता देते हैं: किसी task के अनुमानित मूल्य में हर अतिरिक्त 10 $/h के साथ Claude.ai पर Opus उपयोग के अनुपात में 1.5 points की वृद्धि होती है, और API पर 2.8 points की।

🔗 पूरा रिपोर्ट 🔗 X पर घोषणा

Anthropic Science Blog : वैज्ञानिक शोध में AI के लिए नया ब्लॉग

23 मार्च — Anthropic, Anthropic Science Blog लॉन्च करता है, जो AI और वैज्ञानिक शोध के संगम को समर्पित है। इसका उद्देश्य यह दस्तावेज़ करना है कि AI शोधकर्ताओं के काम को कैसे तेज़ करता है और इस परिवर्तन से उठने वाले प्रश्नों की पड़ताल करना है।

ब्लॉग तीन प्रकार की सामग्री प्रकाशित करेगा: विशिष्ट परिणामों पर गहन लेख, जिनमें AI की भूमिका विस्तार से हो (Features), वैज्ञानिक क्षेत्रों के अनुसार व्यावहारिक मार्गदर्शिकाएँ (Workflows), और क्षेत्र की वर्तमान घटनाओं की समीक्षाएँ (Field notes)।

इस लॉन्च के साथ दो उद्घाटन लेख आते हैं: Matthew Schwartz द्वारा “Vibe physics: The AI grad student” (Claude द्वारा पर्यवेक्षित एक वास्तविक गणना पर काम करने वाला भौतिक विज्ञानी), और बहु-दिवसीय वैज्ञानिक tasks के लिए Claude Code orchestration पर एक ट्यूटोरियल।

यह ब्लॉग Anthropic की मौजूदा पहलों में आधारित है: AI for Science program (शोधकर्ताओं के लिए API credits), Claude for Life Sciences (pharma और biotech के साथ साझेदारियाँ), और Genesis Mission।

🔗 लॉन्च लेख 🔗 X पर घोषणा

ChatGPT में विज़ुअल शॉपिंग और Agentic Commerce Protocol

24 मार्च — OpenAI सीधे ChatGPT में एक दृश्य और immersive खरीदारी अनुभव लॉन्च करता है। उपयोगकर्ता उत्पादों को दृश्य रूप से ब्राउज़ कर सकते हैं, उन्हें कीमत, समीक्षाएँ, विशेषताएँ जैसी जानकारियों के साथ साथ-साथ तुलना कर सकते हैं, और ChatGPT छोड़े बिना बातचीत में अपनी खोज को परिष्कृत कर सकते हैं। प्रेरणादायक फ़ोटो अपलोड करके समान वस्तुएँ खोजने का विकल्प भी है।

इस सुविधा को शक्ति देने के लिए, OpenAI Agentic Commerce Protocol (ACP) को उत्पाद खोज तक विस्तारित करता है। यह protocol व्यापारियों और उपयोगकर्ताओं के बीच कनेक्शन की परत बन जाता है: व्यापारी अपने catalogues ACP के माध्यम से साझा करते हैं, और डेटा सीधे ChatGPT में आता है। Salesforce और Stripe पहले से third-party providers के रूप में एकीकृत हैं।

विवरण	जानकारी
उपलब्धता	सभी Free, Go, Plus, Pro उपयोगकर्ता — इस सप्ताह रोलआउट
Images upload	समान वस्तुएँ खोजने के लिए प्रेरणादायक फ़ोटो
एकीकृत व्यापारी	Target, Sephora, Nordstrom, Lowe’s, Best Buy, The Home Depot, Wayfair
Shopify	catalogues पहले से ही व्यापारियों की किसी कार्रवाई के बिना एकीकृत

Walmart पहला व्यापारी है जो एक native ChatGPT app प्रदान करता है: ChatGPT में discovery से लेकर Walmart environment तक, account link, loyalty program और payments के साथ। web browser पर उपलब्ध, iOS और Android जल्द आ रहे हैं। नोट: OpenAI अपनी प्रारंभिक “Instant Checkout” सुविधा छोड़ रहा है, जिसे व्यापारियों के लिए पर्याप्त लचीला नहीं माना गया, और discovery पर ध्यान केंद्रित कर रहा है।

🔗 आधिकारिक घोषणा

OpenAI : किशोरों के लिए सुरक्षा नीतियाँ open source में

24 मार्च — OpenAI किशोरों के लिए उपयुक्त अनुभव बनाने में डेवलपर्स की मदद के लिए सुरक्षा नीतियों का एक open source सेट प्रकाशित करता है। ये नीतियाँ prompt के रूप में आती हैं जिन्हें सीधे gpt-oss-safeguard के साथ उपयोग किया जा सकता है, जो OpenAI का open-weight सुरक्षा model है।

लक्ष्य: डेवलपर्स को अमूर्त सुरक्षा उद्देश्यों को सटीक परिचालन नियमों में बदलने में सक्षम बनाना। छह क्षेत्र शामिल हैं:

क्षेत्र	विवरण
ग्राफ़िक हिंसक सामग्री	स्पष्ट हिंसा का फ़िल्टरिंग
ग्राफ़िक यौन सामग्री	स्पष्ट यौन सामग्री का फ़िल्टरिंग
खतरनाक शरीर आदर्श	खाने के विकार, जोखिमपूर्ण व्यवहार
खतरनाक गतिविधियाँ और चुनौतियाँ	जोखिमपूर्ण viral challenges
रोमांटिक या हिंसक role-play	अनुपयुक्त interactions
वयस्कों के लिए आरक्षित वस्तुएँ और सेवाएँ	शराब, तंबाकू, जुआ

ये नीतियाँ Common Sense Media और everyone.ai के साथ विकसित की गई हैं। ROOST Model Community (RMC GitHub) के माध्यम से प्रकाशित, इन्हें स्पष्ट रूप से एक प्रारंभिक बिंदु के रूप में प्रस्तुत किया गया है, न कि पूर्ण समाधान के रूप में।

🔗 आधिकारिक घोषणा

OpenAI Foundation : कम से कम 1 अरब डॉलर तैनात

24 मार्च — OpenAI Foundation के बोर्ड अध्यक्ष Bret Taylor घोषणा करते हैं कि Foundation 2025 की शरद ऋतु की recapitalization से प्राप्त संसाधनों को तैनात करना शुरू कर रही है। वर्ष भर में कम से कम 1 अरब डॉलर चार क्षेत्रों में निवेश किया जाएगा: life sciences (Alzheimer, उच्च मृत्यु दर वाली बीमारियाँ), employment और आर्थिक प्रभाव, AI resilience (बच्चों की सुरक्षा, biosafety), और समुदाय-आधारित कार्यक्रम।

🔗 आधिकारिक घोषणा

ChatGPT में फ़ाइलें प्रबंधित करने के लिए OpenAI : Library tab

23 मार्च — OpenAI ChatGPT में फ़ाइल प्रबंधन की नई सुविधाएँ जोड़ता है: हाल की फ़ाइलें सीधे टूलबार से उपलब्ध, पहले अपलोड किए गए दस्तावेज़ से पूछताछ करने की क्षमता, और web sidebar में Library टैब ताकि सभी फ़ाइलें मिल सकें। Plus, Pro और Business ग्राहकों के लिए उपलब्ध, और European Economic Area, Switzerland और United Kingdom के लिए आने वाला रोलआउट।

🔗 X पर घोषणा

Gemini 3.1 Flash-Lite : एक ब्राउज़र जो पेजों को वास्तविक समय में जनरेट करता है

24 मार्च — Google DeepMind Gemini 3.1 Flash-Lite का एक डेमो प्रकाशित करता है: एक प्रयोगात्मक ब्राउज़र जो हर web page को क्लिक, खोज और नेविगेशन के साथ-साथ तुरंत जनरेट करता है। कोई पूर्व-मौजूद HTML पेज नहीं — हर सामग्री मॉडल द्वारा वास्तविक समय में बनाई जाती है। यह demo सीधे Google AI Studio से उपलब्ध है और इसने भारी engagement उत्पन्न किया (कुछ ही घंटों में 85,000 views)।

🔗 AI Studio डेमो 🔗 X पर घोषणा

Google DeepMind × Agile Robots : रोबोटिक्स साझेदारी

24 मार्च — Google DeepMind, humanoid robotics विशेषज्ञ Agile Robots के साथ एक शोध साझेदारी की घोषणा करता है। समझौते में Google DeepMind की Gemini Robotics रणनीति के हिस्से के रूप में Gemini मूलभूत models को Agile Robots के robotic hardware में एकीकृत करना शामिल है।

🔗 X पर घोषणा

Grok Imagine : API पर मल्टी-इमेज वीडियो (#1 Arena Elo 1342)

24 मार्च — xAI अपने Grok Imagine API के लिए दो नई क्षमताएँ घोषित करता है: कई images से video generation (multi-image to video) और मौजूदा video का विस्तार (video extension)।

डेवलपर grok-imagine-video model के माध्यम से एक सुसंगत video बनाने के लिए इनपुट में अधिकतम 7 images भेज सकते हैं। API asynchronous रूप से काम करता है: request भेजी जाती है, फिर done स्थिति आने तक polling की जाती है। outputs 720p में 16:9 ratio का समर्थन करते हैं।

Design Arena के अनुसार, Grok Imagine ने तुरंत Multi Image to Video Arena रैंकिंग में 1342 Elo score के साथ पहला स्थान प्राप्त कर लिया।

🔗 @grok घोषणा 🔗 Imagine API documentation

GitHub Copilot : किसी भी PR को सीधे संशोधित करने के लिए @copilot

24 मार्च — GitHub Copilot अब मांग पर किसी भी pull request को सीधे संशोधित कर सकता है। प्राकृतिक भाषा के निर्देश के साथ किसी टिप्पणी में @copilot का उल्लेख करके — failing tests ठीक करना, review comment का समाधान करना, unit test जोड़ना — एजेंट अपने cloud environment में काम करता है, tests और linters के साथ अपना काम सत्यापित करता है, फिर branch पर बदलाव push करता है। पिछला व्यवहार (नई PR खोलना) अभी भी स्पष्ट रूप से अनुरोध करने पर उपलब्ध है। सभी paid Copilot plans पर उपलब्ध।

🔗 GitHub changelog

GitHub Copilot : JetBrains, Xcode और Eclipse में Gemini 3.1 Pro

23 मार्च — GitHub Copilot JetBrains, Xcode और Eclipse IDEs के लिए Gemini 3.1 Pro की उपलब्धता का विस्तार करता है। Le modèle est désormais accessible via le sélecteur de modèles Copilot dans tous les modes (agent, ask, edit) sur ces environnements, en plus des plateformes déjà prises en charge. En preview publique pour les plans Enterprise, Business, Pro et Pro+.

🔗 Changelog GitHub

GitHub Copilot : API के माध्यम से रिपोज़िटरी-स्तर पर agent एक्सेस प्रबंधन

24 मार्च — GitHub संगठन की रिपोज़िटरी-स्तर पर Copilot coding agent की पहुँच प्रबंधित करने के लिए एक सार्वजनिक preview REST API जारी कर रहा है। प्रशासक प्रोग्रामेटिक रूप से agent को किसी भी, सभी, या कुछ विशिष्ट रिपोज़िटरी पर अनुमत कर सकते हैं — जो enterprise-स्तरीय बड़े पैमाने पर तैनाती के लिए उपयोगी है।

🔗 GitHub Changelog

GitHub Copilot : Raycast में live logs

20 मार्च — Raycast के लिए GitHub Copilot extension (macOS/Windows launcher) अब launcher छोड़े बिना coding agent के logs को live मॉनिटर करने देता है। “View Tasks” कमांड के माध्यम से, फिर session का चयन करके, डेवलपर real-time में agent की प्रगति देखते हैं। सभी paid Copilot subscribers के लिए उपलब्ध।

🔗 GitHub Changelog

इसका क्या मतलब है

Claude Code का auto mode इस अवधि का सबसे महत्वपूर्ण परिवर्तन है। यह उपयोगकर्ता से cognitive load हटाता है — अब हर command को approve करने की आवश्यकता नहीं — जबकि classifier के माध्यम से एक safety net बनाए रखता है। यह अधिक autonomous development agents की दिशा में एक कदम है, लेकिन एक ऐसा framework जिसमें isolated environments के लिए स्पष्ट रूप से अनुशंसा की जाती है। multi-agent harness पर engineering article इस तस्वीर को पूरा करता है: Anthropic की trajectory स्पष्ट रूप से उन agents की ओर है जो लंबे समय तक और स्वायत्त रूप से काम करते हैं, internal supervision structures (dedicated evaluator, sprint contracts) के साथ, न कि हर चरण पर human supervision के साथ।

OpenAI की ओर, ChatGPT में visual shopping सार्वजनिक commercial use cases की ओर एक pivot का संकेत देता है। Agentic Commerce Protocol ChatGPT को merchants और consumers के बीच intermediation layer के रूप में position करता है — यह API pure से अलग रणनीति है, जो सीधे transactional value को target करती है।

Grok Imagine का launch के साथ ही Arena ranking में पहले स्थान पर पहुँचना multi-image to video generation में xAI की iteration की गति को दर्शाता है। दूसरी ओर, GitHub Copilot अपने coding agent की autonomy को लगातार मजबूत कर रहा है: किसी मौजूदा PR को सीधे modify करने की क्षमता agent और developer के बीच आने-जाने को और कम करती है।

Sources

इस दस्तावेज़ का फ्र संस्करण से hi भाषा में gpt-5.4-mini मॉडल का उपयोग करके अनुवाद किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए, https://gitlab.com/jls42/ai-powered-markdown-translator देखें