नीदरलैंड्स में Grok पर प्रतिबंध, Gemini 3.1 Flash Live, Codex के नेटिव plugins

एम्स्टर्डम की अदालत ने xAI को Grok के जरिए बिना सहमति की यौन/नग्न छवियाँ उत्पन्न करने से रोक दिया, जुर्माना €100,000 प्रति दिन होने की शर्त पर। उसी दिन, Google ने Gemini 3.1 Flash Live लॉन्च किया — 90+ भाषाओं में रीयल‑टाइम ऑडियो बातचीत के लिए — OpenAI ने Codex में नेटिव plugins जोड़े (Slack, Figma, Notion, Gmail), और Anthropic ने Claude Code के ऑटो मोड की डिज़ाइन पर तकनीकी ब्लॉग पोस्ट प्रकाशित किया। Cohere, Mistral और Suno ने भी एक भरी हुई घोषणाओं वाली सप्ताह को पूरा किया।

xAI : एम्स्टर्डम की अदालत ने Grok के नग्न/यौन चित्रों पर रोक लगा दी

27 मार्च — एम्स्टर्डम डिस्ट्रिक्ट कोर्ट ने xAI के खिलाफ निर्णय दिया, और नीदरलैंड्स में उसे बिना सहमति वाली यौन/नग्न छवियाँ जनरेट या वितरित करने से रोक दिया। गैर‑पालन करने पर जुर्माना €100 000 प्रतिदिन है, जो अधिकतम €10 मिलियन तक सीमित है।

यह निर्णय नेदरलैंड्स NGO Offlimits और Victims Support Fund की संयुक्त शिकायत के बाद आया। Center for Countering Digital Hate (CCDH) के अनुसार, Grok ने 11 दिनों में 3 मिलियन से अधिक सेक्सुअलाइज़्ड इमेजेज़ जनरेट कीं, जिनमें 23,000 मामलों में नाबालिग शामिल थे। Offlimits ने कहा कि Grok पीड़िता के भौगोलिक स्थान को ध्यान में नहीं रखता, जिससे इसकी प्रभावशीलता वैश्विक बनती है।

यह फैसला उसी दिन आया जब यूरोपीय संसद ने AI जेनरेटेड सेक्सुअल deepfakes पर पाबंदी को मंजूरी दी — एक मजबूत नियामक संकेत। यह xAI के खिलाफ इस तरह का पहला यूरोपीय निर्णय माना जाता है।

🔗 CNBC : नीदरलैंड्स की अदालत ने Grok AI के नुड्स पर रोक लगाई 🔗 The Record Media : नीदरलैंड्स की अदालत ने xAI को जुर्माने की चेतावनी दी

Gemini 3.1 Flash Live : 90+ भाषाओं में रियल‑टाइम ऑडियो

26 मार्च — Google ने Gemini 3.1 Flash Live लॉन्च किया, उसका मल्टीमॉडल मॉडल रीयल‑टाइम बातचीत के लिए। यह ऑडियो, इमेज, वीडियो और टेक्स्ट को सपोर्ट करता है, 128 000 tokens की संदर्भ विंडो के साथ, और 90+ भाषाओं का समर्थन करता है।

पिछली पीढ़ी के मुकाबले, मॉडल बातचीत को पहले से दोगुना लंबा बनाए रखता है, बैकग्राउंड शोर और पर्यावरणीय आवाज़ों को बेहतर संभालता है, जटिल सिस्टम निर्देशों का पालन अधिक सटीकता से करता है, और बातचीत के दौरान बाहरी टूल्स को अधिक विश्वसनीय तरीके से ट्रिगर करता है। सभी जनरेट किए गए ऑडियो पर SynthID लगाया जाता है।

फ़ीचर	विवरण
संदर्भ विंडो	128 000 tokens
भाषाएँ	90+
बातचीत	पहले से 2× लंबी
वॉटरमार्किंग	सभी ऑडियोज़ पर SynthID

उपलब्धता : Live API के माध्यम से Google AI Studio (डेवेलपर्स), Gemini Live और Search Live के जरिए (यूज़र्स, 200+ देश), और Vertex AI (एंटरप्राइज़)। Search Live भी 200+ देशों और क्षेत्रों में पहुंच बढ़ा रहा है, Google Lens का वीडियो सपोर्ट के साथ।

🔗 Google की आधिकारिक घोषणा

Gemini : ChatGPT और Claude से मेमोरी और इतिहास इम्पोर्ट करना

26 मार्च — Google ने Gemini ऐप में एक इम्पोर्ट टूल लॉन्च किया ताकि अन्य AI असिस्टेंट्स से माइग्रेशन आसान हो सके।

दो फ़ीचर उपलब्ध हैं :

मेमोरी इम्पोर्ट (“Add Memory”) : Gemini ChatGPT, Claude या Copilot में टाइप करने के लिए एक प्रॉम्प्ट सुझाता है। उत्पन्न उत्तर (दूसरे असिस्टेंट द्वारा स्टोर की गई व्यक्तिगत जानकारी का सार) को कॉपी‑पेस्ट कर Gemini में डालने पर, वह पसंद, रुचियाँ, लोकेशन जानकारी आदि निकाल लेता है।
हैस्ट्रोरी इम्पोर्ट (“Import Chats”) : ChatGPT या Claude से एक्सपोर्ट किए गए .zip फाइल को अपलोड करना, अधिकतम 5 GB तक। पुरानी बातचीत खोजने योग्य बन जाती है और Gemini में फिर से जारी रखी जा सकती है।

🔗 ब्लॉग Google : Switch to Gemini

Gemini CLI v0.35.2 : डिफ़ॉल्ट सबएजेंट्स, बेहतर Vim मोड — और Pro पहुँच सीमित

25-26 मार्च — Gemini CLI का स्टेबल v0.35.2 कई महत्वपूर्ण फ़ीचर लेकर आता है।

फ़ीचर	विवरण
Subagents डिफ़ॉल्ट सक्रिय	समानांतर टास्क शेड्यूलर + कोड स्लीसिंग
कस्टम कीबाइंडिंग	keybindings समर्थन, literal chars, Kitty प्रोटोकॉल
बेहतर Vim मोड	Motions X, ~, r, f/F/t/T ; unnamed रजिस्टर के साथ कॉपी‑पेस्ट
एकीकृत SandboxManager	bubblewrap/seccomp Linux के साथ टूल्स का आइसोलेशन
JIT संदर्भ खोज	फाइलसिस्टम टूल्स के लिए अनुकूलित लोडिंग
gRPC नेटिव	नेटिव एकीकरण और प्रोटोकॉल रूटिंग

नीतिगत बदलाव (महत्वपूर्ण) : 25 मार्च से फ्री यूज़र्स अब केवल Gemini Flash तक ही पहुँच पाएँगे। Gemini Pro एक्सेस केवल पेड सब्सक्राइबर्स (Pro और Ultra प्लान) के लिए उपलब्ध है। समुदाय की प्रतिक्रिया भारी रूप से नकारात्मक रही। Google ने दुरुपयोग की पहचान भी सख्त की है: Gemini CLI के OAuth प्रमाणिकरण का थर्ड‑पार्टी सॉफ़्टवेयर के साथ उपयोग अब प्रतिबंधों का कारण बन सकता है।

🔗 Gemini CLI चेंजलॉग 🔗 समुदाय चर्चा

Gemini Drop मार्च 2026 : Personal Intelligence मुफ्त और Lyria 3 Pro

27 मार्च — मार्च 2026 का मासिक “Gemini Drops” अपडेट उस महीने Gemini ऐप में तैनात की गई नई विशेषताएँ प्रस्तुत करता है।

फ़ीचर	विवरण	उपलब्धता
Personal Intelligence मुफ्त	Gmail, Photos, YouTube कनेक्शन के साथ यात्राओं/प्रोजेक्ट्स की योजना बनाना	मुफ्त, यूएस
Gemini Live बेहतर	Gemini 3.1 Flash Live आधारित, संदर्भ 2× लंबा	सभी यूज़र्स
ChatGPT/Claude इम्पोर्ट	मेमोरी और हिस्ट्री ट्रांसफर	सभी यूज़र्स
Lyria 3 Pro	3 मिनट तक संगीत निर्माण, फोटो → थीम्स/ऐंथेम	सब्सक्राइबर्स
Google TV	विज़ुअल Gemini उत्तर और नैरेशन्स	Google TV

🔗 Gemini Drop मार्च 2026

Codex : Slack, Figma, Notion और Gmail के लिए नेटिव plugins

26-27 मार्च — OpenAI ने Codex में plugins को एक प्राथमिक फ़ीचर के रूप में तैनात किया। डेवलपर्स बिना मैनुअल कॉन्फ़िगरेशन के अपने रोज़मर्रा के टूल्स से Codex को जोड़ सकते हैं।

Plugin	उपयोग का मामला
Slack	संदेश भेजना, चैनल पढ़ना
Figma	डिज़ाइन्स तक पहुँच, कोड जनरेट करना
Notion	पेज पढ़ना और लिखना
Gmail	ई‑मेल पढ़ना और लिखना

plugins Codex के शुरुआती पर ही सिंक होते हैं और /plugins कमांड के माध्यम से पहुंच योग्य हैं। इंस्टॉलेशन और अनइंस्टॉलेशन सीधे TUI इंटरफ़ेस से होता है, जिसमें ऑथेंटिकेशन का प्रबंधन भी शामिल है।

27 मार्च को, OpenAI ने एक प्रैक्टिकल केस‑गैलरी जारी की जो एक‑क्लिक में उपलब्ध है: iOS ऐप्स बनाना, datasets का विश्लेषण, रिपोर्ट और प्रेजेंटेशन जेनरेट करना। Codex v0.117.0 के चेंजलॉग में तकनीकी फ़ीचर्स का विवरण है, जिनमें prompts में plugins के उल्लेख का सपोर्ट भी शामिल है।

🔗 Codex plugins दस्तावेज़ 🔗 ट्वीट @OpenAIDevs

Anthropic : Claude Code के ऑटो मोड की डिजाइन समझाई गई

26 mars — Anthropic ने अपने ब्लॉग पर Claude Code के ऑटो (auto mode) मोड की डिज़ाइन पर एक तकनीकी पोस्ट प्रकाशित की है, जो Engineering ब्लॉग पर उपलब्ध है।

समस्या जिसे संबोधित किया गया : Claude Code के उपयोगकर्ताओं को अनुमोदन थकान (approval fatigue) का सामना करना पड़ता है। आँकड़े दिखाते हैं कि अनुमतियों के अनुरोधों में से 93% स्वीकार कर दिए जाते हैं — जो संकेत देता है कि सुरक्षा खतरों के बिना आंशिक स्वचालन संभव है।

समाधान : दो परतों वाले क्लासिफ़ायर

ऑटो मोड Sonnet 4.6 मॉडल पर आधारित दो स्तर की सुरक्षा पर टिका है :

इनपुट परत : एक prompt injection probe टूल के परिणामों का विश्लेषण करता है इससे पहले कि वे एजेंट तक पहुँचें।
आउटपुट परत : एक ट्रांस्क्रिप्शन क्लासिफ़ायर हर प्रस्तावित क्रिया का दो‑चरणीय प्रक्रिया में मूल्यांकन करता है execution से पहले।

स्तर	क्रिया का प्रकार	प्रोसेसिंग
Tier 1	सुरक्षित टूल्स (फ़ाइल पढ़ना, खोज)	सीधे पास, बिना क्लासिफ़ायर
Tier 2	प्रोजेक्ट में फ़ाइल संशोधन	क्लासिफ़ायर को बाईपास (वर्जन कंट्रोल के जरिए रिव्यू किए जा सकते हैं)
Tier 3	खतरनाक क्रियाएँ (shell कमांड, बाहरी ऑपरेशन)	क्लासिफ़ायर द्वारा पूरा मूल्यांकन

प्रदर्शन मेट्रिक्स :

चरण	फॉल्स पॉज़िटिव रेट (रीयल ट्रैफिक)	फॉल्स नेगेटिव रेट (रिस्की एक्शन्स)
चरण 1 (तेज़)	8.5 %	6.6 %
पूरा पाइपलाइन	0.4 %	17 %

पूरा पाइपलाइन पर 0.4% का फॉल्स पॉज़िटिव रेट बताता है कि ऑटो मोड लगभग कभी भी बेवजह काम रोकता नहीं है। 17% का फॉल्स नेगेटिव रेट उन मामलों को दर्शाता है जहाँ क्लासिफ़ायर खतरे का पता तो लगाता है लेकिन उपयोगकर्ता द्वारा दिये गए अनुमति‑सीमाओं की सही व्याख्या नहीं कर पाता।

“New on the Engineering Blog: How we designed Claude Code auto mode. Many Claude Code users let Claude work without permission prompts. Auto mode is a safer middle ground: we built and tested classifiers that make approval decisions instead.”

🇮🇳 Engineering ब्लॉग पर: हमने Claude Code के ऑटो मोड को कैसे डिज़ाइन किया। कई उपयोगकर्ता Claude को बिना अनुमति माँगे काम करने देते हैं। ऑटो मोड एक सुरक्षित समझौता है: हमने ऐसे क्लासिफ़ायर बनाए और परीक्षण किए जो अनुमोदन के निर्णय उनकी जगह ले लेते हैं। — @AnthropicAI पर X

🔗 Claude Code auto mode: a safer way to skip permissions

GitHub Copilot : merge conflicts का समाधान और एजेंटों की दृश्यता

26 मार्च — GitHub Copilot में दो बड़े अपडेट्स टीम वर्कफ़्लो को बेहतर बनाते हैं।

Merge conflicts का समाधान : अब पुल रिक्वेस्ट के कमेंट में @copilot का उल्लेख करके उसे conflicts सुलझाने के लिए कहा जा सकता है। एजेंट क्लाउड एन्वायरनमेंट में काम करता है, conflicts हल करता है, बिल्ड और टेस्ट पास होने की जाँच करता है, और फिर बदलाव पुश कर देता है। यह सभी Copilot पेड प्लान्स में उपलब्ध है (Business/Enterprise में admin activation की आवश्यकता हो सकती है)।

Issues और Projects में एजेंट दृश्यता : जब किसी issue पर कोड एजेंट (Copilot, Claude, Codex) असाइन किया जाता है, उसकी सेशन अस्साइनी के नीचे साइडबार में रीयल‑टाइम स्टेटस के साथ दिखती है — कतार में, चालू, समीक्षा प्रतीक्षा, पूरा। सेशन Projects की table और board views में भी दिखाई देती हैं (View menu > Show agent sessions से सक्रिय करें)।

🔗 Copilot merge conflicts सुलझाता है 🔗 Issues और Projects में एजेंट एक्टिविटी

GitHub : नया PRs डैशबोर्ड और Copilot for Jira

25-26 मार्च — डेवलपर्स के लिए दो और सुधार।

Pull Requests डैशबोर्ड (public preview) : github.com/pulls पर नया री‑इमेज्ड डैशबोर्ड उन PRs को केंद्रीकृत करता जिन्हें ध्यान चाहिए — review requested, सुधारों की आवश्यकता, merge के लिए तैयार। कस्टम सहेजी गई views,ADVANCED फिल्टर के साथ ऑटोकम्प्लीट और AND/OR क्वेरी सपोर्ट इंटरफ़ेस को पूरा करते हैं। Feature Preview सेटिंग्स से सक्रिय किया जा सकता है।

Copilot for Jira : public preview से, कई सुधार आये हैं : Jira से सीधे IA मॉडल का चयन, PR शीर्षक और ब्रांच नाम में Jira टिकट नंबर का ऑटो‑इंसर्शन, और MCP सर्वर के जरिए Confluence पेजेज़ तक पहुँच (PAT के साथ कॉन्फिगर करने योग्य)।

🔗 नया PRs डैशबोर्ड 🔗 Copilot for Jira सुधार

Cohere Transcribe : open‑source ASR रैंकिंग में नंबर 1

26 मार्च — Cohere ने Cohere Transcribe लॉन्च किया, अपना पहला Automatic Speech Recognition (ASR) मॉडल। यह Apache 2.0 लाइसेंस के तहत open‑source है और अंग्रेज़ी के लिए Hugging Face के Open ASR रैंकिंग में सीधे शीर्ष स्थान पर आ गया।

मॉडल एक Fast‑Conformer Transformer encoder‑decoder आर्किटेक्चर पर आधारित है और इसमें 2 अरब पैरामीटर हैं। 90% से अधिक पैरामीटर एन्कोडर को दिए गए हैं, जबकि डिकोडर हल्का रखा गया है ताकि ऑटोरेग्रेसिव कंप्यूटेशन कम और स्पीड अधिक हो। इसे 500,000 घंटे के ऑडियो‑ट्रांसक्रिप्शन पेयर पर ट्रेन किया गया है।

मॉडल	औसत WER
Cohere Transcribe	5.42
Zoom Scribe v1	5.47
IBM Granite 4.0 1B	5.52
NVIDIA Canary Qwen 2.5B	5.63
OpenAI Whisper Large v3	7.44

WER (Word Error Rate) 5.42% Cohere Transcribe को शीर्ष पर रखता है। इनफ़रेंस स्पीड समान आकार के प्रतिद्वंद्वियों की तुलना में 3× तेज़ है। 14 भाषाएँ सपोर्टेड हैं (जिसमें फ़्रेंच, जर्मन, अरबी, मैंडारिन, जापानी और कोरियाई शामिल हैं)।

सीमाएँ : मॉडल को code‑switching (एक ऑडियो में भाषाओं का मिश्रण) के लिए डिज़ाइन नहीं किया गया है और यह नॉन‑वोकल साउंड्स को ट्रांसक्राइब कर सकता है — VAD (Voice Activity Detection) फ़िल्टर जोड़ने की सिफारिश है।

🔗 Cohere ब्लॉग : Transcribe 🔗 Hugging Face मॉडल

Suno v5.5 : निजी आवाज़, कस्टम मॉडल, अनुकूलन योग्य पसंदें

26 मार्च — Suno ने अपने म्यूज़िक जनरेशन टूल का वर्जन 5.5 लॉन्च किया, जिसमें पर्सनलाइज़ेशन पर केंद्रित तीन नई क्षमताएँ शामिल हैं।

फ़ीचर	विवरण	उपलब्धता
Voices	अपनी गाई हुई आवाज़ को कैप्चर और उपयोग करना (प्राइवेसी बनी रहती है)	सभी यूज़र्स
Custom Models	अपनी मूल रचनाओं से फाइन‑ट्यूनिंग, तक 3 मॉडल	Pro/Premier सब्सक्राइबर्स
My Taste	शैलियों और मूड में अनुकूलन सीखना	सभी यूज़र्स

यह टूल्स अगले जनरेशन के मॉडलों की नींव के रूप में इंडस्ट्री के साथ साझेदारी में विकसित किए जा रहे हैं।

🔗 Suno ब्लॉग v5.5

Mistral Voxtral TTS : 3 सेकंड में वॉयस क्लोन, open‑weight

23 मार्च (प्रेस कवरेज 26-27 मार्च) — Mistral ने Voxtral TTS जारी किया, उसका पहला open‑weight टेक्स्ट‑टू‑स्पीच मॉडल। मॉडल voxtral-tts-2603 में 4 अरब पैरामीटर हैं और यह 9 भाषाएँ सपोर्ट करता है (अंग्रेज़ी, फ़्रेंच, जर्मन, स्पेनिश, डच, पुर्तगाली, इटालियन, हिन्दी, अरबी)।

आधिकारिक लेटेंसी 70 ms बताई गई है एक टाइपिकल सेटअप के लिए (10 सेकंड सैंपल + 500 कैरेक्टर्स)। वॉयस क्लोनिंग केवल 3 सेकंड के रेफ़रेंस ऑडियो से काम करती है। नेचुरलनेस के मामले में Mistral का कहना है कि Voxtral ElevenLabs Flash v2.5 से बेहतर है और ElevenLabs v3 के साथ समानता पर पहुँचता है। मॉडल एक सामान्य लैपटॉप, मिड‑रेंज GPU या हाई‑एंड मोबाइल डिवाइस पर चल सकता है। पहुँच : Hugging Face पर उपलब्ध मॉडल वज़न (Creative Commons लाइसेंस) और Mistral Studio API के माध्यम से 0.016 डॉलर प्रति 1,000 अक्षर पर। Le Chat में voice mode एकीकरण उपलब्ध है।

🔗 Mistral Voxtral की घोषणा

xAI : SuperGrok Lite 10 डॉलर/महीना और 15 सेकंड की वीडियो स्टोरीज़

25 मार्च — xAI ने Grok के चारों ओर दो नई घोषणाएँ कीं।

SuperGrok Lite : 10 डॉलर प्रति महीना का नया सदस्यता प्लान, जो वर्तमान में सीमित परीक्षण में है। इसमें मुफ्त स्तर की तुलना में दोगुनी लंबी चैट सेशन, एक AI एजेंट, और 480p रिज़ॉल्यूशन में वीडियो जनरेशन (अधिकतम 6 सेकंड) शामिल है। यह प्लान मुफ्त स्तर और SuperGrok Standard (30 डॉलर प्रति महीना) के बीच स्थित है।

Grok Imagine के माध्यम से वीडियो स्टोरीज़ : Grok Imagine अब 15 सेकंड, 720p की “वीडियो स्टोरीज़” बनाता है, जिनमें सिंक्रनाइज़्ड ऑडियो, बैकग्राउंड म्यूज़िक और साउंड इफेक्ट्स होते हैं। Elon Musk ने वीडियो पर “दोगुना दांव लगाने” की बात कही। यह घोषणा उसी सप्ताह आई है जब OpenAI ने Sora को बंद कर दिया था।

🔗 Bloomberg : xAI AI वीडियो पर जोर दे रहा है

Kimi/Moonshot AI हांगकांग में आईपीओ पर विचार कर रहा है

26 मार्च — Bloomberg के अनुसार, Kimi के पीछे वाली चीनी कंपनी Moonshot AI हांगकांग स्टॉक एक्सचेंज में IPO करने पर विचार कर रही है। सलाहकार बैंक में CICC और Goldman Sachs बताए जा रहे हैं, लक्ष्यित वैल्यूएशन लगभग 18 अरब डॉलर और वर्तमान फंडिंग 1 अरब डॉलर तक चल रही है। मौजूदा शेयरधारकों में Alibaba, Tencent और 5Y Capital शामिल हैं। IPO का समय अभी अनिश्चित है।

🔗 Bloomberg : Moonshot considers Hong Kong IPO

NVIDIA GTC : स्वामित्व और ओपन AI विरोधी नहीं हैं

25 मार्च — GTC 2026 के दौरान NVIDIA और उद्योग के नेताओं (Mistral, Perplexity, Cursor, Reflection AI, LangChain) ने कहा कि AI का भविष्य खुले और स्वामित्व वाले मॉडल्स की पूरकता में है। Jensen Huang ने NVIDIA की स्थिति का सार दिया: “Proprietary versus open is not a thing. It’s proprietary and open.”

ब्लॉग पोस्ट ने कंपनियों के लिए मल्टी-मॉडल, मल्टी-क्लाउड और मल्टीमॉडल ऑर्केस्ट्रेशन की जरूरत को रेखांकित किया। NVIDIA ने Hugging Face पर सबसे बड़ी ऑर्गनाइजेशन बनकर अपने ओपन सोर्स संकल्प की पुष्टि की।

🔗 Blog NVIDIA : AI Open and Proprietary

Claude Code v2.1.85 et v2.1.84 : कंडीशनल hooks और PowerShell Windows पर

26-27 मार्च — Claude Code के दो नए वर्शन जारी किए गए।

v2.1.85 (27 मार्च) : कॉन्फ़िगरेशन में hooks के लिए एक कंडीशनल फ़ील्ड if पेश किया गया, जो केवल कुछ कमांड्स या फ़ाइलों पर hook ट्रिगर करने की अनुमति देता है। साथ ही: MCP सहायक स्क्रिप्ट्स के लिए पर्यावरण चर, शेड्यूल किए गए कार्यों के लिए ट्रांसक्रिप्शन्स में टाइमस्टैम्प, RFC 9728 अनुरूप OAuth समर्थन, और PreToolUse hooks के लिए AskUserQuestion को पूरा करने हेतु updatedInput लौटाने की क्षमता।

v2.1.84 (~26 मार्च) : Windows पर PowerShell एक नेटिव टूल के रूप में प्रीव्यू (ऑप्ट-इन पूर्वावलोकन) में उपलब्ध, hook TaskCreated (Claude द्वारा टास्क बनते समय ट्रिगर) पेश किया गया, WorktreeCreate के लिए HTTP समर्थन, और 75 मिनट की निष्क्रियता के बाद रिटर्न प्रॉम्प्ट दिखाने का व्यवहार। macOS/Linux पर आधिकारिक प्लगइन्स स्क्रिप्ट्स की अनुमति से संबंधित बग ठीक किया गया।

🔗 Tweet @lydiahallie — v2.1.85

Z.ai GLM-5.1 सभी Coding Plan सब्सक्राइबर्स के लिए उपलब्ध

27 मार्च — Z.ai (Zhipu) ने घोषणा की कि GLM-5.1 अब GLM Coding Plan के सभी सब्सक्राइबर्स के लिए उपलब्ध है, चाहे उनका सदस्यता स्तर Lite, Pro या Max कोई भी हो।

🔗 PANews : GLM-5.1 Coding Plan

Genspark ने अपने वीडियो एजेंट में Grok Imagine को जोड़ा

26 मार्च — Genspark ने Grok Imagine (मल्टी-इमेज वीडियो जनरेशन और वीडियो एक्सटेंशन) को अपने Genspark AI Video Agent में जोड़ा। उपयोगकर्ता अधिकतम 7 इमेज तक उपयोग करके एक वीडियो बना सकते हैं, या मौजूदा वीडियो को 10 सेकंड तक बढ़ा सकते हैं।

🔗 Tweet @genspark_ai

Meta SAM 3.1 : रीयल‑टाइम में 16 ऑब्जेक्ट ट्रैकिंग, स्पीड दोगुनी

27 मार्च — Meta ने SAM 3.1 जारी किया, Segment Anything Model 3 का अपडेट जो वीडियो में वस्तुओं का रीयल‑टाइम डिटेक्शन और ट्रैकिंग करता है। मुख्य नवाचार है वस्तु मल्टिप्लेक्सिंग (object multiplexing): हर वस्तु के लिए अलग‑अलग पास करने के बजाय सभी वस्तुओं को एक ही फॉरवर्ड पास में प्रोसेस किया जाता है। नतीजा: एक साथ तक 16 वस्तुएँ, और H100 GPU पर फ्रेम रेट 16 से बढ़कर 32 इमेज प्रति सेकंड हो गया — यानी गति दोगुनी — जबकि मेमोरी उपयोग भी काफी घट गया।

आर्किटेक्चर एक Mux-Demux एन्कोडर/डिकोडर पर आधारित है जो सभी वस्तुओं के लिए एक ही कंप्यूटेशन साझा करता है। एक वैश्विक तर्क (global reasoning) तंत्र उन दृश्यों में सटीकता सुधारता है जहाँ कई तत्व हों। SAM 3.1 सीधे SAM 3 का प्रतिस्थापन (drop-in replacement) है — API में कोई बदलाव आवश्यक नहीं है।

मॉडल ओपन सोर्स प्रकाशित किया गया है: checkpoint Hugging Face पर उपलब्ध, सोर्स कोड GitHub पर अपडेट, रिसर्च पेपर प्रकाशित और एक इंटरएक्टिव डेमो उपलब्ध है।

🔗 Blog Meta : SAM 3.1 🔗 Code GitHub 🔗 Tweet @AIatMeta

Meta TRIBE v2 : मानवीय मस्तिष्क गतिविधि का डिजिटल ट्विन

26 मार्च — Meta ने TRIBE v2 जारी किया, एक प्रेडिक्टिव फाउंडेशन मॉडल जिसे मानव न्यूरोनल गतिविधि का “डिजिटल ट्विन” कहा गया है। यह मॉडल लगभग किसी भी साउंड, इमेज या टेक्स्ट के लिए उच्च-रिज़ॉल्यूशन fMRI प्रतिक्रियाएँ भविष्यवाणी करता है, जो पिछली विधियों की तुलना में 70× अधिक रिज़ॉल्यूशन देता है। 700 से अधिक स्वयंसेवकों के डेटा पर प्रशिक्षित, यह नए सब्जेक्ट्स, भाषाओं और कार्यों पर बिना पुनःप्रशिक्षण के zero-shot मोड में काम करता है। उद्देश्य वैज्ञानिकों को बिना मानव प्रयोगों के तेज़ी से हाइपोथेसिस टेस्ट करने देना और न्यूरोलॉजिकल विकारों पर शोध को तेज़ करना है। मॉडल, कोड और वैज्ञानिक लेख CC BY-NC लाइसेंस के साथ जारी किए गए हैं।

🔗 Blog Meta : TRIBE v2 🔗 Tweet @AIatMeta

इसका क्या मतलब है

एम्स्टर्डम की अदालत का निर्णय एक नियामक मोड़ को दर्शाता है: यह पहली बार है जब किसी यूरोपीय अधिकार क्षेत्र ने Grok द्वारा उत्पन्न सामग्री के लिए सीधे xAI को दंडित किया है, और जुर्माने का प्रावधान निवारक है। इसी दिन यूरोपीय संसद द्वारा सेक्सुअल deepfakes पर वोट को मिलाकर, यह एक वैधानिक ढाँचा रेखांकित करता है जो धीरे-धीरे सभी जेनरेटिव AI प्रदाताओं पर लागू होगा।

डेवेलपर टूल्स की दिशा में, यह सप्ताह एकीकरण की दौड़ को दर्शाता है: Codex अपने नेटिव plugins के साथ, Copilot में merge conflicts का समाधान और Issues/Projects में एजेंट्स की दृश्यता, और Claude Code में कंडीशनल hooks। AI असिस्टेंट मौजूदा वर्कफ़्लो में इन्हें प्रतिस्थापित करने के बजाय गहराई से एकीकृत होते जा रहे हैं।

CLI मुफ्त में Gemini Pro की पहुँच पर रोक एक संकेत है कि CLI टूल्स में मुफ्त उदारता की अवधि कम हो रही है। Gemini, GitHub Copilot की तरह, एक freemium मॉडल की ओर बढ़ रहा है जहाँ उन्नत क्षमताओं के लिए सब्सक्रिप्शन चाहिए होगा।

अंततः, Kimi के हांगकांग IPO के 18 अरब डॉलर के संभावित लक्ष्य से चीनी AI क्षेत्र की वैल्यूएशन की आकर्षणशीलता की पुष्टि होती है, जबकि Mistral Voxtral TTS के साथ अपने open-weight मॉडल्स को वोकल संश्लेषण में मालिकाना सेवाओं के विकल्प के रूप में स्थापित करने की कोशिश जारी रखता है।

स्रोत

इस दस्तावेज़ का अनुवाद fr संस्करण से hi भाषा में gpt-5-mini मॉडल का उपयोग करके किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए, देखें https://gitlab.com/jls42/ai-powered-markdown-translator