एम्स्टर्डम की अदालत ने xAI को Grok के जरिए बिना सहमति की यौन/नग्न छवियाँ उत्पन्न करने से रोक दिया, जुर्माना €100,000 प्रति दिन होने की शर्त पर। उसी दिन, Google ने Gemini 3.1 Flash Live लॉन्च किया — 90+ भाषाओं में रीयल‑टाइम ऑडियो बातचीत के लिए — OpenAI ने Codex में नेटिव plugins जोड़े (Slack, Figma, Notion, Gmail), और Anthropic ने Claude Code के ऑटो मोड की डिज़ाइन पर तकनीकी ब्लॉग पोस्ट प्रकाशित किया। Cohere, Mistral और Suno ने भी एक भरी हुई घोषणाओं वाली सप्ताह को पूरा किया।
xAI : एम्स्टर्डम की अदालत ने Grok के नग्न/यौन चित्रों पर रोक लगा दी
27 मार्च — एम्स्टर्डम डिस्ट्रिक्ट कोर्ट ने xAI के खिलाफ निर्णय दिया, और नीदरलैंड्स में उसे बिना सहमति वाली यौन/नग्न छवियाँ जनरेट या वितरित करने से रोक दिया। गैर‑पालन करने पर जुर्माना €100 000 प्रतिदिन है, जो अधिकतम €10 मिलियन तक सीमित है।
यह निर्णय नेदरलैंड्स NGO Offlimits और Victims Support Fund की संयुक्त शिकायत के बाद आया। Center for Countering Digital Hate (CCDH) के अनुसार, Grok ने 11 दिनों में 3 मिलियन से अधिक सेक्सुअलाइज़्ड इमेजेज़ जनरेट कीं, जिनमें 23,000 मामलों में नाबालिग शामिल थे। Offlimits ने कहा कि Grok पीड़िता के भौगोलिक स्थान को ध्यान में नहीं रखता, जिससे इसकी प्रभावशीलता वैश्विक बनती है।
यह फैसला उसी दिन आया जब यूरोपीय संसद ने AI जेनरेटेड सेक्सुअल deepfakes पर पाबंदी को मंजूरी दी — एक मजबूत नियामक संकेत। यह xAI के खिलाफ इस तरह का पहला यूरोपीय निर्णय माना जाता है।
🔗 CNBC : नीदरलैंड्स की अदालत ने Grok AI के नुड्स पर रोक लगाई 🔗 The Record Media : नीदरलैंड्स की अदालत ने xAI को जुर्माने की चेतावनी दी
Gemini 3.1 Flash Live : 90+ भाषाओं में रियल‑टाइम ऑडियो
26 मार्च — Google ने Gemini 3.1 Flash Live लॉन्च किया, उसका मल्टीमॉडल मॉडल रीयल‑टाइम बातचीत के लिए। यह ऑडियो, इमेज, वीडियो और टेक्स्ट को सपोर्ट करता है, 128 000 tokens की संदर्भ विंडो के साथ, और 90+ भाषाओं का समर्थन करता है।
पिछली पीढ़ी के मुकाबले, मॉडल बातचीत को पहले से दोगुना लंबा बनाए रखता है, बैकग्राउंड शोर और पर्यावरणीय आवाज़ों को बेहतर संभालता है, जटिल सिस्टम निर्देशों का पालन अधिक सटीकता से करता है, और बातचीत के दौरान बाहरी टूल्स को अधिक विश्वसनीय तरीके से ट्रिगर करता है। सभी जनरेट किए गए ऑडियो पर SynthID लगाया जाता है।
| फ़ीचर | विवरण |
|---|---|
| संदर्भ विंडो | 128 000 tokens |
| भाषाएँ | 90+ |
| बातचीत | पहले से 2× लंबी |
| वॉटरमार्किंग | सभी ऑडियोज़ पर SynthID |
उपलब्धता : Live API के माध्यम से Google AI Studio (डेवेलपर्स), Gemini Live और Search Live के जरिए (यूज़र्स, 200+ देश), और Vertex AI (एंटरप्राइज़)। Search Live भी 200+ देशों और क्षेत्रों में पहुंच बढ़ा रहा है, Google Lens का वीडियो सपोर्ट के साथ।
Gemini : ChatGPT और Claude से मेमोरी और इतिहास इम्पोर्ट करना
26 मार्च — Google ने Gemini ऐप में एक इम्पोर्ट टूल लॉन्च किया ताकि अन्य AI असिस्टेंट्स से माइग्रेशन आसान हो सके।
दो फ़ीचर उपलब्ध हैं :
- मेमोरी इम्पोर्ट (“Add Memory”) : Gemini ChatGPT, Claude या Copilot में टाइप करने के लिए एक प्रॉम्प्ट सुझाता है। उत्पन्न उत्तर (दूसरे असिस्टेंट द्वारा स्टोर की गई व्यक्तिगत जानकारी का सार) को कॉपी‑पेस्ट कर Gemini में डालने पर, वह पसंद, रुचियाँ, लोकेशन जानकारी आदि निकाल लेता है।
- हैस्ट्रोरी इम्पोर्ट (“Import Chats”) : ChatGPT या Claude से एक्सपोर्ट किए गए
.zipफाइल को अपलोड करना, अधिकतम 5 GB तक। पुरानी बातचीत खोजने योग्य बन जाती है और Gemini में फिर से जारी रखी जा सकती है।
🔗 ब्लॉग Google : Switch to Gemini
Gemini CLI v0.35.2 : डिफ़ॉल्ट सबएजेंट्स, बेहतर Vim मोड — और Pro पहुँच सीमित
25-26 मार्च — Gemini CLI का स्टेबल v0.35.2 कई महत्वपूर्ण फ़ीचर लेकर आता है।
| फ़ीचर | विवरण |
|---|---|
| Subagents डिफ़ॉल्ट सक्रिय | समानांतर टास्क शेड्यूलर + कोड स्लीसिंग |
| कस्टम कीबाइंडिंग | keybindings समर्थन, literal chars, Kitty प्रोटोकॉल |
| बेहतर Vim मोड | Motions X, ~, r, f/F/t/T ; unnamed रजिस्टर के साथ कॉपी‑पेस्ट |
| एकीकृत SandboxManager | bubblewrap/seccomp Linux के साथ टूल्स का आइसोलेशन |
| JIT संदर्भ खोज | फाइलसिस्टम टूल्स के लिए अनुकूलित लोडिंग |
| gRPC नेटिव | नेटिव एकीकरण और प्रोटोकॉल रूटिंग |
नीतिगत बदलाव (महत्वपूर्ण) : 25 मार्च से फ्री यूज़र्स अब केवल Gemini Flash तक ही पहुँच पाएँगे। Gemini Pro एक्सेस केवल पेड सब्सक्राइबर्स (Pro और Ultra प्लान) के लिए उपलब्ध है। समुदाय की प्रतिक्रिया भारी रूप से नकारात्मक रही। Google ने दुरुपयोग की पहचान भी सख्त की है: Gemini CLI के OAuth प्रमाणिकरण का थर्ड‑पार्टी सॉफ़्टवेयर के साथ उपयोग अब प्रतिबंधों का कारण बन सकता है।
🔗 Gemini CLI चेंजलॉग 🔗 समुदाय चर्चा
Gemini Drop मार्च 2026 : Personal Intelligence मुफ्त और Lyria 3 Pro
27 मार्च — मार्च 2026 का मासिक “Gemini Drops” अपडेट उस महीने Gemini ऐप में तैनात की गई नई विशेषताएँ प्रस्तुत करता है।
| फ़ीचर | विवरण | उपलब्धता |
|---|---|---|
| Personal Intelligence मुफ्त | Gmail, Photos, YouTube कनेक्शन के साथ यात्राओं/प्रोजेक्ट्स की योजना बनाना | मुफ्त, यूएस |
| Gemini Live बेहतर | Gemini 3.1 Flash Live आधारित, संदर्भ 2× लंबा | सभी यूज़र्स |
| ChatGPT/Claude इम्पोर्ट | मेमोरी और हिस्ट्री ट्रांसफर | सभी यूज़र्स |
| Lyria 3 Pro | 3 मिनट तक संगीत निर्माण, फोटो → थीम्स/ऐंथेम | सब्सक्राइबर्स |
| Google TV | विज़ुअल Gemini उत्तर और नैरेशन्स | Google TV |
Codex : Slack, Figma, Notion और Gmail के लिए नेटिव plugins
26-27 मार्च — OpenAI ने Codex में plugins को एक प्राथमिक फ़ीचर के रूप में तैनात किया। डेवलपर्स बिना मैनुअल कॉन्फ़िगरेशन के अपने रोज़मर्रा के टूल्स से Codex को जोड़ सकते हैं।
| Plugin | उपयोग का मामला |
|---|---|
| Slack | संदेश भेजना, चैनल पढ़ना |
| Figma | डिज़ाइन्स तक पहुँच, कोड जनरेट करना |
| Notion | पेज पढ़ना और लिखना |
| Gmail | ई‑मेल पढ़ना और लिखना |
plugins Codex के शुरुआती पर ही सिंक होते हैं और /plugins कमांड के माध्यम से पहुंच योग्य हैं। इंस्टॉलेशन और अनइंस्टॉलेशन सीधे TUI इंटरफ़ेस से होता है, जिसमें ऑथेंटिकेशन का प्रबंधन भी शामिल है।
27 मार्च को, OpenAI ने एक प्रैक्टिकल केस‑गैलरी जारी की जो एक‑क्लिक में उपलब्ध है: iOS ऐप्स बनाना, datasets का विश्लेषण, रिपोर्ट और प्रेजेंटेशन जेनरेट करना। Codex v0.117.0 के चेंजलॉग में तकनीकी फ़ीचर्स का विवरण है, जिनमें prompts में plugins के उल्लेख का सपोर्ट भी शामिल है।
🔗 Codex plugins दस्तावेज़ 🔗 ट्वीट @OpenAIDevs
Anthropic : Claude Code के ऑटो मोड की डिजाइन समझाई गई
26 mars — Anthropic ने अपने ब्लॉग पर Claude Code के ऑटो (auto mode) मोड की डिज़ाइन पर एक तकनीकी पोस्ट प्रकाशित की है, जो Engineering ब्लॉग पर उपलब्ध है।
समस्या जिसे संबोधित किया गया : Claude Code के उपयोगकर्ताओं को अनुमोदन थकान (approval fatigue) का सामना करना पड़ता है। आँकड़े दिखाते हैं कि अनुमतियों के अनुरोधों में से 93% स्वीकार कर दिए जाते हैं — जो संकेत देता है कि सुरक्षा खतरों के बिना आंशिक स्वचालन संभव है।
समाधान : दो परतों वाले क्लासिफ़ायर
ऑटो मोड Sonnet 4.6 मॉडल पर आधारित दो स्तर की सुरक्षा पर टिका है :
- इनपुट परत : एक prompt injection probe टूल के परिणामों का विश्लेषण करता है इससे पहले कि वे एजेंट तक पहुँचें।
- आउटपुट परत : एक ट्रांस्क्रिप्शन क्लासिफ़ायर हर प्रस्तावित क्रिया का दो‑चरणीय प्रक्रिया में मूल्यांकन करता है execution से पहले।
| स्तर | क्रिया का प्रकार | प्रोसेसिंग |
|---|---|---|
| Tier 1 | सुरक्षित टूल्स (फ़ाइल पढ़ना, खोज) | सीधे पास, बिना क्लासिफ़ायर |
| Tier 2 | प्रोजेक्ट में फ़ाइल संशोधन | क्लासिफ़ायर को बाईपास (वर्जन कंट्रोल के जरिए रिव्यू किए जा सकते हैं) |
| Tier 3 | खतरनाक क्रियाएँ (shell कमांड, बाहरी ऑपरेशन) | क्लासिफ़ायर द्वारा पूरा मूल्यांकन |
प्रदर्शन मेट्रिक्स :
| चरण | फॉल्स पॉज़िटिव रेट (रीयल ट्रैफिक) | फॉल्स नेगेटिव रेट (रिस्की एक्शन्स) |
|---|---|---|
| चरण 1 (तेज़) | 8.5 % | 6.6 % |
| पूरा पाइपलाइन | 0.4 % | 17 % |
पूरा पाइपलाइन पर 0.4% का फॉल्स पॉज़िटिव रेट बताता है कि ऑटो मोड लगभग कभी भी बेवजह काम रोकता नहीं है। 17% का फॉल्स नेगेटिव रेट उन मामलों को दर्शाता है जहाँ क्लासिफ़ायर खतरे का पता तो लगाता है लेकिन उपयोगकर्ता द्वारा दिये गए अनुमति‑सीमाओं की सही व्याख्या नहीं कर पाता।
“New on the Engineering Blog: How we designed Claude Code auto mode. Many Claude Code users let Claude work without permission prompts. Auto mode is a safer middle ground: we built and tested classifiers that make approval decisions instead.”
🇮🇳 Engineering ब्लॉग पर: हमने Claude Code के ऑटो मोड को कैसे डिज़ाइन किया। कई उपयोगकर्ता Claude को बिना अनुमति माँगे काम करने देते हैं। ऑटो मोड एक सुरक्षित समझौता है: हमने ऐसे क्लासिफ़ायर बनाए और परीक्षण किए जो अनुमोदन के निर्णय उनकी जगह ले लेते हैं। — @AnthropicAI पर X
🔗 Claude Code auto mode: a safer way to skip permissions
GitHub Copilot : merge conflicts का समाधान और एजेंटों की दृश्यता
26 मार्च — GitHub Copilot में दो बड़े अपडेट्स टीम वर्कफ़्लो को बेहतर बनाते हैं।
Merge conflicts का समाधान : अब पुल रिक्वेस्ट के कमेंट में @copilot का उल्लेख करके उसे conflicts सुलझाने के लिए कहा जा सकता है। एजेंट क्लाउड एन्वायरनमेंट में काम करता है, conflicts हल करता है, बिल्ड और टेस्ट पास होने की जाँच करता है, और फिर बदलाव पुश कर देता है। यह सभी Copilot पेड प्लान्स में उपलब्ध है (Business/Enterprise में admin activation की आवश्यकता हो सकती है)।
Issues और Projects में एजेंट दृश्यता : जब किसी issue पर कोड एजेंट (Copilot, Claude, Codex) असाइन किया जाता है, उसकी सेशन अस्साइनी के नीचे साइडबार में रीयल‑टाइम स्टेटस के साथ दिखती है — कतार में, चालू, समीक्षा प्रतीक्षा, पूरा। सेशन Projects की table और board views में भी दिखाई देती हैं (View menu > Show agent sessions से सक्रिय करें)।
🔗 Copilot merge conflicts सुलझाता है 🔗 Issues और Projects में एजेंट एक्टिविटी
GitHub : नया PRs डैशबोर्ड और Copilot for Jira
25-26 मार्च — डेवलपर्स के लिए दो और सुधार।
Pull Requests डैशबोर्ड (public preview) : github.com/pulls पर नया री‑इमेज्ड डैशबोर्ड उन PRs को केंद्रीकृत करता जिन्हें ध्यान चाहिए — review requested, सुधारों की आवश्यकता, merge के लिए तैयार। कस्टम सहेजी गई views,ADVANCED फिल्टर के साथ ऑटोकम्प्लीट और AND/OR क्वेरी सपोर्ट इंटरफ़ेस को पूरा करते हैं। Feature Preview सेटिंग्स से सक्रिय किया जा सकता है।
Copilot for Jira : public preview से, कई सुधार आये हैं : Jira से सीधे IA मॉडल का चयन, PR शीर्षक और ब्रांच नाम में Jira टिकट नंबर का ऑटो‑इंसर्शन, और MCP सर्वर के जरिए Confluence पेजेज़ तक पहुँच (PAT के साथ कॉन्फिगर करने योग्य)।
🔗 नया PRs डैशबोर्ड 🔗 Copilot for Jira सुधार
Cohere Transcribe : open‑source ASR रैंकिंग में नंबर 1
26 मार्च — Cohere ने Cohere Transcribe लॉन्च किया, अपना पहला Automatic Speech Recognition (ASR) मॉडल। यह Apache 2.0 लाइसेंस के तहत open‑source है और अंग्रेज़ी के लिए Hugging Face के Open ASR रैंकिंग में सीधे शीर्ष स्थान पर आ गया।
मॉडल एक Fast‑Conformer Transformer encoder‑decoder आर्किटेक्चर पर आधारित है और इसमें 2 अरब पैरामीटर हैं। 90% से अधिक पैरामीटर एन्कोडर को दिए गए हैं, जबकि डिकोडर हल्का रखा गया है ताकि ऑटोरेग्रेसिव कंप्यूटेशन कम और स्पीड अधिक हो। इसे 500,000 घंटे के ऑडियो‑ट्रांसक्रिप्शन पेयर पर ट्रेन किया गया है।
| मॉडल | औसत WER |
|---|---|
| Cohere Transcribe | 5.42 |
| Zoom Scribe v1 | 5.47 |
| IBM Granite 4.0 1B | 5.52 |
| NVIDIA Canary Qwen 2.5B | 5.63 |
| OpenAI Whisper Large v3 | 7.44 |
WER (Word Error Rate) 5.42% Cohere Transcribe को शीर्ष पर रखता है। इनफ़रेंस स्पीड समान आकार के प्रतिद्वंद्वियों की तुलना में 3× तेज़ है। 14 भाषाएँ सपोर्टेड हैं (जिसमें फ़्रेंच, जर्मन, अरबी, मैंडारिन, जापानी और कोरियाई शामिल हैं)।
सीमाएँ : मॉडल को code‑switching (एक ऑडियो में भाषाओं का मिश्रण) के लिए डिज़ाइन नहीं किया गया है और यह नॉन‑वोकल साउंड्स को ट्रांसक्राइब कर सकता है — VAD (Voice Activity Detection) फ़िल्टर जोड़ने की सिफारिश है।
🔗 Cohere ब्लॉग : Transcribe 🔗 Hugging Face मॉडल
Suno v5.5 : निजी आवाज़, कस्टम मॉडल, अनुकूलन योग्य पसंदें
26 मार्च — Suno ने अपने म्यूज़िक जनरेशन टूल का वर्जन 5.5 लॉन्च किया, जिसमें पर्सनलाइज़ेशन पर केंद्रित तीन नई क्षमताएँ शामिल हैं।
| फ़ीचर | विवरण | उपलब्धता |
|---|---|---|
| Voices | अपनी गाई हुई आवाज़ को कैप्चर और उपयोग करना (प्राइवेसी बनी रहती है) | सभी यूज़र्स |
| Custom Models | अपनी मूल रचनाओं से फाइन‑ट्यूनिंग, तक 3 मॉडल | Pro/Premier सब्सक्राइबर्स |
| My Taste | शैलियों और मूड में अनुकूलन सीखना | सभी यूज़र्स |
यह टूल्स अगले जनरेशन के मॉडलों की नींव के रूप में इंडस्ट्री के साथ साझेदारी में विकसित किए जा रहे हैं।
Mistral Voxtral TTS : 3 सेकंड में वॉयस क्लोन, open‑weight
23 मार्च (प्रेस कवरेज 26-27 मार्च) — Mistral ने Voxtral TTS जारी किया, उसका पहला open‑weight टेक्स्ट‑टू‑स्पीच मॉडल। मॉडल voxtral-tts-2603 में 4 अरब पैरामीटर हैं और यह 9 भाषाएँ सपोर्ट करता है (अंग्रेज़ी, फ़्रेंच, जर्मन, स्पेनिश, डच, पुर्तगाली, इटालियन, हिन्दी, अरबी)।
आधिकारिक लेटेंसी 70 ms बताई गई है एक टाइपिकल सेटअप के लिए (10 सेकंड सैंपल + 500 कैरेक्टर्स)। वॉयस क्लोनिंग केवल 3 सेकंड के रेफ़रेंस ऑडियो से काम करती है। नेचुरलनेस के मामले में Mistral का कहना है कि Voxtral ElevenLabs Flash v2.5 से बेहतर है और ElevenLabs v3 के साथ समानता पर पहुँचता है। मॉडल एक सामान्य लैपटॉप, मिड‑रेंज GPU या हाई‑एंड मोबाइल डिवाइस पर चल सकता है। पहुँच : Hugging Face पर उपलब्ध मॉडल वज़न (Creative Commons लाइसेंस) और Mistral Studio API के माध्यम से 0.016 डॉलर प्रति 1,000 अक्षर पर। Le Chat में voice mode एकीकरण उपलब्ध है।
xAI : SuperGrok Lite 10 डॉलर/महीना और 15 सेकंड की वीडियो स्टोरीज़
25 मार्च — xAI ने Grok के चारों ओर दो नई घोषणाएँ कीं।
SuperGrok Lite : 10 डॉलर प्रति महीना का नया सदस्यता प्लान, जो वर्तमान में सीमित परीक्षण में है। इसमें मुफ्त स्तर की तुलना में दोगुनी लंबी चैट सेशन, एक AI एजेंट, और 480p रिज़ॉल्यूशन में वीडियो जनरेशन (अधिकतम 6 सेकंड) शामिल है। यह प्लान मुफ्त स्तर और SuperGrok Standard (30 डॉलर प्रति महीना) के बीच स्थित है।
Grok Imagine के माध्यम से वीडियो स्टोरीज़ : Grok Imagine अब 15 सेकंड, 720p की “वीडियो स्टोरीज़” बनाता है, जिनमें सिंक्रनाइज़्ड ऑडियो, बैकग्राउंड म्यूज़िक और साउंड इफेक्ट्स होते हैं। Elon Musk ने वीडियो पर “दोगुना दांव लगाने” की बात कही। यह घोषणा उसी सप्ताह आई है जब OpenAI ने Sora को बंद कर दिया था।
🔗 Bloomberg : xAI AI वीडियो पर जोर दे रहा है
Kimi/Moonshot AI हांगकांग में आईपीओ पर विचार कर रहा है
26 मार्च — Bloomberg के अनुसार, Kimi के पीछे वाली चीनी कंपनी Moonshot AI हांगकांग स्टॉक एक्सचेंज में IPO करने पर विचार कर रही है। सलाहकार बैंक में CICC और Goldman Sachs बताए जा रहे हैं, लक्ष्यित वैल्यूएशन लगभग 18 अरब डॉलर और वर्तमान फंडिंग 1 अरब डॉलर तक चल रही है। मौजूदा शेयरधारकों में Alibaba, Tencent और 5Y Capital शामिल हैं। IPO का समय अभी अनिश्चित है।
🔗 Bloomberg : Moonshot considers Hong Kong IPO
NVIDIA GTC : स्वामित्व और ओपन AI विरोधी नहीं हैं
25 मार्च — GTC 2026 के दौरान NVIDIA और उद्योग के नेताओं (Mistral, Perplexity, Cursor, Reflection AI, LangChain) ने कहा कि AI का भविष्य खुले और स्वामित्व वाले मॉडल्स की पूरकता में है। Jensen Huang ने NVIDIA की स्थिति का सार दिया: “Proprietary versus open is not a thing. It’s proprietary and open.”
ब्लॉग पोस्ट ने कंपनियों के लिए मल्टी-मॉडल, मल्टी-क्लाउड और मल्टीमॉडल ऑर्केस्ट्रेशन की जरूरत को रेखांकित किया। NVIDIA ने Hugging Face पर सबसे बड़ी ऑर्गनाइजेशन बनकर अपने ओपन सोर्स संकल्प की पुष्टि की।
🔗 Blog NVIDIA : AI Open and Proprietary
Claude Code v2.1.85 et v2.1.84 : कंडीशनल hooks और PowerShell Windows पर
26-27 मार्च — Claude Code के दो नए वर्शन जारी किए गए।
v2.1.85 (27 मार्च) : कॉन्फ़िगरेशन में hooks के लिए एक कंडीशनल फ़ील्ड if पेश किया गया, जो केवल कुछ कमांड्स या फ़ाइलों पर hook ट्रिगर करने की अनुमति देता है। साथ ही: MCP सहायक स्क्रिप्ट्स के लिए पर्यावरण चर, शेड्यूल किए गए कार्यों के लिए ट्रांसक्रिप्शन्स में टाइमस्टैम्प, RFC 9728 अनुरूप OAuth समर्थन, और PreToolUse hooks के लिए AskUserQuestion को पूरा करने हेतु updatedInput लौटाने की क्षमता।
v2.1.84 (~26 मार्च) : Windows पर PowerShell एक नेटिव टूल के रूप में प्रीव्यू (ऑप्ट-इन पूर्वावलोकन) में उपलब्ध, hook TaskCreated (Claude द्वारा टास्क बनते समय ट्रिगर) पेश किया गया, WorktreeCreate के लिए HTTP समर्थन, और 75 मिनट की निष्क्रियता के बाद रिटर्न प्रॉम्प्ट दिखाने का व्यवहार। macOS/Linux पर आधिकारिक प्लगइन्स स्क्रिप्ट्स की अनुमति से संबंधित बग ठीक किया गया।
🔗 Tweet @lydiahallie — v2.1.85
Z.ai GLM-5.1 सभी Coding Plan सब्सक्राइबर्स के लिए उपलब्ध
27 मार्च — Z.ai (Zhipu) ने घोषणा की कि GLM-5.1 अब GLM Coding Plan के सभी सब्सक्राइबर्स के लिए उपलब्ध है, चाहे उनका सदस्यता स्तर Lite, Pro या Max कोई भी हो।
🔗 PANews : GLM-5.1 Coding Plan
Genspark ने अपने वीडियो एजेंट में Grok Imagine को जोड़ा
26 मार्च — Genspark ने Grok Imagine (मल्टी-इमेज वीडियो जनरेशन और वीडियो एक्सटेंशन) को अपने Genspark AI Video Agent में जोड़ा। उपयोगकर्ता अधिकतम 7 इमेज तक उपयोग करके एक वीडियो बना सकते हैं, या मौजूदा वीडियो को 10 सेकंड तक बढ़ा सकते हैं।
Meta SAM 3.1 : रीयल‑टाइम में 16 ऑब्जेक्ट ट्रैकिंग, स्पीड दोगुनी
27 मार्च — Meta ने SAM 3.1 जारी किया, Segment Anything Model 3 का अपडेट जो वीडियो में वस्तुओं का रीयल‑टाइम डिटेक्शन और ट्रैकिंग करता है। मुख्य नवाचार है वस्तु मल्टिप्लेक्सिंग (object multiplexing): हर वस्तु के लिए अलग‑अलग पास करने के बजाय सभी वस्तुओं को एक ही फॉरवर्ड पास में प्रोसेस किया जाता है। नतीजा: एक साथ तक 16 वस्तुएँ, और H100 GPU पर फ्रेम रेट 16 से बढ़कर 32 इमेज प्रति सेकंड हो गया — यानी गति दोगुनी — जबकि मेमोरी उपयोग भी काफी घट गया।
आर्किटेक्चर एक Mux-Demux एन्कोडर/डिकोडर पर आधारित है जो सभी वस्तुओं के लिए एक ही कंप्यूटेशन साझा करता है। एक वैश्विक तर्क (global reasoning) तंत्र उन दृश्यों में सटीकता सुधारता है जहाँ कई तत्व हों। SAM 3.1 सीधे SAM 3 का प्रतिस्थापन (drop-in replacement) है — API में कोई बदलाव आवश्यक नहीं है।
मॉडल ओपन सोर्स प्रकाशित किया गया है: checkpoint Hugging Face पर उपलब्ध, सोर्स कोड GitHub पर अपडेट, रिसर्च पेपर प्रकाशित और एक इंटरएक्टिव डेमो उपलब्ध है।
🔗 Blog Meta : SAM 3.1 🔗 Code GitHub 🔗 Tweet @AIatMeta
Meta TRIBE v2 : मानवीय मस्तिष्क गतिविधि का डिजिटल ट्विन
26 मार्च — Meta ने TRIBE v2 जारी किया, एक प्रेडिक्टिव फाउंडेशन मॉडल जिसे मानव न्यूरोनल गतिविधि का “डिजिटल ट्विन” कहा गया है। यह मॉडल लगभग किसी भी साउंड, इमेज या टेक्स्ट के लिए उच्च-रिज़ॉल्यूशन fMRI प्रतिक्रियाएँ भविष्यवाणी करता है, जो पिछली विधियों की तुलना में 70× अधिक रिज़ॉल्यूशन देता है। 700 से अधिक स्वयंसेवकों के डेटा पर प्रशिक्षित, यह नए सब्जेक्ट्स, भाषाओं और कार्यों पर बिना पुनःप्रशिक्षण के zero-shot मोड में काम करता है। उद्देश्य वैज्ञानिकों को बिना मानव प्रयोगों के तेज़ी से हाइपोथेसिस टेस्ट करने देना और न्यूरोलॉजिकल विकारों पर शोध को तेज़ करना है। मॉडल, कोड और वैज्ञानिक लेख CC BY-NC लाइसेंस के साथ जारी किए गए हैं।
🔗 Blog Meta : TRIBE v2 🔗 Tweet @AIatMeta
इसका क्या मतलब है
एम्स्टर्डम की अदालत का निर्णय एक नियामक मोड़ को दर्शाता है: यह पहली बार है जब किसी यूरोपीय अधिकार क्षेत्र ने Grok द्वारा उत्पन्न सामग्री के लिए सीधे xAI को दंडित किया है, और जुर्माने का प्रावधान निवारक है। इसी दिन यूरोपीय संसद द्वारा सेक्सुअल deepfakes पर वोट को मिलाकर, यह एक वैधानिक ढाँचा रेखांकित करता है जो धीरे-धीरे सभी जेनरेटिव AI प्रदाताओं पर लागू होगा।
डेवेलपर टूल्स की दिशा में, यह सप्ताह एकीकरण की दौड़ को दर्शाता है: Codex अपने नेटिव plugins के साथ, Copilot में merge conflicts का समाधान और Issues/Projects में एजेंट्स की दृश्यता, और Claude Code में कंडीशनल hooks। AI असिस्टेंट मौजूदा वर्कफ़्लो में इन्हें प्रतिस्थापित करने के बजाय गहराई से एकीकृत होते जा रहे हैं।
CLI मुफ्त में Gemini Pro की पहुँच पर रोक एक संकेत है कि CLI टूल्स में मुफ्त उदारता की अवधि कम हो रही है। Gemini, GitHub Copilot की तरह, एक freemium मॉडल की ओर बढ़ रहा है जहाँ उन्नत क्षमताओं के लिए सब्सक्रिप्शन चाहिए होगा।
अंततः, Kimi के हांगकांग IPO के 18 अरब डॉलर के संभावित लक्ष्य से चीनी AI क्षेत्र की वैल्यूएशन की आकर्षणशीलता की पुष्टि होती है, जबकि Mistral Voxtral TTS के साथ अपने open-weight मॉडल्स को वोकल संश्लेषण में मालिकाना सेवाओं के विकल्प के रूप में स्थापित करने की कोशिश जारी रखता है।
स्रोत
- CNBC : Dutch court bans Grok AI nudes
- The Record Media : Dutch court threatens xAI with fines
- Al Jazeera : Dutch court bans xAI Grok nudification
- Blog Google : Gemini 3.1 Flash Live
- Blog Google : Développeurs Gemini 3.1 Flash Live
- Blog Google : Switch to Gemini
- Blog Google : Gemini Drop mars 2026
- Changelog Gemini CLI
- Discussion politique Gemini CLI
- TechCrunch : Gemini import ChatGPT/Claude
- Documentation plugins Codex
- Tweet @OpenAIDevs — plugins
- Anthropic Engineering : Claude Code auto mode
- Tweet @AnthropicAI — auto mode
- GitHub Changelog : Copilot résout conflits de merge
- GitHub Changelog : Activité agents dans Issues et Projects
- GitHub Changelog : Tableau de bord PRs
- GitHub Changelog : Copilot for Jira
- Blog Cohere : Transcribe
- Hugging Face : Cohere Transcribe
- TechCrunch : Cohere Transcribe
- Suno Blog v5.5
- Mistral Voxtral TTS
- TechCrunch : Mistral Voxtral
- Bloomberg : xAI doubling down on videos
- Bloomberg : Moonshot IPO Hong Kong
- Blog NVIDIA GTC : Open and Proprietary AI
- Tweet @lydiahallie — Claude Code v2.1.85
- PANews : GLM-5.1 Coding Plan
- Tweet @genspark_ai
- Blog Meta : SAM 3.1
- GitHub SAM 3
- Tweet @AIatMeta — SAM 3.1
- Blog Meta : TRIBE v2
- Tweet @AIatMeta — TRIBE v2
इस दस्तावेज़ का अनुवाद fr संस्करण से hi भाषा में gpt-5-mini मॉडल का उपयोग करके किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए, देखें https://gitlab.com/jls42/ai-powered-markdown-translator