खोजें

नीदरलैंड्स में Grok पर प्रतिबंध, Gemini 3.1 Flash Live, Codex के नेटिव plugins

नीदरलैंड्स में Grok पर प्रतिबंध, Gemini 3.1 Flash Live, Codex के नेटिव plugins

एम्स्टर्डम की अदालत ने xAI को Grok के जरिए बिना सहमति की यौन/नग्न छवियाँ उत्पन्न करने से रोक दिया, जुर्माना €100,000 प्रति दिन होने की शर्त पर। उसी दिन, Google ने Gemini 3.1 Flash Live लॉन्च किया — 90+ भाषाओं में रीयल‑टाइम ऑडियो बातचीत के लिए — OpenAI ने Codex में नेटिव plugins जोड़े (Slack, Figma, Notion, Gmail), और Anthropic ने Claude Code के ऑटो मोड की डिज़ाइन पर तकनीकी ब्लॉग पोस्ट प्रकाशित किया। Cohere, Mistral और Suno ने भी एक भरी हुई घोषणाओं वाली सप्ताह को पूरा किया।


xAI : एम्स्टर्डम की अदालत ने Grok के नग्न/यौन चित्रों पर रोक लगा दी

27 मार्च — एम्स्टर्डम डिस्ट्रिक्ट कोर्ट ने xAI के खिलाफ निर्णय दिया, और नीदरलैंड्स में उसे बिना सहमति वाली यौन/नग्न छवियाँ जनरेट या वितरित करने से रोक दिया। गैर‑पालन करने पर जुर्माना €100 000 प्रतिदिन है, जो अधिकतम €10 मिलियन तक सीमित है।

यह निर्णय नेदरलैंड्स NGO Offlimits और Victims Support Fund की संयुक्त शिकायत के बाद आया। Center for Countering Digital Hate (CCDH) के अनुसार, Grok ने 11 दिनों में 3 मिलियन से अधिक सेक्सुअलाइज़्ड इमेजेज़ जनरेट कीं, जिनमें 23,000 मामलों में नाबालिग शामिल थे। Offlimits ने कहा कि Grok पीड़िता के भौगोलिक स्थान को ध्यान में नहीं रखता, जिससे इसकी प्रभावशीलता वैश्विक बनती है।

यह फैसला उसी दिन आया जब यूरोपीय संसद ने AI जेनरेटेड सेक्सुअल deepfakes पर पाबंदी को मंजूरी दी — एक मजबूत नियामक संकेत। यह xAI के खिलाफ इस तरह का पहला यूरोपीय निर्णय माना जाता है।

🔗 CNBC : नीदरलैंड्स की अदालत ने Grok AI के नुड्स पर रोक लगाई 🔗 The Record Media : नीदरलैंड्स की अदालत ने xAI को जुर्माने की चेतावनी दी


Gemini 3.1 Flash Live : 90+ भाषाओं में रियल‑टाइम ऑडियो

26 मार्च — Google ने Gemini 3.1 Flash Live लॉन्च किया, उसका मल्टीमॉडल मॉडल रीयल‑टाइम बातचीत के लिए। यह ऑडियो, इमेज, वीडियो और टेक्स्ट को सपोर्ट करता है, 128 000 tokens की संदर्भ विंडो के साथ, और 90+ भाषाओं का समर्थन करता है।

पिछली पीढ़ी के मुकाबले, मॉडल बातचीत को पहले से दोगुना लंबा बनाए रखता है, बैकग्राउंड शोर और पर्यावरणीय आवाज़ों को बेहतर संभालता है, जटिल सिस्टम निर्देशों का पालन अधिक सटीकता से करता है, और बातचीत के दौरान बाहरी टूल्स को अधिक विश्वसनीय तरीके से ट्रिगर करता है। सभी जनरेट किए गए ऑडियो पर SynthID लगाया जाता है।

फ़ीचरविवरण
संदर्भ विंडो128 000 tokens
भाषाएँ90+
बातचीतपहले से 2× लंबी
वॉटरमार्किंगसभी ऑडियोज़ पर SynthID

उपलब्धता : Live API के माध्यम से Google AI Studio (डेवेलपर्स), Gemini Live और Search Live के जरिए (यूज़र्स, 200+ देश), और Vertex AI (एंटरप्राइज़)। Search Live भी 200+ देशों और क्षेत्रों में पहुंच बढ़ा रहा है, Google Lens का वीडियो सपोर्ट के साथ।

🔗 Google की आधिकारिक घोषणा


Gemini : ChatGPT और Claude से मेमोरी और इतिहास इम्पोर्ट करना

26 मार्च — Google ने Gemini ऐप में एक इम्पोर्ट टूल लॉन्च किया ताकि अन्य AI असिस्टेंट्स से माइग्रेशन आसान हो सके।

दो फ़ीचर उपलब्ध हैं :

  1. मेमोरी इम्पोर्ट (“Add Memory”) : Gemini ChatGPT, Claude या Copilot में टाइप करने के लिए एक प्रॉम्प्ट सुझाता है। उत्पन्न उत्तर (दूसरे असिस्टेंट द्वारा स्टोर की गई व्यक्तिगत जानकारी का सार) को कॉपी‑पेस्ट कर Gemini में डालने पर, वह पसंद, रुचियाँ, लोकेशन जानकारी आदि निकाल लेता है।
  2. हैस्ट्रोरी इम्पोर्ट (“Import Chats”) : ChatGPT या Claude से एक्सपोर्ट किए गए .zip फाइल को अपलोड करना, अधिकतम 5 GB तक। पुरानी बातचीत खोजने योग्य बन जाती है और Gemini में फिर से जारी रखी जा सकती है।

🔗 ब्लॉग Google : Switch to Gemini


Gemini CLI v0.35.2 : डिफ़ॉल्ट सबएजेंट्स, बेहतर Vim मोड — और Pro पहुँच सीमित

25-26 मार्च — Gemini CLI का स्टेबल v0.35.2 कई महत्वपूर्ण फ़ीचर लेकर आता है।

फ़ीचरविवरण
Subagents डिफ़ॉल्ट सक्रियसमानांतर टास्क शेड्यूलर + कोड स्लीसिंग
कस्टम कीबाइंडिंगkeybindings समर्थन, literal chars, Kitty प्रोटोकॉल
बेहतर Vim मोडMotions X, ~, r, f/F/t/T ; unnamed रजिस्टर के साथ कॉपी‑पेस्ट
एकीकृत SandboxManagerbubblewrap/seccomp Linux के साथ टूल्स का आइसोलेशन
JIT संदर्भ खोजफाइलसिस्टम टूल्स के लिए अनुकूलित लोडिंग
gRPC नेटिवनेटिव एकीकरण और प्रोटोकॉल रूटिंग

नीतिगत बदलाव (महत्वपूर्ण) : 25 मार्च से फ्री यूज़र्स अब केवल Gemini Flash तक ही पहुँच पाएँगे। Gemini Pro एक्सेस केवल पेड सब्सक्राइबर्स (Pro और Ultra प्लान) के लिए उपलब्ध है। समुदाय की प्रतिक्रिया भारी रूप से नकारात्मक रही। Google ने दुरुपयोग की पहचान भी सख्त की है: Gemini CLI के OAuth प्रमाणिकरण का थर्ड‑पार्टी सॉफ़्टवेयर के साथ उपयोग अब प्रतिबंधों का कारण बन सकता है।

🔗 Gemini CLI चेंजलॉग 🔗 समुदाय चर्चा


Gemini Drop मार्च 2026 : Personal Intelligence मुफ्त और Lyria 3 Pro

27 मार्च — मार्च 2026 का मासिक “Gemini Drops” अपडेट उस महीने Gemini ऐप में तैनात की गई नई विशेषताएँ प्रस्तुत करता है।

फ़ीचरविवरणउपलब्धता
Personal Intelligence मुफ्तGmail, Photos, YouTube कनेक्शन के साथ यात्राओं/प्रोजेक्ट्स की योजना बनानामुफ्त, यूएस
Gemini Live बेहतरGemini 3.1 Flash Live आधारित, संदर्भ 2× लंबासभी यूज़र्स
ChatGPT/Claude इम्पोर्टमेमोरी और हिस्ट्री ट्रांसफरसभी यूज़र्स
Lyria 3 Pro3 मिनट तक संगीत निर्माण, फोटो → थीम्स/ऐंथेमसब्सक्राइबर्स
Google TVविज़ुअल Gemini उत्तर और नैरेशन्सGoogle TV

🔗 Gemini Drop मार्च 2026


Codex : Slack, Figma, Notion और Gmail के लिए नेटिव plugins

26-27 मार्च — OpenAI ने Codex में plugins को एक प्राथमिक फ़ीचर के रूप में तैनात किया। डेवलपर्स बिना मैनुअल कॉन्फ़िगरेशन के अपने रोज़मर्रा के टूल्स से Codex को जोड़ सकते हैं।

Pluginउपयोग का मामला
Slackसंदेश भेजना, चैनल पढ़ना
Figmaडिज़ाइन्स तक पहुँच, कोड जनरेट करना
Notionपेज पढ़ना और लिखना
Gmailई‑मेल पढ़ना और लिखना

plugins Codex के शुरुआती पर ही सिंक होते हैं और /plugins कमांड के माध्यम से पहुंच योग्य हैं। इंस्टॉलेशन और अनइंस्टॉलेशन सीधे TUI इंटरफ़ेस से होता है, जिसमें ऑथेंटिकेशन का प्रबंधन भी शामिल है।

27 मार्च को, OpenAI ने एक प्रैक्टिकल केस‑गैलरी जारी की जो एक‑क्लिक में उपलब्ध है: iOS ऐप्स बनाना, datasets का विश्लेषण, रिपोर्ट और प्रेजेंटेशन जेनरेट करना। Codex v0.117.0 के चेंजलॉग में तकनीकी फ़ीचर्स का विवरण है, जिनमें prompts में plugins के उल्लेख का सपोर्ट भी शामिल है।

🔗 Codex plugins दस्तावेज़ 🔗 ट्वीट @OpenAIDevs


Anthropic : Claude Code के ऑटो मोड की डिजाइन समझाई गई

26 mars — Anthropic ने अपने ब्लॉग पर Claude Code के ऑटो (auto mode) मोड की डिज़ाइन पर एक तकनीकी पोस्ट प्रकाशित की है, जो Engineering ब्लॉग पर उपलब्ध है।

समस्या जिसे संबोधित किया गया : Claude Code के उपयोगकर्ताओं को अनुमोदन थकान (approval fatigue) का सामना करना पड़ता है। आँकड़े दिखाते हैं कि अनुमतियों के अनुरोधों में से 93% स्वीकार कर दिए जाते हैं — जो संकेत देता है कि सुरक्षा खतरों के बिना आंशिक स्वचालन संभव है।

समाधान : दो परतों वाले क्लासिफ़ायर

ऑटो मोड Sonnet 4.6 मॉडल पर आधारित दो स्तर की सुरक्षा पर टिका है :

  1. इनपुट परत : एक prompt injection probe टूल के परिणामों का विश्लेषण करता है इससे पहले कि वे एजेंट तक पहुँचें।
  2. आउटपुट परत : एक ट्रांस्क्रिप्शन क्लासिफ़ायर हर प्रस्तावित क्रिया का दो‑चरणीय प्रक्रिया में मूल्यांकन करता है execution से पहले।
स्तरक्रिया का प्रकारप्रोसेसिंग
Tier 1सुरक्षित टूल्स (फ़ाइल पढ़ना, खोज)सीधे पास, बिना क्लासिफ़ायर
Tier 2प्रोजेक्ट में फ़ाइल संशोधनक्लासिफ़ायर को बाईपास (वर्जन कंट्रोल के जरिए रिव्यू किए जा सकते हैं)
Tier 3खतरनाक क्रियाएँ (shell कमांड, बाहरी ऑपरेशन)क्लासिफ़ायर द्वारा पूरा मूल्यांकन

प्रदर्शन मेट्रिक्स :

चरणफॉल्स पॉज़िटिव रेट (रीयल ट्रैफिक)फॉल्स नेगेटिव रेट (रिस्की एक्शन्स)
चरण 1 (तेज़)8.5 %6.6 %
पूरा पाइपलाइन0.4 %17 %

पूरा पाइपलाइन पर 0.4% का फॉल्स पॉज़िटिव रेट बताता है कि ऑटो मोड लगभग कभी भी बेवजह काम रोकता नहीं है। 17% का फॉल्स नेगेटिव रेट उन मामलों को दर्शाता है जहाँ क्लासिफ़ायर खतरे का पता तो लगाता है लेकिन उपयोगकर्ता द्वारा दिये गए अनुमति‑सीमाओं की सही व्याख्या नहीं कर पाता।

“New on the Engineering Blog: How we designed Claude Code auto mode. Many Claude Code users let Claude work without permission prompts. Auto mode is a safer middle ground: we built and tested classifiers that make approval decisions instead.”

🇮🇳 Engineering ब्लॉग पर: हमने Claude Code के ऑटो मोड को कैसे डिज़ाइन किया। कई उपयोगकर्ता Claude को बिना अनुमति माँगे काम करने देते हैं। ऑटो मोड एक सुरक्षित समझौता है: हमने ऐसे क्लासिफ़ायर बनाए और परीक्षण किए जो अनुमोदन के निर्णय उनकी जगह ले लेते हैं।@AnthropicAI पर X

🔗 Claude Code auto mode: a safer way to skip permissions


GitHub Copilot : merge conflicts का समाधान और एजेंटों की दृश्यता

26 मार्च — GitHub Copilot में दो बड़े अपडेट्स टीम वर्कफ़्लो को बेहतर बनाते हैं।

Merge conflicts का समाधान : अब पुल रिक्वेस्ट के कमेंट में @copilot का उल्लेख करके उसे conflicts सुलझाने के लिए कहा जा सकता है। एजेंट क्लाउड एन्वायरनमेंट में काम करता है, conflicts हल करता है, बिल्ड और टेस्ट पास होने की जाँच करता है, और फिर बदलाव पुश कर देता है। यह सभी Copilot पेड प्लान्स में उपलब्ध है (Business/Enterprise में admin activation की आवश्यकता हो सकती है)।

Issues और Projects में एजेंट दृश्यता : जब किसी issue पर कोड एजेंट (Copilot, Claude, Codex) असाइन किया जाता है, उसकी सेशन अस्साइनी के नीचे साइडबार में रीयल‑टाइम स्टेटस के साथ दिखती है — कतार में, चालू, समीक्षा प्रतीक्षा, पूरा। सेशन Projects की table और board views में भी दिखाई देती हैं (View menu > Show agent sessions से सक्रिय करें)।

🔗 Copilot merge conflicts सुलझाता है 🔗 Issues और Projects में एजेंट एक्टिविटी


GitHub : नया PRs डैशबोर्ड और Copilot for Jira

25-26 मार्च — डेवलपर्स के लिए दो और सुधार।

Pull Requests डैशबोर्ड (public preview) : github.com/pulls पर नया री‑इमेज्ड डैशबोर्ड उन PRs को केंद्रीकृत करता जिन्हें ध्यान चाहिए — review requested, सुधारों की आवश्यकता, merge के लिए तैयार। कस्टम सहेजी गई views,ADVANCED फिल्टर के साथ ऑटोकम्प्लीट और AND/OR क्वेरी सपोर्ट इंटरफ़ेस को पूरा करते हैं। Feature Preview सेटिंग्स से सक्रिय किया जा सकता है।

Copilot for Jira : public preview से, कई सुधार आये हैं : Jira से सीधे IA मॉडल का चयन, PR शीर्षक और ब्रांच नाम में Jira टिकट नंबर का ऑटो‑इंसर्शन, और MCP सर्वर के जरिए Confluence पेजेज़ तक पहुँच (PAT के साथ कॉन्फिगर करने योग्य)।

🔗 नया PRs डैशबोर्ड 🔗 Copilot for Jira सुधार


Cohere Transcribe : open‑source ASR रैंकिंग में नंबर 1

26 मार्च — Cohere ने Cohere Transcribe लॉन्च किया, अपना पहला Automatic Speech Recognition (ASR) मॉडल। यह Apache 2.0 लाइसेंस के तहत open‑source है और अंग्रेज़ी के लिए Hugging Face के Open ASR रैंकिंग में सीधे शीर्ष स्थान पर आ गया।

मॉडल एक Fast‑Conformer Transformer encoder‑decoder आर्किटेक्चर पर आधारित है और इसमें 2 अरब पैरामीटर हैं। 90% से अधिक पैरामीटर एन्कोडर को दिए गए हैं, जबकि डिकोडर हल्का रखा गया है ताकि ऑटोरेग्रेसिव कंप्यूटेशन कम और स्पीड अधिक हो। इसे 500,000 घंटे के ऑडियो‑ट्रांसक्रिप्शन पेयर पर ट्रेन किया गया है।

मॉडलऔसत WER
Cohere Transcribe5.42
Zoom Scribe v15.47
IBM Granite 4.0 1B5.52
NVIDIA Canary Qwen 2.5B5.63
OpenAI Whisper Large v37.44

WER (Word Error Rate) 5.42% Cohere Transcribe को शीर्ष पर रखता है। इनफ़रेंस स्पीड समान आकार के प्रतिद्वंद्वियों की तुलना में 3× तेज़ है। 14 भाषाएँ सपोर्टेड हैं (जिसमें फ़्रेंच, जर्मन, अरबी, मैंडारिन, जापानी और कोरियाई शामिल हैं)।

सीमाएँ : मॉडल को code‑switching (एक ऑडियो में भाषाओं का मिश्रण) के लिए डिज़ाइन नहीं किया गया है और यह नॉन‑वोकल साउंड्स को ट्रांसक्राइब कर सकता है — VAD (Voice Activity Detection) फ़िल्टर जोड़ने की सिफारिश है।

🔗 Cohere ब्लॉग : Transcribe 🔗 Hugging Face मॉडल


Suno v5.5 : निजी आवाज़, कस्टम मॉडल, अनुकूलन योग्य पसंदें

26 मार्च — Suno ने अपने म्यूज़िक जनरेशन टूल का वर्जन 5.5 लॉन्च किया, जिसमें पर्सनलाइज़ेशन पर केंद्रित तीन नई क्षमताएँ शामिल हैं।

फ़ीचरविवरणउपलब्धता
Voicesअपनी गाई हुई आवाज़ को कैप्चर और उपयोग करना (प्राइवेसी बनी रहती है)सभी यूज़र्स
Custom Modelsअपनी मूल रचनाओं से फाइन‑ट्यूनिंग, तक 3 मॉडलPro/Premier सब्सक्राइबर्स
My Tasteशैलियों और मूड में अनुकूलन सीखनासभी यूज़र्स

यह टूल्स अगले जनरेशन के मॉडलों की नींव के रूप में इंडस्ट्री के साथ साझेदारी में विकसित किए जा रहे हैं।

🔗 Suno ब्लॉग v5.5


Mistral Voxtral TTS : 3 सेकंड में वॉयस क्लोन, open‑weight

23 मार्च (प्रेस कवरेज 26-27 मार्च) — Mistral ने Voxtral TTS जारी किया, उसका पहला open‑weight टेक्स्ट‑टू‑स्पीच मॉडल। मॉडल voxtral-tts-2603 में 4 अरब पैरामीटर हैं और यह 9 भाषाएँ सपोर्ट करता है (अंग्रेज़ी, फ़्रेंच, जर्मन, स्पेनिश, डच, पुर्तगाली, इटालियन, हिन्दी, अरबी)।

आधिकारिक लेटेंसी 70 ms बताई गई है एक टाइपिकल सेटअप के लिए (10 सेकंड सैंपल + 500 कैरेक्टर्स)। वॉयस क्लोनिंग केवल 3 सेकंड के रेफ़रेंस ऑडियो से काम करती है। नेचुरलनेस के मामले में Mistral का कहना है कि Voxtral ElevenLabs Flash v2.5 से बेहतर है और ElevenLabs v3 के साथ समानता पर पहुँचता है। मॉडल एक सामान्य लैपटॉप, मिड‑रेंज GPU या हाई‑एंड मोबाइल डिवाइस पर चल सकता है। पहुँच : Hugging Face पर उपलब्ध मॉडल वज़न (Creative Commons लाइसेंस) और Mistral Studio API के माध्यम से 0.016 डॉलर प्रति 1,000 अक्षर पर। Le Chat में voice mode एकीकरण उपलब्ध है।

🔗 Mistral Voxtral की घोषणा


xAI : SuperGrok Lite 10 डॉलर/महीना और 15 सेकंड की वीडियो स्टोरीज़

25 मार्च — xAI ने Grok के चारों ओर दो नई घोषणाएँ कीं।

SuperGrok Lite : 10 डॉलर प्रति महीना का नया सदस्यता प्लान, जो वर्तमान में सीमित परीक्षण में है। इसमें मुफ्त स्तर की तुलना में दोगुनी लंबी चैट सेशन, एक AI एजेंट, और 480p रिज़ॉल्यूशन में वीडियो जनरेशन (अधिकतम 6 सेकंड) शामिल है। यह प्लान मुफ्त स्तर और SuperGrok Standard (30 डॉलर प्रति महीना) के बीच स्थित है।

Grok Imagine के माध्यम से वीडियो स्टोरीज़ : Grok Imagine अब 15 सेकंड, 720p की “वीडियो स्टोरीज़” बनाता है, जिनमें सिंक्रनाइज़्ड ऑडियो, बैकग्राउंड म्यूज़िक और साउंड इफेक्ट्स होते हैं। Elon Musk ने वीडियो पर “दोगुना दांव लगाने” की बात कही। यह घोषणा उसी सप्ताह आई है जब OpenAI ने Sora को बंद कर दिया था।

🔗 Bloomberg : xAI AI वीडियो पर जोर दे रहा है


Kimi/Moonshot AI हांगकांग में आईपीओ पर विचार कर रहा है

26 मार्च — Bloomberg के अनुसार, Kimi के पीछे वाली चीनी कंपनी Moonshot AI हांगकांग स्टॉक एक्सचेंज में IPO करने पर विचार कर रही है। सलाहकार बैंक में CICC और Goldman Sachs बताए जा रहे हैं, लक्ष्यित वैल्यूएशन लगभग 18 अरब डॉलर और वर्तमान फंडिंग 1 अरब डॉलर तक चल रही है। मौजूदा शेयरधारकों में Alibaba, Tencent और 5Y Capital शामिल हैं। IPO का समय अभी अनिश्चित है।

🔗 Bloomberg : Moonshot considers Hong Kong IPO


NVIDIA GTC : स्वामित्व और ओपन AI विरोधी नहीं हैं

25 मार्च — GTC 2026 के दौरान NVIDIA और उद्योग के नेताओं (Mistral, Perplexity, Cursor, Reflection AI, LangChain) ने कहा कि AI का भविष्य खुले और स्वामित्व वाले मॉडल्स की पूरकता में है। Jensen Huang ने NVIDIA की स्थिति का सार दिया: “Proprietary versus open is not a thing. It’s proprietary and open.”

ब्लॉग पोस्ट ने कंपनियों के लिए मल्टी-मॉडल, मल्टी-क्लाउड और मल्टीमॉडल ऑर्केस्ट्रेशन की जरूरत को रेखांकित किया। NVIDIA ने Hugging Face पर सबसे बड़ी ऑर्गनाइजेशन बनकर अपने ओपन सोर्स संकल्प की पुष्टि की।

🔗 Blog NVIDIA : AI Open and Proprietary


Claude Code v2.1.85 et v2.1.84 : कंडीशनल hooks और PowerShell Windows पर

26-27 मार्च — Claude Code के दो नए वर्शन जारी किए गए।

v2.1.85 (27 मार्च) : कॉन्फ़िगरेशन में hooks के लिए एक कंडीशनल फ़ील्ड if पेश किया गया, जो केवल कुछ कमांड्स या फ़ाइलों पर hook ट्रिगर करने की अनुमति देता है। साथ ही: MCP सहायक स्क्रिप्ट्स के लिए पर्यावरण चर, शेड्यूल किए गए कार्यों के लिए ट्रांसक्रिप्शन्स में टाइमस्टैम्प, RFC 9728 अनुरूप OAuth समर्थन, और PreToolUse hooks के लिए AskUserQuestion को पूरा करने हेतु updatedInput लौटाने की क्षमता।

v2.1.84 (~26 मार्च) : Windows पर PowerShell एक नेटिव टूल के रूप में प्रीव्यू (ऑप्ट-इन पूर्वावलोकन) में उपलब्ध, hook TaskCreated (Claude द्वारा टास्क बनते समय ट्रिगर) पेश किया गया, WorktreeCreate के लिए HTTP समर्थन, और 75 मिनट की निष्क्रियता के बाद रिटर्न प्रॉम्प्ट दिखाने का व्यवहार। macOS/Linux पर आधिकारिक प्लगइन्स स्क्रिप्ट्स की अनुमति से संबंधित बग ठीक किया गया।

🔗 Tweet @lydiahallie — v2.1.85


Z.ai GLM-5.1 सभी Coding Plan सब्सक्राइबर्स के लिए उपलब्ध

27 मार्च — Z.ai (Zhipu) ने घोषणा की कि GLM-5.1 अब GLM Coding Plan के सभी सब्सक्राइबर्स के लिए उपलब्ध है, चाहे उनका सदस्यता स्तर Lite, Pro या Max कोई भी हो।

🔗 PANews : GLM-5.1 Coding Plan


Genspark ने अपने वीडियो एजेंट में Grok Imagine को जोड़ा

26 मार्च — Genspark ने Grok Imagine (मल्टी-इमेज वीडियो जनरेशन और वीडियो एक्सटेंशन) को अपने Genspark AI Video Agent में जोड़ा। उपयोगकर्ता अधिकतम 7 इमेज तक उपयोग करके एक वीडियो बना सकते हैं, या मौजूदा वीडियो को 10 सेकंड तक बढ़ा सकते हैं।

🔗 Tweet @genspark_ai


Meta SAM 3.1 : रीयल‑टाइम में 16 ऑब्जेक्ट ट्रैकिंग, स्पीड दोगुनी

27 मार्च — Meta ने SAM 3.1 जारी किया, Segment Anything Model 3 का अपडेट जो वीडियो में वस्तुओं का रीयल‑टाइम डिटेक्शन और ट्रैकिंग करता है। मुख्य नवाचार है वस्तु मल्टिप्लेक्सिंग (object multiplexing): हर वस्तु के लिए अलग‑अलग पास करने के बजाय सभी वस्तुओं को एक ही फॉरवर्ड पास में प्रोसेस किया जाता है। नतीजा: एक साथ तक 16 वस्तुएँ, और H100 GPU पर फ्रेम रेट 16 से बढ़कर 32 इमेज प्रति सेकंड हो गया — यानी गति दोगुनी — जबकि मेमोरी उपयोग भी काफी घट गया।

आर्किटेक्चर एक Mux-Demux एन्कोडर/डिकोडर पर आधारित है जो सभी वस्तुओं के लिए एक ही कंप्यूटेशन साझा करता है। एक वैश्विक तर्क (global reasoning) तंत्र उन दृश्यों में सटीकता सुधारता है जहाँ कई तत्व हों। SAM 3.1 सीधे SAM 3 का प्रतिस्थापन (drop-in replacement) है — API में कोई बदलाव आवश्यक नहीं है।

मॉडल ओपन सोर्स प्रकाशित किया गया है: checkpoint Hugging Face पर उपलब्ध, सोर्स कोड GitHub पर अपडेट, रिसर्च पेपर प्रकाशित और एक इंटरएक्टिव डेमो उपलब्ध है।

🔗 Blog Meta : SAM 3.1 🔗 Code GitHub 🔗 Tweet @AIatMeta


Meta TRIBE v2 : मानवीय मस्तिष्क गतिविधि का डिजिटल ट्विन

26 मार्च — Meta ने TRIBE v2 जारी किया, एक प्रेडिक्टिव फाउंडेशन मॉडल जिसे मानव न्यूरोनल गतिविधि का “डिजिटल ट्विन” कहा गया है। यह मॉडल लगभग किसी भी साउंड, इमेज या टेक्स्ट के लिए उच्च-रिज़ॉल्यूशन fMRI प्रतिक्रियाएँ भविष्यवाणी करता है, जो पिछली विधियों की तुलना में 70× अधिक रिज़ॉल्यूशन देता है। 700 से अधिक स्वयंसेवकों के डेटा पर प्रशिक्षित, यह नए सब्जेक्ट्स, भाषाओं और कार्यों पर बिना पुनःप्रशिक्षण के zero-shot मोड में काम करता है। उद्देश्य वैज्ञानिकों को बिना मानव प्रयोगों के तेज़ी से हाइपोथेसिस टेस्ट करने देना और न्यूरोलॉजिकल विकारों पर शोध को तेज़ करना है। मॉडल, कोड और वैज्ञानिक लेख CC BY-NC लाइसेंस के साथ जारी किए गए हैं।

🔗 Blog Meta : TRIBE v2 🔗 Tweet @AIatMeta


इसका क्या मतलब है

एम्स्टर्डम की अदालत का निर्णय एक नियामक मोड़ को दर्शाता है: यह पहली बार है जब किसी यूरोपीय अधिकार क्षेत्र ने Grok द्वारा उत्पन्न सामग्री के लिए सीधे xAI को दंडित किया है, और जुर्माने का प्रावधान निवारक है। इसी दिन यूरोपीय संसद द्वारा सेक्सुअल deepfakes पर वोट को मिलाकर, यह एक वैधानिक ढाँचा रेखांकित करता है जो धीरे-धीरे सभी जेनरेटिव AI प्रदाताओं पर लागू होगा।

डेवेलपर टूल्स की दिशा में, यह सप्ताह एकीकरण की दौड़ को दर्शाता है: Codex अपने नेटिव plugins के साथ, Copilot में merge conflicts का समाधान और Issues/Projects में एजेंट्स की दृश्यता, और Claude Code में कंडीशनल hooks। AI असिस्टेंट मौजूदा वर्कफ़्लो में इन्हें प्रतिस्थापित करने के बजाय गहराई से एकीकृत होते जा रहे हैं।

CLI मुफ्त में Gemini Pro की पहुँच पर रोक एक संकेत है कि CLI टूल्स में मुफ्त उदारता की अवधि कम हो रही है। Gemini, GitHub Copilot की तरह, एक freemium मॉडल की ओर बढ़ रहा है जहाँ उन्नत क्षमताओं के लिए सब्सक्रिप्शन चाहिए होगा।

अंततः, Kimi के हांगकांग IPO के 18 अरब डॉलर के संभावित लक्ष्य से चीनी AI क्षेत्र की वैल्यूएशन की आकर्षणशीलता की पुष्टि होती है, जबकि Mistral Voxtral TTS के साथ अपने open-weight मॉडल्स को वोकल संश्लेषण में मालिकाना सेवाओं के विकल्प के रूप में स्थापित करने की कोशिश जारी रखता है।


स्रोत

इस दस्तावेज़ का अनुवाद fr संस्करण से hi भाषा में gpt-5-mini मॉडल का उपयोग करके किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए, देखें https://gitlab.com/jls42/ai-powered-markdown-translator