Luma AI ने Uni-1 लॉन्च किया — एक ऐसा मॉडल जो एक ही पास में सोचने और पिक्सल जेनरेट करने को जोड़ता है — और कुछ ही दिनों में इसे 6.1 मिलियन व्यूज मिले। इसी दौरान, Perplexity ने अपनी API सेवाएँ Samsung Browsing Assist में 1 अरब से अधिक डिवाइसेज़ पर तैनात कीं, Claude Code v2.1.86 लगभग पंद्रह बड़े फिक्स के साथ आया, और GitHub Copilot CLI ने एजेंट्स द्वारा ऑटोपायलट में यूनिट टेस्ट जेनरेशन पेश किया।
Luma Uni-1 — एकीकृत दृश्य तर्क और पिक्सल जेनरेशन
23 मार्च — Luma AI ने Uni-1 की घोषणा की, जिसे वह “एक नया प्रकार का मॉडल जो एक साथ सोचता है और पिक्सल उत्पन्न करता है” के रूप में वर्णित कर रहा है। पारंपरिक diffusion मॉडल्स जो पहले एक latent प्रतिनिधित्व बनाते हैं और फिर उसे डिकोड करते हैं, उनसे अलग Uni-1 तर्क (reasoning) और जेनरेशन को एक ही प्रक्रिया में मिला देता है।
घोषणा ने ध्यान खींचा और कुछ ही दिनों में 6.1 मिलियन व्यूज, 4,000 लाइक्स और एक हज़ार से अधिक रीशेयर हुए — जो इमेज जेनरेशन की तकनीकी घोषणा के लिए असाधारण आँकड़े हैं।
आर्किटेक्चर और पोजिशनिंग :
| Capacité | Description |
|---|---|
| Raisonnement spatial | परिप्रेक्ष्य और ओक्लूज़न की संगति के साथ दृश्यों को समझता और पूरा करता है |
| Raisonnement de bon sens | जेनरेशन को मार्गदर्शित करने के लिए दृश्य के इरादे का अनुमान लगाता है |
| Transformation guidée | केवल पिक्सल मिलान नहीं, बल्कि भौतिक संभाव्यता द्वारा निर्देशित मॉडिफिकेशन |
| Intelligence unifiée | एक ही पास में समझना, निर्देश और जेनरेशन (एकीकृत पास) |
Luma Uni-1 को “Less artificial. More intelligent.” के नारे के साथ पोजिशन करता है — यह संकेत देता है कि यह विज़ुअल पैटर्न-आधारित सांख्यिकीय मिलान पर आधारित जेनरेटर से अलग है। मॉडल को Luma के भविष्य के “Creative Agents” का आधार बताया जा रहा है, संभवतः अगली पीढ़ी की Dream Machine का इंजन।
Uni-1 तुरंत lumalabs.ai/app पर उपलब्ध है।
“A new kind of model that thinks and generates pixels at the same time.”
🇮🇳 एक नया प्रकार का मॉडल जो एक साथ सोचता है और पिक्सल उत्पन्न करता है। — @LumaLabsAI पर X
Perplexity Samsung Browsing Assist को 1 अरब उपकरणों पर संचालित कर रहा है
26 मार्च — Samsung ने Browsing Assist लॉन्च किया, एक नाटिवली इंटीग्रेटेड कन्वर्सेशनल AI असिस्टेंट जो Samsung Browser में Galaxy Android उपकरणों और Windows PC पर काम करता है। इस फीचर के पीछे Perplexity की API हैं, जो दुनिया भर में 1 अरब से अधिक Samsung उपकरणों पर तैनात की गयी हैं।
यह लॉन्च पहले से मौजूद साझेदारी को मजबूत करता है: Perplexity Galaxy S26 के तीन में से दो इन-बिल्ट असिस्टेंट्स को पावर देता है — नाटिव Perplexity असिस्टेंट और Bixby, जो वेब सर्च और रीज़निंग के लिए Perplexity API का उपयोग करता है। Browsing Assist के साथ, Perplexity सिर्फ एक कन्वर्सेशनल असिस्टेंट नहीं बल्कि ब्राउज़र की AI परत बन जाता है।
Browsing Assist की क्षमताएँ :
| Fonctionnalité | Description |
|---|---|
| Réponses sourcées | ब्राउज़िंग के दौरान रीयल-टाइम में स्रोत-सहित उत्तर |
| Résumé de pages | प्रमाणीकृत सामग्री सहित (लॉगिन के पीछे पेज) के सार |
| Recherche dans l’historique | नेचुरल लैंग्वेज में इतिहास में खोज |
| Gestion conversationnelle | वॉइस या टेक्स्ट से टैब खोलना, बंद करना, नेविगेट करना |
| Actions multi-onglets | खुले कई टैब्स पर एक साथ ऑपरेशन करना |
| Synchronisation téléphone → PC | मोबाइल पर शुरू की गई बातचीत को PC पर जारी रखना |
Infrastructure : Browsing Assist एक समर्पित Perplexity क्लस्टर पर single-tenant मोड में चलता है, और सभी API एंट्रीज़ पर कोई डेटा रिटेंशन नहीं है। एंडपॉइंट को Samsung की आवश्यक गति और स्केल के अनुसार कस्टम डिज़ाइन किया गया है।
Perplexity नोट करती है कि Samsung में तैनात क्षमताएँ — खोज, तर्क, मल्टी-टैब ऑर्केस्ट्रेशन — ठीक वही हैं जिन पर उसका ब्राउज़र Comet बना है। यह तैनाती Perplexity की टेक्निकल स्टैक के बड़े पैमाने पर मान्य होने का संकेत है।
उपलब्धता : लॉन्च पर अमेरिका और दक्षिण कोरिया; अन्य क्षेत्रों में बाद में उपलब्ध होगा। डेवलपर्स के लिए वही क्षमताएँ Perplexity की Search API, Embeddings API और Agent API के माध्यम से उपलब्ध हैं।
Claude Code v2.1.86 — प्रमुख फिक्स और VCS Jujutsu/Sapling सपोर्ट
27 मार्च — Anthropic ने Claude Code v2.1.86 जारी किया, एक ऐसा रिलीज़ जिसमें बग फिक्स का भारी समुच्चय है। अपडेट में लगभग पंद्रह बग फिक्स और कई प्रदर्शन सुधार शामिल हैं।
मुख्य सुधार :
| Catégorie | Changement |
|---|---|
| API | Header X-Claude-Code-Session-Id ताकि प्रॉक्सी साइड पर सत्र के अनुसार रिक्वेस्ट्स को एग्रीगेट किया जा सके |
| VCS | Grep और ऑटोकम्प्लीशन में .jj (Jujutsu) और .sl (Sapling) को बाहर रखा गया |
| Cache MCP | macOS keychain cache के लिए स्टार्ट-अप डिले 5s से 30s कर दिया गया |
| Performances | Bedrock, Vertex और Foundry पर cache हिट रेट में सुधार |
| Tokens | उल्लेखों पर overhead घटाया गया @fichier (रॉ कंटेंट का JSON-escape नहीं किया जाएगा) |
| UX mémoire | ”Saved N memories” नोटिस में क्लिक करने योग्य मेमोरी फाइल नाम |
| Skills | विवरण 250 कैरेक्टर तक सीमित; /skills मेन्यू वर्णानुक्रम में सॉर्ट |
| Read tool | लाइन नंबरों का कॉम्पैक्ट फॉर्मेट, समान रीड्स की डेडुप्लिकेशन |
ध्यान देने योग्य बग फिक्स: --resume v2.1.85 से पहले बनाई गई सत्रों पर फेल हो रहा था; स्किल्स पर निर्भर फाइलों के लिए Write/Edit/Read रूट-आउटसाइड फोल्डर पर फेल हो रहा था; /feedback के साथ लंबे सत्रों पर संभावित मेमोरी क्रैश; --bare मोड MCP टूल्स खो रहा था; OAuth URL कॉपी शॉर्टकट ~20 कैरेक्टर ही कॉपी कर रहा था ना कि पूरी URL; आधिकारिक मार्केटप्लेस प्लगइन्स के स्क्रिप्ट्स macOS/Linux पर v2.1.83 के बाद “Permission denied” के साथ फेल हो रहे थे।
GitHub Copilot CLI — एजेंट्स द्वारा ऑटोपायलट में यूनिट टेस्ट जेनरेशन
28 मार्च — GitHub ने Copilot CLI की एक नई क्षमता की घोषणा की: टर्मिनल से सीधे पूरी यूनिट टेस्ट सूट अपने आप जेनरेट करना, plan mode को एजेंट्स की एक फ्लीट के साथ ऑटोपायलट में मिलाकर।
वर्कफ़्लो :
- टर्मिनल में
Shift-Tabके साथ plan मोड एक्टिव करें - ऑटोपायलट मोड में एजेंट्स की एक फ्लीट लॉन्च करें
- प्रोग्रेस को
/tasksकमांड से ट्रैक करें
जेनरेशन कई एजेंट्स के बीच पैरेललाइज़ की जाती है, जिससे कई मॉड्यूल एक साथ कवर किए जा सकते हैं। मुख्य उपयोग का मामला मौजूदा प्रोजेक्ट्स हैं जिनमें टेस्ट कवरेज नहीं है — Copilot CLI बिना टर्मिनल से बाहर निकले एक पूरी टेस्ट सूट जेनरेट कर सकता है।
OpenAI — gpt-realtime-1.5 और gpt-realtime-mini सामान्य उपलब्धता में
27 मार्च — OpenAI ने Realtime API के जरिए नए रीयलटाइम मॉडल्स की General Availability की घोषणा की। मॉडल डॉक्यूमेंटेशन अब सूचीबद्ध करता है :
| Modèle | Positionnement |
|---|---|
gpt-realtime-1.5 | द्वि-दिशात्मक ऑडियो इंटरैक्शन्स के लिए बेस्ट वॉइस मॉडल |
gpt-realtime-mini | रीयलटाइम मॉडल का किफायती संस्करण |
ये मॉडल्स पहले का बेता नाम gpt-4o-realtime-preview बदलते हैं। Realtime API WebRTC, WebSocket या SIP के माध्यम से इनपुट और आउटपुट ऑडियो के साथ रीयल-टाइम द्वि-दिशात्मक वॉयस इंटरैक्शन की अनुमति देती है। @OpenAIDevs द्वारा प्रस्तुत डेमो सिंगापुर की एक क्लिनिक के लिए एक कंसियर्ज़ मेडिकल असिस्टेंट दिखाती है, जो जानकारी इकट्ठा कर सकता है और स्वाभाविक तरीके से अपॉइंटमेंट बुक कर सकता है।
Google DeepMind — AI मैनिपुलेशन मेज़रमेंट टूलकिट
26 मार्च — Google DeepMind ने AI द्वारा किए गए मैनिपुलेशन पर एक बड़े पैमाने की एम्पिरिकल स्टडी के नतीजे प्रकाशित किए, जिसमें 10,000 लोगों को शामिल किया गया। अध्ययन ने उन क्षेत्रों की पहचान की जहां मॉडल्स का प्रभाव खासा है (खासकर वित्तीय क्षेत्र) और उन क्षेत्रों को भी जहाँ मौजूदा गार्डरिल्ज़ गलत सलाह को प्रभावी ढंग से रोकते हैं (चिकित्सा क्षेत्र)।
Google DeepMind ने AI मैनिपुलेशन को मापने के लिए एक टूलकिट विकसित किया — अपने तरह का पहला और एम्पिरिकली मान्य — ताकि यह मापा जा सके कि मैनिपुलेशन कैसे हो सकती है। अध्ययन ने जोखिमपूर्ण रणनीतियाँ भी पहचानीं, जैसे कि डर का लाभ उठाना।
“We’ve built an empirically validated, first-of-its-kind toolkit to measure AI manipulation in the real world — to better understand how it can occur and help protect people.”
🇮🇳 हमने वास्तविक दुनिया में AI द्वारा होने वाली मैनिपुलेशन को मापने के लिए एक टूलकिट विकसित किया है, जिसे अनुभवात्मक रूप से मान्य किया गया है और जो अपने तरह का पहला है — ताकि यह बेहतर तरीके से समझा जा सके कि यह कैसे हो सकती है और उपयोगकर्ताओं की सुरक्षा की जा सके। — @GoogleDeepMind पर X
Google Translate Live — iOS पर रीयलटाइम अनुवाद
27 मार्च — Google ने Google Translate Live को iOS पर हेडफ़ोन के साथ बढ़ाया, और अधिक देशों में डिप्लॉयमेंट जारी है। यह फीचर, जो पहले केवल Android पर उपलब्ध था, ब्लूटूथ या वायर्ड हेडफ़ोन के माध्यम से 70+ भाषाओं में रीयल-टाइम अनुवाद की अनुमति देता है।
MedGemma Impact Challenge — चार विजेताओं, 850+ टीमें
26 मार्च — Google ने MedGemma Impact Challenge के विजेताओं की घोषणा की, एक प्रतियोगिता जिसने MedGemma 1.5 (Google का ओपन मेडिकल मॉडल) के साथ हेल्थ ऐप्स बनाने के लिए 850+ टीमों को जुटाया।
प्रमुख विजेताओं :
| Rang | Projet | Description |
|---|---|---|
| 1er | EpiCast | CEDEAO देशों के लिए महामारी निगरानी — क्लिनिकल ऑब्ज़र्वेशंस को WHO के मानक IDSR सिग्नल्स में ट्रांसलेट करता है |
| 2e | Sunny | मोबाइल के जरिए स्किन कैंसर के लक्षणों का पता लगाना, संरचित रिपोर्टें और प्राइवेसी प्रिज़र्विंग |
| 3e | FieldScreen AI | ऑफ़लाइन TB स्क्रीनिंग: चेस्ट X-ray और खांसने की ऑडियो का विश्लेषण |
| 4e | Tracer | मेडिकल एरर्स रोकने के लिए: डॉक्टर्स के नोट्स से हाइपोथेसिस निकालकर टेस्ट रिज़ल्ट्स से मिलान करता है |
Edge AI और agentic workflow प्रोजेक्ट्स के लिए स्पेशल अवॉर्ड भी दिए गए, जिनमें ClinicDX शामिल है (OpenMRS में शामिल डायग्नोस्टिक्स अफ्रीका सब-सहारा के लिए, 160+ WHO/MSF गाइड्स, पूरी तरह ऑफ़लाइन)।
🔗 MedGemma Impact Challenge ब्लॉग
Runway — Ad Concepter App और $100,000 प्रतियोगिता
27 मार्च — Runway ने Ad Concepter App लॉन्च किया, एक AI-आधारित एड क्रिएशन टूल। एक प्रॉम्प्ट, एक संदर्भ छवि और एक प्रोडक्ट विसुअल से यह ऐप कॉन्सेप्ट्स, कंपोज़िशन्स और विज्ञापनों के लिए स्टोरी बीट्स जेनरेट करता है। यह टूल वेब ऐप पर तुरंत उपलब्ध है।
Runway ने साथ ही Big Ad Contest (#RunwayBigAdContest) भी लॉन्च किया, जिसमें टूल के उपयोग को बढ़ावा देने के लिए $100,000 तक के पुरस्कार हैं।
Pika — सार्वजनिक बीटा में AI Selves
26 मार्च — Pika ने सार्वजनिक बीटा में Pika AI Selves खोल दिया। फरवरी में घोषित यह फीचर प्रत्येक उपयोगकर्ता को अपना एजेंटिक एक्सटेंशन बनाने की अनुमति देता है — एक “AI Self” जिसमें पर्सिस्टेंट मेमोरी होती है (जैसे फ़ूड एलर्जी जैसे निजी विवरण), जो ग्रुप चैट्स में स्वायत्त रूप से कार्य कर सकता है, वीडियो गेम बना सकता है या फोटो भेज सकता है।
एक्सेस pika.me (वेब) और नई iOS ऐप के माध्यम से सार्वभौमिक है। Pika इस फीचर को केवल वीडियो जेनरेशन से आगे रखते हुए व्यक्तिगत AI एजेंट्स के साथ प्रतिस्पर्धा में उतर रहा है।
ब्रेविस
Awesome GitHub Copilot — 27 मार्च — कम्युनिटी प्रोजेक्ट “Awesome GitHub Copilot” एक नए समर्पित साइट awesome-copilot.github.com पर माइग्रेट कर रहा है जिसमें फुल-टेक्स्ट सर्च, Learning Hub और Copilot CLI और VS Code के लिए वन-क्लिक इंस्टॉलेशन है। 🔗 GitHub ट्वीट
NotebookLM पुश नोटिफिकेशन्स — 27 मार्च — NotebookLM अब लंबी जेनरेशन के दौरान पेज छोड़ने और जेनरेशन खत्म होने पर मोबाइल पुश नोटिफिकेशन प्राप्त करने की अनुमति देता है। 🔗 NotebookLM ट्वीट
इसका क्या मतलब है
Luma Uni-1 विज़ुअल जेनरेशन में एक पैराबाइम शिफ्ट का संकेत देता है: पिक्सल के सांख्यिकीय मिलान को ऑप्टिमाइज़ करने के बजाय मॉडल निर्माण के दौरान ही स्पेटियल रीज़निंग को समाहित करता है। यदि यह व्यवहारिक रूप से काम करता है, तो यह क्रिएटिव टूल्स के लिए सीन की संगति और जटिल निर्देशों को संभालने के तरीके को बदल सकता है।
Perplexity × Samsung का डिप्लॉयमेंट इस सप्ताह का शायद सबसे व्यावहारिक प्रभाव वाला ऐलान है: एक अरब उपकरणों पर पहुंच Perplexity की सर्च और रीज़निंग क्षमताओं के लिए एक विशाल वितरण है। यह इस बात की भी पुष्टि है कि विशेषीकृत AI APIs (सर्च, रीज़निंग, मल्टी-टैब ऑर्केस्ट्रेशन) अब हार्डवेयर निर्माताओं के लिए इन्फ्रास्ट्रक्चर घटक बन चुके हैं।
डेवलपर टूल्स की तरफ़, Claude Code v2.1.86 और GitHub Copilot CLI दो अलग-अलग दिशाओं में आगे बढ़ रहे हैं: Claude Code विश्वसनीयता को मजबूत कर रहा है (लंबी सत्रों, MCPs, कम आम VCS के लिए फिक्स), जबकि Copilot CLI एजेंटिक ऑटोमेशन की ओर बढ़ रहा है (एजेंट फ्लीट के जरिए टेस्ट जेनरेशन)। ये दोनों विकास डेवलपर असिस्टेंट्स की परिपक्वता को दर्शाते हैं जो अब ऑटोकम्प्लीशन से आगे बढ़ रहे हैं।
स्रोत
- Luma AI Uni-1 — ट्वीट घोषणा
- Perplexity APIs + Samsung Browsing Assist — आधिकारिक ब्लॉग
- Perplexity × Samsung — ट्वीट
- Claude Code Changelog
- GitHub Copilot CLI — यूनिट टेस्ट — ट्वीट
- OpenAI gpt-realtime-1.5 — @OpenAIDevs ट्वीट
- Realtime API डॉक्स OpenAI
- Google DeepMind — AI मैनिपुलेशन टूलकिट — ट्वीट
- Google Translate Live iOS — @GoogleAI ट्वीट
- MedGemma Impact Challenge — Google ब्लॉग
- Runway Ad Concepter — ट्वीट
- Pika AI Selves बीटा — ट्वीट
- Awesome GitHub Copilot — ट्वीट
यह दस्तावेज़ fr संस्करण से hi भाषा में gpt-5-mini मॉडल का उपयोग करके अनुवादित किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए देखें https://gitlab.com/jls42/ai-powered-markdown-translator