Luma Uni-1 पिक्सल सोचता और उत्पन्न करता है, Perplexity Samsung के 1 अरब+ उपकरणों पर, Claude Code v2.1.86

Luma AI ने Uni-1 लॉन्च किया — एक ऐसा मॉडल जो एक ही पास में सोचने और पिक्सल जेनरेट करने को जोड़ता है — और कुछ ही दिनों में इसे 6.1 मिलियन व्यूज मिले। इसी दौरान, Perplexity ने अपनी API सेवाएँ Samsung Browsing Assist में 1 अरब से अधिक डिवाइसेज़ पर तैनात कीं, Claude Code v2.1.86 लगभग पंद्रह बड़े फिक्स के साथ आया, और GitHub Copilot CLI ने एजेंट्स द्वारा ऑटोपायलट में यूनिट टेस्ट जेनरेशन पेश किया।

Luma Uni-1 — एकीकृत दृश्य तर्क और पिक्सल जेनरेशन

23 मार्च — Luma AI ने Uni-1 की घोषणा की, जिसे वह “एक नया प्रकार का मॉडल जो एक साथ सोचता है और पिक्सल उत्पन्न करता है” के रूप में वर्णित कर रहा है। पारंपरिक diffusion मॉडल्स जो पहले एक latent प्रतिनिधित्व बनाते हैं और फिर उसे डिकोड करते हैं, उनसे अलग Uni-1 तर्क (reasoning) और जेनरेशन को एक ही प्रक्रिया में मिला देता है।

घोषणा ने ध्यान खींचा और कुछ ही दिनों में 6.1 मिलियन व्यूज, 4,000 लाइक्स और एक हज़ार से अधिक रीशेयर हुए — जो इमेज जेनरेशन की तकनीकी घोषणा के लिए असाधारण आँकड़े हैं।

आर्किटेक्चर और पोजिशनिंग :

Capacité	Description
Raisonnement spatial	परिप्रेक्ष्य और ओक्लूज़न की संगति के साथ दृश्यों को समझता और पूरा करता है
Raisonnement de bon sens	जेनरेशन को मार्गदर्शित करने के लिए दृश्य के इरादे का अनुमान लगाता है
Transformation guidée	केवल पिक्सल मिलान नहीं, बल्कि भौतिक संभाव्यता द्वारा निर्देशित मॉडिफिकेशन
Intelligence unifiée	एक ही पास में समझना, निर्देश और जेनरेशन (एकीकृत पास)

Luma Uni-1 को “Less artificial. More intelligent.” के नारे के साथ पोजिशन करता है — यह संकेत देता है कि यह विज़ुअल पैटर्न-आधारित सांख्यिकीय मिलान पर आधारित जेनरेटर से अलग है। मॉडल को Luma के भविष्य के “Creative Agents” का आधार बताया जा रहा है, संभवतः अगली पीढ़ी की Dream Machine का इंजन।

Uni-1 तुरंत lumalabs.ai/app पर उपलब्ध है।

“A new kind of model that thinks and generates pixels at the same time.”

🇮🇳 एक नया प्रकार का मॉडल जो एक साथ सोचता है और पिक्सल उत्पन्न करता है। — @LumaLabsAI पर X

🔗 Luma Uni-1 घोषणा

Perplexity Samsung Browsing Assist को 1 अरब उपकरणों पर संचालित कर रहा है

26 मार्च — Samsung ने Browsing Assist लॉन्च किया, एक नाटिवली इंटीग्रेटेड कन्वर्सेशनल AI असिस्टेंट जो Samsung Browser में Galaxy Android उपकरणों और Windows PC पर काम करता है। इस फीचर के पीछे Perplexity की API हैं, जो दुनिया भर में 1 अरब से अधिक Samsung उपकरणों पर तैनात की गयी हैं।

यह लॉन्च पहले से मौजूद साझेदारी को मजबूत करता है: Perplexity Galaxy S26 के तीन में से दो इन-बिल्ट असिस्टेंट्स को पावर देता है — नाटिव Perplexity असिस्टेंट और Bixby, जो वेब सर्च और रीज़निंग के लिए Perplexity API का उपयोग करता है। Browsing Assist के साथ, Perplexity सिर्फ एक कन्वर्सेशनल असिस्टेंट नहीं बल्कि ब्राउज़र की AI परत बन जाता है।

Browsing Assist की क्षमताएँ :

Fonctionnalité	Description
Réponses sourcées	ब्राउज़िंग के दौरान रीयल-टाइम में स्रोत-सहित उत्तर
Résumé de pages	प्रमाणीकृत सामग्री सहित (लॉगिन के पीछे पेज) के सार
Recherche dans l’historique	नेचुरल लैंग्वेज में इतिहास में खोज
Gestion conversationnelle	वॉइस या टेक्स्ट से टैब खोलना, बंद करना, नेविगेट करना
Actions multi-onglets	खुले कई टैब्स पर एक साथ ऑपरेशन करना
Synchronisation téléphone → PC	मोबाइल पर शुरू की गई बातचीत को PC पर जारी रखना

Infrastructure : Browsing Assist एक समर्पित Perplexity क्लस्टर पर single-tenant मोड में चलता है, और सभी API एंट्रीज़ पर कोई डेटा रिटेंशन नहीं है। एंडपॉइंट को Samsung की आवश्यक गति और स्केल के अनुसार कस्टम डिज़ाइन किया गया है।

Perplexity नोट करती है कि Samsung में तैनात क्षमताएँ — खोज, तर्क, मल्टी-टैब ऑर्केस्ट्रेशन — ठीक वही हैं जिन पर उसका ब्राउज़र Comet बना है। यह तैनाती Perplexity की टेक्निकल स्टैक के बड़े पैमाने पर मान्य होने का संकेत है।

उपलब्धता : लॉन्च पर अमेरिका और दक्षिण कोरिया; अन्य क्षेत्रों में बाद में उपलब्ध होगा। डेवलपर्स के लिए वही क्षमताएँ Perplexity की Search API, Embeddings API और Agent API के माध्यम से उपलब्ध हैं।

🔗 Perplexity आधिकारिक ब्लॉग

Claude Code v2.1.86 — प्रमुख फिक्स और VCS Jujutsu/Sapling सपोर्ट

27 मार्च — Anthropic ने Claude Code v2.1.86 जारी किया, एक ऐसा रिलीज़ जिसमें बग फिक्स का भारी समुच्चय है। अपडेट में लगभग पंद्रह बग फिक्स और कई प्रदर्शन सुधार शामिल हैं।

मुख्य सुधार :

Catégorie	Changement
API	Header `X-Claude-Code-Session-Id` ताकि प्रॉक्सी साइड पर सत्र के अनुसार रिक्वेस्ट्स को एग्रीगेट किया जा सके
VCS	Grep और ऑटोकम्प्लीशन में `.jj` (Jujutsu) और `.sl` (Sapling) को बाहर रखा गया
Cache MCP	macOS keychain cache के लिए स्टार्ट-अप डिले 5s से 30s कर दिया गया
Performances	Bedrock, Vertex और Foundry पर cache हिट रेट में सुधार
Tokens	उल्लेखों पर overhead घटाया गया `@fichier` (रॉ कंटेंट का JSON-escape नहीं किया जाएगा)
UX mémoire	”Saved N memories” नोटिस में क्लिक करने योग्य मेमोरी फाइल नाम
Skills	विवरण 250 कैरेक्टर तक सीमित; `/skills` मेन्यू वर्णानुक्रम में सॉर्ट
Read tool	लाइन नंबरों का कॉम्पैक्ट फॉर्मेट, समान रीड्स की डेडुप्लिकेशन

ध्यान देने योग्य बग फिक्स: --resume v2.1.85 से पहले बनाई गई सत्रों पर फेल हो रहा था; स्किल्स पर निर्भर फाइलों के लिए Write/Edit/Read रूट-आउटसाइड फोल्डर पर फेल हो रहा था; /feedback के साथ लंबे सत्रों पर संभावित मेमोरी क्रैश; --bare मोड MCP टूल्स खो रहा था; OAuth URL कॉपी शॉर्टकट ~20 कैरेक्टर ही कॉपी कर रहा था ना कि पूरी URL; आधिकारिक मार्केटप्लेस प्लगइन्स के स्क्रिप्ट्स macOS/Linux पर v2.1.83 के बाद “Permission denied” के साथ फेल हो रहे थे।

🔗 Claude Code Changelog

GitHub Copilot CLI — एजेंट्स द्वारा ऑटोपायलट में यूनिट टेस्ट जेनरेशन

28 मार्च — GitHub ने Copilot CLI की एक नई क्षमता की घोषणा की: टर्मिनल से सीधे पूरी यूनिट टेस्ट सूट अपने आप जेनरेट करना, plan mode को एजेंट्स की एक फ्लीट के साथ ऑटोपायलट में मिलाकर।

वर्कफ़्लो :

टर्मिनल में Shift-Tab के साथ plan मोड एक्टिव करें
ऑटोपायलट मोड में एजेंट्स की एक फ्लीट लॉन्च करें
प्रोग्रेस को /tasks कमांड से ट्रैक करें

जेनरेशन कई एजेंट्स के बीच पैरेललाइज़ की जाती है, जिससे कई मॉड्यूल एक साथ कवर किए जा सकते हैं। मुख्य उपयोग का मामला मौजूदा प्रोजेक्ट्स हैं जिनमें टेस्ट कवरेज नहीं है — Copilot CLI बिना टर्मिनल से बाहर निकले एक पूरी टेस्ट सूट जेनरेट कर सकता है।

🔗 GitHub Copilot CLI ट्वीट

OpenAI — gpt-realtime-1.5 और gpt-realtime-mini सामान्य उपलब्धता में

27 मार्च — OpenAI ने Realtime API के जरिए नए रीयलटाइम मॉडल्स की General Availability की घोषणा की। मॉडल डॉक्यूमेंटेशन अब सूचीबद्ध करता है :

Modèle	Positionnement
`gpt-realtime-1.5`	द्वि-दिशात्मक ऑडियो इंटरैक्शन्स के लिए बेस्ट वॉइस मॉडल
`gpt-realtime-mini`	रीयलटाइम मॉडल का किफायती संस्करण

ये मॉडल्स पहले का बेता नाम gpt-4o-realtime-preview बदलते हैं। Realtime API WebRTC, WebSocket या SIP के माध्यम से इनपुट और आउटपुट ऑडियो के साथ रीयल-टाइम द्वि-दिशात्मक वॉयस इंटरैक्शन की अनुमति देती है। @OpenAIDevs द्वारा प्रस्तुत डेमो सिंगापुर की एक क्लिनिक के लिए एक कंसियर्ज़ मेडिकल असिस्टेंट दिखाती है, जो जानकारी इकट्ठा कर सकता है और स्वाभाविक तरीके से अपॉइंटमेंट बुक कर सकता है।

🔗 @OpenAIDevs ट्वीट

Google DeepMind — AI मैनिपुलेशन मेज़रमेंट टूलकिट

26 मार्च — Google DeepMind ने AI द्वारा किए गए मैनिपुलेशन पर एक बड़े पैमाने की एम्पिरिकल स्टडी के नतीजे प्रकाशित किए, जिसमें 10,000 लोगों को शामिल किया गया। अध्ययन ने उन क्षेत्रों की पहचान की जहां मॉडल्स का प्रभाव खासा है (खासकर वित्तीय क्षेत्र) और उन क्षेत्रों को भी जहाँ मौजूदा गार्डरिल्ज़ गलत सलाह को प्रभावी ढंग से रोकते हैं (चिकित्सा क्षेत्र)।

Google DeepMind ने AI मैनिपुलेशन को मापने के लिए एक टूलकिट विकसित किया — अपने तरह का पहला और एम्पिरिकली मान्य — ताकि यह मापा जा सके कि मैनिपुलेशन कैसे हो सकती है। अध्ययन ने जोखिमपूर्ण रणनीतियाँ भी पहचानीं, जैसे कि डर का लाभ उठाना।

“We’ve built an empirically validated, first-of-its-kind toolkit to measure AI manipulation in the real world — to better understand how it can occur and help protect people.”

🇮🇳 हमने वास्तविक दुनिया में AI द्वारा होने वाली मैनिपुलेशन को मापने के लिए एक टूलकिट विकसित किया है, जिसे अनुभवात्मक रूप से मान्य किया गया है और जो अपने तरह का पहला है — ताकि यह बेहतर तरीके से समझा जा सके कि यह कैसे हो सकती है और उपयोगकर्ताओं की सुरक्षा की जा सके। — @GoogleDeepMind पर X

🔗 Google DeepMind ट्वीट

Google Translate Live — iOS पर रीयलटाइम अनुवाद

27 मार्च — Google ने Google Translate Live को iOS पर हेडफ़ोन के साथ बढ़ाया, और अधिक देशों में डिप्लॉयमेंट जारी है। यह फीचर, जो पहले केवल Android पर उपलब्ध था, ब्लूटूथ या वायर्ड हेडफ़ोन के माध्यम से 70+ भाषाओं में रीयल-टाइम अनुवाद की अनुमति देता है।

🔗 @GoogleAI ट्वीट

MedGemma Impact Challenge — चार विजेताओं, 850+ टीमें

26 मार्च — Google ने MedGemma Impact Challenge के विजेताओं की घोषणा की, एक प्रतियोगिता जिसने MedGemma 1.5 (Google का ओपन मेडिकल मॉडल) के साथ हेल्थ ऐप्स बनाने के लिए 850+ टीमों को जुटाया।

प्रमुख विजेताओं :

Rang	Projet	Description
1er	EpiCast	CEDEAO देशों के लिए महामारी निगरानी — क्लिनिकल ऑब्ज़र्वेशंस को WHO के मानक IDSR सिग्नल्स में ट्रांसलेट करता है
2e	Sunny	मोबाइल के जरिए स्किन कैंसर के लक्षणों का पता लगाना, संरचित रिपोर्टें और प्राइवेसी प्रिज़र्विंग
3e	FieldScreen AI	ऑफ़लाइन TB स्क्रीनिंग: चेस्ट X-ray और खांसने की ऑडियो का विश्लेषण
4e	Tracer	मेडिकल एरर्स रोकने के लिए: डॉक्टर्स के नोट्स से हाइपोथेसिस निकालकर टेस्ट रिज़ल्ट्स से मिलान करता है

Edge AI और agentic workflow प्रोजेक्ट्स के लिए स्पेशल अवॉर्ड भी दिए गए, जिनमें ClinicDX शामिल है (OpenMRS में शामिल डायग्नोस्टिक्स अफ्रीका सब-सहारा के लिए, 160+ WHO/MSF गाइड्स, पूरी तरह ऑफ़लाइन)।

🔗 MedGemma Impact Challenge ब्लॉग

Runway — Ad Concepter App और $100,000 प्रतियोगिता

27 मार्च — Runway ने Ad Concepter App लॉन्च किया, एक AI-आधारित एड क्रिएशन टूल। एक प्रॉम्प्ट, एक संदर्भ छवि और एक प्रोडक्ट विसुअल से यह ऐप कॉन्सेप्ट्स, कंपोज़िशन्स और विज्ञापनों के लिए स्टोरी बीट्स जेनरेट करता है। यह टूल वेब ऐप पर तुरंत उपलब्ध है।

Runway ने साथ ही Big Ad Contest (#RunwayBigAdContest) भी लॉन्च किया, जिसमें टूल के उपयोग को बढ़ावा देने के लिए $100,000 तक के पुरस्कार हैं।

🔗 Runway ट्वीट

Pika — सार्वजनिक बीटा में AI Selves

26 मार्च — Pika ने सार्वजनिक बीटा में Pika AI Selves खोल दिया। फरवरी में घोषित यह फीचर प्रत्येक उपयोगकर्ता को अपना एजेंटिक एक्सटेंशन बनाने की अनुमति देता है — एक “AI Self” जिसमें पर्सिस्टेंट मेमोरी होती है (जैसे फ़ूड एलर्जी जैसे निजी विवरण), जो ग्रुप चैट्स में स्वायत्त रूप से कार्य कर सकता है, वीडियो गेम बना सकता है या फोटो भेज सकता है।

एक्सेस pika.me (वेब) और नई iOS ऐप के माध्यम से सार्वभौमिक है। Pika इस फीचर को केवल वीडियो जेनरेशन से आगे रखते हुए व्यक्तिगत AI एजेंट्स के साथ प्रतिस्पर्धा में उतर रहा है।

🔗 Pika Labs ट्वीट

ब्रेविस

Awesome GitHub Copilot — 27 मार्च — कम्युनिटी प्रोजेक्ट “Awesome GitHub Copilot” एक नए समर्पित साइट awesome-copilot.github.com पर माइग्रेट कर रहा है जिसमें फुल-टेक्स्ट सर्च, Learning Hub और Copilot CLI और VS Code के लिए वन-क्लिक इंस्टॉलेशन है। 🔗 GitHub ट्वीट

NotebookLM पुश नोटिफिकेशन्स — 27 मार्च — NotebookLM अब लंबी जेनरेशन के दौरान पेज छोड़ने और जेनरेशन खत्म होने पर मोबाइल पुश नोटिफिकेशन प्राप्त करने की अनुमति देता है। 🔗 NotebookLM ट्वीट

इसका क्या मतलब है

Luma Uni-1 विज़ुअल जेनरेशन में एक पैराबाइम शिफ्ट का संकेत देता है: पिक्सल के सांख्यिकीय मिलान को ऑप्टिमाइज़ करने के बजाय मॉडल निर्माण के दौरान ही स्पेटियल रीज़निंग को समाहित करता है। यदि यह व्यवहारिक रूप से काम करता है, तो यह क्रिएटिव टूल्स के लिए सीन की संगति और जटिल निर्देशों को संभालने के तरीके को बदल सकता है।

Perplexity × Samsung का डिप्लॉयमेंट इस सप्ताह का शायद सबसे व्यावहारिक प्रभाव वाला ऐलान है: एक अरब उपकरणों पर पहुंच Perplexity की सर्च और रीज़निंग क्षमताओं के लिए एक विशाल वितरण है। यह इस बात की भी पुष्टि है कि विशेषीकृत AI APIs (सर्च, रीज़निंग, मल्टी-टैब ऑर्केस्ट्रेशन) अब हार्डवेयर निर्माताओं के लिए इन्फ्रास्ट्रक्चर घटक बन चुके हैं।

डेवलपर टूल्स की तरफ़, Claude Code v2.1.86 और GitHub Copilot CLI दो अलग-अलग दिशाओं में आगे बढ़ रहे हैं: Claude Code विश्वसनीयता को मजबूत कर रहा है (लंबी सत्रों, MCPs, कम आम VCS के लिए फिक्स), जबकि Copilot CLI एजेंटिक ऑटोमेशन की ओर बढ़ रहा है (एजेंट फ्लीट के जरिए टेस्ट जेनरेशन)। ये दोनों विकास डेवलपर असिस्टेंट्स की परिपक्वता को दर्शाते हैं जो अब ऑटोकम्प्लीशन से आगे बढ़ रहे हैं।

स्रोत

यह दस्तावेज़ fr संस्करण से hi भाषा में gpt-5-mini मॉडल का उपयोग करके अनुवादित किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए देखें https://gitlab.com/jls42/ai-powered-markdown-translator