खोजें

Luma Uni-1 पिक्सल सोचता और उत्पन्न करता है, Perplexity Samsung के 1 अरब+ उपकरणों पर, Claude Code v2.1.86

Luma Uni-1 पिक्सल सोचता और उत्पन्न करता है, Perplexity Samsung के 1 अरब+ उपकरणों पर, Claude Code v2.1.86

Luma AI ने Uni-1 लॉन्च किया — एक ऐसा मॉडल जो एक ही पास में सोचने और पिक्सल जेनरेट करने को जोड़ता है — और कुछ ही दिनों में इसे 6.1 मिलियन व्यूज मिले। इसी दौरान, Perplexity ने अपनी API सेवाएँ Samsung Browsing Assist में 1 अरब से अधिक डिवाइसेज़ पर तैनात कीं, Claude Code v2.1.86 लगभग पंद्रह बड़े फिक्स के साथ आया, और GitHub Copilot CLI ने एजेंट्स द्वारा ऑटोपायलट में यूनिट टेस्ट जेनरेशन पेश किया।


Luma Uni-1 — एकीकृत दृश्य तर्क और पिक्सल जेनरेशन

23 मार्च — Luma AI ने Uni-1 की घोषणा की, जिसे वह “एक नया प्रकार का मॉडल जो एक साथ सोचता है और पिक्सल उत्पन्न करता है” के रूप में वर्णित कर रहा है। पारंपरिक diffusion मॉडल्स जो पहले एक latent प्रतिनिधित्व बनाते हैं और फिर उसे डिकोड करते हैं, उनसे अलग Uni-1 तर्क (reasoning) और जेनरेशन को एक ही प्रक्रिया में मिला देता है।

घोषणा ने ध्यान खींचा और कुछ ही दिनों में 6.1 मिलियन व्यूज, 4,000 लाइक्स और एक हज़ार से अधिक रीशेयर हुए — जो इमेज जेनरेशन की तकनीकी घोषणा के लिए असाधारण आँकड़े हैं।

आर्किटेक्चर और पोजिशनिंग :

CapacitéDescription
Raisonnement spatialपरिप्रेक्ष्य और ओक्लूज़न की संगति के साथ दृश्यों को समझता और पूरा करता है
Raisonnement de bon sensजेनरेशन को मार्गदर्शित करने के लिए दृश्य के इरादे का अनुमान लगाता है
Transformation guidéeकेवल पिक्सल मिलान नहीं, बल्कि भौतिक संभाव्यता द्वारा निर्देशित मॉडिफिकेशन
Intelligence unifiéeएक ही पास में समझना, निर्देश और जेनरेशन (एकीकृत पास)

Luma Uni-1 को “Less artificial. More intelligent.” के नारे के साथ पोजिशन करता है — यह संकेत देता है कि यह विज़ुअल पैटर्न-आधारित सांख्यिकीय मिलान पर आधारित जेनरेटर से अलग है। मॉडल को Luma के भविष्य के “Creative Agents” का आधार बताया जा रहा है, संभवतः अगली पीढ़ी की Dream Machine का इंजन।

Uni-1 तुरंत lumalabs.ai/app पर उपलब्ध है।

“A new kind of model that thinks and generates pixels at the same time.”

🇮🇳 एक नया प्रकार का मॉडल जो एक साथ सोचता है और पिक्सल उत्पन्न करता है।@LumaLabsAI पर X

🔗 Luma Uni-1 घोषणा


Perplexity Samsung Browsing Assist को 1 अरब उपकरणों पर संचालित कर रहा है

26 मार्च — Samsung ने Browsing Assist लॉन्च किया, एक नाटिवली इंटीग्रेटेड कन्वर्सेशनल AI असिस्टेंट जो Samsung Browser में Galaxy Android उपकरणों और Windows PC पर काम करता है। इस फीचर के पीछे Perplexity की API हैं, जो दुनिया भर में 1 अरब से अधिक Samsung उपकरणों पर तैनात की गयी हैं।

यह लॉन्च पहले से मौजूद साझेदारी को मजबूत करता है: Perplexity Galaxy S26 के तीन में से दो इन-बिल्ट असिस्टेंट्स को पावर देता है — नाटिव Perplexity असिस्टेंट और Bixby, जो वेब सर्च और रीज़निंग के लिए Perplexity API का उपयोग करता है। Browsing Assist के साथ, Perplexity सिर्फ एक कन्वर्सेशनल असिस्टेंट नहीं बल्कि ब्राउज़र की AI परत बन जाता है।

Browsing Assist की क्षमताएँ :

FonctionnalitéDescription
Réponses sourcéesब्राउज़िंग के दौरान रीयल-टाइम में स्रोत-सहित उत्तर
Résumé de pagesप्रमाणीकृत सामग्री सहित (लॉगिन के पीछे पेज) के सार
Recherche dans l’historiqueनेचुरल लैंग्वेज में इतिहास में खोज
Gestion conversationnelleवॉइस या टेक्स्ट से टैब खोलना, बंद करना, नेविगेट करना
Actions multi-ongletsखुले कई टैब्स पर एक साथ ऑपरेशन करना
Synchronisation téléphone → PCमोबाइल पर शुरू की गई बातचीत को PC पर जारी रखना

Infrastructure : Browsing Assist एक समर्पित Perplexity क्लस्टर पर single-tenant मोड में चलता है, और सभी API एंट्रीज़ पर कोई डेटा रिटेंशन नहीं है। एंडपॉइंट को Samsung की आवश्यक गति और स्केल के अनुसार कस्टम डिज़ाइन किया गया है।

Perplexity नोट करती है कि Samsung में तैनात क्षमताएँ — खोज, तर्क, मल्टी-टैब ऑर्केस्ट्रेशन — ठीक वही हैं जिन पर उसका ब्राउज़र Comet बना है। यह तैनाती Perplexity की टेक्निकल स्टैक के बड़े पैमाने पर मान्य होने का संकेत है।

उपलब्धता : लॉन्च पर अमेरिका और दक्षिण कोरिया; अन्य क्षेत्रों में बाद में उपलब्ध होगा। डेवलपर्स के लिए वही क्षमताएँ Perplexity की Search API, Embeddings API और Agent API के माध्यम से उपलब्ध हैं।

🔗 Perplexity आधिकारिक ब्लॉग


Claude Code v2.1.86 — प्रमुख फिक्स और VCS Jujutsu/Sapling सपोर्ट

27 मार्च — Anthropic ने Claude Code v2.1.86 जारी किया, एक ऐसा रिलीज़ जिसमें बग फिक्स का भारी समुच्चय है। अपडेट में लगभग पंद्रह बग फिक्स और कई प्रदर्शन सुधार शामिल हैं।

मुख्य सुधार :

CatégorieChangement
APIHeader X-Claude-Code-Session-Id ताकि प्रॉक्सी साइड पर सत्र के अनुसार रिक्वेस्ट्स को एग्रीगेट किया जा सके
VCSGrep और ऑटोकम्प्लीशन में .jj (Jujutsu) और .sl (Sapling) को बाहर रखा गया
Cache MCPmacOS keychain cache के लिए स्टार्ट-अप डिले 5s से 30s कर दिया गया
PerformancesBedrock, Vertex और Foundry पर cache हिट रेट में सुधार
Tokensउल्लेखों पर overhead घटाया गया @fichier (रॉ कंटेंट का JSON-escape नहीं किया जाएगा)
UX mémoire”Saved N memories” नोटिस में क्लिक करने योग्य मेमोरी फाइल नाम
Skillsविवरण 250 कैरेक्टर तक सीमित; /skills मेन्यू वर्णानुक्रम में सॉर्ट
Read toolलाइन नंबरों का कॉम्पैक्ट फॉर्मेट, समान रीड्स की डेडुप्लिकेशन

ध्यान देने योग्य बग फिक्स: --resume v2.1.85 से पहले बनाई गई सत्रों पर फेल हो रहा था; स्किल्स पर निर्भर फाइलों के लिए Write/Edit/Read रूट-आउटसाइड फोल्डर पर फेल हो रहा था; /feedback के साथ लंबे सत्रों पर संभावित मेमोरी क्रैश; --bare मोड MCP टूल्स खो रहा था; OAuth URL कॉपी शॉर्टकट ~20 कैरेक्टर ही कॉपी कर रहा था ना कि पूरी URL; आधिकारिक मार्केटप्लेस प्लगइन्स के स्क्रिप्ट्स macOS/Linux पर v2.1.83 के बाद “Permission denied” के साथ फेल हो रहे थे।

🔗 Claude Code Changelog


GitHub Copilot CLI — एजेंट्स द्वारा ऑटोपायलट में यूनिट टेस्ट जेनरेशन

28 मार्च — GitHub ने Copilot CLI की एक नई क्षमता की घोषणा की: टर्मिनल से सीधे पूरी यूनिट टेस्ट सूट अपने आप जेनरेट करना, plan mode को एजेंट्स की एक फ्लीट के साथ ऑटोपायलट में मिलाकर।

वर्कफ़्लो :

  1. टर्मिनल में Shift-Tab के साथ plan मोड एक्टिव करें
  2. ऑटोपायलट मोड में एजेंट्स की एक फ्लीट लॉन्च करें
  3. प्रोग्रेस को /tasks कमांड से ट्रैक करें

जेनरेशन कई एजेंट्स के बीच पैरेललाइज़ की जाती है, जिससे कई मॉड्यूल एक साथ कवर किए जा सकते हैं। मुख्य उपयोग का मामला मौजूदा प्रोजेक्ट्स हैं जिनमें टेस्ट कवरेज नहीं है — Copilot CLI बिना टर्मिनल से बाहर निकले एक पूरी टेस्ट सूट जेनरेट कर सकता है।

🔗 GitHub Copilot CLI ट्वीट


OpenAI — gpt-realtime-1.5 और gpt-realtime-mini सामान्य उपलब्धता में

27 मार्च — OpenAI ने Realtime API के जरिए नए रीयलटाइम मॉडल्स की General Availability की घोषणा की। मॉडल डॉक्यूमेंटेशन अब सूचीबद्ध करता है :

ModèlePositionnement
gpt-realtime-1.5द्वि-दिशात्मक ऑडियो इंटरैक्शन्स के लिए बेस्ट वॉइस मॉडल
gpt-realtime-miniरीयलटाइम मॉडल का किफायती संस्करण

ये मॉडल्स पहले का बेता नाम gpt-4o-realtime-preview बदलते हैं। Realtime API WebRTC, WebSocket या SIP के माध्यम से इनपुट और आउटपुट ऑडियो के साथ रीयल-टाइम द्वि-दिशात्मक वॉयस इंटरैक्शन की अनुमति देती है। @OpenAIDevs द्वारा प्रस्तुत डेमो सिंगापुर की एक क्लिनिक के लिए एक कंसियर्ज़ मेडिकल असिस्टेंट दिखाती है, जो जानकारी इकट्ठा कर सकता है और स्वाभाविक तरीके से अपॉइंटमेंट बुक कर सकता है।

🔗 @OpenAIDevs ट्वीट


Google DeepMind — AI मैनिपुलेशन मेज़रमेंट टूलकिट

26 मार्च — Google DeepMind ने AI द्वारा किए गए मैनिपुलेशन पर एक बड़े पैमाने की एम्पिरिकल स्टडी के नतीजे प्रकाशित किए, जिसमें 10,000 लोगों को शामिल किया गया। अध्ययन ने उन क्षेत्रों की पहचान की जहां मॉडल्स का प्रभाव खासा है (खासकर वित्तीय क्षेत्र) और उन क्षेत्रों को भी जहाँ मौजूदा गार्डरिल्ज़ गलत सलाह को प्रभावी ढंग से रोकते हैं (चिकित्सा क्षेत्र)।

Google DeepMind ने AI मैनिपुलेशन को मापने के लिए एक टूलकिट विकसित किया — अपने तरह का पहला और एम्पिरिकली मान्य — ताकि यह मापा जा सके कि मैनिपुलेशन कैसे हो सकती है। अध्ययन ने जोखिमपूर्ण रणनीतियाँ भी पहचानीं, जैसे कि डर का लाभ उठाना।

“We’ve built an empirically validated, first-of-its-kind toolkit to measure AI manipulation in the real world — to better understand how it can occur and help protect people.”

🇮🇳 हमने वास्तविक दुनिया में AI द्वारा होने वाली मैनिपुलेशन को मापने के लिए एक टूलकिट विकसित किया है, जिसे अनुभवात्मक रूप से मान्य किया गया है और जो अपने तरह का पहला है — ताकि यह बेहतर तरीके से समझा जा सके कि यह कैसे हो सकती है और उपयोगकर्ताओं की सुरक्षा की जा सके।@GoogleDeepMind पर X

🔗 Google DeepMind ट्वीट


Google Translate Live — iOS पर रीयलटाइम अनुवाद

27 मार्च — Google ने Google Translate Live को iOS पर हेडफ़ोन के साथ बढ़ाया, और अधिक देशों में डिप्लॉयमेंट जारी है। यह फीचर, जो पहले केवल Android पर उपलब्ध था, ब्लूटूथ या वायर्ड हेडफ़ोन के माध्यम से 70+ भाषाओं में रीयल-टाइम अनुवाद की अनुमति देता है।

🔗 @GoogleAI ट्वीट


MedGemma Impact Challenge — चार विजेताओं, 850+ टीमें

26 मार्च — Google ने MedGemma Impact Challenge के विजेताओं की घोषणा की, एक प्रतियोगिता जिसने MedGemma 1.5 (Google का ओपन मेडिकल मॉडल) के साथ हेल्थ ऐप्स बनाने के लिए 850+ टीमों को जुटाया।

प्रमुख विजेताओं :

RangProjetDescription
1erEpiCastCEDEAO देशों के लिए महामारी निगरानी — क्लिनिकल ऑब्ज़र्वेशंस को WHO के मानक IDSR सिग्नल्स में ट्रांसलेट करता है
2eSunnyमोबाइल के जरिए स्किन कैंसर के लक्षणों का पता लगाना, संरचित रिपोर्टें और प्राइवेसी प्रिज़र्विंग
3eFieldScreen AIऑफ़लाइन TB स्क्रीनिंग: चेस्ट X-ray और खांसने की ऑडियो का विश्लेषण
4eTracerमेडिकल एरर्स रोकने के लिए: डॉक्टर्स के नोट्स से हाइपोथेसिस निकालकर टेस्ट रिज़ल्ट्स से मिलान करता है

Edge AI और agentic workflow प्रोजेक्ट्स के लिए स्पेशल अवॉर्ड भी दिए गए, जिनमें ClinicDX शामिल है (OpenMRS में शामिल डायग्नोस्टिक्स अफ्रीका सब-सहारा के लिए, 160+ WHO/MSF गाइड्स, पूरी तरह ऑफ़लाइन)।

🔗 MedGemma Impact Challenge ब्लॉग


Runway — Ad Concepter App और $100,000 प्रतियोगिता

27 मार्च — Runway ने Ad Concepter App लॉन्च किया, एक AI-आधारित एड क्रिएशन टूल। एक प्रॉम्प्ट, एक संदर्भ छवि और एक प्रोडक्ट विसुअल से यह ऐप कॉन्सेप्ट्स, कंपोज़िशन्स और विज्ञापनों के लिए स्टोरी बीट्स जेनरेट करता है। यह टूल वेब ऐप पर तुरंत उपलब्ध है।

Runway ने साथ ही Big Ad Contest (#RunwayBigAdContest) भी लॉन्च किया, जिसमें टूल के उपयोग को बढ़ावा देने के लिए $100,000 तक के पुरस्कार हैं।

🔗 Runway ट्वीट


Pika — सार्वजनिक बीटा में AI Selves

26 मार्च — Pika ने सार्वजनिक बीटा में Pika AI Selves खोल दिया। फरवरी में घोषित यह फीचर प्रत्येक उपयोगकर्ता को अपना एजेंटिक एक्सटेंशन बनाने की अनुमति देता है — एक “AI Self” जिसमें पर्सिस्टेंट मेमोरी होती है (जैसे फ़ूड एलर्जी जैसे निजी विवरण), जो ग्रुप चैट्स में स्वायत्त रूप से कार्य कर सकता है, वीडियो गेम बना सकता है या फोटो भेज सकता है।

एक्सेस pika.me (वेब) और नई iOS ऐप के माध्यम से सार्वभौमिक है। Pika इस फीचर को केवल वीडियो जेनरेशन से आगे रखते हुए व्यक्तिगत AI एजेंट्स के साथ प्रतिस्पर्धा में उतर रहा है।

🔗 Pika Labs ट्वीट


ब्रेविस

Awesome GitHub Copilot — 27 मार्च — कम्युनिटी प्रोजेक्ट “Awesome GitHub Copilot” एक नए समर्पित साइट awesome-copilot.github.com पर माइग्रेट कर रहा है जिसमें फुल-टेक्स्ट सर्च, Learning Hub और Copilot CLI और VS Code के लिए वन-क्लिक इंस्टॉलेशन है। 🔗 GitHub ट्वीट

NotebookLM पुश नोटिफिकेशन्स — 27 मार्च — NotebookLM अब लंबी जेनरेशन के दौरान पेज छोड़ने और जेनरेशन खत्म होने पर मोबाइल पुश नोटिफिकेशन प्राप्त करने की अनुमति देता है। 🔗 NotebookLM ट्वीट


इसका क्या मतलब है

Luma Uni-1 विज़ुअल जेनरेशन में एक पैराबाइम शिफ्ट का संकेत देता है: पिक्सल के सांख्यिकीय मिलान को ऑप्टिमाइज़ करने के बजाय मॉडल निर्माण के दौरान ही स्पेटियल रीज़निंग को समाहित करता है। यदि यह व्यवहारिक रूप से काम करता है, तो यह क्रिएटिव टूल्स के लिए सीन की संगति और जटिल निर्देशों को संभालने के तरीके को बदल सकता है।

Perplexity × Samsung का डिप्लॉयमेंट इस सप्ताह का शायद सबसे व्यावहारिक प्रभाव वाला ऐलान है: एक अरब उपकरणों पर पहुंच Perplexity की सर्च और रीज़निंग क्षमताओं के लिए एक विशाल वितरण है। यह इस बात की भी पुष्टि है कि विशेषीकृत AI APIs (सर्च, रीज़निंग, मल्टी-टैब ऑर्केस्ट्रेशन) अब हार्डवेयर निर्माताओं के लिए इन्फ्रास्ट्रक्चर घटक बन चुके हैं।

डेवलपर टूल्स की तरफ़, Claude Code v2.1.86 और GitHub Copilot CLI दो अलग-अलग दिशाओं में आगे बढ़ रहे हैं: Claude Code विश्वसनीयता को मजबूत कर रहा है (लंबी सत्रों, MCPs, कम आम VCS के लिए फिक्स), जबकि Copilot CLI एजेंटिक ऑटोमेशन की ओर बढ़ रहा है (एजेंट फ्लीट के जरिए टेस्ट जेनरेशन)। ये दोनों विकास डेवलपर असिस्टेंट्स की परिपक्वता को दर्शाते हैं जो अब ऑटोकम्प्लीशन से आगे बढ़ रहे हैं।


स्रोत

यह दस्तावेज़ fr संस्करण से hi भाषा में gpt-5-mini मॉडल का उपयोग करके अनुवादित किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए देखें https://gitlab.com/jls42/ai-powered-markdown-translator