खोजें

OpenAI ने 80 वर्ष पुरानी Erdős अनुमानना का खंडन किया, Cohere Command A+ open-source, NVIDIA Nemotron-Labs-Diffusion

OpenAI ने 80 वर्ष पुरानी Erdős अनुमानना का खंडन किया, Cohere Command A+ open-source, NVIDIA Nemotron-Labs-Diffusion

ai-powered-markdown-translator

gpt-5.4-mini के साथ fr से hi में अनुवादित लेख।

GitHub पर प्रोजेक्ट देखें ↗

20 मई 2026 को, एआई मूलभूत गणित में प्रवेश करती है: एक OpenAI मॉडल 1946 में प्रस्तुत Paul Erdős की एक अनुमानना का खंडन करता है, 125 पृष्ठों के एक प्रमाण के आधार पर जिसे Fields पदक विजेता Tim Gowers सहित गणितज्ञों ने मान्य किया। मॉडल्स के मोर्चे पर, Cohere Command A+ को open-source Apache 2.0 के रूप में जारी करता है (MoE आर्किटेक्चर 218B/25B सक्रिय), NVIDIA Nemotron-Labs-Diffusion को टोकन की समानांतर जनरेशन के साथ लॉन्च करता है, और Stability AI Stable Audio 3.0 (4 open weights मॉडल) का अनावरण करता है। टूलिंग में, GitHub Copilot एक साथ चार मोर्चों पर विकसित होता है, और Claude Code 24 घंटों में दो संस्करण जारी करता है।


OpenAI ने 80 वर्ष पुरानी Erdős अनुमानना का खंडन किया

20 मई — OpenAI ने एक अभूतपूर्व परिणाम प्रकाशित किया: एक आंतरिक सामान्य-उद्देश्यीय तर्क मॉडल ने planar unit distance problem को हल कर दिया है, जो तब से खुला प्रश्न था जब Paul Erdős ने इसे 1946 में प्रस्तुत किया था। यह समस्या पूछती है कि समतल में n बिंदुओं के बीच ठीक 1 दूरी पर बिंदु-युग्मों की अधिकतम संख्या क्या हो सकती है। 1940 के दशक से, गणितीय समुदाय मानता था कि Erdős की वर्गाकार ग्रिड-आधारित रचनाएँ मूलतः सर्वोत्तम थीं।

मॉडल ने एक प्रमाण तैयार किया जिसमें यह दिखाया गया कि configurations के एक अनंत परिवार का अस्तित्व है जो अनुमानित सीमा से आगे निकलता है, और इसमें Will Sawin (Princeton) द्वारा स्थापित δ = 0,014 का घातांक है। यह सफलता एक अप्रत्याशित गणितीय उपकरण पर आधारित है: class field towers और Golod-Shafarevich theory, जो algebraic number theory से आते हैं, और जिन्हें एक प्राथमिक Euclidean geometry समस्या पर लागू किया गया। दो मूलतः दूर क्षेत्रों के बीच यह संबंध, संबंधित गणितज्ञों के अनुसार, परिणाम की मौलिकता का केंद्र है।

पहलूविवरण
समस्यासमतल इकाई दूरी (Erdős, 1946)
पिछली सीमाn^(1+C/loglog(n)) में वृद्धि (Spencer-Szemerédi-Trotter, 1984)
नया परिणामn^(1+δ), δ = 0,014
गणितीय उपकरणबीजगणितीय संख्या सिद्धांत (Golod-Shafarevich)
मॉडलआंतरिक सामान्य तर्क मॉडल (अनामित)
विचार-श्रृंखला लंबाई125 पृष्ठ
सत्यापनबाहरी गणितज्ञों का समूह + साथी लेख

जो बात इस परिणाम को विशेष रूप से उल्लेखनीय बनाती है: यह किसी ऐसे सिस्टम द्वारा उत्पन्न नहीं हुआ जिसे विशेष रूप से गणित के लिए प्रशिक्षित किया गया हो या इस समस्या के लिए लक्षित किया गया हो। यह एक सामान्य-उद्देश्यीय मॉडल है, जिसका मूल्यांकन Erdős समस्याओं के एक संग्रह पर स्वायत्त शोध क्षमताओं की व्यापक खोज के हिस्से के रूप में किया गया।

Tim Gowers (Fields पदक) इस परिणाम को “milestone in AI mathematics” कहते हैं। Arul Shankar (Princeton) इससे भी आगे जाते हैं:

“In my opinion this paper demonstrates that current AI models go beyond just helpers to human mathematicians – they are capable of having original ingenious ideas, and then carrying them out to fruition.”

🇮🇳 मेरी राय में, यह लेख दिखाता है कि आज के एआई मॉडल केवल गणितज्ञों के सहायक की भूमिका से आगे बढ़ चुके हैं — वे मौलिक और चतुर विचार रखने, और उन्हें अंत तक ले जाने में सक्षम हैं। — [Arul Shankar, संख्या सिद्धांतज्ञ, Princeton]

OpenAI इस परिणाम को मूलभूत शोध के लिए एक संकेत के रूप में देखता है: यदि कोई मॉडल 125 पृष्ठों तक जटिल तर्क बनाए रख सकता है और दूरस्थ गणितीय क्षेत्रों को जोड़ सकता है, तो ये क्षमताएँ जीवविज्ञान, भौतिकी, सामग्री विज्ञान और चिकित्सा तक स्थानांतरित की जा सकती हैं।

🔗 OpenAI लेख


Cohere Command A+ — MoE flagship open-source

20 मई — Cohere अपना अब तक का सबसे शक्तिशाली मॉडल Command A+ open-source के रूप में Apache 2.0 लाइसेंस के तहत जारी करता है। mixture-of-experts (sparse MoE) आर्किटेक्चर कुल 218B पैरामीटर उपयोग करता है, लेकिन हर inference में केवल 25B सक्रिय होते हैं, जिससे यह W4A4 quantization में दो NVIDIA H100 GPU या एक Blackwell (B200) GPU पर चल सकता है।

Command A+ पहले अलग-अलग मौजूद क्षमताओं — Command A Reasoning, Command A Vision और Command A Translate — को एक ही मॉडल में एकीकृत करता है। यह 48 भाषाओं का समर्थन करता है (पिछले संस्करणों के लिए 23 की तुलना में), और गैर-यूरोपीय भाषाओं के लिए एक बेहतर tokenizer के साथ आता है (+20% अरबी के लिए, +16% कोरियाई के लिए, +18% जापानी के लिए)।

BenchmarkCommand A+Command A Reasoning
τ²-Bench Telecom85%37%
Terminal-Bench Hard25%3%
MMMU75,1%N/A
MathVista80,6%73,5%
North Agentic QA+20% सुधारreference
North Data Analysis+32% सुधारreference

यह मॉडल Command A Reasoning की तुलना में 2× तक तेज और 30% कम latent है, और speculative decoding अतिरिक्त 1,5–1,6× लाभ देता है। Hugging Face पर और vLLM के माध्यम से उपलब्ध। Artificial Analysis Intelligence Index पर 37 का स्कोर इसे open-source मॉडलों में सर्वोत्तम बनाता है।

“Introducing: Cohere Command A+ — We’ve created our most powerful LLM yet, optimized it to run on as little hardware as possible, and released it open-source for all.”

🇮🇳 यह रहा Cohere Command A+ — हमने अपना अब तक का सबसे शक्तिशाली LLM बनाया है, जिसे यथासंभव कम हार्डवेयर पर चलने के लिए अनुकूलित किया गया है, और इसे सभी के लिए open-source के रूप में जारी कर रहे हैं।@cohere on X

🔗 Cohere ब्लॉग


Gemini for Science — वैज्ञानिक खोज में साझेदार के रूप में एआई

20 मई — Google I/O 2026 में घोषित और 20 मई को ट्वीट किया गया, Gemini for Science वैज्ञानिक अनुसंधान के लिए प्रायोगिक टूल्स का एक सूट है। डेटा के विस्फोट के सामने, उद्देश्य शोधकर्ताओं को ऐसी जानकारियों को जोड़ने में सक्षम बनाना है जिन्हें कोई एक व्यक्ति अकेले संसाधित नहीं कर सकता।

तीन प्रायोगिक टूल्स प्रस्तुत किए गए हैं:

टूलआधारकार्य
Hypothesis GenerationCo-Scientistनई परिकल्पनाओं की खोज और परिशोधन
Computational DiscoveryAlphaEvolve + ERAसमानांतर में हजारों कोड विविधताओं का परीक्षण
Science Skills30+ bio modelsagentic platforms (Antigravity) में एकीकृत बंडल

Computational Discovery सबसे तकनीकी टूल है: यह समानांतर में हजारों कोड विविधताएँ उत्पन्न और मूल्यांकित करता है, जिससे epidemiology, chemistry या computational biology में नई modeling approaches को सामान्य समय के एक अंश में परीक्षण करना संभव होता है।

Science Skills life sciences और databases के 30 से अधिक प्रमुख models के डेटा को एकीकृत करता है, और agentic platforms के साथ इंटरफेस करके जटिल manual workflows को कुछ ही मिनटों में स्वचालित करता है।

यह परियोजना 100+ साझेदार संस्थानों के साथ विकसित की गई है, जिनमें doctoral students से लेकर Nobel laureates तक शामिल हैं।

🔗 @GoogleAI घोषणा


NVIDIA Nemotron-Labs-Diffusion — टोकन-डिफ्यूजन आर्किटेक्चर

20 मई — NVIDIA Nemotron-Labs-Diffusion की घोषणा करता है, एक भाषा मॉडल जो पारंपरिक autoregressive LLMs के विपरीत, जो एक समय में एक token उत्पन्न करते हैं, diffusion के माध्यम से tokens को समानांतर रूप से उत्पन्न करता है। यह आर्किटेक्चर — छवि जनरेशन के लिए diffusion models से प्रेरित — आउटपुट की गुणवत्ता बनाए रखते हुए inference को तेज करने का लक्ष्य रखता है।

यह दृष्टिकोण standard transformer paradigm से मूलतः अलग है: पिछले tokens पर condition करके प्रत्येक token को क्रमिक रूप से predict करने के बजाय, मॉडल noise-युक्त token sequence पर समानांतर रूप से iterate करता है, convergence तक। सैद्धांतिक लाभों में लंबे आउटपुट पर कम latency और GPU पर बेहतर parallelization शामिल हैं।

पहलूक्लासिक (autoregressive)Nemotron-Labs-Diffusion
GenerationToken by token, sequentialपूरी sequence पर समानांतर
लंबे आउटपुट की latencyरैखिक रूप से बढ़ती हैसंभावित रूप से कम
ParadigmGPT-styleDiffusion-style

पूर्ण तकनीकी रिपोर्ट रिलीज़ के साथ आती है। यह NVIDIA Labs का एक शोध योगदान है, जिसे प्रमुख autoregressive transformer मॉडल के लिए एक वास्तुशिल्प विकल्प के रूप में रखा गया है — ऐसा शोध क्षेत्र जो MDLM और Plaid जैसे text diffusion models के उभरने के बाद से सक्रिय है।

🔗 @NVIDIAAI घोषणा


Stability AI — Stable Audio 3.0 (open weights परिवार)

20 मई — Stability AI Stable Audio 3.0 जारी करता है, जो commercial license के तहत 4 open weights audio models का एक परिवार है। यह श्रृंखला तैनाती के पूरे स्पेक्ट्रम को कवर करती है, embedded devices से लेकर enterprise API तक।

मॉडलअधिकतम लंबाईपरिनियोजनOpen weights
Small SFXछोटीon-deviceहाँ
Small2 minon-deviceहाँ
Medium6:20cloud/localहाँ
Large6:20+API/enterpriseनहीं

Small SFX, Small और Medium मॉडल Hugging Face पर उपलब्ध हैं। सभी प्रशिक्षण डेटा पूरी तरह लाइसेंस प्राप्त हैं, और Universal Music Group तथा Warner Music Group के साथ साझेदारियों की घोषणा की गई है। उन्नत सुविधाओं में कस्टम fine-tuning के लिए LoRA training support, और audio inpainting mode (single-segment editing, multi-segment, causal continuation) शामिल हैं।

“We want to foster the same kind of community-driven innovation in audio that we sparked in image generation with the launch of Stable Diffusion.”

🇮🇳 हम ऑडियो में समुदाय-चालित उसी प्रकार के नवाचार को बढ़ावा देना चाहते हैं, जैसा हमने Stable Diffusion के लॉन्च के साथ छवि जनरेशन में शुरू किया था।Stability AI


GitHub Copilot चार मोर्चों पर विकसित होता है

VS Code में अनुकूलनशील Auto model selection

20 मई — Copilot VS Code का “Auto” विकल्प अब कार्य की प्रकृति के अनुसार सर्वोत्तम मॉडल चुनता है: जटिल reasoning, सरल code generation, debugging या tool orchestration। चयन उपलब्धता और विश्वसनीयता के real-time metrics पर आधारित है। व्यावहारिक लाभ: Auto का उपयोग करते समय premium request multiplier में 10% की कमी, बिना किसी configuration के आवश्यकता के।

🔗 GitHub changelog

20 मई — web पर Copilot Chat issues का एक semantic index जोड़ता है: एक developer “पिछले महीने रिपोर्ट किए गए mobile rendering bugs” खोज सकता है, बिना exact title जाने, और context के आधार पर grouped परिणाम प्राप्त कर सकता है। सभी Copilot योजनाओं के लिए general availability में उपलब्ध।

🔗 GitHub changelog

Copilot Chat web से Gemini models की removal

20 मई — github.com पर Copilot Chat से सभी Gemini models हटाए जाते हैं, साथ ही GPT-5.2 Codex और GPT-5.4 nano भी। वेब पर केवल OpenAI और Claude उपलब्ध रहते हैं। GitHub इस निर्णय को उत्तरों की गुणवत्ता की स्थिरता के आधार पर उचित ठहराता है। Gemini IDEs और API में उपलब्ध रहता है।

🔗 GitHub changelog

Fix with Copilot — code review feedback का grouped application

19 मई — “Implement suggestion” बटन का नाम बदलकर “Fix with Copilot” कर दिया गया है, और एक नया संवाद जोड़ा गया है (मॉडल चयन, target branch, custom instructions)। एक नया “Fix batch with Copilot” बटन कई code review टिप्पणियों को समूहित करने और उन्हें एक साथ Copilot cloud agent को सौंपने की अनुमति देता है, जिससे बहुत सारी टिप्पणियों वाले PRs पर friction कम होता है।

🔗 GitHub changelog


Claude Code v2.1.144 और v2.1.145

19 मई — Claude Code 24 घंटों में दो संस्करण जारी करता है, जिनमें नई सुविधाओं और सुधारों का एक बड़ा सेट शामिल है।

संस्करण 2.1.144 background sessions के प्रबंधन में सुधार करता है: कमांड /resume अब --bg sessions दिखाता है, और sub-agent समाप्ति notifications में अवधि शामिल होती है (उदा.: “Agent completed · 3h 2m 5s”). कमांड /model केवल वर्तमान session पर लागू होता है (स्थायी default सेट करने के लिए d दबाएँ)। “extra usage” → “usage credits” का पुनर्नामकरण शब्दावली को स्पष्ट करता है, और api.anthropic.com के inaccessible होने पर startup block का 75 सेकंड तक रुकना (VPN, firewall) enterprise अनुभव को बेहतर बनाता है।

संस्करण 2.1.145 claude agents --json के परिचय से अलग है, जो shell scripts (tmux-resurrect, status bars, session selectors) में एकीकरण के लिए डिज़ाइन किया गया कमांड है। OpenTelemetry tracing को agent_id और parent_agent_id के साथ spans में समृद्ध किया गया है, जिससे sub-agents की सही hierarchy संभव होती है। /plugin स्क्रीन अब installation से पहले पूरी सामग्री (commands, agents, skills, hooks, MCP/LSP servers) दिखाती है। Stop/SubagentStop hooks को दो नए fields मिलते हैं: background_tasks और session_crons

🔗 CHANGELOG Claude Code


Anthropic AI के चरित्र-निर्माण पर चिंतन खोलता है

19 मई — Anthropic ने एक लेख प्रकाशित किया जिसमें 15 से अधिक धार्मिक और सांस्कृतिक परंपराओं से आए दार्शनिकों, धर्मगुरुओं और नैतिकतावादियों के साथ नियमित संवादों की एक पहल का विवरण है। उद्देश्य इस पर चिंतन को समृद्ध करना है कि किसी एआई सिस्टम के चरित्र को रूप देना क्या अर्थ रखता है — यह सद्गुण और अच्छे जीवन पर सदियों की संचित सोच पर आधारित है, बिना Claude को किसी विशेष परंपरा के अनुरूप बनाए।

एक प्रायोगिक परिणाम ध्यान देने योग्य है: एक ऐसा टूल जिसे Claude कार्य के दौरान अपने स्वयं के नैतिक commitments को पुनः पढ़ने के लिए invoke कर सकता है। उच्च-प्रभाव वाले कार्यों से पहले स्वस्फूर्त रूप से उपयोग किए जाने पर, इसने आंतरिक मूल्यांकनों पर “असंगत व्यवहारों में उल्लेखनीय कमी” दिखाई। अगले चरणों में jurists, psychologists और civic institutions के साथ संवाद शामिल होंगे।

🔗 Anthropic लेख


Cohere — Indra Group और Multiverse Computing के साथ MOUs

20 मई — Cohere कनाडा में स्पेन के राजा Felipe VI की राज्य यात्रा के दौरान दो समझौता ज्ञापन (MOU) पर हस्ताक्षर करता है। पहला Cohere को IndraMind (Indra समूह की एआई शाखा, स्पेनिश रक्षा और डिजिटलीकरण) से जोड़ता है ताकि एक sovereign AI ecosystem बनाया जा सके, जिसमें स्पेन की पाँच आधिकारिक भाषाओं के लिए भाषाई अनुकूलन शामिल हों। रक्षा से जुड़ा एक पक्ष बहुराष्ट्रीय अभ्यासों के लिए विश्लेषण और योजना क्षमताएँ प्रदान करता है। दूसरा Multiverse Computing (quantum-inspired AI optimization, Spain/Canada) को शामिल करता है, ताकि यूरोप और कनाडा में व्यावसायिक अवसरों का अन्वेषण किया जा सके।

“Enterprises no longer want to rent AI — they want to own it.”

🇮🇳 कंपनियाँ अब एआई किराये पर नहीं लेना चाहतीं — वे इसकी मालिक बनना चाहती हैं।Aidan Gomez, Cohere के सह-संस्थापक और CEO


Perplexity — अनुरोध-संवेदी संदर्भ संपीड़न उत्पादन में

20 मई — Perplexity उत्पादन में एक संदर्भ संपीड़न प्रणाली (query-aware context compression) तैनात कर रहा है, जो उत्तरों की सटीकता सुधारते हुए संदर्भ टोकनों को 70% तक घटाती है। सिद्धांत यह है: एक हल्का मॉडल अनुरोध से संबंधित प्रासंगिक अंशों को सर्जिकल तरीके से निकालता है और फिर उन्हें मुख्य LLM को भेजता है, जिससे विज्ञापन, मेटाडेटा और विषय से हटकर सामग्री हट जाती है।

मेट्रिकमान
संदर्भ टोकनों में कमी70% तक
प्रति अंश महत्वपूर्ण सामग्री में वृद्धि+63%
इंफ़रेंस विलंबता में कमी35–40%
समग्र GPU गणना में कमी40–45%
उत्पादन विलंबता (p99)< 20 ms

pplx-diffusion बैकबोन (17 परतें, 28 परतों से डिस्टिल्ड) बिना पाठ生成 किए समानांतर में यह भविष्यवाणी करता है कि किन खंडों को बनाए रखना है — एक extractive दृष्टिकोण जो उद्धरणों की विश्वसनीयता की गारंटी देता है। SimpleQA पर, संपीड़न के साथ “medium” प्रीसेट औसतन प्रति दस्तावेज़ केवल 200 टोकनों के साथ 95% सटीकता हासिल करता है।

🔗 Perplexity की घोषणा


ElevenLabs — Speech Engine, एक प्रॉम्प्ट में वॉइस एजेंट

20 मई — ElevenLabs Speech Engine लॉन्च कर रहा है, एक एकीकृत वॉइस पाइपलाइन (वॉइस सिंथेसिस + ट्रांसक्रिप्शन + ऑर्केस्ट्रेशन) जो डेवलपर्स को एक ही प्रॉम्प्ट से टेक्स्ट-आधारित बातचीत एजेंट को पूर्ण वॉइस एजेंट में बदलने देती है। यह ElevenAPI में उपलब्ध है, और मूल्य निर्धारण 8 सेंट प्रति मिनट है, जिसमें वॉल्यूम के अनुसार कमी होती है। अतिरिक्त परिनियोजन चैनलों के लिए मॉनिटरिंग और analytics के साथ ElevenAgents में माइग्रेशन संभव है।

🔗 ElevenLabs की घोषणा


Luma Agents में Seedance 2.0 का एकीकरण

19 मई — Luma Agents अपने क्रिएटिव एजेंट प्लेटफ़ॉर्म में ByteDance के वीडियो जनरेशन मॉडल Seedance 2.0 को एकीकृत कर रहा है। अन्य पहले से एकीकृत मॉडलों जैसा ही workflow। यह एकीकरण Luma Agents के माध्यम से उपलब्ध मॉडलों के विकल्प को बढ़ाता है, और प्लेटफ़ॉर्म को AI वीडियो के लिए एक बहु-मॉडल orchestration hub के रूप में स्थापित करता है।

🔗 Luma की घोषणा


Cannes में Kling AI — House of David, औद्योगिक पैमाने पर AI के साथ पहली हॉलीवुड फ़िल्म

20 मई — 2026 के Cannes Film Festival में, Kling AI अपनी तकनीक के औद्योगिक उपयोग की पुष्टि House of David (Prime Video) में करता है: 44 मिलियन वैश्विक viewers, संयुक्त राज्य अमेरिका में नई श्रृंखलाओं के शीर्ष 10 में, Prime Video US पर नंबर 1। यह पहली हॉलीवुड प्रोडक्शन है जो बड़े पैमाने के अपने production pipeline में AI वीडियो जनरेशन के एकीकरण को सार्वजनिक रूप से स्वीकार करती है, जिसमें औद्योगिक सख्त मानकों को पूरा करने वाले सुसंगत प्लान हैं।

🔗 Kling AI की घोषणा


संक्षिप्त समाचार

  • Running Guide Agent — Google DeepMind — दौड़ प्रशिक्षण के लिए समर्पित एक व्यक्तिगत AI एजेंट, जिसे “बिना सीमाओं वाली दौड़ की ओर एक कदम” के रूप में प्रस्तुत किया गया है। 🔗 DeepMind ब्लॉग

  • Midjourney V8.1 — flag --no फिर से जोड़ा गया — anti-prompting flag V8.1 में वापस आ गया है ताकि जनरेटेड छवियों से तत्वों को बाहर रखा जा सके (उदा.: --no people)। 🔗 @midjourney की घोषणा

  • Anthropic की /usage Claude Code में नया रूप — Boris Cherny ने उपयोगकर्ता के प्रति प्रतिक्रिया में token खपत को बेहतर ढंग से देखने के लिए /usage के UI के पुनर्निर्माण की पुष्टि की है। 🔗 स्रोत

  • MiniMax Speech 2.8 Turbo — Together AI पर 600+ आवाज़ें — Speech 2.8 Turbo की 600 से अधिक नई आवाज़ें अब Together AI प्लेटफ़ॉर्म पर उपलब्ध हैं। 🔗 @MiniMax_AI की घोषणा


इसका क्या मतलब है

मौलिक शोध और स्वायत्त AI. एक सामान्य-उद्देश्य OpenAI मॉडल द्वारा Erdős अनुमान का समाधान साधारण बात नहीं है। जो बात इसमें शामिल गणितज्ञों को सबसे अधिक प्रभावित करती है, वह परिणाम की प्रकृति है: गणित की दो शाखाओं (बीजीय संख्या सिद्धांत और विविक्त ज्यामिति) के बीच एक अप्रत्याशित संबंध, जो 125 पृष्ठों तक सुसंगत तर्क के साथ कायम रहा। Gemini for Science (100+ संस्थानों के साथ विकसित) के साथ मिलाकर, प्रवृत्ति स्पष्ट है: AI अब केवल वैज्ञानिक डेटा प्रसंस्करण के उपकरण के रूप में नहीं, बल्कि मौलिक खोज के भागीदार के रूप में एकीकृत होना शुरू कर रहा है, जो मौलिक परिकल्पनाएँ उत्पन्न कर सकता है।

autoregressive प्रतिमान के विकल्पी आर्किटेक्चर. आज की दो घोषणाएँ प्रमुख GPT-style मॉडल पर सवाल उठाती हैं। NVIDIA Nemotron-Labs-Diffusion क्रमिक रूप से नहीं, बल्कि diffusion के माध्यम से समानांतर में टोकन उत्पन्न करता है। Stability AI का Stable Audio 3.0 दिखाता है कि diffusion 4 परिनियोजन स्तरों वाले open weights मॉडल के साथ उच्च-गुणवत्ता वाले संगीतमय परिणाम पैदा करता है। इन दृष्टिकोणों का अभिसरण बताता है कि diffusion अब केवल छवि जनरेशन तक सीमित नहीं है — यह टेक्स्ट और ऑडियो के लिए एक गंभीर प्रतिस्पर्धी आर्किटेक्चर बन रहा है।

संप्रभुता और एंटरप्राइज़ AI. Command A+ (MoE 218B open-source, Apache 2.0, 2× H100) और Cohere के Indra Group तथा Multiverse Computing के साथ MOUs एक गहरी प्रवृत्ति को दर्शाते हैं: बड़े संगठन — सरकारें, रक्षा, विनियमित क्षेत्र — अपने मॉडल अपनी ही अवसंरचना में तैनात करना चाहते हैं। एक कुशल MoE आर्किटेक्चर (218B कुल में से 25B सक्रिय) और Apache 2.0 लाइसेंस का संयोजन Command A+ को मई 2026 के अंत तक संप्रभु परिनियोजन के लिए सबसे अच्छी स्थिति वाला open-source मॉडल बनाता है।

डेवलपर टूलिंग पर बढ़ता दबाव. Claude Code 2.1.144 और 2.1.145, GitHub Copilot के चार एकसाथ अपडेट, और Perplexity का संदर्भ संपीड़न (-70% tokens, -40% GPU) सुसंगत संकेत हैं: प्रतिस्पर्धा अब मॉडलों की कच्ची गुणवत्ता से हटकर टूल की ergonomics, scriptability (claude agents —json), inference लागत (Auto model selection -10%, pplx-diffusion) और production में मजबूती (Claude Code में VPN ब्लॉकिंग का सुधार) की ओर स्थानांतरित हो रही है।


स्रोत