ai-powered-markdown-translatorhi से अनूदित लेख gpt-5.4-mini के साथ।
1 जून 2026 एआई के हालिया इतिहास के सबसे घने दिनों में से एक के रूप में याद रहेगा: Anthropic SEC में गोपनीय S-1 दाखिला करके शेयर बाज़ार की ओर एक कदम आगे बढ़ता है, जबकि एक साथ “Physical AI” की लहर फैलती है — NVIDIA Cosmos 3, Cosmos Coalition Runway+NVIDIA, Luma OPAL Lab, MiniMax M3, Qwen-VLA और Qwen3.7-Plus। इसी दौरान, OpenAI महामारी तैयारी के लिए Rosalind Biodefense तैनात करता है और कैलिफ़ोर्निया TFAIA तथा EU AI Act के अनुरूप एक शासन-ढांचा प्रकाशित करता है।
Anthropic ने SEC के समक्ष गोपनीय रूप से S-1 फॉर्म दाखिल किया
1 जून — Anthropic ने अपने सामान्य शेयरों की सार्वजनिक पेशकश (IPO) के लिए अमेरिकी प्रतिभूति और विनिमय आयोग (SEC) के समक्ष S-1 पंजीकरण का मसौदा गोपनीय रूप से दाखिल किया है। यह गोपनीय दाखिला एक अनिवार्य प्रारंभिक चरण है, जो SEC को किसी भी सार्वजनिक प्रस्ताव से पहले दस्तावेज़ की समीक्षा करने देता है।
| तत्व | मूल्य |
|---|---|
| दाखिले का प्रकार | गोपनीय S-1 फॉर्म |
| नियामक | SEC (संयुक्त राज्य) |
| शेयरों का प्रकार | सामान्य शेयर |
| मूल्य / शेयरों की संख्या | अभी तय नहीं |
| कानूनी स्थिति | प्रारंभिक दाखिला — बिक्री का प्रस्ताव नहीं |
| तिथि | 1 जून 2026 |
घोषणा में कहा गया है कि SEC की समीक्षा पूरी होने के बाद Anthropic के पास सार्वजनिक होने का विकल्प बना रहता है, लेकिन अंतिम लेन-देन बाज़ार की स्थितियों और अन्य कारकों पर निर्भर करेगा। यह S-1 दाखिला Series H की बंदी (65 अरब USD, 965 अरब USD का post-money valuation) और उस वार्षिकीकृत राजस्व की सीधी निरंतरता में आता है, जो मई 2026 के मध्य तक 47 अरब USD से ऊपर जा चुका होगा।
Anthropic एक सार्वजनिक लाभ निगम (PBC — Public Benefit Corporation) बना हुआ है, और कंपनी संभावित लिस्टिंग के बाद भी यह दर्जा बनाए रखना चाहती है — यह एक दुर्लभ कानूनी विशेषता है जो लाभ की खोज के साथ-साथ सार्वजनिक हित के दायित्व भी थोपती है।
NVIDIA Cosmos 3 — Physical AI के लिए पहला open-source omni-model
1 जून — NVIDIA ने Cosmos 3 लॉन्च किया, जो Physical AI के लिए पहला पूरी तरह खुला omni-model है। यह भाषा, छवि, वीडियो, ऑडियो और action generation को एक ही मॉडल में एकीकृत करता है — दुनिया में पहली बार।
| संस्करण | पैरामीटर | उपलब्धता |
|---|---|---|
| Cosmos 3 Super | 32B | लॉन्च के साथ ही open-source |
| Cosmos 3 Nano | 8B | लॉन्च के साथ ही open-source |
मॉडल में native vision reasoning, world generation और action generation मूल रूप से शामिल हैं। Artificial Analysis के अनुसार, लॉन्च के दिन ही Cosmos 3 text-to-image और image-to-video generation में open-weight मॉडलों में तुरंत #1 स्थान पर आ गया। weights Hugging Face और NVIDIA NGC पर उपलब्ध हैं।
“Introducing Cosmos 3: Our latest frontier model for Physical AI. Cosmos 3 is the world’s first fully open omnimodel with native vision reasoning, world and action generation.”
🇮🇳 NVIDIA Cosmos 3 प्रस्तुत करता है: Physical AI के लिए उसका नवीनतम frontier model। Cosmos 3 दुनिया का पहला पूरी तरह खुला omni-model है, जिसमें native visual reasoning, world generation और action generation शामिल हैं। — @NVIDIAAI X पर
Cosmos Coalition — world models के लिए Runway + NVIDIA की वैश्विक पहल
1 जून — Runway, NVIDIA के साथ Cosmos Coalition के संस्थापक सदस्य के रूप में जुड़ता है, जो एक वैश्विक पहल है और अग्रणी AI प्रयोगशालाओं को एक साथ लाकर Physical AI के लिए frontier world models को open-source में बनाने और सुलभ कराने का लक्ष्य रखती है।
लक्ष्य एक साझा खुला पारिस्थितिकी-तंत्र बनाना है, जिससे कोई भी शोध या उद्योग समूह इन मॉडलों का उपयोग, संशोधन और संयोजन करके उत्पादन-योग्य प्रणालियाँ बना सके। इस coalition में चिप और हार्डवेयर निर्माताओं के साथ साझेदारियाँ भी शामिल हैं।
“Introducing the Cosmos Coalition. A new global initiative with NVIDIA and leading AI labs to build and open-source frontier world models for physical AI.”
🇮🇳 Cosmos Coalition का परिचय। NVIDIA और प्रमुख AI प्रयोगशालाओं के साथ एक नई वैश्विक पहल, जो Physical AI के लिए frontier world models को बनाने और open-source करने के लिए है। — @runwayml X पर
Cosmos 3 के साथ समन्वित यह लॉन्च एक रणनीतिक मोड़ है: NVIDIA open-source Physical AI को विश्वव्यापी तकनीकी संप्रभुता के मुद्दे के रूप में स्थापित कर रहा है, कुछ बंद खिलाड़ियों के पास संसाधनों के संकेंद्रण के मुकाबले।
MiniMax M3 — coding frontier, multimodality और 1M context को जोड़ने वाला पहला open-weight
1 जून — MiniMax M3 लॉन्च करता है, जो एक साथ तीन frontier क्षमताओं को जोड़ने वाला पहला open-weight मॉडल है। कुछ ही घंटों में 1.7 मिलियन views के साथ, यह वर्ष के सबसे अधिक देखे गए open-source लॉन्चों में से एक है।
| क्षमता | विवरण |
|---|---|
| Coding & Agentic frontier | 59.0% SWE-Bench Pro, 66.0% Terminal Bench 2.1 |
| 1M tokens का context | MiniMax Sparse Attention |
| नेटिव multimodality | प्रशिक्षण के चरण शून्य से |
पूर्ण benchmarks:
| Benchmark | स्कोर |
|---|---|
| SWE-Bench Pro | 59.0% |
| Terminal Bench 2.1 | 66.0% |
| SWE-fficiency | 34.8% |
| KernelBench Hard | 28.8% |
| MCP Atlas | 74.2% |
| BU Bench (ब्राउज़र उपयोग) | +26% vs पिछला |
M3 को मूल रूप से computer-use agents और लंबी अवधि के agentic workflows के लिए डिज़ाइन किया गया है। weights और तकनीकी रिपोर्ट लॉन्च के लगभग 10 दिनों में प्रकाशित किए जाएंगे। एक समर्पित IDE, MiniMax Code, भी एक साथ लॉन्च किया गया है, जो code.minimax.io पर उपलब्ध है। पहले दिन के लॉन्च पार्टनरों में Qubrid AI (GPU cloud infrastructure) और Simular (autonomous agents) शामिल हैं।
Luma OPAL Lab — सामान्य-उद्देश्य रोबोटिक्स के लिए खुला Physical AI प्रयोगशाला
1 जून — Luma OPAL Lab (Open Science Physical AI Lab) की स्थापना की घोषणा करता है, जो रोबोटिक्स में generalization के लिए समर्पित एक खुली शोध प्रयोगशाला है।
संस्थापक Amit (@gravicle) मौजूदा Physical AI की केंद्रीय समस्या की पहचान करते हैं: बड़े भाषा मॉडल, जो नई-नई tasks पर generalize कर सकते हैं, के विपरीत robots केवल विशिष्ट environments में विशिष्ट tasks को ही दोहरा सकते हैं। रोबोटिक्स डेटा की कमी से जूझती है, जिससे एक सामान्यीकरण संकट पैदा होता है।
“We are launching Open Physical AI Lab at Luma to solve generalization in robotics. We believe general physical AI is the most consequential problem to solve to improve life on Earth.”
🇮🇳 हम रोबोटिक्स में generalization की समस्या को हल करने के लिए Luma में Open Physical AI Lab शुरू कर रहे हैं। हमारा मानना है कि सामान्य-उद्देश्यीय Physical AI पृथ्वी पर जीवन को बेहतर बनाने के लिए हल की जाने वाली सबसे महत्वपूर्ण समस्या है। — @gravicle X पर
Luma multimodal AI (3D, image, video, unified generation) में 4 वर्षों के मौलिक शोध और internet-scale multimodal data processing infrastructure पर आधारित है। OPAL Lab के सिद्धांत हैं: open science, सभी के लिए उपलब्ध methods और substrates, academia के साथ सहयोग, औद्योगिक साझेदारियाँ, और सुरक्षा मूल्यांकन। संदेश स्पष्ट रूप से राजनीतिक है: दुनिया के physical intelligence infrastructure को कुछ ही कंपनियों के हाथों में केंद्रित करना मानवता के लिए एक गहरा खतरा है।
Qwen3.7-Plus — vision, coding और long context वाला Alibaba का multimodal agent
1 जून — Alibaba Tongyi Lab अपना सबसे उन्नत multimodal agent model, Qwen3.7-Plus, प्रकाशित करता है। Qwen3.7 के text backbone पर निर्मित, यह vision और language को एक अद्वितीय और बहुउद्देश्यीय agent foundation में मिलाता है।
मुख्य बेंचमार्क:
| Benchmark | Qwen3.7-Plus | GPT-5.4 | Claude Opus 4.6 Max | Gemini 3.1 Pro |
|---|---|---|---|---|
| Terminal Bench 2.0 | 70.3 | — | 65.4 | — |
| SWE-bench Verified | 77.7 | — | 80.8 | — |
| GPQA Diamond | 90.3 | — | 91.3 | — |
| ScreenSpot Pro | 79.0 | 67.4 | 49.5 | 68.1 |
| AndroidWorld | 81.0 | — | 62.0 | 70.7 |
| BabyVision | 70.4 | 53.1 | 12.6 | 55.9 |
चार प्रमुख क्षमताएँ: हाइब्रिड GUI+CLI agent (स्क्रीन को समझता है, अनुप्रयोगों में नेविगेट करता है), coding और multimodal productivity assistant (frontend mockup से जटिल engineering तक), visual agent (perception, reasoning, localization और web search से समृद्ध प्रश्नोत्तर), और Claude Code, OpenClaw, Qwen Code या किसी भी अन्य agent environment के माध्यम से multi-environment generalization।
उपलब्धता: Alibaba Cloud Model Studio, OpenAI-संगत API और Anthropic protocol (जिसे ANTHROPIC_BASE_URL के माध्यम से सीधे Claude Code के साथ उपयोग किया जा सकता है)।
Rosalind Biodefense — OpenAI रक्षात्मक जीवविज्ञान के लिए GPT-Rosalind खोलता है
29 मई — OpenAI रक्षात्मक जीवविज्ञान के इर्द-गिर्द दो प्रमुख पहलों की घोषणा करता है, जो GPT-Rosalind पर आधारित हैं, यह जीवन विज्ञान के लिए समर्पित उसका reasoning model है।
| संगठन | क्षेत्र | प्रकार |
|---|---|---|
| Fourth Eon | जैव-सुरक्षा स्क्रीनिंग, DNA संश्लेषण | Rosalind Biodefense डेवलपर |
| SecureDNA | जैविक सुरक्षा | Rosalind Biodefense डेवलपर |
| Lawrence Livermore National Laboratory | चिकित्सा प्रतिकार | सरकारी भागीदार |
| Johns Hopkins APL | प्रोटीन engineering, therapeutics | सरकारी भागीदार |
| CEPI | महामारी टीके, Ebola प्रतिक्रिया | सरकारी भागीदार |
Rosalind Biodefense एक विकास कार्यक्रम है जो शैक्षणिक संस्थानों, गैर-लाभकारी संगठनों, रक्षात्मक मिशन वाली कंपनियों और सरकारी टीमों के लिए खुला है। OpenAI GPT-Rosalind तक पहुँच को वित्तपोषित करता है और महामारी मॉडलिंग, प्रारंभिक पहचान, screening, महामारी तैयारी तथा चिकित्सा प्रतिकार पर परियोजनाओं का समर्थन करता है।
“Advances in biology can strengthen our ability to prevent, detect, and respond to biological threats. Our goal is to help build a more robust ecosystem — giving trusted defenders frontier AI to develop and operate new defenses for public health and biodefense.”
🇮🇳 जीवविज्ञान में प्रगति जैविक खतरों को रोकने, पहचानने और उनका जवाब देने की हमारी क्षमता को मजबूत कर सकती है। हमारा लक्ष्य एक अधिक मज़बूत पारिस्थितिकी-तंत्र बनाने में मदद करना है — भरोसेमंद रक्षकों को सार्वजनिक स्वास्थ्य और जैव-रक्षा के लिए नई defenses विकसित करने और संचालित करने हेतु एक frontier AI देकर। — @OpenAI X पर
अमेरिकी और सहयोगी सरकारी साझेदारों के लिए GPT-Rosalind तक विस्तारित पहुँच की भी एक साथ घोषणा की गई है, जिसमें CEPI जैसे लाभार्थी उसके “100 Days” वैक्सीन-त्वरण मिशन के तहत शामिल हैं — जिसमें मौजूदा Ebola प्रकोप की प्रतिक्रिया भी शामिल है।
🔗 Rosalind Biodefense — OpenAI
Claude Code v2.1.153 से v2.1.159 — 28 मई के बाद पाँच अपडेट
29 मई – 1 जून — Anthropic, Opus 4.8 के लॉन्च के बाद के दिनों में Claude Code के पाँच संस्करण प्रकाशित करता है।
| संस्करण | मुख्य बिंदु |
|---|---|
| 2.1.153 | marketplace के लिए skipLfs विकल्प, बेहतर claude doctor, MCP/macOS/Windows agents के लिए सुधार |
| 2.1.156 | महत्वपूर्ण सुधार — Opus 4.8 के thinking blocks API त्रुटियाँ पैदा कर रहे थे |
| 2.1.157 | .claude/skills/ से स्वतः लोड होने वाले plugins, plugin init command, session के बीच EnterWorktree |
| 2.1.158 | Bedrock, Vertex और Foundry पर Auto Mode, Opus 4.7 और Opus 4.8 के लिए (CLAUDE_CODE_ENABLE_AUTO_MODE=1) |
| 2.1.159 | आंतरिक infrastructure, कोई दृश्य परिवर्तन नहीं |
संस्करण 2.1.157 सबसे उल्लेखनीय है: .claude/skills/ में रखे गए plugins अब marketplace से गुज़रे बिना स्वतः लोड हो जाते हैं, और EnterWorktree session के दौरान Claude द्वारा प्रबंधित worktrees के बीच स्विच कर सकता है। संस्करण 2.1.158 प्रमुख cloud platforms पर Auto Mode लाता है, जिससे Claude Code का enterprise deployment मज़बूत होता है।
Gemini 3.5 Flash और Gemini Omni सामान्य उपलब्धता में
29 मई — Google, Gemini 3.5 Flash की सामान्य उपलब्धता (general availability) को 9 वीडियो demos के माध्यम से चिह्नित करता है, जो Gemini Omni और Gemini 3.5 Flash को action में दिखाते हैं।
Gemini 3.5 Flash rollout: Gemini ऐप और Search के AI Mode (वैश्विक) में default model, Google Antigravity, Google AI Studio में Gemini API, Android Studio, Gemini Enterprise Agent Platform और Gemini Enterprise के माध्यम से उपलब्ध।
Gemini Spark: 24x7 व्यक्तिगत AI agent, जो Gemini 3.5 द्वारा संचालित है, अब संयुक्त राज्य में सभी Google AI Ultra subscribers के लिए उपलब्ध है, और Gmail, Docs, Slides तथा Workspace में एकीकृत है।
Gemini Omni Flash: Gemini ऐप और Google Flow में Google AI Plus, Pro और Ultra subscribers के लिए तैनात; YouTube Shorts और YouTube Create App उपयोगकर्ताओं के लिए बिना शुल्क उपलब्ध; developer API rollout अगले हफ्तों में अपेक्षित।
🔗 Gemini Omni और 3.5 Flash डेमो
Qwen-VLA — 11 प्रकार के रोबोटों के लिए vision-language-action agent
29 मई — Tongyi Lab Qwen-VLA प्रकाशित करता है, जो general embodied intelligence के लिए एकीकृत Vision-Language-Action (VLA) model है।
आर्किटेक्चर: Qwen3.5-4B (language-vision backbone) + 1.15B DiT decoder, जो दृश्य perception और प्राकृतिक भाषा से सीधे actions उत्पन्न करता है। यह model वस्तु-हेरफेर, स्थानिक navigation और trajectory prediction को एक ही framework में एकीकृत करता है।
embodiment-aware prompts की बदौलत, वही model 11 प्रकार के robotic embodiments — एकल-arm, दोहरे-arm और humanoid platforms — पर बिना policy heads या task-specific architectures के काम करता है। ट्वीट ने दो दिनों में 3.1 मिलियन views उत्पन्न किए, जो robot community की भारी दिलचस्पी का संकेत है।
Copilot — उपयोग मीट्रिक्स API में AI अपनाने की कोहोर्ट्स जोड़ी गईं
29 मई — GitHub Copilot उपयोग मीट्रिक्स API को AI अपनाने की कोहोर्ट्स की एक प्रणाली के साथ समृद्ध कर रहा है। प्रत्येक सक्रिय उपयोगकर्ता को निम्नलिखित चार चरणों में से एक में वर्गीकृत किया जाता है, जिन्हें 28 दिनों की स्लाइडिंग विंडो पर गणना किया जाता है:
| चरण | नाम | मानदंड |
|---|---|---|
| 0 | कोई कोहोर्ट नहीं | पर्याप्त जुड़ाव नहीं |
| 1 | कोड-प्रथम | कोड पूर्णता और/या IDE एजेंट मोड |
| 2 | एजेंट-प्रथम | एक GitHub एजेंट सतह (cloud agent, code review, CLI) |
| 3 | बहु-एजेंट | दो या अधिक एजेंट सतह, या GitHub Copilot ऐप |
प्रत्येक चरण के लिए उजागर की गई मीट्रिक्स: सक्रिय उपयोगकर्ता, इंटरैक्शन, कोड जनरेशन और स्वीकृति, जोड़ी गई/हटाई गई पंक्तियाँ, बनाई गई/मर्ज की गई/समीक्षित pull requests, मर्ज का माध्यिका समय। यह एंटरप्राइज़ प्रशासकों और संगठन स्वामियों के लिए उपलब्ध है। यह प्रणाली Copilot अपनाने की वास्तविक परिपक्वता को मापने और डेवलपर्स की प्रगति को उन्नत एजेंटिक उपयोगों की ओर ट्रैक करने की अनुमति देती है।
🔗 GitHub चेंजलॉग — Copilot उपयोग मीट्रिक्स API
ElevenLabs ने ग्रीस सरकार के साथ एक MOU पर हस्ताक्षर किए
28 मई — ElevenLabs ने ग्रीक सरकार के साथ एक समझौता-ज्ञापन पर हस्ताक्षर किए, जिसमें प्रधानमंत्री (@PrimeministerGR) और डिजिटल परिवर्तन मंत्री (@papastergiougr) की उपस्थिति रही, और लक्ष्य तीन हैं: वॉइस AI के माध्यम से सार्वजनिक सेवाओं तक पहुँच में सुधार, पर्यटन को बढ़ावा देना, और ग्रीक भाषाई विरासत का संरक्षण। यह सरकारी साझेदारी सार्वजनिक क्षेत्र में स्थापित होने की ElevenLabs की रणनीति को दर्शाती है, जिसमें उच्च-दृश्यता वाले संस्थागत उपयोगों पर जोर है।
Frontier Governance Framework — OpenAI अपनी प्रथाओं को TFAIA और EU AI Act के अनुरूप बनाता है
28 मई — OpenAI अपना Frontier Governance Framework प्रकाशित करती है, जो एक सार्वजनिक शासन दस्तावेज़ है और आंतरिक Preparedness Framework को ठोस नियामकीय दायित्वों में बदलता है। मुख्य लक्ष्य: कैलिफ़ोर्निया का Transparency in Frontier AI Act (TFAIA) और EU AI Act के सामान्य-उपयोग AI के लिए आचार संहिता।
यह framework आक्रामक साइबर, CBRN (रासायनिक, जैविक, रेडियोलॉजिकल, परमाणु), हानिकारक हेरफेर और नियंत्रण की हानि के क्षेत्रों में जोखिमों के आकलन और उन्हें कम करने को कवर करता है। इसमें मॉडल रिपोर्टिंग दायित्व, घटना प्रबंधन, बाहरी विशेषज्ञों की सहायता, और अद्यतन का एक तंत्र भी शामिल है। OpenAI स्पष्ट करती है कि Preparedness Framework उसका आंतरिक आधार बना हुआ है — कुछ प्रथाएँ मौजूदा कानूनी आवश्यकताओं से आगे जाती हैं।
🔗 Frontier Governance Framework
विश्वसनीय तृतीय-पक्ष मूल्यांकनों के लिए मार्गदर्शिका — विधि और नियंत्रित करने योग्य पाँच पूर्वाग्रह
29 मई — OpenAI फ्रंटियर AI मॉडलों के कठोर तृतीय-पक्ष मूल्यांकनों के लिए एक पद्धतिगत मार्गदर्शिका प्रकाशित करती है। दस्तावेज़ एक निष्कर्ष से शुरू होता है: मूल रूप से चैटबॉट्स के लिए डिज़ाइन किए गए मूल्यांकन अब उन एजेंटिक प्रणालियों के लिए उपयुक्त नहीं हैं जो टूल्स का उपयोग कर सकती हैं और लंबी समय-रेखाओं पर कार्य कर सकती हैं।
यह मार्गदर्शिका उन तीन प्रकार के दावों को अलग करती है जिन्हें मूल्यांकनों को समर्थित करना चाहिए: क्षमता-उत्प्रेरण (मॉडल सबसे अच्छी परिस्थितियों में क्या कर सकता है), सुरक्षा की मज़बूती (हमलों के प्रति प्रतिरोध), और प्रणालियों के बीच तुलना। एक केंद्रीय अवधारणा “हैर्नेस” है (मॉडल के चारों ओर रनटाइम वातावरण), जिसके विकल्प परिणामों को भौतिक रूप से बदल सकते हैं — OpenAI बहु-चरणीय साइबर मूल्यांकनों में GPT-5.5 के प्रदर्शन पर कॉन्टेक्स्ट कॉम्पैक्शन के प्रभाव का उल्लेख करती है।
पाँच वैधता पूर्वाग्रह पहचाने गए हैं: रिवॉर्ड हैकिंग (छोटे रास्तों का दुरुपयोग), वास्तविक क्षमताओं को छिपाने वाले इंकार, कंटैमिनेशन (बेंचमार्क की स्मृति), टूटी हुई समस्याएँ (असंभव या गलत स्कोर की गई टास्क), और सैंडबैगिंग (पहचाने गए मूल्यांकनों के दौरान जानबूझकर कम प्रदर्शन)। OpenAI तृतीय-पक्ष मूल्यांककों को अधिकतम क्षमता-उत्प्रेरण निर्देश प्रदान करने और तर्क-ट्रेसेज़ साझा करने का वादा करती है।
🔗 तृतीय-पक्ष मूल्यांकन मार्गदर्शिका — OpenAI
Grok Imagine Extend — निरंतर वीडियो विस्तार
29 मई — Grok Imagine Extend लॉन्च करता है, एक सुविधा जो मौजूदा वीडियो या छवियों से स्मूद ट्रांज़िशन के साथ निरंतर वीडियो बनाने की अनुमति देती है। यह सुविधा सीधे Grok Imagine इंटरफ़ेस में उपलब्ध है। @imagine खाते के ट्वीट को @grok ने रीपोस्ट किया और वह 701,000 व्यूज़ तक पहुँचा। यह घोषणा Grok के क्रिएटिव सूट को Grok Build और grok-build-0.1 API के साथ और मजबूत करती है।
Windows पर Codex Computer Use और मोबाइल नियंत्रण
29 मई — OpenAI घोषणा करती है कि Codex की “computer use” सुविधा अब Windows पर उपलब्ध है। एजेंट स्क्रीन देख सकता है, क्लिक कर सकता है और Windows ऐप्स में टेक्स्ट दर्ज कर सकता है, जिससे नेटिव परीक्षण, सिम्युलेटर-आधारित फ्लो, और केवल ग्राफ़िकल इंटरफ़ेस के माध्यम से सुलभ बग फिक्स के लिए रास्ता खुलता है। ChatGPT मोबाइल ऐप एक साथ Codex के लिए Windows समर्थन जोड़ता है: फोन से कार्यों का लॉन्च, निगरानी और नियंत्रण, जबकि काम PC पर जारी रहता है। OpenAI इस सुविधा को “प्रारंभिक अनुभव” कहती है; यह यूरोपीय आर्थिक क्षेत्र, यूनाइटेड किंगडम या स्विट्ज़रलैंड में उपलब्ध नहीं है।
🔗 Windows पर Codex Computer Use
संक्षिप्त खबरें
-
Salesforce + Claude Code — Boris Cherny (@bcherny) Claude Code के एजेंटिक उपयोग पर Salesforce का एक अनुभव साझा करते हैं: प्रारंभ में 231 दिनों का अनुमानित माइग्रेशन 13 दिनों में पूरा हुआ, 21 endpoints के लिए 100% टेस्ट कवरेज मिली, और PRs की मात्रा बढ़ने के बावजूद घटनाओं में 5% की गिरावट आई। 🔗 स्रोत
-
Google I/O 2026 — AI की मेकिंग-ऑफ — Google बताता है कि उसकी टीमों ने Google I/O 2026 के रचनात्मक अनुभव बनाने के लिए Gemini Omni, Nano Banana, Lyria 3 और Antigravity का उपयोग कैसे किया: एनिमेशन शॉर्ट फ़िल्म, दृश्य पहचान, इंटरैक्टिव म्यूज़िकल प्री-शो, जनरेटिव गेम्स। 🔗 स्रोत
-
Gemini CLI v0.44.0 — एकीकृत Auto Mode (विशेष मोड्स का विलय), Sublime Text और Emacs Client के लिए मूल समर्थन, नए प्रोग्रामेटिक TUI टेस्ट टूल्स। 🔗 स्रोत
-
GitHub Copilot — ऑटो मोड में मूल्यांकनाधीन मॉडल — व्यक्तिगत उपयोगकर्ताओं (Free, Pro, Pro+) को अब स्वचालित चयन
autoके माध्यम से प्री-GA मॉडलों तक पहुँच मिलती है। सेटिंग्स में अक्षम करने का विकल्प उपलब्ध है। 🔗 स्रोत -
ElevenLabs समिट वारसॉ — ElevenLabs द्वारा अब तक विकसित सबसे अभिव्यक्तिपूर्ण वॉइस मॉडल का पूर्वावलोकन, सह-संस्थापक Mati द्वारा प्रस्तुत। यह केवल एक प्रीव्यू है, कोई सार्वजनिक पहुँच घोषित नहीं की गई है। 🔗 स्रोत
-
Cohere Command A+ — अनुवाद बेंचमार्क — Command A+ WMT24++ पर Mistral Medium 3.5, DeepSeek, gpt-oss और Claude Opus 4.6 के साथ-साथ Google Translate से आगे निकलता है। दर्ज लाभ: फ़्रेंच में +2.4 अंक, स्पेनिश में +1.9 अंक, जर्मन में +0.9 अंक। 🔗 स्रोत
इसका क्या मतलब है
Anthropic की वित्तीय गति और सेक्टर का समेकन। Anthropic की गोपनीय S-1 फ़ाइलिंग सप्ताह की सबसे संरचनात्मक खबर है। यह असाधारण वृद्धि — सीरीज़ H में 65 अरब USD जुटाए गए, लगभग एक ट्रिलियन डॉलर का मूल्यांकन — के संदर्भ में आती है, और संकेत देती है कि फ्रंटियर AI की बड़ी कंपनियाँ अब सार्वजनिक बाज़ारों पर गंभीरता से विचार करना शुरू कर रही हैं। PBC (सार्वजनिक लाभ निगम) स्थिति को बनाए रखना एक मज़बूत प्रतिबद्धता है: Anthropic यह साबित करना चाहती है कि IPO लंबी अवधि की सुरक्षा मिशन के साथ संगत हो सकता है। यह मिसाल OpenAI और अन्य खिलाड़ियों के लिए भी निहितार्थ रखेगी जो इस रास्ते का अनुसरण कर सकते हैं।
Physical AI की लहर — ऐसी AI की ओर जो वास्तविक दुनिया में काम करती है। 1 जून भौतिक AI के इर्द-गिर्द एक उल्लेखनीय अभिसरण को चिह्नित करता है: NVIDIA Cosmos 3 (रोबोट और एजेंट्स के लिए पहला ओपन-वेट omni-model), Cosmos Coalition (Runway+NVIDIA का खुला पारिस्थितिकी तंत्र), Luma OPAL Lab (रोबोटिक सामान्यीकरण पर खुला शोध), MiniMax M3 (1M कॉन्टेक्स्ट + मूल बहु-माध्यमिता), Qwen-VLA (एकीकृत आर्किटेक्चर के तहत 11 प्रकार के रोबोट) और Qwen3.7-Plus (इंटरफ़ेस में GUI+CLI एजेंट के रूप में काम करता हुआ)। यह समूह संयोग नहीं है — यह इस बढ़ती सहमति को दर्शाता है कि AI की अगली सीमा भौतिक स्थान में क्रिया है, और open-source इसमें केंद्रीय भूमिका निभा रहा है। बंद और खुले मॉडलों के बीच प्रतिस्पर्धा तेज़ हो रही है, खासकर रोबोटिक्स और computer use बेंचमार्क्स में।
AI शासन और सुरक्षा अब सकारात्मक कानून में प्रवेश कर रहे हैं। कैलिफ़ोर्निया के TFAIA और EU AI Act के अनुरूप OpenAI के Frontier Governance Framework और तृतीय-पक्ष मूल्यांकन मार्गदर्शिका का प्रकाशन एक नए चरण को चिह्नित करता है: बड़ी AI कंपनियाँ अब अपने नियम केवल आंतरिक रूप से परिभाषित नहीं करतीं। वे उन्हें ठोस विधानों के साथ संरेखित करती हैं और अपनी मूल्यांकन विधियों को प्रकाशित करती हैं। Rosalind Biodefense पहल इस शासन के दूसरे पक्ष को दर्शाती है — सामाजिक रक्षा के लिए फ्रंटियर AI का उपयोग करना (महामारी तैयारी, जैव-सुरक्षा), उपयुक्त नियंत्रणों के साथ।
डेवलपर टूलिंग तेज़ हो रही है और खंडित भी। Claude Code को चार दिनों में पाँच संस्करण मिलते हैं, जिनमें Bedrock/Vertex/Foundry पर Auto Mode और स्थानीय प्लगइन्स का स्वचालित लोडिंग शामिल है। Gemini CLI v0.44.0 अपने Auto mode को एकीकृत करता है और IDE इंटीग्रेशन्स का विस्तार करता है। GitHub Copilot अपनी अपनाने की टैक्सोनॉमी (4 चरण, 28 दिन की विंडो) को परिष्कृत करता है ताकि संगठनों को अपने AI अपनाने की वास्तविक परिपक्वता मापने में मदद मिल सके। डेवलपर्स के पास अब घना और तेज़ी से विकसित होता एजेंटिक टूलिंग-सूट है — सवाल अब मॉडलों तक पहुँच का नहीं, बल्कि इस बात का है कि टीमें इन टूल्स को अपने वर्कफ़्लो में सुसंगत और मापनीय तरीके से कैसे एकीकृत करती हैं।
स्रोत
- Anthropic — SEC में गोपनीय S-1 फ़ाइलिंग
- NVIDIA Cosmos 3 X पर
- Cosmos Coalition — Runway X पर
- MiniMax M3 X पर
- Luma OPAL Lab X पर
- Luma OPAL Lab — @gravicle X पर
- Qwen3.7-Plus — Qwen ब्लॉग
- Qwen-VLA X पर
- Rosalind Biodefense — OpenAI
- Frontier Governance Framework — OpenAI
- विश्वसनीय तृतीय-पक्ष मूल्यांकन — OpenAI
- Windows पर Codex Computer Use — OpenAI X पर
- Grok Imagine Extend X पर
- Claude Code Releases
- Gemini Omni और 3.5 Flash — Google Blog
- Copilot उपयोग मीट्रिक्स API — GitHub चेंजलॉग
- ElevenLabs ग्रीस MOU X पर
- ElevenLabs समिट वारसॉ X पर
- Cohere Command A+ अनुवाद X पर
- Gemini CLI चेंजलॉग
- Google I/O 2026 — AI की मेकिंग-ऑफ
- Salesforce + Claude Code — @bcherny X पर
- GitHub Copilot — ऑटो में मूल्यांकनाधीन मॉडल