खोजें

Gemma 4 12B ओपन-सोर्स, Ideogram 4.0 ओपन-weights, Windows पर Perplexity Computer, Stargate Michigan

Gemma 4 12B ओपन-सोर्स, Ideogram 4.0 ओपन-weights, Windows पर Perplexity Computer, Stargate Michigan

ai-powered-markdown-translator

gpt-5.4-mini के साथ फ्र से hi में अनुवादित लेख।

GitHub पर प्रोजेक्ट देखें ↗

3 जून 2026 open-source से जुड़ी बड़ी घोषणाओं की एक लहर समेटे हुए है: Google Gemma 4 12B (मल्टीमॉडल, edge, Apache 2.0) प्रकाशित करता है और Co-Scientist, वैज्ञानिक शोध के लिए अपना multi-agent सिस्टम, लॉन्च करता है। Ideogram अपने version 4.0 के weights जारी करता है। Perplexity अपना Personal Computer agent Windows पर लाता है। OpenAI Michigan में The Barn नामक 1 GW datacenter का उद्घाटन करता है। GitHub Copilot VS Code, JetBrains, Eclipse और billing पर एक बड़ा अपडेट जारी करता है। xAI की तरफ, Grok Imagine 1.5 Preview API के जरिए उपलब्ध है और Grok की आवाज़ें Vapi पर आ रही हैं।


Gemma 4 12B — लैपटॉप के लिए ओपन-सोर्स मल्टीमॉडल मॉडल

3 जून — Google Gemma 4 12B लॉन्च करता है, जो एक एकीकृत मल्टीमॉडल मॉडल है जिसे सीधे लैपटॉप और edge computing उपकरणों पर चलाने के लिए डिज़ाइन किया गया है। इसकी मुख्य तकनीकी विशेषता इसकी encoder-free आर्किटेक्चर है, जो deployment को सरल बनाती है और software dependencies को कम करती है। मॉडल Apache 2.0 license के तहत जारी किया गया है, जिससे यह व्यावसायिक और शोध उद्देश्यों के लिए मुक्त रूप से उपयोग किया जा सकता है।

विशेषतामान
पैरामीटर12 अरब
modalityText + Image (एकीकृत)
आर्किटेक्चरबिना अलग encoder के (encoder-free)
लाइसेंसApache 2.0
हार्डवेयर लक्ष्यलैपटॉप, edge computing
उपलब्धताअभी डाउनलोड किया जा सकता है

इस घोषणा ने X पर 620,000 views और 5,000 likes उत्पन्न किए, जिससे यह सप्ताह की सबसे आकर्षक open-source घोषणाओं में से एक बन गई। Google DeepMind द्वारा repost किए गए, Gemma 4 12B Gemma के पिछले मॉडलों की निरंतरता में है, लेकिन यह vision और text को एक ही compact मॉडल में जोड़कर एक नई ऊँचाई पर पहुँचता है।

Developers के लिए, यह मॉडल cloud के बाहर deploy होने वाले multimodal AI applications की ओर एक व्यावहारिक रास्ता खोलता है — ऐसे machines पर जिनमें consumer GPU हों, बिना API subscription के।

🔗 लॉन्च ट्वीट @googlegemma


Google DeepMind Co-Scientist — वैज्ञानिक शोध के लिए multi-agent साझेदार

2 जून — Google DeepMind Co-Scientist प्रस्तुत करता है, जो Gemini-आधारित एक multi-agent सिस्टम है जिसे एक वास्तविक वैज्ञानिक शोध-साझेदार की तरह काम करने के लिए डिज़ाइन किया गया है। इसकी मुख्य क्षमता: वैज्ञानिक समस्याओं पर hypotheses उत्पन्न करना, बहस करना और विकसित करना—वह भी autonomous रूप से, और कम human intervention के साथ।

Co-Scientist केवल summary या document search का साधन नहीं है। यह मौलिक hypotheses प्रस्तावित कर सकता है, agents के बीच उन्हें अंदरूनी तौर पर परख सकता है, और फिर उन्हें परिष्कृत कर सकता है — एक ideation-debate-evolution चक्र जो अब तक केवल मानव शोध टीमों तक सीमित था। इस सिस्टम का मूल्यांकन विशेष benchmarks पर global scientific experts के साथ किया गया है।

उपलब्धता: Hypothesis Generation (waitlist) के माध्यम से individual researchers के लिए early access। विशिष्ट domains पर performance का मूल्यांकन करने के लिए global scientific experts के साथ सहयोग जारी है।

“We believe AI can be a dedicated research partner to help discover the next breakthrough.”

🇮🇳 हम मानते हैं कि AI एक समर्पित शोध-साझेदार हो सकता है, जो अगली बड़ी सफलता की खोज में मदद करे।@GoogleDeepMind

इस घोषणा ने X पर 144,000 views उत्पन्न किए। ऐसे समय में जब वैज्ञानिक क्षेत्र discovery cycles को तेज़ करने के दबाव में है, Co-Scientist सीधे उन individual researchers को लक्षित करता है जिनके पास बड़ी टीम के संसाधन नहीं हैं।

🔗 deepmind.google लेख


Ideogram 4.0 — डाउनलोड करने योग्य open-source weights, fine-tuning संभव

3 जून — Ideogram Ideogram 4.0 की घोषणा करता है, जिसे “दुनिया का सबसे अच्छा open-source image model” बताया गया है। यह घोषणा अपनी बेहद खुली philosophy के कारण अलग दिखती है: model weights डाउनलोड किए जा सकते हैं, developers उन्हें अपने data पर fine-tune कर सकते हैं और अपनी infrastructure पर deploy कर सकते हैं।

पहलूविवरण
उपलब्धतासभी Ideogram plans + API (अभी)
Hugging Face weightsideogram-ai/ideogram-4-nf4
Demohuggingface.co/spaces/multimodalart/ideogram4
Fine-tuningproprietary data पर अनुमत
Deploymentpersonal infrastructure संभव
X engagement396,800 views — मजबूत virality

इस घोषणा को Hugging Face ने खुले मॉडलों की गुणवत्ता में प्रगति के उदाहरण के रूप में दोहराया और समर्थन दिया। “Think it. Make it. Own it.” का slogan philosophy को संक्षेप में प्रस्तुत करता है: आम तौर पर बंद रहने वाले image generation models (Midjourney, DALL-E, हाल का Stable Diffusion) के विपरीत, Ideogram 4.0 studios और developers के लिए पूर्ण ownership का model प्रस्तुत करता है।

Creative teams के लिए, इसका लाभ तुरंत स्पष्ट है: बाहरी सेवा पर निर्भर हुए बिना अपने data पर style को personalize करना, और अंदर ही deploy करना।

🔗 घोषणा @ideogram_ai


Perplexity Personal Computer Windows पर आता है

3 जून — Perplexity अपने Personal Computer on Windows agent के आगमन की घोषणा करता है। अब तक केवल macOS पर उपलब्ध, यह agent Microsoft के operating system में प्रवेश करने वाला है।

“Personal Computer is coming to Windows. Personal Computer for Windows runs on your machine and orchestrates across the apps and files you use every day. We’ll roll out first to paying Max and Enterprise Max subscribers on the waitlist.”

🇮🇳 Personal Computer Windows पर आ रहा है। Windows के लिए Personal Computer आपकी मशीन पर चलता है और आपके द्वारा हर दिन उपयोग किए जाने वाले applications और files को orchestrate करता है। हम पहले waitlist में पंजीकृत भुगतान करने वाले Max और Enterprise Max subscribers के लिए इसे जारी करेंगे।@perplexity_ai

Personal Computer उपयोगकर्ता की मशीन पर स्थानीय रूप से चलता है — यह रोज़मर्रा के applications और files को cloud पर पूरी तरह निर्भर हुए बिना orchestrate करता है। यह local/cloud hybrid दृष्टिकोण Perplexity को purely cloud agents से अलग श्रेणी में रखता है: उपयोगकर्ता अपने संवेदनशील data पर नियंत्रण बनाए रखता है।

Deployment Max और Enterprise Max subscribers के बीच, जो waitlist पर हैं, perplexity.ai/personal-computer के माध्यम से शुरू होगा।

Perplexity Computer — व्यवसायों के लिए 400+ integrations

उसी दिन, Perplexity ने agent की enterprise क्षमताओं का दायरा स्पष्ट किया: सभी प्रकार के businesses को कवर करने वाले 400 से अधिक connected tools। जिन integrations का उल्लेख किया गया है उनमें शामिल हैं: Intuit QuickBooks (accounting), Vercel (web deployment), Shopify (e-commerce) और Canva (design)।

यह पूरक घोषणा Perplexity Computer को एक सार्वभौमिक enterprise agent के रूप में स्थापित करती है, जो मौजूद tools को बदले बिना मौजूदा workflows में एकीकृत हो सकता है।

🔗 व्यावसायिक integrations


Stargate Michigan — Saline में The Barn, 1 GW datacenter

1 जून — OpenAI और Governor Gretchen Whitmer मिलकर The Barn के लिए पहली खुदाई का उद्घाटन करते हैं, जो Saline, Michigan में 1 gigawatt का datacenter campus है। यह परियोजना OpenAI के Stargate कार्यक्रम का हिस्सा है — advanced AI के लिए दीर्घकालिक infrastructure निर्माण का प्रयास, Oracle, Related Digital, Walbridge और Blackstone के साथ साझेदारी में।

मीट्रिकमान
क्षमता1 GW
स्थानSaline, Michigan
निर्माण नौकरियाँ2,500+ (यूनियन)
स्थायी नौकरियाँ450
काउंटी + अप्रत्यक्ष नौकरियाँ2,500
rec center निवेश$10M (Oracle + Related Digital)
अनुमानित कर राजस्व$1 बिलियन (lease अवधि)
छात्रों के लिए Codex credits$45M तक
पात्र छात्र400,000+

सामुदायिक प्रतिबद्धताएँ स्पष्ट हैं: स्थानीय निवासियों को अपनी बिजली के बिलों पर infrastructure लागत का बोझ नहीं उठाना पड़ेगा। Cooling एक closed loop में काम करता है, जिसकी water consumption एक सामान्य office building के बराबर है।

Michigan student program राज्य के university, community college और trade school के 400,000 छात्रों (18 वर्ष और उससे अधिक, शैक्षणिक वर्ष 2026-2027) के लिए $45 मिलियन तक Codex credits प्रदान करता है।

🔗 openai.com घोषणा


GitHub Copilot in VS Code — मई रिलीज़ (v1.120–v1.123)

3 जून — GitHub Copilot for VS Code का मासिक recap प्रकाशित करता है, जिसमें मई 2026 के दौरान जारी v1.120 से v1.123 versions शामिल हैं। यह गहन अपडेट agents, synchronization और security पर कई महीनों के काम को एक साथ लाता है।

मुख्य नई सुविधाएँ:

  • Agents विंडो (stable preview): एक agent-first interface, जिससे कई projects पर एक साथ काम किया जा सकता है, तेज़ navigation और बदलावों की समीक्षा के साथ
  • दूरस्थ agents (preview): SSH या Dev Tunnels के माध्यम से दूरस्थ machines पर execution — client disconnect होने पर भी sessions बने रहते हैं
  • Agent Host Protocol (AHP): कई clients के बीच session state को synchronize करने के लिए open protocol
  • Session sync: chat sessions अपने-आप GitHub account में sync हो जाती हैं, और machines व workspaces के बीच देखी जा सकती हैं
  • /chronicle: past sessions पूछना, daily stand-up reports बनाना, personalized productivity advice प्राप्त करना
  • Terminal security: terminal में दर्ज passwords, PINs और verification codes कभी भी language model को नहीं भेजे जाते
  • Command risk assessment (experimental): terminal confirmations में AI-generated risk levels शामिल होते हैं
  • BYOK air-gapped: BYOK models isolated environments में GitHub access के बिना काम करते हैं
  • Configurable utility models: titles, summaries, rename suggestions, commit messages और intent detection के लिए models का चयन
  • Built-in browser: mobile device emulation, advanced screenshots (viewport, चयनित क्षेत्र, पूरा पृष्ठ), local HTML preview
  • Mermaid rendering और YAML front matter: Markdown preview में मूल रूप से एकीकृत
  • Terminal output compression: verbose patterns (tests, builds, linters, Docker, package managers) अपने-आप compress हो जाते हैं

Multi-agent work model आकार ले रहा है: Agents विंडो में कई agent sessions समानांतर चल सकती हैं, जिनमें से प्रत्येक का अपना context और GitHub account में sync किया गया history होता है।

🔗 VS Code मई changelog


Copilot Code Review — skills MCP और Medium analysis level (public preview)

2 जून — GitHub Copilot code review के लिए public preview में दो प्रमुख सुविधाएँ लॉन्च करता है, जिससे automatic reviews को हर team के context और complexity के अनुसार अनुकूलित किया जा सके।

Skills और MCP support: अब teams custom agent skills (files .github/skills/code-review/SKILL.md) और MCP servers से connections configure कर सकती हैं, ताकि हर review internal tool context से समृद्ध हो — issues tracking, documentation, service catalogs, incident tools। MCP configuration repository settings → Copilot → MCP servers से की जाती है। cloud agent के लिए कोई भी मौजूदा MCP configuration reviews पर अपने-आप लागू हो जाती है — एक बार निवेश, दोनों agents पर सुसंगत व्यवहार।

“Medium” level: एक नया मध्य स्तर complex pull requests को उच्च-reasoning model की ओर route करता है, जिसे subtle bugs पकड़ने, security logic का विश्लेषण करने और inter-service changes को संभालने के लिए डिज़ाइन किया गया है। Low स्तर सरल परिवर्तनों के लिए तेज़ और किफायती default बना रहता है। Medium, Low की तुलना में अधिक AI Credits खर्च करता है, और interface में लागत के स्पष्ट संकेत होते हैं। Admins प्रति repository level निर्धारित करते हैं।

Actions workflows भी configure किए जा सकते हैं, जिससे Copilot reviews के लिए उपयोग किए जाने वाले compute environment को नियंत्रित किया जा सके। Copilot Pro, Pro+, Business और Enterprise के लिए उपलब्ध।

🔗 Copilot Code Review को आकार देना


JetBrains IDEs में Copilot CLI और मजबूत agentic क्षमताएँ

2 जून — GitHub JetBrains में Copilot CLI के आने की घोषणा करता है, साथ में एक agent selector जो Agent (autonomous), Ask (त्वरित सहायता), Custom agents (customized) या Plan (collaborative planning) के बीच चयन करने देता है। तीन नए commands CLI sessions को समृद्ध करते हैं:

  • /remote : github.com या mobile app से CLI session को नियंत्रित करना
  • /compact : लंबे sessions के context को manually compress करना
  • /chronicle : history का विश्लेषण करना, stand-up reports बनाना और personalized advice प्राप्त करना

Agent debug panel (public preview) interactions का chronological log दिखाता है — विशेष रूप से custom agents और जटिल multi-agent workflows को debug करने में उपयोगी। Reasoning models का thinking effort model selector से सीधे configure किया जा सकता है, जिससे task के अनुसार analysis depth समायोजित की जा सकती है।

Cloud agent sessions अब unified sessions view में एकीकृत हैं, जिससे सभी sessions (local, CLI, cloud) को एक ही जगह से प्रबंधित किया जा सकता है। एक agent customization editor skills, instructions और prompts के निर्माण व प्रबंधन को केंद्रीकृत करता है।

नई sign-in options: उपलब्ध sign-in methods में Google और Apple जुड़ते हैं। GA में जाने वाली सुविधाओं में शामिल हैं: agent skills, agent hooks, prompt files और Anthropic Thinking। Copilot CLI agent को JetBrains में default experience बनाने के लिए एक क्रमिक rollout चल रहा है।

🔗 Copilot JetBrains changelog


GitHub Copilot billing और plans — usage-based billing GA, Copilot Max

1 जून — GitHub 1 जून 2026 से सभी Copilot plans के लिए usage-based billing (AI Credits) सक्रिय करता है। प्रत्येक plan में मासिक AI Credits quota शामिल है; उसके बाद, उपयोगकर्ता admins द्वारा परिभाषित सीमाओं के साथ अतिरिक्त खर्च budget configure करके उपयोग जारी रख सकते हैं।

संरचनात्मक बदलाव:

  • Copilot code review अब अतिरिक्त रूप से GitHub Actions minutes consume करता है — AI Credits के साथ मिलकर — admins संगठन स्तर पर सभी reviews के लिए एक default runner configure कर सकते हैं, बिना repository-by-repository configuration के
  • GA में प्रति-उपयोगकर्ता budgets: organization और enterprise admins universal या उपयोगकर्ता-विशिष्ट budgets परिभाषित करते हैं, limits के करीब पहुँचने पर email notifications के साथ
  • Copilot Max: मौजूदा Student, Pro और Pro+ subscribers के लिए आज से उपलब्ध upgrade — अधिक quota और intensive workflows के लिए उच्च spending limits
  • नई registrations निलंबित हैं Student, Pro, Pro+ और Max के लिए — अगले कुछ हफ्तों में पुनः खोलने की योजना है

Enterprise teams के लिए ध्यान देने योग्य बिंदु: admins को मॉडल policies के माध्यम से वैकल्पिक GPT-5.5 model सक्रिय करना होगा ताकि deprecated GPT-4.1 को बदला जा सके। एक बार सक्रिय होने पर, GPT-5.5 VS Code और github.com पर Copilot Chat के model selector में दिखाई देता है।

🔗 billing और plans अपडेट


xAI API में Grok Imagine 1.5 Preview उपलब्ध

3 जून — xAI ने Grok Imagine 1.5 Preview की उपलब्धता xAI API में घोषित की है, जिसे x.ai/api/imagine पर एक्सेस किया जा सकता है। यह Grok की इमेज-जनरेशन क्षमता का एक बड़ा अपडेट है — 1.5 Preview, Grok Imagine का उत्तराधिकारी है और xAI के इमेज मॉडल की एक नई पीढ़ी का प्रतिनिधित्व करता है, जो डेवलपर्स के लिए सीधे API के माध्यम से उपलब्ध है।

पहलूविवरण
मॉडलGrok Imagine 1.5 Preview
पहुँचxAI API — x.ai/api/imagine
स्थितिPreview (स्कैन के समय कोई आधिकारिक उत्पाद पेज नहीं)
उपलब्धताडेवलपर्स के लिए API के माध्यम से अभी उपलब्ध
X एंगेजमेंट164 800 views, ~1 000 likes

घोषणा वाला ट्वीट @grok खाते से आया था और उसे तुरंत @xai ने repost किया — यह टीम के लिए प्राथमिकता का संकेत है। Grok Imagine पहले से ही Grok इंटरफ़ेस में उपलब्ध था, लेकिन 1.5 Preview का API उपलब्ध होना xAI की इमेज-जनरेशन को उन डेवलपर्स के लिए खोलता है जो इसे अपनी एप्लिकेशन में एकीकृत करना चाहते हैं।

Grok Imagine 1.5 Preview, multimodal सेगमेंट में xAI के बढ़ते विस्तार का हिस्सा है: उसी दिन, Grok STT और Grok TTS APIs Vapi इंटीग्रेशन के माध्यम से अपनी पहुँच बढ़ाती हैं। xAI का इकोसिस्टम अब API के ज़रिए टेक्स्ट, इमेज और वॉइस को कवर करता है, और इस सेगमेंट में OpenAI तथा Google के ऑफ़रों के लिए एक पूर्ण विकल्प प्रस्तुत करता है।

🔗 @grok की घोषणा


Vapi पर उपलब्ध Grok STT और TTS

3 जून — xAI वॉइस APIs — Grok STT (speech recognition) और Grok TTS (speech synthesis) — अब Vapi, एक enterprise voice AI प्लेटफ़ॉर्म, में इंटीग्रेट हो चुकी हैं। अप्रैल 2026 में लॉन्च की गई ये APIs अब Vapi के माध्यम से enterprise voice agents बनाने वाले डेवलपर्स तक अपनी पहुँच बढ़ाती हैं।

घोषणा ने 433 300 views, 1 100 likes और 272 reposts उत्पन्न किए — तकनीकी इंटीग्रेशन घोषणा के लिए यह मजबूत एंगेजमेंट है। Vapi कस्टम वॉइस एजेंट बनाने की सुविधा देता है; Grok STT/TTS इंटीग्रेशन इसमें xAI के वॉइस मॉडल्स को ElevenLabs, Deepgram या OpenAI के विकल्प के रूप में जोड़ता है।

🔗 Vapi पर Grok


NVIDIA CVPR 2026 — AV, रोबोटिक्स, AI विज़न और Alpamayo 2 Super 32B के लिए Physical AI agent skills

3 जूनCVPR 2026 (Denver, 3–7 जून) के अवसर पर NVIDIA autonomous vehicles, रोबोटिक्स और AI विज़न के लिए पूरे research cycle को कवर करने वाली Physical AI agents की नई पीढ़ी के skills प्रस्तुत कर रहा है।

autonomous vehicles के लिए प्रमुख घोषणाएँ:

  • AlpaGym : बंद-लूप (closed-loop) reinforcement learning फ्रेमवर्क, जिसे हज़ारों GPU तक स्केल किया जा सकता है
  • OmniDreams : action-conditioned generative world model
  • Alpamayo 2 Super : level 4 autonomous driving के लिए 32 billion parameters वाला open-source VLA (Vision-Language-Action) मॉडल

रोबोटिक्स के लिए: native agent connectors, mobility skills, sim-to-real reinforcement learning, और surgical robotics के लिए Cosmos-H-Surgical-Simulator के साथ Isaac Sim 6.0।

AI विज़न के लिए: synthetic visual anomalies उत्पन्न करने के लिए Metropolis skills और औद्योगिक निरीक्षण के लिए Defect Image Generation skill।

Physical AI Dataset NVIDIA Hugging Face पर 15 million downloads से अधिक हो चुका है। ये skills GitHub और NVIDIA Brev पर उपलब्ध हैं, साथ ही H100 पर मुफ्त trial credits भी उपलब्ध हैं।

🔗 NVIDIA CVPR 2026 Physical AI


NVIDIA Transaction Foundation Models — Revolut, Mastercard, Adyen, Stripe

1 जून — NVIDIA बताता है कि बड़ी वित्तीय संस्थाएँ transaction foundation models की ओर कैसे अभिसरण कर रही हैं — ऐसे foundation models जिन्हें अरबों proprietary financial events पर प्रशिक्षित किया गया है।

संस्थादृष्टिकोणप्रमुख परिणाम
RevolutPRAGMA — 24 billion events, 26M users, 100+ देशोंएक ही मॉडल विशेषीकृत मॉडल्स (fraud, credit, reco) से बेहतर प्रदर्शन करता है
Mastercardअरबों transactions पर बड़ा tabular model (NVIDIA NeMo AutoModel)उपयोग: fraud, credit, loyalty
Adyen$1 trillion payments के पैमाने पर deployed मॉडल्स, conversion के लिए RL”0,1% authorization = बड़ा प्रभाव”
Stripetransactional behavioral context$112 billion fraud blocked/year, -38% fraud rate

NVIDIA AWS SageMaker HyperPod और Nebius AI Cloud पर उपलब्ध “Build Your Own Transaction Foundation Model” का एक development example प्रदान करता है।

🔗 NVIDIA Transaction Foundation Models


Anthropic — Partner Network, cyber threats और Claude Code /fork

Claude Partner Network — Services Track और Partner Hub

3 जून — Anthropic अपने partner network को दो नई संरचनाओं के साथ विस्तारित कर रहा है: Services Track और Claude Partner Hub

Services Track तीन-स्तरीय प्रणाली है, जो फर्मों का मूल्यांकन Claude के साथ उनके वास्तविक अभ्यास के आधार पर करती है:

स्तरसक्रिय प्रमाणिततैनात क्लाइंटसार्वजनिक प्रशंसापत्र
Select10+2+ (12 महीने)1+
Preferred100+15+3+
Global Premier1 000+100+ (3 क्षेत्र)15+

Claude Partner Hub एक ऐसा पोर्टल है जिसमें हर partner की प्रगति की daily update मिलती है, और Hub की जानकारी को सीधे Claude से query करने के लिए एक MCP connector भी है।

मुख्य आँकड़े: partner training में $100 million का निवेश, मार्च में launch के बाद से 40 000+ applications, और अब तक 10 000+ certified consultants। जुड़े हुए firms में शामिल हैं: Accenture (30 000 trained professionals), Deloitte (470 000 लोग), KPMG (276 000+), Cognizant, PwC।

🔗 Services Track और Partner Hub


MITRE ATT&CK रिपोर्ट — AI द्वारा सक्रिय एक वर्ष की cyber threats

3 जून — Anthropic की Frontier Red Team मार्च 2025 से मार्च 2026 तक के 832 banned accounts का विश्लेषण प्रकाशित करती है, जिन्हें MITRE ATT&CK framework पर mapped किया गया है।

तीन मुख्य निष्कर्ष:

संकेतकसंख्या
विश्लेषित खाते832 (मार्च 2025 – मार्च 2026)
malware लेखन के लिए AI उपयोग560/832 (67,3%)
अवधि की शुरुआत में मध्यम+ जोखिम वाले actors33%
अवधि के अंत में मध्यम+ जोखिम वाले actors56% (+1,7×)
निष्क्रिय की गई espionage operationनवंबर 2025 — अधिकतम स्कोर 100/100

Agentic orchestration — यानी एक हमले के चरणों को स्वायत्त रूप से क्रमबद्ध करने वाला मॉडल — अभी तक MITRE ATT&CK framework द्वारा कवर नहीं किया गया है। Anthropic ने framework को विकसित करने के लिए MITRE के साथ चर्चाएँ शुरू की हैं, और Verizon की DBIR 2026 रिपोर्ट की अगली कड़ी में यह डेटा प्रकाशित कर रहा है।

🔗 Anthropic रिपोर्ट — AI cyber threats


Claude Code /fork पुनर्रचित — सटीक context वाला बैकग्राउंड agent

3 जून — Anthropic Claude Code में /fork के व्यवहार को बदल रहा है। नया /fork एक background agent लॉन्च करता है जो वर्तमान session के context (system prompt, tools, history, model, prompt cache) को बिल्कुल उसी रूप में inherit करता है और अपना परिणाम मूल session में वापस करता है।

कमांडव्यवहार
/fork (नया)सटीक context + prompt cache के साथ background agent लॉन्च करता है → परिणाम session में वापस आता है
/branch (ex-/fork)transcript को एक नए, manually driven session में कॉपी करता है

यह बदलाव /fork को Claude Code के multi-agent work model की दिशा में विकास में शामिल करता है।

🔗 @ClaudeDevs का ट्वीट


OpenAI Blueprint — frontier AI की लोकतांत्रिक governance

3 जून — OpenAI एक public policy document (“blueprint”) प्रकाशित करता है, जो बताता है कि संयुक्त राज्य अमेरिका frontier AI systems को govern करने के लिए एक टिकाऊ federal framework कैसे बना सकते हैं।

3-स्तरीय रणनीति:

  1. राष्ट्रीय ढाँचा — राज्य-स्तर के कानूनों (California SB 53, New York RAISE Act, Illinois SB 315) से उभरते consensus पर आधारित होना
  2. CAISI को मज़बूत करना — Center for AI Safety and Innovation को frontier AI सुरक्षा के लिए मुख्य federal संस्था बनाना
  3. राष्ट्रीय resilience plan — frontier AI द्वारा उत्पन्न national security और public safety चुनौतियों के सामने सरकार को mobilize करना

यह blueprint White House द्वारा एक दिन पहले प्रकाशित Executive Order “Promoting Advanced Artificial Intelligence Innovation and Security” के बाद आया है।

🔗 OpenAI Blueprint


Gemini CLI v0.45.0 और Wan के रचनात्मक tools

Gemini CLI v0.45.0

3 जून — Google Gemini CLI का स्थिर v0.45.0 संस्करण जारी करता है, जिसमें ContextManager (conversation context management का केंद्रीय घटक) का architectural overhaul किया गया है ताकि robustness और performance में सुधार हो सके।

सुविधाविवरण
Context SimplificationContextManager का बड़ा पुनर्रचना
A2A Usage MetadataAgent-to-Agent protocol में metadata का exposure
Termux सुधारअनंत relaunch loops का समाधान (Android environment)
PTY resizeआकार बदलने की त्रुटियों का सुधार
Topic updatesconflicts से बचने के लिए बाध्य sequential execution

🔗 Gemini CLI Changelog


Wan — नए Extract Line Art और Render skills

3 जून — Wan (Alibaba Tongyi Lab का video और image model) दो नए रचनात्मक tools लॉन्च करता है: Extract Line Art (जटिल visuals को साफ़, सटीक line art में बदलना) और Render (line art को तुरंत final visual में बदलना)। दोनों skills create.wan.video/lab/skill पर उपलब्ध हैं। इस घोषणा ने कुछ ही घंटों में लगभग 600 000 views उत्पन्न किए।

🔗 Wan की घोषणा


GPT-4.1 Copilot से हटाया गया — GPT-5.5 से बदला गया

2 जून — GitHub सभी GitHub Copilot अनुभवों (chat, inline edits, ask और agent modes, code completions) में GPT-4.1 की depreciation को आधिकारिक रूप से घोषित करता है, जो 1 जून 2026 से प्रभावी है। अनुशंसित विकल्प GPT-5.5 है। Enterprise प्रशासकों को अपने Copilot settings में model policies के माध्यम से GPT-5.5 access सक्षम करना होगा। GPT-4.1 को हटाने के लिए कोई manual action आवश्यक नहीं है।

🔗 GPT-4.1 deprecated


Azure Repos के लिए Copilot Code Review (तकनीकी preview)

2 जून — GitHub Azure Repos के लिए Copilot code review को तकनीकी preview में लॉन्च करता है। उपयोगकर्ता Azure DevOps pull request से सीधे Copilot review माँग सकते हैं — inline comments, improvement suggestions, और issues की detection। Azure DevOps ग्राहकों के लिए GitHub Copilot license आवश्यक नहीं है। उपयोग का बिल AI credits GitHub में आता है, मौजूदा Copilot plans से अलग।

🔗 Copilot Code Review — Azure Repos


Cohere Co/plot — AI research के लिए open source visualization tool

3 जून — Cohere Labs co/plot प्रकाशित करता है, जो AI शोधकर्ताओं के लिए एक open source data visualization tool है। Tiny Aya (70+ भाषाओं वाला multilingual model) के विकास के दौरान एक वास्तविक आवश्यकता से जन्मा, co/plot Matplotlib की सीमाओं (हर परिवर्तन पर पूरी rerun) और Figma की सीमाओं (वास्तविक डेटा से disconnected) को दूर करता है।

यह tool वास्तविक डेटा में anchored, preset और customizable style के साथ तेज़ prototyping प्रदान करता है। open science की भावना में प्रकाशित, यह coplot.vercel.app पर उपलब्ध है।

🔗 Cohere co/plot


संक्षिप्त समाचार

  • Claude Code v2.1.161 — नया संस्करण: OTEL_RESOURCE_ATTRIBUTES मीट्रिक labels के रूप में, आंशिक विफलता की स्थिति में स्वतंत्र parallel tool calls, बेहतर Linux clipboard (wl-copy/xclip/xsel), git worktrees में /autofix-pr सुधार। 🔗 Releases

  • Anthropic ने AI Executive Order का समर्थन किया — Anthropic “Promoting Advanced Artificial Intelligence Innovation and Security” EO का स्वागत करता है और उसके implementation के लिए White House के साथ सहयोग की घोषणा करता है। 🔗 AnthropicAI का ट्वीट

  • Eclipse में GitHub Copilot — Business और Enterprise के लिए BYOK उपलब्ध, ताज़ा chat interface, skills और prompt files, thinking blocks (Thinking blocks), बेहतर ABAP support। 🔗 Eclipse changelog

  • NVIDIA Research CVPR — NVIDIA Research CVPR 2026 में advanced grasping, intelligent autonomous driving और बड़े पैमाने पर agent training पर कार्य प्रस्तुत करता है। 🔗 NVIDIA Blog

  • Fun-Realtime-TTS #1 Speech Arena — Alibaba का Fun-Realtime-TTS (TONGYI_SpeechAI टीम) Artificial Analysis के Speech Arena Leaderboard में पहले स्थान पर पहुँचता है (Elo 1 219), Google Gemini 3.1 Flash TTS और Inworld Realtime TTS-2 से आगे। 🔗 @Ali_TongyiLab का ट्वीट

  • Go by Gopuff — AI shopping assistant — “Go by Gopuff” का लॉन्च, xAI के साथ सह-विकसित personal shopping assistant, जो कुछ ही मिनटों में त्वरित delivery के लिए Grok models (text, audio, image) द्वारा संचालित है। 🔗 xAI की घोषणा

  • OpenAI teaser “It’s time to fly.” — OpenAI ने एक embedded video के साथ pinned tweet “It’s time to fly.” प्रकाशित किया (68k+ views, @OpenAIDevs द्वारा reposted)। स्कैन के समय कोई संबंधित product page उपलब्ध नहीं था — संभावित imminent announcement अभी प्रकाशित नहीं हुआ है। 🔗 @OpenAI का ट्वीट


इसका क्या अर्थ है

Open-source/open-weights wave और अधिक मज़बूत हो रही है। Gemma 4 12B (Apache 2.0, edge, multimodal) और Ideogram 4.0 (downloadable weights, मुक्त fine-tuning) एक संरचनात्मक प्रवृत्ति का प्रतिनिधित्व करते हैं: बड़ी टीमें competitive models को permissive licenses के तहत जारी कर रही हैं, जिससे बंद offerings और open-source alternatives के बीच का अंतर कम हो रहा है। डेवलपर्स के लिए, 3 जून का दिन एक दुर्लभ क्षण है जब एक अग्रणी vision model और एक अग्रणी image model एक साथ बिना commercial बाधा के उपलब्ध हो जाते हैं।

स्थानीय/डेस्कटॉप agents नया प्रतिस्पर्धी मोर्चा बन रहे हैं। Windows पर Perplexity Personal Computer — जो सीधे मशीन पर चलता है — एक स्पष्ट माँग का उत्तर देता है: कंपनियाँ cloud में अपने संवेदनशील डेटा को उजागर किए बिना agents की autonomy चाहती हैं। DeepMind का Co-Scientist व्यक्तिगत शोधकर्ताओं को एक scientific reasoning partner के साथ लक्षित करता है। पुनर्रचित Claude Code /fork का multi-agent background agent इस चित्र को पूरा करता है: तीन अलग-अलग ecosystems (Perplexity, Google, Anthropic) एक ही paradigm की ओर अभिसरित हो रहे हैं — एक ऐसा agent जो समृद्ध context के साथ, समानांतर में काम करे, और निरंतर मानव हस्तक्षेप के बिना चले।

GitHub Copilot developer tooling में अपनी बढ़त को मज़बूत कर रहा है। जून की लहर — usage-based billing GA, Copilot Max, Code Review Medium, JetBrains CLI, session sync, BYOK air-gapped — अलग-अलग सुविधाओं का समूह नहीं है, बल्कि एक सुसंगत platform है जो एक मॉडल की ओर धकेलता है: सभी IDEs, सभी machines से सुलभ एक ही agent, जिसमें हर टीम के लिए उपयुक्त नियंत्रण स्तर (MCP, skills, reasoning effort) हो। GPT-4.1 का GPT-5.5 से replacement इसी निरंतर upgrade logic का हिस्सा है।

Physical AI और AI infrastructure वास्तविक अर्थव्यवस्था में जड़ें जमा रहे हैं। Stargate Michigan (1 GW, 2 500 union jobs, $1 billion projected tax revenue) और NVIDIA CVPR 2026 (level 4 autonomous driving के लिए Alpamayo 2 Super 32B, 15 million downloads वाले Physical AI datasets) संकेत देते हैं कि AI केवल software domain से बाहर निकलकर उच्च physical intensity वाले क्षेत्रों — datacenters, autonomous vehicles, robotics — में प्रवेश कर रहा है। वित्तीय संस्थाएँ (Revolut, Mastercard, Adyen, Stripe) भी इसी तर्क का अनुसरण कर रही हैं: अपने proprietary data पर प्रशिक्षित foundation models, न कि generic APIs।


स्रोत