खोजें

Project Glasswing और Claude Mythos Preview, Meta Muse Spark, Gemini CLI v0.37.0

Project Glasswing और Claude Mythos Preview, Meta Muse Spark, Gemini CLI v0.37.0

5 से 9 अप्रैल 2026 का सप्ताह दो बड़ी घोषणाओं से प्रभावित रहा: Anthropic ने Project Glasswing का अनावरण किया, जो Claude Mythos Preview के इर्द-गिर्द ग्यारह बड़ी tech कंपनियों का गठबंधन है और बड़े पैमाने पर zero-day vulnerabilities का पता लगाने के लिए बनाया गया है, जबकि Meta ने Muse Spark के साथ वापसी की, जो एक साल में उसका पहला non open-weights मॉडल है। समानांतर रूप से, Google, OpenAI, GitHub और Perplexity ने अपने डेवलपर्स और उपयोगकर्ताओं के लिए उल्लेखनीय अपडेट जारी किए।


Project Glasswing और Claude Mythos Preview

7 अप्रैल 2026 — Anthropic ने Project Glasswing की घोषणा की, जो software security की एक पहल है और ग्यारह संगठनों को साथ लाती है: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, The Linux Foundation, Microsoft, NVIDIA और Palo Alto Networks। यह पहल सीमित एक्सेस वाले एक नए frontier model की क्षमताओं पर आधारित है: Claude Mythos Preview

Mythos Preview क्या करता है

मॉडल ने प्रमुख operating systems और web browsers में हजारों zero-day vulnerabilities की पहचान करने की क्षमता दिखाई है, जिनमें से कुछ कई दशकों से निष्क्रिय पड़ी थीं। तीन ठोस उदाहरण खोजों के दायरे को दिखाते हैं:

  • OpenBSD में 27 साल पुरानी एक खामी, जो किसी भी कनेक्टेड मशीन को remote रूप से crash करने की अनुमति देती है
  • FFmpeg में 16 साल पुरानी एक vulnerability, जो code की एक ऐसी पंक्ति में छिपी थी जिसे detect हुए बिना पाँच मिलियन से अधिक बार test किया गया था
  • Linux kernel में कई खामियाँ, जो privilege escalation के जरिए मशीन के पूर्ण नियंत्रण तक पहुँचने की अनुमति देती हैं

ये उदाहरण दिखाते हैं कि Mythos Preview सतही detection नहीं करता — यह critical codebases में गहराई से दबी logic errors को ढूँढ़ निकालता है, जिन्हें वर्षों से हजारों researchers लगातार audit करते रहे हैं।

Benchmarks

संदर्भ benchmarks पर Mythos Preview का प्रदर्शन Opus 4.6 की तुलना में स्पष्ट प्रगति दिखाता है:

BenchmarkMythos PreviewOpus 4.6
SWE-bench Verified93,9 %80,8 %
SWE-bench Pro77,8 %53,4 %
Terminal-Bench 2.082,0 %65,4 %
SWE-bench Multilingue87,3 %77,8 %
CyberGym (cybersecurity)83,1 %66,6 %
GPQA Diamond94,6 %91,3 %
Humanity’s Last Exam (बिना tools)56,8 %40,0 %

SWE-bench Verified पर छलांग — 80.8% से 93.9% — विशेष रूप से महत्वपूर्ण है: यह किसी मॉडल की वास्तविक open source repositories में वास्तविक bugs को हल करने की क्षमता मापने के लिए सबसे अधिक उपयोग किया जाने वाला benchmark है। CyberGym पर, जो cybersecurity को समर्पित है, 16 से अधिक अंकों की बढ़त Mythos Preview को offensive और defensive security tasks के लिए एक अलग श्रेणी में रखती है।

वित्तीय प्रतिबद्धता और शासन

Anthropic परियोजना के partners के लिए usage credits में 100 मिलियन डॉलर देने की प्रतिबद्धता जताता है, साथ ही open source security संगठनों को direct donations में 4 मिलियन डॉलर:

  • Linux Foundation के माध्यम से Alpha-Omega और OpenSSF को 2.5 M$
  • Apache Software Foundation को 1.5 M$

वित्तीय प्रतिबद्धता का यह स्तर संकेत देता है कि Anthropic Glasswing को एक दीर्घकालिक पहल के रूप में रख रहा है, न कि केवल communication partnership के रूप में। ठीक की गई vulnerabilities पर report 90 दिनों के भीतर प्रकाशित की जाएगी।

उपलब्धता और मूल्य निर्धारण

Mythos Preview तत्काल सार्वजनिक रूप से उपलब्ध नहीं कराया गया है। प्रारंभिक credits phase समाप्त होने के बाद, मॉडल participants के लिए 25 /125/125 प्रति मिलियन tokens (input/output) की दर पर, Claude API, Amazon Bedrock, Google Cloud Vertex AI और Microsoft Foundry के माध्यम से उपलब्ध होगा।

खोजी गई vulnerabilities और exploits पर विस्तृत technical report Anthropic के Red Team blog पर उपलब्ध है, और पूरी system card anthropic.com पर प्रकाशित की गई है।

“This project represents a watershed moment for AI-assisted cybersecurity — not because of what Claude can do today, but because of what it will be able to do as capabilities continue to scale.”

🇮🇳 यह परियोजना AI-सहायता प्राप्त cybersecurity के लिए एक निर्णायक क्षण का प्रतिनिधित्व करती है — इसलिए नहीं कि Claude आज क्या कर सकता है, बल्कि इसलिए कि क्षमताएँ लगातार विकसित होने के साथ वह क्या करने में सक्षम होगा। — आधिकारिक Anthropic घोषणा

🔗 Project Glasswing · System Card Mythos Preview · Red Team रिपोर्ट


Meta Muse Spark: बंद मॉडल के साथ Meta की वापसी

8 अप्रैल 2026 — Meta ने Muse Spark की घोषणा की, जो नई “Muse” family का पहला मॉडल है, जिसे Meta Superintelligence Labs (MSL) ने विकसित किया है — advanced AI research को समर्पित एक नई internal entity। यह अप्रैल 2025 में Llama 4 के बाद Meta का पहला मॉडल है, यानी एक साल की चुप्पी के बाद, और सबसे बढ़कर पहला Meta मॉडल जो open-weights में उपलब्ध नहीं है

क्षमताएँ और positioning

Muse Spark को “personal superintelligence” (personal superintelligence) की दिशा में एक कदम के रूप में position किया गया है। मॉडल advanced capabilities के साथ कई domains को cover करता है:

Domainविवरण
MultimodalAdvanced visual perception और understanding, cross visual information integration
ReasoningStep-by-step reasoning, जवाब देने से पहले सोचना (test-time reasoning)
HealthMedical image analysis, personalized dietary recommendations
AgenticComplex tasks के लिए agent capabilities
Contemplating modeसमानांतर reasoning करने वाले कई agents का orchestration (progressive deployment)

मॉडल reasoning tokens को optimize करने के लिए “thought compression” (thought compression) को integrate करता है, और कई parallel agents के माध्यम से test-time scaling को support करता है। Contemplating mode, जो अभी progressive deployment में है, सबसे प्रतीक्षित features में से एक है: यह एक ही problem पर कई agents को समानांतर रूप से assign करने की अनुमति देता है, जहाँ synthesis से पहले प्रत्येक independent रूप से reasoning करता है।

प्रदर्शन

Artificial Analysis (8 अप्रैल 2026) के अनुसार, Muse Spark Artificial Analysis Intelligence Index पर 52 का score हासिल करता है, जिससे यह Gemini 3.1 Pro, GPT-5.4 और Claude Opus 4.6 के पीछे दुनिया के top 4 में आ जाता है। Meta के लिए यह एक उल्लेखनीय वापसी है, जो सीधे सर्वश्रेष्ठ frontier models की श्रेणी में लौटता है।

Architecture

Meta Muse Spark के लिए scaling के तीन axes का वर्णन करता है:

  1. Pretraining: नौ महीनों में stack की पूर्ण पुनर्रचना, architecture और data improvements के साथ
  2. Reinforcement Learning (Reinforcement Learning): post-pretraining capabilities का scalable amplification
  3. Test-time reasoning: agent parallelization के कारण latency बढ़ाए बिना extended reasoning

सुरक्षा और उपलब्धता

Meta बताता है कि उसने अपने Advanced AI Scaling Framework v2 के माध्यम से गहन evaluations किए हैं। Apollo Research ने pre-launch checkpoint पर third-party evaluations किए और high-risk domains (biology आदि) में मजबूत refusal behaviors देखे।

Muse Spark 8 अप्रैल से meta.ai और Meta AI app में उपलब्ध है। API access selected partners के लिए private preview में है — तत्काल public access नहीं है।

🔗 Meta AI ब्लॉग — Muse Spark · घोषणा Tweet · Artificial Analysis Benchmark


Anthropic: infrastructure और agents

Google + Broadcom partnership — 2027 से कई gigawatts TPU

6 अप्रैल 2026 — Anthropic ने Google और Broadcom के साथ next-generation TPU compute capacity के कई gigawatts पर एक agreement की घोषणा की, जिसे 2027 से service में आना है। यह Anthropic के इतिहास की सबसे बड़ी infrastructure commitment है।

growth context महत्वपूर्ण है:

  • Annualized revenue (run-rate revenue) अब 30 बिलियन डॉलर से अधिक है, जबकि 2025 के अंत में यह लगभग 9 बिलियन था
  • 1,000 से अधिक enterprise customers प्रत्येक सालाना एक मिलियन डॉलर से अधिक खर्च करते हैं, जबकि फरवरी 2026 में 500+ थे — यानी दो महीने से भी कम समय में doubling

“This groundbreaking partnership with Google and Broadcom is a continuation of our disciplined approach to scaling infrastructure: we are building the capacity necessary to serve the exponential growth we have seen in our customer base while also enabling Claude to define the frontier of AI development.”

🇮🇳 Google और Broadcom के साथ यह partnership infrastructure scale-up के लिए हमारे कठोर दृष्टिकोण का हिस्सा है: हम अपने customer base की exponential growth का जवाब देने के लिए आवश्यक capacity बना रहे हैं, साथ ही Claude को AI development की frontier परिभाषित करने में सक्षम बना रहे हैं। — Krishna Rao, Anthropic के CFO

नए compute का अधिकांश हिस्सा United States में install किया जाएगा, जो नवंबर 2025 की उस commitment की निरंतरता है जिसमें American infrastructure में 50 बिलियन डॉलर invest करने की बात कही गई थी। Claude तीनों प्रमुख cloud platforms पर उपलब्ध एकमात्र frontier model बना हुआ है: AWS Bedrock, Google Cloud Vertex AI और Microsoft Azure Foundry।

🔗 Partnership announcement

Managed Agents — decoupled architecture, latency में 90% कमी

8 अप्रैल 2026 — Anthropic के Engineering Blog ने Claude platform पर long-running agents execute करने के लिए hosted service Managed Agents की architecture को detail करने वाला एक technical article प्रकाशित किया।

मुख्य विचार brain (Claude और उसका harness), hands (execution sandbox, tools) और session (event log) का decoupling है। प्रत्येक component एक स्वतंत्र interface बन जाता है, जिसे अलग से replace और scale किया जा सकता है।

decoupling के measured results:

MetricImprovement
p50 TTFT (time to first token)-60 %
p95 TTFT-90 %

decoupling दो security problems को भी हल करता है: credential isolation (OAuth tokens code execution sandbox से कभी accessible नहीं होते) और resilience (यदि harness गिर जाता है, तो नया harness context loss के बिना last session event से restart होता है)।

🔗 Managed Agents को scale करना


Google Gemini

Gemini CLI v0.37.0 — Dynamic Sandbox, Chapters और persistent Browser

8 अप्रैल 2026 — Gemini CLI का v0.37.0 version developer workflows के लिए तीन evolutions पेश करता है:

Featureविवरण
Dynamic Sandbox ExpansionDynamic sandbox expansion + Linux और Windows के लिए worktree support
Chapters (Narrative Flow)बेहतर session structure के लिए tools का thematic grouping “chapters” में
Advanced Browser CapabilitiesPersistent browser sessions और browser agent में dynamic tool discovery

Chapters feature लंबी sessions में narrative continuity लाता है: actions का प्रत्येक group अपनी logic के साथ एक “chapter” बनाता है, जिससे complex session को track करना और resume करना आसान हो जाता है। browser agent में persistence बढ़ता है — sessions calls के बीच active रहती हैं, और available tools dynamically discover किए जाते हैं।

🔗 Gemini CLI Changelog

Gemini App में interactive simulations और 3D models

9 अप्रैल 2026 — Gemini App अब complex concepts को सीधे chat में interactive visualizations में बदल सकता है। एक user real time में physical parameters (speed, gravity, mass) adjust कर सकता है और functional simulation पर effect देख सकता है — lunar orbit, molecule rotation, dynamic systems। prompt bar में Pro model के साथ globally available। Education और Workspace accounts के लिए तत्काल उपलब्ध नहीं।

🔗 Gemini App में 3D simulations

Gemini Notebooks — NotebookLM के साथ synchronization

8 अप्रैल 2026 — Google Gemini App में Notebooks लॉन्च करता है: persistent workspaces जो complex projects के लिए Gemini App और NotebookLM को synchronize करते हैं। notebooks conversations, custom instructions और files (documents, PDF) को organize करने की अनुमति देते हैं। Gemini App में जोड़ी गई source automatically NotebookLM में दिखाई देती है, और vice versa। इस सप्ताह web पर Google AI Ultra, Pro और Plus subscribers के लिए available। Mobile और free access बाद में आएँगे।

🔗 Gemini Notebooks + NotebookLM


OpenAI

नया Pro tier 100 $/month — 5x अधिक Codex

9 अप्रैल 2026 — OpenAI **100 /monthपरएकनयाProtierपेशकरताहै,जिसेPlustier( 20/month** पर एक नया Pro tier पेश करता है, जिसे Plus tier (~20 /month) और मौजूदा 200 $/month Pro के बीच position किया गया है। यह Plus tier की तुलना में पाँच गुना अधिक Codex usage देता है, जिसे लंबी और intensive sessions के लिए design किया गया है।

TierPriceCodex usage
Plus~20 $/monthStandard
Pro (new)100 $/month5× Plus
Pro (existing)200 $/monthMaximum

समानांतर रूप से, OpenAI मौजूदा 200 $/month subscribers के लिए 2x Codex usage promotion को 31 मई 2026 तक बढ़ाता है और उनकी rate limits reset करता है।

“Next phase of enterprise AI” — Denise Dresser की note

8 अप्रैल 2026 — Chief Revenue Officer Denise Dresser अपने पहले 90 दिनों के बाद एक summary प्रकाशित करती हैं। मुख्य बिंदु: enterprise business अब revenue के 40% से अधिक का प्रतिनिधित्व करता है (2026 के अंत तक consumer business के साथ parity की trajectory पर), Codex 3 million weekly users से अधिक है (2026 की शुरुआत से +5x), और ChatGPT के 900 million weekly users हैं। OpenAI दो strategic axes प्रस्तुत करता है: OpenAI Frontier (enterprise systems में traverse करने वाले agents) और teams के लिए एक unified AI superapp

🔗 Enterprise AI का next phase

Safety Fellowship और Child Safety Blueprint

6-8 अप्रैल 2026 — OpenAI ने दो सुरक्षा पहलों की घोषणा की। OpenAI Safety Fellowship (6 अप्रैल) एक बाहरी शोध कार्यक्रम है, जो 3 मई 2026 तक खुला है, जिसमें मूल्यांकन, मजबूती और agentic supervision पर काम के लिए पारिश्रमिक और कंप्यूट संसाधन दिए जाते हैं — समयरेखा: 14 सितंबर 2026 से 5 फरवरी 2027। Child Safety Blueprint (8 अप्रैल) AI द्वारा बच्चों के शोषण से निपटने के लिए एक रूपरेखा प्रस्तावित करता है, जिसे NCMEC, Thorn और Attorney General Alliance के साथ सह-विकसित किया गया है, और जो तीन धुरों के इर्द-गिर्द संगठित है: AI-जनित CSAM सामग्री पर कानूनों का आधुनिकीकरण, रिपोर्टिंग में सुधार, और डिज़ाइन से ही सुरक्षा को शामिल करना (safety-by-design)।

🔗 Safety Fellowship · Child Safety Blueprint


GitHub Copilot

टर्मिनल से OWASP Top 10 सुरक्षा स्कैन

9 अप्रैल 2026 — GitHub Copilot CLI सीधे टर्मिनल से एक स्वचालित सुरक्षा workflow जोड़ता है। कुछ कमांड में, डेवलपर अपने repository पर पूरा scan चला सकते हैं, परिणामों को OWASP Top 10 श्रेणियों से map कर सकते हैं, और प्रत्येक पहचानी गई vulnerability के लिए GitHub issues अपने-आप खोल सकते हैं — CLI environment छोड़े बिना। उन टीमों के लिए Project Glasswing का सीधा पूरक, जो पहले से GitHub tooling का उपयोग करती हैं।

Agent “Rubber Duck” — स्वचालित review

8 अप्रैल 2026 — GitHub Research टीम ने Copilot CLI के लिए एक “Rubber Duck” agent प्रकाशित किया। क्लासिक debugging तकनीक (समस्याएँ खोजने के लिए अपना code ज़ोर से समझाना) से प्रेरित, यह agent submit किए गए code का अपने-आप विश्लेषण करता है और सीधे terminal में एक संरचित review तैयार करता है। प्रयोगात्मक, लेकिन @github द्वारा आधिकारिक रूप से repost किया गया।

🔗 Copilot CLI OWASP ट्वीट · Rubber Duck ट्वीट


Perplexity

Plaid integration — Perplexity Computer में व्यक्तिगत वित्त

9 अप्रैल 2026 — Perplexity ने Plaid के साथ integration लॉन्च किया, जिससे उपयोगकर्ता अपने bank accounts, credit cards और loans को सीधे Perplexity Computer में जोड़ सकते हैं। access read-only है — data Perplexity के servers से होकर नहीं गुजरता। Plaid network 12 000 से अधिक institutions (Chase, Fidelity, Vanguard, Robinhood, आदि) को cover करता है। उपयोग के मामले: net worth की गणना, budget tracking, debt repayment planner, retirement projection। desktop पर संयुक्त राज्य अमेरिका और कनाडा में उपलब्ध।

स्तरसुविधाएँ
Standardwallet जोड़ना, basic Portfolio access
Pro / Maxadvanced analyses, interactive dashboards

Billion Dollar Build — startups प्रतियोगिता

8 अप्रैल 2026 — Perplexity ने “Billion Dollar Build” लॉन्च किया, 8 सप्ताह की एक प्रतियोगिता जिसमें टीमें Perplexity Computer का उपयोग करके 1 अरब डॉलर की valuation की दिशा वाली trajectory के साथ एक enterprise बनाती हैं। finalists के लिए rewards: Perplexity Fund से 1 million dollars तक का investment + Computer credits में 1 million dollars तक।

🔗 Plaid Integration ब्लॉग · Billion Dollar Build ट्वीट


Agents और tools

Manus Slack में integrate होता है — तीन modes

6 अप्रैल 2026 — Manus (अब Meta से संबद्ध) ने तीन modes के इर्द-गिर्द संगठित Slack integrations का एक पूरा suite लॉन्च किया: व्यक्तिगत tasks के लिए persistent memory वाला DM में agent, सामूहिक tasks के लिए team channels में @manus mention (persistent memory के बिना — हर thread एक नया task है), और manus.im से आपकी ओर से reports और summaries automate करने के लिए एक MCP connector। paid Slack plan पर उपलब्ध।

🔗 Manus for Slack ब्लॉग

Genspark AI Workspace 4.0 — Claw Desktop, Office plugins

8 अप्रैल 2026 — Genspark ने अपने AI workspace का version 4.0 चार components के साथ लॉन्च किया: Claw for Desktop (computer को control करने के लिए Computer Use और Browser Use), PowerPoint, Excel और Word के लिए Microsoft Office plugins, Speakly (real-time translation और meeting note-taking), और नए OpenCode engine पर Advanced Workflows

🔗 Genspark ब्लॉग


Generative media और hardware

Stability AI Brand Studio — brands के लिए creative platform

8 अप्रैल 2026 — Stability AI ने Brand Studio लॉन्च किया, enterprises की marketing teams के लिए डिज़ाइन किया गया एक end-to-end creative production platform। system का core Brand Central Hub पर आधारित है: किसी brand के visual elements (photographic style, palette, patterns, logo placement) पर trained Brand ID models। Producer Mode किसी description को structured production plan में बदलता है और उसे step by step automatically execute करता है। Curated Model Routing Stability AI और third-party offerings (जिनमें Seedream और Nano Banana शामिल हैं) में से सबसे उपयुक्त model को intelligently select करता है। enterprise पक्ष: SSO, role-based access controls, approval workflows। launch partner: creative agency Huge। उपलब्धता: Core plan (free trial) + Enterprise plan।

🔗 Stability AI द्वारा Brand Studio

NVIDIA — National Robotics Week

9 अप्रैल 2026 — National Robotics Week के अवसर पर, NVIDIA ने अपनी Physical AI technologies पर एक resource article प्रकाशित किया: NVIDIA Cosmos (world foundation models), Isaac Sim (simulation), Jetson range (edge AI), Nemotron और NemoClaw (open source)। कोई नई hardware announcement नहीं — developers के लिए NVIDIA robotics ecosystem का एक शैक्षिक सारांश।

🔗 NVIDIA Robotics Week


Claude Code — v2.1.94 / v2.1.96 / v2.1.97 updates

सप्ताह के दौरान तीन नए versions प्रकाशित किए गए।

Versionतारीखमुख्य बिंदु
v2.1.945-6 अप्रैलMantle द्वारा powered Bedrock support, API-key/Bedrock/Enterprise के लिए default effort high, Slack MCP links का compact display
v2.1.967 अप्रैलBedrock regression fix: AWS_BEARER_TOKEN_BEDROCK के साथ 403 "Authorization header is missing" error
v2.1.978-9 अप्रैलNO_FLICKER mode में focus view toggle Ctrl+O, status line parameter refreshInterval, /agents में ● N running indicator, Cedar syntax highlighting

v2.1.94 एक उल्लेखनीय व्यवहार परिवर्तन भी पेश करता है: "skills": ["./"] के माध्यम से घोषित skills plugins अब directory name के बजाय frontmatter के name field का उपयोग करते हैं। v2.1.97 कई Bash permissions समस्याओं (environment variable prefixes, network redirections) और एक bug को ठीक करता है जिसमें permissions rules जिनका नाम किसी JavaScript prototype property (toString, आदि) से मेल खाता था, settings.json में silently ignored हो जाते थे।

🔗 Claude Code CHANGELOG


इसका क्या मतलब है

5 से 9 अप्रैल 2026 का सप्ताह दो परस्पर intersecting दिशाओं में acceleration को दर्शाता है। एक तरफ, Anthropic consumer product logic से निकलकर critical infrastructure logic में प्रवेश कर रहा है: Project Glasswing और Google/Broadcom partnership संकेत देते हैं कि Anthropic खुद को वैश्विक tech ecosystem के स्तर पर AI capabilities provider के रूप में position कर रहा है, न कि केवल benchmarks की race में competitor के रूप में। credits में 100 million dollars और annualized revenue में 30 billion dollars की commitment इस व्याख्या को मजबूत करती है।

दूसरी तरफ, Meta अपनी open-weights policy से अलग होकर Muse Spark के साथ वापसी करता है। यह एक महत्वपूर्ण strategic shift है: Meta अपने open source positioning को बनाए रखने के बजाय closed frontier segment में compete करना चुनता है। Meta Superintelligence Labs का creation और पहला non-Llama model group की AI strategy के गहरे reorientation का संकेत देते हैं।

developers के लिए, सप्ताह घना लेकिन coherent है: Gemini CLI persistence और structure में बढ़त हासिल करता है, GitHub Copilot अपनी security scope बढ़ाता है, Perplexity personal data की ओर धक्का देता है, और Claude Code अपने rapid update cycle को जारी रखता है।


स्रोत

यह दस्तावेज़ fr संस्करण से hi भाषा में gpt-5.5 मॉडल का उपयोग करके अनुवादित किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए, https://github.com/jls42/ai-powered-markdown-translator देखें