Claude Opus 4.7 उपलब्ध, Codex macOS पर computer use में जाता है, OpenAI ने GPT-Rosalind लॉन्च किया

16 अप्रैल को दिन असाधारण रूप से व्यस्त रहा: Anthropic ने Claude Opus 4.7 को सामान्य उपलब्धता में लॉन्च किया, agentic benchmarks पर महत्वपूर्ण सुधारों के साथ; OpenAI ने एक साथ Codex के साथ macOS पर computer use और GPT-Rosalind, जीवन-विज्ञान के लिए समर्पित अपना पहला frontier मॉडल, पेश किया। Google ने Gemini ऐप को Nano Banana 2 और Google Photos के माध्यम से निजीकृत image generation के साथ समृद्ध किया, Perplexity ने Mac के लिए Personal Computer लॉन्च किया, और GitHub ने एजेंटों के बीच skills के प्रबंधन के लिए gh skill कमांड खोली।

Claude Opus 4.7 : सामान्य उपलब्धता

16 अप्रैल — Anthropic ने Claude Opus 4.7 को सामान्य उपलब्धता (generally available) में लॉन्च किया। यह मॉडल Opus 4.6 का उत्तराधिकारी है और लंबे कार्यों, agentic autonomy तथा instruction accuracy में उल्लेखनीय प्रगति लाता है।

“Opus 4.7 handles complex, long-running tasks with rigor and consistency, pays precise attention to instructions, and devises ways to verify its own outputs before reporting back.”

🇮🇳 Opus 4.7 लंबे और जटिल कार्यों को अनुशासन और निरंतरता के साथ संभालता है, निर्देशों पर सटीक ध्यान देता है, और उन्हें भेजने से पहले अपने स्वयं के आउटपुट को सत्यापित करने के तरीके तैयार करता है। — @claudeai on X

मुख्य क्षमताएँ

फ़ंक्शनलिटी	विवरण
उच्च-रिज़ॉल्यूशन vision	बड़े किनारे पर 2 576 px तक images (~3,75 megapixels), पिछली resolution से 3×
xhigh effort level	`high` और `max` के बीच का मध्य स्तर, reasoning/latency पर सूक्ष्म नियंत्रण
फ़ाइल सिस्टम memory	कार्य सत्रों के बीच बेहतर persistence
बढ़ी हुई autonomy	भेजने से पहले outputs की verification, निर्देशों का अक्षरशः पालन
पेशेवर गुणवत्ता	बेहतर गुणवत्ता वाले interfaces, slides और documents

Benchmarks

Benchmark	Opus 4.7	Opus 4.6	GPT-5.4	Gemini 3.1 Pro
SWE-bench Pro	64.3%	53.4%	57.7%	54.2%
SWE-bench Verified	87.6%	80.8%	—	80.6%
Terminal-Bench 2.0	69.4%	65.4%	75.1%*	68.5%
बहु-विषयक reasoning (tools के साथ)	54.7%	53.3%	58.7%	51.4%
बड़े पैमाने पर tools उपयोग – MCP-Atlas	77.3%	75.8%	68.1%	73.9%
Computer use – OSWorld Verified	78.0%	72.7%	75.0%	—
उन्नत reasoning – GPQA Diamond	94.2%	91.3%	94.4%	94.3%
दृश्य reasoning (tools के साथ)	91.0%	84.7%	—	—

* GPT-5.4 : विशिष्ट harness के साथ self-reported परिणाम

सबसे उल्लेखनीय लाभ SWE-bench Pro (+10.9 अंक), दृश्य reasoning (+6.3 अंक tools के साथ) और MCP-Atlas (+1.5 अंक) पर हैं — ऐसे benchmarks जो सीधे agentic उपयोगों से जुड़े हैं।

मूल्य निर्धारण और उपलब्धता

Opus 4.7 आज से Claude API (identifier claude-opus-4-7), Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry, और सभी Claude उत्पादों में उपलब्ध है। कीमत Opus 4.6 जैसी ही है: इनपुट पर प्रति million tokens $5, आउटपुट पर$ 25।

Opus 4.6 से माइग्रेट करने वाले developers के लिए दो महत्वपूर्ण बिंदु: नया tokenizer content type के आधार पर 1,0× से 1,35× तक अधिक tokens उत्पन्न कर सकता है, और Opus 4.7 उच्च effort levels पर अधिक reasoning tokens पैदा करता है। Anthropic ने एक समर्पित migration guide प्रकाशित की है।

Opus 4.7 परियोजना Glasswing के नए cybersecurity safeguards से लाभ पाने वाला पहला मॉडल भी है। एक Cyber Verification Program वैध पेशेवरों के लिए खुला है।

🔗 Anthropic का आधिकारिक लेख

Claude Code v2.1.111 : /ultrareview, auto mode Max, xhigh by default

16 अप्रैल — Claude Code का 2.1.111 संस्करण Opus 4.7 के लॉन्च के साथ कई महत्वपूर्ण जोड़ लेकर आता है।

फ़ंक्शनलिटी	विवरण
`/ultrareview`	multi-agent समानांतर में गहन code review। बिना argument = वर्तमान branch; GitHub PR के लिए `/ultrareview <PR#>`। Pro और Max के लिए 3 निःशुल्क प्रयास।
Max के लिए Auto mode	auto mode (Claude स्वयं permissions तय करता है) अब Opus 4.7 के साथ Max subscribers के लिए उपलब्ध है।
डिफ़ॉल्ट xhigh effort	सभी plans के लिए default effort level `xhigh` तक बढ़ाया गया है।
`/less-permission-prompts`	transcripts को स्कैन करता है और `.claude/settings.json` के लिए एक प्राथमिकता-आधारित अनुमति सूची सुझाता है।
PowerShell tool	PowerShell support (क्रमिक rollout)। Linux/macOS पर `CLAUDE_CODE_USE_POWERSHELL_TOOL=1` के माध्यम से सक्रिय किया जा सकता है।
नामित plans	plans अब यादृच्छिक रूप से नहीं बल्कि प्रारंभिक prompt (`fix-auth-race-snug-otter.md`) के नाम पर होंगे।
Read-only commands	`cd`, `ls`, `cat` और read-only commands अब permission prompt ट्रिगर नहीं करते।

2.1.112 संस्करण (16 अप्रैल की शाम को deployed) auto mode में दिखने वाली “claude-opus-4-7 is temporarily unavailable” त्रुटि को तुरंत ठीक करता है।

Boris Cherny (@bcherny) ने सभी subscribers के लिए rate limits बढ़ाने की भी घोषणा की, ताकि Opus 4.7 के उच्च reasoning tokens volume की भरपाई हो सके। long-context requests पर rate limiting का एक bug ठीक किया गया और 5h तथा weekly limits reset कर दी गईं।

GitHub Copilot भी आज से GA में Opus 4.7 को एकीकृत करता है, VS Code, Visual Studio, CLI, GitHub Mobile और अन्य Copilot clients में क्रमिक rollout के साथ। Copilot Pro+ के लिए, आने वाले हफ्तों में यह Opus 4.5 और 4.6 की जगह लेगा। एक promotional pricing (7.5× multiplier) 30 अप्रैल तक लागू है।

🔗 Claude Code CHANGELOG 🔗 @bcherny का ट्वीट 🔗 GitHub Copilot में Claude Opus 4.7

OpenAI : Codex computer use, GPT-Rosalind और cyber ecosystem की ओर बढ़ता है

Codex — macOS पर computer use, integrated browser, persistent memory

16 अप्रैल — OpenAI Codex का एक महत्वपूर्ण अपडेट जारी करता है, जिसका उपयोग प्रति सप्ताह 3 million से अधिक developers करते हैं। यह release Codex को code से बहुत आगे ले जाती है।

“Codex can now use your computer alongside you, seeing, clicking, and typing with its own cursor.”

🇮🇳 अब Codex आपके साथ आपके कंप्यूटर का उपयोग कर सकता है, देख सकता है, क्लिक कर सकता है और अपने स्वयं के cursor से टाइप कर सकता है। — @OpenAI

Computer use (ordinateur का उपयोग) — कई Codex agents macOS पर खुले हुए applications में हस्तक्षेप किए बिना एक साथ काम कर सकते हैं। उपयोग के उदाहरण: interfaces (frontend) पर iteration, applications का परीक्षण, exposed API के बिना apps में काम करना। EU/UK उपलब्धता आने वाली है।

फ़ंक्शनलिटी	विवरण
Integrated browser	frontend development और games पर agent को निर्देश देने के लिए web pages पर सीधे comment करना
Image generation	एक ही workflow में assets और maquettes बनाने के लिए `gpt-image-1.5` integration
90+ नए plugins	Atlassian Rovo, CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon, Remotion, Render, Superpowers…
Persistent memory	sessions के बीच संचित preferences, corrections और context
Scheduled automations	दिनों या हफ्तों पर recurring tasks, automatic wake-up के साथ
SSH devboxes	remote servers से connection (alpha)
Multiple terminal tabs	कई simultaneous terminals

🔗 OpenAI का आधिकारिक लेख

GPT-Rosalind — जीवन-विज्ञान के लिए पहला frontier मॉडल

16 अप्रैल — OpenAI GPT-Rosalind लॉन्च करता है, जो biology, drug discovery और translational medicine के लिए समर्पित उसका पहला frontier model है। नाम Rosalind Franklin को श्रद्धांजलि है, जिनके काम ने DNA की संरचना को उजागर करने में योगदान दिया।

GPT-Rosalind वैज्ञानिक साहित्य के synthesis, hypothesis generation, experimental planning और biological data analysis के लिए optimized है।

Benchmark	परिणाम
BixBench (वास्तविक bioinformatics)	प्रकाशित scores वाले models में सर्वोत्तम प्रदर्शन
LABBench2	11 में से 6 tasks पर GPT-5.4 से बेहतर
RNA sequence prediction (Dyno Therapeutics)	मानव experts के top 95th percentile (best-of-10)
RNA sequence generation (Dyno Therapeutics)	मानव experts के ~84th percentile (best-of-10)

GitHub पर Codex के लिए एक निःशुल्क Life Sciences plugin उपलब्ध है: 50 से अधिक सार्वजनिक biological databases (human genomics, proteomics, biochemistry) तक पहुंच। GPT-Rosalind संयुक्त राज्य में qualified Enterprise clients के लिए Trusted Access program के माध्यम से research preview (research preview) में उपलब्ध है। preview के दौरान उपयोग मौजूदा credits को consume नहीं करता।

घोषित partners: Amgen, Novo Nordisk, Moderna, Thermo Fisher Scientific, NVIDIA, Allen Institute, UCSF School of Pharmacy, Los Alamos National Laboratory.

🔗 OpenAI का आधिकारिक लेख

Cyber defense ecosystem — API credits में $10M

16 अप्रैल — OpenAI open source security teams और vulnerability researchers का समर्थन करने के लिए 10 million dollars के API credits प्रतिबद्ध करता है। शुरुआती लाभार्थी: Socket, Semgrep, Calif, Trail of Bits.

Trusted Access for Cyber program नई organizations तक विस्तारित होता है: Bank of America, BlackRock, BNY, Citi, Cisco, CrowdStrike, Goldman Sachs, JPMorgan Chase, Morgan Stanley, NVIDIA, Oracle, Zscaler. GPT-5.4-Cyber को स्वतंत्र evaluations के लिए अमेरिकी AI standards and innovation केंद्र (CAISI) और UK AI Security Institute (UK AISI) को भी प्रदान किया गया है।

🔗 OpenAI का आधिकारिक लेख

Gemini : Nano Banana 2 और Google Photos के साथ निजीकृत images

16 अप्रैल — Google Gemini ऐप में निजीकृत image generation की नई सुविधाएँ प्रस्तुत करता है, जो Personal Intelligence (निजी intelligence), Nano Banana 2 और उपयोगकर्ता की Google Photos library द्वारा संचालित हैं।

अब तक, Gemini के साथ वास्तव में निजी image बनाना विस्तृत prompts और manually uploaded photos पर निर्भर था। Personal Intelligence अब Gemini को उपयोगकर्ता के context की निहित समझ देती है: “मेरा dream house बनाओ” या “एक desert island के लिए मेरी जरूरी चीज़ों की image बनाओ” जैसे सरल वाक्य पर्याप्त हैं, और Gemini connected Google apps से details स्वतः भर देता है।

अपनी Google Photos library को जोड़कर, उपयोगकर्ता ऐसी images बना सकता है जिनमें वह स्वयं और उसके करीबी सीधे दिखाई दें। Photos में पहले से बने labels (लोग, pets) की बदौलत, “मुझे और मेरे परिवार को claymation में हमारी पसंदीदा activity करते हुए एक image बनाओ” जैसी request पर्याप्त है।

फ़ंक्शनलिटी	विवरण
उपलब्ध styles	Watercolor, charcoal pencil, oil painting, claymation
Sources बटन	दिखाता है कि कौन-सी photo स्वतः चुनी गई थी
Refine	बताएं क्या गलत था, कोई दूसरी reference photo चुनें
गोपनीयता	Gemini निजी Google Photos library पर training नहीं करता
Opt-in	Google apps से connection अभी भी वैकल्पिक और configurable है

उपलब्धता: अभी कुछ दिनों में, केवल संयुक्त राज्य में Google AI Plus, Pro और Ultra subscribers के लिए rollout हो रहा है। Gemini on Chrome desktop और अधिक users के लिए आने की उम्मीद है।

🔗 blog.google लेख

Gemini CLI v0.38.0

14 अप्रैल — Gemini CLI का v0.38.0 संस्करण command-line अनुभव में कई सुधारों के साथ उपलब्ध है।

फ़ंक्शनलिटी	विवरण
Chapters (narrative flow)	intention और tools उपयोग के अनुसार interactions को “chapters” में व्यवस्थित करता है
Context Compression Service	लंबी sessions के लिए इतिहास को बुद्धिमानी से distill करता है
स्थायी approvals	हर बार दोबारा पूछे बिना tools के execution को approve करें
UI flicker fix	Terminal Buffer mode के माध्यम से अस्थिर rendering का समाधान

🔗 Gemini CLI changelog

Perplexity Personal Computer : Mac पर local agent

16 अप्रैल — Perplexity Personal Computer लॉन्च करता है, जो Mac ऐप में एकीकृत local agent फ़ंक्शन है।

“Today we’re releasing Personal Computer. Personal Computer integrates with the Perplexity Mac App for secure orchestration across your local files, native apps, and browser. We’re rolling this out to all Perplexity Max subscribers and everyone on the waitlist starting today.”

🇮🇳 आज हम Personal Computer लॉन्च कर रहे हैं। Personal Computer आपके local files, native applications और browser के सुरक्षित orchestration के लिए Perplexity Mac ऐप में एकीकृत होता है। हम इसे आज से सभी Perplexity Max subscribers और waiting list पर मौजूद लोगों के लिए rollout कर रहे हैं। — @perplexity_ai on X

agent local files, native applications और browser का सुरक्षित orchestration करता है, और संवेदनशील डेटा के लिए cloud का उपयोग नहीं करता। rollout क्रमिक है: पहले Perplexity Max subscribers, फिर waiting list।

Perplexity के लिए यह एक उल्लेखनीय pivot है: web search AI पर अपनी प्रतिष्ठा बनाने के बाद, कंपनी अब desktop पर local orchestration को लक्ष्य बना रही है — एक क्षेत्र जिसे पहले ही Apple Intelligence और OpenAI के Operator ने खोजा है।

🔗 perplexity.ai/computer

GitHub : `gh skill` कमांड सार्वजनिक preview में

16 अप्रैल — GitHub GitHub CLI (v2.90.0+) में gh skill को सार्वजनिक preview में लॉन्च करता है। यह नई command agent skills — instructions, scripts और resources के portable sets जो AI agents के व्यवहार को configure करते हैं — को install, discover, update और publish करने देती है।

gh skill install github/awesome-copilot documentation-writer
gh skill install github/awesome-copilot doc-writer --agent claude-code
gh skill search mcp-apps
gh skill update --all

skills कई platforms पर काम करती हैं: GitHub Copilot, Claude Code, Cursor, Codex, Gemini CLI और Antigravity। command में supply chain सुरक्षा mechanisms भी शामिल हैं: tag या commit SHA द्वारा pinning, immutable releases, और frontmatter के माध्यम से provenance tracking. खुला specification agentskills.io पर उपलब्ध है।

🔗 GitHub changelog

Qwen3.6-35B-A3B open-source और Meta Muse Spark Safety

Qwen3.6-35B-A3B : Apache 2.0 के तहत open-source MoE

15–16 अप्रैल — Alibaba Qwen3.6-35B-A3B की open-source release की घोषणा करता है, एक sparse MoE (mixture-of-experts) model जिसमें कुल 35 billion parameters हैं लेकिन inference प्रति केवल 3 billion active parameters।

पहलू	विवरण
Architecture	sparse MoE : 35B parameters, 3B active
License	Apache 2.0
Multimodal	native (vision + reasoning)
Modes	Thinking / non-thinking

Benchmark	Qwen3.6-35B-A3B
SWE-bench Verified	73,4
SWE-bench Multilingual	67,2
AIME 2026	92,7
GPQA	86,0

Hugging Face / ModelScope, Qwen Studio और Alibaba Cloud API (qwen3.6-flash) के माध्यम से उपलब्ध। Claude Code, Qwen Code और OpenClaw के साथ native रूप से compatible। 🔗 आधिकारिक Qwen ब्लॉग

मेटा Muse Spark: सुरक्षा रिपोर्ट प्रकाशित

15 अप्रैल — Meta AI Muse Spark की सुरक्षा और तैयारी (Safety & Preparedness Report) रिपोर्ट प्रकाशित करता है, जो Meta Superintelligence Labs द्वारा विकसित उसका पहला गैर-open-weights मल्टीमोडल मॉडल है।

पहलू	विवरण
उपयोग किया गया ढांचा	Meta Advanced AI Scaling Framework
आंके गए जोखिम	रासायनिक/जैविक, साइबरसुरक्षा, नियंत्रण की हानि
chem/bio परिणाम	जोखिम प्रारंभ में « संभावित रूप से उच्च » → mitigations सत्यापित → अवशिष्ट जोखिम स्वीकार्य

यह रिपोर्ट एक उल्लेखनीय चरण का संकेत देती है: Meta अब अपने उन्नत मॉडलों के लिए डिप्लॉयमेंट से पहले औपचारिक सुरक्षा मूल्यांकन प्रक्रिया अपनाता है, जो Anthropic और OpenAI के दृष्टिकोणों के समान है।

🔗 Muse Spark सुरक्षा रिपोर्ट

मीडिया और विविध अपडेट

Runway 16 अप्रैल को दो अपडेट जारी करता है: Seedance 2.0 अब 1080p रेंडरिंग में जाता है, और Runway Characters अब टेक्स्ट स्क्रिप्ट के माध्यम से एनीमेशन को एकीकृत करता है (एक पात्र चुनें, स्क्रिप्ट लिखें, जनरेट करें)। NVIDIA NAB Show 2026 में media प्रोडक्शन, फैन एंगेजमेंट और कंटेंट मुद्रीकरण में AI का प्रदर्शन करने के लिए मौजूद है।

Grok iOS को वॉइस मोड में एक एनिमेटेड विज़ुअल संकेतक मिलता है: अब एक छोटा वृत्त दिखाता है कि Grok सक्रिय रूप से सुन रहा है।

🔗 Runway — Seedance 2.0 1080p में 🔗 Runway Characters — स्क्रिप्ट द्वारा एनीमेशन

इसका क्या मतलब है

16 अप्रैल एजेंटिक अभिसरण का एक दिन दर्शाता है, हर मोर्चे पर: Claude Opus 4.7, computer use के साथ Codex, Perplexity Personal Computer और gh skill एक ही तर्क साझा करते हैं — ऐसे agents जो स्थानीय सिस्टम (फ़ाइलें, applications, computer) पर कार्य कर सकते हैं, और portable standards के माध्यम से कई platforms के बीच समन्वित होते हैं।

gh skill कमांड विशेष रूप से संरचनात्मक है: एक खुली inter-agent installation specification (Copilot, Claude Code, Cursor, Codex, Gemini CLI) प्रस्तुत करके, GitHub एक साझा infrastructure स्थापित करता है जो agentic दुनिया का npm install बन सकता है।

GPT-Rosalind अपनी ओर से OpenAI की रणनीति में एक विकास को चिह्नित करता है: सामान्य-उद्देश्य models के बाद, कंपनी domain-विशिष्ट frontier models बनाना शुरू करती है — एक ऐसा दृष्टिकोण जो computation biology में Google DeepMind द्वारा पहले से खोजी गई vertical diversification की याद दिलाता है।

स्रोत

इस दस्तावेज़ का अनुवाद फ्र संस्करण से hi भाषा में gpt-5.4-mini मॉडल का उपयोग करके किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए, https://gitlab.com/jls42/ai-powered-markdown-translator देखें

Claude Opus 4.7 उपलब्ध, Codex macOS पर computer use में जाता है, OpenAI ने GPT-Rosalind लॉन्च किया

Claude Opus 4.7 : सामान्य उपलब्धता

मुख्य क्षमताएँ

Benchmarks

मूल्य निर्धारण और उपलब्धता

Claude Code v2.1.111 : /ultrareview, auto mode Max, xhigh by default

OpenAI : Codex computer use, GPT-Rosalind और cyber ecosystem की ओर बढ़ता है

Codex — macOS पर computer use, integrated browser, persistent memory

GPT-Rosalind — जीवन-विज्ञान के लिए पहला frontier मॉडल

Cyber defense ecosystem — API credits में $10M

Gemini : Nano Banana 2 और Google Photos के साथ निजीकृत images

Gemini CLI v0.38.0

Perplexity Personal Computer : Mac पर local agent

GitHub : gh skill कमांड सार्वजनिक preview में

Qwen3.6-35B-A3B open-source और Meta Muse Spark Safety

Qwen3.6-35B-A3B : Apache 2.0 के तहत open-source MoE

मेटा Muse Spark: सुरक्षा रिपोर्ट प्रकाशित

मीडिया और विविध अपडेट

इसका क्या मतलब है

स्रोत

GitHub : `gh skill` कमांड सार्वजनिक preview में