खोजें

Claude Opus 4.7 उपलब्ध, Codex macOS पर computer use में जाता है, OpenAI ने GPT-Rosalind लॉन्च किया

Claude Opus 4.7 उपलब्ध, Codex macOS पर computer use में जाता है, OpenAI ने GPT-Rosalind लॉन्च किया

16 अप्रैल को दिन असाधारण रूप से व्यस्त रहा: Anthropic ने Claude Opus 4.7 को सामान्य उपलब्धता में लॉन्च किया, agentic benchmarks पर महत्वपूर्ण सुधारों के साथ; OpenAI ने एक साथ Codex के साथ macOS पर computer use और GPT-Rosalind, जीवन-विज्ञान के लिए समर्पित अपना पहला frontier मॉडल, पेश किया। Google ने Gemini ऐप को Nano Banana 2 और Google Photos के माध्यम से निजीकृत image generation के साथ समृद्ध किया, Perplexity ने Mac के लिए Personal Computer लॉन्च किया, और GitHub ने एजेंटों के बीच skills के प्रबंधन के लिए gh skill कमांड खोली।


Claude Opus 4.7 : सामान्य उपलब्धता

16 अप्रैल — Anthropic ने Claude Opus 4.7 को सामान्य उपलब्धता (generally available) में लॉन्च किया। यह मॉडल Opus 4.6 का उत्तराधिकारी है और लंबे कार्यों, agentic autonomy तथा instruction accuracy में उल्लेखनीय प्रगति लाता है।

“Opus 4.7 handles complex, long-running tasks with rigor and consistency, pays precise attention to instructions, and devises ways to verify its own outputs before reporting back.”

🇮🇳 Opus 4.7 लंबे और जटिल कार्यों को अनुशासन और निरंतरता के साथ संभालता है, निर्देशों पर सटीक ध्यान देता है, और उन्हें भेजने से पहले अपने स्वयं के आउटपुट को सत्यापित करने के तरीके तैयार करता है।@claudeai on X

मुख्य क्षमताएँ

फ़ंक्शनलिटीविवरण
उच्च-रिज़ॉल्यूशन visionबड़े किनारे पर 2 576 px तक images (~3,75 megapixels), पिछली resolution से 3×
xhigh effort levelhigh और max के बीच का मध्य स्तर, reasoning/latency पर सूक्ष्म नियंत्रण
फ़ाइल सिस्टम memoryकार्य सत्रों के बीच बेहतर persistence
बढ़ी हुई autonomyभेजने से पहले outputs की verification, निर्देशों का अक्षरशः पालन
पेशेवर गुणवत्ताबेहतर गुणवत्ता वाले interfaces, slides और documents

Benchmarks

BenchmarkOpus 4.7Opus 4.6GPT-5.4Gemini 3.1 Pro
SWE-bench Pro64.3%53.4%57.7%54.2%
SWE-bench Verified87.6%80.8%80.6%
Terminal-Bench 2.069.4%65.4%75.1%*68.5%
बहु-विषयक reasoning (tools के साथ)54.7%53.3%58.7%51.4%
बड़े पैमाने पर tools उपयोग – MCP-Atlas77.3%75.8%68.1%73.9%
Computer use – OSWorld Verified78.0%72.7%75.0%
उन्नत reasoning – GPQA Diamond94.2%91.3%94.4%94.3%
दृश्य reasoning (tools के साथ)91.0%84.7%

* GPT-5.4 : विशिष्ट harness के साथ self-reported परिणाम

सबसे उल्लेखनीय लाभ SWE-bench Pro (+10.9 अंक), दृश्य reasoning (+6.3 अंक tools के साथ) और MCP-Atlas (+1.5 अंक) पर हैं — ऐसे benchmarks जो सीधे agentic उपयोगों से जुड़े हैं।

मूल्य निर्धारण और उपलब्धता

Opus 4.7 आज से Claude API (identifier claude-opus-4-7), Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry, और सभी Claude उत्पादों में उपलब्ध है। कीमत Opus 4.6 जैसी ही है: इनपुट पर प्रति million tokens 5,आउटपुटपर5, आउटपुट पर 25

Opus 4.6 से माइग्रेट करने वाले developers के लिए दो महत्वपूर्ण बिंदु: नया tokenizer content type के आधार पर 1,0× से 1,35× तक अधिक tokens उत्पन्न कर सकता है, और Opus 4.7 उच्च effort levels पर अधिक reasoning tokens पैदा करता है। Anthropic ने एक समर्पित migration guide प्रकाशित की है।

Opus 4.7 परियोजना Glasswing के नए cybersecurity safeguards से लाभ पाने वाला पहला मॉडल भी है। एक Cyber Verification Program वैध पेशेवरों के लिए खुला है।

🔗 Anthropic का आधिकारिक लेख


Claude Code v2.1.111 : /ultrareview, auto mode Max, xhigh by default

16 अप्रैल — Claude Code का 2.1.111 संस्करण Opus 4.7 के लॉन्च के साथ कई महत्वपूर्ण जोड़ लेकर आता है।

फ़ंक्शनलिटीविवरण
/ultrareviewmulti-agent समानांतर में गहन code review। बिना argument = वर्तमान branch; GitHub PR के लिए /ultrareview <PR#>। Pro और Max के लिए 3 निःशुल्क प्रयास।
Max के लिए Auto modeauto mode (Claude स्वयं permissions तय करता है) अब Opus 4.7 के साथ Max subscribers के लिए उपलब्ध है।
डिफ़ॉल्ट xhigh effortसभी plans के लिए default effort level xhigh तक बढ़ाया गया है।
/less-permission-promptstranscripts को स्कैन करता है और .claude/settings.json के लिए एक प्राथमिकता-आधारित अनुमति सूची सुझाता है।
PowerShell toolPowerShell support (क्रमिक rollout)। Linux/macOS पर CLAUDE_CODE_USE_POWERSHELL_TOOL=1 के माध्यम से सक्रिय किया जा सकता है।
नामित plansplans अब यादृच्छिक रूप से नहीं बल्कि प्रारंभिक prompt (fix-auth-race-snug-otter.md) के नाम पर होंगे।
Read-only commandscd, ls, cat और read-only commands अब permission prompt ट्रिगर नहीं करते।

2.1.112 संस्करण (16 अप्रैल की शाम को deployed) auto mode में दिखने वाली “claude-opus-4-7 is temporarily unavailable” त्रुटि को तुरंत ठीक करता है।

Boris Cherny (@bcherny) ने सभी subscribers के लिए rate limits बढ़ाने की भी घोषणा की, ताकि Opus 4.7 के उच्च reasoning tokens volume की भरपाई हो सके। long-context requests पर rate limiting का एक bug ठीक किया गया और 5h तथा weekly limits reset कर दी गईं।

GitHub Copilot भी आज से GA में Opus 4.7 को एकीकृत करता है, VS Code, Visual Studio, CLI, GitHub Mobile और अन्य Copilot clients में क्रमिक rollout के साथ। Copilot Pro+ के लिए, आने वाले हफ्तों में यह Opus 4.5 और 4.6 की जगह लेगा। एक promotional pricing (7.5× multiplier) 30 अप्रैल तक लागू है।

🔗 Claude Code CHANGELOG 🔗 @bcherny का ट्वीट 🔗 GitHub Copilot में Claude Opus 4.7


OpenAI : Codex computer use, GPT-Rosalind और cyber ecosystem की ओर बढ़ता है

Codex — macOS पर computer use, integrated browser, persistent memory

16 अप्रैल — OpenAI Codex का एक महत्वपूर्ण अपडेट जारी करता है, जिसका उपयोग प्रति सप्ताह 3 million से अधिक developers करते हैं। यह release Codex को code से बहुत आगे ले जाती है।

“Codex can now use your computer alongside you, seeing, clicking, and typing with its own cursor.”

🇮🇳 अब Codex आपके साथ आपके कंप्यूटर का उपयोग कर सकता है, देख सकता है, क्लिक कर सकता है और अपने स्वयं के cursor से टाइप कर सकता है।@OpenAI

Computer use (ordinateur का उपयोग) — कई Codex agents macOS पर खुले हुए applications में हस्तक्षेप किए बिना एक साथ काम कर सकते हैं। उपयोग के उदाहरण: interfaces (frontend) पर iteration, applications का परीक्षण, exposed API के बिना apps में काम करना। EU/UK उपलब्धता आने वाली है।

फ़ंक्शनलिटीविवरण
Integrated browserfrontend development और games पर agent को निर्देश देने के लिए web pages पर सीधे comment करना
Image generationएक ही workflow में assets और maquettes बनाने के लिए gpt-image-1.5 integration
90+ नए pluginsAtlassian Rovo, CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon, Remotion, Render, Superpowers…
Persistent memorysessions के बीच संचित preferences, corrections और context
Scheduled automationsदिनों या हफ्तों पर recurring tasks, automatic wake-up के साथ
SSH devboxesremote servers से connection (alpha)
Multiple terminal tabsकई simultaneous terminals

🔗 OpenAI का आधिकारिक लेख

GPT-Rosalind — जीवन-विज्ञान के लिए पहला frontier मॉडल

16 अप्रैल — OpenAI GPT-Rosalind लॉन्च करता है, जो biology, drug discovery और translational medicine के लिए समर्पित उसका पहला frontier model है। नाम Rosalind Franklin को श्रद्धांजलि है, जिनके काम ने DNA की संरचना को उजागर करने में योगदान दिया।

GPT-Rosalind वैज्ञानिक साहित्य के synthesis, hypothesis generation, experimental planning और biological data analysis के लिए optimized है।

Benchmarkपरिणाम
BixBench (वास्तविक bioinformatics)प्रकाशित scores वाले models में सर्वोत्तम प्रदर्शन
LABBench211 में से 6 tasks पर GPT-5.4 से बेहतर
RNA sequence prediction (Dyno Therapeutics)मानव experts के top 95th percentile (best-of-10)
RNA sequence generation (Dyno Therapeutics)मानव experts के ~84th percentile (best-of-10)

GitHub पर Codex के लिए एक निःशुल्क Life Sciences plugin उपलब्ध है: 50 से अधिक सार्वजनिक biological databases (human genomics, proteomics, biochemistry) तक पहुंच। GPT-Rosalind संयुक्त राज्य में qualified Enterprise clients के लिए Trusted Access program के माध्यम से research preview (research preview) में उपलब्ध है। preview के दौरान उपयोग मौजूदा credits को consume नहीं करता।

घोषित partners: Amgen, Novo Nordisk, Moderna, Thermo Fisher Scientific, NVIDIA, Allen Institute, UCSF School of Pharmacy, Los Alamos National Laboratory.

🔗 OpenAI का आधिकारिक लेख

Cyber defense ecosystem — API credits में $10M

16 अप्रैल — OpenAI open source security teams और vulnerability researchers का समर्थन करने के लिए 10 million dollars के API credits प्रतिबद्ध करता है। शुरुआती लाभार्थी: Socket, Semgrep, Calif, Trail of Bits.

Trusted Access for Cyber program नई organizations तक विस्तारित होता है: Bank of America, BlackRock, BNY, Citi, Cisco, CrowdStrike, Goldman Sachs, JPMorgan Chase, Morgan Stanley, NVIDIA, Oracle, Zscaler. GPT-5.4-Cyber को स्वतंत्र evaluations के लिए अमेरिकी AI standards and innovation केंद्र (CAISI) और UK AI Security Institute (UK AISI) को भी प्रदान किया गया है।

🔗 OpenAI का आधिकारिक लेख


Gemini : Nano Banana 2 और Google Photos के साथ निजीकृत images

16 अप्रैल — Google Gemini ऐप में निजीकृत image generation की नई सुविधाएँ प्रस्तुत करता है, जो Personal Intelligence (निजी intelligence), Nano Banana 2 और उपयोगकर्ता की Google Photos library द्वारा संचालित हैं।

अब तक, Gemini के साथ वास्तव में निजी image बनाना विस्तृत prompts और manually uploaded photos पर निर्भर था। Personal Intelligence अब Gemini को उपयोगकर्ता के context की निहित समझ देती है: “मेरा dream house बनाओ” या “एक desert island के लिए मेरी जरूरी चीज़ों की image बनाओ” जैसे सरल वाक्य पर्याप्त हैं, और Gemini connected Google apps से details स्वतः भर देता है।

अपनी Google Photos library को जोड़कर, उपयोगकर्ता ऐसी images बना सकता है जिनमें वह स्वयं और उसके करीबी सीधे दिखाई दें। Photos में पहले से बने labels (लोग, pets) की बदौलत, “मुझे और मेरे परिवार को claymation में हमारी पसंदीदा activity करते हुए एक image बनाओ” जैसी request पर्याप्त है।

फ़ंक्शनलिटीविवरण
उपलब्ध stylesWatercolor, charcoal pencil, oil painting, claymation
Sources बटनदिखाता है कि कौन-सी photo स्वतः चुनी गई थी
Refineबताएं क्या गलत था, कोई दूसरी reference photo चुनें
गोपनीयताGemini निजी Google Photos library पर training नहीं करता
Opt-inGoogle apps से connection अभी भी वैकल्पिक और configurable है

उपलब्धता: अभी कुछ दिनों में, केवल संयुक्त राज्य में Google AI Plus, Pro और Ultra subscribers के लिए rollout हो रहा है। Gemini on Chrome desktop और अधिक users के लिए आने की उम्मीद है।

🔗 blog.google लेख

Gemini CLI v0.38.0

14 अप्रैल — Gemini CLI का v0.38.0 संस्करण command-line अनुभव में कई सुधारों के साथ उपलब्ध है।

फ़ंक्शनलिटीविवरण
Chapters (narrative flow)intention और tools उपयोग के अनुसार interactions को “chapters” में व्यवस्थित करता है
Context Compression Serviceलंबी sessions के लिए इतिहास को बुद्धिमानी से distill करता है
स्थायी approvalsहर बार दोबारा पूछे बिना tools के execution को approve करें
UI flicker fixTerminal Buffer mode के माध्यम से अस्थिर rendering का समाधान

🔗 Gemini CLI changelog


Perplexity Personal Computer : Mac पर local agent

16 अप्रैल — Perplexity Personal Computer लॉन्च करता है, जो Mac ऐप में एकीकृत local agent फ़ंक्शन है।

“Today we’re releasing Personal Computer. Personal Computer integrates with the Perplexity Mac App for secure orchestration across your local files, native apps, and browser. We’re rolling this out to all Perplexity Max subscribers and everyone on the waitlist starting today.”

🇮🇳 आज हम Personal Computer लॉन्च कर रहे हैं। Personal Computer आपके local files, native applications और browser के सुरक्षित orchestration के लिए Perplexity Mac ऐप में एकीकृत होता है। हम इसे आज से सभी Perplexity Max subscribers और waiting list पर मौजूद लोगों के लिए rollout कर रहे हैं।@perplexity_ai on X

agent local files, native applications और browser का सुरक्षित orchestration करता है, और संवेदनशील डेटा के लिए cloud का उपयोग नहीं करता। rollout क्रमिक है: पहले Perplexity Max subscribers, फिर waiting list।

Perplexity के लिए यह एक उल्लेखनीय pivot है: web search AI पर अपनी प्रतिष्ठा बनाने के बाद, कंपनी अब desktop पर local orchestration को लक्ष्य बना रही है — एक क्षेत्र जिसे पहले ही Apple Intelligence और OpenAI के Operator ने खोजा है।

🔗 perplexity.ai/computer


GitHub : gh skill कमांड सार्वजनिक preview में

16 अप्रैल — GitHub GitHub CLI (v2.90.0+) में gh skill को सार्वजनिक preview में लॉन्च करता है। यह नई command agent skills — instructions, scripts और resources के portable sets जो AI agents के व्यवहार को configure करते हैं — को install, discover, update और publish करने देती है।

gh skill install github/awesome-copilot documentation-writer
gh skill install github/awesome-copilot doc-writer --agent claude-code
gh skill search mcp-apps
gh skill update --all

skills कई platforms पर काम करती हैं: GitHub Copilot, Claude Code, Cursor, Codex, Gemini CLI और Antigravity। command में supply chain सुरक्षा mechanisms भी शामिल हैं: tag या commit SHA द्वारा pinning, immutable releases, और frontmatter के माध्यम से provenance tracking. खुला specification agentskills.io पर उपलब्ध है।

🔗 GitHub changelog


Qwen3.6-35B-A3B open-source और Meta Muse Spark Safety

Qwen3.6-35B-A3B : Apache 2.0 के तहत open-source MoE

15–16 अप्रैल — Alibaba Qwen3.6-35B-A3B की open-source release की घोषणा करता है, एक sparse MoE (mixture-of-experts) model जिसमें कुल 35 billion parameters हैं लेकिन inference प्रति केवल 3 billion active parameters।

पहलूविवरण
Architecturesparse MoE : 35B parameters, 3B active
LicenseApache 2.0
Multimodalnative (vision + reasoning)
ModesThinking / non-thinking
BenchmarkQwen3.6-35B-A3B
SWE-bench Verified73,4
SWE-bench Multilingual67,2
AIME 202692,7
GPQA86,0

Hugging Face / ModelScope, Qwen Studio और Alibaba Cloud API (qwen3.6-flash) के माध्यम से उपलब्ध। Claude Code, Qwen Code और OpenClaw के साथ native रूप से compatible। 🔗 आधिकारिक Qwen ब्लॉग

मेटा Muse Spark: सुरक्षा रिपोर्ट प्रकाशित

15 अप्रैल — Meta AI Muse Spark की सुरक्षा और तैयारी (Safety & Preparedness Report) रिपोर्ट प्रकाशित करता है, जो Meta Superintelligence Labs द्वारा विकसित उसका पहला गैर-open-weights मल्टीमोडल मॉडल है।

पहलूविवरण
उपयोग किया गया ढांचाMeta Advanced AI Scaling Framework
आंके गए जोखिमरासायनिक/जैविक, साइबरसुरक्षा, नियंत्रण की हानि
chem/bio परिणामजोखिम प्रारंभ में « संभावित रूप से उच्च » → mitigations सत्यापित → अवशिष्ट जोखिम स्वीकार्य

यह रिपोर्ट एक उल्लेखनीय चरण का संकेत देती है: Meta अब अपने उन्नत मॉडलों के लिए डिप्लॉयमेंट से पहले औपचारिक सुरक्षा मूल्यांकन प्रक्रिया अपनाता है, जो Anthropic और OpenAI के दृष्टिकोणों के समान है।

🔗 Muse Spark सुरक्षा रिपोर्ट


मीडिया और विविध अपडेट

Runway 16 अप्रैल को दो अपडेट जारी करता है: Seedance 2.0 अब 1080p रेंडरिंग में जाता है, और Runway Characters अब टेक्स्ट स्क्रिप्ट के माध्यम से एनीमेशन को एकीकृत करता है (एक पात्र चुनें, स्क्रिप्ट लिखें, जनरेट करें)। NVIDIA NAB Show 2026 में media प्रोडक्शन, फैन एंगेजमेंट और कंटेंट मुद्रीकरण में AI का प्रदर्शन करने के लिए मौजूद है।

Grok iOS को वॉइस मोड में एक एनिमेटेड विज़ुअल संकेतक मिलता है: अब एक छोटा वृत्त दिखाता है कि Grok सक्रिय रूप से सुन रहा है।

🔗 Runway — Seedance 2.0 1080p में 🔗 Runway Characters — स्क्रिप्ट द्वारा एनीमेशन


इसका क्या मतलब है

16 अप्रैल एजेंटिक अभिसरण का एक दिन दर्शाता है, हर मोर्चे पर: Claude Opus 4.7, computer use के साथ Codex, Perplexity Personal Computer और gh skill एक ही तर्क साझा करते हैं — ऐसे agents जो स्थानीय सिस्टम (फ़ाइलें, applications, computer) पर कार्य कर सकते हैं, और portable standards के माध्यम से कई platforms के बीच समन्वित होते हैं।

gh skill कमांड विशेष रूप से संरचनात्मक है: एक खुली inter-agent installation specification (Copilot, Claude Code, Cursor, Codex, Gemini CLI) प्रस्तुत करके, GitHub एक साझा infrastructure स्थापित करता है जो agentic दुनिया का npm install बन सकता है।

GPT-Rosalind अपनी ओर से OpenAI की रणनीति में एक विकास को चिह्नित करता है: सामान्य-उद्देश्य models के बाद, कंपनी domain-विशिष्ट frontier models बनाना शुरू करती है — एक ऐसा दृष्टिकोण जो computation biology में Google DeepMind द्वारा पहले से खोजी गई vertical diversification की याद दिलाता है।


स्रोत

इस दस्तावेज़ का अनुवाद फ्र संस्करण से hi भाषा में gpt-5.4-mini मॉडल का उपयोग करके किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए, https://gitlab.com/jls42/ai-powered-markdown-translator देखें