वह घोषणा जो AI को पुनर्परिभाषित करती है
24 नवंबर 2025 — Anthropic ने Claude Opus 4.5 का अनावरण किया, जो अब तक का उसका सबसे उन्नत मॉडल है। “coding, एजेंटों और कंप्यूटर उपयोग के लिए दुनिया का सबसे अच्छा मॉडल” के रूप में प्रस्तुत, Opus 4.5 AI सिस्टम के विकास में एक महत्वपूर्ण मील का पत्थर है।
Introducing Claude Opus 4.5: the best model in the world for coding, agents, and computer use. Opus 4.5 is a step forward in what AI systems can do, and a preview of larger changes to how work gets done.
🇮🇳 पेश है Claude Opus 4.5: coding, एजेंटों और कंप्यूटर उपयोग के लिए दुनिया का सबसे अच्छा मॉडल। Opus 4.5 इस दिशा में एक कदम आगे है कि AI सिस्टम क्या कर सकते हैं, और काम कैसे होता है, इसमें बड़े बदलावों की एक झलक है। — @claudeai X पर
🔗 anthropic.com पर आधिकारिक घोषणा
क्यों Opus 4.5 खेल बदल देता है
Claude Opus 4.5 केवल एक वृद्धिशील अपडेट नहीं है। यह मॉडल कई प्रमुख क्षेत्रों में गुणात्मक छलांग का प्रतिनिधित्व करता है:
बुद्धिमान तर्क
Opus 4.5 अस्पष्टता और ट्रेड-ऑफ के प्रबंधन में उत्कृष्ट है। मॉडल जटिल परिस्थितियों में नेविगेट करने की बढ़ी हुई क्षमता प्रदर्शित करता है जहां कई मान्य दृष्टिकोण मौजूद हैं, संदर्भ के लिए सबसे उपयुक्त चुनता है।
विस्तारित संदर्भ प्रबंधन
स्वचालित संक्षेपण (summarization) के लिए धन्यवाद, Opus 4.5 वार्तालाप की लंबाई की सीमाओं को समाप्त करता है। मॉडल प्रदर्शन में गिरावट के बिना लंबे कार्य सत्रों में संदर्भ बनाए रख सकता है।
मल्टी-एजेंट समन्वय
सबसे बड़ी प्रगति में से एक मल्टी-एजेंट सिस्टम को ऑर्केस्ट्रेट करने की क्षमता से संबंधित है। Opus 4.5 जटिल कार्यों पर समानांतर रूप से काम करने वाली कई स्वायत्त प्रक्रियाओं का समन्वय कर सकता है।
उन्नत Computer Use
मॉडल अब सीधे हेरफेर कर सकता है:
- स्प्रेडशीट — Excel/Sheets डेटा का विश्लेषण और संशोधन
- प्रस्तुतियाँ — स्लाइड बनाना और संपादित करना
- ब्राउज़र — जटिल वेब कार्यों का स्वचालन
- डेस्कटॉप एप्लिकेशन — मूल सॉफ़्टवेयर के साथ इंटरैक्शन
बेंचमार्क: आंकड़े बोलते हैं
सॉफ्टवेयर इंजीनियरिंग प्रदर्शन
| बेंचमार्क | Opus 4.5 | सुधार |
|---|---|---|
| SWE-bench Verified | State-of-the-art | पूर्ण लीडर |
| SWE-bench Multilingual | 7/8 भाषाएं | 7 भाषाओं में सर्वश्रेष्ठ |
| Aider Polyglot | +10.6% | बनाम Sonnet 4.5 |
| Vending-Bench | +29% | बनाम Sonnet 4.5 |
| Terminal Bench | +15% | बनाम Sonnet 4.5 |
| BrowseComp-Plus | महत्वपूर्ण लाभ | एजेंटिक अनुसंधान |
एक उल्लेखनीय तथ्य
2 घंटे की समय सीमा के साथ एक आंतरिक Anthropic इंजीनियरिंग परीक्षा के दौरान, Opus 4.5 ने सभी मानव उम्मीदवारों की तुलना में उच्च स्कोर प्राप्त किया। एक पहली बार जो इस मॉडल द्वारा प्राप्त स्तर को दर्शाता है।
क्रांतिकारी टोकन दक्षता
Opus 4.5 के सबसे प्रभावशाली पहलुओं में से एक इसकी टोकन दक्षता है। मॉडल काफी कम टोकन के साथ समतुल्य या बेहतर परिणाम देता है:
| प्रयास स्तर | प्रदर्शन | टोकन में कमी |
|---|---|---|
| मध्यम प्रयास | Sonnet 4.5 के बराबर | -76% टोकन |
| अधिकतम प्रयास | +4.3% बनाम Sonnet 4.5 | -48% टोकन |
| लंबे कार्य | बनाए रखा गया | -65% टोकन |
इसका ठोस अर्थ क्या है
- कम लागत — कम टोकन = हल्का API बिल
- तेज़ प्रतिक्रियाएँ — कम जनरेशन = कम विलंबता
- अधिक कुशल तर्क — कम बैकट्रैकिंग और अनावश्यक अन्वेषण
मूल्य निर्धारण और उपलब्धता
API एक्सेस
| पैरामीटर | मान |
|---|---|
| Model ID | claude-opus-4-5-20251101 |
| Input मूल्य | $5 / मिलियन टोकन |
| Output मूल्य | $25 / मिलियन टोकन |
| Context window | 200K टोकन |
| Thinking budget | 64K टोकन |
उपलब्ध प्लेटफॉर्म
- Anthropic API — सीधी पहुंच
- AWS Bedrock — Amazon क्लाउड एकीकरण
- Google Vertex AI — Google क्लाउड एकीकरण
- Claude एप्लिकेशन — claude.ai, डेस्कटॉप, मोबाइल
कंपनियां क्या कह रही हैं
शुरुआती उपयोगकर्ताओं की प्रतिक्रिया एकमत है:
GitHub Copilot
मॉडल हमारे आंतरिक coding बेंचमार्क से बेहतर प्रदर्शन करता है जबकि टोकन उपयोग को आधा कर देता है। — Mario Rodriguez, Chief Product Officer
Windsurf AI
Clear winner… best frontier task planning and tool calling.
🇮🇳 स्पष्ट विजेता… सर्वोत्तम फ्रंटियर कार्य योजना और टूल कॉलिंग। — Jeff Wang, CEO
Replit
Using fewer tokens to solve the same problems.
🇮🇳 समान समस्याओं को हल करने के लिए कम टोकन का उपयोग करना। — Michele Catasta, President
Warp
15% improvement over Sonnet 4.5 on Terminal Bench स्वायत्त कार्यों के लिए। — Zach Lloyd, Founder
Cursor
Notable improvement with improved pricing and intelligence.
🇮🇳 बेहतर मूल्य निर्धारण और बुद्धिमत्ता के साथ उल्लेखनीय सुधार। — Michael Truell, CEO
उत्पाद सुधार
Opus 4.5, Claude पारिस्थितिकी तंत्र में कई नई सुविधाओं के साथ आता है:
Claude Code — उन्नत Plan Mode
- निष्पादन से पहले स्पष्टीकरण प्रश्न
- उपयोगकर्ता द्वारा संपादन योग्य
plan.mdफ़ाइलें - कई फ़ाइलों में संशोधनों का बेहतर समन्वय
Claude Desktop
- समानांतर स्थानीय और दूरस्थ सत्र
- एकीकृत स्क्रीनशॉट कैप्चर
- विंडो पर क्लिक करके संदर्भ साझा करना
- वॉयस कमांड (बोलने के लिए Caps Lock)
Claude for Chrome (सभी सशुल्क योजनाओं के लिए उपलब्ध)
शुरुआत में बीटा में, Claude for Chrome अब 18 दिसंबर, 2025 से सभी सशुल्क योजनाओं (Pro, Team, Enterprise) के लिए उपलब्ध है। एक्सटेंशन Claude को सीधे ब्राउज़र में बातचीत करने की अनुमति देता है:
- स्वायत्त नेविगेशन — साइटों को ब्राउज़ करना, क्लिक करना, फॉर्म भरना
- मल्टी-टैब — एक साथ कई टैब पर काम करना
- स्वचालन — मेट्रिक्स निकालना, क्लाउड फ़ाइलें प्रबंधित करना, कैलेंडर तैयार करना
- एकीकरण — Google Drive, Salesforce, Gmail, CRM
- अनुसूचित कार्यप्रवाह — दैनिक या साप्ताहिक स्वचालन
- सुरक्षा — निष्पादन से पहले संवेदनशील कार्यों की समीक्षा
🔗 Claude for Chrome के बारे में और जानें
अन्य एकीकरण
- Claude for Excel — बीटा का विस्तार Max, Team और Enterprise तक किया गया
- विस्तारित वार्तालाप — ऑटो-summarization के कारण लंबाई की कोई सीमा नहीं
सुरक्षा और संरेखण
Anthropic ने Opus 4.5 को अपने “अब तक के सबसे मज़बूती से संरेखित मॉडल” के रूप में प्रस्तुत किया है:
हमलों का प्रतिरोध
- Prompt इंजेक्शन — किसी भी प्रतियोगी मॉडल की तुलना में धोखा देना कठिन
- दुरुपयोग श्रेणियां — “चंताजनक व्यवहार” स्कोर कम
System Card
सुरक्षा दस्तावेज़ विश्वसनीय और अनुमानित व्यवहार सुनिश्चित करने के लिए किए गए उपायों का विवरण देता है, यहां तक कि जटिल एज-केस परिदृश्यों में भी।
तकनीकी विनिर्देश
| विनिर्देश | मान |
|---|---|
| Context window | 200K टोकन (डिफ़ॉल्ट) |
| Thinking budget | 64K टोकन (इंटरलीव्ड) |
| मूल्यांकन कार्यप्रणाली | 5 स्वतंत्र परीक्षणों का औसत |
| प्रयास पैरामीटर | विन्यास योग्य (गति बनाम क्षमता) |
| सैंपलिंग | मानक तापमान और top-p |
आर्किटेक्चरल लाभ
- कुशल मल्टी-स्टेप तर्क बैकट्रैकिंग को कम करता है
- अनुकूलित संदर्भ संघनन
- लंबे सत्रों में निरंतर तर्क के लिए मेमोरी टूल्स
निष्कर्ष
Claude Opus 4.5 केवल एक मॉडल अपडेट से अधिक का प्रतिनिधित्व करता है — यह इस बात का प्रदर्शन है कि जब दक्षता और क्षमता एक साथ आगे बढ़ते हैं तो AI क्या हासिल कर सकता है।
डेवलपर्स के लिए, निहितार्थ स्पष्ट हैं:
- coding और स्वचालन कार्यों पर बेहतर प्रदर्शन
- टोकन दक्षता के कारण कम लागत
- कंप्यूटर उपयोग और मल्टी-एजेंट समन्वय के साथ नई संभावनाएं