खोजें

Claude Opus 4.5: दुनिया का सबसे उन्नत AI मॉडल

Claude Opus 4.5: दुनिया का सबसे उन्नत AI मॉडल

वह घोषणा जो AI को पुनर्परिभाषित करती है

24 नवंबर 2025 — Anthropic ने Claude Opus 4.5 का अनावरण किया, जो अब तक का उसका सबसे उन्नत मॉडल है। “coding, एजेंटों और कंप्यूटर उपयोग के लिए दुनिया का सबसे अच्छा मॉडल” के रूप में प्रस्तुत, Opus 4.5 AI सिस्टम के विकास में एक महत्वपूर्ण मील का पत्थर है।

Introducing Claude Opus 4.5: the best model in the world for coding, agents, and computer use. Opus 4.5 is a step forward in what AI systems can do, and a preview of larger changes to how work gets done.

🇮🇳 पेश है Claude Opus 4.5: coding, एजेंटों और कंप्यूटर उपयोग के लिए दुनिया का सबसे अच्छा मॉडल। Opus 4.5 इस दिशा में एक कदम आगे है कि AI सिस्टम क्या कर सकते हैं, और काम कैसे होता है, इसमें बड़े बदलावों की एक झलक है।@claudeai X पर

🔗 anthropic.com पर आधिकारिक घोषणा


क्यों Opus 4.5 खेल बदल देता है

Claude Opus 4.5 केवल एक वृद्धिशील अपडेट नहीं है। यह मॉडल कई प्रमुख क्षेत्रों में गुणात्मक छलांग का प्रतिनिधित्व करता है:

बुद्धिमान तर्क

Opus 4.5 अस्पष्टता और ट्रेड-ऑफ के प्रबंधन में उत्कृष्ट है। मॉडल जटिल परिस्थितियों में नेविगेट करने की बढ़ी हुई क्षमता प्रदर्शित करता है जहां कई मान्य दृष्टिकोण मौजूद हैं, संदर्भ के लिए सबसे उपयुक्त चुनता है।

विस्तारित संदर्भ प्रबंधन

स्वचालित संक्षेपण (summarization) के लिए धन्यवाद, Opus 4.5 वार्तालाप की लंबाई की सीमाओं को समाप्त करता है। मॉडल प्रदर्शन में गिरावट के बिना लंबे कार्य सत्रों में संदर्भ बनाए रख सकता है।

मल्टी-एजेंट समन्वय

सबसे बड़ी प्रगति में से एक मल्टी-एजेंट सिस्टम को ऑर्केस्ट्रेट करने की क्षमता से संबंधित है। Opus 4.5 जटिल कार्यों पर समानांतर रूप से काम करने वाली कई स्वायत्त प्रक्रियाओं का समन्वय कर सकता है।

उन्नत Computer Use

मॉडल अब सीधे हेरफेर कर सकता है:

  • स्प्रेडशीट — Excel/Sheets डेटा का विश्लेषण और संशोधन
  • प्रस्तुतियाँ — स्लाइड बनाना और संपादित करना
  • ब्राउज़र — जटिल वेब कार्यों का स्वचालन
  • डेस्कटॉप एप्लिकेशन — मूल सॉफ़्टवेयर के साथ इंटरैक्शन

बेंचमार्क: आंकड़े बोलते हैं

सॉफ्टवेयर इंजीनियरिंग प्रदर्शन

बेंचमार्कOpus 4.5सुधार
SWE-bench VerifiedState-of-the-artपूर्ण लीडर
SWE-bench Multilingual7/8 भाषाएं7 भाषाओं में सर्वश्रेष्ठ
Aider Polyglot+10.6%बनाम Sonnet 4.5
Vending-Bench+29%बनाम Sonnet 4.5
Terminal Bench+15%बनाम Sonnet 4.5
BrowseComp-Plusमहत्वपूर्ण लाभएजेंटिक अनुसंधान

एक उल्लेखनीय तथ्य

2 घंटे की समय सीमा के साथ एक आंतरिक Anthropic इंजीनियरिंग परीक्षा के दौरान, Opus 4.5 ने सभी मानव उम्मीदवारों की तुलना में उच्च स्कोर प्राप्त किया। एक पहली बार जो इस मॉडल द्वारा प्राप्त स्तर को दर्शाता है।


क्रांतिकारी टोकन दक्षता

Opus 4.5 के सबसे प्रभावशाली पहलुओं में से एक इसकी टोकन दक्षता है। मॉडल काफी कम टोकन के साथ समतुल्य या बेहतर परिणाम देता है:

प्रयास स्तरप्रदर्शनटोकन में कमी
मध्यम प्रयासSonnet 4.5 के बराबर-76% टोकन
अधिकतम प्रयास+4.3% बनाम Sonnet 4.5-48% टोकन
लंबे कार्यबनाए रखा गया-65% टोकन

इसका ठोस अर्थ क्या है

  • कम लागत — कम टोकन = हल्का API बिल
  • तेज़ प्रतिक्रियाएँ — कम जनरेशन = कम विलंबता
  • अधिक कुशल तर्क — कम बैकट्रैकिंग और अनावश्यक अन्वेषण

मूल्य निर्धारण और उपलब्धता

API एक्सेस

पैरामीटरमान
Model IDclaude-opus-4-5-20251101
Input मूल्य$5 / मिलियन टोकन
Output मूल्य$25 / मिलियन टोकन
Context window200K टोकन
Thinking budget64K टोकन

उपलब्ध प्लेटफॉर्म

  • Anthropic API — सीधी पहुंच
  • AWS Bedrock — Amazon क्लाउड एकीकरण
  • Google Vertex AI — Google क्लाउड एकीकरण
  • Claude एप्लिकेशन — claude.ai, डेस्कटॉप, मोबाइल

कंपनियां क्या कह रही हैं

शुरुआती उपयोगकर्ताओं की प्रतिक्रिया एकमत है:

GitHub Copilot

मॉडल हमारे आंतरिक coding बेंचमार्क से बेहतर प्रदर्शन करता है जबकि टोकन उपयोग को आधा कर देता है। — Mario Rodriguez, Chief Product Officer

Windsurf AI

Clear winner… best frontier task planning and tool calling.

🇮🇳 स्पष्ट विजेता… सर्वोत्तम फ्रंटियर कार्य योजना और टूल कॉलिंग।Jeff Wang, CEO

Replit

Using fewer tokens to solve the same problems.

🇮🇳 समान समस्याओं को हल करने के लिए कम टोकन का उपयोग करना।Michele Catasta, President

Warp

15% improvement over Sonnet 4.5 on Terminal Bench स्वायत्त कार्यों के लिए। — Zach Lloyd, Founder

Cursor

Notable improvement with improved pricing and intelligence.

🇮🇳 बेहतर मूल्य निर्धारण और बुद्धिमत्ता के साथ उल्लेखनीय सुधार।Michael Truell, CEO


उत्पाद सुधार

Opus 4.5, Claude पारिस्थितिकी तंत्र में कई नई सुविधाओं के साथ आता है:

Claude Code — उन्नत Plan Mode

  • निष्पादन से पहले स्पष्टीकरण प्रश्न
  • उपयोगकर्ता द्वारा संपादन योग्य plan.md फ़ाइलें
  • कई फ़ाइलों में संशोधनों का बेहतर समन्वय

Claude Desktop

  • समानांतर स्थानीय और दूरस्थ सत्र
  • एकीकृत स्क्रीनशॉट कैप्चर
  • विंडो पर क्लिक करके संदर्भ साझा करना
  • वॉयस कमांड (बोलने के लिए Caps Lock)

Claude for Chrome (सभी सशुल्क योजनाओं के लिए उपलब्ध)

शुरुआत में बीटा में, Claude for Chrome अब 18 दिसंबर, 2025 से सभी सशुल्क योजनाओं (Pro, Team, Enterprise) के लिए उपलब्ध है। एक्सटेंशन Claude को सीधे ब्राउज़र में बातचीत करने की अनुमति देता है:

  • स्वायत्त नेविगेशन — साइटों को ब्राउज़ करना, क्लिक करना, फॉर्म भरना
  • मल्टी-टैब — एक साथ कई टैब पर काम करना
  • स्वचालन — मेट्रिक्स निकालना, क्लाउड फ़ाइलें प्रबंधित करना, कैलेंडर तैयार करना
  • एकीकरण — Google Drive, Salesforce, Gmail, CRM
  • अनुसूचित कार्यप्रवाह — दैनिक या साप्ताहिक स्वचालन
  • सुरक्षा — निष्पादन से पहले संवेदनशील कार्यों की समीक्षा

🔗 Claude for Chrome के बारे में और जानें

अन्य एकीकरण

  • Claude for Excel — बीटा का विस्तार Max, Team और Enterprise तक किया गया
  • विस्तारित वार्तालाप — ऑटो-summarization के कारण लंबाई की कोई सीमा नहीं

सुरक्षा और संरेखण

Anthropic ने Opus 4.5 को अपने “अब तक के सबसे मज़बूती से संरेखित मॉडल” के रूप में प्रस्तुत किया है:

हमलों का प्रतिरोध

  • Prompt इंजेक्शन — किसी भी प्रतियोगी मॉडल की तुलना में धोखा देना कठिन
  • दुरुपयोग श्रेणियां — “चंताजनक व्यवहार” स्कोर कम

System Card

सुरक्षा दस्तावेज़ विश्वसनीय और अनुमानित व्यवहार सुनिश्चित करने के लिए किए गए उपायों का विवरण देता है, यहां तक कि जटिल एज-केस परिदृश्यों में भी।


तकनीकी विनिर्देश

विनिर्देशमान
Context window200K टोकन (डिफ़ॉल्ट)
Thinking budget64K टोकन (इंटरलीव्ड)
मूल्यांकन कार्यप्रणाली5 स्वतंत्र परीक्षणों का औसत
प्रयास पैरामीटरविन्यास योग्य (गति बनाम क्षमता)
सैंपलिंगमानक तापमान और top-p

आर्किटेक्चरल लाभ

  • कुशल मल्टी-स्टेप तर्क बैकट्रैकिंग को कम करता है
  • अनुकूलित संदर्भ संघनन
  • लंबे सत्रों में निरंतर तर्क के लिए मेमोरी टूल्स

निष्कर्ष

Claude Opus 4.5 केवल एक मॉडल अपडेट से अधिक का प्रतिनिधित्व करता है — यह इस बात का प्रदर्शन है कि जब दक्षता और क्षमता एक साथ आगे बढ़ते हैं तो AI क्या हासिल कर सकता है।

डेवलपर्स के लिए, निहितार्थ स्पष्ट हैं:

  1. coding और स्वचालन कार्यों पर बेहतर प्रदर्शन
  2. टोकन दक्षता के कारण कम लागत
  3. कंप्यूटर उपयोग और मल्टी-एजेंट समन्वय के साथ नई संभावनाएं

स्रोत