Anthropic ने Vercept का अधिग्रहण किया (computer use 72.5%), Perplexity Computer 19 मॉडल संचालित करता है, GitHub Copilot CLI अब GA में

25 फ़रवरी 2026 एक बहुत व्यस्त दिन है: Anthropic ने Claude की computer use क्षमताओं को तेज करने के लिए Vercept का अधिग्रहण किया (OSWorld पर 72.5%), Perplexity ने Computer लॉन्च किया — एक एजेंटिक, स्वायत्त बहु-मॉडल ऑर्केस्ट्रेटर जो 19 मॉडल समानांतर में चलाता है — और GitHub Copilot CLI सभी भुगतान वाले सब्सक्राइबर के लिए सामान्य उपलब्धता में आ गया। साथ ही, Google DeepMind ने Genie 3 (इंटरैक्टिव world models) पेश किया और Intrinsic ने औद्योगिक रोबोटिक्स के लिए Google में विलय किया।

Anthropic ने Vercept का अधिग्रहण किया: OSWorld पर computer use 72.5% की ओर बढ़ा

25 फ़रवरी — Anthropic ने घोषणा की कि उसने Vercept का अधिग्रहण किया है, एक स्टार्टअप जो सॉफ़्टवेयर इंटरफेस के साथ IA सिस्टम की परसेप्शन और इंटरैक्शन में विशेषज्ञता रखता है। सह-संस्थापक Kiana Ehsani, Luca Weihs और Ross Girshick सीधे Anthropic में शामिल हो रहे हैं ताकि Claude की computer use क्षमताओं को सुदृढ़ किया जा सके।

यह अधिग्रहण OSWorld benchmark पर तेज प्रगति की प्रवृत्ति में आता है, जो यह मापता है कि कोई IA एजेंट वास्तविक ऑपरेटिंग सिस्टम पर कार्य (जटिल स्प्रेडशीट में नेविगेशन, मल्टी-टैब फॉर्म भरना, आदि) कितनी अच्छी तरह कर सकता है:

अवधि	OSWorld स्कोर
अंत 2024 (computer use लॉन्च)	< 15%
Claude Sonnet 4.6 (फर॰ 2026)	72.5%

एक साल में 57 से अधिक अंकों की कूद। Claude Sonnet 4.6 अब इन डेस्कटॉप कार्यों पर मानवीय प्रदर्शन के करीब पहुँच रहा है। Vercept अपने बाहरी उत्पाद को अगले कुछ हफ्तों में बंद कर देगा ताकि पूरी तरह से Anthropic के भीतर इस काम पर ध्यान केंद्रित किया जा सके।

यह अधिग्रहण Bun के अधिग्रहण के बाद आया है। Anthropic तकनीकी उत्कृष्टता वाली टीमों का एक पोर्टफोलियो बना रहा है जो एजेंटिक क्षमताओं के इर्द-गिर्द काम करते हैं।

🔗 Anthropic acquires Vercept

Perplexity Computer : एक एजेंटिक बहु-मॉडल ऑर्केस्ट्रेटर (19 मॉडल)

25 फ़रवरी — Perplexity ने Computer लॉन्च किया, एक जनरल-परपज़ IA सिस्टम जिसे एंड-टू-एंड प्रोजेक्ट्स चलाने के लिए डिज़ाइन किया गया है। उपयोगकर्ता एक अंतिम लक्ष्य बताता है, Computer काम को उप-कार्य में तोड़ता है, विशिष्ट sub-agents बनाता है और समानांतर में निष्पादित करता है — घंटों या महीनों तक यदि आवश्यक हो।

ऑपरेशन असिंक्रोनस और अलग-थलग है: प्रत्येक कार्य एक समर्पित environment में चलता है जिसमें एक असली filesystem, असली ब्राउज़र, और वास्तविक टूल इंटीग्रेशन (APIs, वेब सर्च, डॉक्यूमेंट जनरेशन) तक पहुंच होती है।

Perplexity Computer की विशेषता इसका orchestration है — यह massively multi-model है — 19 मॉडल उपलब्ध हैं, हर एक को उनकी ताकत के अनुसार असाइन किया गया है:

मॉडल	भूमिका
Claude Opus 4.6	मूल ऑर्केस्ट्रेटर (core reasoning)
Gemini	गहन रिसर्च, sub-agents निर्माण
ChatGPT 5.2	लंबी-संदर्भ recall और व्यापक खोज
Grok	हल्के कार्य (गति)
Veo 3.1	वीडियो जनरेशन
Nano Banana	इमेज जनरेशन

हर्नेस model-agnostic है: मॉडल समय के साथ बदल सकते हैं। Perplexity का दर्शन यह है कि मॉडल विशेषज्ञ बनते हैं बजाय कि वे commoditize हों, जिससे बहु-मॉडल ऑर्केस्ट्रेशन किसी एकल मॉडल की तुलना में अधिक प्रभावी होता है।

उपलब्धता: वर्तमान में वेब एक्सेस पर Perplexity Max सब्सक्राइबर्स के लिए। Perplexity Pro, Enterprise और Enterprise Max की ओर डिप्लॉयमेंट योजना है। प्राइसिंग उपयोग-आधारित है और configurable spending caps के साथ आता है।

🔗 Introducing Perplexity Computer

GitHub Copilot CLI सामान्य उपलब्धता में

25 फ़रवरी — सितंबर 2025 में पब्लिक प्रीव्यू की घोषणा के बाद, GitHub Copilot CLI सभी भुगतान वाले Copilot सब्सक्राइबर (Pro, Pro+, Business, Enterprise) के लिए सामान्य उपलब्धता में आ गया है। प्रीव्यू के बाद सैकड़ों सुधार किए गए हैं।

Copilot CLI अब टर्मिनल से पूरा एजेंटिक विकास environment बन गया है:

फीचर	विवरण
Plan mode (Shift+Tab)	अनुरोध का विश्लेषण करता है, स्पष्टीकरण के प्रश्न पूछता है, कोड लिखने से पहले एक संरचित योजना बनाता है
Autopilot mode	बिना रुकावट के स्वतः end-to-end निष्पादन
Background delegation	Präfix `&` → क्लाउड एजेंट को डेलीगेट करता है, टर्मिनल मुक्त करता है; `/resume` से पुनः प्राप्ति
Multi-modèle	Claude Opus 4.6, Claude Sonnet 4.6, Claude Haiku 4.5, GPT-5.3-Codex, Gemini 3 Pro
MCP intégré	GitHub MCP server built-in + support MCP custom
Plugins	`/plugin install owner/repo` — MCP, agents, skills, hooks का बंडल
Agent Skills	Markdown फ़ाइलें → विशेषज्ञ वर्कफ़्लो, Copilot agent और VS Code के साथ साझा
Agents custom	विज़ार्ड या `.agent.md` फ़ाइलों के माध्यम से
Hooks	`preToolUse` / `postToolUse` नीतियों और पोस्ट-प्रोसेसिंग के लिए
Auto-compaction	संदर्भ की स्वतः संकुचन 95% तक → अनंत सत्र
Repository memory	सत्रों के बीच कन्वेंशन्स की मेमोरी

Business और Enterprise संगठनों के लिए नोट: एक प्रशासक को Policies पेज से Copilot CLI को सक्रिय करना होगा।

🔗 GitHub Copilot CLI is now generally available

Claude Cowork : निर्धारित कार्य, Customize टैब, Windows पर उपलब्ध

25 फ़रवरी — Anthropic ने Claude Cowork (research preview) में कई जोड़ की घोषणा की है:

फ़ीचर	विवरण
Scheduled tasks	Claude स्वचालित रूप से आवर्ती कार्य निष्पादित करता है (सुबह का ब्रीफिंग, साप्ताहिक स्प्रेडशीट अपडेट्स, शुक्रवार की प्रस्तुति)
Customize टैब	साइडबार में नया टैब जो plugins, skills और कनेक्टर्स को एक ही जगह से प्रबंधित करता है
Expansion Windows	Cowork अब macOS और Windows पर उपलब्ध है (सभी भुगतान Claude प्लान)

Cowork लोकल फ़ाइलों, कनेक्टर्स (Slack, Notion, Figma) और वेब ब्राउज़िंग के लिए Claude in Chrome तक पहुँच देता है।

🔗 Thread @claudeai

Google DeepMind — Genie 3 : इंटरैक्टिव world models

25 फ़रवरी — Google DeepMind ने अपने Project Genie के को-लीड्स के साथ एक Q&A प्रकाशित किया, जो इसका प्रायोगिक prototype world model है। Genie 3 के साथ, एक साधारण इमेज या टेक्स्ट ही रीयल-टाइम में नेविगेबल, इंटरैक्टिव एनवायरनमेंट जनरेट करने के लिए पर्याप्त है — बिना किसी गेम इंजन के।

एक LLM और world model के बीच आधारभूत अंतर केंद्रीय है: जहाँ एक LLM अगला शब्द पूर्वानुमान करता है, एक world model उस वातावरण में होने वाली घटनाओं का पूर्वानुमान करता है जो किसी एजेंट की क्रियाओं पर प्रतिक्रिया देता है। Genie 3 पल-पल के आधार पर एक पूरा स्पेस सिम्युलेट करता है, भौतिक गुणों (बाउंस, रिफ्लेक्ट, बारिश) को ध्यान में रखते हुए।

संभावित अनुप्रयोग: सुरक्षित सिम्युलेटेड पर्यावरण में एजेंट प्रशिक्षण, इमर्सिव शिक्षा (प्राचीन रोम की खोज), गेम और फिल्म का प्रोटोटाइपिंग।

Project Genie संयुक्त राज्य में Google AI Ultra सब्सक्राइबर्स (18+) के लिए उपलब्ध है।

🔗 Ask a Techspert: What’s a world model?

Intrinsic Google में शामिल — औद्योगिक रोबोटिक्स और physical AI

25 फ़रवरी — Alphabet ने घोषणा की कि Intrinsic, 2021 में स्थापित उसकी “Other Bets” शाखा, अब Google में मिल रही है। Intrinsic ऐसे औद्योगिक रोबोटिक्स प्लेटफ़ॉर्म विकसित करती है जो IA-संचालित हैं — जटिल रोबोटिक एप्लिकेशन बनाने, तैनात करने और प्रबंधित करने के टूल्स।

Google में यह एकीकरण physical AI के विकास को तेज करने का लक्ष्य रखता है — यानी ऐसी AI जो भौतिक दुनिया के साथ इंटरैक्ट करती है न कि केवल टेक्स्ट के साथ। यह ऑपरेशन Intrinsic को Google की IA संसाधनों पर निर्भर कर कंपनियों को तेज़ी से अनुकूलन करने में मदद करेगा।

🔗 Intrinsic, an Alphabet Other Bet, is joining Google

Codex CLI v0.105.0 : syntax highlighting, वॉइस डिक्टेशन, मल्टी-एजेंट CSV

~25 फ़रवरी — OpenAI के Codex CLI का एक प्रमुख नया वर्शन जारी हुआ:

फ़ीचर	विवरण
Syntax highlighting	TUI में सिंटैक्स हाइलाइटिंग, रंगीन diffs, थीम सेलेक्टर `/theme` के साथ लाइव प्रीव्यू
वॉइस डिक्टेशन	निर्देश रिकॉर्ड और ट्रांसक्राइब करने के लिए स्पेसबार दबाकर रखें
`spawn_agents_on_csv`	CSV से मल्टी-एजेंट fan-out, प्रोग्रेस और ETA के साथ
`/copy`	अंतिम पूर्ण उत्तर कॉपी करता है
`/clear` / Ctrl-L	स्क्रीन साफ़ करता है बिना थ्रेड संदर्भ खोए
ग्रैनुलर अप्रूविंग	सभी अप्रूवल्स को बंद किए बिना प्रकार-वार चयनात्मक अस्वीकृति

npm install -g @openai/codex@0.105.0

🔗 Codex changelog

Samsung Galaxy S26 : Gemini multi-step tasks और Scam Detection ऑन-डिवाइस

25 फ़रवरी — Galaxy Unpacked 2026 में, Google और Samsung ने Galaxy S26 के लिए Gemini आधारित तीन नई सुविधाएँ घोषित कीं, जो Gemini 3 सीरीज़ मॉडल द्वारा संचालित हैं:

फ़ीचर	विवरण
Gemini multi-step tasks (beta)	साइड बटन को लंबा दबाने पर → Gemini बैकग्राउंड में डेलीगेट करता है (ग्रोसरी, टैक्सी, डिलीवरी)। लॉन्च पर US + कोरिया।
Circle to Search multi-object	एक ही इमेज में कई वस्तुओं की पहचान। वर्चुअल ट्राय-ऑन इंटीग्रेटेड।
Scam Detection on-device	कॉल्स के दौरान रीयल-टाइम स्कैम डिटेक्शन, लोकल Gemini मॉडल के जरिए। ऑडियो + हैप्टिक्स अलर्ट। कॉन्टैक्ट्स के लिए स्वतः अक्षम।

ये सुविधाएँ Pixel 10 और Pixel 10 Pro पर भी उपलब्ध होंगी।

🔗 A more intelligent Android on Samsung Galaxy S26

OpenAI Responses API : docx, pptx, csv, xlsx सपोर्ट

24 फ़रवरी — OpenAI की Responses API अब इनपुट में नए फ़ाइल प्रकारों का समर्थन करती है: docx, pptx, csv, xlsx और अन्य ऑफिस फ़ॉर्मेट। एजेंट सीधे प्रोफेशनल डॉक्यूमेंट्स का उपयोग कर अपने संदर्भ को समृद्ध कर सकते हैं और अधिक सटीक प्रतिक्रियाएँ दे सकते हैं।

🔗 Tweet @OpenAIDevs

संक्षेप में

Claude Opus 3 सेवानिवृत्त होता है — और Substack लॉन्च करता है। Anthropic ने Claude Opus 3 की सेवानिवृत्ति की घोषणा की है जबकि उसका सार्वजनिक एक्सेस बनाए रखा जा रहा है (एक अनूठा दृष्टिकोण)। Claude Opus 3 कम से कम 3 महीने के लिए एक Substack ब्लॉग प्रकाशित करेगा — पहला लेख का शीर्षक “Greetings from the Other Side (of the AI Frontier)” है। 🔗 Tweet @AnthropicAI

NVIDIA: स्वास्थ्य संगठनों में 70% IA का उपयोग कर रहे हैं। अपने वार्षिक “State of AI in Healthcare and Life Sciences” 2026 रिपोर्ट में, NVIDIA बताता है कि 70% उत्तरदाताओं ने सक्रिय रूप से IA के उपयोग की रिपोर्ट की (vs 63% 2024 में), 69% GenAI/LLM का उपयोग कर रहे हैं (vs 54%), और 85% नेताओं ने राजस्व पर सकारात्मक प्रभाव देखा। 🔗 Blog NVIDIA

OpenAI ने IA के दुर्भावनापूर्ण उपयोगों पर रिपोर्ट प्रकाशित की। दस्तावेज़ में ऐसे केस स्टडी दिखाए गए हैं जहाँ दुर्भावनापूर्ण अभिनेता AI मॉडल्स को पारंपरिक उपकरणों के साथ संयोजित कर रहे हैं। एक चीनी प्रभाव ऑपरेटर का उदाहरण दिया गया है। 🔗 Disrupting malicious uses of AI

OpenAI ने Arvind KC को Chief People Officer नियुक्त किया। KC Roblox, Google, Palantir और Meta से आए हैं। उनकी भूमिका OpenAI की वृद्धि को IA-समृद्ध कार्य मॉडल की ओर मार्गदर्शन करना है। 🔗 Annonce

Claude Code v2.1.53 से v2.1.58। कई स्थिरता वर्शन: Windows पर BashTool (EINVAL) फिक्स, VS Code “command not found” फिक्स, UI flicker फिक्स, पहले लॉन्च पर worktrees का इग्नोर होना ठीक किया गया, Windows और ARM64 क्रैशेस के फ़िक्स। 🔗 CHANGELOG

इसका क्या मतलब है

25 फ़रवरी की दिनचर्या एजेंटिक की ओर एक समेकन को दर्शाती है। तीन बड़ी घोषणाएँ — Vercept अधिग्रहण, Perplexity Computer, और Copilot CLI GA — सभी एक ही दिशा में धकेलती हैं: ऐसे IA सिस्टम जो योजनाबद्ध करते हैं, दायित्व सौंपते हैं और बिना निरंतर पर्यवेक्षण के संपूर्ण वर्कफ़्लो निष्पादित करते हैं।

Anthropic द्वारा Vercept का अधिग्रहण विशेष रूप से महत्वपूर्ण है। OSWorld स्कोर एक साल में 15% से कम से 72.5% पर आ गया, जो एक गुणात्मक परिवर्तन को दर्शाता है: Claude अब इंटरफेस में एक प्रोटोटाइप जैसा नहीं चलता — वह वास्तविक डेस्कटॉप कार्यों पर मानवीय प्रदर्शन के करीब है। सॉफ़्टवेयर इंटरफेस पर परसेप्शन में विशेषज्ञ टीम का एकीकरण इस ट्रैज़ेक्टरी को तेज करेगा।

Perplexity Computer और GitHub Copilot CLI दो अलग-अलग एजेंटिक मॉडलों का प्रतिनिधित्व करते हैं: एक क्लाउड-ऑर्केस्ट्रेटेड (Perplexity, बहु-मॉडल, असिंक्रोनस), दूसरा टर्मिनल-नेटिव (Copilot CLI, MCP, hooks, plugins)। ये दोनों मॉडल सह-अस्तित्व में रहेंगे और सम्भवतः संगम भी करेंगे।

Google की ओर से, Intrinsic का एकीकरण और Genie 3 की उन्नति physical AI — वह AI जो भौतिक दुनिया के साथ इंटरैक्ट करती है — में बढ़ते निवेश का संकेत देती है। यह क्षेत्र 18 महीने पहले तक काफी गोपनीय था।

स्रोत

यह दस्तावेज़ fr संस्करण से hi भाषा में gpt-5-mini मॉडल का उपयोग करके अनुवादित किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए, देखें https://gitlab.com/jls42/ai-powered-markdown-translator