खोजें

Anthropic ने Vercept का अधिग्रहण किया (computer use 72.5%), Perplexity Computer 19 मॉडल संचालित करता है, GitHub Copilot CLI अब GA में

Anthropic ने Vercept का अधिग्रहण किया (computer use 72.5%), Perplexity Computer 19 मॉडल संचालित करता है, GitHub Copilot CLI अब GA में

25 फ़रवरी 2026 एक बहुत व्यस्त दिन है: Anthropic ने Claude की computer use क्षमताओं को तेज करने के लिए Vercept का अधिग्रहण किया (OSWorld पर 72.5%), Perplexity ने Computer लॉन्च किया — एक एजेंटिक, स्वायत्त बहु-मॉडल ऑर्केस्ट्रेटर जो 19 मॉडल समानांतर में चलाता है — और GitHub Copilot CLI सभी भुगतान वाले सब्सक्राइबर के लिए सामान्य उपलब्धता में आ गया। साथ ही, Google DeepMind ने Genie 3 (इंटरैक्टिव world models) पेश किया और Intrinsic ने औद्योगिक रोबोटिक्स के लिए Google में विलय किया।


Anthropic ने Vercept का अधिग्रहण किया: OSWorld पर computer use 72.5% की ओर बढ़ा

25 फ़रवरी — Anthropic ने घोषणा की कि उसने Vercept का अधिग्रहण किया है, एक स्टार्टअप जो सॉफ़्टवेयर इंटरफेस के साथ IA सिस्टम की परसेप्शन और इंटरैक्शन में विशेषज्ञता रखता है। सह-संस्थापक Kiana Ehsani, Luca Weihs और Ross Girshick सीधे Anthropic में शामिल हो रहे हैं ताकि Claude की computer use क्षमताओं को सुदृढ़ किया जा सके।

यह अधिग्रहण OSWorld benchmark पर तेज प्रगति की प्रवृत्ति में आता है, जो यह मापता है कि कोई IA एजेंट वास्तविक ऑपरेटिंग सिस्टम पर कार्य (जटिल स्प्रेडशीट में नेविगेशन, मल्टी-टैब फॉर्म भरना, आदि) कितनी अच्छी तरह कर सकता है:

अवधिOSWorld स्कोर
अंत 2024 (computer use लॉन्च)< 15%
Claude Sonnet 4.6 (फर॰ 2026)72.5%

एक साल में 57 से अधिक अंकों की कूद। Claude Sonnet 4.6 अब इन डेस्कटॉप कार्यों पर मानवीय प्रदर्शन के करीब पहुँच रहा है। Vercept अपने बाहरी उत्पाद को अगले कुछ हफ्तों में बंद कर देगा ताकि पूरी तरह से Anthropic के भीतर इस काम पर ध्यान केंद्रित किया जा सके।

यह अधिग्रहण Bun के अधिग्रहण के बाद आया है। Anthropic तकनीकी उत्कृष्टता वाली टीमों का एक पोर्टफोलियो बना रहा है जो एजेंटिक क्षमताओं के इर्द-गिर्द काम करते हैं।

🔗 Anthropic acquires Vercept


Perplexity Computer : एक एजेंटिक बहु-मॉडल ऑर्केस्ट्रेटर (19 मॉडल)

25 फ़रवरी — Perplexity ने Computer लॉन्च किया, एक जनरल-परपज़ IA सिस्टम जिसे एंड-टू-एंड प्रोजेक्ट्स चलाने के लिए डिज़ाइन किया गया है। उपयोगकर्ता एक अंतिम लक्ष्य बताता है, Computer काम को उप-कार्य में तोड़ता है, विशिष्ट sub-agents बनाता है और समानांतर में निष्पादित करता है — घंटों या महीनों तक यदि आवश्यक हो।

ऑपरेशन असिंक्रोनस और अलग-थलग है: प्रत्येक कार्य एक समर्पित environment में चलता है जिसमें एक असली filesystem, असली ब्राउज़र, और वास्तविक टूल इंटीग्रेशन (APIs, वेब सर्च, डॉक्यूमेंट जनरेशन) तक पहुंच होती है।

Perplexity Computer की विशेषता इसका orchestration है — यह massively multi-model है — 19 मॉडल उपलब्ध हैं, हर एक को उनकी ताकत के अनुसार असाइन किया गया है:

मॉडलभूमिका
Claude Opus 4.6मूल ऑर्केस्ट्रेटर (core reasoning)
Geminiगहन रिसर्च, sub-agents निर्माण
ChatGPT 5.2लंबी-संदर्भ recall और व्यापक खोज
Grokहल्के कार्य (गति)
Veo 3.1वीडियो जनरेशन
Nano Bananaइमेज जनरेशन

हर्नेस model-agnostic है: मॉडल समय के साथ बदल सकते हैं। Perplexity का दर्शन यह है कि मॉडल विशेषज्ञ बनते हैं बजाय कि वे commoditize हों, जिससे बहु-मॉडल ऑर्केस्ट्रेशन किसी एकल मॉडल की तुलना में अधिक प्रभावी होता है।

उपलब्धता: वर्तमान में वेब एक्सेस पर Perplexity Max सब्सक्राइबर्स के लिए। Perplexity Pro, Enterprise और Enterprise Max की ओर डिप्लॉयमेंट योजना है। प्राइसिंग उपयोग-आधारित है और configurable spending caps के साथ आता है।

🔗 Introducing Perplexity Computer


GitHub Copilot CLI सामान्य उपलब्धता में

25 फ़रवरी — सितंबर 2025 में पब्लिक प्रीव्यू की घोषणा के बाद, GitHub Copilot CLI सभी भुगतान वाले Copilot सब्सक्राइबर (Pro, Pro+, Business, Enterprise) के लिए सामान्य उपलब्धता में आ गया है। प्रीव्यू के बाद सैकड़ों सुधार किए गए हैं।

Copilot CLI अब टर्मिनल से पूरा एजेंटिक विकास environment बन गया है:

फीचरविवरण
Plan mode (Shift+Tab)अनुरोध का विश्लेषण करता है, स्पष्टीकरण के प्रश्न पूछता है, कोड लिखने से पहले एक संरचित योजना बनाता है
Autopilot modeबिना रुकावट के स्वतः end-to-end निष्पादन
Background delegationPräfix & → क्लाउड एजेंट को डेलीगेट करता है, टर्मिनल मुक्त करता है; /resume से पुनः प्राप्ति
Multi-modèleClaude Opus 4.6, Claude Sonnet 4.6, Claude Haiku 4.5, GPT-5.3-Codex, Gemini 3 Pro
MCP intégréGitHub MCP server built-in + support MCP custom
Plugins/plugin install owner/repo — MCP, agents, skills, hooks का बंडल
Agent SkillsMarkdown फ़ाइलें → विशेषज्ञ वर्कफ़्लो, Copilot agent और VS Code के साथ साझा
Agents customविज़ार्ड या .agent.md फ़ाइलों के माध्यम से
HookspreToolUse / postToolUse नीतियों और पोस्ट-प्रोसेसिंग के लिए
Auto-compactionसंदर्भ की स्वतः संकुचन 95% तक → अनंत सत्र
Repository memoryसत्रों के बीच कन्वेंशन्स की मेमोरी

Business और Enterprise संगठनों के लिए नोट: एक प्रशासक को Policies पेज से Copilot CLI को सक्रिय करना होगा।

🔗 GitHub Copilot CLI is now generally available


Claude Cowork : निर्धारित कार्य, Customize टैब, Windows पर उपलब्ध

25 फ़रवरी — Anthropic ने Claude Cowork (research preview) में कई जोड़ की घोषणा की है:

फ़ीचरविवरण
Scheduled tasksClaude स्वचालित रूप से आवर्ती कार्य निष्पादित करता है (सुबह का ब्रीफिंग, साप्ताहिक स्प्रेडशीट अपडेट्स, शुक्रवार की प्रस्तुति)
Customize टैबसाइडबार में नया टैब जो plugins, skills और कनेक्टर्स को एक ही जगह से प्रबंधित करता है
Expansion WindowsCowork अब macOS और Windows पर उपलब्ध है (सभी भुगतान Claude प्लान)

Cowork लोकल फ़ाइलों, कनेक्टर्स (Slack, Notion, Figma) और वेब ब्राउज़िंग के लिए Claude in Chrome तक पहुँच देता है।

🔗 Thread @claudeai


Google DeepMind — Genie 3 : इंटरैक्टिव world models

25 फ़रवरी — Google DeepMind ने अपने Project Genie के को-लीड्स के साथ एक Q&A प्रकाशित किया, जो इसका प्रायोगिक prototype world model है। Genie 3 के साथ, एक साधारण इमेज या टेक्स्ट ही रीयल-टाइम में नेविगेबल, इंटरैक्टिव एनवायरनमेंट जनरेट करने के लिए पर्याप्त है — बिना किसी गेम इंजन के।

एक LLM और world model के बीच आधारभूत अंतर केंद्रीय है: जहाँ एक LLM अगला शब्द पूर्वानुमान करता है, एक world model उस वातावरण में होने वाली घटनाओं का पूर्वानुमान करता है जो किसी एजेंट की क्रियाओं पर प्रतिक्रिया देता है। Genie 3 पल-पल के आधार पर एक पूरा स्पेस सिम्युलेट करता है, भौतिक गुणों (बाउंस, रिफ्लेक्ट, बारिश) को ध्यान में रखते हुए।

संभावित अनुप्रयोग: सुरक्षित सिम्युलेटेड पर्यावरण में एजेंट प्रशिक्षण, इमर्सिव शिक्षा (प्राचीन रोम की खोज), गेम और फिल्म का प्रोटोटाइपिंग।

Project Genie संयुक्त राज्य में Google AI Ultra सब्सक्राइबर्स (18+) के लिए उपलब्ध है।

🔗 Ask a Techspert: What’s a world model?


Intrinsic Google में शामिल — औद्योगिक रोबोटिक्स और physical AI

25 फ़रवरी — Alphabet ने घोषणा की कि Intrinsic, 2021 में स्थापित उसकी “Other Bets” शाखा, अब Google में मिल रही है। Intrinsic ऐसे औद्योगिक रोबोटिक्स प्लेटफ़ॉर्म विकसित करती है जो IA-संचालित हैं — जटिल रोबोटिक एप्लिकेशन बनाने, तैनात करने और प्रबंधित करने के टूल्स।

Google में यह एकीकरण physical AI के विकास को तेज करने का लक्ष्य रखता है — यानी ऐसी AI जो भौतिक दुनिया के साथ इंटरैक्ट करती है न कि केवल टेक्स्ट के साथ। यह ऑपरेशन Intrinsic को Google की IA संसाधनों पर निर्भर कर कंपनियों को तेज़ी से अनुकूलन करने में मदद करेगा।

🔗 Intrinsic, an Alphabet Other Bet, is joining Google


Codex CLI v0.105.0 : syntax highlighting, वॉइस डिक्टेशन, मल्टी-एजेंट CSV

~25 फ़रवरी — OpenAI के Codex CLI का एक प्रमुख नया वर्शन जारी हुआ:

फ़ीचरविवरण
Syntax highlightingTUI में सिंटैक्स हाइलाइटिंग, रंगीन diffs, थीम सेलेक्टर /theme के साथ लाइव प्रीव्यू
वॉइस डिक्टेशननिर्देश रिकॉर्ड और ट्रांसक्राइब करने के लिए स्पेसबार दबाकर रखें
spawn_agents_on_csvCSV से मल्टी-एजेंट fan-out, प्रोग्रेस और ETA के साथ
/copyअंतिम पूर्ण उत्तर कॉपी करता है
/clear / Ctrl-Lस्क्रीन साफ़ करता है बिना थ्रेड संदर्भ खोए
ग्रैनुलर अप्रूविंगसभी अप्रूवल्स को बंद किए बिना प्रकार-वार चयनात्मक अस्वीकृति
npm install -g @openai/codex@0.105.0

🔗 Codex changelog


Samsung Galaxy S26 : Gemini multi-step tasks और Scam Detection ऑन-डिवाइस

25 फ़रवरीGalaxy Unpacked 2026 में, Google और Samsung ने Galaxy S26 के लिए Gemini आधारित तीन नई सुविधाएँ घोषित कीं, जो Gemini 3 सीरीज़ मॉडल द्वारा संचालित हैं:

फ़ीचरविवरण
Gemini multi-step tasks (beta)साइड बटन को लंबा दबाने पर → Gemini बैकग्राउंड में डेलीगेट करता है (ग्रोसरी, टैक्सी, डिलीवरी)। लॉन्च पर US + कोरिया।
Circle to Search multi-objectएक ही इमेज में कई वस्तुओं की पहचान। वर्चुअल ट्राय-ऑन इंटीग्रेटेड।
Scam Detection on-deviceकॉल्स के दौरान रीयल-टाइम स्कैम डिटेक्शन, लोकल Gemini मॉडल के जरिए। ऑडियो + हैप्टिक्स अलर्ट। कॉन्टैक्ट्स के लिए स्वतः अक्षम।

ये सुविधाएँ Pixel 10 और Pixel 10 Pro पर भी उपलब्ध होंगी।

🔗 A more intelligent Android on Samsung Galaxy S26


OpenAI Responses API : docx, pptx, csv, xlsx सपोर्ट

24 फ़रवरी — OpenAI की Responses API अब इनपुट में नए फ़ाइल प्रकारों का समर्थन करती है: docx, pptx, csv, xlsx और अन्य ऑफिस फ़ॉर्मेट। एजेंट सीधे प्रोफेशनल डॉक्यूमेंट्स का उपयोग कर अपने संदर्भ को समृद्ध कर सकते हैं और अधिक सटीक प्रतिक्रियाएँ दे सकते हैं।

🔗 Tweet @OpenAIDevs


संक्षेप में

Claude Opus 3 सेवानिवृत्त होता है — और Substack लॉन्च करता है। Anthropic ने Claude Opus 3 की सेवानिवृत्ति की घोषणा की है जबकि उसका सार्वजनिक एक्सेस बनाए रखा जा रहा है (एक अनूठा दृष्टिकोण)। Claude Opus 3 कम से कम 3 महीने के लिए एक Substack ब्लॉग प्रकाशित करेगा — पहला लेख का शीर्षक “Greetings from the Other Side (of the AI Frontier)” है। 🔗 Tweet @AnthropicAI

NVIDIA: स्वास्थ्य संगठनों में 70% IA का उपयोग कर रहे हैं। अपने वार्षिक “State of AI in Healthcare and Life Sciences” 2026 रिपोर्ट में, NVIDIA बताता है कि 70% उत्तरदाताओं ने सक्रिय रूप से IA के उपयोग की रिपोर्ट की (vs 63% 2024 में), 69% GenAI/LLM का उपयोग कर रहे हैं (vs 54%), और 85% नेताओं ने राजस्व पर सकारात्मक प्रभाव देखा। 🔗 Blog NVIDIA

OpenAI ने IA के दुर्भावनापूर्ण उपयोगों पर रिपोर्ट प्रकाशित की। दस्तावेज़ में ऐसे केस स्टडी दिखाए गए हैं जहाँ दुर्भावनापूर्ण अभिनेता AI मॉडल्स को पारंपरिक उपकरणों के साथ संयोजित कर रहे हैं। एक चीनी प्रभाव ऑपरेटर का उदाहरण दिया गया है। 🔗 Disrupting malicious uses of AI

OpenAI ने Arvind KC को Chief People Officer नियुक्त किया। KC Roblox, Google, Palantir और Meta से आए हैं। उनकी भूमिका OpenAI की वृद्धि को IA-समृद्ध कार्य मॉडल की ओर मार्गदर्शन करना है। 🔗 Annonce

Claude Code v2.1.53 से v2.1.58। कई स्थिरता वर्शन: Windows पर BashTool (EINVAL) फिक्स, VS Code “command not found” फिक्स, UI flicker फिक्स, पहले लॉन्च पर worktrees का इग्नोर होना ठीक किया गया, Windows और ARM64 क्रैशेस के फ़िक्स। 🔗 CHANGELOG


इसका क्या मतलब है

25 फ़रवरी की दिनचर्या एजेंटिक की ओर एक समेकन को दर्शाती है। तीन बड़ी घोषणाएँ — Vercept अधिग्रहण, Perplexity Computer, और Copilot CLI GA — सभी एक ही दिशा में धकेलती हैं: ऐसे IA सिस्टम जो योजनाबद्ध करते हैं, दायित्व सौंपते हैं और बिना निरंतर पर्यवेक्षण के संपूर्ण वर्कफ़्लो निष्पादित करते हैं।

Anthropic द्वारा Vercept का अधिग्रहण विशेष रूप से महत्वपूर्ण है। OSWorld स्कोर एक साल में 15% से कम से 72.5% पर आ गया, जो एक गुणात्मक परिवर्तन को दर्शाता है: Claude अब इंटरफेस में एक प्रोटोटाइप जैसा नहीं चलता — वह वास्तविक डेस्कटॉप कार्यों पर मानवीय प्रदर्शन के करीब है। सॉफ़्टवेयर इंटरफेस पर परसेप्शन में विशेषज्ञ टीम का एकीकरण इस ट्रैज़ेक्टरी को तेज करेगा।

Perplexity Computer और GitHub Copilot CLI दो अलग-अलग एजेंटिक मॉडलों का प्रतिनिधित्व करते हैं: एक क्लाउड-ऑर्केस्ट्रेटेड (Perplexity, बहु-मॉडल, असिंक्रोनस), दूसरा टर्मिनल-नेटिव (Copilot CLI, MCP, hooks, plugins)। ये दोनों मॉडल सह-अस्तित्व में रहेंगे और सम्भवतः संगम भी करेंगे।

Google की ओर से, Intrinsic का एकीकरण और Genie 3 की उन्नति physical AI — वह AI जो भौतिक दुनिया के साथ इंटरैक्ट करती है — में बढ़ते निवेश का संकेत देती है। यह क्षेत्र 18 महीने पहले तक काफी गोपनीय था।


स्रोत

यह दस्तावेज़ fr संस्करण से hi भाषा में gpt-5-mini मॉडल का उपयोग करके अनुवादित किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए, देखें https://gitlab.com/jls42/ai-powered-markdown-translator