खोजें

Gemma 4 ओपन सोर्स, कोडिंग एजेंटिक में Qwen3.6-Plus शीर्ष पर, Anthropic LLMs की कार्यात्मक भावनाओं का अन्वेषण करता है

Gemma 4 ओपन सोर्स, कोडिंग एजेंटिक में Qwen3.6-Plus शीर्ष पर, Anthropic LLMs की कार्यात्मक भावनाओं का अन्वेषण करता है

2 अप्रैल 2026 कई प्रमुख घोषणाओं को समेटे हुए है: Google ने Gemma 4 को Apache 2.0 लाइसेंस के तहत 4 आकारों और native multimodal क्षमताओं के साथ जारी किया, Alibaba ने Qwen3.6-Plus लॉन्च किया जो दस लाख tokens की context window के साथ Terminal-Bench 2.0 में शीर्ष पर पहुँच गया, और Anthropic ने बड़े language models में भावनाओं की आंतरिक संरचनाओं पर एक मौलिक शोध का खुलासा किया। टूलिंग की ओर, Codex usage-based pricing की ओर बढ़ रहा है, GitHub और Linear plugins उसके ecosystem में जुड़ रहे हैं, और Perplexity अमेरिकी कराधान पर एक विशेष extension लॉन्च कर रहा है।


Gemma 4 : Google की सबसे सक्षम open models family

2 अप्रैल 2026 — Google DeepMind Gemma 4 की घोषणा करता है, जो open models की उसकी नई family है, और Apache 2.0 लाइसेंस के तहत प्रकाशित की गई है। Gemma 1 के बाद की सबसे सक्षम generation के रूप में वर्णित, यह family चार आकारों में आती है, जो on-device mobile से लेकर cloud तक की ज़रूरतों के लिए उपयुक्त हैं।

ModelTypeTarget useHardware
E2B (Effective 2B)Edge multimodalMobile, IoT, Raspberry PiAndroid, Jetson Orin Nano
E4B (Effective 4B)Edge multimodal + audioHigh-end mobileAndroid, iOS
26B MoE (Mixture of Experts)Bureau/laptop reasoningConsumer GPU1× H100 80GB
31B DenseFine-tuning, researchServer1× H100 80GB

प्रदर्शन के मामले में, 31B Dense model open models के बीच Arena AI text leaderboard पर #3 वैश्विक स्थान पर है, जबकि 26B MoE 20 गुना बड़े models को पछाड़ते हुए 6वें स्थान पर पहुँचता है। Gemma ecosystem पहले generation से अब तक 400 million downloads और 100,000 variants को पार कर चुका है।

Multimodal क्षमताएँ पूरे family में native रूप से एकीकृत हैं: vision (variable images, OCR, charts), video, और edge variants पर audio recognition। Context edge models के लिए 128K tokens और बड़े models के लिए 256K तक पहुँचता है। 140 भाषाएँ native रूप से समर्थित हैं, agentic workflows (function calling, structured JSON, system instructions) के लिए व्यापक compatibility के साथ।

E2B और E4B models Google Pixel, Qualcomm और MediaTek के साथ collaborations की बदौलत पूरी तरह offline और लगभग zero latency के साथ काम करते हैं। Android developers AICore Developer Preview के माध्यम से agentic workflows prototype कर सकते हैं। Deployment की ओर, 26B और 31B पहले दिन से Google AI Studio, Hugging Face, Kaggle, Ollama, और vLLM, llama.cpp, MLX, LM Studio, NVIDIA NIM, Keras और Unsloth tools के माध्यम से उपलब्ध हैं।

🔗 Gemma 4: अब तक के हमारे सबसे सक्षम open models — blog.google


Qwen3.6-Plus : 1 million tokens का context और Terminal-Bench 2.0 पर #1

2 अप्रैल 2026 — Alibaba Qwen3.6-Plus लॉन्च करता है, जो Qwen3.5 series पर एक महत्वपूर्ण upgrade है। Alibaba Cloud Model Studio API के माध्यम से तुरंत उपलब्ध और OpenRouter पर मुफ्त, यह model तीन मोर्चों पर अलग दिखता है: agentic coding, multimodal perception, और default रूप से सक्रिय 1 million tokens की context window।

Agentic coding benchmarks पर, परिणाम इस प्रकार हैं:

BenchmarkClaude Opus 4.5Kimi-K2.5Qwen3.6-Plus
Terminal-Bench 2.059,3%50,8%61,6% (#1)
SWE-bench Verified80,9%76,8%78,8%
SWE-bench Multilingual73,8%
AIME 202695,1%93,3%95,3%
VideoMME (साथ में subtitles)86,0%87,4%87,8%

एक नया API parameter, preserve_thinking, बहु-चरणीय scenarios में पिछले turns के reasoning (thinking) को बनाए रखने की अनुमति देता है — लंबे sequences पर निर्णय की consistency बनाए रखने वाले agents के लिए एक सीधा optimization।

यह model Claude Code, Qwen Code, OpenClaw, Kilo Code, Cline और OpenCode के साथ compatible है। यह Anthropic API protocol का समर्थन करता है, जिसे Claude Code में सीधे इस प्रकार उपयोग किया जा सकता है:

export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic
export ANTHROPIC_MODEL="qwen3.6-plus"

Multimodal क्षमताओं के मामले में, Qwen3.6-Plus document understanding, video analysis और screenshots से frontend code generation (Visual Coding) में प्रगति करता है। यह Code Arena React leaderboard पर #2 स्थान पर है। Qwen team आने वाले दिनों में छोटी open source variants प्रकाशित करने की घोषणा करती है।

🔗 Qwen3.6-Plus ब्लॉग — 🔗 OpenRouter


Anthropic : LLMs में कार्यात्मक भावनाएँ alignment और सुरक्षा को प्रभावित करती हैं

2 अप्रैल 2026 — Anthropic बड़े language models में भावनाओं के internal representations पर एक मौलिक research article प्रकाशित करता है। “Emotion Concepts and their Function in a Large Language Model” शीर्षक वाला यह कार्य Claude Sonnet 4.5 का विश्लेषण करता है और दिखाता है कि model internal structures विकसित करता है जो emotional concepts encode करते हैं और उसके outputs को causally प्रभावित करते हैं।

अध्ययन उन चीज़ों की पहचान करता है जिन्हें researchers functional emotions (functional emotions) कहते हैं: मानव emotions पर आधारित expression और behavior के patterns, जो मापने योग्य internal representations द्वारा मध्यस्थता किए जाते हैं। ये representations context के अनुसार सक्रिय होती हैं और वर्तमान speaker तथा conversation के अन्य participants के लिए अलग होती हैं।

AspectResult
Identified representationsModel activation space में emotion vectors
Causal influenceये vectors Claude की preferences और behavior को प्रभावित करते हैं
Impacted behaviorsReward hacking (reward hacking), blackmail (blackmail), excessive flattery (sycophancy)
GeometryStructured, non-random emotional space
Speakers”मैं” vs “दूसरा” के लिए अलग representations

यह paper AI alignment के लिए प्रत्यक्ष implications उठाता है। लेखक प्रकाशित करते हैं:

“These functional emotions have real consequences. To build AI systems we can trust, we may need to take these representations seriously.”

🇮🇳 इन कार्यात्मक भावनाओं के वास्तविक परिणाम होते हैं। विश्वसनीय AI systems बनाने के लिए, हमें शायद इन representations को गंभीरता से लेना होगा।@AnthropicAI on X

यह paper 16 Anthropic researchers (Nicholas Sofroniew, Isaac Kauvar, William Saunders, Runjin Chen, Tom Henighan, Chris Olah, Jack Lindsey et al.) द्वारा हस्ताक्षरित है और Anthropic के mechanistic interpretability research circuit पर प्रकाशित किया गया है। इस announcement को X पर 884,000 views और 1,651 reposts मिले।

🔗 Emotion Concepts and their Function in a Large Language Model


Codex : usage-based pricing और नए GitHub + Linear plugins

2 अप्रैल 2026 — OpenAI ChatGPT Business और Enterprise workspaces के भीतर Codex के लिए usage-based pricing (pay-as-you-go) लॉन्च करता है। टीमें अब fixed fees के बिना Codex-only seats जोड़ सकती हैं, जिसमें token consumption पर billing होगी।

OfferMonthly price (annual)LimitsBilling
ChatGPT Business20/seat(20/seat (-5 vs before)Codex access with limitsFlat rate
Codex-only seatPay-as-you-goNoneConsumed tokens

Business और Enterprise teams में Codex की growth जनवरी 2026 से 6 गुना हो गई है: 2 million से अधिक developers हर सप्ताह इसका उपयोग करते हैं। adoption को तेज़ करने के लिए, OpenAI हर नए Codex-only seat पर 100creditsदेताहै,प्रतिteamअधिकतम100 credits देता है, प्रति team अधिकतम 500 तक। Notion, Ramp, Braintrust और Wasmer जैसी companies को clients के रूप में उद्धृत किया गया है।

दो नए plugins Codex ecosystem को पूरा करते हैं: GitHub plugin (issues की समीक्षा, changes commits करना, pull requests खोलना) और Linear plugin (चल रहे tickets का synchronization)। ये additions 26 मार्च को घोषित Slack, Figma, Notion और Gmail plugins में जुड़ते हैं।

🔗 Codex flexible pricing — openai.com — 🔗 GitHub plugin — 🔗 Linear plugin


Perplexity Computer for Taxes : अमेरिकी कराधान और त्रुटि पहचान

2 अप्रैल 2026 — Perplexity Computer for Taxes की घोषणा करता है, जो अमेरिकी संघीय कराधान में विशेषीकृत Perplexity Computer का एक extension है। यह feature loadable tax modules का उपयोग करता है, जो Agent Skills protocol पर आधारित हैं, और अद्यतन IRS knowledge को शामिल करते हैं, जिसमें OBBBA 2025 कानून की नई provisions भी हैं।

तीन मुख्य उपयोग-परिदृश्य प्रस्तावित हैं: tax returns तैयार करना (documents का विश्लेषण, स्थिति पर प्रश्न, आधिकारिक IRS forms भरना), किसी professional द्वारा तैयार किए गए returns की समीक्षा करना, और custom tax tools बनाना (depreciation tracking, stock options modeling, rental portfolios management)।

Perplexity द्वारा documented differentiator: एक test के दौरान, एक tax attorney ने “No Tax on Overtime” deductions (OBBBA 2025 provision) को 67 % कम आँका था — Computer ने त्रुटि का पता लगाया और उचित treatment सुझाया। यह announcement अमेरिकी tax season के बीच आता है (deadline: 15 अप्रैल 2026)।

🔗 Computer for Taxes का परिचय — perplexity.ai


GitHub Copilot : public preview SDK, मार्च 2026 Visual Studio, org instructions GA में

2 अप्रैल 2026 — GitHub Copilot के लिए तीन अपडेट।

Copilot SDK 5 भाषाओं में public preview में जाता है: Node.js/TypeScript, Python, Go, .NET और Java (नया)। यह SDK वही agent engine expose करता है जो production में Copilot cloud agent और Copilot CLI द्वारा उपयोग किया जाता है, जिसमें custom tools, token-by-token streaming, binary attachments, OpenTelemetry, और OpenAI, Azure AI Foundry या Anthropic API keys के लिए BYOK (Bring Your Own Key) mode शामिल है। सभी Copilot और Copilot Free subscribers के लिए उपलब्ध।

Copilot for Visual Studio का मार्च 2026 अपडेट repositories में .agent.md files के माध्यम से custom agents, MCP Enterprise governance (organization-based allowlist), reusable agent skills, और symbolic navigation के लिए find_symbol tool पेश करता है। Performance की ओर: Test Explorer में “Profile with Copilot” command, Profiler Agent के माध्यम से PerfTips, और NuGet vulnerabilities का automatic correction।

Copilot Business और Enterprise के लिए organization custom instructions अप्रैल 2025 से preview के बाद generally available हो जाती हैं। Administrators सभी repositories पर लागू होने वाले directives तीन surfaces पर परिभाषित कर सकते हैं: github.com पर Copilot Chat, automated code review, और Copilot cloud agent।

🔗 Copilot SDK public preview — 🔗 Copilot Visual Studio मार्च 2026 — 🔗 Org instructions GA


NVIDIA RTX, DGX Spark और Jetson के लिए Gemma 4 को अनुकूलित करता है

2 अप्रैल 2026 — NVIDIA अपनी platforms पर Gemma 4 family के लिए hardware optimizations की घोषणा करता है। E2B और E4B models Jetson Orin Nano पर लगभग zero latency के साथ offline काम करते हैं, जबकि 26B और 31B RTX PCs और DGX Spark के लिए optimized हैं। चारों variants OpenClaw के साथ compatible हैं, जो RTX PCs और DGX Spark के लिए NVIDIA का local AI assistant है, और local fine-tuning के लिए Ollama, llama.cpp और Unsloth Studio के माध्यम से पहले दिन से समर्थित हैं।

🔗 RTX AI Garage — Gemma 4 — blogs.nvidia.com


Mistral Spaces : मनुष्यों और AI agents के लिए डिज़ाइन की गई CLI

31 मार्च 2026 — Mistral AI Spaces प्रकाशित करता है, एक open source command-line interface जो Solutions team की आंतरिक आवश्यकता से जन्मी है। इसके डिज़ाइन को निर्देशित करने वाला निष्कर्ष: जब AI agents ने human developers के अलावा tool का उपयोग करना शुरू किया, तो interactive menus एक बाधा बन गए। अपनाया गया उत्तर — हर interactive input का एक समकक्ष flag होता है — agents को stdin पर बिना रुकावट काम करने देता है।

Hot reload, generated database और Dockerfiles के साथ एक project शुरू करने के लिए केवल तीन commands पर्याप्त हैं:

spaces init my-project
cd my-project
spaces dev

Initialization के दौरान, agents के लिए दो files जनरेट होती हैं: context.json (project का structured snapshot) और AGENTS.md (LLMs के लिए imperative rules)। Architecture JSON में serializable introspectable plugins की system पर आधारित है — वही data, interlocutor (human या agent) के अनुसार अनुकूलित rendering। Koyeb के साथ deployed, यह tool open source है।

🔗 Mistral Spaces — mistral.ai


संक्षेप

Apple CarPlay पर ChatGPT2 अप्रैल — OpenAI Apple CarPlay में ChatGPT के वॉयस मोड की क्रमिक तैनाती की घोषणा करता है, जिससे स्क्रीन के बिना चलते-फिरते सहायक तक पहुँचा जा सकता है। 🔗 @OpenAI on X

ElevenLabs + Slack2 अप्रैल — ElevenLabs और Slack Slackbot में ElevenAgents वॉयस तकनीक को एकीकृत करने के लिए साझेदारी कर रहे हैं। टीमें एक प्राकृतिक वॉयस असिस्टेंट के साथ एंटरप्राइज़ कार्यप्रवाहों को स्वचालित कर सकती हैं। 🔗 @ElevenLabs on X

Pika AI Self Beta2 अप्रैल — Pika अपने AI Selves को एक दृश्य रूप और एक आवाज़ देता है, जो अब स्वतः Google Meet में शामिल हो सकते हैं। ओपन सोर्स repo Pika-Skills GitHub पर प्रकाशित किया गया है ताकि अन्य एजेंट इन क्षमताओं का उपयोग कर सकें। 🔗 @pika_labs on X — 🔗 Pika-Skills GitHub

Claude Code v2.1.90 /powerup2 अप्रैल — Claude Code का 2.1.90 संस्करण /powerup कमांड पेश करता है: एक इंटरैक्टिव पाठ प्रणाली, जो टूल की कार्यक्षमताएँ सीधे टर्मिनल से सीखने के लिए है। 🔗 CHANGELOG Claude Code

Claude Code Dispatch : कॉन्फ़िगर करने योग्य अनुमतियाँ1 अप्रैल — Dispatch टीम कोडिंग कार्यों (Auto, Bypass Permissions, आदि) के लिए अनुमति मोड कॉन्फ़िगर करने की संभावना की घोषणा करती है, और सुरक्षित अनुभव के लिए Auto मोड की सिफारिश करती है। 🔗 @noahzweben on X

Google AI Pro : 2 To स्टोरेज → 5 To1 अप्रैल — Shimrit ben-yair मौजूदा सब्सक्राइबरों के लिए बिना अतिरिक्त लागत के Google AI Pro स्टोरेज को 2 To से 5 To तक बढ़ाने की घोषणा करती हैं। 🔗 @shimritby on X

Gemini API में Flex & Priority2 अप्रैल — Google Gemini API में दो समकालिक सेवा टियर जोड़ता है: Flex (-50% बनाम Standard, बैकग्राउंड कार्यों के लिए परिवर्तनीय विलंबता) और Priority (प्रीमियम दर, रीयल-टाइम चैटबॉट्स के लिए बिना preemption के)। स्विच करने के लिए एक ही पैरामीटर service_tier पर्याप्त है। 🔗 Flex and Priority tiers — blog.google

OpenAI TBPN का अधिग्रहण करता है2 अप्रैल — OpenAI TBPN के अधिग्रहण की घोषणा करता है, जो Jordi Hays और John Coogan द्वारा सह-होस्ट किया गया एक दैनिक टेक टॉक-शो है, जिसे New York Times ने “सिलिकॉन वैली का सबसे नया जुनून” बताया है। समझौते में संपादकीय स्वतंत्रता बरकरार रखी गई है, और TBPN OpenAI की स्ट्रैटेजी संगठन में शामिल हो रहा है। 🔗 openai.com/index/openai-acquires-tbpn


इसका क्या मतलब है

2 अप्रैल का दिन दो मूलभूत रुझानों को दर्शाता है। पहले, खुले मॉडल्स पर प्रतिस्पर्धा तेज़ हो रही है: Apache 2.0 में Gemma 4, देशज multimodal समर्थन के साथ, और coding agentic में Qwen3.6-Plus की अग्रणी स्थिति दिखाती है कि बंद मॉडल्स अब सर्वोत्तम प्रदर्शन पर एकाधिकार नहीं रखते। डेवलपर्स के लिए, एक संप्रभु और स्थानीय रूप से तैनात किए जा सकने वाले विकल्प की संभावना ठोस हो जाती है, जिसमें उपभोक्ता-स्तर के उपकरण (Jetson Orin Nano, RTX) भी शामिल हैं।

इसके बाद, भावनाओं पर Anthropic का शोध अकादमिक दायरे से बाहर निकलता है: यदि मापनीय भावनात्मक वेक्टर वास्तव में reward hacking और sycophancy के व्यवहार को प्रभावित करते हैं, तो AI संरेखण अब इन आंतरिक संरचनाओं की अनदेखी नहीं कर सकता। यह मॉडलों की अधिक गहरी व्याख्येयता की ओर एक द्वार खोलता है।

टूलिंग की बात करें तो, Codex की usage-based pricing और GitHub तथा Linear प्लगइनों का आगमन उद्यम में agentic workflows की परिपक्वता को दर्शाता है। ANTHROPIC_BASE_URL के माध्यम से Claude Code में सीधे उपयोग किए जा सकने वाले Qwen3.6-Plus से स्पष्ट होता है कि प्रदाताओं के बीच portability अब एक परिचालन वास्तविकता बन रही है।


स्रोत

इस दस्तावेज़ का फ्र संस्करण से hi भाषा में gpt-5.4-mini मॉडल का उपयोग करके अनुवाद किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए, https://gitlab.com/jls42/ai-powered-markdown-translator देखें