3 मार्च 2026 एक भारी दिन रहा: Claude Code ने अपना Voice Mode धीरे-धीरे रोलआउट करना शुरू किया, OpenAI ने GPT-5.3 Instant को सभी ChatGPT उपयोगकर्ताओं तक पहुँचाया जिससे हैलुसिनेशन में उल्लेखनीय कमी आई, और Google ने Gemini 3.1 Flash-Lite का प्रीव्यू लॉन्च किया — यह Gemini 3 श्रृंखला का सबसे किफायती मॉडल है। साथ ही OpenAI ने GPT-5.4 का टीज़र दिया, FLUX.2 [pro] अपनी गति दोगुनी कर देता है बिना गुणवत्ता खोए, और Anthropic ने एक “unprecedented” वृद्धि को स्वीकार किया जिसने उनके सिस्टम पर दबाव डाला।
Claude Code में Voice Mode — push-to-talk, ~5% रोलआउट
3 मार्च 2026 — Thariq (@trq212, Claude Code टीम, Anthropic) ने Claude Code में Voice Mode के धीरे-धीरे रोलआउट की घोषणा की। यह फीचर डेवलपर समुदाय में पिछले कुछ हफ्तों से बहुत प्रत्याशित था।
यह कैसे काम करता है :
| पहलू | विवरण |
|---|---|
| Activation | कमांड /voice से सक्रिय/निष्क्रिय |
| Push-to-talk | बोलने के लिए स्पेस बार दबाकर रखें, भेजने के लिए छोड़ें |
| Transcription | टर्मिनल में रीयल-टाइम में दिखाई देती है |
| Note d’accueil | सक्रिय करते समय होम स्क्रीन पर दिखाई देती है |
| Tokens | वोकल ट्रांस्क्रिप्शन के tokens रेट लिमिट में गिनती नहीं होते |
Boris Cherny (@bcherny, lead Claude Code) पुष्टि करते हैं कि वे दैनिक रूप से इस मोड का उपयोग कर रहे हैं: उन्होंने बताया कि उन्होंने इस सप्ताह “अपना अधिकांश CLI कोड” Voice Mode के साथ लिखा। उनका अनुभव बताता है कि यह फीचर केवल परीक्षण के लिए नहीं, बल्कि वास्तविक कार्य सत्रों के लिए तैयार है।
उपलब्धता : 3 मार्च तक लगभग 5% उपयोगकर्ताओं के लिए सक्रिय। धीरे-धीरे रोलआउट आने वाले हफ्तों में जारी रहेगा। ट्रांस्क्रिप्शन का मुफ्त होना (tokens को क्वोटा से बाहर रखना) एक महत्वपूर्ण चुनाव है जो इस तरह की सुविधा में आम आर्थिक अवरोध को दूर करता है।
समुदाय पहले से ही एक द्वि-तरफ़ा संस्करण — आवाज़ में पढ़कर जवाब देना — और /remote-control की सामान्य उपलब्धता की मांग कर रही है। ये दोनों पॉइंट्स रोडमैप पर बने हुए हैं।
🔗 ट्वीट @trq212 — Voice Mode रोलिंग आउट 🔗 ट्वीट @bcherny — उपयोगकर्ता अनुभव
GPT-5.3 Instant सभी के लिए — हैलुसिनेशन में -26.8%
3 मार्च 2026 — OpenAI ने GPT-5.3 Instant को सभी ChatGPT उपयोगकर्ताओं के लिए रोलआउट किया। यह मॉडल GPT-5.2 Instant की जगह ChatGPT का डिफ़ॉल्ट मॉडल बन गया है, और इसका मुख्य फोकस रोज़मर्रा की गुणवत्ता पर है न कि केवल अकादमिक benchmarks पर।
इस अपडेट का सबसे ठोस बिंदु है: हैलुसिनेशन में कमी।
| परिदृश्य | हैलुसिनेशन में कमी |
|---|---|
| वेब एक्सेस के साथ (उच्च-जोखिम डोमेन्स: मेडिसिन, क़ानून) | -26.8% |
| बिना वेब एक्सेस | -19.7% |
| उपयोगकर्ता फीडबैक (त्रुटि रिपोर्ट) | -22.5% (वेब), -9.6% (बिना) |
OpenAI के ब्लॉग में दर्ज अन्य सुधार :
- बेकार इनकार कम : GPT-5.2 के रक्षात्मक/नैतिक प्रीएम्बुल कम हुए — मॉडल अब सीधे उत्तर देता है बिना अनावश्यक चेतावनियों के
- वेब खोज : वेब रिज़ल्ट और आंतरिक ज्ञान के बीच बेहतर संतुलन; कम लिंक-लिस्टिंग, अधिक सारगर्भित संश्लेषण
- टोन अधिक प्रवाही : उपयोगकर्ता की भावनात्मक अवस्था के बारे में कम अनुमान लगाने वाला टोन
- रचित लेखन : अधिक evocative और immersive प्रॉज़
“GPT-5.3 Instant in ChatGPT is now rolling out to everyone. More accurate, less cringe.”
🇮🇳 GPT-5.3 Instant अब ChatGPT में सभी के लिए तैनात किया गया है। अधिक सटीक, कम शर्मनाक/क्रिंज। — @OpenAI पर X
API उपलब्धता : आइडेंटिफायर gpt-5.3-chat-latest. GPT-5.2 Instant “पुराने मॉडल” में 3 महीनों के लिए उपलब्ध रहेगा, फिर 3 जून 2026 को हटाया जाएगा। Thinking और Pro अपडेट्स “जल्द आ रहे हैं” के रूप में घोषित किए गए हैं।
ज्ञात सीमा : जापानी और कोरियाई में टोन कभी-कभी कठोर रहता है — सुधार चल रहा है।
🔗 GPT-5.3 Instant घोषणा 🔗 GPT-5.3 Instant System Card
Gemini 3.1 Flash-Lite — प्रीव्यू, 2.5× तेज़, $0.25/1M tokens
3 मार्च 2026 — Google ने Gemini 3.1 Flash-Lite का प्रीव्यू API के माध्यम से Google AI Studio और Vertex AI में लॉन्च किया। यह Gemini 3 की श्रृंखला का सबसे किफायती मॉडल है, जिसे उच्च-वॉल्यूम डेवलपर वर्कलोड के लिए डिज़ाइन किया गया है।
कीमत और प्रदर्शन
| पहलू | मान |
|---|---|
| इनपुट की कीमत | $0.25 / 1M tokens |
| आउटपुट की कीमत | $1.50 / 1M tokens |
| गति (TTFAT) | 2.5× तेज़ बनाम Gemini 2.5 Flash |
| आउटपुट गति | +45% बनाम Gemini 2.5 Flash (Artificial Analysis) |
| Elo स्कोर (Arena.ai) | 1432 |
| GPQA Diamond | 86.9% |
| MMMU Pro | 76.8% |
ये benchmarks Flash-Lite को कई पिछले जनरेशन के बड़े Gemini मॉडलों से ऊपर रखते हैं — जो 3.1 सीरीज़ की एफिशिएंसी अप्रोच को मान्य करता है।
अनुकूली Thinking स्तर
एक महत्वपूर्ण विशेषता: thinking levels (अनुकूली विचार स्तर) नॅटिव रूप से AI Studio और Vertex AI में जुड़े हुए हैं। डेवलपर टास्क की जटिलता के अनुसार डायनामिक रूप से रीज़निंग की गहराई समायोजित कर सकते हैं — उपयोगी जब एक ही पाइपलाइन में सस्ते सरल टास्क और जटिल विश्लेषण मिलाना हो, बिना मॉडल बदले।
दस्तावेजीकृत उपयोग मामले
वृहद पैमाने पर बहुभाषी अनुवाद, कंटेंट मॉडरेशन, ई-कॉमर्स इंटरफ़ेस जेनेरेशन, डायनामिक डैशबोर्ड, मल्टी-स्टेप SaaS एजेंट। Latitude, Cartwheel और Whering जैसी कंपनियाँ पहले से ही early access में हैं।
🔗 Gemini 3.1 Flash-Lite घोषणा 🔗 ट्वीट @GoogleAI
GPT-5.4 टीज़र — “5.4 sooner than you Think.”
3 मार्च 2026 — GPT-5.3 Instant की घोषणा के एक घंटे बाद OpenAI ने एक संक्षिप्त ट्वीट पोस्ट किया: “5.4 sooner than you Think.” 800k व्यूज़, 13k लाइक्स।
समुदाय ने “Think” के असामान्य कैपिटलाइज़ेशन पर ध्यान दिया — संभवतः GPT-5.4 में एक उन्नत सोच/रीज़निंग मोड का संकेत। इस स्तर पर कोई अतिरिक्त विवरण उपलब्ध नहीं है।
Claude की स्केलेबिलिटी — अभूतपूर्व ट्रैफ़िक, #1 App Store
3 मार्च 2026 — दिन के अंत में, Thariq (@trq212) ने स्केलिंग चुनौतियों के बारे में एक आभार संदेश पोस्ट किया :
“We’ve seen unprecedented growth in Claude and Claude Code traffic this week that was genuinely hard to forecast. We appreciate you bearing with us as we scale.”
🇮🇳 हमने इस सप्ताह Claude और Claude Code के ट्रैफ़िक में अभूतपूर्व वृद्धि देखी, जिसे अनुमान लगाना वास्तव में मुश्किल था। जब तक हम अपने इंफ्रास्ट्रक्चर को समायोजित कर रहे हैं, तब तक आपकी सहनशीलता के लिए धन्यवाद। — @trq212 पर X
प्रसंग : Claude 1 मार्च को App Store में #1 पर पहुंचा (Mike Krieger, CPO @mikeyk द्वारा पुष्टि), और Voice Mode के लॉन्च ने अतिरिक्त ट्रैफ़िक पिक उत्पन्न किया। npm पैकेज @anthropic-ai/claude-code का साप्ताहिक डाउनलोड 9.5 मिलियन रिपोर्ट किया गया है।
🔗 ट्वीट @trq212 — स्केलेबिलिटी 🔗 ट्वीट @mikeyk — Claude #1 App Store
BFL FLUX.2 [pro] — 2× तेज़, वही कीमत, वही गुणवत्ता
3 मार्च 2026 — Black Forest Labs ने FLUX.2 [pro] का एक बड़ा अपडेट घोषित किया: मॉडल अब 2× तेज़ है बिना किसी गुणवत्ता हानि और बिना कीमत बढ़ाए।
FLUX.2 [pro] तीन मोड कवर करता है: text-to-image, इमेज एडिटिंग, और multi-reference। BFL के ट्वीट में यह पोज़िशनिंग दी गई कि यह “उच्च गुणवत्ता + उचित गति + व्यापक क्षमताओं का sweet spot” है — विशेषकर फोटोरियलिज्म (प्रोडक्ट फोटो, ग्राफिक डिज़ाइन) और पात्रों की निरंतरता के लिए।
🔗 ट्वीट @bfl_ml — FLUX.2 [pro] अपडेट 🔗 FLUX.2 डॉक्यूमेंटेशन
ElevenLabs MWC में — नेटवर्क-आधारित वॉइस असिस्टेंट और Deloitte के साथ साझेदारी
2 मार्च 2026 — ElevenLabs ने Mobile World Congress Barcelona से दो साझेदारियों की घोषणा की।
ElevenLabs × Deutsche Telekom — Magenta AI Call Assistant
Deutsche Telekom ने Magenta AI Call Assistant प्रस्तुत किया — जिसे नेटवर्क-इंटीग्रेटेड पहला AI वॉइस असिस्टेंट बताया जा रहा है। ElevenLabs की ElevenAgents प्लेटफ़ॉर्म द्वारा संचालित, यह किसी एप्लिकेशन इंस्टॉल किए बिना किसी भी कॉल करने वाले डिवाइस (स्मार्टफोन और फिक्स्ड लाइन फोन) पर काम करता है।
घोषित विशेषताएँ: 50 भाषाओं में अनुवाद, कॉल का स्मार्ट सार, वर्कफ़्लोज़ में स्वायत्त क्रियाएं।
ElevenLabs × Deloitte — एंटरप्राइज़ ओमनीचैनल एजेंट्स
ElevenLabs और Deloitte ने अपना पहला पार्टनरशिप घोषित किया। उद्देश्य: ElevenLabs Agents प्लेटफ़ॉर्म को Deloitte की कंसल्टिंग विशेषज्ञता के साथ जोड़कर कंपनियों को एंटरप्राइज़ सिस्टम्स में इंटीग्रेटेड वॉइस ओमनीचैनल एजेंट्स (कस्टमर एक्सपीरियंस, सेल्स, आंतरिक ऑपरेशंस) तैनात करने में मदद करना। यह ElevenLabs का पहला Big Four के साथ साझेदारी है।
🔗 ट्वीट @elevenlabsio — Deutsche Telekom MWC 🔗 ElevenLabs × Deloitte ब्लॉग
ताज़ा खबरें
Claude Code v2.1.64 (pre-release “next”)
Claude Code का 2.1.64 वर्शन npm पर टैग next के तहत प्रकाशित हुआ — अभी latest में promote नहीं किया गया (जो 2.1.63 बनी हुई है) और आधिकारिक GitHub Releases में नहीं दिख रहा। चेंजलॉग अभी उपलब्ध नहीं है; संभावना है कि यह pre-release Voice Mode शामिल करता है।
🔗 npm @anthropic-ai/claude-code
Qwen 3.5 GPTQ-Int4 — quantization, vLLM और SGLang
3 मार्च — Alibaba/Qwen ने Qwen 3.5 श्रृंखला के GPTQ-Int4 वज़न प्रकाशित किए जिनमें नेटिव vLLM और SGLang समर्थन है। परिणाम: कम VRAM आवश्यक, तेज़ इनफ़ेरेंस, सीमित GPU कॉन्फ़िगरेशन पर लोकल डिप्लॉयमेंट आसान।
🔗 ट्वीट @Alibaba_Qwen — GPTQ-Int4
Qwen 3.5 Small LM Studio, Ollama और MLX पर
2-3 मार्च — Qwen 3.5 Small मॉडल्स (0.8B–9B) अब प्रमुख लोकल इनफ़ेरेंस प्लेटफ़ॉर्म्स पर उपलब्ध हैं: LM Studio (~9B के लिए ~7 GB VRAM), Ollama और MLX। लोकल रोलआउट लॉन्च के अगले ही दिन ऑपरेशनल हो गया।
Z.ai Startup Program — API क्रेडिट और GLM-5 के early access
2 मार्च — Z.ai ने अपना Startup Program खोला: मुफ्त API क्रेडिट, प्रायोरिटी rate limits, शुरुआती API एक्सेस, और एक समर्पित समुदाय। लक्षित: AI-native स्टार्टअप्स, एजेंट बिल्डर्स, SaaS संस्थापक। प्लेटफ़ॉर्म पर सक्रिय मॉडल GLM-5 है।
🔗 ट्वीट @Zai_org — Startup Program
March Pixel Drop — Gemini ऐप्स में, Circle to Search मल्टी-ऑब्जेक्ट, फ्रांस में Scam Detection
3 मार्च — मार्च Pixel Drop ने Pixel डिवाइसों में कई AI फीचर जोड़े। Gemini अब सीधे ऐप्स में टास्क चला सकता है (कमांड, बुकिंग, कॉफी — बीटा में)। Circle to Search अब स्क्रीन पर दिख रहे सभी ऑब्जेक्ट्स को एक ही सर्च में पहचानता है, और “Try It On” बटन वर्चुअल क्लोथ ट्राय-ऑन के लिए देता है। Magic Cue Gemini के जरिए बातचीत में सीधे रेस्तरां सुझाता है। सुरक्षा की तरफ, Scam Detection फ्रांस, इटली, स्पेन, मैक्सिको, जर्मनी और जापान में आ रहा है। Pixel Watch को यूरोप और कनाडा में भूकंप अलर्ट और सैटेलाइट SOS सपोर्ट मिलता है।
🔗 March Pixel Drop — Google Blog
GPT-5.3 Instant System Card
GPT-5.3 Instant के साथ System Card भी एक साथ प्रकाशित हुई। सुरक्षा अप्रोच GPT-5.2 Instant के समान है — मॉडल को gpt-5.3-instant के तहत भी संदर्भित किया गया है।
इसका क्या अर्थ है
Claude Code में Voice Mode डेवलपरों के लिए दिन का सबसे संरचनात्मक निर्णय है। ट्रांस्क्रिप्शन मुफ्त करना (क्वोटा से बाहर) इस तरह की सुविधा की मुख्य आर्थिक बाधा को हटा देता है — यह अपनाने को अधिकतम करने के लिए एक जानबूझकर निर्णय है, कोई मामूली बात नहीं। टर्मिनल में स्पेस बार को push-to-talk के रूप में उपयोग करना उपकरण के साथ एक सुसंगत न्यूनतम इंटरफेस है।
मॉडल के मोर्चे पर, GPT-5.3 Instant और Gemini 3.1 Flash-Lite दो अलग रणनीतियों का प्रतिनिधित्व करते हैं: OpenAI बड़े पैमाने पर सार्वजनिक उपयोगकर्ता के दैनिक अनुभव में सुधार कर रहा है (कम हैलुसिनेशन, कम बेकार इनकार), जबकि Google डेवलपर्स के उच्च-वॉल्यूम API उपयोग के लिए लागत/प्रदर्शन अनुपात को अनुकूलित कर रहा है (2.5× तेज़, आक्रामक मूल्य)। GPT-5.3 के लॉन्च के एक घंटे बाद प्रकाशित GPT-5.4 का टीज़र OpenAI में मार्च 2026 के दौरान तेज़ डिलीवरी गति का संकेत देता है।
Anthropic में ट्रैफ़िक की ‘abhootpoorv’ (unprecedented) वृद्धि का ज़िक्र, #1 App Store के साथ मिलकर, पुष्टि करता है कि Claude Code और Claude ऐप अब निचे के चरण से बाहर निकलकर बहुत बड़े दर्शकों तक पहुँच रहे हैं। स्केलेबिलिटी की समस्याएँ इस बात का संकेत हैं कि अपनाना अनुमान से अधिक तेज़ रहा — यह तकनीकी विफलता नहीं बल्कि तेज़ वृद्धि का परिणाम है।
स्रोत - ट्वीट @trq212 — Voice Mode रोलआउट जारी
- ट्वीट @bcherny — Voice Mode प्रयोग का अनुभव
- ट्वीट @trq212 — Claude की स्केलेबिलिटी
- ट्वीट @mikeyk — Claude — App Store पर #1
- npm @anthropic-ai/claude-code — v2.1.64 next
- घोषणा GPT-5.3 Instant — OpenAI
- सिस्टम कार्ड GPT-5.3 Instant
- ट्वीट @OpenAI — GPT-5.3 Instant
- टीज़र GPT-5.4 — @OpenAI
- घोषणा Gemini 3.1 Flash-Lite — Google ब्लॉग
- ट्वीट @GoogleAI — Gemini 3.1 Flash-Lite
- ट्वीट @bfl_ml — FLUX.2 [pro] 2× अधिक तेज़
- ट्वीट @elevenlabsio — Deutsche Telekom MWC
- ElevenLabs × Deloitte ब्लॉग
- ट्वीट @Alibaba_Qwen — GPTQ-Int4
- ट्वीट @Alibaba_Qwen — LM Studio
- ट्वीट @Alibaba_Qwen — Ollama
- ट्वीट @Alibaba_Qwen — MLX
- ट्वीट @Zai_org — Z.ai स्टार्टअप प्रोग्राम
- मार्च Pixel Drop — Google ब्लॉग
इस दस्तावेज़ का fr संस्करण से hi भाषा में gpt-5-mini मॉडल का उपयोग करके अनुवाद किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए देखें https://gitlab.com/jls42/ai-powered-markdown-translator