Claude Code में Voice Mode, GPT-5.3 Instant सबके लिए, Gemini 3.1 Flash-Lite प्रीव्यू

3 मार्च 2026 एक भारी दिन रहा: Claude Code ने अपना Voice Mode धीरे-धीरे रोलआउट करना शुरू किया, OpenAI ने GPT-5.3 Instant को सभी ChatGPT उपयोगकर्ताओं तक पहुँचाया जिससे हैलुसिनेशन में उल्लेखनीय कमी आई, और Google ने Gemini 3.1 Flash-Lite का प्रीव्यू लॉन्च किया — यह Gemini 3 श्रृंखला का सबसे किफायती मॉडल है। साथ ही OpenAI ने GPT-5.4 का टीज़र दिया, FLUX.2 [pro] अपनी गति दोगुनी कर देता है बिना गुणवत्ता खोए, और Anthropic ने एक “unprecedented” वृद्धि को स्वीकार किया जिसने उनके सिस्टम पर दबाव डाला।

Claude Code में Voice Mode — push-to-talk, ~5% रोलआउट

3 मार्च 2026 — Thariq (@trq212, Claude Code टीम, Anthropic) ने Claude Code में Voice Mode के धीरे-धीरे रोलआउट की घोषणा की। यह फीचर डेवलपर समुदाय में पिछले कुछ हफ्तों से बहुत प्रत्याशित था।

यह कैसे काम करता है :

पहलू	विवरण
Activation	कमांड `/voice` से सक्रिय/निष्क्रिय
Push-to-talk	बोलने के लिए स्पेस बार दबाकर रखें, भेजने के लिए छोड़ें
Transcription	टर्मिनल में रीयल-टाइम में दिखाई देती है
Note d’accueil	सक्रिय करते समय होम स्क्रीन पर दिखाई देती है
Tokens	वोकल ट्रांस्क्रिप्शन के tokens रेट लिमिट में गिनती नहीं होते

Boris Cherny (@bcherny, lead Claude Code) पुष्टि करते हैं कि वे दैनिक रूप से इस मोड का उपयोग कर रहे हैं: उन्होंने बताया कि उन्होंने इस सप्ताह “अपना अधिकांश CLI कोड” Voice Mode के साथ लिखा। उनका अनुभव बताता है कि यह फीचर केवल परीक्षण के लिए नहीं, बल्कि वास्तविक कार्य सत्रों के लिए तैयार है।

उपलब्धता : 3 मार्च तक लगभग 5% उपयोगकर्ताओं के लिए सक्रिय। धीरे-धीरे रोलआउट आने वाले हफ्तों में जारी रहेगा। ट्रांस्क्रिप्शन का मुफ्त होना (tokens को क्वोटा से बाहर रखना) एक महत्वपूर्ण चुनाव है जो इस तरह की सुविधा में आम आर्थिक अवरोध को दूर करता है।

समुदाय पहले से ही एक द्वि-तरफ़ा संस्करण — आवाज़ में पढ़कर जवाब देना — और /remote-control की सामान्य उपलब्धता की मांग कर रही है। ये दोनों पॉइंट्स रोडमैप पर बने हुए हैं।

🔗 ट्वीट @trq212 — Voice Mode रोलिंग आउट 🔗 ट्वीट @bcherny — उपयोगकर्ता अनुभव

GPT-5.3 Instant सभी के लिए — हैलुसिनेशन में -26.8%

3 मार्च 2026 — OpenAI ने GPT-5.3 Instant को सभी ChatGPT उपयोगकर्ताओं के लिए रोलआउट किया। यह मॉडल GPT-5.2 Instant की जगह ChatGPT का डिफ़ॉल्ट मॉडल बन गया है, और इसका मुख्य फोकस रोज़मर्रा की गुणवत्ता पर है न कि केवल अकादमिक benchmarks पर।

इस अपडेट का सबसे ठोस बिंदु है: हैलुसिनेशन में कमी।

परिदृश्य	हैलुसिनेशन में कमी
वेब एक्सेस के साथ (उच्च-जोखिम डोमेन्स: मेडिसिन, क़ानून)	-26.8%
बिना वेब एक्सेस	-19.7%
उपयोगकर्ता फीडबैक (त्रुटि रिपोर्ट)	-22.5% (वेब), -9.6% (बिना)

OpenAI के ब्लॉग में दर्ज अन्य सुधार :

बेकार इनकार कम : GPT-5.2 के रक्षात्मक/नैतिक प्रीएम्बुल कम हुए — मॉडल अब सीधे उत्तर देता है बिना अनावश्यक चेतावनियों के
वेब खोज : वेब रिज़ल्ट और आंतरिक ज्ञान के बीच बेहतर संतुलन; कम लिंक-लिस्टिंग, अधिक सारगर्भित संश्लेषण
टोन अधिक प्रवाही : उपयोगकर्ता की भावनात्मक अवस्था के बारे में कम अनुमान लगाने वाला टोन
रचित लेखन : अधिक evocative और immersive प्रॉज़

“GPT-5.3 Instant in ChatGPT is now rolling out to everyone. More accurate, less cringe.”

🇮🇳 GPT-5.3 Instant अब ChatGPT में सभी के लिए तैनात किया गया है। अधिक सटीक, कम शर्मनाक/क्रिंज। — @OpenAI पर X

API उपलब्धता : आइडेंटिफायर gpt-5.3-chat-latest. GPT-5.2 Instant “पुराने मॉडल” में 3 महीनों के लिए उपलब्ध रहेगा, फिर 3 जून 2026 को हटाया जाएगा। Thinking और Pro अपडेट्स “जल्द आ रहे हैं” के रूप में घोषित किए गए हैं।

ज्ञात सीमा : जापानी और कोरियाई में टोन कभी-कभी कठोर रहता है — सुधार चल रहा है।

🔗 GPT-5.3 Instant घोषणा 🔗 GPT-5.3 Instant System Card

Gemini 3.1 Flash-Lite — प्रीव्यू, 2.5× तेज़, $0.25/1M tokens

3 मार्च 2026 — Google ने Gemini 3.1 Flash-Lite का प्रीव्यू API के माध्यम से Google AI Studio और Vertex AI में लॉन्च किया। यह Gemini 3 की श्रृंखला का सबसे किफायती मॉडल है, जिसे उच्च-वॉल्यूम डेवलपर वर्कलोड के लिए डिज़ाइन किया गया है।

कीमत और प्रदर्शन

पहलू	मान
इनपुट की कीमत	$0.25 / 1M tokens
आउटपुट की कीमत	$1.50 / 1M tokens
गति (TTFAT)	2.5× तेज़ बनाम Gemini 2.5 Flash
आउटपुट गति	+45% बनाम Gemini 2.5 Flash (Artificial Analysis)
Elo स्कोर (Arena.ai)	1432
GPQA Diamond	86.9%
MMMU Pro	76.8%

ये benchmarks Flash-Lite को कई पिछले जनरेशन के बड़े Gemini मॉडलों से ऊपर रखते हैं — जो 3.1 सीरीज़ की एफिशिएंसी अप्रोच को मान्य करता है।

अनुकूली Thinking स्तर

एक महत्वपूर्ण विशेषता: thinking levels (अनुकूली विचार स्तर) नॅटिव रूप से AI Studio और Vertex AI में जुड़े हुए हैं। डेवलपर टास्क की जटिलता के अनुसार डायनामिक रूप से रीज़निंग की गहराई समायोजित कर सकते हैं — उपयोगी जब एक ही पाइपलाइन में सस्ते सरल टास्क और जटिल विश्लेषण मिलाना हो, बिना मॉडल बदले।

दस्तावेजीकृत उपयोग मामले

वृहद पैमाने पर बहुभाषी अनुवाद, कंटेंट मॉडरेशन, ई-कॉमर्स इंटरफ़ेस जेनेरेशन, डायनामिक डैशबोर्ड, मल्टी-स्टेप SaaS एजेंट। Latitude, Cartwheel और Whering जैसी कंपनियाँ पहले से ही early access में हैं।

🔗 Gemini 3.1 Flash-Lite घोषणा 🔗 ट्वीट @GoogleAI

GPT-5.4 टीज़र — “5.4 sooner than you Think.”

3 मार्च 2026 — GPT-5.3 Instant की घोषणा के एक घंटे बाद OpenAI ने एक संक्षिप्त ट्वीट पोस्ट किया: “5.4 sooner than you Think.” 800k व्यूज़, 13k लाइक्स।

समुदाय ने “Think” के असामान्य कैपिटलाइज़ेशन पर ध्यान दिया — संभवतः GPT-5.4 में एक उन्नत सोच/रीज़निंग मोड का संकेत। इस स्तर पर कोई अतिरिक्त विवरण उपलब्ध नहीं है।

🔗 GPT-5.4 टीज़र — @OpenAI

Claude की स्केलेबिलिटी — अभूतपूर्व ट्रैफ़िक, #1 App Store

3 मार्च 2026 — दिन के अंत में, Thariq (@trq212) ने स्केलिंग चुनौतियों के बारे में एक आभार संदेश पोस्ट किया :

“We’ve seen unprecedented growth in Claude and Claude Code traffic this week that was genuinely hard to forecast. We appreciate you bearing with us as we scale.”

🇮🇳 हमने इस सप्ताह Claude और Claude Code के ट्रैफ़िक में अभूतपूर्व वृद्धि देखी, जिसे अनुमान लगाना वास्तव में मुश्किल था। जब तक हम अपने इंफ्रास्ट्रक्चर को समायोजित कर रहे हैं, तब तक आपकी सहनशीलता के लिए धन्यवाद। — @trq212 पर X

प्रसंग : Claude 1 मार्च को App Store में #1 पर पहुंचा (Mike Krieger, CPO @mikeyk द्वारा पुष्टि), और Voice Mode के लॉन्च ने अतिरिक्त ट्रैफ़िक पिक उत्पन्न किया। npm पैकेज @anthropic-ai/claude-code का साप्ताहिक डाउनलोड 9.5 मिलियन रिपोर्ट किया गया है।

🔗 ट्वीट @trq212 — स्केलेबिलिटी 🔗 ट्वीट @mikeyk — Claude #1 App Store

BFL FLUX.2 [pro] — 2× तेज़, वही कीमत, वही गुणवत्ता

3 मार्च 2026 — Black Forest Labs ने FLUX.2 [pro] का एक बड़ा अपडेट घोषित किया: मॉडल अब 2× तेज़ है बिना किसी गुणवत्ता हानि और बिना कीमत बढ़ाए।

FLUX.2 [pro] तीन मोड कवर करता है: text-to-image, इमेज एडिटिंग, और multi-reference। BFL के ट्वीट में यह पोज़िशनिंग दी गई कि यह “उच्च गुणवत्ता + उचित गति + व्यापक क्षमताओं का sweet spot” है — विशेषकर फोटोरियलिज्म (प्रोडक्ट फोटो, ग्राफिक डिज़ाइन) और पात्रों की निरंतरता के लिए।

🔗 ट्वीट @bfl_ml — FLUX.2 [pro] अपडेट 🔗 FLUX.2 डॉक्यूमेंटेशन

ElevenLabs MWC में — नेटवर्क-आधारित वॉइस असिस्टेंट और Deloitte के साथ साझेदारी

2 मार्च 2026 — ElevenLabs ने Mobile World Congress Barcelona से दो साझेदारियों की घोषणा की।

ElevenLabs × Deutsche Telekom — Magenta AI Call Assistant

Deutsche Telekom ने Magenta AI Call Assistant प्रस्तुत किया — जिसे नेटवर्क-इंटीग्रेटेड पहला AI वॉइस असिस्टेंट बताया जा रहा है। ElevenLabs की ElevenAgents प्लेटफ़ॉर्म द्वारा संचालित, यह किसी एप्लिकेशन इंस्टॉल किए बिना किसी भी कॉल करने वाले डिवाइस (स्मार्टफोन और फिक्स्ड लाइन फोन) पर काम करता है।

घोषित विशेषताएँ: 50 भाषाओं में अनुवाद, कॉल का स्मार्ट सार, वर्कफ़्लोज़ में स्वायत्त क्रियाएं।

ElevenLabs × Deloitte — एंटरप्राइज़ ओमनीचैनल एजेंट्स

ElevenLabs और Deloitte ने अपना पहला पार्टनरशिप घोषित किया। उद्देश्य: ElevenLabs Agents प्लेटफ़ॉर्म को Deloitte की कंसल्टिंग विशेषज्ञता के साथ जोड़कर कंपनियों को एंटरप्राइज़ सिस्टम्स में इंटीग्रेटेड वॉइस ओमनीचैनल एजेंट्स (कस्टमर एक्सपीरियंस, सेल्स, आंतरिक ऑपरेशंस) तैनात करने में मदद करना। यह ElevenLabs का पहला Big Four के साथ साझेदारी है।

🔗 ट्वीट @elevenlabsio — Deutsche Telekom MWC 🔗 ElevenLabs × Deloitte ब्लॉग

इसका क्या अर्थ है

Claude Code में Voice Mode डेवलपरों के लिए दिन का सबसे संरचनात्मक निर्णय है। ट्रांस्क्रिप्शन मुफ्त करना (क्वोटा से बाहर) इस तरह की सुविधा की मुख्य आर्थिक बाधा को हटा देता है — यह अपनाने को अधिकतम करने के लिए एक जानबूझकर निर्णय है, कोई मामूली बात नहीं। टर्मिनल में स्पेस बार को push-to-talk के रूप में उपयोग करना उपकरण के साथ एक सुसंगत न्यूनतम इंटरफेस है।

मॉडल के मोर्चे पर, GPT-5.3 Instant और Gemini 3.1 Flash-Lite दो अलग रणनीतियों का प्रतिनिधित्व करते हैं: OpenAI बड़े पैमाने पर सार्वजनिक उपयोगकर्ता के दैनिक अनुभव में सुधार कर रहा है (कम हैलुसिनेशन, कम बेकार इनकार), जबकि Google डेवलपर्स के उच्च-वॉल्यूम API उपयोग के लिए लागत/प्रदर्शन अनुपात को अनुकूलित कर रहा है (2.5× तेज़, आक्रामक मूल्य)। GPT-5.3 के लॉन्च के एक घंटे बाद प्रकाशित GPT-5.4 का टीज़र OpenAI में मार्च 2026 के दौरान तेज़ डिलीवरी गति का संकेत देता है।

Anthropic में ट्रैफ़िक की ‘abhootpoorv’ (unprecedented) वृद्धि का ज़िक्र, #1 App Store के साथ मिलकर, पुष्टि करता है कि Claude Code और Claude ऐप अब निचे के चरण से बाहर निकलकर बहुत बड़े दर्शकों तक पहुँच रहे हैं। स्केलेबिलिटी की समस्याएँ इस बात का संकेत हैं कि अपनाना अनुमान से अधिक तेज़ रहा — यह तकनीकी विफलता नहीं बल्कि तेज़ वृद्धि का परिणाम है।

स्रोत - ट्वीट @trq212 — Voice Mode रोलआउट जारी

इस दस्तावेज़ का fr संस्करण से hi भाषा में gpt-5-mini मॉडल का उपयोग करके अनुवाद किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए देखें https://gitlab.com/jls42/ai-powered-markdown-translator

Claude Code में Voice Mode, GPT-5.3 Instant सबके लिए, Gemini 3.1 Flash-Lite प्रीव्यू

Claude Code में Voice Mode — push-to-talk, ~5% रोलआउट

GPT-5.3 Instant सभी के लिए — हैलुसिनेशन में -26.8%

Gemini 3.1 Flash-Lite — प्रीव्यू, 2.5× तेज़, $0.25/1M tokens

कीमत और प्रदर्शन

अनुकूली Thinking स्तर

दस्तावेजीकृत उपयोग मामले

GPT-5.4 टीज़र — “5.4 sooner than you Think.”

Claude की स्केलेबिलिटी — अभूतपूर्व ट्रैफ़िक, #1 App Store

BFL FLUX.2 [pro] — 2× तेज़, वही कीमत, वही गुणवत्ता

ElevenLabs MWC में — नेटवर्क-आधारित वॉइस असिस्टेंट और Deloitte के साथ साझेदारी

ElevenLabs × Deutsche Telekom — Magenta AI Call Assistant

ElevenLabs × Deloitte — एंटरप्राइज़ ओमनीचैनल एजेंट्स

ताज़ा खबरें

Claude Code v2.1.64 (pre-release “next”)

Qwen 3.5 GPTQ-Int4 — quantization, vLLM और SGLang

Qwen 3.5 Small LM Studio, Ollama और MLX पर

Z.ai Startup Program — API क्रेडिट और GLM-5 के early access

March Pixel Drop — Gemini ऐप्स में, Circle to Search मल्टी-ऑब्जेक्ट, फ्रांस में Scam Detection

GPT-5.3 Instant System Card

इसका क्या अर्थ है

स्रोत - ट्वीट @trq212 — Voice Mode रोलआउट जारी

विषय सूची