Babel Fish AI एक ओपन सोर्स ब्राउज़र एक्सटेंशन है जिसे मैंने स्वयं एक भी लाइन कोड लिखे बिना विकसित किया। Roo Code, एक स्वायत्त AI एजेंट, की मदद से मैंने उच्च प्रदर्शन वाली वॉयस ट्रांसक्रिप्शन और अनुवाद समाधान बनाया, और प्रोजेक्ट को समृद्ध करने के लिए Heygen, FFmpeg, और DALL-E जैसी तकनीकों का अन्वेषण भी किया। यह सिर्फ एक तकनीकी टूल नहीं है: यह सीखने, टेक्नोलॉजी की निगरानी, और अंतरराष्ट्रीय उपयोगकर्ता अनुभव देने का एक सफर है।
विशेषताएँ
- वॉइस ट्रांसक्रिप्शन : उच्च गुणवत्ता ऑडियो कैप्चर, Voxtral (Mistral AI) या Whisper (OpenAI) के माध्यम से सटीक ट्रांसक्रिप्शन
- रीयल-टाइम अनुवाद : ट्रांसक्रिप्शन्स का वैकल्पिक अनुवाद 15 भाषाओं में
- संदर्भ मेनू : किसी भी चयनित टेक्स्ट को पुनर्लेखन, अनुवाद या वर्तनी सुधारने का विकल्प
- मल्टी-प्रोवाइडर : Mistral AI, OpenAI, या कस्टम endpoint (LiteLLM)
- मल्टी-ब्राउज़र : Chrome और Firefox समर्थित
आईए के साथ विकास : एक नवोन्मेषी दृष्टिकोण
Babel Fish AI पूरी तरह से Roo Code पर आधारित है, जिसने हर कोड लाइन जेनरेट की — Chrome मैनिफेस्ट से लेकर स्क्रिप्ट्स और इंटरफ़ेस तक। CSS, HTML या JS की विशेषज्ञता के बिना, मैंने AI को सटीक प्रॉम्प्ट देकर निर्देशित किया। जब यह किसी बाधा पर अटकी, तो मैंने डॉक्यूमेंटेशन में जाकर मदद की, साबित करते हुए कि विधि के साथ तकनीकी बाधाओं को पार किया जा सकता है। मैंने Roo Code के माध्यम से कई AI मॉडल्स का परीक्षण किया: शुरुआत में उनकी क्षमताओं का अन्वेषण किया गया, फिर लागत और प्रदर्शन के आधार पर मैंने Gemini (विशेषकर Gemini 2.0 Pro Experimental) चुना। मैंने Claude Sonnet का भी उपयोग किया, जो Roo Code में कुछ कामों के लिए बेहतर अनुकूल मिला। सही मॉडल का सही समय पर चयन इस प्रोजेक्ट के लिए निर्णायक रहा।
विकास का क्रम : Roo Code से कोडिंग एजेंट्स तक
2025 के अंत से, मैं Babel Fish AI को Claude Code और Gemini CLI जैसे कोडिंग एजेंट्स के साथ मेंटेन कर रहा हूँ। इस दृष्टिकोण की निरंतरता ने कई फीचर्स जोड़ने की अनुमति दी: Firefox सपोर्ट, Mistral AI को Voxtral के माध्यम से ट्रांसक्रिप्शन प्रोवाइडर के रूप में एकीकृत करना, टेक्स्ट के पुनर्लेखन और सुधार के लिए संदर्भ मेनू, और अन्य कई सुधार।
बहु-ब्राउज़र समर्थन
एक्सटेंशन Chrome और Firefox पर उपलब्ध है :
बहुभाषी वीडियो: एक महत्वाकांक्षी मल्टीमीडिया प्रयास
Babel Fish AI पेश करने के लिए, मैंने Heygen के साथ कई भाषाओं में डेमो वीडियो बनाए। प्रक्रिया तीव्र थी: मैंने OBS Studio से क्लिप कैप्चर की, ऑडियो FFmpeg से एक्सट्रैक्ट किया, और फिर सब कुछ Heygen में असेंबल किया। व्यक्तिगत स्पर्श जोड़ने के लिए, मैंने DALL-E से एक यूनिक अवतार जेनरेट किया, जो इन वीडियोस को जीवन देता है। यह काम समय-साध्य था, पर इसने एक्सटेंशन को वैश्विक दर्शकों के लिए सुलभ बनाया, और मुझे यह नया मल्टीमीडिया चैलेंज बहुत पसंद आया।
अनुवाद और अंतरराष्ट्रीय पहुंच
Roo Code की मदद से, मैंने एक्सटेंशन इंटरफ़ेस को कई भाषाओं में अनुवादित किया, अच्छे प्रॉम्प्ट्स के जरिए। जो काम हाथ से घंटों लेता, वह AI के साथ तेजी से पूरा हुआ, जिससे Babel Fish AI की पहुँच बढ़ी। यह लोकलाइज़ेशन का अनुभव पाने का भी एक मौका था, एक ऐसा क्षेत्र जो मैंने पहले कम ही एक्सप्लोर किया था।
गुणवत्ता और प्रोफेशनलिज़्म
इस प्रोजेक्ट की रीढ़ रहा है कड़ी मेहनत और नियमबद्धता:
- टेस्ट और टूल्स : मैंने AI-जनरेटेड कोड की गुणवत्ता जांचने के लिए SonarCloud, CodeFactor, Codacy और DeepSource जैसे स्कैनर्स का उपयोग किया, साथ ही व्यापक मैनुअल टेस्टिंग भी की।
- गोपनीयता नीति : मैंने उपयोगकर्ताओं के लिए पारदर्शिता और गंभीरता दिखाने हेतु एक विस्तृत गोपनीयता नीति तैयार की।
- प्रोजेक्ट प्रबंधन : सब कुछ Git पर वर्शन किया गया है, स्पष्ट पुल रिक्वेस्ट्स के साथ, जिससे ट्रैकिंग साफ और सुगठित बनी रहती है।
ये प्रयास दिखाते हैं कि बिना सीधे कोड लिखे भी विश्वसनीय और पेशेवर उत्पाद उपलब्ध कराया जा सकता है।
ओपन सोर्स और साझा करना
Babel Fish AI को GNU Affero General Public License v3.0 के तहत वितरित किया गया है। यह चुनाव मेरी इस धारणा को दर्शाता है कि तकनीकी ज्ञान साझा किया जाना चाहिए। सोर्स कोड योगदान के लिए खुला है, और README 14 भाषाओं में अनूदित है ताकि अंतरराष्ट्रीय समुदाय का स्वागत किया जा सके।
एक प्रोजेक्ट साइट प्रोजेक्ट और इसकी विशेषताओं को पेश करती है।
टेक वॉच और सीखना
इस प्रोजेक्ट ने मुझे उन टूल्स और स्किल्स से रूबरू कराया जिन्हें मैंने पहले नहीं छुआ था :
- कोडिंग एजेंट्स AI (Roo Code, फिर Claude Code और Gemini CLI)
- Heygen, OBS Studio और FFmpeg के साथ वीडियो निर्माण
- DALL-E के साथ अवतार जनरेशन
- गोपनीयता नीति जैसे कानूनी दस्तावेज़ लिखना
- कोड गुणवत्ता सुनिश्चित करने के लिए एनालिसिस टूल्स का उपयोग
यह एक वास्तविक टेक वॉच सेशन था, और मैंने इन नए क्षेत्रों में डूबकर बहुत कुछ सीखा।
उपयोगकर्ता अनुभव और एर्गोनॉमी
डिज़ाइन में विशेषज्ञता न होते हुए भी, मैंने UX/UI के बारे में स्पष्ट विजन विकसित किया। मैंने Roo Code को निर्देशित करके एक सहज इंटरफ़ेस बनाया, जैसे कि अच्छा एकीकृत संदर्भ मेनू और स्पष्ट ट्रांसक्रिप्शन रिज़ल्ट। यूएक्स पर यह फ़ोकस मेरे ध्यान और वास्तविक उपयोगकर्ता आवश्यकताओं को पूरा करने की इच्छा को दर्शाता है।
Babel Fish AI आज़माएँ !
- आधिकारिक साइट : babelfishai.jls42.org
- स्रोत कोड : GitHub
- Chrome : Chrome वेब स्टोर
- Firefox : Firefox ऐड-ऑन
यह प्रोजेक्ट मेरे बारे में क्या बताता है
Babel Fish AI सिर्फ एक एक्सटेंशन नहीं है: यह मेरी नवोन्मेषी क्षमता, सीखने की लगन, और एक समाप्त उत्पाद देने की क्षमता का प्रदर्शन है। मैंने AI को सहायक के रूप में उपयोग करना सीखा, जटिल प्रोजेक्ट का प्रबंधन किया, और नए तकनीकी क्षितिजों का अन्वेषण किया, साथ ही उच्च मानकों को बनाए रखा। यह यात्रा मेरी जिज्ञासा, कठोरता, और उपयोगी उपकरण बनाने व समुदाय के साथ साझा करने की चाह को प्रतिबिंबित करती है।
यह दस्तावेज़ fr संस्करण से hi भाषा में gpt-5-mini मॉडल का उपयोग करके अनुवादित किया गया है। अनुवाद प्रक्रिया के बारे में अधिक जानकारी के लिए देखें https://gitlab.com/jls42/ai-powered-markdown-translator