मैंने अपने AI-संचालित Markdown अनुवाद स्क्रिप्ट (Mistral AI और Open AI) का उपयोग करते हुए GitLab पर मेरे प्रोजेक्ट GitLab पर Stable Diffusion के README का अनुवाद करने का प्रयास किया, तो मुझे एक बड़ी समस्या का सामना करना पड़ा। कुछ हिस्से अनुवादित नहीं हुए और कुछ कोड ब्लॉक्स गलत तरीके से अनुवादित हो गए। यह लेख इस गंभीर समस्या को हल करने के लिए किए गए सुधार को प्रस्तुत करता है।
सामने आई समस्या
Stable Diffusion के README का अनुवाद करते समय, स्क्रिप्ट कुछ स्थानों पर सामान्य टेक्स्ट और कोड ब्लॉक्स के बीच सही अंतर नहीं कर पाई। इसके परिणामस्वरूप उन सामग्रियों का अनुचित अनुवाद हुआ जिन्हें अपरिवर्तित रखा जाना चाहिए था, जिससे कोड ब्लॉक्स के अधिक सूक्ष्म प्रबंधन की आवश्यकता स्पष्ट हुई।
समाधान की रणनीति
इस समस्या को हल करने के लिए, मैंने स्क्रिप्ट को सुधारकर कोड ब्लॉक्स की सही पहचान और उनके सटीक निष्कर्षण योग्य बनाया ताकि उन्हें AI द्वारा अनुवाद से पहले अलग किया जा सके और अनुवाद के बाद सही ढंग से पुनर्स्थापित किया जा सके। इस दृष्टिकोण से किसी भी अनचाहे बदलाव को रोका जा सकता है।
सुधार का तंत्र
- सटीक पहचान और निष्कर्षण : एक बेहतर रेगुलर एक्सप्रेशन के जरिए, अब कोड ब्लॉक्स को स्पष्ट रूप से पहचानकर अनुवाद से पहले निकाल लिया जाता है, जिससे उनका बदलना रोका जाता है।
- उपयुक्त पुनर्स्थापन : अनुवाद के बाद कोड ब्लॉक्स को उनके मूल स्थान पर पुन: डाल दिया जाता है, जिससे अंतिम सामग्री की सच्चाई बनी रहती है।
सुधार के फायदे
- कोड ब्लॉक्स की रक्षा : कोड अपरिवर्तित रहते हैं, जिससे उनकी तकनीकी सटीकता बनी रहती है। अब अनुवाद कोड ब्लॉक्स को प्रभावित नहीं करता, जिससे तकनीकी सामग्री की अखंडता सुनिश्चित होती है।
- विश्वसनीयता में वृद्धि : स्क्रिप्ट अब जटिल Markdown दस्तावेज़ों में मौजूद महत्वपूर्ण कोड ब्लॉक्स को विश्वसनीय तरीके से संभालती है। अनुवाद पूरी तरह से स्वचालित है और मैन्युअल छेड़छाड़ की आवश्यकता नहीं रहती, जिससे प्रक्रिया अधिक कुशल और तेज हो गई है।
- बेहतर भेदभाव : कोड ब्लॉक्स का बेहतर पता लगाने से अनुवाद योग्य टेक्स्ट और संरक्षित करने योग्य कोड ब्लॉक्स के बीच बेहतर भेदभाव होता है। इससे अनुवाद त्रुटियाँ घटती हैं और परिणाम अधिक सटीक व सुसंगत होते हैं।
अनुवाद के परिणाम
सुधारों को व्यवहार में देखने के लिए, आप मूल फ्रेंच README के अनूदित संस्करणों को देख सकते हैं — प्रोजेक्ट GitLab पर Stable Diffusion के README के अनुवादित वर्ज़न:
- README अंग्रेज़ी में (gpt-4-1106-preview के साथ अनुवादित, बिना किसी संशोधन के)
- README स्पेनिश में (gpt-4-1106-preview के साथ अनुवादित, बिना किसी संशोधन के)
- README चीनी में (gpt-4-1106-preview के साथ अनुवादित, बिना किसी संशोधन के)
ये अनुवाद दिखाते हैं कि सुधरे हुए स्क्रिप्ट में कोड ब्लॉक्स को प्रभावी ढंग से संभालने और विभिन्न भाषाओं में सटीक तथा सुसंगत अनुवाद प्रदान करने की क्षमता है, वह भी बिना किसी मैन्युअल छेड़छाड़ के।
सुधरे हुए स्क्रिप्ट तक पहुँच
आप सुधरे हुए स्क्रिप्ट को प्रोजेक्ट AI-संचालित Markdown अनुवादक पर पा सकते हैं, जिसे आप अपनी जरूरत के अनुसार उपयोग या अनुकूलित कर सकते हैं।
नई विशेषताएँ और सुधार
कोड ब्लॉक्स की पहचान और प्रबंधन में हुए सुधार के अलावा, AI-संचालित Markdown अनुवाद स्क्रिप्ट को कई अन्य अपडेट और सुधार भी मिले हैं। यहाँ नई सुविधाओं का सारांश है:
आउटपुट फ़ाइलों का बेहतर प्रबंधन
स्क्रिप्ट अब अनुवाद शुरू करने से पहले आउटपुट फ़ाइलों के अस्तित्व पर विचार करती है। यदि आउटपुट फ़ाइल पहले से मौजूद है और विकल्प --force सक्रिय नहीं है, तो स्क्रिप्ट संदेश दिखाएगा कि अनुवाद नहीं किया जा रहा है और अगले फ़ाइल पर चलेगा। इससे अनावश्यक पुनरावृत्तियों से बचा जा सकता है और समय की बचत होती है।
मौजूद फ़ाइलों का बेहतर पता लगाना
मौजूद फ़ाइलों का पता लगाने की क्षमता glob लाइब्रेरी का उपयोग करके सुधारी गई है। अब स्क्रिप्ट यह जाँचती है कि क्या कोई अनुवाद पहले से मौजूद है, मॉडल चाहे जो भी हो, इसके लिए मूल फ़ाइल के बेस नाम और लक्षित भाषा के अनुरूप फ़ाइलों की खोज की जाती है।
आउटपुट फ़ाइल नाम में मॉडल और भाषा का स्वैप
आउटपुट फ़ाइल के नाम के फॉर्मेट को लक्ष्य भाषा और उपयोग किए गए मॉडल को बेहतर ढंग से दर्शाने के लिए संशोधित किया गया है। अब आउटपुट फ़ाइल का नाम फॉर्मेट {base}-{langue_cible}-{modèle}.md होगा, पहले के {base}-{modèle}-{langue_cible}.md की बजाय।
विकल्प --force का जोड़
स्क्रिप्ट में नया विकल्प --force जोड़ा गया है। जब इसे सक्षम किया जाता है, तो स्क्रिप्ट उस इनपुट फ़ाइल के लिए पहले से मौजूद अनुवाद होने पर भी अनुवाद को मजबूर करेगा। यह तब उपयोगी हो सकता है जब आप किसी नई मॉडल के साथ अनुवाद अपडेट करना चाहते हैं या अनुवाद सेटिंग्स में परिवर्तन कर रहे हों।
ये सुधार और नई विशेषताएँ AI-संचालित Markdown अनुवाद स्क्रिप्ट को और भी अधिक शक्तिशाली और लचीला बनाती हैं, जिससे आपके Markdown दस्तावेज़ों का प्रबंधन और अनुवाद आसान हो जाता है।
निष्कर्ष
यह अपडेट Markdown अनुवाद टूल के लिए एक महत्वपूर्ण प्रगति है, जो तकनीकी दस्तावेज़ों को संभालने की इसकी क्षमता का विस्तार करता है। इस उपकरण को और बेहतर बनाते रहना का उद्देश्य ओपन-सोर्स प्रोजेक्ट्स को वैश्विक दर्शकों के लिए सुलभ बनाना है।
AI जनरेटिव और ऑटोमेशन की रोमांचक दुनिया में और अपडेट्स और नवाचारों के लिए जुड़े रहें!
यह दस्तावेज़ fr संस्करण से hi भाषा में gpt-5-mini मॉडल का उपयोग करके अनुवादित किया गया है। अधिक जानकारी के लिए अनुवाद प्रक्रिया देखें https://gitlab.com/jls42/ai-powered-markdown-translator