بحث

Babel Fish AI: إضافة للتفريغ الصوتي والترجمة الصوتية

Babel Fish AI: إضافة للتفريغ الصوتي والترجمة الصوتية

Babel Fish AI هي إضافة متصفح مفتوحة المصدر طورتها دون أن أكتب سطر كود واحد بنفسي. بفضل Roo Code، وهو وكيل ذكاء اصطناعي مستقل، أنشأت حلاً قوياً للتفريغ الصوتي والترجمة الصوتية، مع استكشاف تقنيات مثل Heygen وFFmpeg وDALL-E لإثراء المشروع. ليست مجرد أداة تقنية: إنها مغامرة في التعلّم، ومتابعة للتقنيات، وجهد لتقديم تجربة مستخدم عالية الجودة لجمهور دولي.

الميزات

  • التفريغ الصوتي: التقاط صوت عالي الجودة، وتفريغ دقيق عبر Voxtral (Mistral AI) أو Whisper (OpenAI)
  • الترجمة في الوقت الحقيقي: ترجمة اختيارية للتفريغات إلى 15 لغة
  • قائمة سياقية: إعادة صياغة، ترجمة أو تصحيح تهجئة أي نص محدد
  • متعدد المزودين: Mistral AI، OpenAI، أو نقطة نهاية مخصصة (LiteLLM)
  • متعدد المتصفحات: يدعم Chrome و Firefox

التطوير بالاعتماد على الذكاء الاصطناعي: نهج مبتكر

يعتمد Babel Fish AI بالكامل على Roo Code، الذي ولّد كل سطر من الكود — من ملف مانيفست Chrome إلى السكربتات والواجهة. بدون مهارات في CSS أو HTML أو JS، قمت بتوجيه الذكاء الاصطناعي عبر مُدخلات دقيقة. عندما اصطدمت بعقبات، غصت في التوثيق لمساعدته على التقدم، مما يثبت أنه بالمنهجية يمكن تجاوز الحواجز التقنية. جربت عدة نماذج ذكاء اصطناعي عبر Roo Code: في البداية استكشفت قدراتها، ثم اخترت Gemini (بخاصة Gemini 2.0 Pro Experimental) لتوفيره وملائمته من حيث التكلفة والجودة. كما استخدمت Claude Sonnet، الذي تبين أنه محسن أفضل لبعض المهام في Roo Code. اختيار النموذج المناسب في الوقت المناسب كان مفتاحاً لهذا المشروع.

التطور: من Roo Code إلى وكلاء التكويد

منذ أواخر 2025، أقوم بصيانة Babel Fish AI بواسطة وكلاء التكويد مثل Claude Code و Gemini CLI. أتاحت لي هذه الاستمرارية إضافة العديد من الميزات: دعم Firefox، دمج Mistral AI كمزود للتفريغ (عبر Voxtral)، القائمة السياقية لإعادة الصياغة وتصحيح النصوص، والعديد من التحسينات الأخرى.

دعم متعدّد المتصفحات

الإضافة متاحة على Chrome و Firefox:

فيديوهات متعددة اللغات: جهد وسائط متعددة طموح

لعرض Babel Fish AI، أنشأت فيديوهات توضيحية بعدة لغات باستخدام Heygen. كانت العملية مكثفة: سجلت مشاهد عبر OBS Studio، استخرجت الصوت باستخدام FFmpeg، ثم جمعت المواد في Heygen. لإضافة لمسة شخصية، أنشأت صورة رمزية فريدة عبر DALL-E، ما أعطى الحياة لتلك الفيديوهات. هذا العمل، رغم أنه استغرق وقتاً طويلاً، سمح بجعل الإضافة متاحة للجمهور العالمي، واستمتعت بخوض هذا التحدي الإعلامي الجديد بالنسبة لي.

الترجمة وإتاحة الوصول دولياً

بمساعدة Roo Code، ترجمت واجهة الإضافة إلى العديد من اللغات عبر مُدخلات مُصممة جيداً. ما كان سيستغرق ساعات يدوياً اكتمل بسرعة بفضل الذكاء الاصطناعي، معززاً إمكانية الوصول لـ Babel Fish AI. كانت أيضاً فرصة للغوص في تعريب البرمجيات، مجال لم أستكشفه من قبل.

الجودة والاحترافية

الصرامة كانت في صلب هذا المشروع:

  • الاختبارات والأدوات: استخدمت أدوات فحص الكود مثل SonarCloud و CodeFactor و Codacy و DeepSource للتحقق من جودة الكود المولد بواسطة الذكاء الاصطناعي، بالإضافة إلى اختبارات يدوية معمقة.
  • سياسة الخصوصية: كتبت سياسة خصوصية مفصلة، كدليل على الشفافية والجدية تجاه المستخدمين.
  • إدارة المشروع: كل شيء مُدار عبر Git مع طلبات سحب واضحة، مما يضمن تتبُّعاً منظماً ومرتباً.

تُظهر هذه الجهود أنه حتى دون كتابة الكود مباشرةً، يمكن تسليم منتج موثوق ومحترف.

البرمجيات الحرة والمشاركة

Babel Fish AI مُوزع تحت رخصة GNU Affero General Public License v3.0. يعكس هذا الاختيار قناعتي بأن المعرفة التقنية يجب أن تُنشر وتُشارك. الشيفرة المصدرية مفتوحة للمساهمة، وملف README مترجم إلى 14 لغة لاستقبال مجتمع دولي.

يوجد موقع عرض يعرض المشروع وميزاته.

متابعة التكنولوجيا والتعلّم

فتح لي هذا المشروع أبواباً لأدوات ومهارات لم ألمسها من قبل:

  • وكلاء التكويد بالذكاء الاصطناعي (Roo Code، ثم Claude Code و Gemini CLI)
  • إنشاء الفيديو باستخدام Heygen، OBS Studio و FFmpeg
  • توليد الصور الرمزية باستخدام DALL-E
  • كتابة مستندات قانونية مثل سياسة الخصوصية
  • استخدام أدوات تحليل الكود لضمان الجودة

كانت جلسة حقيقية من متابعة التكنولوجيا، وتعلمت الكثير من خلال الغوص في هذه المجالات الجديدة.

قابلية الاستخدام وتجربة المستخدم

حتى بدون خبرة في التصميم، طورت رؤية واضحة لقابلية الاستخدام (UX/UI). قدت Roo Code لإنشاء واجهة بديهية، مع خيارات مثل قائمة سياقية مدمجة ونتائج تفريغ واضحة. هذا التركيز على تجربة المستخدم يعكس اهتمامي بالتفاصيل ورغبتي في تلبية الاحتياجات الحقيقية للناس.

جرّب Babel Fish AI!

ما الذي يعبر عنه هذا المشروع عني

Babel Fish AI ليس مجرد إضافة: هو واجهة لقدرتي على الابتكار والتعلم وتسليم منتج مكتمل. نجحت في استغلال الذكاء الاصطناعي كأداة تعاون، إدارة مشروع معقد، واستكشاف آفاق تقنية جديدة، مع الحفاظ على معايير عالية. هذا المسار يعكس فضولي، صرامتي، ورغبتي في إنشاء أدوات مفيدة ومشاركتها مع المجتمع.

تمت ترجمة هذا المستند من النسخة fr إلى اللغة ar باستخدام النموذج gpt-5-mini. لمزيد من المعلومات حول عملية الترجمة، راجع https://gitlab.com/jls42/ai-powered-markdown-translator