Rechercher

Babel Fish AI : Extension de Transcription et Traduction Vocale

Babel Fish AI est une extension navigateur open source que j’ai développée sans écrire une seule ligne de code moi-même. Grâce à Roo Code, un agent IA autonome, j’ai créé une solution de transcription et traduction vocale performante, tout en explorant des technologies comme Heygen, FFmpeg, et DALL-E pour enrichir le projet. Ce n’est pas qu’un outil technique : c’est une aventure d’apprentissage, de veille technologique, et un effort pour offrir une expérience utilisateur de qualité à une audience internationale.

Fonctionnalités

  • Transcription vocale : Capture audio haute qualité, transcription précise via Voxtral (Mistral AI) ou Whisper (OpenAI)
  • Traduction temps réel : Traduction optionnelle des transcriptions en 15 langues
  • Menu contextuel : Reformuler, traduire ou corriger l’orthographe de n’importe quel texte sélectionné
  • Multi-provider : Mistral AI, OpenAI, ou endpoint personnalisé (LiteLLM)
  • Multi-navigateur : Chrome et Firefox supportés

Développer avec l’IA : Une Approche Innovante

Babel Fish AI repose entièrement sur Roo Code, qui a généré chaque ligne de code – du manifeste Chrome aux scripts et à l’interface. Sans compétences en CSS, HTML ou JS, j’ai guidé l’IA avec des prompts précis. Quand elle butait sur des obstacles, j’ai plongé dans la documentation pour l’aider à avancer, prouvant qu’avec de la méthode, on peut surmonter des barrières techniques. J’ai testé plusieurs modèles d’IA via Roo Code : au départ, j’ai exploré leurs capacités, puis j’ai opté pour Gemini (notamment Gemini 2.0 Pro Experimental) pour son coût gratuit et son bon rapport qualité-prix. J’ai aussi utilisé Claude Sonnet, qui s’est révélé mieux optimisé pour certaines tâches dans Roo Code. Choisir le bon modèle au bon moment a été clé pour ce projet.

Évolution : De Roo Code aux Agents de Codage

Depuis fin 2025, je maintiens Babel Fish AI avec des agents de codage comme Claude Code et Gemini CLI. Cette continuité dans l’approche m’a permis d’ajouter de nombreuses fonctionnalités : le support Firefox, l’intégration de Mistral AI comme provider de transcription (via Voxtral), le menu contextuel pour reformuler et corriger du texte, et bien d’autres améliorations.

Support Multi-Navigateur

L’extension est disponible sur Chrome et Firefox :

Vidéos Multilingues : Un Effort Multimédia Ambitieux

Pour présenter Babel Fish AI, j’ai créé des vidéos de démonstration en plusieurs langues avec Heygen. Le processus était intense : j’ai capturé des séquences via OBS Studio, extrait l’audio avec FFmpeg, puis assemblé le tout dans Heygen. Pour ajouter une touche personnelle, j’ai généré un avatar unique avec DALL-E, qui donne vie à ces vidéos. Ce travail, bien que chronophage, a permis de rendre l’extension accessible à un public mondial, et j’ai adoré relever ce défi multimédia inédit pour moi.

Traduction et Accessibilité Internationale

Grâce à Roo Code, j’ai traduit l’interface de l’extension dans de nombreuses langues via des prompts bien conçus. Ce qui aurait pris des heures manuellement a été bouclé rapidement avec l’IA, renforçant l’accessibilité de Babel Fish AI. C’était aussi une occasion de toucher à la localisation logicielle, un domaine que je n’avais jamais exploré auparavant.

Qualité et Professionnalisme

La rigueur a été au cœur de ce projet :

  • Tests et Outils : J’ai utilisé des scanners de code comme SonarCloud, CodeFactor, Codacy et DeepSource pour vérifier la qualité du code généré par l’IA, en plus de tests manuels approfondis.
  • Politique de Confidentialité : J’ai rédigé une politique de confidentialité détaillée, un gage de transparence et de sérieux pour les utilisateurs.
  • Gestion de Projet : Tout est versionné sur Git avec des pull requests clairs, assurant un suivi propre et organisé.

Ces efforts montrent que même sans coder directement, on peut livrer un produit fiable et professionnel.

Open Source et Partage

Babel Fish AI est distribué sous licence GNU Affero General Public License v3.0. Ce choix reflète ma conviction que le savoir technique doit être partagé. Le code source est ouvert aux contributions, et le README est traduit en 14 langues pour accueillir une communauté internationale.

Un site vitrine présente le projet et ses fonctionnalités.

Veille Technologique et Apprentissage

Ce projet m’a ouvert des portes sur des outils et des compétences que je n’avais jamais touchés :

  • Les agents de codage IA (Roo Code, puis Claude Code et Gemini CLI)
  • La création vidéo avec Heygen, OBS Studio et FFmpeg
  • La génération d’avatars avec DALL-E
  • La rédaction de documents légaux comme la politique de confidentialité
  • L’utilisation d’outils d’analyse de code pour garantir la qualité

C’était une vraie session de veille technologique, et j’ai appris énormément en me plongeant dans ces nouveaux domaines.

Ergonomie et Expérience Utilisateur

Même sans expertise en design, j’ai développé une vision claire de l’ergonomie (UX/UI). J’ai guidé Roo Code pour créer une interface intuitive, avec des choix comme un menu contextuel bien intégré ou des résultats de transcription clairs. Ce focus sur l’expérience utilisateur montre mon attention aux détails et ma volonté de répondre aux besoins réels des gens.

Essayez Babel Fish AI !

Ce Que Ce Projet Dit de Moi

Babel Fish AI, c’est plus qu’une extension : c’est une vitrine de ma capacité à innover, apprendre, et livrer un produit fini. J’ai su exploiter l’IA comme outil de collaboration, gérer un projet complexe, et explorer de nouveaux horizons technologiques, tout en maintenant des standards élevés. Ce parcours reflète ma curiosité, ma rigueur, et mon envie de créer des outils utiles et de les partager avec la communauté.