Pesquisar

Babel Fish AI : Extensão de Transcrição e Tradução de Voz

Babel Fish AI : Extensão de Transcrição e Tradução de Voz

Babel Fish AI é uma extensão de navegador open source que desenvolvi sem escrever uma única linha de código eu mesmo. Graças ao Roo Code, um agente de IA autônomo, criei uma solução de transcrição e tradução de voz eficiente, explorando também tecnologias como Heygen, FFmpeg e DALL-E para enriquecer o projeto. Não é apenas uma ferramenta técnica: é uma aventura de aprendizagem, de monitoramento tecnológico, e um esforço para oferecer uma experiência de usuário de qualidade a um público internacional.

Funcionalidades

  • Transcrição de voz: Captura de áudio de alta qualidade, transcrição precisa via Voxtral (Mistral AI) ou Whisper (OpenAI)
  • Tradução em tempo real: Tradução opcional das transcrições para 15 idiomas
  • Menu de contexto: Reformular, traduzir ou corrigir a ortografia de qualquer texto selecionado
  • Multi-provider: Mistral AI, OpenAI ou endpoint personalizado (LiteLLM)
  • Multi-navegador: Suporta Chrome e Firefox

Desenvolver com IA: Uma Abordagem Inovadora

Babel Fish AI baseia-se inteiramente em Roo Code, que gerou cada linha de código — do manifesto do Chrome aos scripts e à interface. Sem conhecimentos de CSS, HTML ou JS, guiei a IA com prompts precisos. Quando ela encontrava obstáculos, mergulhei na documentação para ajudá-la a avançar, provando que, com método, é possível superar barreiras técnicas. Testei vários modelos de IA via Roo Code: no início, explorei suas capacidades e depois optei pelo Gemini (notadamente Gemini 2.0 Pro Experimental) pelo seu custo gratuito e boa relação custo-benefício. Também utilizei Claude Sonnet, que se mostrou melhor otimizado para certas tarefas no Roo Code. Escolher o modelo certo no momento certo foi determinante para este projeto.

Evolução: Do Roo Code aos Agentes de Codificação

Desde o final de 2025, mantenho o Babel Fish AI com agentes de codificação como Claude Code e Gemini CLI. Essa continuidade na abordagem permitiu adicionar muitas funcionalidades: suporte ao Firefox, integração do Mistral AI como provedor de transcrição (via Voxtral), o menu de contexto para reformular e corrigir texto, entre outras melhorias.

Suporte a múltiplos navegadores

A extensão está disponível para Chrome e Firefox:

Vídeos Multilíngues: Um Esforço Multimídia Ambicioso

Para apresentar o Babel Fish AI, criei vídeos de demonstração em várias línguas com Heygen. O processo foi intenso: capturei sequências com OBS Studio, extraí o áudio com FFmpeg, e em seguida montei tudo no Heygen. Para adicionar um toque pessoal, gerei um avatar único com DALL-E, que dá vida a esses vídeos. Esse trabalho, embora demorado, tornou a extensão acessível a um público global, e adorei enfrentar esse desafio multimídia inédito para mim.

Tradução e Acessibilidade Internacional

Graças ao Roo Code, traduzi a interface da extensão para muitas línguas por meio de prompts bem elaborados. O que teria levado horas manualmente foi concluído rapidamente com a IA, reforçando a acessibilidade do Babel Fish AI. Foi também uma oportunidade de me aprofundar em localização de software, um campo que eu nunca havia explorado antes.

Qualidade e Profissionalismo

A rigorosidade esteve no centro deste projeto:

  • Testes e Ferramentas: Usei scanners de código como SonarCloud, CodeFactor, Codacy e DeepSource para verificar a qualidade do código gerado pela IA, além de testes manuais aprofundados.
  • Política de Privacidade: Redigi uma política de privacidade detalhada, um sinal de transparência e seriedade para os usuários.
  • Gestão de Projeto: Tudo está versionado no Git com pull requests claras, assegurando um acompanhamento limpo e organizado.

Esses esforços mostram que, mesmo sem codificar diretamente, é possível entregar um produto confiável e profissional.

Código Aberto e Compartilhamento

Babel Fish AI é distribuído sob a licença GNU Affero General Public License v3.0. Essa escolha reflete minha convicção de que o conhecimento técnico deve ser partilhado. O código-fonte está aberto a contribuições, e o README está traduzido em 14 línguas para acolher uma comunidade internacional.

Um site de apresentação apresenta o projeto e suas funcionalidades.

Monitoramento Tecnológico e Aprendizado

Este projeto abriu portas para ferramentas e competências que eu nunca tinha usado antes:

  • Agentes de codificação IA (Roo Code, depois Claude Code e Gemini CLI)
  • Criação de vídeo com Heygen, OBS Studio e FFmpeg
  • Geração de avatares com DALL-E
  • Redação de documentos legais como a política de privacidade
  • Uso de ferramentas de análise de código para garantir a qualidade

Foi uma verdadeira sessão de atualização tecnológica, e aprendi muito ao me envolver nesses novos domínios.

Ergonomia e Experiência do Usuário

Mesmo sem expertise em design, desenvolvi uma visão clara de ergonomia (UX/UI). Orientei o Roo Code para criar uma interface intuitiva, com escolhas como um menu de contexto bem integrado e resultados de transcrição claros. Esse foco na experiência do usuário demonstra minha atenção aos detalhes e minha vontade de responder às necessidades reais das pessoas.

Experimente Babel Fish AI!

O Que Este Projeto Diz Sobre Mim

Babel Fish AI é mais do que uma extensão: é uma vitrine da minha capacidade de inovar, aprender e entregar um produto finalizado. Soube explorar a IA como uma ferramenta de colaboração, gerir um projeto complexo e explorar novos horizontes tecnológicos, mantendo padrões elevados. Essa trajetória reflete minha curiosidade, minha rigorosidade e meu desejo de criar ferramentas úteis e compartilhá-las com a comunidade.

Este documento foi traduzido da versão fr para a língua pt usando o modelo gpt-5-mini. Para mais informações sobre o processo de tradução, consulte https://gitlab.com/jls42/ai-powered-markdown-translator