Con Babel Fish AI, ya presenté una extensión de Chrome capaz de transformar la voz en texto mediante la API Whisper de OpenAI, ofreciendo también una traducción en tiempo real. Hoy vuelvo con un conjunto de nuevas funcionalidades y numerosas mejoras: desde el menú contextual hasta el auto-copy del texto transcrito, pasando por la reformulación automática (ahora activable desde un botón en la barra), este artículo repasa las evoluciones desde la primera versión.
1. Presentación: ¿Qué cambia?
Babel Fish AI continúa su misión: permitirte transcribir, traducir y reformular tus textos en un navegador, con total simplicidad. Aquí algunas de las novedades principales desde el último artículo:
-
Menú contextual potente:
Haz clic derecho sobre un texto seleccionado para reformularlo (rephrase) o traducirlo al idioma que elijas. El texto original se reemplaza directamente por la nueva versión. -
Control inmediato desde la barra:
Ya no es necesario ir a las opciones para activar/desactivar la reformulación o la traducción. Los botones de la barra (en la parte superior de la pantalla durante la transcripción) permiten ajustar tus preferencias en directo, según lo que quieras hacer con tu transcripción o tu texto. -
Función de auto-copy inteligente:
Activa la opción Copia automática al portapapeles para copiar automáticamente el texto cuando el cuadro de diálogo está visible y ningún campo de entrada tiene el foco. -
Mejoras de la interfaz:
- Botón de copia mejor integrado.
- Posibilidad de mantener el cuadro de diálogo abierto o de definir un tiempo antes de que se cierre automáticamente.
- Animaciones y estilo más modernos (esquinas redondeadas, sombras, etc.).
-
Optimizaciones diversas:
- Verificación de la conexión (
navigator.onLine) antes de cada llamada para evitar errores sin conexión. - Mejor gestión de errores y mensajes más explícitos (clave API faltante, red inactiva, etc.).
- Código más modular (archivos dedicados para los idiomas, la banner, la UI, etc.).
- Verificación de la conexión (
2. Los Videos: 15 Idiomas, 15 Demostraciones
Aquí la lista de videos, cada video presenta la transcripción vocal, la traducción en tiempo real y la reformulación.
- Francés (FR) : https://youtu.be/7iLJ_MPQ33k
- Inglés (EN) : https://youtu.be/ie7vR_9IJCw
- Japonés (JA) : https://youtu.be/bjoGWvSyQPo
- Coreano (KO) : https://youtu.be/e4E5K4il6t8
- Chino (ZH) : https://youtu.be/mdxffjYetJs
- Español (ES) : https://youtu.be/pXvQBsjKHLk
- Alemán (DE) : https://youtu.be/FdjPCvDEYXc
- Polaco (PL) : https://youtu.be/ckkgQ1wtYok
- Italiano (IT) : https://youtu.be/1XTbqCksu2s
- Portugués (PT) : https://youtu.be/s6BcKsTdUdg
- Neerlandés (NL) : https://youtu.be/8jMHRjzNM2k
- Hindi (HI) : https://youtu.be/VFuh-qrAFKU
- Árabe (AR) : https://youtu.be/pMbzVmCudDQ
- Rumano (RO) : https://youtu.be/FmQgv3Ezu0s
- Sueco (SV) : https://youtu.be/1hHPh6cYOkY
¡Descubre cómo Babel Fish AI facilita la comunicación en tu idioma preferido!
3. Resumen de las Últimas Versiones
Aquí un breve resumen de los cambios destacados desde la versión 1.1.0:
3.1. Menú contextual (v1.1.12)
- Clic derecho sobre texto seleccionado:
- Reformular selección para reformular al instante.
- Traducir selección para traducir el texto seleccionado a cualquier idioma soportado.
- Cuadro de diálogo mejorado:
- Temporizador visual, botón “Mantener abierta”, estilo modernizado, botón de copia integrado.
3.2. Auto-copy y gestión del foco (v1.1.14 → v1.1.15)
- Opción “Copia automática al portapapeles”:
- Copia el texto solo si el cuadro de diálogo se muestra y ningún campo tiene el foco.
- Detección mejorada:
- Evita sobrecargar el portapapeles cuando el texto ya está insertado en un campo.
- Preservación del foco y del cursor:
- Ya no se pierde la posición en el texto durante las interacciones con la barra o los botones.
3.3. Mejoras UI y UX (v1.1.13)
- Controles movidos a la parte superior del cuadro de diálogo para una mejor accesibilidad.
- Interfaz más compacta (espaciado reducido, márgenes ajustados).
- Mejor gestión del temporizador (contador visual, opción “Mantener abierta”).
3.4. Diversas optimizaciones y correcciones
- Refactorización del código: más modular (archivos separados para los idiomas, la banner, las llamadas API…).
- Conexiones más fiables: verificación del estado offline para evitar llamadas API innecesarias.
- Mensajes de error más claros: instrucciones detalladas para resolver problemas (clave API inválida, etc.).
- Mejoras de seguridad:
window.clearTimeout, inyección más segura, etc.
4. Implementación de Analizadores de Código
Paralelamente al desarrollo asistido por IA a través de Roo Code (utilizo principalmente los modelos gemini-2.0-pro-exp-02-05, gemini-2.0-flash-thinking-exp-01-21 de Google que actualmente son gratuitos y Claude Sonnet 3.7 de Anthropic), he integrado varias herramientas de análisis estático para garantizar la calidad y seguridad del código generado:
- SonarCloud
- CodeFactor
- Codacy
- DeepSource
En cada pull request en GitHub, estos servicios analizan el código y señalan de inmediato vulnerabilidades, deuda técnica o malas prácticas. Los resultados aparecen directamente en la interfaz de GitHub, lo que permite corregir rápidamente antes de cualquier fusión en la rama principal. De este modo, aunque las IA produzcan grandes bloques de código, estos analizadores sirven como salvaguardas para mantener un código limpio y seguro.
5. Arquitectura Técnica Actualizada
Desde mi anterior artículo, la estructura de la extensión ha evolucionado ligeramente. Los puntos clave:
- manifest.json (MV3): gestiona los permisos (activeTab, scripting, contextMenus…) y la inyección dinámica.
- background.js: service worker encargado de reaccionar al clic en el icono, a los atajos, e inyectar
content.js. - content.js: papel central para el audio (MediaRecorder) y la llamada a las APIs (Whisper, GPT) mediante módulos especializados.
- Menú contextual: creado por
background.js, aplicado porcontent.js. - i18n.js y languages-shared.js: centralización de los datos de traducción.
6. ¿Quieres Probar?
- Instalar Babel Fish AI:
- Tienda web de Chrome
- GitHub (proyecto open source)
- Clave API OpenAI:
- Crea tu clave en platform.openai.com/account/api-keys y configúrala en las opciones.
7. Conclusión
Con estas actualizaciones, Babel Fish AI se vuelve aún más polivalente, ergonómico e inteligente. Gracias al menú contextual, a los botones de reformulación/traducción accesibles directamente en la barra, al sistema de auto-copy y a un análisis de código reforzado, la experiencia de usuario mejora notablemente.
No dudes en ver los videos de demostración. ¡Gracias por seguir el proyecto y mucho éxito con tus proyectos de transcripción y traducción!
Este documento ha sido traducido de la versión fr al idioma es utilizando el modelo gpt-5-mini. Para más información sobre el proceso de traducción, consulte https://gitlab.com/jls42/ai-powered-markdown-translator