
Con Babel Fish AI, ya he presentado una extensión Chrome capaz de transformar la voz en texto a través de la API Whisper de OpenAI, ofreciendo además una traducción en tiempo real. Hoy, regreso con un conjunto de nuevas funcionalidades y numerosas mejoras: desde el menú contextual hasta el auto-copy del texto transcrito, pasando por la reformulación automática (ahora activable mediante un botón en la barra), este artículo recapitula las evoluciones desde la primera versión.
1. Presentación: ¿Qué cambia?
Babel Fish AI continúa con su misión: permitirte transcribir, traducir y reformular tus textos en un navegador, con total simplicidad. Estas son algunas de las novedades principales desde el último artículo:
-
Menú contextual potente:
Haz clic derecho sobre un texto seleccionado para reformularlo (rephrase) o para traducirlo al idioma de tu elección. El texto original es reemplazado directamente por la nueva versión. -
Control inmediato desde la barra:
¡Ya no es necesario ir a las opciones para activar/desactivar la reformulación o la traducción! Los botones de la barra (en la parte superior de la pantalla durante la transcripción) te permiten ajustar tus preferencias en directo, según lo que desees hacer con tu transcripción o tu texto. -
Función de auto-copy inteligente:
Activa la opción Automatic copy to clipboard para copiar automáticamente el texto cuando se muestra el cuadro de diálogo y ningún campo de entrada está enfocado. -
Mejoras de la interfaz:
- Botón de copia mejor integrado.
- Posibilidad de mantener el cuadro de diálogo abierto o de definir un retraso antes de que se cierre automáticamente.
- Animaciones y estilo más modernos (bordes redondeados, sombras, etc.).
-
Diversas optimizaciones:
- Verificación de la conexión (
navigator.onLine
) antes de cada llamada para evitar errores por estar sin conexión. - Mejor gestión de los errores y mensajes más explícitos (clave API faltante, red inactiva, etc.).
- Código más modular (archivos dedicados para los idiomas, la barra, la interfaz, etc.).
- Verificación de la conexión (
2. Los Videos: 15 Idiomas, 15 Demostraciones
Aquí tienes la lista de videos, cada uno presenta la transcripción de voz, la traducción en tiempo real y la reformulación.
- Francés (FR) : https://youtu.be/7iLJ_MPQ33k
- Inglés (EN) : https://youtu.be/ie7vR_9IJCw
- Japonés (JA) : https://youtu.be/bjoGWvSyQPo
- Coreano (KO) : https://youtu.be/e4E5K4il6t8
- Chino (ZH) : https://youtu.be/mdxffjYetJs
- Español (ES) : https://youtu.be/pXvQBsjKHLk
- Alemán (DE) : https://youtu.be/FdjPCvDEYXc
- Polaco (PL) : https://youtu.be/ckkgQ1wtYok
- Italiano (IT) : https://youtu.be/1XTbqCksu2s
- Portugués (PT) : https://youtu.be/s6BcKsTdUdg
- Neerlandés (NL) : https://youtu.be/8jMHRjzNM2k
- Hindú (HI) : https://youtu.be/VFuh-qrAFKU
- Árabe (AR) : https://youtu.be/pMbzVmCudDQ
- Rumano (RO) : https://youtu.be/FmQgv3Ezu0s
- Sueco (SV) : https://youtu.be/1hHPh6cYOkY
¡Descubre así cómo Babel Fish AI facilita la comunicación en tu idioma preferido!
3. Resumen de las Últimas Versiones
Aquí tienes un breve resumen de los cambios destacados desde la versión 1.1.0:
3.1. Menú contextual (v1.1.12)
- Clic derecho sobre el texto seleccionado:
- Rephrase Selection para reformular al instante.
- Translate Selection para traducir el texto seleccionado a cualquier idioma soportado.
- Cuadro de diálogo mejorado:
- Temporizador visual, botón “Keep Open”, estilo modernizado, botón de copia integrado.
3.2. Auto-copy y gestión del foco (v1.1.14 → v1.1.15)
- Opción “Automatic copy to clipboard”:
- Copia el texto únicamente si se muestra el cuadro de diálogo y ningún campo está enfocado.
- Detección mejorada:
- Evita sobrecargar el portapapeles cuando el texto ya está insertado en un campo.
- Preservación del foco y del cursor:
- Ya no se pierde la posición en el texto durante las interacciones con la barra o los botones.
3.3. Mejoras en UI y UX (v1.1.13)
- Controles trasladados a la parte superior del cuadro de diálogo para una mejor accesibilidad.
- Interfaz más compacta (espaciado reducido, márgenes ajustadas).
- Mejor gestión del timer (contador visual, opción “Keep Open”).
3.4. Diversas optimizaciones y correcciones
- Refactorización del código: más modular (archivos separados para los idiomas, la barra, las llamadas a API, etc.).
- Conexiones más fiables: verificación del estado offline para evitar llamadas a API innecesarias.
- Mensajes de error más claros: instrucciones detalladas para resolver problemas (clave API inválida, etc.).
- Mejoras en seguridad:
window.clearTimeout
, inyección más segura, etc.
4. Implementación de Analizadores de Código
Paralelamente al desarrollo asistido por IA a través de Roo Code (utilizo principalmente los modelos gemini-2.0-pro-exp-02-05, gemini-2.0-flash-thinking-exp-01-21 de Google, que actualmente son gratuitos, y Claude Sonnet 3.7 de Anthropic), he integrado varias herramientas de análisis estático para garantizar la calidad y la seguridad del código generado:
- SonarCloud
- CodeFactor
- Codacy
- DeepSource
En cada pull request en GitHub, estos servicios analizan el código y señalan de inmediato las vulnerabilidades, deudas técnicas o malas prácticas. Los comentarios aparecen directamente en la interfaz de GitHub, lo que permite corregir rápidamente antes de cualquier fusión en la rama principal. De este modo, aunque las IA produzcan grandes bloques de código, estos analyzers sirven de freno para mantener un código limpio y seguro.
5. Arquitectura Técnica Actualizada
Desde mi artículo anterior, la estructura de la extensión ha evolucionado ligeramente. Los puntos clave:
- manifest.json (MV3): gestiona los permisos (activeTab, scripting, contextMenus, etc.) y la inyección dinámica.
- background.js: Service worker encargado de reaccionar al clic en el ícono, a los atajos y de inyectar
content.js
. - content.js: papel central para el audio (MediaRecorder) y la llamada a las APIs (Whisper, GPT) a través de módulos especializados.
- Menú contextual: creado por
background.js
, aplicado porcontent.js
. - i18n.js y languages-shared.js: centralización de los datos de traducción.
6. ¿Quieres Probarlo?
- Instalar Babel Fish AI:
- Chrome Web Store
- GitHub (proyecto open source)
- Clave API OpenAI:
- Crea tu clave en platform.openai.com/account/api-keys y configúrala en las opciones.
7. Conclusión
Con estas actualizaciones, Babel Fish AI se vuelve aún más polivalente, ergonómico e inteligente. Gracias al menú contextual, a los botones de reformulación/traducción accesibles directamente en la barra, al sistema de auto-copy y a un análisis de código reforzado, la experiencia del usuario mejora notablemente.
No dudes en mirar los videos de demostración. ¡Gracias por tu seguimiento, y mucho éxito en tus proyectos de transcripción y traducción!
Este documento ha sido traducido de la versión fr a la lengua es utilizando el modelo o3-mini. Para más información sobre el proceso de traducción, consulte https://gitlab.com/jls42/ai-powered-markdown-translator