Logo

借助 Babel Fish AI,我已经为大家介绍了一个利用 OpenAI Whisper API 将语音转换为文本的 Chrome扩展,同时还提供实时翻译功能。今天,我带来了一系列 新功能 和诸多 改进:从 右键菜单 到转录文本的 自动复制,再到 自动改写(现在可以通过工具条上的按钮激活),本文总结了自最初版本以来的所有演变。

1. 介绍:有什么变化?

Babel Fish AI 继续秉持其使命:让您在浏览器中轻松 转录翻译 以及 改写 文本。以下是自上一篇文章以来的一些主要新功能:

  • 强大的右键菜单:
    右键点击选中的文本即可改写(rephrase)或翻译为您选择的语言。原文本将直接被新版本替换。

  • 顶部工具条上的即时控制:
    无需再进入选项来启用/禁用改写或翻译!转录期间屏幕顶部工具条上的按钮让您能够 实时 调整转录或文本的相关偏好设置。

  • 智能自动复制功能:
    启用 Automatic copy to clipboard 选项,仅当对话框显示且没有任何输入框获得焦点时,自动复制文本。

  • 界面改进:

    • 复制按钮整合得更好。
    • 可以选择 保持对话框开启 或设置自动关闭前的延时。
    • 动画效果和风格更加现代化(圆角、阴影等)。
  • 各种优化:

    • 在每次调用前检查连接状态(navigator.onLine),以避免离线错误。
    • 更好的错误处理和更明确的提示信息(如缺少 API 密钥、网络中断等)。
    • 代码更模块化(为语言、横幅、用户界面等分别设有独立的文件)。

2. 视频展示:15 种语言,15 个演示

以下是视频列表,每个视频展示了 语音转录、实时 翻译改写 功能。

  1. 法语 (FR) : https://youtu.be/7iLJ_MPQ33k
  2. 英语 (EN) : https://youtu.be/ie7vR_9IJCw
  3. 日语 (JA) : https://youtu.be/bjoGWvSyQPo
  4. 韩语 (KO) : https://youtu.be/e4E5K4il6t8
  5. 中文 (ZH) : https://youtu.be/mdxffjYetJs
  6. 西班牙语 (ES) : https://youtu.be/pXvQBsjKHLk
  7. 德语 (DE) : https://youtu.be/FdjPCvDEYXc
  8. 波兰语 (PL) : https://youtu.be/ckkgQ1wtYok
  9. 意大利语 (IT) : https://youtu.be/1XTbqCksu2s
  10. 葡萄牙语 (PT) : https://youtu.be/s6BcKsTdUdg
  11. 荷兰语 (NL) : https://youtu.be/8jMHRjzNM2k
  12. 印地语 (HI) : https://youtu.be/VFuh-qrAFKU
  13. 阿拉伯语 (AR) : https://youtu.be/pMbzVmCudDQ
  14. 罗马尼亚语 (RO) : https://youtu.be/FmQgv3Ezu0s
  15. 瑞典语 (SV) : https://youtu.be/1hHPh6cYOkY

借此了解 Babel Fish AI 如何让您使用喜爱的语言更便捷地沟通!

3. 最新版本回顾

以下是自 1.1.0 版本以来主要变更的简要概述:

3.1. 右键菜单(v1.1.12)

  • 右键点击 选中的文本:
    • 选择 Rephrase Selection 以立即改写。
    • 选择 Translate Selection 将选中的文本翻译成任一支持的语言。
  • 改进的对话框
    • 视觉倒计时、“Keep Open” 按钮、现代化风格、内置复制按钮。

3.2. 自动复制与焦点管理(v1.1.14 → v1.1.15)

  • “Automatic copy to clipboard” 选项
    • 仅在对话框显示且没有任何输入框获得焦点时复制文本。
  • 改进的检测
    • 避免在文本已插入输入框时过多占用剪贴板。
  • 保持焦点和光标
    • 与横幅或按钮交互时,不再丢失文本中的输入位置。

3.3. UI 和 UX 改进(v1.1.13)

  • 控件移至对话框顶部,以提高可访问性。
  • 界面更紧凑(间距减少,边距调整)。
  • 更好的 计时器 管理(视觉计时器,“Keep Open” 选项)。

3.4. 各种优化与修正

  • 代码重构:更模块化(为语言、横幅、API 调用等分别设有独立的文件)。
  • 更可靠的连接:在每次调用前检查离线状态,以避免不必要的 API 调用。
  • 更明确的错误信息:提供详细说明来解决问题(如无效 API 密钥等)。
  • 安全性改进:例如 window.clearTimeout,更安全的注入等。

4. 代码分析器的部署

在借助 Roo Code 进行 AI 辅助开发的同时(我主要使用 Google 目前免费的 gemini-2.0-pro-exp-02-05gemini-2.0-flash-thinking-exp-01-21 模型以及 Anthropic 的 Claude Sonnet 3.7),我还集成了多个静态代码分析工具,以确保生成代码的质量与安全性:

  • SonarCloud
  • CodeFactor
  • Codacy
  • DeepSource

在 GitHub 上的每次 pull request 中,这些服务都会分析代码,并立即报告漏洞、技术债务或不良实践。反馈直接显示在 GitHub 界面中,从而能在合并至主分支前 迅速修正。这样,即使 AI 生成大量代码块,这些分析器也能作为 防护措施,确保代码 清洁安全

5. 更新后的技术架构

自上篇文章以来,扩展的结构略有变化。关键点如下:

  • manifest.json (MV3):管理权限(activeTab、scripting、contextMenus…)及动态注入。
  • background.js:服务工作线程,负责响应图标点击、快捷键,并注入 content.js
  • content.js:在音频(MediaRecorder)处理及通过专用模块调用 API(Whisper、GPT)中扮演核心角色。
  • 右键菜单:由 background.js 创建,由 content.js 应用。
  • i18n.js 和 languages-shared.js:用于集中管理翻译数据。

6. 想试试吗?

7. 结语

通过这些更新, Babel Fish AI 变得更加 多功能人性化智能。借助 右键菜单、可直接在工具条上访问的 改写/翻译按钮自动复制系统 以及增强的 代码分析,用户体验得到了显著提升。

欢迎观看这些 演示视频。感谢您的关注,祝您的 转录翻译 项目顺利进行!

此文档已从法语版本翻译为中文,使用o3-mini模型。如需更多有关翻译过程的信息,请访问 https://gitlab.com/jls42/ai-powered-markdown-translator