使用 Babel Fish AI,我之前已经介绍过一个能够通过 OpenAI 的 Whisper API 将语音转换为文本并提供实时翻译的 Chrome 扩展。今天,我带来了一批 新功能 和 大量改进:从 右键菜单 到转录文本的 自动复制,再到现在可以通过横幅按钮启用的 自动改写,本文总结了自最初版本以来的演进。
1. 介绍:有什么变化?
Babel Fish AI 延续其使命:让你在浏览器中轻松地 转录、翻译 和 改写 文本。以下是自上次文章以来的一些主要新功能:
-
强大的右键菜单:
在选中文本上右键单击即可对其进行改写(rephrase)或翻译为你选择的语言。原文会被直接替换为新版本。 -
可从横幅直接控制:
不再需要进入选项来开启/关闭改写或翻译!横幅上的按钮(在转录时屏幕顶部显示)可以让你实时调整偏好,按需处理转录或文本内容。 -
智能自动复制功能:
启用选项 Automatic copy to clipboard 后,当对话框显示且没有任何输入框获得焦点时,会自动将文本复制到剪贴板。 -
界面改进:
- 更好集成的复制按钮。
- 可选择 保持对话框打开 或设置对话框自动关闭前的延时。
- 更现代的动画与样式(圆角、阴影等)。
-
各种优化:
- 在每次调用前检查连接状态(
navigator.onLine)以避免离线错误。 - 更好的错误处理与更清晰的提示(缺少 API 密钥、网络不可用等)。
- 更模块化的代码(为语言、横幅、UI 等拆分专用文件)。
- 在每次调用前检查连接状态(
2. 视频:15 种语言,15 个演示
下面是视频列表,每个视频展示了 语音转录、实时翻译 和 改写。
- 法语 (FR) : https://youtu.be/7iLJ_MPQ33k
- 英语 (EN) : https://youtu.be/ie7vR_9IJCw
- 日语 (JA) : https://youtu.be/bjoGWvSyQPo
- 韩语 (KO) : https://youtu.be/e4E5K4il6t8
- 中文 (ZH) : https://youtu.be/mdxffjYetJs
- 西班牙语 (ES) : https://youtu.be/pXvQBsjKHLk
- 德语 (DE) : https://youtu.be/FdjPCvDEYXc
- 波兰语 (PL) : https://youtu.be/ckkgQ1wtYok
- 意大利语 (IT) : https://youtu.be/1XTbqCksu2s
- 葡萄牙语 (PT) : https://youtu.be/s6BcKsTdUdg
- 荷兰语 (NL) : https://youtu.be/8jMHRjzNM2k
- 印地语 (HI) : https://youtu.be/VFuh-qrAFKU
- 阿拉伯语 (AR) : https://youtu.be/pMbzVmCudDQ
- 罗马尼亚语 (RO) : https://youtu.be/FmQgv3Ezu0s
- 瑞典语 (SV) : https://youtu.be/1hHPh6cYOkY
来看看 Babel Fish AI 如何让你更轻松地用偏好的语言进行沟通!
3. 最近版本回顾
下面简要总结了自 1.1.0 版本以来的主要变化:
3.1. 右键菜单(v1.1.12)
- 在选中文本上 右键单击:
- Rephrase Selection 可即时改写。
- Translate Selection 可将选中文本翻译为任意受支持的语言。
- 改良的对话框:
- 可视化计时器、“保持打开”按钮、现代化样式、内置复制按钮。
3.2. 自动复制与焦点管理(v1.1.14 → v1.1.15)
- “Automatic copy to clipboard” 选项:
- 仅在对话框显示且没有任何输入框处于焦点时复制文本。
- 改进的检测:
- 当文本已插入输入框时,避免重复覆盖剪贴板。
- 保留焦点与光标位置:
- 与横幅或按钮交互时不再丢失文本中的光标位置。
3.3. 界面与体验改进(v1.1.13)
- 控件移至对话框顶部以提高可达性。
- 更紧凑的界面(减少间距,调整边距)。
- 更好的 计时器 管理(可视计数器,“保持打开”选项)。
3.4. 各种优化与修复
- 代码重构:更模块化(为语言、横幅、API 调用等拆分文件)。
- 更可靠的连接:离线状态检查以避免不必要的 API 调用。
- 更清晰的错误信息:提供详尽的解决指导(无效 API 密钥等)。
- 安全性改进:
window.clearTimeout、更安全的注入等。
4. 引入代码分析器
在使用 Roo Code(我主要使用 Google 的 gemini-2.0-pro-exp-02-05、gemini-2.0-flash-thinking-exp-01-21(当前免费)以及 Anthropic 的 Claude Sonnet 3.7)进行 AI 辅助开发的同时,我还集成了多个静态分析工具来保证生成代码的质量与安全:
- SonarCloud
- CodeFactor
- Codacy
- DeepSource
在每次对 GitHub 发起的 pull request 中,这些服务会分析代码并立即报告漏洞、技术债或不良实践。反馈会直接出现在 GitHub 界面中,便于在合并到主分支之前快速修复。这样即使 AI 生成大量代码,这些分析器也能作为把关工具,保持代码的整洁与安全。
5. 更新后的技术架构
自上一篇文章以来,扩展的结构略有演进。关键点如下:
- manifest.json(MV3):管理权限(activeTab、scripting、contextMenus…)和动态注入。
- background.js:Service Worker,负责响应图标点击、快捷键,并注入
content.js。 - content.js:在音频(MediaRecorder)和通过专用模块调用 API(Whisper、GPT)方面起核心作用。
- 右键菜单:由
background.js创建,由content.js应用。 - i18n.js 和 languages-shared.js:用于集中管理翻译数据。
6. 想试用吗?
- 安装 Babel Fish AI:
- Chrome 网上应用店
- GitHub(开源项目)
- OpenAI API 密钥:
- 在 https://platform.openai.com/account/api-keys 创建你的密钥并在选项中填写。
7. 结论
通过这些更新,Babel Fish AI 变得更加多功能、易用且智能。借助右键菜单、横幅中可直接访问的改写/翻译按钮、自动复制系统以及更严格的代码分析,用户体验得到了显著提升。
欢迎观看演示视频。感谢你的关注,祝你的转录与翻译项目一切顺利!
本文件已使用 gpt-5-mini 模型将 fr 版本翻译为 zh 语言。有关翻译过程的更多信息,请参阅 https://gitlab.com/jls42/ai-powered-markdown-translator