
借助 Babel Fish AI,我已经为大家介绍了一个利用 OpenAI Whisper API 将语音转换为文本的 Chrome扩展,同时还提供实时翻译功能。今天,我带来了一系列 新功能 和诸多 改进:从 右键菜单 到转录文本的 自动复制,再到 自动改写(现在可以通过工具条上的按钮激活),本文总结了自最初版本以来的所有演变。
1. 介绍:有什么变化?
Babel Fish AI 继续秉持其使命:让您在浏览器中轻松 转录、翻译 以及 改写 文本。以下是自上一篇文章以来的一些主要新功能:
-
强大的右键菜单:
右键点击选中的文本即可改写(rephrase)或翻译为您选择的语言。原文本将直接被新版本替换。 -
顶部工具条上的即时控制:
无需再进入选项来启用/禁用改写或翻译!转录期间屏幕顶部工具条上的按钮让您能够 实时 调整转录或文本的相关偏好设置。 -
智能自动复制功能:
启用 Automatic copy to clipboard 选项,仅当对话框显示且没有任何输入框获得焦点时,自动复制文本。 -
界面改进:
- 复制按钮整合得更好。
- 可以选择 保持对话框开启 或设置自动关闭前的延时。
- 动画效果和风格更加现代化(圆角、阴影等)。
-
各种优化:
- 在每次调用前检查连接状态(
navigator.onLine
),以避免离线错误。 - 更好的错误处理和更明确的提示信息(如缺少 API 密钥、网络中断等)。
- 代码更模块化(为语言、横幅、用户界面等分别设有独立的文件)。
- 在每次调用前检查连接状态(
2. 视频展示:15 种语言,15 个演示
以下是视频列表,每个视频展示了 语音转录、实时 翻译 和 改写 功能。
- 法语 (FR) : https://youtu.be/7iLJ_MPQ33k
- 英语 (EN) : https://youtu.be/ie7vR_9IJCw
- 日语 (JA) : https://youtu.be/bjoGWvSyQPo
- 韩语 (KO) : https://youtu.be/e4E5K4il6t8
- 中文 (ZH) : https://youtu.be/mdxffjYetJs
- 西班牙语 (ES) : https://youtu.be/pXvQBsjKHLk
- 德语 (DE) : https://youtu.be/FdjPCvDEYXc
- 波兰语 (PL) : https://youtu.be/ckkgQ1wtYok
- 意大利语 (IT) : https://youtu.be/1XTbqCksu2s
- 葡萄牙语 (PT) : https://youtu.be/s6BcKsTdUdg
- 荷兰语 (NL) : https://youtu.be/8jMHRjzNM2k
- 印地语 (HI) : https://youtu.be/VFuh-qrAFKU
- 阿拉伯语 (AR) : https://youtu.be/pMbzVmCudDQ
- 罗马尼亚语 (RO) : https://youtu.be/FmQgv3Ezu0s
- 瑞典语 (SV) : https://youtu.be/1hHPh6cYOkY
借此了解 Babel Fish AI 如何让您使用喜爱的语言更便捷地沟通!
3. 最新版本回顾
以下是自 1.1.0 版本以来主要变更的简要概述:
3.1. 右键菜单(v1.1.12)
- 右键点击 选中的文本:
- 选择 Rephrase Selection 以立即改写。
- 选择 Translate Selection 将选中的文本翻译成任一支持的语言。
- 改进的对话框:
- 视觉倒计时、“Keep Open” 按钮、现代化风格、内置复制按钮。
3.2. 自动复制与焦点管理(v1.1.14 → v1.1.15)
- “Automatic copy to clipboard” 选项:
- 仅在对话框显示且没有任何输入框获得焦点时复制文本。
- 改进的检测:
- 避免在文本已插入输入框时过多占用剪贴板。
- 保持焦点和光标:
- 与横幅或按钮交互时,不再丢失文本中的输入位置。
3.3. UI 和 UX 改进(v1.1.13)
- 控件移至对话框顶部,以提高可访问性。
- 界面更紧凑(间距减少,边距调整)。
- 更好的 计时器 管理(视觉计时器,“Keep Open” 选项)。
3.4. 各种优化与修正
- 代码重构:更模块化(为语言、横幅、API 调用等分别设有独立的文件)。
- 更可靠的连接:在每次调用前检查离线状态,以避免不必要的 API 调用。
- 更明确的错误信息:提供详细说明来解决问题(如无效 API 密钥等)。
- 安全性改进:例如
window.clearTimeout
,更安全的注入等。
4. 代码分析器的部署
在借助 Roo Code 进行 AI 辅助开发的同时(我主要使用 Google 目前免费的 gemini-2.0-pro-exp-02-05、gemini-2.0-flash-thinking-exp-01-21 模型以及 Anthropic 的 Claude Sonnet 3.7),我还集成了多个静态代码分析工具,以确保生成代码的质量与安全性:
- SonarCloud
- CodeFactor
- Codacy
- DeepSource
在 GitHub 上的每次 pull request 中,这些服务都会分析代码,并立即报告漏洞、技术债务或不良实践。反馈直接显示在 GitHub 界面中,从而能在合并至主分支前 迅速修正。这样,即使 AI 生成大量代码块,这些分析器也能作为 防护措施,确保代码 清洁 且 安全。
5. 更新后的技术架构
自上篇文章以来,扩展的结构略有变化。关键点如下:
- manifest.json (MV3):管理权限(activeTab、scripting、contextMenus…)及动态注入。
- background.js:服务工作线程,负责响应图标点击、快捷键,并注入
content.js
。 - content.js:在音频(MediaRecorder)处理及通过专用模块调用 API(Whisper、GPT)中扮演核心角色。
- 右键菜单:由
background.js
创建,由content.js
应用。 - i18n.js 和 languages-shared.js:用于集中管理翻译数据。
6. 想试试吗?
- 安装 Babel Fish AI:
- Chrome Web Store
- GitHub (开源项目)
- OpenAI API 密钥:
- 在 platform.openai.com/account/api-keys 上创建您的密钥,并在选项中填写。
7. 结语
通过这些更新, Babel Fish AI 变得更加 多功能、人性化 且 智能。借助 右键菜单、可直接在工具条上访问的 改写/翻译按钮、自动复制系统 以及增强的 代码分析,用户体验得到了显著提升。
欢迎观看这些 演示视频。感谢您的关注,祝您的 转录 及 翻译 项目顺利进行!
此文档已从法语版本翻译为中文,使用o3-mini模型。如需更多有关翻译过程的信息,请访问 https://gitlab.com/jls42/ai-powered-markdown-translator