Babel Fish AIでは、OpenAIのWhisper APIを使って音声をテキストに変換し、リアルタイム翻訳も提供するChrome拡張を以前に紹介しました。今回は一連の新機能と多くの改善点を携えて戻ってきました:コンテキストメニューから転写テキストの自動コピー、さらにバナーのボタンから有効化できる**自動言い換え(reformulation)**まで、この投稿では最初のバージョン以降の進化をまとめます。
1. 紹介:何が変わったのか?
Babel Fish AIは、ブラウザ内で簡単にテキストを転写、翻訳、言い換えできることを目指しています。ここでは前回の記事以降の主な新機能をいくつかご紹介します:
-
強力なコンテキストメニュー:
テキストを選択して右クリックすると、その選択を言い換えたり(rephrase)任意の言語に翻訳したりできます。元のテキストは新しいバージョンで直接置き換えられます。 -
バナーからの即時コントロール:
言い換えや翻訳を有効/無効にするために設定画面へ行く必要はありません!転写中に画面上部に表示されるバナーのボタンで、転写やテキストの扱いをリアルタイムに調整できます。 -
賢い自動コピー機能:
Automatic copy to clipboard オプションを有効にすると、ダイアログが表示されているときかつ入力フィールドにフォーカスが当たっていないときに自動でテキストをコピーします。 -
インターフェースの改善:
- 統合されたコピー用ボタン。
- ダイアログを開いたままにする オプションや、自動で閉じるまでの遅延設定。
- アニメーションとよりモダンなスタイル(角丸、シャドウなど)。
-
各種最適化:
- 各API呼び出し前の接続チェック(
navigator.onLine)でオフライン時のエラーを回避。 - エラーハンドリングとメッセージの改善(APIキーがない、ネットワーク不通など)。
- コードのモジュール化(言語、バナー、UIなど専用ファイルに分割)。
- 各API呼び出し前の接続チェック(
2. 動画:15言語、15デモ
以下は各動画一覧で、各動画は音声転写、リアルタイム翻訳、言い換えを紹介しています。
- フランス語 (FR) : https://youtu.be/7iLJ_MPQ33k
- 英語 (EN) : https://youtu.be/ie7vR_9IJCw
- 日本語 (JA) : https://youtu.be/bjoGWvSyQPo
- 韓国語 (KO) : https://youtu.be/e4E5K4il6t8
- 中国語 (ZH) : https://youtu.be/mdxffjYetJs
- スペイン語 (ES) : https://youtu.be/pXvQBsjKHLk
- ドイツ語 (DE) : https://youtu.be/FdjPCvDEYXc
- ポーランド語 (PL) : https://youtu.be/ckkgQ1wtYok
- イタリア語 (IT) : https://youtu.be/1XTbqCksu2s
- ポルトガル語 (PT) : https://youtu.be/s6BcKsTdUdg
- オランダ語 (NL) : https://youtu.be/8jMHRjzNM2k
- ヒンディー語 (HI) : https://youtu.be/VFuh-qrAFKU
- アラビア語 (AR) : https://youtu.be/pMbzVmCudDQ
- ルーマニア語 (RO) : https://youtu.be/FmQgv3Ezu0s
- スウェーデン語 (SV) : https://youtu.be/1hHPh6cYOkY
Babel Fish AIがあなたの好みの言語でどのようにコミュニケーションを助けるかをぜひご覧ください!
3. 直近バージョンのまとめ
ここではバージョン1.1.0以降の主な変更点を簡潔にまとめます:
3.1. コンテキストメニュー (v1.1.12)
- テキスト選択時の右クリック:
- Rephrase Selection(選択範囲を言い換え)で即時に言い換え。
- Translate Selection(選択範囲を翻訳)で選択テキストを任意の対応言語に翻訳。
- 改良されたダイアログ:
- ビジュアルタイマー、ボタン「Keep Open」、モダンなスタイル、統合されたコピー用ボタン。
3.2. 自動コピーとフォーカス管理 (v1.1.14 → v1.1.15)
- 「Automatic copy to clipboard」オプション:
- ダイアログが表示され、かつ入力フィールドにフォーカスがない場合にのみテキストをコピーします。
- 検出精度の向上:
- テキストがすでに入力フィールドに挿入されている場合にクリップボードを上書きしないよう回避。
- フォーカスとカーソル位置の保持:
- バナーやボタン操作時に編集位置が失われなくなりました。
3.3. UI/UXの改善 (v1.1.13)
- ダイアログ上部にコントロールを移動してアクセシビリティを向上。
- よりコンパクトなインターフェース(スペース、マージン調整)。
- タイマーの管理改善(ビジュアルカウント、オプション「Keep Open」)。
3.4. 各種最適化と修正
- コードのリファクタリング:よりモジュール化(言語、バナー、API呼び出しなどを分割)。
- 接続の信頼性向上:オフライン状態のチェックで不要なAPI呼び出しを回避。
- エラーメッセージの明確化:問題解決のための詳細な案内(無効なAPIキーなど)。
- セキュリティ強化:
window.clearTimeout、より安全なインジェクションなど。
4. コード解析ツールの導入
Roo CodeによるIA支援開発と並行して(主にGoogleのgemini-2.0-pro-exp-02-05、gemini-2.0-flash-thinking-exp-01-21、およびAnthropicのClaude Sonnet 3.7を利用)、生成されたコードの品質と安全性を担保するために複数の静的解析ツールを導入しました:
- SonarCloud
- CodeFactor
- Codacy
- DeepSource
GitHubでの各プルリクエストごとにこれらのサービスがコードを解析し、脆弱性、技術的負債、ベストプラクティス違反を即座に報告します。フィードバックはGitHubのインターフェースに直接表示されるため、メインブランチへマージする前に迅速に修正できます。こうして、AIが大きなコードブロックを生成しても、これらの解析ツールがコードをクリーンかつ安全に保つガードレールの役割を果たします。
5. 更新された技術アーキテクチャ
前回の記事以降、拡張機能の構成が一部変更されました。主要ポイントは次の通りです:
- manifest.json (MV3):permission(activeTab、scripting、contextMenus…)と動的インジェクションを管理。
- background.js:アイコンクリック、ショートカットに反応し、
content.jsを注入するサービスワーカー。 - content.js:オーディオ(MediaRecorder)とAPI(Whisper、GPT)呼び出しの中心的役割を果たすモジュール群。
- コンテキストメニュー:
background.jsによって作成され、content.jsによって適用。 - i18n.js と languages-shared.js:翻訳データの集中管理。
6. 試してみたいですか?
- Babel Fish AI をインストール:
- Chrome ウェブストア
- GitHub(オープンソースプロジェクト)
- OpenAIのAPIキー:
- 作成は platform.openai.com/account/api-keys で行い、オプションに設定してください。
7. 結論
これらの更新により、Babel Fish AIはさらに多機能で使いやすく、賢くなりました。コンテキストメニュー、バナー上のアクセスしやすい言い換え/翻訳ボタン、自動コピー機能、強化されたコード解析により、ユーザー体験は大幅に向上しています。
デモ動画もぜひご覧ください。ご愛読ありがとうごさいます。転写や翻訳のプロジェクトでのご活用を願っています!
この文書は、gpt-5-mini モデルを使用して fr バージョンから ja 言語に翻訳されました。翻訳プロセスの詳細については、https://gitlab.com/jls42/ai-powered-markdown-translator をご覧ください。