Mit Babel Fish AI habe ich bereits eine Chrome-Erweiterung vorgestellt, die Sprache mithilfe der Whisper-API von OpenAI in Text verwandelt und außerdem eine Übersetzung in Echtzeit anbietet. Heute präsentiere ich eine Reihe neuer Funktionen und zahlreicher Verbesserungen: vom Kontextmenü über das Auto-Copy des transkribierten Textes bis zur automatischen Umformulierung (jetzt über eine Schaltfläche im Banner aktivierbar). Dieser Beitrag fasst die Entwicklungen seit der allerersten Version zusammen.
1. Vorstellung : Was ändert sich?
Babel Fish AI verfolgt weiterhin sein Ziel: Ihnen das Transkribieren, Übersetzen und Umformulieren von Texten im Browser so einfach wie möglich zu machen. Hier einige der wichtigsten Neuerungen seit dem letzten Artikel:
-
Leistungsstarkes Kontextmenü:
Klicken Sie mit der rechten Maustaste auf einen markierten Text, um ihn umzuformulieren (rephrase) oder in die Sprache Ihrer Wahl zu übersetzen. Der Originaltext wird direkt durch die neue Version ersetzt. -
Sofortige Steuerung über das Banner:
Keine Notwendigkeit mehr, in die Optionen zu gehen, um Umformulierung oder Übersetzung ein- oder auszuschalten! Die Schaltflächen im Banner (oben auf dem Bildschirm während der Transkription) ermöglichen es, Ihre Einstellungen live anzupassen, je nachdem, was Sie mit Ihrer Transkription oder Ihrem Text vorhaben. -
Intelligente Auto-Copy-Funktion:
Aktivieren Sie die Option Automatisches Kopieren in die Zwischenablage, um den Text automatisch zu kopieren wenn das Dialogfeld angezeigt wird und kein Eingabefeld fokussiert ist. -
Verbesserungen der Benutzeroberfläche:
- Besser integrierte Kopier-Schaltfläche.
- Möglichkeit, das Dialogfeld offen zu halten oder eine Verzögerung einzustellen, bevor es automatisch geschlossen wird.
- Modernere Animationen und Stil (abgerundete Ecken, Schatten, etc.).
-
Verschiedene Optimierungen:
- Überprüfung der Verbindung (
navigator.onLine) vor jedem Aufruf, um Offline-Fehler zu vermeiden. - Bessere Fehlerbehandlung und aussagekräftigere Meldungen (fehlender API-Schlüssel, Netzwerk inaktiv, etc.).
- Modularerer Code (separate Dateien für Sprachen, Banner, UI, etc.).
- Überprüfung der Verbindung (
2. Die Videos : 15 Sprachen, 15 Demonstrationen
Hier die Liste der Videos, jedes Video zeigt die Sprachtranskription, die Echtzeitübersetzung und die Umformulierung.
- Französisch (FR) : https://youtu.be/7iLJ_MPQ33k
- Englisch (EN) : https://youtu.be/ie7vR_9IJCw
- Japanisch (JA) : https://youtu.be/bjoGWvSyQPo
- Koreanisch (KO) : https://youtu.be/e4E5K4il6t8
- Chinesisch (ZH) : https://youtu.be/mdxffjYetJs
- Spanisch (ES) : https://youtu.be/pXvQBsjKHLk
- Deutsch (DE) : https://youtu.be/FdjPCvDEYXc
- Polnisch (PL) : https://youtu.be/ckkgQ1wtYok
- Italienisch (IT) : https://youtu.be/1XTbqCksu2s
- Portugiesisch (PT) : https://youtu.be/s6BcKsTdUdg
- Niederländisch (NL) : https://youtu.be/8jMHRjzNM2k
- Hindi (HI) : https://youtu.be/VFuh-qrAFKU
- Arabisch (AR) : https://youtu.be/pMbzVmCudDQ
- Rumänisch (RO) : https://youtu.be/FmQgv3Ezu0s
- Schwedisch (SV) : https://youtu.be/1hHPh6cYOkY
Erfahren Sie, wie Babel Fish AI die Kommunikation in Ihrer bevorzugten Sprache erleichtert!
3. Überblick über die letzten Versionen
Hier eine kurze Zusammenfassung der wichtigsten Änderungen seit Version 1.1.0 :
3.1. Kontextmenü (v1.1.12)
- Rechtsklick auf markierten Text :
- Auswahl umformulieren für sofortige Umformulierung.
- Auswahl übersetzen zur Übersetzung des markierten Textes in jede unterstützte Sprache.
- Verbessertes Dialogfeld :
- Visueller Timer, Schaltfläche “Keep Open”, modernisiertes Design, integrierte Kopier-Schaltfläche.
3.2. Auto-Copy und Fokusverwaltung (v1.1.14 → v1.1.15)
- Option “Automatisches Kopieren in die Zwischenablage” :
- Kopiert den Text nur, wenn das Dialogfeld angezeigt wird und kein Feld fokussiert ist.
- Verbesserte Erkennung :
- Vermeidet, die Zwischenablage zu überladen, wenn der Text bereits in ein Feld eingefügt wurde.
- Erhalt von Fokus und Cursorposition :
- Die Position im Text geht bei Interaktionen mit dem Banner oder den Schaltflächen nicht mehr verloren.
3.3. UI- und UX-Verbesserungen (v1.1.13)
- Steuerungselemente wurden nach oben im Dialogfeld verschoben für bessere Zugänglichkeit.
- Kompaktere Oberfläche (reduzierte Abstände, angepasste Ränder).
- Bessere Verwaltung des Timers (visueller Zähler, Option “Keep Open”).
3.4. Verschiedene Optimierungen und Fehlerbehebungen
- Refactoring des Codes : modularer (separate Dateien für Sprachen, Banner, API-Aufrufe…).
- Zuverlässigere Verbindungen : Überprüfung des Offline-Status, um unnötige API-Aufrufe zu vermeiden.
- Klarere Fehlermeldungen : detaillierte Anweisungen zur Problemlösung (ungültiger API-Schlüssel, etc.).
- Sicherheitsverbesserungen :
window.clearTimeout, sicherere Injection, etc.
4. Einrichtung von Code-Analysatoren
Parallel zur KI-gestützten Entwicklung über Roo Code (ich nutze hauptsächlich die Modelle gemini-2.0-pro-exp-02-05, gemini-2.0-flash-thinking-exp-01-21 von Google, die derzeit kostenlos sind, sowie Claude Sonnet 3.7 von Anthropic), habe ich mehrere statische Analyse-Tools integriert, um die Qualität und Sicherheit des generierten Codes zu gewährleisten:
- SonarCloud
- CodeFactor
- Codacy
- DeepSource
Bei jedem Pull Request auf GitHub analysieren diese Services den Code und melden sofort Verwundbarkeiten, technische Schulden oder schlechte Praktiken. Das Feedback erscheint direkt in der GitHub-Oberfläche, sodass Korrekturen vor dem Merge in den Hauptzweig schnell vorgenommen werden können. Auf diese Weise dienen diese Analysetools als Schutzmechanismus, um sauberen und sicheren Code zu erhalten, auch wenn die KI große Codeblöcke erzeugt.
5. Aktualisierte technische Architektur
Seit meinem vorherigen Beitrag hat sich die Struktur der Erweiterung leicht verändert. Die wichtigsten Punkte:
- manifest.json (MV3) : verwaltet die Berechtigungen (activeTab, scripting, contextMenus…) und die dynamische Injektion.
- background.js : Service Worker, der auf Klicks auf das Symbol, auf Tastenkürzel reagiert und
content.jsinjiziert. - content.js : zentrale Rolle für Audio (MediaRecorder) und Aufrufe an die APIs (Whisper, GPT) über spezialisierte Module.
- Kontextmenü : erstellt durch
background.js, angewendet durchcontent.js. - i18n.js und languages-shared.js : Zentralisierung der Übersetzungsdaten.
6. Möchten Sie es testen?
- Babel Fish AI installieren :
- Chrome Web Store
- GitHub (Open-Source-Projekt)
- OpenAI API-Schlüssel :
- Erstellen Sie Ihren Schlüssel unter platform.openai.com/account/api-keys und tragen Sie ihn in den Optionen ein.
7. Fazit
Mit diesen Updates wird Babel Fish AI noch vielseitiger, benutzerfreundlicher und intelligenter. Dank des Kontextmenüs, der Umformungs-/Übersetzungsschaltflächen direkt im Banner, des Auto-Copy-Systems und der verstärkten Code-Analyse wurde das Nutzererlebnis deutlich verbessert.
Zögern Sie nicht, sich die Demonstrationsvideos anzusehen. Vielen Dank für Ihr Interesse und viel Erfolg mit Ihren Projekten zur Transkription und Übersetzung!
Dieses Dokument wurde aus der französischen Version in die englische Sprache mithilfe des Modells gpt-5-mini übersetzt. Für weitere Informationen zum Übersetzungsprozess finden Sie unter https://gitlab.com/jls42/ai-powered-markdown-translator