Logo

Mit Babel Fish AI habe ich bereits eine Chrome-Erweiterung vorgestellt, die in der Lage ist, Sprache in Text über die OpenAI Whisper API umzuwandeln und gleichzeitig eine Echtzeitübersetzung anzubieten. Heute melde ich mich mit einer Reihe von neuen Funktionen und zahlreichen Verbesserungen zurück: vom Kontextmenü bis hin zum Auto-Copy des transkribierten Textes, einschließlich der automatischen Umformulierung (nun aktivierbar über einen Knopf in der Leiste). Dieser Beitrag fasst die Entwicklungen seit der allerersten Version zusammen.

1. Vorstellung: Was ändert sich?

Babel Fish AI verfolgt seine Mission: Ihnen zu ermöglichen, Ihre Texte im Browser ganz einfach zu transkribieren, übersetzen und umzuformulieren. Hier einige der wichtigsten Neuerungen seit dem letzten Artikel:

  • Leistungsstarkes Kontextmenü:
    Klicken Sie mit der rechten Maustaste auf einen markierten Text, um ihn umzuformulieren (rephrase) oder in die von Ihnen gewählte Sprache zu übersetzen. Der Originaltext wird direkt durch die neue Version ersetzt.

  • Sofortige Steuerung über die Leiste:
    Es ist nicht mehr nötig, in die Optionen zu gehen, um die Umformulierung oder Übersetzung zu aktivieren/deaktivieren! Die Knöpfe in der Leiste (oben auf dem Bildschirm während der Transkription) ermöglichen es Ihnen, Ihre Einstellungen live anzupassen, je nachdem, was Sie mit Ihrer Transkription oder Ihrem Text tun möchten.

  • Intelligente Auto-Copy-Funktion:
    Aktivieren Sie die Option Automatic copy to clipboard, um den Text automatisch zu kopieren, wenn das Dialogfeld angezeigt wird und kein Eingabefeld fokussiert ist.

  • Verbesserungen der Benutzeroberfläche:

    • Besser integrierter Kopierknopf.
    • Möglichkeit, das Dialogfeld offen zu halten oder eine Verzögerung einzustellen, bevor es sich automatisch schließt.
    • Modernere Animationen und ein moderner Stil (abgerundete Ecken, Schatten, etc.).
  • Verschiedene Optimierungen:

    • Überprüfung der Verbindung (navigator.onLine) vor jedem Aufruf, um Offline-Fehler zu vermeiden.
    • Bessere Fehlerbehandlung und verständlichere Meldungen (fehlender API-Schlüssel, inaktives Netzwerk etc.).
    • Modulareser Code (dedizierte Dateien für Sprachen, Banner, UI, etc.).

2. Die Videos: 15 Sprachen, 15 Demonstrationen

Hier ist die Liste der Videos, jedes Video zeigt die Sprachtranskription, die Echtzeitübersetzung und die Umformulierung.

  1. Französisch (FR): https://youtu.be/7iLJ_MPQ33k
  2. Englisch (EN): https://youtu.be/ie7vR_9IJCw
  3. Japanisch (JA): https://youtu.be/bjoGWvSyQPo
  4. Koreanisch (KO): https://youtu.be/e4E5K4il6t8
  5. Chinesisch (ZH): https://youtu.be/mdxffjYetJs
  6. Spanisch (ES): https://youtu.be/pXvQBsjKHLk
  7. Deutsch (DE): https://youtu.be/FdjPCvDEYXc
  8. Polnisch (PL): https://youtu.be/ckkgQ1wtYok
  9. Italienisch (IT): https://youtu.be/1XTbqCksu2s
  10. Portugiesisch (PT): https://youtu.be/s6BcKsTdUdg
  11. Niederländisch (NL): https://youtu.be/8jMHRjzNM2k
  12. Hindi (HI): https://youtu.be/VFuh-qrAFKU
  13. Arabisch (AR): https://youtu.be/pMbzVmCudDQ
  14. Rumänisch (RO): https://youtu.be/FmQgv3Ezu0s
  15. Schwedisch (SV): https://youtu.be/1hHPh6cYOkY

So erfahren Sie, wie Babel Fish AI die Kommunikation in Ihrer bevorzugten Sprache erleichtert!

3. Zusammenfassung der neuesten Versionen

Hier ein kurzer Überblick über die wesentlichen Änderungen seit Version 1.1.0:

3.1. Kontextmenü (v1.1.12)

  • Rechtsklick auf markierten Text:
    • Rephrase Selection, um sofort umzuformulieren.
    • Translate Selection, um den markierten Text in eine beliebige unterstützte Sprache zu übersetzen.
  • Verbessertes Dialogfeld:
    • Visueller Timer, Button „Keep Open“, modernisierter Stil, integrierter Kopierknopf.

3.2. Auto-Copy und Fokusverwaltung (v1.1.14 → v1.1.15)

  • Option “Automatic copy to clipboard”:
    • Kopiert den Text nur, wenn das Dialogfeld angezeigt wird und kein Feld fokussiert ist.
  • Verbesserte Erkennung:
    • Verhindert, dass die Zwischenablage überladen wird, wenn der Text bereits in einem Feld eingefügt ist.
  • Erhalt von Fokus und Cursor:
    • Die Position im Text geht bei Interaktionen mit dem Banner oder den Knöpfen nicht verloren.

3.3. Verbesserungen von UI und UX (v1.1.13)

  • Steuerungselemente wurden in das obere Ende des Dialogfelds verlagert, um eine bessere Zugänglichkeit zu gewährleisten.
  • Kompaktere Benutzeroberfläche (reduzierter Abstand, angepasste Ränder).
  • Bessere Verwaltung des Timers (visueller Zähler, Option „Keep Open“).

3.4. Verschiedene Optimierungen und Fehlerbehebungen

  • Refactoring des Codes: modularer (getrennte Dateien für Sprachen, Banner, API-Aufrufe usw.).
  • Zuverlässigere Verbindungen: Überprüfung des Offline-Status, um unnötige API-Aufrufe zu vermeiden.
  • Klarere Fehlermeldungen: Detaillierte Anweisungen zur Problemlösung (ungültiger API-Schlüssel etc.).
  • Verbesserte Sicherheit: window.clearTimeout, sicherere Injektion etc.

4. Implementierung von Code-Analyzern

Parallel zur von der KI unterstützten Entwicklung über Roo Code (ich nutze hauptsächlich die Modelle gemini-2.0-pro-exp-02-05, gemini-2.0-flash-thinking-exp-01-21 von Google, die derzeit kostenlos sind, und Claude Sonnet 3.7 von Anthropic) habe ich mehrere statische Analysetools integriert, um die Qualität und Sicherheit des generierten Codes zu gewährleisten:

  • SonarCloud
  • CodeFactor
  • Codacy
  • DeepSource

Bei jeder Pull Request auf GitHub analysieren diese Dienste den Code und melden sofort Sicherheitslücken, technische Schulden oder schlechte Praktiken. Die Rückmeldungen erscheinen direkt in der GitHub-Oberfläche, was eine schnelle Korrektur ermöglicht, bevor ein Merge in den Hauptbranch erfolgt. Auf diese Weise fungieren diese Analyzer als Sicherheitsnetz, um einen sauberen und sicheren Code aufrechtzuerhalten, auch wenn die KI große Codeblöcke produziert.

5. Aktualisierte technische Architektur

Seit meinem letzten Beitrag hat sich die Struktur der Erweiterung leicht verändert. Die wichtigsten Punkte:

  • manifest.json (MV3): verwaltet die Berechtigungen (activeTab, scripting, contextMenus usw.) und die dynamische Injektion.
  • background.js: Service Worker, der auf Klicks auf das Symbol, Tastenkombinationen reagiert und content.js injiziert.
  • content.js: Zentrale Rolle für Audio (MediaRecorder) und API-Aufrufe (Whisper, GPT) über spezialisierte Module.
  • Kontextmenü: erstellt durch background.js, angewendet durch content.js.
  • i18n.js und languages-shared.js: Zentralisierung der Übersetzungsdaten.

6. Lust zum Ausprobieren?

7. Fazit

Mit diesen Updates wird Babel Fish AI noch vielseitiger, benutzerfreundlicher und intelligenter. Dank des Kontextmenüs, der direkt in der Leiste zugänglichen Umformulierung-/Übersetzungsknöpfe, des Auto-Copy-Systems und einer verstärkten Code-Analyse wird die Benutzererfahrung deutlich verbessert.

Schauen Sie sich gerne die Demovideos an. Vielen Dank für Ihr Interesse und viel Erfolg bei Ihren Projekten zur Transkription und Übersetzung!

Dieses Dokument wurde von der Version fr in die Sprache en übersetzt unter Verwendung des Modells o3-mini. Für weitere Informationen zum Übersetzungsprozess besuchen Sie https://gitlab.com/jls42/ai-powered-markdown-translator