Logo

Dzięki Babel Fish AI, już zaprezentowałem rozszerzenie Chrome, które potrafi przekształcić mowę na tekst za pośrednictwem API Whisper firmy OpenAI, oferując jednocześnie tłumaczenie w czasie rzeczywistym. Dziś wracam z zestawem nowych funkcji oraz licznymi ulepszeniami: od menu kontekstowego, przez auto-copy transkrybowanego tekstu, aż po automatyczną reformulację (teraz możliwą do aktywacji za pomocą przycisku w pasku), ten wpis podsumowuje zmiany wprowadzone od pierwszej wersji.

1. Prezentacja: Co się zmienia?

Babel Fish AI kontynuuje swoją misję: umożliwić Ci transkrypcję, tłumaczenie i reformulację tekstów w przeglądarce, w sposób prosty i intuicyjny. Oto kilka głównych nowości wprowadzonych od ostatniego artykułu:

  • Potężne menu kontekstowe:
    Kliknij prawym przyciskiem myszy na zaznaczony tekst, aby go zreformułować (rephrase) lub przetłumaczyć na wybrany przez Ciebie język. Oryginalny tekst zostaje bezpośrednio zastąpiony nową wersją.

  • Natychmiastowa kontrola z poziomu paska:
    Nie musisz już przechodzić do ustawień, aby włączyć lub wyłączyć reformulację czy tłumaczenie! Przyciski w pasku (na górze ekranu podczas transkrypcji) pozwalają na dostosowanie preferencji na bieżąco, w zależności od tego, co chcesz zrobić ze swoją transkrypcją lub tekstem.

  • Inteligentna funkcja auto-copy:
    Włącz opcję Automatic copy to clipboard, aby automatycznie skopiować tekst gdy okno dialogowe jest wyświetlane i żadne pole tekstowe nie jest aktywne.

  • Ulepszenia interfejsu:

    • Lepsza integracja przycisku kopiowania.
    • Możliwość pozostawienia otwartego okna dialogowego lub ustawienia opóźnienia przed jego automatycznym zamknięciem.
    • Nowocześniejsze animacje i styl (zaokrąglone rogi, cienie, itd.).
  • Różne optymalizacje:

    • Sprawdzanie połączenia (navigator.onLine) przed każdym wywołaniem, aby uniknąć błędów związanych z brakiem łączności.
    • Lepsze zarządzanie błędami oraz bardziej precyzyjne komunikaty (brak klucza API, brak aktywnego połączenia, itd.).
    • Bardziej modułowy kod (osobne pliki dla języków, banera, interfejsu użytkownika, itd.).

2. Filmy: 15 Języków, 15 Demonstracji

Oto lista filmów, z których każdy przedstawia transkrypcję mowy, tłumaczenie w czasie rzeczywistym oraz reformulację.

  1. Francuski (FR) : https://youtu.be/7iLJ_MPQ33k
  2. Angielski (EN) : https://youtu.be/ie7vR_9IJCw
  3. Japoński (JA) : https://youtu.be/bjoGWvSyQPo
  4. Koreański (KO) : https://youtu.be/e4E5K4il6t8
  5. Chiński (ZH) : https://youtu.be/mdxffjYetJs
  6. Hiszpański (ES) : https://youtu.be/pXvQBsjKHLk
  7. Niemiecki (DE) : https://youtu.be/FdjPCvDEYXc
  8. Polski (PL) : https://youtu.be/ckkgQ1wtYok
  9. Włoski (IT) : https://youtu.be/1XTbqCksu2s
  10. Portugalski (PT) : https://youtu.be/s6BcKsTdUdg
  11. Holenderski (NL) : https://youtu.be/8jMHRjzNM2k
  12. Hindi (HI) : https://youtu.be/VFuh-qrAFKU
  13. Arabski (AR) : https://youtu.be/pMbzVmCudDQ
  14. Rumuński (RO) : https://youtu.be/FmQgv3Ezu0s
  15. Szwedzki (SV) : https://youtu.be/1hHPh6cYOkY

Dzięki temu przekonasz się, jak Babel Fish AI ułatwia komunikację w Twoim ulubionym języku!

3. Podsumowanie Ostatnich Wersji

Oto krótkie podsumowanie najważniejszych zmian wprowadzonych od wersji 1.1.0:

3.1. Menu kontekstowe (v1.1.12)

  • Kliknięcie prawym przyciskiem myszy na zaznaczony tekst:
    • Rephrase Selection – umożliwia natychmiastową reformulację.
    • Translate Selection – tłumaczy zaznaczony tekst na dowolny obsługiwany język.
  • Ulepszone okno dialogowe:
    • Wizualny licznik, przycisk „Keep Open”, unowocześniony styl, zintegrowany przycisk kopiowania.

3.2. Auto-copy i zarządzanie fokusem (v1.1.14 → v1.1.15)

  • Opcja “Automatic copy to clipboard”:
    • Kopiuje tekst tylko wtedy, gdy okno dialogowe jest wyświetlane i żadne pole nie jest aktywne.
  • Ulepszone wykrywanie:
    • Unika przeciążenia schowka, gdy tekst jest już wprowadzony w polu.
  • Zachowanie fokusu i kursora:
    • Pozycja w tekście nie jest tracona podczas interakcji z banerem lub przyciskami.

3.3. Ulepszenia UI i UX (v1.1.13)

  • Kontrolki przeniesione na górę okna dialogowego dla lepszej dostępności.
  • Bardziej kompaktowy interfejs (zmniejszone odstępy, dostosowane marginesy).
  • Lepsza obsługa licznika (wizualny licznik, opcja „Keep Open”).

3.4. Różne optymalizacje i poprawki

  • Refaktoryzacja kodu: bardziej modułowy (osobne pliki dla języków, banera, wywołań API…).
  • Bardziej niezawodne połączenia: sprawdzanie stanu offline, aby uniknąć zbędnych wywołań API.
  • Bardziej przejrzyste komunikaty o błędach: szczegółowe instrukcje do rozwiązania problemów (nieprawidłowy klucz API, itd.).
  • Ulepszenia bezpieczeństwa: window.clearTimeout, bezpieczniejsza iniekcja, itd.

4. Wdrożenie Analizatorów Kodu

Równolegle do rozwoju wspieranego przez SI za pomocą Roo Code (głównie wykorzystuję modele gemini-2.0-pro-exp-02-05, gemini-2.0-flash-thinking-exp-01-21 firmy Google, które są obecnie darmowe, oraz Claude Sonnet 3.7 firmy Anthropic), zintegrowałem kilka narzędzi do statycznej analizy, aby zagwarantować jakość i bezpieczeństwo generowanego kodu:

  • SonarCloud
  • CodeFactor
  • Codacy
  • DeepSource

Przy każdym pull request na GitHub, te usługi analizują kod i natychmiast zgłaszają luki, zadłużenia techniczne lub złe praktyki. Informacje zwrotne pojawiają się bezpośrednio w interfejsie GitHub, co pozwala szybko wprowadzić poprawki przed scaleniem z główną gałęzią. W ten sposób, nawet jeśli SI generują duże bloki kodu, te analizatory służą jako zabezpieczenie, dzięki któremu kod pozostaje czysty i bezpieczny.

5. Zaktualizowana Architektura Techniczna

Od mojego poprzedniego wpisu struktura rozszerzenia nieznacznie się zmieniła. Kluczowe punkty:

  • manifest.json (MV3): zarządza uprawnieniami (activeTab, scripting, contextMenus…) oraz dynamicznym wstrzykiwaniem.
  • background.js: Service worker odpowiedzialny za reakcję na kliknięcia ikony, skróty oraz wstrzykiwanie content.js.
  • content.js: kluczowa rola dla audio (MediaRecorder) oraz wywołań API (Whisper, GPT) za pomocą specjalistycznych modułów.
  • Menu kontekstowe: tworzone przez background.js, stosowane przez content.js.
  • i18n.js oraz languages-shared.js: centralizacja danych tłumaczeniowych.

6. Chcesz Spróbować?

7. Podsumowanie

Dzięki tym aktualizacjom, Babel Fish AI staje się jeszcze bardziej wszechstronny, ergonomiczny i inteligentny. Dzięki menu kontekstowemu, przyciskom reformulacji/tłumaczenia dostępnym bezpośrednio na pasku, systemowi auto-copy oraz wzmocnionej analizie kodu, doświadczenie użytkownika zostało znacząco polepszone.

Nie wahaj się obejrzeć filmów demonstracyjnych. Dziękuję za Twoje wsparcie i powodzenia w Twoich projektach transkrypcji oraz tłumaczenia!

Ten dokument został przetłumaczony z wersji fr na język pl przy użyciu modelu o3-mini. Aby uzyskać więcej informacji na temat procesu tłumaczenia, odwiedź https://gitlab.com/jls42/ai-powered-markdown-translator