Szukaj

blogia

Babel Fish AI : Nowe Funkcje, Menu Kontekstowe, Auto-Copy, Kontrola Jakości Kodu, itd.

Babel Fish AI : Nowe Funkcje, Menu Kontekstowe, Auto-Copy, Kontrola Jakości Kodu, itd.

W poście o Babel Fish AI przedstawiłem już rozszerzenie Chrome potrafiące zamieniać mowę na tekst za pomocą API Whisper od OpenAI, oferujące również tłumaczenie w czasie rzeczywistym. Dziś wracam z zestawem nowych funkcji i wieloma ulepszeniami: od menu kontekstowego, przez automatyczne kopiowanie przetranskrybowanego tekstu, po automatyczną reformulację (teraz możliwą do włączenia z poziomu przycisku na pasku) — ten wpis podsumowuje zmiany od pierwszej wersji.

1. Prezentacja: Co się zmienia?

Babel Fish AI realizuje swoją misję: umożliwić Ci transkrypcję, tłumaczenie i reformulację tekstów w przeglądarce w prosty sposób. Oto niektóre z głównych nowości od ostatniego artykułu:

  • Mocne menu kontekstowe:
    Kliknij prawym przyciskiem myszy na zaznaczony tekst, aby go przeformułować (rephrase) lub przetłumaczyć na wybrany język. Oryginalny tekst jest bezpośrednio zastępowany nową wersją.

  • Natychmiastowa kontrola z paska:
    Nie trzeba przechodzić do opcji, aby włączać/wyłączać reformulację lub tłumaczenie! Przycisky na pasku (u góry ekranu podczas transkrypcji) pozwalają dostosować preferencje na żywo, zależnie od tego, co chcesz zrobić z transkrypcją lub tekstem.

  • Inteligentna funkcja auto-copy:
    Włącz opcję Automatic copy to clipboard, aby automatycznie kopiować tekst gdy okno dialogowe jest wyświetlone i żadne pole tekstowe nie ma fokusu.

  • Ulepszenia interfejsu:

    • Lepiej zintegrowany przycisk kopiowania.
    • Możliwość utrzymania okna dialogowego otwartego lub ustawienia opóźnienia przed jego automatycznym zamknięciem.
    • Nowocześniejsze animacje i styl (zaokrąglone rogi, cienie itp.).
  • Różne optymalizacje:

    • Sprawdzanie połączenia (navigator.onLine) przed każdym wywołaniem, aby unikać błędów w trybie offline.
    • Lepsze zarządzanie błędami i bardziej czytelne komunikaty (brak klucza API, brak sieci itp.).
    • Bardziej modułowy kod (wydzielone pliki dla języków, banera, UI itp.).

2. Wideo: 15 języków, 15 demonstracji

Oto lista filmów — każdy prezentuje transkrypcję mowy, tłumaczenie w czasie rzeczywistym oraz reformulację.

  1. Francuski (FR) : https://youtu.be/7iLJ_MPQ33k
  2. Angielski (EN) : https://youtu.be/ie7vR_9IJCw
  3. Japoński (JA) : https://youtu.be/bjoGWvSyQPo
  4. Koreański (KO) : https://youtu.be/e4E5K4il6t8
  5. Chiński (ZH) : https://youtu.be/mdxffjYetJs
  6. Hiszpański (ES) : https://youtu.be/pXvQBsjKHLk
  7. Niemiecki (DE) : https://youtu.be/FdjPCvDEYXc
  8. Polski (PL) : https://youtu.be/ckkgQ1wtYok
  9. Włoski (IT) : https://youtu.be/1XTbqCksu2s
  10. Portugalski (PT) : https://youtu.be/s6BcKsTdUdg
  11. Niderlandzki (NL) : https://youtu.be/8jMHRjzNM2k
  12. Hindi (HI) : https://youtu.be/VFuh-qrAFKU
  13. Arabski (AR) : https://youtu.be/pMbzVmCudDQ
  14. Rumuński (RO) : https://youtu.be/FmQgv3Ezu0s
  15. Szwedzki (SV) : https://youtu.be/1hHPh6cYOkY

Zobacz, jak Babel Fish AI ułatwia komunikację w preferowanym języku!

3. Podsumowanie ostatnich wersji

Krótki przegląd najważniejszych zmian od wersji 1.1.0:

3.1. Menu kontekstowe (v1.1.12)

  • Klik prawym przyciskiem na zaznaczonym tekście:
    • Przeformułuj zaznaczenie aby natychmiast przeformułować.
    • Przetłumacz zaznaczenie aby przetłumaczyć zaznaczony tekst na dowolny obsługiwany język.
  • Ulepszone okno dialogowe:
    • Wizualny licznik czasu, przycisk „Zachowaj otwarte”, odświeżony styl, zintegrowany przycisk kopiowania.

3.2. Auto-copy i zarządzanie focusem (v1.1.14 → v1.1.15)

  • Opcja “Automatic copy to clipboard”:
    • Kopiuje tekst tylko jeśli okno dialogowe jest wyświetlone i żadne pole nie ma fokusu.
  • Ulepszona detekcja:
    • Unika nadpisywania schowka, gdy tekst jest już wstawiany do pola.
  • Zachowanie fokusu i kursora:
    • Nie tracisz pozycji w tekście podczas interakcji z banerem lub przyciskami.

3.3. Ulepszenia UI i UX (v1.1.13)

  • Kontrolki przeniesione na górę okna dialogowego dla lepszej dostępności.
  • Bardziej kompaktowy interfejs (mniejsze odstępy, dostosowane marginesy).
  • Lepsze zarządzanie timerem (wizualny licznik, opcja „Keep Open”).

3.4. Różne optymalizacje i poprawki

  • Refaktoryzacja kodu: bardziej modułowy (oddzielne pliki dla języków, banera, wywołań API…).
  • Bardziej niezawodne połączenia: sprawdzanie stanu offline, aby unikać niepotrzebnych wywołań API.
  • Bardziej czytelne komunikaty o błędach: szczegółowe instrukcje pomagające rozwiązać problemy (nieprawidłowy klucz API itp.).
  • Ulepszenia bezpieczeństwa: window.clearTimeout, bezpieczniejsze wstrzykiwanie, itd.

4. Wdrożenie analizatorów kodu

Równolegle do rozwoju wspomaganego AI przez Roo Code (korzystam głównie z modeli gemini-2.0-pro-exp-02-05, gemini-2.0-flash-thinking-exp-01-21 od Google, które są obecnie darmowe, oraz Claude Sonnet 3.7 od Anthropic), zintegrowałem kilka narzędzi do analizy statycznej, aby zapewnić jakość i bezpieczeństwo generowanego kodu:

  • SonarCloud
  • CodeFactor
  • Codacy
  • DeepSource

Przy każdym pull request na GitHubie usługi te analizują kod i natychmiast zgłaszają podatności, długi techniczne lub złe praktyki. Informacje zwrotne pojawiają się bezpośrednio w interfejsie GitHuba, co pozwala szybko naprawiać problemy przed scaleniem do głównej gałęzi. W ten sposób, nawet jeśli AI generuje obszerne fragmenty kodu, te narzędzia działają jako zabezpieczenie, utrzymując kod czystym i bezpiecznym.

5. Zaktualizowana architektura techniczna

Od poprzedniego wpisu struktura rozszerzenia nieco się zmieniła. Kluczowe punkty:

  • manifest.json (MV3): zarządza uprawnieniami (activeTab, scripting, contextMenus…) i dynamicznym wstrzykiwaniem.
  • background.js: worker serwisowy odpowiedzialny za reakcję na kliknięcie ikony, skróty oraz wstrzykiwanie content.js.
  • content.js: centralna rola w obsłudze audio (MediaRecorder) i wywołań API (Whisper, GPT) za pomocą wyspecjalizowanych modułów.
  • Menu kontekstowe: tworzone przez background.js, stosowane przez content.js.
  • i18n.js oraz languages-shared.js: centralizacja danych tłumaczeń.

6. Chcesz przetestować?

7. Wnioski

Dzięki tym aktualizacjom Babel Fish AI staje się jeszcze bardziej wszechstronny, ergonomiczny i inteligentny. Dzięki menu kontekstowemu, przyciskom do reformulacji/tłumaczenia bezpośrednio na pasku, systemowi auto-copy i wzmocnionej analizie kodu, doświadczenie użytkownika znacząco się poprawiło.

Zapraszam do obejrzenia filmów demonstracyjnych. Dziękuję za śledzenie i powodzenia w projektach związanych z transkrypcją i tłumaczeniem!

Ten dokument został przetłumaczony z wersji fr na język pl przy użyciu modelu gpt-5-mini. Aby uzyskać więcej informacji na temat procesu tłumaczenia, zobacz https://gitlab.com/jls42/ai-powered-markdown-translator