W poście o Babel Fish AI przedstawiłem już rozszerzenie Chrome potrafiące zamieniać mowę na tekst za pomocą API Whisper od OpenAI, oferujące również tłumaczenie w czasie rzeczywistym. Dziś wracam z zestawem nowych funkcji i wieloma ulepszeniami: od menu kontekstowego, przez automatyczne kopiowanie przetranskrybowanego tekstu, po automatyczną reformulację (teraz możliwą do włączenia z poziomu przycisku na pasku) — ten wpis podsumowuje zmiany od pierwszej wersji.
1. Prezentacja: Co się zmienia?
Babel Fish AI realizuje swoją misję: umożliwić Ci transkrypcję, tłumaczenie i reformulację tekstów w przeglądarce w prosty sposób. Oto niektóre z głównych nowości od ostatniego artykułu:
-
Mocne menu kontekstowe:
Kliknij prawym przyciskiem myszy na zaznaczony tekst, aby go przeformułować (rephrase) lub przetłumaczyć na wybrany język. Oryginalny tekst jest bezpośrednio zastępowany nową wersją. -
Natychmiastowa kontrola z paska:
Nie trzeba przechodzić do opcji, aby włączać/wyłączać reformulację lub tłumaczenie! Przycisky na pasku (u góry ekranu podczas transkrypcji) pozwalają dostosować preferencje na żywo, zależnie od tego, co chcesz zrobić z transkrypcją lub tekstem. -
Inteligentna funkcja auto-copy:
Włącz opcję Automatic copy to clipboard, aby automatycznie kopiować tekst gdy okno dialogowe jest wyświetlone i żadne pole tekstowe nie ma fokusu. -
Ulepszenia interfejsu:
- Lepiej zintegrowany przycisk kopiowania.
- Możliwość utrzymania okna dialogowego otwartego lub ustawienia opóźnienia przed jego automatycznym zamknięciem.
- Nowocześniejsze animacje i styl (zaokrąglone rogi, cienie itp.).
-
Różne optymalizacje:
- Sprawdzanie połączenia (
navigator.onLine) przed każdym wywołaniem, aby unikać błędów w trybie offline. - Lepsze zarządzanie błędami i bardziej czytelne komunikaty (brak klucza API, brak sieci itp.).
- Bardziej modułowy kod (wydzielone pliki dla języków, banera, UI itp.).
- Sprawdzanie połączenia (
2. Wideo: 15 języków, 15 demonstracji
Oto lista filmów — każdy prezentuje transkrypcję mowy, tłumaczenie w czasie rzeczywistym oraz reformulację.
- Francuski (FR) : https://youtu.be/7iLJ_MPQ33k
- Angielski (EN) : https://youtu.be/ie7vR_9IJCw
- Japoński (JA) : https://youtu.be/bjoGWvSyQPo
- Koreański (KO) : https://youtu.be/e4E5K4il6t8
- Chiński (ZH) : https://youtu.be/mdxffjYetJs
- Hiszpański (ES) : https://youtu.be/pXvQBsjKHLk
- Niemiecki (DE) : https://youtu.be/FdjPCvDEYXc
- Polski (PL) : https://youtu.be/ckkgQ1wtYok
- Włoski (IT) : https://youtu.be/1XTbqCksu2s
- Portugalski (PT) : https://youtu.be/s6BcKsTdUdg
- Niderlandzki (NL) : https://youtu.be/8jMHRjzNM2k
- Hindi (HI) : https://youtu.be/VFuh-qrAFKU
- Arabski (AR) : https://youtu.be/pMbzVmCudDQ
- Rumuński (RO) : https://youtu.be/FmQgv3Ezu0s
- Szwedzki (SV) : https://youtu.be/1hHPh6cYOkY
Zobacz, jak Babel Fish AI ułatwia komunikację w preferowanym języku!
3. Podsumowanie ostatnich wersji
Krótki przegląd najważniejszych zmian od wersji 1.1.0:
3.1. Menu kontekstowe (v1.1.12)
- Klik prawym przyciskiem na zaznaczonym tekście:
- Przeformułuj zaznaczenie aby natychmiast przeformułować.
- Przetłumacz zaznaczenie aby przetłumaczyć zaznaczony tekst na dowolny obsługiwany język.
- Ulepszone okno dialogowe:
- Wizualny licznik czasu, przycisk „Zachowaj otwarte”, odświeżony styl, zintegrowany przycisk kopiowania.
3.2. Auto-copy i zarządzanie focusem (v1.1.14 → v1.1.15)
- Opcja “Automatic copy to clipboard”:
- Kopiuje tekst tylko jeśli okno dialogowe jest wyświetlone i żadne pole nie ma fokusu.
- Ulepszona detekcja:
- Unika nadpisywania schowka, gdy tekst jest już wstawiany do pola.
- Zachowanie fokusu i kursora:
- Nie tracisz pozycji w tekście podczas interakcji z banerem lub przyciskami.
3.3. Ulepszenia UI i UX (v1.1.13)
- Kontrolki przeniesione na górę okna dialogowego dla lepszej dostępności.
- Bardziej kompaktowy interfejs (mniejsze odstępy, dostosowane marginesy).
- Lepsze zarządzanie timerem (wizualny licznik, opcja „Keep Open”).
3.4. Różne optymalizacje i poprawki
- Refaktoryzacja kodu: bardziej modułowy (oddzielne pliki dla języków, banera, wywołań API…).
- Bardziej niezawodne połączenia: sprawdzanie stanu offline, aby unikać niepotrzebnych wywołań API.
- Bardziej czytelne komunikaty o błędach: szczegółowe instrukcje pomagające rozwiązać problemy (nieprawidłowy klucz API itp.).
- Ulepszenia bezpieczeństwa:
window.clearTimeout, bezpieczniejsze wstrzykiwanie, itd.
4. Wdrożenie analizatorów kodu
Równolegle do rozwoju wspomaganego AI przez Roo Code (korzystam głównie z modeli gemini-2.0-pro-exp-02-05, gemini-2.0-flash-thinking-exp-01-21 od Google, które są obecnie darmowe, oraz Claude Sonnet 3.7 od Anthropic), zintegrowałem kilka narzędzi do analizy statycznej, aby zapewnić jakość i bezpieczeństwo generowanego kodu:
- SonarCloud
- CodeFactor
- Codacy
- DeepSource
Przy każdym pull request na GitHubie usługi te analizują kod i natychmiast zgłaszają podatności, długi techniczne lub złe praktyki. Informacje zwrotne pojawiają się bezpośrednio w interfejsie GitHuba, co pozwala szybko naprawiać problemy przed scaleniem do głównej gałęzi. W ten sposób, nawet jeśli AI generuje obszerne fragmenty kodu, te narzędzia działają jako zabezpieczenie, utrzymując kod czystym i bezpiecznym.
5. Zaktualizowana architektura techniczna
Od poprzedniego wpisu struktura rozszerzenia nieco się zmieniła. Kluczowe punkty:
- manifest.json (MV3): zarządza uprawnieniami (activeTab, scripting, contextMenus…) i dynamicznym wstrzykiwaniem.
- background.js: worker serwisowy odpowiedzialny za reakcję na kliknięcie ikony, skróty oraz wstrzykiwanie
content.js. - content.js: centralna rola w obsłudze audio (MediaRecorder) i wywołań API (Whisper, GPT) za pomocą wyspecjalizowanych modułów.
- Menu kontekstowe: tworzone przez
background.js, stosowane przezcontent.js. - i18n.js oraz languages-shared.js: centralizacja danych tłumaczeń.
6. Chcesz przetestować?
- Zainstaluj Babel Fish AI:
- Sklep Chrome Web
- GitHub (projekt open source)
- Klucz API OpenAI:
- Utwórz swój klucz na platform.openai.com/account/api-keys i wprowadź go w opcjach.
7. Wnioski
Dzięki tym aktualizacjom Babel Fish AI staje się jeszcze bardziej wszechstronny, ergonomiczny i inteligentny. Dzięki menu kontekstowemu, przyciskom do reformulacji/tłumaczenia bezpośrednio na pasku, systemowi auto-copy i wzmocnionej analizie kodu, doświadczenie użytkownika znacząco się poprawiło.
Zapraszam do obejrzenia filmów demonstracyjnych. Dziękuję za śledzenie i powodzenia w projektach związanych z transkrypcją i tłumaczeniem!
Ten dokument został przetłumaczony z wersji fr na język pl przy użyciu modelu gpt-5-mini. Aby uzyskać więcej informacji na temat procesu tłumaczenia, zobacz https://gitlab.com/jls42/ai-powered-markdown-translator