Med Babel Fish AI presenterade jag redan ett Chrome‑tillägg som kan omvandla tal till text via OpenAI:s Whisper‑API och som även erbjuder realtidsöversättning. Idag återvänder jag med en rad nya funktioner och många förbättringar: från kontextmenyn till automatisk kopiering av transkriberad text, samt automatisk omformulering (nu aktiverbar från en knapp i bannern). Detta inlägg sammanfattar utvecklingen sedan den allra första versionen.
1. Presentation: Vad förändras?
Babel Fish AI fortsätter sitt uppdrag: att låta dig transkribera, översätta och omformulera dina texter i webbläsaren, enkelt och smidigt. Här är några av de största nyheterna sedan förra artikeln:
-
Kraftfull kontextmeny:
Högerklicka på markerad text för att omformulera eller översätta till valfritt språk. Den ursprungliga texten ersätts direkt med den nya versionen. -
Omedelbar kontroll från bannern:
Du behöver inte längre gå till inställningarna för att aktivera/avaktivera omformulering eller översättning! Knapparna i bannern (överst på skärmen under transkribering) låter dig justera dina preferenser direkt, beroende på vad du vill göra med din transkription eller din text. -
Intelligent automatisk kopiering:
Aktivera alternativet Automatic copy to clipboard för att automatiskt kopiera texten när dialogrutan visas och när inget inmatningsfält har fokus. -
Förbättringar av gränssnittet:
- Bättre integrerad kopieringsknapp.
- Möjlighet att behålla dialogrutan öppen eller att ange en fördröjning innan den stängs automatiskt.
- Modernare animationer och stil (rundade hörn, skuggor osv.).
-
Olika optimeringar:
- Kontroll av anslutningen (
navigator.onLine) före varje anrop för att undvika fel vid offline‑läge. - Bättre felhantering och tydligare meddelanden (saknad API‑nyckel, nätverkstproblem osv.).
- Mer modulär kod (separata filer för språk, bannern, UI osv.).
- Kontroll av anslutningen (
2. Videorna: 15 språk, 15 demonstrationer
Här är listan med videor, varje video visar taltranskribering, realtidsöversättning och omformulering.
- Franska (FR) : https://youtu.be/7iLJ_MPQ33k
- Engelska (EN) : https://youtu.be/ie7vR_9IJCw
- Japanska (JA) : https://youtu.be/bjoGWvSyQPo
- Koreanska (KO) : https://youtu.be/e4E5K4il6t8
- Kinesiska (ZH) : https://youtu.be/mdxffjYetJs
- Spanska (ES) : https://youtu.be/pXvQBsjKHLk
- Tyska (DE) : https://youtu.be/FdjPCvDEYXc
- Polska (PL) : https://youtu.be/ckkgQ1wtYok
- Italienska (IT) : https://youtu.be/1XTbqCksu2s
- Portugisiska (PT) : https://youtu.be/s6BcKsTdUdg
- Nederländska (NL) : https://youtu.be/8jMHRjzNM2k
- Hindi (HI) : https://youtu.be/VFuh-qrAFKU
- Arabiska (AR) : https://youtu.be/pMbzVmCudDQ
- Rumänska (RO) : https://youtu.be/FmQgv3Ezu0s
- Svenska (SV) : https://youtu.be/1hHPh6cYOkY
Upptäck hur Babel Fish AI förenklar kommunikationen på ditt föredragna språk!
3. Sammanfattning av de senaste versionerna
Här är en kort överblick över de viktigaste förändringarna sedan version 1.1.0:
3.1. Kontextmeny (v1.1.12)
- Högerklick på markerad text:
- Rephrase Selection för att omformulera omedelbart.
- Translate Selection för att översätta den markerade texten till vilket hanterat språk som helst.
- Förbättrad dialogruta:
- Visuell timer, knapp för “Keep Open”, moderniserad stil, integrerad kopieringsknapp.
3.2. Automatisk kopiering och fokus-hantering (v1.1.14 → v1.1.15)
- Alternativet “Automatic copy to clipboard”:
- Kopierar texten endast om dialogrutan visas och inget fält har fokus.
- Förbättrad detektion:
- Undviker att överbelasta urklippet när text redan är inskriven i ett fält.
- Behåll fokus och markörposition:
- Du förlorar inte längre din position i texten vid interaktion med bannern eller knapparna.
3.3. UI‑ och UX‑förbättringar (v1.1.13)
- Kontroller flyttade till toppen av dialogrutan för bättre åtkomst.
- Kompaktare gränssnitt (mindre mellanrum, justerade marginaler).
- Bättre hantering av timer (visuell räknare, alternativ “Keep Open”).
3.4. Olika optimeringar och buggfixar
- Refactoring av koden: mer modulär (separerade filer för språk, bannern, API‑anrop osv.).
- Mer tillförlitliga anslutningar: kontroll av offline‑status för att undvika onödiga API‑anrop.
- Tydligare felmeddelanden: detaljerade instruktioner för att lösa problem (ogiltig API‑nyckel osv.).
- Säkerhetsförbättringar:
window.clearTimeout, säkrare injektion, osv.
4. Implementering av kodanalysverktyg
Parallellt med AI‑stödd utveckling via Roo Code (jag använder främst Googles modeller gemini-2.0-pro-exp-02-05, gemini-2.0-flash-thinking-exp-01-21 som för närvarande är gratis samt Anthropic‑modellen Claude Sonnet 3.7), har jag integrerat flera statiska analysverktyg för att säkerställa kvalitet och säkerhet i genererad kod:
- SonarCloud
- CodeFactor
- Codacy
- DeepSource
Vid varje pull request på GitHub analyserar dessa tjänster koden och rapporterar direkt sårbarheter, teknisk skuld eller dåliga praxis. Återkopplingen visas i GitHubs gränssnitt, vilket gör det möjligt att åtgärda snabbt innan sammanslagning till huvudgrenen. På så sätt fungerar dessa analysverktyg som skydd för att hålla koden ren och säker, även när AI genererar stora kodblock.
5. Uppdaterad teknisk arkitektur
Sedan mitt tidigare inlägg har förlängningen av strukturen förändrats något. Viktiga punkter:
- manifest.json (MV3): hanterar behörigheter (activeTab, scripting, contextMenus…) och dynamisk injektion.
- background.js: service worker som hanterar klick på ikonen, kortkommandon och injicerar
content.js. - content.js: central roll för ljud (MediaRecorder) och anrop till API:er (Whisper, GPT) via specialiserade moduler.
- Kontextmeny: skapad av
background.js, applicerad avcontent.js. - i18n.js och languages-shared.js: centraliserar översättningsdata.
6. Vill du testa?
- Installera Babel Fish AI:
- Chrome Web Store
- GitHub (öppet källkodsprojekt)
- OpenAI API‑nyckel:
- Skapa din nyckel på https://platform.openai.com/account/api-keys och ange den i inställningarna.
7. Slutsats
Med dessa uppdateringar blir Babel Fish AI ännu mer mångsidigt, ergonomiskt och intelligent. Tack vare kontextmenyn, omformulerings-/översättningsknapparna direkt i bannern, automatisk kopiering och en stärkt kodanalys, är användarupplevelsen avsevärt förbättrad.
Tveka inte att titta på demonstrationsvideorna. Tack för att du följt med, och lycka till med dina transkriberings‑ och översättningsprojekt!
Detta dokument har översatts från fr-versionen till språket sv med hjälp av modellen gpt-5-mini. För mer information om översättningsprocessen, se https://gitlab.com/jls42/ai-powered-markdown-translator