
Med Babel Fish AI har jag redan presenterat en Chrome-tillägg kapabel att omvandla röst till text via OpenAI:s Whisper API, som även erbjuder realtidsöversättning. Idag kommer jag tillbaka med en rad nya funktioner och många förbättringar: från kontextmeny till auto-kopiering av den transkriberade texten, samt automatisk omformulering (numera aktiverbar via en knapp i bandet), denna artikel går igenom utvecklingen sedan den allra första versionen.
1. Presentation: Vad är nytt?
Babel Fish AI fortsätter sitt uppdrag: att låta dig transkribera, översätta och omformulera dina texter direkt i webbläsaren, på ett enkelt sätt. Här är några av de större nyheterna sedan den senaste artikeln:
-
Kraftfull kontextmeny:
Högerklicka på markerad text för att omformulera (rephrase) eller översätta den till det språk du önskar. Den ursprungliga texten ersätts direkt med den nya versionen. -
Omedelbar kontroll via bandet:
Ingen anledning att gå in i inställningarna för att aktivera/inaktivera omformulering eller översättning! Knapparna i bandet (överst på skärmen under transkriberingen) låter dig justera dina preferenser i realtid, beroende på vad du vill göra med din transkription eller text. -
Smart auto-kopieringsfunktion:
Aktivera alternativet Automatic copy to clipboard för att automatiskt kopiera texten när dialogrutan visas och inget inmatningsfält är i fokus. -
Förbättringar av gränssnittet:
- Kopieringsknappen är bättre integrerad.
- Möjlighet att hålla dialogrutan öppen eller att ställa in en fördröjning innan den stängs automatiskt.
- Mer moderna animationer och stil (avrundade hörn, skuggor, etc.).
-
Diverse optimeringar:
- Kontroll av anslutning (
navigator.onLine
) före varje anrop för att undvika offlinefel. - Bättre hantering av fel och tydligare meddelanden (saknad API-nyckel, inaktivt nätverk, etc.).
- Mer modulär kod (dedikerade filer för språk, band, UI, etc.).
- Kontroll av anslutning (
2. Videorna: 15 Språk, 15 Demonstrationer
Här är listan med videor, där varje video visar rösttranskribering, realtidsöversättning och omformulering.
- Français (FR) : https://youtu.be/7iLJ_MPQ33k
- Anglais (EN) : https://youtu.be/ie7vR_9IJCw
- Japonais (JA) : https://youtu.be/bjoGWvSyQPo
- Coréen (KO) : https://youtu.be/e4E5K4il6t8
- Chinois (ZH) : https://youtu.be/mdxffjYetJs
- Espagnol (ES) : https://youtu.be/pXvQBsjKHLk
- Allemand (DE) : https://youtu.be/FdjPCvDEYXc
- Polonais (PL) : https://youtu.be/ckkgQ1wtYok
- Italien (IT) : https://youtu.be/1XTbqCksu2s
- Portugais (PT) : https://youtu.be/s6BcKsTdUdg
- Néerlandais (NL) : https://youtu.be/8jMHRjzNM2k
- Hindi (HI) : https://youtu.be/VFuh-qrAFKU
- Arabe (AR) : https://youtu.be/pMbzVmCudDQ
- Roumain (RO) : https://youtu.be/FmQgv3Ezu0s
- Suédois (SV) : https://youtu.be/1hHPh6cYOkY
Upptäck hur Babel Fish AI underlättar kommunikationen på ditt föredragna språk!
3. Sammanfattning av de senaste versionerna
Här är en kort sammanfattning av de betydande ändringarna sedan version 1.1.0:
3.1. Kontextmeny (v1.1.12)
- Högerklick på markerad text:
- Rephrase Selection för att omformulera omedelbart.
- Translate Selection för att översätta den markerade texten till vilket hanterat språk som helst.
- Förbättrad dialogruta:
- Visuell nedräkning, knapp “Keep Open”, moderniserad stil, integrerad kopieringsknapp.
3.2. Auto-copy och hantering av fokus (v1.1.14 → v1.1.15)
- Alternativet “Automatic copy to clipboard”:
- Kopierar texten endast om dialogrutan visas och inget fält är i fokus.
- Förbättrad detektion:
- Undviker att överbelasta urklippet när texten redan är införd i ett fält.
- Bibehållande av fokus och markör:
- Man tappar inte längre sin position i texten vid interaktioner med bandet eller knapparna.
3.3. Förbättringar av UI och UX (v1.1.13)
- Kontroller har flyttats till toppen av dialogrutan för bättre åtkomlighet.
- Mer kompakt gränssnitt (minskade mellanrum, justerade marginaler).
- Bättre hantering av timern (visuell räknare, alternativ “Keep Open”).
3.4. Diverse optimeringar och buggfixar
- Omstrukturering av koden: Mer modulär (separerade filer för språk, band, API-anrop, etc.).
- Mer pålitliga anslutningar: Kontrollerar offline-status för att undvika onödiga API-anrop.
- Tydligare felmeddelanden: Detaljerade instruktioner för att lösa problem (ogiltig API-nyckel, etc.).
- Säkerhetsförbättringar:
window.clearTimeout
, säkrare injektion, etc.
4. Införande av kodanalysverktyg
Parallellt med AI-assisterad utveckling via Roo Code (jag använder främst modellerna gemini-2.0-pro-exp-02-05, gemini-2.0-flash-thinking-exp-01-21 från Google, som för närvarande är gratis, samt Claude Sonnet 3.7 från Anthropic), har jag integrerat flera statiska analysverktyg för att garantera kodens kvalitet och säkerhet:
- SonarCloud
- CodeFactor
- Codacy
- DeepSource
Vid varje pull request på GitHub analyserar dessa tjänster koden och signalerar direkt sårbarheter, tekniska skulder eller dåliga metoder. Feedbacken visas direkt i GitHub-gränssnittet, vilket gör det möjligt att åtgärda snabbt innan sammanslagning med huvudgrenen. På så sätt, även om AI producerar stora kodblock, fungerar dessa analyzers som säkerhetsåtgärder för att upprätthålla ren och säker kod.
5. Uppdaterad teknisk arkitektur
Sedan min senaste artikel har strukturen för tillägget utvecklats något. De viktigaste punkterna:
- manifest.json (MV3): hanterar behörigheter (activeTab, scripting, contextMenus…) och dynamisk injektion.
- background.js: Service worker som ansvarar för att reagera på klick på ikonen, genvägar, och injicera
content.js
. - content.js: har en central roll för ljud (MediaRecorder) och API-anrop (Whisper, GPT) via specialiserade moduler.
- Kontextmeny: skapas av
background.js
, appliceras avcontent.js
. - i18n.js och languages-shared.js: centraliserar översättningsdata.
6. Vill du testa?
- Installera Babel Fish AI:
- Chrome Web Store
- GitHub (öppen källkod)
- OpenAI API-nyckel:
- Skapa din nyckel på platform.openai.com/account/api-keys och ange den i inställningarna.
7. Slutsats
Med dessa uppdateringar blir Babel Fish AI ännu mer mångsidigt, användarvänligt och intelligent. Tack vare kontextmenyn, knapparna för omformulering/översättning som är direkt tillgängliga i bandet, auto-copy-systemet och en förstärkt kodanalys är användarupplevelsen avsevärt förbättrad.
Tveka inte att titta på demonstrationsvideorna. Tack för ditt stöd, och lycka till med dina projekt för transkribering och översättning!
Det här dokumentet har översatts från versionen fr till språket sv med hjälp av modellen o3-mini. För mer information om översättningsprocessen, se https://gitlab.com/jls42/ai-powered-markdown-translator